Com relação ao Big Data e suas tecnologias, assinale V para ...
( ) Existem diversas tecnologias para processamento e análise de Big Data, mas a maioria possui algumas características comuns. Ou seja, adotam técnicas de escalonamento e processamento paralelo; utilizam dados não relacionais, e aplicam análises avançadas e visualização de dados.
( ) Existem três tecnologias de Big Data que se destacam: MapReduce, Hadoop e NoSQL. O Hadoop é uma técnica popularizada pelo Google que distribui o processamento de dados em grandes arquivos de dados multiestruturados em um grande cluster que pode ser alcançado dividindo o processamento em pequenas unidades de trabalho que podem ser executadas em paralelo.
( ) O MapReduce é um modelo de programação e uma implementação associada para processar e gerar grandes conjuntos de dados. Os programas escritos neste estilo funcional são automaticamente paralelizados e executados em um grande cluster de máquinas de alto desempenho. O modelo que programadores sem qualquer experiência com sistemas paralelos e distribuídos utilizem facilmente os recursos.
As afirmativas são, respectivamente,
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a D - V – F – V. Agora, vamos entender o porquê dessa ser a resposta correta.
Primeira afirmativa (Verdadeira): As tecnologias de Big Data realmente compartilham várias características em comum. Elas muitas vezes utilizam técnicas de escalonamento horizontal e processamento paralelo para lidar com grandes volumes de dados, uma vez que isso permite um melhor desempenho e a capacidade de trabalhar com dados que não caberiam em um único servidor ou que seriam processados muito lentamente. Além disso, o uso de dados não relacionais permite que essas tecnologias lidem com uma variedade muito maior de tipos de dados, o que é comum em cenários de Big Data. Por fim, a análise avançada e visualização de dados são essenciais para extrair insights úteis de grandes conjuntos de dados.
Segunda afirmativa (Falsa): A descrição do Hadoop está incorreta. De fato, o Hadoop é uma das tecnologias de Big Data mais conhecidas e frequentemente associada ao processamento de grandes conjuntos de dados. No entanto, não foi o Google que popularizou o Hadoop, mas sim a Apache Software Foundation. O Google, na verdade, inspirou o Hadoop com seus próprios sistemas, como o Google File System (GFS) e o MapReduce. O Hadoop é um framework que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores usando modelos de programação simples.
Terceira afirmativa (Verdadeira): O MapReduce é de fato um modelo de programação para processar grandes conjuntos de dados. Seus programas são projetados para transformar grandes volumes de dados em algo mais manejável e são paralelizados automaticamente, permitindo que sejam processados em clusters. Esse modelo ajuda a simplificar a computação distribuída, tornando mais acessível a programadores sem experiência prévia com sistemas paralelos ou distribuídos.
Com base nessa análise, podemos ver que a alternativa D é correta porque identifica corretamente a primeira e terceira afirmativas como verdadeiras e a segunda como falsa.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Vamos analisar cada afirmativa:
( V ) Existem diversas tecnologias para processamento e análise de Big Data, mas a maioria possui algumas características comuns. Ou seja, adotam técnicas de escalonamento e processamento paralelo; utilizam dados não relacionais, e aplicam análises avançadas e visualização de dados.
Comentário: Isso está correto. Muitas tecnologias de Big Data compartilham características como escalonamento e processamento paralelo, uso de dados não relacionais e aplicação de análises avançadas e visualização de dados.
( F ) Existem três tecnologias de Big Data que se destacam: MapReduce, Hadoop e NoSQL. O Hadoop é uma técnica popularizada pelo Google que distribui o processamento de dados em grandes arquivos de dados multiestruturados em um grande cluster que pode ser alcançado dividindo o processamento em pequenas unidades de trabalho que podem ser executadas em paralelo.
Comentário: A afirmativa é falsa. Hadoop não é uma técnica, mas sim um framework de software que permite o processamento distribuído de grandes conjuntos de dados. Além disso, o Hadoop inclui o MapReduce como um dos seus componentes principais. Portanto, Hadoop e MapReduce não são tecnologias distintas, mas sim relacionadas.
( V ) O MapReduce é um modelo de programação e uma implementação associada para processar e gerar grandes conjuntos de dados. Os programas escritos neste estilo funcional são automaticamente paralelizados e executados em um grande cluster de máquinas de alto desempenho. O modelo permite que programadores sem qualquer experiência com sistemas paralelos e distribuídos utilizem facilmente os recursos.
Comentário: Isso está correto. MapReduce é um modelo de programação utilizado para processar grandes conjuntos de dados de forma paralela em clusters distribuídos. Ele permite que programadores usem recursos distribuídos sem a necessidade de experiência específica em sistemas paralelos.
Letra D
GABARITO LETRA D
Hadoop é a implementação, aquilo que operacionaliza o MapReduce.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo