O Apache Hadoop é um framework que permite o processamento ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: B - O armazenamento de dados em blocos distribuídos por vários nós no cluster, oferecendo alta disponibilidade e tolerância a falhas.
O Apache Hadoop é um framework amplamente utilizado para o processamento de grandes volumes de dados, conhecido como Big Data. Um de seus componentes principais é o Hadoop Distributed File System (HDFS). Vamos entender o porquê a alternativa B é a correta e as outras não se aplicam ao contexto.
A principal característica que torna o HDFS especialmente adequado para o processamento de Big Data é seu método de armazenamento de dados. Ele armazena os dados em blocos distribuídos por vários nós no cluster, o que proporciona alta disponibilidade e tolerância a falhas. Isso significa que, mesmo que algum nó falhe, os dados podem ser recuperados de outros nós, garantindo que o sistema continue funcionando sem interrupção significativa.
Vamos agora analisar as alternativas incorretas:
A - Suporte a bases de dados relacionais com transações ACID: Essa característica é típica de bancos de dados relacionais, como MySQL ou PostgreSQL, que são projetados para garantir Atomicidade, Consistência, Isolamento e Durabilidade (ACID) nas transações. O HDFS, por outro lado, é projetado para lidar com grandes volumes de dados de forma distribuída, mas não oferece suporte a transações ACID.
C - Operações de leitura e escrita em tempo real: O HDFS é otimizado para operações de leitura-escrita em grandes blocos de dados, mas não é projetado para aplicações em tempo real, como streaming de dados. Tecnologias como Apache Kafka ou Apache Flink são mais adequadas para esse tipo de aplicação.
D - Mecanismo de indexação automática: O HDFS não possui um mecanismo de indexação automática semelhante a bancos de dados em memória. Ele é projetado para armazenamento e acesso a grandes conjuntos de dados, mas a indexação rápida e consultas são mais características de bancos de dados específicos, como Elasticsearch.
Portanto, a alternativa B destaca precisamente a característica central do HDFS que é vital para o processamento eficiente de Big Data: armazenamento distribuído, alta disponibilidade e tolerância a falhas.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo