O HDFS é o sistema de arquivos do Hadoop. Ele possui uma ar...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: A - NameNode.
O Hadoop é uma framework de software para armazenamento e processamento de grandes conjuntos de dados. O componente de armazenamento do Hadoop é conhecido como Hadoop Distributed File System (HDFS), que é um sistema de arquivos distribuído que armazena dados em máquinas comuns. A arquitetura do HDFS é baseada no modelo mestre-escravo, no qual há dois tipos principais de nós que formam a rede:
- NameNode: É o servidor mestre que gerencia o espaço de nomes do sistema de arquivos e regula o acesso aos arquivos pelos clientes. O NameNode armazena os metadados do HDFS, como a árvore de diretórios, inodes e o mapeamento de blocos para DataNodes, mas não armazena os dados reais.
- DataNode: São os servidores escravos responsáveis por armazenar os dados reais em blocos. Eles servem os dados de leitura e escrita sob a instrução do NameNode e também realizam operações de bloco, como criação, exclusão e replicação sob a direção do NameNode.
A alternativa correta é a A - NameNode porque, conforme descrito na arquitetura do HDFS, o NameNode é o componente que realiza o gerenciamento de metadados, que é o papel indicado na questão. Ele mantém e gerencia a árvore de diretórios e o mapeamento de blocos para DataNodes, essencial para o funcionamento do HDFS.
As outras alternativas apresentam termos que não são associados com a arquitetura do HDFS ou possuem papéis diferentes dentro dessa arquitetura, e por isso são incorretas:
- DataNode: Responsável pelo armazenamento dos dados e não pelo gerenciamento de metadados.
- HDFSnode: Não é um termo usado na arquitetura do Hadoop para se referir a um componente específico.
- LinkNode: Não é um componente da arquitetura do Hadoop.
- TraceNode: Também não é um componente da arquitetura do Hadoop.
Para resolver essa questão, é necessário conhecer a arquitetura básica do HDFS e os papéis dos seus componentes, especialmente do NameNode como o servidor mestre responsável pelo gerenciamento de metadados.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Assertiva A
Os clusters HDFS possuem dois tipos de nós – primeiro um namenode, que é um master, e múltiplos datanodes, que são nós slave. Fora esses dois, também é possível ter namenodes secundários.
GABARITO: LETRA A
Rápido resumo do Hadoop. (Quase) Tudo o que vc precisa saber sobre o Hadoop em provas.
___________
Os principais elementos (em termos de importancia em provas, sobretudo)do Hadoop sao o MapReduce e HDFS (Hadoop Distributed File System)
MapReduce realiza o processamento dos dados. É dividido em duas fases: Map e Reduce.
Map faz o mapeamento, o processamento primário dos dados de entrada (imputs). Reduce gera os resultados desse processamento, as saídas (outputs).
Componentes do MapReduce
- Jobtraker - gerenciador do processamento. Distribui, organiza as tarefas (tasks) entre as diversas máquinas. Por ex, direciona algumas para a funçao de map e outras para a de reduce. É único para cada aplicaçao (MASTER)
- Tasktraker - executa as tarefas repassadas pelo Jobtracker. Instanciado para cada máquina (SLAVE).
HDFS - Responsável pelo armazenamento de dados, tendo como princípio o acrônimo WORM (Write-once, Read Many - "escrita uma vez, múltiplas leituras" - escrita controlada, leitura livre)
Componentes HDFS
- NameNode - Gerencia o armazenamento de dados. É único para cada aplicaçao (MASTER)
- SecondaryNameNode - Auxilia o NameNode na funçao de gestor do armazenamento. Ou ainda, funciona como alternativa àquele. É único para cada aplicaçao (MASTER)
- Datanode - É quem executa efetivamente as tarefas de armazenamento. Instanciado para cada máquina (SLAVE).
Q435074 CESPE - 2014 - ANATEL - Analista Administrativo - Desenvolvimento de Sistemas
No Hadoop MapReduce, o JobTracker é o processo-escravo responsável por aceitar submissões de tarefas e disponibilizar funções administrativas. ERRADO
Q862680 CESPE - 2018 - TCE-PB - Auditor de Contas Públicas
Em big data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma distribuída, tendo como princípio o write-many, read-once. ERRADO
Fonte:
https://www.devmedia.com.br/hadoop-mapreduce-introducao-a-big-data/30034
naMe node: Mestre
Data node: Escravo
GAB. A
NAMENODE = ADMINISTRA/GERENCIA/MAPEIA OS DADOS; MASTER NODE = MESTRE.
DATANOTE = ARMAZENA OS DADOS; SLAVES NODES = ESCRAVOS.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo