O HDFS é o sistema de arquivos do Hadoop. Ele possui uma ar...

Próximas questões
Com base no mesmo assunto
Q1622526 Banco de Dados
O HDFS é o sistema de arquivos do Hadoop. Ele possui uma arquitetura mestre-escravo na qual um servidor é responsável por fazer todo o gerenciamento de metadados do sistema. Dentro da arquitetura do Hadoop, como se denomina esse servidor?
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: A - NameNode.

O Hadoop é uma framework de software para armazenamento e processamento de grandes conjuntos de dados. O componente de armazenamento do Hadoop é conhecido como Hadoop Distributed File System (HDFS), que é um sistema de arquivos distribuído que armazena dados em máquinas comuns. A arquitetura do HDFS é baseada no modelo mestre-escravo, no qual há dois tipos principais de nós que formam a rede:

  • NameNode: É o servidor mestre que gerencia o espaço de nomes do sistema de arquivos e regula o acesso aos arquivos pelos clientes. O NameNode armazena os metadados do HDFS, como a árvore de diretórios, inodes e o mapeamento de blocos para DataNodes, mas não armazena os dados reais.
  • DataNode: São os servidores escravos responsáveis por armazenar os dados reais em blocos. Eles servem os dados de leitura e escrita sob a instrução do NameNode e também realizam operações de bloco, como criação, exclusão e replicação sob a direção do NameNode.

A alternativa correta é a A - NameNode porque, conforme descrito na arquitetura do HDFS, o NameNode é o componente que realiza o gerenciamento de metadados, que é o papel indicado na questão. Ele mantém e gerencia a árvore de diretórios e o mapeamento de blocos para DataNodes, essencial para o funcionamento do HDFS.

As outras alternativas apresentam termos que não são associados com a arquitetura do HDFS ou possuem papéis diferentes dentro dessa arquitetura, e por isso são incorretas:

  • DataNode: Responsável pelo armazenamento dos dados e não pelo gerenciamento de metadados.
  • HDFSnode: Não é um termo usado na arquitetura do Hadoop para se referir a um componente específico.
  • LinkNode: Não é um componente da arquitetura do Hadoop.
  • TraceNode: Também não é um componente da arquitetura do Hadoop.

Para resolver essa questão, é necessário conhecer a arquitetura básica do HDFS e os papéis dos seus componentes, especialmente do NameNode como o servidor mestre responsável pelo gerenciamento de metadados.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Assertiva A

Os clusters HDFS possuem dois tipos de nós – primeiro um namenode, que é um master, e múltiplos datanodes, que são nós slave. Fora esses dois, também é possível ter namenodes secundários.

GABARITO: LETRA A

Rápido resumo do Hadoop. (Quase) Tudo o que vc precisa saber sobre o Hadoop em provas.

___________

Os principais elementos (em termos de importancia em provas, sobretudo)do Hadoop sao o MapReduce e HDFS (Hadoop Distributed File System)

MapReduce realiza o processamento dos dados. É dividido em duas fases: Map e Reduce.

Map faz o mapeamento, o processamento primário dos dados de entrada (imputs). Reduce gera os resultados desse processamento, as saídas (outputs).

Componentes do MapReduce

  • Jobtraker - gerenciador do processamento. Distribui, organiza as tarefas (tasks) entre as diversas máquinas. Por ex, direciona algumas para a funçao de map e outras para a de reduce. É único para cada aplicaçao (MASTER)
  • Tasktraker - executa as tarefas repassadas pelo Jobtracker. Instanciado para cada máquina (SLAVE).

HDFS - Responsável pelo armazenamento de dados, tendo como princípio o acrônimo WORM (Write-once, Read Many - "escrita uma vez, múltiplas leituras" - escrita controlada, leitura livre)

Componentes HDFS

  • NameNode - Gerencia o armazenamento de dados. É único para cada aplicaçao (MASTER)
  • SecondaryNameNode - Auxilia o NameNode na funçao de gestor do armazenamento. Ou ainda, funciona como alternativa àquele. É único para cada aplicaçao (MASTER)
  • Datanode - É quem executa efetivamente as tarefas de armazenamento. Instanciado para cada máquina (SLAVE).

Q435074 CESPE - 2014 - ANATEL - Analista Administrativo - Desenvolvimento de Sistemas

No Hadoop MapReduce, o JobTracker é o processo-escravo responsável por aceitar submissões de tarefas e disponibilizar funções administrativas. ERRADO

Q862680 CESPE - 2018 - TCE-PB - Auditor de Contas Públicas

Em big data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma distribuída, tendo como princípio o write-many, read-once. ERRADO

Fonte:

https://www.devmedia.com.br/hadoop-mapreduce-introducao-a-big-data/30034

naMe node: Mestre

Data node: Escravo

GAB. A

NAMENODE = ADMINISTRA/GERENCIA/MAPEIA OS DADOS; MASTER NODE = MESTRE.

DATANOTE = ARMAZENA OS DADOS; SLAVES NODES = ESCRAVOS.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo