Julgue o item a seguir, relativos ao Hadoop e ao Spark. Spar...
Spark é uma arquitetura de sistema operacional para trabalhar com dados organizados de forma hierárquica, utilizando-se o módulo Spark SQL, que permite consultar arquivos pelo seu conteúdo.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: E - Errado.
O enunciado propõe uma avaliação sobre o conhecimento das tecnologias Hadoop e Spark. Para responder corretamente, é necessário entender o que cada uma dessas tecnologias representa no contexto de Big Data.
Hadoop é um framework de software que permite o processamento distribuído de grandes conjuntos de dados através de clusters de computadores. O Hadoop utiliza um modelo de armazenamento conhecido como Hadoop Distributed File System (HDFS), que é, de fato, hierárquico e permite o armazenamento de grandes volumes de dados em um ambiente distribuído.
Por outro lado, Spark é uma plataforma de computação em cluster que fornece uma API para programação distribuída. Spark é projetado para ser rápido e generalista, sendo capaz de realizar processamento em batch e também processamento em tempo real. O Spark SQL é um módulo dentro do Spark que permite a execução de SQL e também a leitura de dados de diversas fontes de dados, incluindo, mas não se limitando a, arquivos hierárquicos.
O erro na afirmação do enunciado está em descrever o Spark como uma "arquitetura de sistema operacional", o que não é verdade. Spark é uma plataforma de processamento e análise de dados e não tem relação com sistemas operacionais. Além disso, o Spark SQL permite consultar dados de maneira estruturada, não necessariamente "arquivos organizados de forma hierárquica" como sugere o enunciado, e sim, estruturas de dados como DataFrames e datasets que podem ser originados de diversas fontes de dados, incluindo bancos de dados relacionais, NoSQL, HDFS e até mesmo formatos como parquet e JSON.
Entender essa distinção é crucial, pois as características do Spark são bastante distintas das de um sistema operacional. O Spark é uma ferramenta na camada de processamento de dados, e não na camada de sistemas operacionais, que gerencia recursos de hardware e fornece serviços essenciais para os programas de computador.
Portanto, ao entender o papel de Spark no ecossistema de Big Data, fica claro que a afirmação feita no enunciado está errada, justificando assim a resposta correta sendo "E - Errado".
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Errado. Spark não é uma arquitetura de sistema operacional, mas sim uma plataforma de processamento de dados em larga escala. Spark SQL é um módulo que permite consultar dados estruturados ou semi-estruturados usando a linguagem SQL ou uma variante chamada HiveQL. Spark SQL não consulta arquivos pelo seu conteúdo, mas sim pelo seu esquema, que define as colunas e os tipos de dados de uma tabela ou um arquivo.
Spark é uma ferramenta/plataforma da BigData, tal qual o Apache Hadoop.
O Spark não é uma arquitetura de sistema operacional, mas sim um framework de computação em cluster de código aberto, projetado para processamento de dados em grande escala e análise. Ele fornece uma interface para programação de clusters completos com tolerância a falhas.
O Spark SQL é um módulo do Spark para processamento de dados estruturados. Ao contrário do que a afirmação sugere, o Spark SQL não é usado para consultar arquivos pelo seu conteúdo, mas sim para executar consultas SQL e ler dados de várias fontes estruturadas
GABARITO: ERRADO
O que spark?
- É uma Plataforma, framework e ecossistema de computação distribuída
Não é apenas um software ou um sistema operacional
Qual a função do spark?
- ARMAZENAMENTO E PROCESSAMENTO DE GRANDES VOLUMES DE DADOS
Quais as características do spark?
- Alta escalabilidade, grande confiabilidade e tolerância a falhas.
Apache Spark é um framework de código fonte aberto para computação distribuída --> Plataforma para Big Data
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo