A respeito de arquitetura e políticas de armazenamento de da...

Com base no mesmo assunto

Ano: 2023 Banca: CESPE / CEBRASPE Órgão: DATAPREV Prova: CESPE / CEBRASPE - 2023 - DATAPREV - Analista de Tecnologia da Informação - Perfil: Desenvolvimento de Software |

Q2275427 Banco de Dados

A respeito de arquitetura e políticas de armazenamento de dados, engenharia de dados e Big Data, julgue o próximo item.

As ferramentas utilizadas para manipular dados em Big Data são as mesmas utilizadas em bancos de dados relacionais.

Certo

Errado

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: E - Errado

A afirmativa está incorreta porque as ferramentas usadas para manipular Big Data diferem substancialmente das utilizadas em bancos de dados relacionais tradicionais. Enquanto os bancos de dados relacionais são projetados para ambientes com volumes menores de dados estruturados e suportam bem transações e consultas complexas com o uso da linguagem SQL, as ferramentas de Big Data são projetadas para lidar com volumes massivos de dados que podem ser estruturados, semi-estruturados ou não estruturados, e que muitas vezes exigem processamento distribuído para análise eficiente.

Exemplos de ferramentas de Big Data incluem sistemas de processamento como Apache Hadoop e suas ferramentas relacionadas como Hive e Pig, bem como plataformas de processamento em tempo real como Apache Spark. Estas são otimizadas para armazenamento distribuído e processamento de grandes conjuntos de dados em clusters de computadores, algo que os bancos de dados relacionais não foram criados para fazer de forma nativa.

É fundamental entender que, embora algumas ferramentas como SQL possam ser usadas em ambos os contextos com adaptações (por exemplo, SQL on Hadoop), a arquitetura, funcionalidades e otimizações são distintas e pensadas para atender aos diferentes desafios e características do Big Data, que são diferentes dos dados manipulados por sistemas de bancos de dados relacionais convencionais.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

As ferramentas utilizadas para manipular dados em Big Data não são as mesmas utilizadas em bancos de dados relacionais. Embora algumas técnicas possam ser semelhantes, os ambientes e os desafios envolvidos na manipulação de Big Data são distintos dos bancos de dados relacionais tradicionais.

Aqui estão algumas diferenças-chave:

Escalabilidade: Bancos de dados relacionais tradicionais não são facilmente escaláveis para lidar com grandes volumes de dados. Em contraste, as soluções de Big Data são projetadas para escalabilidade horizontal, o que significa que podem lidar com grandes quantidades de dados distribuindo o processamento por vários nós ou servidores.
Estrutura de Dados: Bancos de dados relacionais geralmente exigem que os dados estejam em formato tabular e sigam um esquema rígido. Em Big Data, os dados podem ser estruturados, semiestruturados ou não estruturados. Isso permite a ingestão e análise de uma variedade mais ampla de dados.
Tecnologias: Para Big Data, são usadas ferramentas e tecnologias diferentes, como Hadoop, Spark, NoSQL databases (por exemplo, MongoDB, Cassandra), sistemas de armazenamento distribuído (por exemplo, HDFS), e outras soluções específicas para lidar com grandes volumes de dados e análises em tempo real.
Processamento Paralelo: O processamento de Big Data é altamente paralelo, o que significa que os dados são processados em vários nós de forma simultânea. Isso é essencial para lidar com o volume e a velocidade dos dados em Big Data.
Análises Avançadas: Big Data frequentemente envolve análises avançadas, como aprendizado de máquina e análise de texto, que vão além das consultas SQL típicas em bancos de dados relacionais.
Distribuição Geográfica: Em Big Data, os dados podem estar distribuídos em locais geograficamente dispersos, o que requer soluções de processamento distribuído e ferramentas de gerenciamento de dados específicas.

Em resumo, embora algumas técnicas de processamento de dados possam ser aplicadas em ambos os cenários, as ferramentas e abordagens utilizadas em Big Data são adaptadas às necessidades específicas de lidar com grandes volumes, variedade e velocidade de dados, bem como análises mais avançadas. Portanto, as ferramentas para manipular dados em Big Data geralmente não são as mesmas que as usadas em bancos de dados relacionais tradicionais.

Errado. Ambas utilizam o MapReduce, por exemplo, mas a BigData, por possuir uma volumosidade absurda de dados quando comparada aos Bancos de Dados relacionais, necessita de ferramentas mais específicas para tratar disso com velocidade, como o Apache Hadoop, que são softwares integrados para lidar com os 5 V's da BigData.

GAB. Errado!

Uma vez que se trata de volumes absurdos de dados, a lógica já nos leva a entender que precisam de novas ferramentas ou ferramentas adaptadas a esse cenário.

Outra questão relacionada:

(CESPE-2024) - Com relação a Big Data, julgue o item seguinte.

Big Data é um conjunto de dados maior e mais complexo de novas fontes de dados que softwares tradicionais de processamento de dados não conseguem gerenciar devido ao seu volume.

GAB. CERTO

banco de dados

Trabalham com dados estruturados.
Utilizam SQL como linguagem padrão.
Ferramentas comuns:
MySQL
PostgreSQL
Oracle DB
SQL Server

big data

Trabalha com dados estruturados, semiestruturados e não estruturados.
Lida com grandes volumes (volume), velocidade e variedade (os 3Vs do Big Data).
Utiliza ferramentas específicas para processamento paralelo e distribuído.
Ferramentas comuns:
Hadoop (e seu ecossistema: HDFS, MapReduce)
Spark
Hive (usa uma linguagem parecida com SQL)
Kafka (para streaming de dados)
NoSQL databases como MongoDB, Cassandra, HBase

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo

SEJA VITALÍCIO