Julgue o item a seguir, a respeito de sistema gerenciador de...
Data warehouses são repositórios nos quais os dados podem ser armazenados em formatos variados, incluindo-se registros semiestruturados e formatos de arquivo não estruturados.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Vamos analisar a questão e entender por que a alternativa correta é E - errado.
Primeiramente, é importante entender o que é um Data Warehouse. Um Data Warehouse (DW) é um repositório centralizado de dados que armazena informações de diversas fontes de uma organização, para ser usado em análises e na tomada de decisões. Os dados no DW são estruturados, o que significa que eles são organizados em tabelas com linhas e colunas, de maneira a facilitar a consulta e análise.
A questão afirma que os Data Warehouses podem armazenar dados em formatos variados, incluindo registros semiestruturados e não estruturados. Esta afirmação está errada por alguns motivos principais:
- Dados Estruturados: Os Data Warehouses trabalham fundamentalmente com dados estruturados, que vêm de sistemas transacionais e são organizados de maneira a facilitar a análise.
- Semiestruturados e Não Estruturados: Embora dados semiestruturados (como JSON ou XML) possam ser convertidos e carregados em um DW, eles precisam ser transformados em um formato estruturado antes de serem armazenados. Dados não estruturados (como textos livres, vídeos, ou imagens) geralmente não são armazenados diretamente em um DW. Outros sistemas, como Data Lakes, são mais adequados para esses tipos de dados.
Agora que esclarecemos isso, vamos justificar as alternativas:
Alternativa Correta: E - errado
Os Data Warehouses não são projetados para armazenar dados semiestruturados e não estruturados diretamente. Eles são otimizados para dados estruturados, que vêm de diversas fontes e são organizados de maneira a facilitar a consulta e análise.
Alternativa Incorreta: C - certo
Se escolhêssemos "C - certo", estaríamos afirmando que os Data Warehouses podem armazenar diretamente dados semiestruturados e não estruturados, o que não é verdade. Isso caracterizaria uma compreensão equivocada sobre a finalidade e estrutura dos Data Warehouses.
Espero que agora tenha ficado claro por que a alternativa correta é E - errado.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gab E.
Acredito que o examinador quis confundir com o Data Lake.
[1] Tanto data lakes quanto data warehouses podem ter fontes de dados ilimitadas. No entanto, o data warehousing requer que você projete seu esquema antes de salvar os dados. Só é possível salvar dados estruturados no sistema.
Por outro lado, data lakes não têm esses requisitos. Eles podem armazenar dados semiestruturados ou não estruturados, como logs de servidores da Web, dados de fluxos de cliques, de mídias sociais e de sensor.
Fonte: [1] aws.amazon
Data Warehouse x Data Lake -
- Data Warehouse - dados geralmente são tratados (limpos, combinados, organizados, etc) antes de serem armazenados. Podem armazenar todos os tipos de dados, mas o foco é nos dados estruturados. Ideal para usuários operacionais visto que as ferramentas analíticas são mais fáceis de usar. Armazenamento de dados custam geralmente mais caro e consome mais tempo. Um esquema é definido antes dos dados serem armazenados. Armazenam um grande volume de dados.
- Data Lake - dados geralmente são armazenados da maneira que foram capturados – brutos, sem nenhum tratamento. Armazenam dados estruturados, semi-estruturados e não-estruturados. Ideal para cientistas de dados visto que as ferramentas analíticas são mais difíceis de usar. Armazenamento de dados custam geralmente mais barato e consome menos tempo. Um esquema é definido após os dados serem armazenados. Armazenam um gigantesco volume de dados.
Errado.
Data warehouses são projetados para armazenar e gerenciar dados estruturados, tipicamente organizados em tabelas relacionais com esquema definido (linhas e colunas). Embora possam ser utilizados para análise de grandes volumes de dados, eles não são adequados para armazenar dados semiestruturados ou não estruturados, que são mais comuns em bancos de dados NoSQL. Para esses tipos de dados, outros tipos de soluções, como data lakes, são mais apropriados.
Erado
data warehousing - dados estruturados
Data Lake - dados semi estruturados ou nao estruturados
ERRADO.
Tá tentando de confundir com Data Lake.
Data Lake -> Dados brutos e desestruturados
Data Warehouse -> Dados relacionados e estruturados
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo