Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com
isso, novos conceitos foram introduzidos, como o Data Lake, que

Question

Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com
isso, novos conceitos foram introduzidos, como o Data Lake, que Alternativa A: pode ser considerado um repositório de dados relacionados, sendo, portanto, um armazém
de dados orientado por assunto. Ou Alternativa B: pode ser considerado um conjunto de bancos de dados relacionais e com relacionamentos
entre tabelas de diferentes esquemas de bancos de dados. Ou Alternativa C: é o resultado de sucessivas operações de mineração de dados, sendo um ambiente no
qual é possível ter relatórios e dashboards de maneira amigável para os analistas de
negócio. Ou Alternativa D: é projetado para armazenar dados de diversas fontes e formatos, não havendo a
necessidade da definição de um esquema de dados para inserir novos itens.

Qconcursos · Accepted Answer

Alternativa [D] é projetado para armazenar dados de diversas fontes e formatos, não havendo a
necessidade da definição de um esquema de dados para inserir novos itens. Gabarito: Letra D

Para compreender a questão e identificar a resposta correta, é essencial ter um entendimento sobre os conceitos de Big Data e Data Lake. Big Data se refere à manipulação de grandes volumes de dados que são complexos e crescem exponencialmente com o tempo. Já um Data Lake é uma arquitetura de armazenamento que permite armazenar grandes quantidades de dados em seu estado bruto e nativo, incluindo dados estruturados, semi-estruturados e não estruturados.

A resposta correta é a Letra D, porque reflete exatamente o propósito de um Data Lake. Em um Data Lake, os dados são armazenados em seu formato natural e podem vir de diversas fontes. Um ponto importante dos Data Lakes é a flexibilidade: não é necessário definir um esquema até que os dados sejam lidos ou processados, o que é conhecido como "schema-on-read". Isso difere drasticamente de um armazém de dados tradicional, onde o esquema deve ser definido antes dos dados serem carregados ("schema-on-write").

Vamos entender por que a alternativa D é a correta com uma observação mais detalhada:

É projetado para armazenar dados de diversas fontes: Isso indica que o Data Lake é uma solução para a coleta de dados de múltiplas origens, sejam eles logs de servidores, dados de sensores IoT, transações financeiras, entre outros.
    E formatos: O Data Lake pode lidar com dados em vários formatos, como CSV, JSON, imagens, vídeos, etc. Essa é uma característica que o difere de sistemas tradicionais, que requerem formatos específicos.
    Não havendo a necessidade da definição de um esquema de dados para inserir novos itens: Esta é uma característica essencial do Data Lake, a capacidade de armazenar dados sem a necessidade de definição prévia de um esquema de banco de dados. Isso proporciona grande flexibilidade e agilidade na inserção de novos dados.

As demais alternativas não descrevem corretamente o conceito de um Data Lake:

A alternativa A descreve o conceito de um Data Warehouse, que é um armazém de dados orientado por assunto e estruturado para facilitar a análise e o relatório de dados.
    A alternativa B parece descrever um sistema integrado de bancos de dados relacionais, o que não abrange a amplitude de tipos de dados e a natureza não relacional que um Data Lake pode conter.
    A alternativa C confunde Data Lake com ferramentas de Business Intelligence (BI), que são utilizadas para análise de dados e não para o armazenamento em estado bruto.

Portanto, a resposta correta é a alternativa D, por ela capturar a essência do que é um Data Lake no contexto de Big Data.

SEJA VITALÍCIO

SEJA VITALÍCIO

Big Data surgiu a partir da necessidade de manipular um gran...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas