No que se refere a banco de dados NoSQL e data lake, julgue ...
Considere-se que uma empresa de comércio eletrônico deseje armazenar todos os dados relacionados às interações dos clientes em seu site — registros de visitas, cliques, compras, avaliações, comentários, entre outros. Nessa situação, se a empresa decidir não estruturar e organizar esses dados antecipadamente, será melhor armazenar esses dados em uma solução data lake do que em um banco relacional.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: C - certo
A questão aborda o conceito de data lake em comparação com bancos de dados relacionais tradicionais. Para resolver essa questão, é necessário compreender a diferença entre um data lake e um banco de dados relacional, bem como as situações em que cada um é mais apropriado.
Um data lake é um sistema de armazenamento que permite guardar grandes volumes de dados em seu formato bruto, sem a necessidade de estruturação prévia. Isso significa que você pode armazenar todos os tipos de dados, sejam eles estruturados, semiestruturados ou não estruturados, e decidir como utilizá-los posteriormente. Isso é particularmente útil quando se lida com dados massivos e variados, como é o caso de uma empresa de comércio eletrônico que deseja armazenar registros de visitas, cliques, compras, avaliações e comentários.
Em contraste, um banco de dados relacional exige que os dados sejam estruturados em tabelas previamente definidas, com esquemas fixos que determinam o formato dos dados antes de serem armazenados. Isso pode limitar a flexibilidade e a agilidade ao lidar com grandes quantidades de dados que não se encaixam facilmente nesses esquemas ou que mudam rapidamente com o tempo.
Portanto, a afirmação está correta, pois em um cenário onde a empresa opta por não estruturar e organizar antecipadamente os dados, um data lake oferece a flexibilidade necessária para armazenar e posteriormente processar e analisar esses dados de forma eficiente e escalável, sem as restrições impostas pelos bancos de dados relacionais.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gabarito: certo
Um data lake é um repositórios que consegue armazenar todos os tipos de dados: estruturados, não estruturados, semiestruturados...
Já no banco de dados relacional, é necessário fazer uma organização, consequentemente transformar os dados em categorias etc
O que não seria válido para a ocasião proposta pela questão!
NÃO DESISTA!! DEUS TE AMA!!
Certo.
A afirmação é correta. Um Data Lake é uma solução de armazenamento que permite armazenar grandes volumes de dados brutos e não estruturados. Se a empresa pretende armazenar dados diversificados, como registros de visitas, cliques, compras, avaliações e comentários, sem uma estruturação prévia, um Data Lake pode ser mais adequado do que um banco de dados relacional.
Diferentemente dos bancos de dados relacionais, que exigem esquemas rigorosos e estruturação dos dados antes do armazenamento, um Data Lake permite a ingestão de dados em seu formato bruto, sem a necessidade de definição de esquemas rígidos antecipadamente. Isso oferece flexibilidade para lidar com dados variados e não estruturados, com a capacidade de realizar a transformação e a análise posteriormente, conforme necessário.
Portanto, a opção por um Data Lake pode ser mais adequada quando a estruturação antecipada dos dados não é viável ou desejada.
Fonte: ChatGPT
UM ADENDO SOBRE AS PRINCIPAIS DIFERENÇAS ENTRE DL E DW.
A principal diferença entre Data Lake (DL) e Data Warehouse (DW) reside na natureza e no propósito do armazenamento de dados:
- Data Lake (DL):
- Natureza dos Dados: Armazena dados brutos, não processados e não estruturados. Pode conter uma variedade de formatos de dados, incluindo texto, imagens, vídeos, logs e outros.
- Estrutura: Não requer uma estruturação rígida ou um esquema definido antecipadamente. Pode lidar com dados variados e não estruturados.
- Escopo Temporal: Pode armazenar grandes volumes de dados históricos e em tempo real.
- Flexibilidade: Oferece flexibilidade para a realização de análises exploratórias e descoberta de insights, permitindo a transformação e a análise dos dados conforme necessário.
- Data Warehouse (DW):
- Natureza dos Dados: Armazena dados processados, estruturados e otimizados para consulta e análise. Geralmente, os dados são provenientes de fontes específicas e foram transformados para atender a um esquema definido.
- Estrutura: Requer uma modelagem de dados rigorosa e um esquema definido antes do armazenamento. Os dados são organizados em tabelas e relacionamentos.
- Escopo Temporal: Geralmente, foca em dados históricos e consolidados, otimizados para consultas analíticas.
- Finalidade: Projetado para suportar consultas analíticas complexas e relatórios de negócios. Oferece desempenho otimizado para consultas estruturadas.
Em resumo, um Data Lake é mais flexível e adequado para armazenar grandes volumes de dados brutos e variados, enquanto um Data Warehouse é otimizado para consultas analíticas estruturadas e relatórios de negócios, exigindo uma modelagem prévia dos dados. Em muitos casos, organizações optam por integrar ambas as soluções para obter o melhor dos dois mundos, usando o Data Lake para a ingestão inicial de dados e o Data Warehouse para análises específicas e relatórios.
Fonte: ChatGPT
GABARITO CERTO
DATA LAKE = Armazena todos os tipos de dados (Não estruturados / semiestruturados / estruturados) de forma bruta
BANCO DE DADOS RELACIONAL = TABELAS = Armazena os dados (estruturados) em linhas e colunas
Portanto, se a empresa não quer tratar o dados, ela deve usar um DATA LAKE.
GAB: CERTO
Sim, visto que o data lake é um banco de dados onde se armazenam dados brutos, não estruturados, estruturados e etc.. Ou seja, grande volume de dados.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo