No que se refere a banco de dados NoSQL e data lake, julgue ...

Próximas questões
Com base no mesmo assunto
Q2276956 Banco de Dados
No que se refere a banco de dados NoSQL e data lake, julgue o próximo item.
Considere-se que uma empresa de comércio eletrônico deseje armazenar todos os dados relacionados às interações dos clientes em seu site — registros de visitas, cliques, compras, avaliações, comentários, entre outros. Nessa situação, se a empresa decidir não estruturar e organizar esses dados antecipadamente, será melhor armazenar esses dados em uma solução data lake do que em um banco relacional. 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

A alternativa correta para a questão apresentada é: C - certo.

Vamos entender por que essa alternativa é a correta e como a questão aborda o tema de banco de dados NoSQL e data lake.

Primeiramente, é importante compreender o conceito de data lake. Um data lake é uma solução de armazenamento que permite guardar grandes volumes de dados em sua forma bruta, ou seja, sem a necessidade de estruturação e organização antecipada. Esse tipo de solução é ideal para armazenar dados variados e volumosos que podem ser processados e analisados posteriormente.

Por outro lado, um banco de dados relacional exige que os dados sejam estruturados (organizados em tabelas e colunas) e seguem um esquema rígido. Isso pode ser um obstáculo quando lidamos com dados não estruturados ou semiestruturados, como registros de visitas, cliques, avaliações e comentários, comuns em um ambiente de comércio eletrônico.

Portanto, ao considerar a situação descrita na questão, onde a empresa deseja armazenar uma grande variedade de dados relacionados às interações dos clientes sem estruturá-los antecipadamente, uma solução de data lake é mais adequada do que um banco de dados relacional.

Justificando a alternativa correta:

No enunciado, é mencionado que a empresa "deseja armazenar todos os dados relacionados às interações dos clientes em seu site— registros de visitas, cliques, compras, avaliações, comentários, entre outros" e que a empresa "decidir não estruturar e organizar esses dados antecipadamente".

Esse cenário é ideal para o uso de um data lake, pois este permite armazenar dados variados e volumosos de maneira eficiente, sem a necessidade de definir uma estrutura rígida de antemão. Desta forma, a empresa pode coletar e armazenar todos os dados brutos e, posteriormente, processá-los e analisá-los conforme necessário.

C - certo: Afirmativa correta, pois, conforme explicado, um data lake é mais adequado para armazenar dados não estruturados e volumosos sem a necessidade de organização antecipada.

Explicação das alternativas incorretas:

E - errado: Esta alternativa seria incorreta, pois contradiz o conceito fundamental de data lake e banco de dados relacional. Um banco de dados relacional não é a escolha mais apropriada para armazenar dados não estruturados ou semiestruturados em grande volume sem organização prévia. Um data lake é claramente a solução mais adequada para o cenário descrito.

Espero que esta explicação tenha sido clara. Qualquer dúvida adicional sobre o tema, estou à disposição para ajudar!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

No caso descrito, em que a empresa deseja armazenar uma grande quantidade de dados relacionados às interações dos clientes em seu site, e não pretende realizar uma estruturação e organização prévia desses dados, um Data Lake pode ser uma escolha mais adequada do que um banco de dados relacional.

Aqui está o raciocínio:

  • Data Lake: Um Data Lake é uma solução de armazenamento que permite armazenar grandes volumes de dados brutos e não estruturados. Ele oferece flexibilidade para armazenar dados de diversas fontes sem a necessidade de um esquema pré-definido. Isso é especialmente útil quando se lida com dados variados e complexos, como os registros de interações dos clientes mencionados. Posteriormente, é possível processar, analisar e estruturar esses dados conforme necessário.

  • Banco de Dados Relacional: Em um banco de dados relacional, é necessário definir uma estrutura de tabelas e esquemas antes de inserir os dados. Isso implica em um processo de modelagem e design de banco de dados que pode ser complexo e demorado. Se os dados não estão estruturados ou não se encaixam bem em um esquema pré-definido, pode ser mais desafiador gerenciar essas informações em um banco relacional.

Gabarito Certo

Fonte: ChatGPT

Data Lake é tipo o rio tietê: os porcos jogam tudo que é lixo lá, não se importando em separar (isto é, estruturar).

Banco Relacional é uma parada mais limpa, um lixão organizado. Separando vidro, plásticos, recicláveis, não recicláveis...

Data Lake: "Lago de dados"

  • Dados geralmente são armazenados da maneira que forma capturados - Brutos, sem nenhum tratamento;
  • Armazenam dados estruturados, semi- estruturados, e não-estruturados;
  • Armazenam um gigantesco volume de dados.

GABARITO: CERTO

QUAL A DIFERENÇA ENTRE UM DATA LAKE E UM BANCO RELACIONAL?

O banco relacional armazena os dados em tabelas, logo, faz-se necessário que esses dados estejam preferencialmente organizados / estruturados.

O data lake tem a característica de armazenar um gigantesco volumo de dados. Ele armazena todos os tipos de dados - estruturados, semi estruturados e não estruturados. Ele armazena os dados na forma bruta.

Dessa forma, o data lake é o tipo de BD mais adequado para essa situação.

Nessa situação, se a empresa decidir não estruturar e organizar esses dados antecipadamente,

Data Lake: Um Data Lake é uma solução de armazenamento que permite armazenar grandes volumes de dados brutos e não estruturados. Ele oferece flexibilidade para armazenar dados de diversas fontes sem a necessidade de um esquema pré-definido.

Banco de Dados Relacional: Em um banco de dados relacional, é necessário definir uma estrutura de tabelas e esquemas antes de inserir os dados. Isso 

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo