No que se refere a banco de dados NoSQL e data lake, julgue ...
Considere-se que uma empresa de comércio eletrônico deseje armazenar todos os dados relacionados às interações dos clientes em seu site — registros de visitas, cliques, compras, avaliações, comentários, entre outros. Nessa situação, se a empresa decidir não estruturar e organizar esses dados antecipadamente, será melhor armazenar esses dados em uma solução data lake do que em um banco relacional.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta para a questão apresentada é: C - certo.
Vamos entender por que essa alternativa é a correta e como a questão aborda o tema de banco de dados NoSQL e data lake.
Primeiramente, é importante compreender o conceito de data lake. Um data lake é uma solução de armazenamento que permite guardar grandes volumes de dados em sua forma bruta, ou seja, sem a necessidade de estruturação e organização antecipada. Esse tipo de solução é ideal para armazenar dados variados e volumosos que podem ser processados e analisados posteriormente.
Por outro lado, um banco de dados relacional exige que os dados sejam estruturados (organizados em tabelas e colunas) e seguem um esquema rígido. Isso pode ser um obstáculo quando lidamos com dados não estruturados ou semiestruturados, como registros de visitas, cliques, avaliações e comentários, comuns em um ambiente de comércio eletrônico.
Portanto, ao considerar a situação descrita na questão, onde a empresa deseja armazenar uma grande variedade de dados relacionados às interações dos clientes sem estruturá-los antecipadamente, uma solução de data lake é mais adequada do que um banco de dados relacional.
Justificando a alternativa correta:
No enunciado, é mencionado que a empresa "deseja armazenar todos os dados relacionados às interações dos clientes em seu site— registros de visitas, cliques, compras, avaliações, comentários, entre outros" e que a empresa "decidir não estruturar e organizar esses dados antecipadamente".
Esse cenário é ideal para o uso de um data lake, pois este permite armazenar dados variados e volumosos de maneira eficiente, sem a necessidade de definir uma estrutura rígida de antemão. Desta forma, a empresa pode coletar e armazenar todos os dados brutos e, posteriormente, processá-los e analisá-los conforme necessário.
C - certo: Afirmativa correta, pois, conforme explicado, um data lake é mais adequado para armazenar dados não estruturados e volumosos sem a necessidade de organização antecipada.
Explicação das alternativas incorretas:
E - errado: Esta alternativa seria incorreta, pois contradiz o conceito fundamental de data lake e banco de dados relacional. Um banco de dados relacional não é a escolha mais apropriada para armazenar dados não estruturados ou semiestruturados em grande volume sem organização prévia. Um data lake é claramente a solução mais adequada para o cenário descrito.
Espero que esta explicação tenha sido clara. Qualquer dúvida adicional sobre o tema, estou à disposição para ajudar!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
No caso descrito, em que a empresa deseja armazenar uma grande quantidade de dados relacionados às interações dos clientes em seu site, e não pretende realizar uma estruturação e organização prévia desses dados, um Data Lake pode ser uma escolha mais adequada do que um banco de dados relacional.
Aqui está o raciocínio:
- Data Lake: Um Data Lake é uma solução de armazenamento que permite armazenar grandes volumes de dados brutos e não estruturados. Ele oferece flexibilidade para armazenar dados de diversas fontes sem a necessidade de um esquema pré-definido. Isso é especialmente útil quando se lida com dados variados e complexos, como os registros de interações dos clientes mencionados. Posteriormente, é possível processar, analisar e estruturar esses dados conforme necessário.
- Banco de Dados Relacional: Em um banco de dados relacional, é necessário definir uma estrutura de tabelas e esquemas antes de inserir os dados. Isso implica em um processo de modelagem e design de banco de dados que pode ser complexo e demorado. Se os dados não estão estruturados ou não se encaixam bem em um esquema pré-definido, pode ser mais desafiador gerenciar essas informações em um banco relacional.
Gabarito Certo
Fonte: ChatGPT
Data Lake é tipo o rio tietê: os porcos jogam tudo que é lixo lá, não se importando em separar (isto é, estruturar).
Banco Relacional é uma parada mais limpa, um lixão organizado. Separando vidro, plásticos, recicláveis, não recicláveis...
Data Lake: "Lago de dados"
- Dados geralmente são armazenados da maneira que forma capturados - Brutos, sem nenhum tratamento;
- Armazenam dados estruturados, semi- estruturados, e não-estruturados;
- Armazenam um gigantesco volume de dados.
GABARITO: CERTO
QUAL A DIFERENÇA ENTRE UM DATA LAKE E UM BANCO RELACIONAL?
O banco relacional armazena os dados em tabelas, logo, faz-se necessário que esses dados estejam preferencialmente organizados / estruturados.
O data lake tem a característica de armazenar um gigantesco volumo de dados. Ele armazena todos os tipos de dados - estruturados, semi estruturados e não estruturados. Ele armazena os dados na forma bruta.
Dessa forma, o data lake é o tipo de BD mais adequado para essa situação.
Nessa situação, se a empresa decidir não estruturar e organizar esses dados antecipadamente,
Data Lake: Um Data Lake é uma solução de armazenamento que permite armazenar grandes volumes de dados brutos e não estruturados. Ele oferece flexibilidade para armazenar dados de diversas fontes sem a necessidade de um esquema pré-definido.
Banco de Dados Relacional: Em um banco de dados relacional, é necessário definir uma estrutura de tabelas e esquemas antes de inserir os dados. Isso
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo