Acerca de técnicas de modelagem e otimização de bases de dad...
Acerca de técnicas de modelagem e otimização de bases de dados multidimensionais, julgue o item subsecutivo.
Ao utilizar um esquema estrela, as tabelas dimensão são
propositalmente desnormalizadas.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: C - certo
A questão aborda o conceito de modelagem de dados multidimensionais, que é fundamental para o design de bases de dados utilizadas em sistemas de suporte à decisão, como Data Warehouses. Um dos esquemas mais comuns nessa área é o esquema estrela.
No esquema estrela, temos uma tabela central chamada de tabela de fatos, que contém as medidas numéricas de interesse, ou seja, os dados que são analisados e agregados para fornecer informações estratégicas. Circundando essa tabela de fatos, existem várias tabelas de dimensão, que contêm atributos descritivos relacionados às dimensões do negócio, como tempo, geografia, clientes, produtos, entre outros.
O ponto chave dessa questão é o entendimento de que as tabelas de dimensão são propositalmente desnormalizadas. A desnormalização é um processo onde se permite alguma redundância de dados com o objetivo de otimizar a performance de consultas. Em ambientes de banco de dados tradicionais, busca-se a normalização para reduzir redundância e garantir a integridade dos dados, mas em um Data Warehouse, a prioridade é a velocidade de leitura e a simplicidade das consultas, o que justifica a desnormalização.
Portanto, ao utilizar um esquema estrela, aceita-se que as tabelas de dimensão sejam desnormalizadas para que se possa realizar operações de consulta mais eficientes, já que agregações, junções e filtros são mais simples de serem executados em estruturas desnormalizadas, quando comparadas às estruturas normalizadas de bancos de dados operacionais. Isso é essencial no contexto de análise de dados e Business Intelligence, onde a performance na recuperação de dados é crítica.
Em resumo, a alternativa está correta porque reflete adequadamente a prática de desnormalizar intencionalmente as tabelas de dimensão em um esquema estrela para melhorar o desempenho das consultas em bases de dados multidimensionais.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
nao entendi esse "propositalmente"
O esquema em estrela é uma abordagem de modelagem madura amplamente adotada por data warehouses relacionais. Ele requer que os modeladores classifiquem suas tabelas de modelo como dimensão ou fato.
Tabelas de dimensões descrevem as entidades de negócios – os itens que você modela. As entidades podem incluir produtos, pessoas, locais e conceitos, incluindo o próprio tempo. A tabela mais consistente que você encontrará em um esquema em estrela é uma tabela de dimensão de data. Uma tabela de dimensões contém uma ou mais colunas de chave, que atuam como um identificador exclusivo, e colunas descritivas.
Tabelas de fatos armazenam observações ou eventos e podem ser ordens de vendas, saldos de ações, taxas de câmbio, temperaturas, etc. Uma tabela de fatos contém colunas chave de dimensão relacionadas a tabelas de dimensões e colunas de medidas numéricas. As colunas de chave de dimensão determinam a dimensionalidade de uma tabela de fatos, enquanto os valores de chave de dimensão determinam a granularidade de uma tabela de fatos. Por exemplo, considere uma tabela de fatos projetada para armazenar os destinos de venda que têm duas colunas de chave de dimensão Data e ProductKey. É fácil entender que a tabela tem duas dimensões. No entanto, a granularidade não pode ser determinada sem considerar os valores de chave de dimensão. Neste exemplo, considere que os valores armazenados na coluna Data são o primeiro dia de cada mês. Nesse caso, a granularidade está no nível do mês-produto.
Em geral, as tabelas de dimensões contêm um número relativamente pequeno de linhas. As tabelas de fatos, por outro lado, podem conter um número muito grande de linhas e continuar crescendo ao longo do tempo."
site da microsofth
https://learn.microsoft.com/pt-br/power-bi/guidance/star-schema
Para entender alguns conceitos de esquema em estrela, é importante conhecer dois termos: normalização e desnormalização.
"Normalização é o termo usado para descrever os dados armazenados de uma forma que reduz dados repetidos. Considere uma tabela de produtos que tem uma coluna de valor de chave exclusiva, como a chave do produto, e colunas adicionais que descrevem características do produto, incluindo nome do produto, categoria, cor e tamanho. Uma tabela de vendas é considerada normalizada quando armazena apenas chaves, como a chave do produto. Na imagem a seguir, observe que apenas a coluna ProductKey registra o produto.
Se, no entanto, a tabela de vendas armazenar detalhes do produto além da chave, ela será considerada desnormalizada. Na imagem a seguir, observe que ProductKey e outras colunas relacionadas ao produto registram o produto.
Quando você obtém dados de um arquivo de exportação ou extração de dados, é provável que ele represente um conjunto de dados desnormalizado. Nesse caso, use o para transformar e moldar os dados de origem em várias tabelas normalizadas.
Conforme descrito neste artigo, você deve se esforçar para desenvolver modelos de dados otimizados do Power BI com tabelas que representam dados de fatos e dimensões normalizados. No entanto, há uma exceção em que uma deve ser desnormalizada para produzir uma tabela de modelo."
Site da microsofth
https://learn.microsoft.com/pt-br/power-bi/guidance/star-schema
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo