Julgue os itens subsequentes, a respeito de sistemas de supo...
Em uma modelagem multidimensional, cada dimensão deve possuir uma chave de acesso associada ao ambiente transacional no momento do ETL. Nesse tipo de modelagem, a utilização de chaves semânticas ou naturais, em vez de chaves artificiais ou surrogate keys, agrega, entre outras vantagens, maior integração entre o ambiente operacional e o transacional, o que facilita operações de drill down em arquiteturas do tipo ROLAP; maior estabilidade no projeto; melhor nível de consistência nos dados e mais facilidade de conferência na importação dos dados no ETL.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E - Errado
Para resolver esta questão, é importante entender os conceitos de modelagem multidimensional e os processos envolvidos no ETL (Extract, Transform, Load) dentro de sistemas de suporte à decisão, como Data Warehouses. A modelagem multidimensional é usualmente aplicada para representar dados analíticos através de cubos de dados contendo dimensões e medidas, facilitando análises complexas e consultas ad hoc.
Na prática, dimensões em um modelo multidimensional frequentemente utilizam surrogate keys (chaves artificiais) ao invés de chaves naturais. As surrogate keys são chaves sequenciais geradas, que não possuem valor semântico fora do sistema de banco de dados. Elas são preferidas por várias razões:
- Permitem melhor desempenho, pois costumam ser números inteiros de fácil indexação.
- Evitam problemas decorrentes de alterações nos dados de origem, garantindo estabilidade ao modelo.
- Facilitam a manutenção do histórico de dados em ambientes de data warehouse.
- Reduzem as chances de conflitos de chave quando dados de diferentes fontes são integrados.
Contrariando o texto, o uso de chaves semânticas ou naturais poderia complicar as operações de drill down em ROLAP (Relational Online Analytical Processing), aumentar a complexidade no projeto, causar problemas de consistência nos dados e dificultar a conferência durante o processo de ETL, uma vez que essas chaves podem mudar no sistema operacional.
Portanto, a afirmação é errada pois chaves naturais não são recomendadas para modelagem multidimensional no contexto de sistemas de BI, sendo as surrogate keys a abordagem preferencial por oferecerem benefícios significativos em estabilidade, desempenho e manutenção.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
"Em uma modelagem multidimensional, cada dimensão deve possuir uma chave de acesso associada ao ambiente transacional no momento do ETL"
Parei nesta primeira frase, talvez eu esteja errado, mas as dimensões são associadas depois que o ETL é feito, já no datawarehouse ou datamarts;
Gabarito: errado
O erro que encontrei foi em relação ao não uso das surrogate keys.
Na verdade, é aconselhável o uso de surrogate keys na modelagem multidimensional.
http://corporate.canaltech.com.br/noticia/banco-de-dados/Grandes-erros-na-elaboracao-do-Data-Warehouse-que-devem-ser-evitados/
Como o Diego disse, o erro da questão é afirmar que a a utilização de chaves semânticas ou naturais em datawarehouse oferece todas essas vantagens elencadas.
Em Datawarehouse é recomendável a utilização de surrogate keys (= chaves artificiais)
Na verdade, o próprio Kimball levanta alguns problemas do uso de chaves naturais (derivadas do negócio).
As chaves naturais podem ser alteradas, reutilizadas pela aplicação do negócio. Logo essa integração entre o ambiente operacional e o transacional apontada como vantagem já seria um problema.
"Production keys such as product keys or customer keys are generated,
formatted, updated, deleted, recycled, and reused according to the
dictates of production. If you use production keys as your keys, you
will be jerked around by changes that can be, at the very least,
annoying, and at the worst, disastrous."
"Production may generalize its key format to handle (...) Production may reuse keys that it has purged"
ótimo texto para conhecimento do assunto.
Fonte: http://www.kimballgroup.com/1998/05/surrogate-keys/
Errado, apenas complementando o erro já apontado pelos colegas:
"Não podemos utilizar chaves das tabelas operacionais para junções entre Dimensões e Fatos. Devemos utilizar as surrogate keys (chaves artificiais ou substitutas) pois só assim é possível tratar dados históricos nas tabelas de Fatos e o versionamento (modificações) dos dados nas Dimensões. Sem as chaves substitutas esse artifício é inviabilizado."
http://corporate.canaltech.com.br/noticia/banco-de-dados/Grandes-erros-na-elaboracao-do-Data-Warehouse-que-devem-ser-evitados/
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo