Com relação à modelagem dimensional e à otimização de bases ...
Com relação à modelagem dimensional e à otimização de bases de dados para business intelligence, julgue o item subsequente.
Na modelagem multidimensional utilizada em data warehouses
para se prover melhor desempenho, a tabela fato central deve
relacionar-se às suas dimensões por meio da chave primária
oriunda da fonte de dados original. O valor dessa chave deve
ser idêntico ao da fonte, para que tenha valor semântico e
garanta que o histórico das transações seja mantido.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E - Errado
Para compreender por que a afirmativa é incorreta, é necessário entender os conceitos de modelagem dimensional usados em Data Warehouses (DW). A modelagem dimensional é uma técnica de design lógico destinada a apresentar os dados de uma maneira intuitiva e com bom desempenho para consultas de business intelligence. Esta abordagem é centrada em tabelas fato que se relacionam com dimensões, descrevendo as métricas de negócio e os contextos, respectivamente.
O ponto-chave da questão é a menção à chave primária e sua relação com a fonte de dados original. Em um ambiente DW, as chaves primárias das tabelas fato normalmente são chaves substitutas (surrogate keys), que não têm significado fora do DW. Elas são utilizadas para garantir a integridade referencial e o desempenho do sistema, mas não mantêm valor semântico relacionado com as chaves primárias da fonte de dados. Ao contrário do que foi afirmado, manter a chave original pode não ser benéfico para o DW, pois esse não é o seu propósito e pode inclusive gerar problemas de desempenho ou integridade ao longo do tempo.
Projetar um DW envolve decidir como as chaves substitutas serão geradas e utilizadas para vincular as tabelas fato às suas dimensões, o que geralmente envolve um processo chamado ETL (Extract, Transform, Load), no qual os dados são extraídos, transformados e carregados do sistema de origem para o DW. Durante esse processo, as chaves podem ser alteradas para se adequarem ao esquema dimensional, otimizado para consultas analíticas.
Portanto, a afirmação de que a tabela fato deve manter a chave primária original por questões de semântica e histórico é incorreta, pois a modelagem dimensional de um DW frequentemente utiliza chaves substitutas para maximizar a eficiência e a eficácia das operações de consulta no DW.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
O que é uma tabela fato (Fact Table):
É a tabela dominante de um esquema de modelagem tipo estrela (Star Schema), em um modelo multidimensional, e tem como característica principal a presença de dados altamente REDUNTANTES para se obter um melhor desempenho.
A tabel de fatos contém dois tipos de campos:
● os campos de armazenar as chaves estrangeiras que ligam cada circunstância particular para o valor apropriado em cada dimensão
● e os campos de armazenar os dados individuais - como o número , quantidade e preço.
Só marquei errado pelo por causas das palavras: "garanta, deve ser , ..."
http://www.fatecsp.br/dti/tcc/tcc00071.pdf
Acredito que o erro estar em que as tabelas de fato contêm chaves externas que se relacionam com as suas respectivas tabelas de dimensoes. A questao mencionou q seriam chaves primárias.
Para melhor manter o controle sobre identificadores de registro de ambientes de data warehouse (armazém de dados), em geral recomenda-se a geração de chaves substitutas (surrogate keys). Assim, cada junção entre as tabelas de dimensão e tabelas fato em um ambiente de data warehouse deve se basear nessas chaves substitutas, e não nas chaves naturais existentes..
O erro está em falar que as tabelas fato se relacionam às dimensões pela chave do sistema original. Na modelagem multidimensional, trabalha-se com o conceito de "SURROGATE KEYS", que são chaves substitutas à chave original do sistema transacional. Assim, se temos um cliente com chave 12345 no sistema transacional (original), no sistema de BI com modelagem multidimensional, esse mesmo cliente tende a ter outra chave, por exemplo "ABCDE".
É possível, adicionalmente, colocar na dimensão o código original do cliente, mas a chave primária da tabela no modelo multidimensional será, a priori, sempre a chave substituta.
Achei esse comentário do colega Rapinagem no TEC, acredito que vai ajudar a entender melhor essa questão das chaves substitutas.
"Simplificando o que o professor expôs, e trazendo para linguagem dos leigos, acredito que a explicação da chave substitua e sua finalidade seja compreendida nesse exemplo do professor, só que de modo mais palatável:
Imagine que o produto café tem sua chave primária no sistema transacional, mas havendo uma mudança de preço do café o dado histórico seria influenciado por esse novo valor, então a operação da compra do café feita antes da atualização de preço seria alterada, por estarem todos ligados na mesma chave. Entretanto, não quero que isso ocorra. Quero que ele continue com o valor antigo da transação. Sendo assim, para isso que serve as chaves substitutas, para poder alterar uma informação sem comprometer os dados históricos e, consequentemente, a integridade do DW. Está tudo interligado, mas não diretamente. Pelo que entendi essa chave substituta faz o meio de campo, evitando isso."
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo