Com relação ao tema “Técnicas de modelagem e otimização de ...
Com relação ao tema “Técnicas de modelagem e otimização de bases de dados multidimensionais”, analise as afirmativas a seguir.
I. No esquema stardate, a tabela de fatos está vinculada a várias tabelas do tipo dimensões simples, slowly changing e role playing.
II. A tecnologia HOLAP permite que os dados de um datawarehouse sejam divididos entre o armazenamento relacional (tabelas de fatos e dimensões) e multidimensional (cubos de dados resumidos).
III. Uma dimensão degenerada é uma tabela que contém os metadados resultantes do processo de ETL utilizada na extração de dados do ambiente operacional.
Assinale:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a B, que afirma que a tecnologia HOLAP permite que os dados de um sejam divididos entre o armazenamento relacional (tabelas de fatos e dimensões) e multidimensional (cubos de dados resumidos).
Para fundamentar a escolha da alternativa correta, vamos abordar o conceito de HOLAP, que é uma combinação das tecnologias ROLAP (Relational OLAP) e MOLAP (Multidimensional OLAP). O HOLAP busca tirar proveito das vantagens de ambos os mundos: a capacidade de armazenamento e a flexibilidade de um ROLAP com o alto desempenho e a capacidade de análise de um MOLAP. Dessa forma, numa solução HOLAP, parte dos dados fica armazenada em um banco de dados relacional (tabelas de fatos e dimensões), enquanto que as agregações e os dados resumidos são mantidos em uma estrutura multidimensional (os cubos), atendendo assim ao que afirma a segunda proposição.
É importante destacar que a assertiva II é correta, pois reflete com precisão o conceito de HOLAP. Diferentemente do ROLAP, que armazena tudo em bancos de dados relacionais, e do MOLAP, que utiliza estruturas de dados multidimensionais para todos os dados, o HOLAP é a tecnologia que permite o melhor de ambos, dependendo das necessidades específicas de armazenamento e de consulta do Data Warehouse.
As assertivas I e III não são corretas, e portanto, não fundamentam a resposta. Na assertiva I, a grafia correta é "star schema" e não "stardate". Além disso, as dimensões slowly changing e role playing fazem parte do modelo, mas não são tipos de dimensões e sim técnicas de modelagem de dimensões. Já a assertiva III apresenta uma definição inadequada de dimensões degeneradas, que na verdade são chaves primárias de processos de negócio que aparecem na tabela de fatos, mas não possuem sua própria tabela de dimensão.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
GABA b)
II. A tecnologia HOLAP (Híbrido) permite que os dados de um datawarehouse sejam divididos entre o armazenamento relacional (tabelas de fatos e dimensões) e multidimensional (cubos de dados resumidos).
stardate??? dimensão degenerada??? =S
De uma forma resumida e bem direto ao ponto, é uma técnica para atualizar a tabela dimensão. Tem um nome todo pomposo, mas é como você vai atualizar a dimensão.
Todas as dimensões são SCD, porque elas vão precisar atualizar para se manterem sincronizadas com o transacional.
A única exceção é a dimensão de tempo, que a gente chama de tipo 0, porque depois que os dados foram inseridos, não precisa mais atualizar.
No Data Warehouse, as dimensões muitas vezes são utilizadas para múltiplos objetivos.
Como assim? Quando você quer fazer uma análise de vendas e nessa análise precisa mensurar quantidade vendida, você quer ver essa quantidade pela data do pedido, pela data do envio do pedido e pela data do recebimento do pedido.
Quando acontece essa situação, nós precisamos ter as Surrogate Keys na fato para que você possa analisar de forma separada.
Em muitos casos, quando as pessoas não entendem de , copiam a dimensão de tempo 3x.
Então ela repete lá, data do pedido, data do recebimento do pedido e data do envio do pedido. Você até pode ter essa visão lógica do Data Warehouse, mas fisicamente, isso não precisa existir, porque você vai deixar seu Data Warehouse 3x maior.
É a dimensão que não mereceu ser uma tabela dimensão e foi inserida como coluna na fato. Quando a gente vai definir uma dimensão, existem algumas perguntas que fazemos.
Imagina uma fato venda em que a pessoa quer ver o código da transação da compra.
Às vezes você precisa ter aquela informação ali para fazer um filtro. Quando é algo desse tipo, que não dá para criar uma dimensão, você faz uma degenerada.
Pensa, você vai criar uma dimensão de transação. O que vai ter nela? O código da transação, talvez um nome da transação, se for ser a transação de uma vendedora ou de um produto, aí já são outras dimensões.
Nesse caso você só quer pôr aquele número porque o usuário precisa dele por algum motivo.
E se não vai criar uma dimensão para isso, vai colocar onde? Muitas vezes isso entra na fato transacional. A fato venda, com a qual você está trabalhando, é transacional, você coloca todas as transações linha por linha.
E onde vai isso? Basicamente, você vai na fato e cria uma coluna. Eu costumo marcar quando é dimensão degenerada, por exemplo: “código transação (DD)”.
A Dimensão Degenerada (Degenerate Dimension, do inglês) é uma Dimensão que também compõe a Tabela Fato, porém não possui sua própria Tabela de Dimensão;
SLOWLY CHANGING DIMENSIONS - Slowly Changing Dimensions SCD (Dimensões que Mudam Lentamente, em português) e retrata as dimensões que sofrem atualizações em seus campos e os classifica pelo tipo de mudança existente em cada uma delas. Vários tipos de SCD podem ser identificados no DW, variando de acordo com as características de atualizações das dimensões. As alternativas mais comuns de SCD são o SCD Tipo 1, SCD Tipo 2, SCD Tipo 3 e o SCD Híbrido (Canaltech, 2020).
role playing: não encontrado
Gabarito:
B
https://www.mentorstec.com.br/post/conceitos-de-tabelas-dimens%C3%A3o-e-fato-na-constru%C3%A7%C3%A3o-do-data-warehouse
I. No esquema stardate, a tabela de fatos está vinculada a várias tabelas do tipo dimensões simples, slowly changing e role playing. - Esta afirmativa está incorreta. O esquema stardate não é uma nomenclatura comum em modelagem de dados multidimensionais. No entanto, em um esquema de estrela típico, a tabela de fatos está vinculada a tabelas dimensionais, que podem ser simples ou envolver técnicas de tratamento de mudanças lentas (slowly changing dimensions), mas a terminologia "stardate" não é convencional nesse contexto.
II. A tecnologia HOLAP permite que os dados de um datawarehouse sejam divididos entre o armazenamento relacional (tabelas de fatos e dimensões) e multidimensional (cubos de dados resumidos). - Esta afirmativa está correta. HOLAP (Hybrid OLAP) é uma abordagem que combina características de ROLAP (Relational OLAP) e MOLAP (Multidimensional OLAP). Ela permite que os dados sejam armazenados tanto em tabelas relacionais quanto em cubos multidimensionais, proporcionando flexibilidade.
III. Uma dimensão degenerada é uma tabela que contém os metadados resultantes do processo de ETL utilizada na extração de dados do ambiente operacional. - Esta afirmativa está incorreta. Uma dimensão degenerada não é uma tabela que contém metadados do ETL. É uma dimensão que não é armazenada separadamente, mas sim incorporada à tabela de fatos, geralmente na forma de um atributo que atua como chave primária ou estrangeira. CHATGPT
Role Playing" e "Dimensão Compartilhada entre tabelas de fatos" são conceitos diferentes em modelagem de dados multidimensionais.
- Role Playing:
- O "role playing" refere-se ao uso de uma única dimensão em várias funções ou papéis dentro do mesmo modelo, normalmente dentro da mesma tabela de fatos. Por exemplo, uma dimensão de data pode ser usada em diferentes funções, como "Data de Venda" e "Data de Entrega", dentro da mesma tabela de fatos. Isso permite que a mesma dimensão seja usada de maneira flexível em diferentes contextos, simplificando o modelo.
- Dimensão Compartilhada Entre Tabelas de Fatos:(OU DIMENSÃO CONFORME)
- A dimensão compartilhada entre tabelas de fatos é uma técnica que envolve o uso da mesma dimensão em diferentes tabelas de fatos em um modelo. Isso significa que você tem várias tabelas de fatos que compartilham a mesma dimensão. Por exemplo, você pode ter uma dimensão de "Produto" que é compartilhada entre tabelas de fatos de "Vendas" e "Estoque". Isso permite que diferentes fatos estejam relacionados à mesma dimensão em diferentes contextos.
Em resumo, enquanto o "role playing" se concentra no uso flexível de uma dimensão dentro da mesma tabela de fatos, a dimensão compartilhada entre tabelas de fatos envolve o compartilhamento da mesma dimensão entre diferentes tabelas de fatos em um modelo multidimensional. Ambas as técnicas são usadas para melhorar a flexibilidade e a reutilização de dimensões em modelos de data warehouse multidimensionais. CHATGPT
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo