Quando se desenha uma solução de data warehouse como base de...

Próximas questões
Com base no mesmo assunto
Q75724 Banco de Dados
Quando se desenha uma solução de data warehouse como base de dados para uma solução de BI, em que os dados gerados serão disponibilizados para uma base de dados OLAP, a principal característica dos dados e do processo de data warehousing é que os dados devem
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

A resposta correta é a Alternativa A - os dados em um data warehouse devem ser alterados muito raramente. Vamos entender o porquê.

O conceito de data warehousing é central para as soluções de BI (Business Intelligence). Um data warehouse é um repositório de dados projetado para facilitar a análise e o relatório de informações. Ao contrário das bases de dados transacionais, que são utilizadas no dia a dia das operações de uma organização (OLTP - Online Transaction Processing), um data warehouse é utilizado para armazenar grandes volumes de dados históricos para análise e tomada de decisões.

Esses dados são tipicamente carregados a partir de vários sistemas de origem através de processos chamados ETL (Extract, Transform, Load). Uma vez que os dados são carregados para o data warehouse, eles são raramente modificados - eles são, de fato, quase estáticos. Esta estabilidade é crucial porque o objetivo do data warehouse é servir como um registro histórico estável que reflita o estado dos negócios ao longo do tempo. Portanto, a consistência e a imutabilidade dos dados são elementos chave.

Podemos então compreender que a natureza dos dados em um data warehouse é de serem persistentes e imutáveis após a sua carga inicial, o que justifica a escolha pela Alternativa A como correta. As outras opções, como serem homogêneos (B), possuir índices (C), estar relacionados por constraints (D), e pertencer a uma mesma fonte de dados (E) são características que podem ser aplicadas a diferentes contextos de bases de dados mas não são tão centrais para a definição de um data warehouse no âmbito de BI quanto a imutabilidade dos dados pós-carga.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Corrigindo Letra b. Os dados devem ser heterogeneos pois em muitas instâncias os sistemas de banco de dados não são diretamente compatíveis e geralmente nem todos usam o mesmo sistema operacional. Por isso, este cenário geralmente é chamado de ambiente de dados heterogêneo.
Os dados em um data warehouse não são modificáveis, porém, poder ser apagados caso não mais sejam úteis, no chamado purging. É a esse purging que "alterados muito raramente" se refere.
Discordo do comentário quanto a heterogeneidade dos dados. No dw os dados serão homogêneo, inclusive é função do ETL transformar(homogeneizar) dados de fontes heterogêneas.
Questão mal elaborada, se o intento do examinador ao dizer que remover dados não úteis é o mesmo que alterar um dado (o que discordo veementemente) a questão teria duas respostas. Se não, o gabarito deveria ser a letra B.
A questão se refere ao desenho de uma solução de DW, em que os dados ainda não foram inseridos no DW. Desta maneira, afirmar que os dados devem ser homogêneos (antes de serem inseridos no DW) seria errado.

De acordo com Navathe, a primeira etapa de aquisição de dados para o DW é a etapa em que os dados precisam ser extraídos de várias fontes heterogêneas.

Ao serem inseridos no DW, os dados realmente se tornarão homogêneos, mas a questão se refere aos dados antes de serem inseridos.

A letra A é a resposta correta mesmo

Acertei porque com exceção da A, as demais alternativas são absurdas para o conceito de DW. Porém, uma característica clara de um DW é o fato dele ser Não Volátil:

"Em um DW não existem alterações de dados, somente a carga inicial e as consultas posteriores. Ele é definido assim pois as operações a nível de registro em modo on-line como são os sistemas transacionais, exigem um controle e um processamento muito grande, fugindo do objetivo principal do DW."

Então, esse de haver atualizações raramente, ao meu ver, estaria errada. Os dados NÃO são alterados NUNCA. O que ocorre são somente novas cargas acrescentando novos dados históricos mais recentes. Mas, iria de A por exclusão.

Bons estudos!

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo