ETL é o método mais comum para transferir dados de uma font...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: A - Staging tables ou tabelas intermediárias no banco de dados de destino (data warehouse).
No que tange à alternativa correta, é fundamental compreender as diferenças entre os métodos de processamento ETL (Extract, Transform, Load) e ELT (Extract, Load, Transform). Enquanto o ETL enfatiza a transformação de dados antes de carregá-los no warehouse, o ELT inverte essa ordem, optando pela transformação após o carregamento dos dados no destino final.
A utilização de staging tables permite que os dados sejam carregados cruamente e armazenados temporariamente no data warehouse antes de serem transformados. Essa abordagem tira proveito da capacidade computacional do sistema de warehouse, que pode ser mais robusta e otimizada para operações intensivas de dados. Assim, a transformação ocorre dentro do próprio data warehouse, o que pode ser mais eficiente e flexível, dependendo do volume de dados e da complexidade das transformações necessárias.
Por outro lado, suas alternativas restantes são incorretas porque não se relacionam diretamente com a necessidade primária do processo ELT:
- B - Tecnologias distintas para origem e destino são uma realidade tanto no ETL quanto no ELT, mas não é um requisito para a implementação de ELT.
- C - A metodologia Kimball e esquemas estrela são conceitos de modelagem e não requisitos de transformação na abordagem ELT.
- D - A extração Full é uma técnica de extração de dados, mas não é específica ou necessária para o modelo ELT por si só.
- E - Técnicas de data mining são procedimentos analíticos aplicados em data marts ou warehouses, não sendo uma exigência para o processo de ELT.
Assim, para que a alternativa A seja implementada com sucesso, o data warehouse deve possuir a capacidade técnica de gerenciar as operações de transformação de dados em grande escala, o que justifica a importância de staging tables para o processamento ELT.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Staging tables:
Cria um ambiente intermediário de armazenamento e processamento dos dados oriundos de aplicações OLTP e outras fontes padrão ETL.
Representa um armazenamento intermediário dos dados, facilitando a integração dos dados do ambiente operativo da sua atualização no DW.
Pode servir de base par a análises do ambiente operativo, pois sua granulidade é normalmente compatível com sistemas desse ambiente
É investigada para verificar a determinação de onde ocorreram erros
Limpa dados sujos que entram no processo de extração
Fonte: Tecnologia e Projeto de Data Warehouse - Machado
ETL x ELT
Ambos são métodos de transferência de dados, de diversas fontes, para uma data warehouse, para posterior visualização e entrega de informações. Contudo, há diferenças significativas no que diz respeito a performance, desempenho e economia.
O método ETL é o mais comum, a sigla vem do inglês “Extract, Transform, and Load”. Trata-se do processo de extrair dados de diferentes fontes, transformá-los no formato desejado e entregando estes dados no banco de dados target. O método ELT (Extract Load and Transform) é semelhante, porém, há uma inversão na ordem dos processos.
No método ETL, o dado é extraído de diferentes fontes, processado separadamente e descarregado em uma data warehouse.
Ver imagem na fonte.
Já no método ELT, os dados são extraídos e carregados diretamente em um único repositório, onde a transformação do formato original do dado para o formato target.
Ver imagem na fonte.
Fonte: http://www.targettrust.com.br/blog/mercado-de-ti/oracle-odi-processos-e-lt-e-seus-beneficios/
Gabarito: a)
A) Na abordagem ELT, os dados são primeiro carregados no data warehouse e, em seguida, são transformados e processados conforme necessário dentro do próprio data warehouse. Para isso, são utilizadas tabelas intermediárias, também conhecidas como staging tables, para armazenar temporariamente os dados brutos antes que sejam transformados e carregados nas tabelas finais do data warehouse.
B) - A utilização de tecnologias distintas de banco de dados de origem e destino não é uma característica específica do processo ELT. Tanto no processo ETL quanto no ELT, podem ser usadas tecnologias diferentes para os bancos de dados de origem e destino, dependendo das necessidades e requisitos do projeto.
C) - A escolha da metodologia de modelagem de dados, como a Metodologia Kimball e os esquemas estrela normalizados, não está diretamente relacionada à decisão de usar ETL ou ELT. Essas metodologias de modelagem de dados são independentes do método de transferência de dados.
D) - A extração completa de todos os dados das tabelas de dimensões e de fatos não é uma característica exclusiva do processo ELT. Tanto no processo ETL quanto no ELT, a extração pode ser completa (extraindo todos os dados) ou incremental (extraindo apenas os dados que foram alterados ou adicionados desde a última extração), dependendo dos requisitos do projeto.
E) - O uso de técnicas de data mining sobre data marts relacionais não é uma característica específica do processo ELT. Data mining pode ser aplicado em data marts independentemente do método de transferência de dados utilizado.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo