Sobre o processo de ETL (Extract, Transform, Load), assinal...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Para entender a questão, precisamos saber sobre o processo de ETL, que significa Extract, Transform, Load. Ele é essencial na gestão de dados, especialmente na formação de um Data Warehouse, que é um sistema de armazenamento de dados para apoiar decisões organizacionais.
A questão pede que identifiquemos a alternativa incorreta sobre as etapas do ETL. Vamos analisar cada alternativa:
Alternativa A (Incorreta): "Na etapa de extração, os dados são convertidos para um único formato devido à heterogeneidade dos sistemas organizacionais."
Justificativa: Na realidade, a etapa de extração é responsável apenas por coletar os dados dos diferentes sistemas, mas não por convertê-los. A conversão para um único formato acontece na etapa de transformação, não de extração. Portanto, esta alternativa é incorreta.
Alternativa B (Correta): "A etapa de extração envolve a extração dos dados dos sistemas organizacionais, enquanto que, na etapa de transformação, os dados são convertidos para um único formato."
Justificativa: Esta afirmação está correta. Na etapa de extração, os dados são retirados de suas fontes originais. A transformação é a fase em que esses dados são convertidos e processados para um formato uniforme.
Alternativa C: "A etapa de extração envolve também o tratamento das inconsistências dos dados."
Justificativa: Em geral, o tratamento de inconsistências é mais associado à etapa de transformação. Contudo, algumas ações básicas para garantir a qualidade dos dados podem ocorrer durante a extração, mas não é o foco principal dessa etapa.
Alternativa D: "Para realizar a etapa de load (carga), deve-se garantir que os dados transformados na etapa anterior estejam persistentes no Data Warehouse."
Justificativa: Esta alternativa está correta. Na fase de carga, é importante que os dados já transformados sejam carregados e armazenados no Data Warehouse de forma persistente.
Alternativa E: "Após a etapa de extração, os dados são colocados em seu local definitivo no Data Warehouse."
Justificativa: Esta afirmação está incorreta. Após a extração, os dados passam ainda pela transformação antes de serem carregados no Data Warehouse.
Portanto, a resposta correta é a Alternativa A porque descreve erroneamente a etapa de extração como se fosse responsável pela conversão de dados, o que ocorre na transformação.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Após a etapa de extração, os dados são colocados em seu local definitivo no Data Warehous? Está correto isso ?
Após a extração, os dados não são tratados ?
Gabarito A.
Em relação a sua pergunta The student, após a extração dos dados, eles são colocados na "Data Staging Área", uma área temporária para armazenamento dos dados.
Desta forma, ao invés de acessar os dados diretamente da fonte, o processo de “transformação” do ETL pega os dados da Staging Area para tratar e entregar os dados.
Luciano Silva mas como você mesmo disse a Data Staging Área é um local temporário e a letra E fala em seu local definitivo, acho que seria passiva de anulação.
A alternativa C também não estaria errada?
No livro Data WareHouse Toolkit de Kimball diz: "Once the data is extracted to the staging area, there are numerous potential transformations, such as cleansing the data (correcting misspellings, resolving domain conflicts, dealing with missing elements, or parsing into standard formats), combining data from multiple sources, deduplicating data, and assigning warehouse keys. These transformations are all precursors to loading the data into the data warehouse presentation area." (Cap. 1, pag. 8)
Ou seja, o tratamento de inconsistência não é feita na Extração mas na Transformação. Correto?
Sem condição. Letra A é a única correta.
.
A) Correto, a extração faz a conversão para um determinado formato [1]
B) Errado, a conversão é feita já na extração [1]. A transformação realiza operações como seleção de colunas, junção de dados, cálculos, renomeações, limpeza, etc.
C) Errado, tratamento de inconsistência é na Transformação [2]
D) Errado, os dados transformados ficam no Staging Area [3]
E) Errado, após extração, fica no Staging Area [3]
.
[1] "In general, the extraction phase aims to convert the data into a single format appropriate for transformation processing" <https://en.wikipedia.org/wiki/Extract,_transform,_load>
[2] "O processo de transformação dos dados deve atender a alguns critérios como limpeza, padronização e qualidade. Aqui é hora de corrigir inconsistências e imprecisões com o objetivo de consolidar a informação obtida." <https://www.mjvinnovation.com/pt-br/blog/o-que-e-etl-como-funciona/>
[3] <https://cdn.holistics.io/guidebook/analytics-setup/etl-process.png>
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo