Julgue os itens que se seguem, acerca das ferramentas ETL (e...
Em ETL, frequentemente, é necessário limpar, ajustar e consolidar os dados antes de realizar sua carga. Nesse estágio de transformação, aplicam-se regras ou funções aos dados extraídos para ajustar os dados a serem carregados. A limpeza trata de vários tipos de erros, como, por exemplo, valores ilegais, ou que não obedeçam às regras de integridade da base, e erros de ortografia.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: C - certo
Para compreender a assertiva, é necessário conhecer o processo de ETL, que é uma componente chave na engenharia de dados, especialmente no contexto de data warehousing. ETL, que significa Extract, Transform, Load, é o processo pelo qual os dados são extraídos de múltiplas fontes, transformados conforme necessário (por exemplo, limpando, agrupando, unindo, ou de outras formas manipulando os dados para adequá-los aos propósitos analíticos), e depois carregados em um armazém de dados ou outro sistema analítico.
A fase de transformação é crítica, pois garante que os dados estejam prontos para serem utilizados de maneira eficaz. Durante esta fase:
- Os erros de ortografia são corrigidos.
- Valores que não seguem as regras de integridade da base de dados são tratados.
- São corrigidos problemas com valores ilegais, que são aqueles que não estão em conformidade com o esperado pelo schema do banco de dados de destino.
A questão está correta porque descreve de maneira precisa os passos envolvidos na etapa de transformação de um processo ETL, onde os dados passam por uma série de procedimentos para assegurar que sejam carregados de forma apropriada e útil para a análise subsequente. A limpeza de dados é uma parte fundamental deste processo para garantir a qualidade e a confiabilidade do data warehouse ou do sistema de relatórios onde eles serão utilizados.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
ETL, vem do inglês Extract Transform Load, ou seja, Extração Transformação Carga. O ETL visa trabalhar com toda a parte de extração de dados de fontes externas, transformação para atender às necessidades de negócios e carga dos dados dentro do Data Warehouse.
1) Extração: É a coleta de dados dos sistemas de origem (também chamados Data Sources ou sistemas operacionais), extraindo-os e transferindo-os para o ambiente de DW, onde o sistema de ETL pode operar independente dos sistemas operacionais.
2) Limpeza, Ajustes e Consolidação (ou também chamada transformação): É nesta etapa que realizamos os devidos ajustes, podendo assim melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes.
O estágio de transformação aplica um série de regras ou funções aos dados extraídos para ajustar os dados a serem carregados. Algumas fontes de dados necessitarão de muito pouca manipulação de dados. Em outros casos, podem ser necessários trabalhar algumas transformações, como por exemplo, Junção de dados provenientes de diversas fontes, seleção de apenas determinadas colunas e Tradução de valores codificados (se o sistema de origem armazena 1 para sexo masculino e 2 para feminino, mas o data warehouse armazena M para masculino e F para feminino, por exemplo).
FONTE: http://vivianeribeiro1.wordpress.com/2011/06/28/o-que-e-etl-2/
Limpeza, Ajustes e Consolidação (ou também chamada transformação): É nesta etapa que realizamos os devidos ajustes, podendo assim melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes.
2012
No âmbito dos DWs, representa um armazenamento intermediário que facilita a integração dos dados de ambiente operativo antes da sua atualização no DW. Trata-se de
a) ODS.
b) ETL.
c) Data Mart.
d) Star Schema.
e) Fact Table.
2010
Importante componente de um data warehouse é o data staging area, cuja função é extrair, transformar e carregar os dados obtidos de diversas fontes da empresa.
certa
É o caso de uniformizar os dados de CNPJ das empresas (com hífen ou sem hífen?), todos os valores monetários deverão exibir o cifrão ou não? É o que chamamos de padronização.
Resposta: certo.
GABARITO CORRETO!
.
.
A consolidação dos dados é o "T" de transformation do ETL. Nesse processo devem ser sanados conflitos semânticos e estruturais.
Conflitos semânticos e estruturais:
- Diferenças de unidades;
- Diferenças de precisão;
- Diferenças em código ou expressões;
- Diferenças de granularidade;
- Diferenças de abstração.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo