Julgue o item seguinte, referente a arquiteturas e aplicaçõe...

Próximas questões
Com base no mesmo assunto
Q1902796 Banco de Dados

Julgue o item seguinte, referente a arquiteturas e aplicações data warehouse, ETL e OLAP. 


No processo de ETL, na fase de transformação os dados são padronizados, sendo transformados em um formato unificado, independentemente do seu formato de origem.

Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: E - Errado

A afirmativa em questão trata sobre a fase de transformação do processo ETL (Extract, Transform, Load), que é um dos pilares fundamentais em projetos de data warehouse e business intelligence. Durante essa fase, os dados extraídos de diferentes fontes são de fato padronizados e transformados, mas a descrição na afirmativa pode levar a uma interpretação equivocada de que essa padronização ocorre de forma a criar um formato único, independentemente do formato de origem e para todos os casos, o que não é correto.

Na prática, a fase de transformação pode envolver diversas operações como limpeza de dados, enriquecimento de dados, filtragem, validação e consolidação. O objetivo é garantir que os dados estejam no formato correto e sejam consistentes para atender as necessidades analíticas do data warehouse, mas isso não implica necessariamente em um formato único. Os dados podem ser transformados em múltiplos formatos finais, de acordo com os requisitos de cada aplicação ou análise que será realizada posteriormente.

É comum que a fase de transformação adapte os dados para um modelo de dados específico do data warehouse, como o modelo dimensional ou normalizado, mas isso é diferente de afirmar que todos os dados são unificados em um único formato independente de sua origem.

Portanto, a alternativa correta é Errado, pois a fase de transformação do ETL envolve a padronização e a transformação dos dados para os formatos necessários e não necessariamente para um formato unificado único.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

As ferramentas ETL leem dados de um conjunto de fontes de dados, incluindo arquivos simples, ODBC, OLE DB e drivers de banco de dados nativos para a maioria dos bancos de dados relacionais. As ferramentas contêm funcionalidade para definir transformações nesses dados, incluindo pesquisas e outros tipos de junções. Eles podem gravar dados em vários formatos de destino. 

Suponho que a CESPE errou.

na modelagem dimensional, ao tratarmos de DataWarehouse, temos o processo de ETL: Extract, Transform and Load. O processo ETL é utilizado para obter dados. As principais atividades desse processo são:

 

  • Extract: extrair dados de fontes de dados de interesse;
  • Transform: transformar dados por intermédio de aplicação de regras coerentes com o domínio do negócio;
  • Load: Carregar dados no repositório de dados, como, por exemplo, um Data Warehouse.

 

Logo, observa-se que esse processo de ETL tem o objetivo de extrair, transformar e realizar carga de dados. Além disso, o processo de ETL tem vários elementos e diversas etapas, como, por exemplo:

 

  • Data Staging Area ou Operacional Data Storage (ODS)
  • Identificação
  • Extração
  • Transformação
  • Carga
  • Atualização

 

Em razão de a etapa de transformação consistir em transformar dados por intermédio de aplicação de regras coerentes com o domínio do negócio, não se pode afirmar que o resultado dessa etapa são dados padronizados e transformados em um formato unificado, independentemente do seu formato de origem, haja vista que as regras do domínio do negócio podem não permitir esse resultado.

 

Por esse motivo, o gabarito para essa questão é ERRADA.

 

Referências bibliográficas:

 

Data Science and Data Analytics. Amit Kumar Tyagi. CRC Press. 2022.

The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. Ralph Kimball, Margy Ross. Wiley. 2013.

Acredito que a questão esteja CERTA

O processo de Transformação de Dados é composto por várias etapas : padronização, limpeza, qualidade. Dados vindos de sistemas diferentes tem padrões diferentes seja de nomenclatura ou mesmo de tipos de dados ( VARCHAR2 Oracle ou VARCHAR Sql Server, por ex. )

Existem também operações de Qualidade de Dados que precisam ser feitas para que os dados sejam utilizados em análises

https://cetax.com.br/etl-extract-transform-load/

1: Formato unificado ? Naah

2: A transformação não é apenas uma questão de padronização, mas também inclui a limpeza, validação, enriquecimento e agregação de dados, de acordo com as regras de negócio definidas.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo