Com relação à modelagem dimensional e à otimização de bases ...
Com relação à modelagem dimensional e à otimização de bases de dados para business intelligence, julgue o item subsequente.
Uma ferramenta de ETL deve ser capaz de extrair dados de
fontes heterogêneas, copiá-los para uma área de transição,
onde possam ser convertidos conforme o padrão estabelecido,
e, ainda, realizar limpeza e correção nesses dados, de acordo
com regras preestabelecidas.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: C - Certo
A questão aborda o papel fundamental de uma ferramenta de ETL (Extract, Transform, Load) no contexto de business intelligence. Para compreender a assertiva, é preciso ter conhecimento sobre o processo de ETL e como ele se aplica na consolidação de dados para análises estratégicas.
No estágio Extract (Extração), a ferramenta de ETL é responsável por coletar dados de diversas fontes, que podem ser estruturadas ou não estruturadas, internas ou externas à organização. Isso inclui sistemas como bancos de dados relacionais, arquivos planos, serviços em nuvem, entre outros.
Após a extração, no passo de Transform (Transformação), os dados são levados a uma área de transição, muitas vezes denominada staging area, onde ocorrem processos de padronização e adequação ao esquema desejado. Isso pode envolver a conversão de formatos, cálculos, agregações e normalização.
O processo de Load (Carga) consiste em transferir os dados já tratados para o destino final, que costuma ser um Data Warehouse ou Data Mart, estruturas otimizadas para análises de business intelligence. Durante este percurso, é essencial efetuar a limpeza e correção dos dados, assegurando a qualidade e confiabilidade das informações que serão utilizadas nas tomadas de decisão.
Desta forma, a afirmação do enunciado está correta, uma vez que descreve precisamente as capacidades esperadas de uma solução ETL, essenciais para consolidar uma base de dados robusta e confiável para análises de inteligência de negócios.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
ETL - (Extract - Transform - Load)
Possui conexões com fontes de dados que podem ser heterogêneas e geograficamente dispersas; processos de extração que irão, através da conexão, copiar dados destas fontes; um processo de arquivamento que conservará dados em disco temporariamente para a etapa seguinte e, finalmente, os procedimentos de transformação e o arquivamento que carrega os dados na sua fonte definitiva.
Significa
➨ Extrair
➨ Limpar
➨ Preparar
➨ Entregar
Método mais comum para transferir dados de uma fonte de dados OLTP para um data warehouse.
Tarefas
➨ Filtragem
➨ Integração
➨ Conversão
➨ Condensação
A derivação dos dados de entrada podem ser originários de diversas fontes como por exemplo OLTP .
Certo
Introdução à Ciencia de Dados: mineração de dados e big data - Amaral, Fernando
Gab: CERTO
O processo de ETL se resume basicamente em 5 passos: 1. Identificação da origem dos dados a serem coletados, sendo que as fontes podem estar espalhadas em diversos sistemas transacionais e banco de dados da organização; 2. Realizar a limpeza dos dados para possibilitar posterior transformação, e nesta etapa ocorre os ajustes nos dados, com o intuito de corrigir imperfeições com o objetivo de oferecer um melhor resultado para o usuário final; 3. A terceira etapa é de transformação dos dados e tem por objetivo fazer a padronização dos dados em um único formato; 4. A fase seguinte é de carga dos dados para o Data Warehouse; 5. Por fim, existe a etapa de atualização dos dados no DW (refresh), realizada a partir das alterações sofridas pelos dados nos sistemas operacionais da organização.
ETL -> extração
-> Transformação
-> Carga
Dados heterogêneos são aqueles dados de tipos diferentes, em contraste com os dados homogêneos, que são aqueles dados de tipos iguais. Uma Ferramenta ETL realmente é capaz de extrair dados de fontes heterogêneas (ou homogêneas), copiá-los para uma área de transição (conhecida como Stage Area), onde possam ser convertidos (ou transformados) conforme o padrão estabelecido e, ainda, realizar limpeza e correção nos dados, de acordo com regras preestabelecidas.
Gabarito: Correto
Fonte: estratégia
Certo
O sistema Extract-Transform-Load (ETL) é a base para construção de um data warehouse. Quando projetado adequadamente um sistema ETL extrai dados dos sistemas de origem, reforça a qualidade dos dados e padrões de consistência, ajusta dados para que dados advindos de fontes distintas possam ser usados juntos e finalmente entrega dados em um formato pronto para apresentação.
A principal função da integração de dados ou ETL é obter dados de onde eles residem atualmente, alterando-os para que sejam compatíveis com o formato desejado e colocando-os no sistema de destino. Essas três etapas são chamadas de extrair, transformar e carregar (ETL). Toda a integração de dados, independentemente de ser executada em lote (batch) ou em tempo real, de forma síncrona ou assíncrona, física ou virtualmente, gira em torno dessas ações básicas.
O ETL é responsável pela extração, transformação e carga dos dados das bases operacionais para a base de dados analítico.
O processo de ETL é composto por algumas fases, extrair, limpar, preparar e entregar.
No processo de ETL mostrado na figura, I e II correspondem, respectivamente, a: Staging Area e Data Warehouse.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo