Observe as seguintes informações sobre os dados de um siste...
Observe as seguintes informações sobre os dados de um sistema de informação:
• 30% das entradas de dados na coluna ID_MILITAR estão marcadas com o caractere “espaço";
• a faixa de valores do campo IDADE vai de 13 a 75 anos;
• existem 140 linhas na TB_DEPENDENTE sem o ID_MILITAR.
Segundo Rêgo (2013), as informações apresentadas acima são exemplos de
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a B - data profiling.
Vamos entender por que essa alternativa é a correta:
Data profiling é uma técnica utilizada para analisar os dados de um banco de dados a fim de coletar estatísticas e informações informativas sobre a qualidade e a estrutura dos dados. No contexto da questão, as informações apresentadas – como a porcentagem de entradas marcadas com espaço, a faixa de valores do campo IDADE e a ausência de valores no campo ID_MILITAR em algumas linhas – são típicos exemplos de atividades de data profiling. Essa prática é essencial para entender a consistência, a precisão e a integridade dos dados em um sistema de informação.
Agora, vamos analisar as alternativas incorretas:
A - Cardinalidade: Cardinalidade se refere ao número de elementos em um conjunto ou, em termos de banco de dados, à quantidade de vezes que uma entidade pode se relacionar com outra em um relacionamento. O enunciado não trata de relações entre entidades, mas sim da análise dos dados em si.
C - Dados derivados: Dados derivados são informações que são calculadas ou inferidas a partir de outros dados. Os exemplos dados na questão não são cálculos ou inferências, mas sim uma análise direta das características dos dados.
D - Master Data Management (MDM): MDM é o processo de gerenciamento de dados principais que são essenciais para o funcionamento de um negócio. Não se aplica aqui, pois a questão não trata de gerenciamento de dados principais, mas sim da análise detalhada da qualidade e características dos dados existentes.
E - Dados multidimensionais: Dados multidimensionais são usados em contextos analíticos, como OLAP, onde os dados são organizados em um formato que suporta a análise de dados em múltiplas dimensões. A questão não aborda esse tipo de estrutura de dados.
Espero que essa explicação tenha ajudado a esclarecer o conceito de data profiling e por que ele é a escolha correta nesta questão. Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Data Profiling - Perfilar dados:
São técnicas analíticas sobre os dados com o propósito de desenvolver o conhecimento sobre seu conteúdo, estrutura e qualidade. Em suma, é uma espécie de exame (diagnóstico) a respeito da qualidade dos dados existentes.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo