Sobre data mining, é correto afirmar:

Próximas questões
Com base no mesmo assunto
Q39741 Banco de Dados
Sobre data mining, é correto afirmar:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

A alternativa correta é a letra A, que define Data Mining como o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados. Isso é feito utilizando técnicas avançadas de reconhecimento de padrões, estatísticas e matemáticas. A grande quantidade de dados disponíveis nas empresas pode conter informações valiosas que não são aparentes a uma análise simples ou superficial. A mineração de dados procura automatizar o processo de descoberta dessas informações úteis.

Essa definição é acertada porque o Data Mining é, essencialmente, um processo exploratório que combina elementos de várias disciplinas, como inteligência artificial, aprendizado de máquina, estatística e sistemas de banco de dados, para analisar grandes conjuntos de dados e extrair informações úteis que podem ser utilizadas para tomada de decisão, previsões e melhorias de processo. As informações encontradas podem ser padrões de compra de clientes, tendências de mercado, correlações entre variáveis que não eram previamente consideradas etc.

As outras alternativas têm erros fundamentais ou concepções equivocadas sobre o que é e o que envolve o processo de Data Mining:

  • Alternativa B: Está incorreta. Embora os algoritmos de Data Mining sejam avançados, a interação com analistas humanos é essencial, visto que eles são responsáveis por interpretar os padrões encontrados e determinar seu real valor prático.
  • Alternativa C: É um mal-entendido, pois o processo de encontrar padrões pode envolver tanto a simplificação quanto a complexificação dos dados, dependendo do contexto e da natureza dos dados.
  • Alternativa D: Confunde Data Mining com um banco de dados, quando, na verdade, é um conjunto de processos aplicados sobre os dados contidos em um banco de dados ou outro repositório.
  • Alternativa E: Embora o Data Mining possa ser potencializado por um Data Warehouse, não é uma condição necessária. Dados podem ser minerados de diferentes fontes e nem sempre precisam estar em um estado perfeito de limpeza e organização.

Desse modo, fica evidente que a melhor resposta e a que mais se alinha ao conceito amplamente aceito de Data Mining é a alternativa letra A.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Alternativa (a) Segundo Wikipédia, "é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados". Usando padrões e técnicas de reconhecimento, como alg géneticos, cluster e outros.
A) CertoB) Data mining requer interação com analistas humanos, pois deve-se entender os dados os quais puros não dizem muito acerca do domínio de aplicação.C) Os dados devem ser tratados de forma igual, não se pode desconsiderar dados genéricos e privilegiar dados específicos que podem se tratar de bias, outliers, missing values, etc.D) Data mining é um processo e não um banco de dados.E) Data mining pode ser utilizado a partir de qualquer tipo de repositório.
A letra "a" é uma pegadinha boa pois geralmente a primeira vista costumamos associar o Datamining com Datawarehouse e esta questão fala sobe "análise de grandes quantidades de dados armazenados em bancos de dados" o que leva a pensar que estaria errado pois poderia deveria ser "análise de grandes quantidades de dados armazenados em Datawarehouses". Mas como o Datamining é uma técnica independente do repositório como o colega colocou, então está correta esta colocação.
desconsiderar aquilo que é generico e considerar aquilo que é especifico(setorial) = DATA MART

É importante notar que as palavras padrões, tendências ou dados brutos sempre estão relacionadas com MD.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo