Sobre data mining, é correto afirmar:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a letra A, que define Data Mining como o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados. Isso é feito utilizando técnicas avançadas de reconhecimento de padrões, estatísticas e matemáticas. A grande quantidade de dados disponíveis nas empresas pode conter informações valiosas que não são aparentes a uma análise simples ou superficial. A mineração de dados procura automatizar o processo de descoberta dessas informações úteis.
Essa definição é acertada porque o Data Mining é, essencialmente, um processo exploratório que combina elementos de várias disciplinas, como inteligência artificial, aprendizado de máquina, estatística e sistemas de banco de dados, para analisar grandes conjuntos de dados e extrair informações úteis que podem ser utilizadas para tomada de decisão, previsões e melhorias de processo. As informações encontradas podem ser padrões de compra de clientes, tendências de mercado, correlações entre variáveis que não eram previamente consideradas etc.
As outras alternativas têm erros fundamentais ou concepções equivocadas sobre o que é e o que envolve o processo de Data Mining:
- Alternativa B: Está incorreta. Embora os algoritmos de Data Mining sejam avançados, a interação com analistas humanos é essencial, visto que eles são responsáveis por interpretar os padrões encontrados e determinar seu real valor prático.
- Alternativa C: É um mal-entendido, pois o processo de encontrar padrões pode envolver tanto a simplificação quanto a complexificação dos dados, dependendo do contexto e da natureza dos dados.
- Alternativa D: Confunde Data Mining com um banco de dados, quando, na verdade, é um conjunto de processos aplicados sobre os dados contidos em um banco de dados ou outro repositório.
- Alternativa E: Embora o Data Mining possa ser potencializado por um Data Warehouse, não é uma condição necessária. Dados podem ser minerados de diferentes fontes e nem sempre precisam estar em um estado perfeito de limpeza e organização.
Desse modo, fica evidente que a melhor resposta e a que mais se alinha ao conceito amplamente aceito de Data Mining é a alternativa letra A.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
É importante notar que as palavras padrões, tendências ou dados brutos sempre estão relacionadas com MD.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo