A etapa de Mineração de Dados (DM – Data Mining) tem como ob...

Próximas questões
Com base no mesmo assunto
Q762153 Banco de Dados
A etapa de Mineração de Dados (DM – Data Mining) tem como objetivo buscar efetivamente o conhecimento no contexto da aplicação de KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em Base de Dados). Alguns autores referem‐se à Mineração de Dados e à Descoberta de Conhecimento em Base de Dados como sendo sinônimos. Na etapa de Mineração de Dados são definidos os algoritmos e/ou técnicas que serão utilizados para resolver o problema apresentado. Podem ser usados Redes Neurais, Algoritmo Genéticos, Modelos Estatísticos e Probabilísticos, entre outros, sendo que esta escolha irá depender do tipo de tarefa de KDD que será realizado. “Uma dessas tarefas compreende a busca por uma função que mapeie os registros de um banco de dados em um intervalo de valores reais.” Trata‐se de:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: A - Regressão.

A área de Mineração de Dados está focada na descoberta de padrões úteis e conhecimento a partir de grandes conjuntos de dados. A compreensão da tarefa de KDD (Knowledge Discovery in Databases) é essencial, pois envolve o processo inteiro de descobrimento de conhecimento, começando pela seleção de dados até a interpretação dos resultados extraídos, passando pela etapa crucial de mineração.

Dentro da mineração de dados, uma série de algoritmos e métodos são aplicados para resolver problemas específicos. No contexto da questão, busca-se uma técnica capaz de mapear registros a um intervalo de valores reais, o que é característico da tarefa de Regressão. A Regressão é utilizada exatamente para predizer valores contínuos, baseando-se em variáveis independentes para determinar a melhor linha (ou curva) que se ajuste aos dados observados. Isso a torna a escolha adequada para modelar e analisar relacionamentos entre variáveis e a previsão de tendências ou valores.

As outras opções apresentam tarefas diferentes dentro do KDD:

  • Sumarização está relacionada à redução de dados a uma forma compacta, preservando informações importantes.
  • Agrupamento (ou clustering) visa encontrar grupos homogêneos dentro dos dados, onde os objetos do mesmo grupo são mais similares entre si do que com aqueles de outros grupos.
  • Detecção de desvios foca na identificação de observações que não se enquadram no padrão normal ou esperado dos dados.

Assim, a Regressão é a técnica correta relacionada à busca por uma função de mapeamento em um intervalo de valores reais, o que responde adequadamente ao problema proposto pela questão.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A)

Regressão faz parte da regra de classificação, é uma função sobre variáveis que as mapeia em uma classe destino.

Regressão é uma função sobre os dados

 

Q961393 --> Questão praticamente idêntica.

Gabarito: A

Na regressão, em vez de prever uma categoria, o objetivo é prever um número, prever um valor. Como na classificação, muitas técnicas de regressão dão a cada característica um peso, então combinam contribuições positivas e negativas dos recursos ponderados para obter uma estimativa. Compreende a busca por uma função que mapeie os registros de um banco de dados em um intervalo de valores reais.

fonte: estratégia concursos

Oito passos do Data Mining:

1) Associação: busca itens que ocorrem frequentemente de forma simultânea;

2) Classificação: divide os atributos em tipos;

3) Regressão: busca por uma função que ajude a mapear registros de um BD em um intervalo de valores numéricos reais; (GABARITO)

4) Agrupamento (Clusterização): segmenta os registros do conjunto de dados em subconjuntos (clusters). O objetivo é encontrar propriedades comuns de elementos;

5) Sumarização: identifica e indica as semelhanças entre os registros;

6) Detecção de Desvios: identifica registros que destoem o padrão no contexto de análise;

7) Descoberta de sequências: identifica itens frequentes considerando um determinado período de tempo;

8) Previsão de Séries Temporais: infere valores que a variável pode ou deve assumir no futuro;

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo