A coleta de dados que serão garimpados, na mineração de dado...

Próximas questões
Com base no mesmo assunto
Q1933437 Banco de Dados
A coleta de dados que serão garimpados, na mineração de dados, é feita na etapa de 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Resposta correta: E - preparação.

A mineração de dados, ou Data Mining, é um processo composto por várias etapas essenciais para extrair conhecimento útil de grandes volumes de dados. A questão aborda uma dessas etapas fundamentais, a coleta de dados, que é um passo importante antes do início efetivo da mineração.

Para resolver essa questão, é necessário entender o ciclo de vida de um projeto de mineração de dados, que geralmente inclui as seguintes fases: entendimento do negócio, entendimento dos dados, preparação dos dados, modelagem, avaliação e implantação. Cada uma dessas fases é crucial para o sucesso do projeto de mineração de dados.

A preparação dos dados é a etapa onde os dados são coletados, limpos e transformados. Este passo é crítico, pois dados de má qualidade podem levar a resultados enganosos. A preparação inclui tarefas como a seleção de dados, limpeza, construção de dados, integração e formatação. Essa fase é muitas vezes a mais demorada do processo de Data Mining, mas é essencial para garantir a qualidade dos dados que serão utilizados posteriormente na fase de mineração.

A alternativa correta é a E - preparação, pois ela reflete exatamente essa fase do processo onde ocorre a coleta dos dados a serem analisados. É durante a preparação que garantimos que os dados estejam no formato adequado e sejam representativos para os algoritmos de mineração que serão aplicados nas etapas subsequentes.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A coleta dos dados que serão minerados é uma etapa prévia à própria aplicação das tarefas de mineração (como classificação, clusterização, regras de associação…), sendo assim uma das etapas do processo de preparação.

A fase de preparação para implementação de um projeto de data mining consiste, entre outras tarefas, em coletar os dados que serão garimpados.

Se você conhece as fases da mineração de dados (CRISP-DM), você já mata a questão por exclusão:

1- Entendimento dos negócios: qual o objetivo?

2- Entendimento dos dados: quais são os dados relevantes?

3- Preparação dos dados: coleta dos dados, seleção de tabelas, organização dos dados, limpeza

4- Modelagem: aqui são aplicadas as técnicas de mineração

5- Avaliação

6- Implantação

Minha contribuição:

Etapas do KDD: EE PM AI

 

Entendimento do negócio: definir os objetivos, requisitos, e o problema

 

Entendimento dos dados: conhecer os dados

 

Preparação dos dados: limpeza, preparação e planejamento dos dados para a modelagem

 

Modelagem dos dados: aplicação de técnicas de data mining

 

Avaliação: realização de testes para validar os dados

 

Implementação / Desenvolvimento

  • KDD: Preparação, Pré-processamento(limpeza e enriquecimento dos dados), transformação, mineração e avaliação.
  • CRISP: Entendimento de dados/negócios, preparação dos dados, modelagem dos dados, avaliação dos dados, implementação.

A banca mistura bastante.

Descoberta de Conhecimento em Base de Dados (KDD – Knowledge Discovery in Databases):

1. entendimento do domínio da aplicação e identificação do objetivo do processo de KDD

2. seleção: criação de um conjunto-alvo de dados;

3. pré-processamento: limpeza de dados e operações básicas como remoção de ruído, tratamento para a falta de dados etc. É o passo mais trabalhoso e demorado do processo de KDD.

4. transformação: encontrar características úteis para representar os dados, conforme o objetivo definido e realizar a redução ou transformação da dimensionalidade;

5.mineração de dados (Data Mining): casar os objetivos do processo de KDD com um método particular de mineração de dados e realizar a análise exploratória e seleção de modelo e hipótese, buscando padrões de interesse;

6. interpretação/avaliação: interpretar e avaliar os padrões minerados, podendo retornar a passos anteriores caso seja necessário;

7. agir a partir do conhecimento descoberto.

Projeto CRISP-DM (CRoss Industry Standard Process for Data Mining – Processo Padrão Inter-Indústrias para Mineração de Dados)

1. Entendimento do negócio;

2. Seleção dos Dados (Data Understanding): Essa fase se inicia com uma coleta inicial de dados, e com procedimentos e atividades visando a familiarização com os dados, para identificar possíveis problemas de qualidade, ou detectar subconjuntos interessantes para formar hipóteses;

3. Limpeza dos Dados (Data Preparation): limpeza, transformação, integração e formatação dos dados da etapa anterior. É a atividade na qual os ruídos, dados estranhos ou inconsistentes são tratados.

4. Modelagem dos Dados (Modeling);

5. Avaliação do Processo (Evaluation):visa garantir que o modelo gerado atenda às expectativas da organização;

6. Execução (Deployment):  definição das fases de implantação do projeto de Mineração de Dados.

Fonte: Gran Cursos.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo