Qual é a etapa de modelagem da metodologia CRISP-DM na qual ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: B - Preparação de Dados.
A metodologia CRISP-DM (Cross-Industry Standard Process for Data Mining) é um modelo de processo amplamente utilizado para projetos de mineração de dados. Ela descreve uma abordagem padrão para enfrentar problemas de data mining de uma forma que seja aplicável em diversas indústrias. A metodologia é dividida em seis fases principais:
- Entendimento do Negócio: Foca em entender os objetivos e requisitos do projeto do ponto de vista do negócio.
- Entendimento dos Dados: Envolve a coleta inicial dos dados e atividades para se familiarizar com os dados, identificar problemas de qualidade, descobrir os primeiros insights e definir hipóteses iniciais.
- Preparação dos Dados: É a fase em que os dados são limpos e transformados para serem utilizados na modelagem. Aqui, valores nulos são tratados e pode ser necessária a fusão com outros conjuntos de dados, justificando por que a alternativa B está correta.
- Modelagem: Nesta etapa, são aplicadas técnicas de modelagem estatística e de machine learning para descobrir padrões nos dados.
- Avaliação: Os modelos são avaliados com o intuito de garantir que atendam aos objetivos do negócio.
- Implementação: A fase final envolve a implementação do modelo de mineração de dados e o monitoramento de seus resultados.
Com base no entendimento do CRISP-DM, podemos justificar que a alternativa correta é a B - Preparação de Dados, pois é nesse momento que ocorre o tratamento e a limpeza dos dados, incluindo o tratamento de valores nulos e a possível fusão de dados de diferentes fontes. Estas atividades são essenciais para garantir a qualidade e a consistência dos dados que serão utilizados nas etapas de modelagem e avaliação subsequentes.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Letra B
Compreensão do Negócio (Business Understanding): Nesta fase, o objetivo é compreender o contexto do projeto, identificar os objetivos de negócio e definir os critérios de sucesso. É importante compreender as necessidades do cliente e determinar como a mineração de dados pode ser aplicada para atender a essas necessidades.
Compreensão dos Dados (Data Understanding): Aqui, o foco é coletar e explorar os dados disponíveis. É necessário identificar as fontes de dados, familiarizar-se com os dados, avaliar sua qualidade, realizar análises exploratórias e identificar possíveis problemas ou lacunas nos dados.
Preparação dos Dados (Data Preparation): Nesta fase, os dados são preparados para a modelagem. Isso envolve a seleção de dados relevantes, limpeza, transformação, integração e formatação dos dados de acordo com os requisitos do modelo de mineração de dados.
Modelagem (Modeling): Aqui, são desenvolvidos modelos de mineração de dados com base nos dados preparados. Diferentes técnicas de modelagem, como algoritmos de machine learning, são aplicadas para descobrir padrões, realizar previsões ou tomar decisões com base nos objetivos do projeto.
Avaliação (Evaluation): Nesta fase, os modelos desenvolvidos são avaliados de acordo com os critérios estabelecidos na fase de compreensão do negócio. A performance do modelo é avaliada usando métricas apropriadas, e ajustes e refinamentos podem ser feitos para melhorar o desempenho do modelo.
Implantação (Deployment): Por fim, os resultados do projeto de mineração de dados são apresentados e implantados para uso prático. Isso pode envolver a criação de relatórios, visualizações de dados ou integração dos modelos em sistemas existentes para suportar a tomada de decisão.
CRISP-DM: É um processo amplamente utilizado na área de mineração de dados e análise de dados. Ele fornece uma estrutura passo a passo para guiar as organizações através do processo de mineração de dados de maneira sistemática e organizada. Tal modelo é constituído de 6 (seis) fases:
1) Entendimento do negócio: Requisito dos projetos são definidos;
2) Entendimento dos dados: Os dados disponíveis são coletados e explorados;
3) Preparação dos dados: Os dados são limpos, transformados e processados;
4) Modelagem: Os modelos de mineração de dados são selecionados;
5) Avaliação: Os modelos são avaliados quanto ao seu desempenho e eficácia;
6) Implantação: Os resultados de análise são incorporados ao ambiente de produção.
Em resumo. o CRISP-DM oferece uma abordagem estruturada para a execução de projetos de mineração de dados, auxiliando as organizações a tomar decisões embasadas em dados e extrair insights (descobertas valiosas) de suas informações.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo