ulgue os itens 115 e 116, a respeito dos conceitos de inteli...
Um dos modelos de garimpagem de dados que pode ser utilizado na fase de análise é a agregação, que tem por objetivo calcular a probabilidade de uma amostra desconhecida pertencer a cada uma das classes possíveis, isto é, predizer a classe mais provável.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E - errado
Vamos esclarecer o tema abordado pela questão. No contexto de Business Intelligence (BI) e garimpagem de dados, também conhecida como Data Mining, existem vários modelos e técnicas que são utilizados para extrair conhecimento de grandes volumes de dados. A agregação é uma dessas técnicas, mas o enunciado da questão descreveu incorretamente seu propósito.
A agregação em Data Mining é frequentemente usada para simplificar os dados antes da análise. Isso envolve a combinação de dois ou mais atributos (ou objetos) em um único atributo (ou objeto) para reduzir a complexidade dos dados ou para torná-los mais compreensíveis. Por exemplo, pode-se agregar dados diários em dados mensais ou combinar categorias similares em uma única categoria.
O objetivo descrito na questão, que é calcular a probabilidade de uma amostra desconhecida pertencer a cada uma das classes possíveis e prever a classe mais provável, é na verdade associado a técnicas de classificação e não agregação. Modelos de classificação, como árvores de decisão, redes neurais e máquinas de vetores de suporte, são projetados para esse tipo de análise preditiva.
Portanto, a afirmação é errada porque confunde o propósito da agregação com o da classificação em Data Mining. Ao estudar para concursos na área de BI, é crucial compreender as diferenças entre as várias técnicas e seus objetivos específicos para não cair em armadilhas como esta.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Data mining
A questão está errada porque a descrição citada é sobre o Algoritmo de Classificação Bayesiana:
O algoritmo tem como objetivo calcular a probabilidade que uma amostra desconhecida pertença a cada uma das classes possiveis, ou seja, predizer a classe mais provável. Este tipo de predição é chamada de classificação estatística, pois é completamente baseada em probabilidades
Agregação:
As funções de agregação fazem exatamento o que o nome diz: agregam valores. As funções de agregação agrupam valores de acordo com alguns campos e tornam um valor baseado no conjunto de valores dos campos agregados, como uma soma ou o menor valor entre o conjunto de valores.
Predizer uma classe é classificação. Agregação é o processo de organizar os dados em gurpos de forma não supervisionadda.
Agregação - as classes são previamente desconhecidas e há a agrupação por caracteristicas semelhantes
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo