Os algoritmos de Mineração de Dados podem ser classificados ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: A - Algoritmos de agrupamento podem ser utilizados para classificação não supervisionada.
Para entendermos o motivo desta ser a alternativa correta, vamos explorar um pouco sobre os algoritmos de Mineração de Dados e o conceito de aprendizado supervisionado e não supervisionado:
Na Mineração de Dados, utilizamos algoritmos para descobrir padrões e obter conhecimento a partir de grandes volumes de dados. Esses algoritmos são categorizados com base no objetivo que desejamos alcançar:
- Classificação: Está associada ao aprendizado supervisionado, onde o algoritmo aprende a partir de um conjunto de dados previamente classificado (ou etiquetado), e o objetivo é prever a classe ou categoria de novas observações.
- Agrupamento (ou clustering): Faz parte do aprendizado não supervisionado. Os dados não são previamente etiquetados, e o algoritmo tenta agrupar as observações com base na similaridade entre elas, sem qualquer conhecimento prévio. Isso é útil, por exemplo, para identificar grupos naturalmente distintos dentro dos dados.
- Regras de associação: Utilizados para identificar relações interessantes entre variáveis em grandes bases de dados.
Com base nisso, a alternativa A está correta porque os algoritmos de agrupamento são um exemplo típico de aprendizado não supervisionado, onde o objetivo é descobrir a estrutura inerente dos dados sem usar etiquetas. Eles não são usados para prever a saída, mas para identificar subgrupos ou clusters nos dados. Portanto, eles são usados em classificação não supervisionada, onde não há uma classificação ou etiquetas previamente definidas.
É importante também entender o porquê das outras alternativas serem incorretas:
- Algoritmos de agrupamento não são supervisionados, então a alternativa B é incorreta.
- Algoritmos de classificação têm como resultado um modelo preditivo e não apenas descritivo, portanto a alternativa C é incorreta.
- Algoritmos de identificação de regras de associação não são necessariamente preditivos, eles são mais usados para encontrar padrões frequentes ou associações, fazendo a alternativa D ser incorreta.
- Agrupamento e identificação de anomalias são dois processos distintos em mineração de dados. Enquanto o agrupamento busca encontrar grupos com características similares, a identificação de anomalias foca em detectar dados que se desviam de um padrão, logo a alternativa E também não é correta.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
a) Algoritmos de agrupamento podem ser utilizados para classificação não supervisionada.
Correta, gabarito da questão;
.
b) Algoritmos de agrupamento são também chamados de algoritmos (não) supervisionados.
Incorreta
.
c) Algoritmos de classificação têm como resultado um modelo descritivo dos dados de entrada.
Incorreta, algoritmos de classificação seguem o modelo preditivo;
.
d) Algoritmos de identificação de regras são também conhecidos como algoritmos preditivos.
Incorreta, Identificação de regras, ou regras de associação, segue o modelo descritivo;
.
e) Algoritmos de agrupamento são equivalentes a algoritmos de identificação de anomalias.
Incorreta, aqui o examinador fez um mixes de conceitos; Identificação de anomalias é do modelo preditivo, para identificar outliers, por sua vez, algoritmo de agrupamento - clustering- segue o modelo Descritivo para encontrar propriedades comuns em certos elementos;
Supervisionado = classificação --> preditivo --> algoritmo ID3, por exemplo
Não supervisionado = clusterização (agrupamento) --> descritivo
Aprendizado:
Supervisionado: Classificação e Regressão Linear.
Não supervisionado: Sumarização, Agrupamento (clustering) e Associação.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo