Classificação é uma importante tarefa utilizada na etapa de...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: E.
A classificação, no contexto da mineração de dados, envolve a construção de um modelo que possa identificar a qual de várias classes ou grupos pré-definidos uma nova observação pertence. O modelo é construído a partir de um conjunto de dados para os quais a classe correta (ou resposta) é conhecida.
Para resolver essa questão, é crucial entender o conceito de aprendizado supervisionado, que é o tipo de aprendizado de máquina onde o modelo é treinado em um conjunto de dados com rótulos conhecidos (isto é, as classes ou categorias corretas já foram identificadas para as observações no conjunto de treinamento).
A alternativa E está correta pois descreve o essencial do processo de classificação, que é o aprendizado de uma função de mapeamento f(X) que associa uma entrada de dados X (isto é, as características ou atributos observados) a um rótulo de saída y (a classe à qual a entrada pertence). Essa aprendizagem envolve o uso de algoritmos que, através do treinamento com dados onde se conhece a entrada X e a saída y, aprendem a relação entre eles e posteriormente podem aplicar esse conhecimento para classificar novas ocorrências de dados.
O foco da classificação está em prever a classe y para novas instâncias de dados baseando-se em um modelo preditivo que foi construído a partir de dados anteriores cujas classes eram conhecidas. Portanto, a alternativa E captura o aspecto central da tarefa de classificação ao mencionar a função de mapeamento que é aprendida.
Essa função de mapeamento é, então, a peça fundamental do processo de classificação, permitindo que novos dados sejam corretamente categorizados em classes específicas com base no modelo desenvolvido durante a fase de treinamento.
Em resumo, compreender o papel do aprendizado supervisionado e como os modelos de classificação são construídos e utilizados é um conhecimento essencial para resolver questões de concursos públicos que abordam o tema de mineração de dados e classificação.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Algoritmos K-Prototypes são usandos para a técnica de Clusterização e não de Classificação.
Em um processo de mineração de dados, a classificação está especificamente voltada à atribuição de uma das classes pré-definidas pelo analista a novos fatos ou objetos submetidos à classificação. Essa técnica pode ser utilizada tanto para entender dados existentes quanto para prever como novos dados irão se comportar [Euriditionhome, 2004].
c4.5 - avore de decisao https://en.wikipedia.org/wiki/C4.5_algorithm
Gabarito: E.
Comentário quanto à alternativa D:
Suporte é a frequência que um conjunto de itens específicos ocorre dentro do banco de dados. Não está ligado à classificação, e sim a associação.
Qualquer equívoco, mandem uma mensagem que retifico o comentário.
Bons estudos!
Erro da C -
Segundo o teorema NFL (No Free Lunch Theorem), não existe um algoritmo de aprendizado que seja superior a todos os demais quando considerados todos os problemas de Classificação possíveis. Isto significa que, a cada nova aplicação envolvendo a tarefa de Classificação, os algoritmos disponíveis devem ser experimentados a fim de identificar aqueles que obtêm melhor desempenho
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo