Com referência aos conceitos e técnicas de mineração de dado...
Com referência aos conceitos e técnicas de mineração de dados, julgue o item seguinte.
Em um modelo para um aprendizado supervisionado dos
dados no formato de uma árvore de decisão, um algoritmo de
construção da árvore busca minimizar a informação
necessária para classificar os dados nas partições da árvore.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: C - certo
Para compreender a resposta correta, é necessário ter conhecimento sobre aprendizado supervisionado e árvores de decisão no contexto de mineração de dados. No aprendizado supervisionado, o algoritmo é treinado em um conjunto de dados que tem as respostas ou classificações conhecidas, e o objetivo é aprender um modelo que faça predições acuradas para novos dados.
Uma árvore de decisão é uma estrutura em forma de fluxograma onde cada nó representa um teste em um atributo, cada ramificação representa o resultado do teste, e as folhas representam classes ou valores de saída. O algoritmo constrói a árvore de forma que sejam realizados os menores números de perguntas possíveis para classificar os dados, o que de fato busca minimizar a informação necessária para as classificações.
Este processo de divisão dos dados em partições cada vez mais homogêneas em relação à variável-alvo é chamado de particionamento recursivo. A medida que busca a melhor divisão dos dados em cada nível da árvore é frequentemente baseada em conceitos como entropia e ganho de informação, que quantificam a pureza das partições resultantes e a quantidade de informação ganha com cada divisão, respectivamente.
Por isso, a afirmação de que o algoritmo de construção da árvore busca minimizar a informação necessária para classificar os dados nas partições da árvore está correta, pois reflete a essência do processo de construção de uma árvore de decisão em aprendizado supervisionado.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
c-
Classification means to group the output inside a class. If the algorithm tries to label input into two distinct classes, it is called binary classification. Selecting between more than two classes is referred to as multiclass classification.
https://www.guru99.com/supervised-vs-unsupervised-learning.html#what-is-unsupervised-learning
O algoritmo procura dividir os dados em partes (nós) de modo a reduzir a incerteza na classificação dos dados. Portanto, o objetivo é minimizar a informação necessária para classificar os dados com precisão, tornando a árvore de decisão eficaz na classificação de novos exemplos. Cada nó interno da árvore representa uma decisão com base em uma característica dos dados, enquanto as folhas representam resultados ou classificações.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo