Assinale a opção correta a respeito da implantação de um mod...
Assinale a opção correta a respeito da implantação de um modelo
de classificação de árvore de decisão em Python.
Comentários
Veja os comentários dos nossos alunos
Gabarito: B
Comentário:
Breve resumo: Para implantar um modelo de classificação (incluindo árvores de decisão) no scikit-learn, o procedimento comum é:
1. Passar as características (features) em X_train e os rótulos (labels) em y_train para o método fit().
2. Avaliar o desempenho com novos dados de teste (X_test e y_test) via score() ou métricas específicas (precision, recall, etc.).
3. Gerar previsões em dados desconhecidos por meio de model.predict(X_test).
A) Incorreta, pois inverte os papéis de X_train e y_train. O correto é X_train para as características e y_train para os rótulos.
B) Correta, pois depois de treinar com fit(X_train, y_train), deve-se usar score(X_test, y_test) para avaliar a acurácia (ou outra métrica) com dados de teste.
C) Embora seja possível chamar predict(X_train), isso serve para checar como o modelo se ajustou aos dados de treinamento, mas não é a forma usual de avaliar o desempenho verdadeiro do modelo.
D) Incorreta, pois se utiliza model.predict(X_test) para prever rótulos em dados de teste. Y_test é o conjunto de rótulos verdadeiros, não as características de entrada.
@_gilson.nogueira_
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo