O cientista de dados João deverá criar um modelo de
aprendizado de máquina com o objetivo de classificar transações
de cartão de crédito como "fraudulentas" ou "não fraudulentas".
Dentre as métricas de avaliação da qualidade geral do modelo
criado, João deverá utilizar a que avalia o equilíbrio entre
precisão e sensibilidade (recall):

Question

O cientista de dados João deverá criar um modelo de
aprendizado de máquina com o objetivo de classificar transações
de cartão de crédito como "fraudulentas" ou "não fraudulentas".
Dentre as métricas de avaliação da qualidade geral do modelo
criado, João deverá utilizar a que avalia o equilíbrio entre
precisão e sensibilidade (recall):  Alternativa A: acurácia; Ou Alternativa B: F1-score; Ou Alternativa C: especificidade; Ou Alternativa D: índice Jaccard (J); Ou Alternativa E: área sob a curva ROC (AUC-ROC).

Qconcursos · Accepted Answer

Alternativa [B] F1-score; Alternativa correta: B - F1-score

Vamos entender o porquê dessa alternativa ser a correta e explorar as demais opções para garantir que você compreenda completamente o tema.

A questão aborda um tema fundamental em aprendizado de máquina e ciência de dados: a avaliação de modelos de classificação. No caso específico, o cientista de dados João precisa de uma métrica que avalie o equilíbrio entre precisão (precision) e sensibilidade (recall).

Vamos explicar a métrica correta e as incorretas:

B - F1-score: O F1-score é a média harmônica entre a precisão e a sensibilidade (recall). Esta métrica é particularmente útil quando há um desbalanceamento entre as classes, como é comum em detecção de fraudes, pois considera tanto a taxa de falsos positivos quanto a de falsos negativos.

Agora, analisando as alternativas incorretas:

A - Acurácia: A acurácia mede a proporção de previsões corretas (tanto positivas quanto negativas) entre o total de casos avaliados. Embora seja uma métrica intuitiva, ela pode ser enganosa em casos de classes desbalanceadas, como a detecção de fraudes, onde a maioria das transações são "não fraudulentas".

C - Especificidade: A especificidade, ou taxa de verdadeiros negativos, mede a proporção de negativos corretamente identificados. Embora seja importante, ela não considera a precisão, o que é crucial na detecção de fraudes.

D - Índice Jaccard (J): O índice Jaccard é uma métrica usada principalmente em problemas de segmentação de imagem e comparação de conjuntos. Não é comumente usada para medir o equilíbrio entre precisão e sensibilidade em modelos de classificação.

E - Área sob a curva ROC (AUC-ROC): Esta métrica avalia a capacidade do modelo em distinguir entre classes, considerando todas as possíveis limiares de decisão. Embora seja uma métrica robusta, não foca especificamente no equilíbrio entre precisão e sensibilidade.

Espero que esta explicação tenha esclarecido suas dúvidas sobre o uso das métricas na avaliação de modelos de aprendizado de máquina. Se precisar de mais alguma coisa, estou à disposição!

DESCONTO RELÂMPAGO ⚡

DESCONTO RELÂMPAGO ⚡

O cientista de dados João deverá criar um modelo de aprendi...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas