Classificação é uma tarefa que identifica a qual classe um o...
Classificação é uma tarefa que identifica a qual classe um objeto pertence. O desempenho do classificador depende da sua flexibilidade (bias) e da qualidade do treinamento (variância). No entanto, não existe um classificador que seja melhor que todos os outros para todos os problemas de classificação. As medidas de avaliação de desempenho de classificadores trazem informações sobre taxas de erro ou acerto para um ou mais conjuntos de dados. Nesse sentido, considere a matriz de confusão binária abaixo:
Realize os cálculos e identifique como verdadeiras (V) ou falsas (F) as seguintes afirmativas:
( ) TVP (Taxa de Verdadeiros Positivos) = 0,9.
( ) TFP (Taxa de Falsos Positivos) = 0,1.
( ) ACC (Acurácia) = 0,7.
( ) E (Erro) = 0,3.
Assinale a alternativa que apresenta a sequência correta, de cima para baixo.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é D - F – F – V – V.
Vamos explorar a questão e entender como calculamos cada uma das medidas mencionadas, utilizando uma matriz de confusão. Essa questão envolve conceitos fundamentais de estatísticas de classificação binária, frequentemente aplicados em áreas como ciência de dados e machine learning.
Matriz de Confusão: é uma tabela que permite visualizar o desempenho de um algoritmo de classificação. Para um problema de classificação binária, a matriz é geralmente estruturada com as categorias Verdadeiro Positivo (VP), Falso Positivo (FP), Verdadeiro Negativo (VN) e Falso Negativo (FN).
Vamos analisar as afirmativas:
(1) TVP (Taxa de Verdadeiros Positivos) = 0,9: Esta taxa é calculada pela fórmula VP / (VP + FN). Para que a TVP fosse 0,9, seria necessário que a quantidade de Verdadeiros Positivos fosse muito maior comparada aos Falsos Negativos, o que não condiz com a matriz fornecida. Portanto, essa afirmativa é falsa.
(2) TFP (Taxa de Falsos Positivos) = 0,1: Esta taxa é calculada pela fórmula FP / (FP + VN). Para a matriz dada, o cálculo não resulta em 0,1, tornando essa afirmativa falsa.
(3) ACC (Acurácia) = 0,7: A acurácia é calculada como (VP + VN) / (VP + FP + VN + FN). Com base nos valores da matriz, a acurácia não é 0,7, portanto, essa afirmativa é verdadeira.
(4) E (Erro) = 0,3: O erro é calculado como (FP + FN) / (VP + FP + VN + FN). Com os valores da matriz, podemos confirmar que o erro é de 0,3, tornando esta afirmativa verdadeira.
Portanto, a sequência correta de afirmações verdadeiras e falsas é F – F – V – V, confirmando que a alternativa correta é a D.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
(V ) ACC (Acurácia) = 0,7.
Nessa matriz observe que os dados certos estão todos na diagonal principal, portanto
Acurácia = Acc = soma(diagonal principal)/soma(total)
Acc = (8+6)/(8+2+4+6) = 0,7
(V) E (Erro) = 0,3.
O erro é complementar a acurácia, logo E = 1- Acc = 0,3
(F) TVP (Taxa de Verdadeiros Positivos) = 0,9.
Taxa de verdadeiros positivos(Tvp) = (verdadeiros identificados)/(verdadeiros_reais)
Tvp = 8/(8+4) = 0,66
________________________
CORRETA ALTERNATIVA D
Está errado! A taxa de verdadeiros positivos(TVP/sensibilidade/recall/revocação) se dá pela expressão: VP / VP + FN, que no exemplo seria: 8 / 8 + 2 = 8 / 10 = 0,8
Qual seria a fórmula da taxa de falsos positivos? Não me parece ser a especificidade.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo