Ao criar um índice para um corpus de notícias políticas, um...
Descobriu, porém, que essa medida pode ser calculada de várias formas, com a característica comum de calcular o peso de cada termo a partir da ideia de que esse termo
Comentários
Veja os comentários dos nossos alunos
A medida TF-IDF (Term Frequency-Inverse Document Frequency) é uma técnica usada na recuperação de informação e mineração de texto para avaliar a importância de uma palavra em um documento que faz parte de uma coleção ou corpus.
O TF-IDF aumenta proporcionalmente à frequência do termo no documento (Term Frequency - TF) e diminui com o aumento do número de documentos no corpus que contêm o termo (Inverse Document Frequency - IDF).
Isso significa que os termos que aparecem frequentemente em um documento, mas raramente no corpus, recebem uma pontuação alta, destacando sua importância única no documento específico em relação à coleção inteira.
Portanto, a característica comum da medida TF-IDF é que ela calcula o peso de cada termo a partir da ideia de que esse termo.
Gabarito: Letra B) tenha um peso diretamente proporcional à sua frequência no documento e inversamente proporcional à sua frequência nos documentos do corpus.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo