Ao criar um índice para um corpus de notícias políticas, um...

Próximas questões
Com base no mesmo assunto
Q2383270 Estatística
Ao criar um índice para um corpus de notícias políticas, um pesquisador decidiu usar o modelo vetorial com a medida TF-IDF.
Descobriu, porém, que essa medida pode ser calculada de várias formas, com a característica comum de calcular o peso de cada termo a partir da ideia de que esse termo  
Alternativas

Comentários

Veja os comentários dos nossos alunos

A medida TF-IDF (Term Frequency-Inverse Document Frequency) é uma técnica usada na recuperação de informação e mineração de texto para avaliar a importância de uma palavra em um documento que faz parte de uma coleção ou corpus.

O TF-IDF aumenta proporcionalmente à frequência do termo no documento (Term Frequency - TF) e diminui com o aumento do número de documentos no corpus que contêm o termo (Inverse Document Frequency - IDF).

Isso significa que os termos que aparecem frequentemente em um documento, mas raramente no corpus, recebem uma pontuação alta, destacando sua importância única no documento específico em relação à coleção inteira.

Portanto, a característica comum da medida TF-IDF é que ela calcula o peso de cada termo a partir da ideia de que esse termo.

Gabarito: Letra B) tenha um peso diretamente proporcional à sua frequência no documento e inversamente proporcional à sua frequência nos documentos do corpus.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo