Em relação aos sistemas de Recuperação de Informação, é cor...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: D
Vamos explorar cada alternativa para entender por que a alternativa D é a correta e por que as outras estão incorretas.
Alternativa A: O modelo vetorial, também conhecido como modelo algébrico, não se baseia na presença ou ausência dos termos de indexação. Na verdade, ele considera a representação dos documentos e das consultas como vetores em um espaço multidimensional, onde o grau de similaridade é calculado por medidas como o cosseno do ângulo entre esses vetores. Portanto, a afirmação está incorreta.
Alternativa B: Os modelos clássicos de recuperação de informação, que incluem o booleano, o vetorial e o probabilístico, não se fundamentam na dependência entre os termos de indexação. Pelo contrário, eles lidam com a independência dos termos para melhorar a eficiência e a precisão da recuperação. Dessa forma, a afirmação está incorreta.
Alternativa C: O modelo booleano opera com lógica exata, utilizando operadores como "E", "OU" e "NÃO" para combinar termos de busca e não permite casamentos parciais ou o uso de pesos não binários. Portanto, a afirmação não representa corretamente o funcionamento do modelo booleano.
Alternativa D: A afirmação está correta. O princípio de ranqueamento probabilístico, utilizado no modelo probabilístico de recuperação de informação, supõe que a relevância de um documento em relação a uma consulta depende apenas das representações da consulta e do documento. Isso significa que ele calcula a probabilidade de um documento ser relevante com base nas características do próprio documento e da consulta.
Alternativa E: A vantagem do modelo probabilístico não está na frequência de ocorrência de um termo de indexação em um documento, mas sim na capacidade de estimar a probabilidade de relevância de um documento em relação a uma consulta, considerando evidências de relevância passada. Portanto, esta afirmação também é incorreta.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Acrescentando...
Segundo Costa e Pimentel (2014, p. 32-33):
O modelo Booleano é um modelo de recuperação simples baseado na teoria de conjunto e na álgebra Booleana. Como consequência, o modelo é bastante intuitivo e possui uma semântica precisa. O modelo Booleano segundo Baeza-Yates (2013) considera que os termos de indexação estão presentes ou ausentes nos documentos, ou seja, as frequências na matriz termos por documentos são todas binárias.
O modelo vetorial reconhece que a recuperação Booleana é bastante limitada e propõe um quadro no qual casamentos parciais são possíveis. Isso é feito por meio da atribuição de pesos não binários aos termos de indexação das consultas e dos documentos, que, por sua vez, são usados para computar o grau de similaridade entre cada documento armazenado no sistema e a consulta do usuário.
Fonte: https://faceel.unifesspa.edu.br/images/works/TCC/2014/UM-FRAMEWORK-PARA-RECUPERAO-SEMANTICA-DE-OBJETOS-DE-APRENDIZAGEM-CONTEXTUALIZADOS.pdf
Conforme Svoboda Junior (2008, p. 25):
O modelo probabilístico supõe que para uma dada consulta q e um documento d, é estimada a probabilidade de o usuário classificar o documento como sendo relevante. Esta probabilidade depende apenas da representação da consulta e do documento.
Gab. D
Fonte: http://www.inf.ufrgs.br/~galante/wiki/lib/exe/fetch.php?id=former_students&cache=cache&media=tc-2008-luizhermes.pdf
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo