Em sistemas de Recuperação de Informação, os termos de index...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa Correta: E
A alternativa correta é a E. Vamos entender por quê.
Justificativa da Alternativa Correta:
O processo de stemming é uma técnica utilizada em sistemas de Recuperação de Informação para reduzir palavras às suas raízes ou radicais. Isso facilita a correspondência entre diferentes formas de uma palavra. Por exemplo, "correr", "correndo" e "correu" podem ser reduzidas ao radical "corr" através do stemming. Esse processo é essencial para melhorar a eficácia da recuperação de documentos que contenham variações morfológicas da mesma palavra.
Agora, vamos analisar as alternativas incorretas:
Análise das Alternativas Incorretas:
A - No processo de reconhecimento da estrutura, ocorre a análise léxica e a remoção de palavras sem semântica associada.
Comentário: Embora a análise léxica seja parte do processamento de texto, esta alternativa está incorreta porque a remoção de palavras sem semântica associada, como "stopwords" (palavras de parada), não faz parte do reconhecimento da estrutura, mas sim de processos de filtragem e limpeza do texto.
B - O processo de quebra do texto em palavras (tokenização) é dependente da stoplist, um dicionário próprio aplicado à separação das palavras.
Comentário: Esta alternativa está incorreta porque a tokenização é o processo de dividir o texto em unidades menores, chamadas "tokens" (como palavras ou frases), e não depende de uma stoplist. A stoplist é usada posteriormente para remover palavras comuns que não adicionam valor semântico.
C - A classificação de grupos nominais visa a identificação dos verbos e remoção das demais palavras, através de listas de palavras, etiquetadores automáticos e um thesaurus da língua ou do domínio.
Comentário: A classificação de grupos nominais geralmente é usada para identificar substantivos e suas relações, e não verbos. Portanto, a descrição apresentada na alternativa está incorreta.
D - Acentos, espaçamento e demais símbolos são delimitadores considerados naturais no processo de stemming.
Comentário: Esta alternativa está incorreta porque acentos, espaçamentos e símbolos não são considerados no processo de stemming. Eles são mais relevantes para a tokenização e normalização de texto.
E - O processo de stemming consiste em remover os afixos, preservando o radical e possibilitando o casamento entre variações de uma mesma palavra.
Comentário: Correto! Este é exatamente o objetivo do stemming: remover sufixos, prefixos e outros afixos para revelar a raiz da palavra, facilitando a recuperação de documentos que contêm diferentes formas da mesma palavra.
Espero que esta explicação tenha ajudado a esclarecer as operações realizadas em sistemas de Recuperação de Informação e como identificar a alternativa correta em questões desse tipo.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
sangue de jesus tem poder!
misericórdia
SENHOR AMADO
no começo da questão eu não entendi nada e quando cheguei ao final, parecia que estava no começo kkkkkk
Parece mais uma questão de informática (Banco de dados, Python...) do que de português kkkk
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo