Em sistemas de Recuperação de Informação, os termos de index...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é: E - O processo de stemming consiste em remover os afixos, preservando o radical e possibilitando o casamento entre variações de uma mesma palavra.
Vamos entender o que cada alternativa representa e por que a alternativa E é a correta.
Alternativa A: Esta alternativa menciona o reconhecimento da estrutura, o que pode incluir análise léxica, mas não está diretamente relacionado à remoção de palavras sem semântica associada, que é mais comumente realizada pelo processo de stopword removal. Assim, a descrição não está inteiramente correta para o contexto proposto.
Alternativa B: A quebra do texto em palavras ou tokenização é um processo que segmenta o texto em unidades menores, chamadas tokens. No entanto, ela não é dependente de uma stoplist. A stoplist é usada após a tokenização para remover palavras irrelevantes, mas não durante a segmentação do texto.
Alternativa C: A classificação de grupos nominais não está focada na identificação de verbos e remoção das demais palavras. Em sistemas de recuperação, o foco é em identificar termos que representam melhor o conteúdo do documento, o que frequentemente são substantivos ou nomes próprios, não verbos.
Alternativa D: O processo de stemming não considera acentos, espaçamento e símbolos como delimitadores. O stemming foca na redução das palavras a sua raiz ou radical, mas não envolve manipulação de acentuação ou formatação.
Alternativa E: Como mencionado, o stemming é uma técnica utilizada para reduzir palavras em variações de sua forma básica ao seu radical. Isso é crucial em sistemas de recuperação de informação, pois permite o reconhecimento de palavras diferentes que compartilham a mesma raiz, melhorando a eficiência na busca e recuperação dos documentos.
O tema central da questão é o processamento de linguagem natural, especialmente no contexto de recuperação de informação, onde técnicas como tokenização, remoção de stopwords e stemming são fundamentais para extrair e indexar termos de um documento. A compreensão desses processos é essencial para quem estuda Biblioteconomia e deseja atuar na área de organização da informação.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Em morfologia linguística e recuperação de informação a stemização (do inglês, stemming) é o processo de reduzir palavras flexionadas (ou às vezes derivadas) ao seu tronco (stem), base ou raiz, geralmente uma forma da palavra escrita.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo