No contexto do Processamento de Linguagem Natural, assinale ...

Próximas questões
Com base no mesmo assunto
Q2287688 Engenharia de Software
No contexto do Processamento de Linguagem Natural, assinale a opção que apresenta o principal objetivo da stemização e sua diferença em relação à lematização.
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

O gabarito correto é a letra A. A stemização, ou stemming, tem como principal objetivo reduzir palavras à sua forma radical, chamada de stem, removendo os afixos, prefixos e sufixos mais comuns da palavra, para simplificar o processamento de texto e reduzir a dimensionalidade do espaço de recursos. Por exemplo, as palavras "running", "runs" e "ran" podem todas ser reduzidas ao seu stem "run".

Por outro lado, a lematização é um processo mais sofisticado e leva em conta a análise morfológica das palavras. O objetivo é reduzir a palavra à sua forma de dicionário, o lema. A lematização busca a forma canônica de uma palavra com base em seu uso real, considerando o contexto e a categoria gramatical, o que preserva o significado original da palavra. Ao contrário da stemização, um lematizador precisa de um dicionário completo de palavras e suas formas flexionadas, além das regras gramaticais para determinar o lema de uma palavra. Assim, as palavras "better" e "best" seriam reduzidas a "good" no caso da lematização, algo que o stemming não faria.

As alternativas B, C, D, e E contêm descrições incorretas dos processos de stemming e lematização, tanto sobre seus objetivos quanto em relação aos métodos utilizados. Portanto, a alternativa A é a única que apresenta a distinção correta entre essas duas técnicas usadas no processamento de linguagem natural.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A stemização (stemming) e a lematização (lemmatization) são técnicas de processamento de texto usadas para reduzir palavras à sua forma base ou raiz, a fim de simplificar o texto e facilitar a análise textual em tarefas como processamento de linguagem natural (PLN) e recuperação de informações. No entanto, essas técnicas têm diferenças importantes:

  1. Stemização (Stemming):

  • A stemização envolve a remoção de sufixos e prefixos de uma palavra para obter a forma raiz ou stem.
  • O objetivo principal da stemização é reduzir as palavras a uma forma truncada que pode não ser uma palavra válida no idioma, mas ainda é a forma raiz da palavra.
  • A stemização é um processo mais simples e geralmente usa regras heurísticas para cortar os sufixos das palavras.
  • Exemplo: "corridas" é reduzido a "corr", e "correndo" é reduzido a "corr".

  1. Lematização (Lemmatization):

  • A lematização envolve a redução de palavras a sua forma canônica ou lema, que é uma palavra válida no idioma.
  • O objetivo da lematização é transformar palavras em sua forma mais básica, considerando sua classe gramatical e significado.
  • A lematização é um processo mais complexo e requer conhecimento de dicionários e regras gramaticais.
  • Exemplo: "corridas" é reduzido a "corrida", e "correndo" é reduzido a "correr".

Em resumo, a stemização tende a ser mais agressiva na redução das palavras, gerando raízes que podem não ser palavras reais, enquanto a lematização busca produzir lemas, que são formas linguísticas válidas e reconhecidas. A escolha entre stemização e lematização depende do contexto da tarefa de processamento de texto e dos objetivos específicos de análise de linguagem natural.

Exemplos de Stemming e Lematização

Stemming:

O stemming reduz palavras à sua forma radical, geralmente removendo sufixos e prefixos. Exemplos incluem:

- "meninas" → "menin"

- "andando" → "and"

- "gatos" → "gat"

Lematização:

A lematização transforma palavras em suas formas canônicas, considerando o contexto. Exemplos incluem:

- "andando" → "andar"

- "melhores" → "bom"

- "correr" (infinitivo) → "correr"

Essas técnicas são essenciais para o pré-processamento de texto em tarefas de processamento de linguagem natural, ajudando a simplificar a análise sem perder o significado.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo