Julgue o item subsequente, relativo a bancos de dados textua...
São técnicas de filtragem utilizadas no BDT: padronização, stopwords e stemming.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: C - certo
A questão aborda o uso de técnicas de filtragem em bancos de dados textuais. Esse tipo de banco de dados lida com grandes volumes de texto não estruturado. Para extrair informações úteis e realizar pesquisas eficientes, essas técnicas são aplicadas:
- Padronização: Refere-se ao processo de converter o texto para um formato padrão. Isso pode envolver converter todas as letras para minúsculas para garantir a consistência durante as buscas.
- Stopwords: São palavras comuns (como "e", "o", "em") que geralmente são removidas do texto antes da análise, pois não contribuem significativamente para o significado do texto e podem distorcer os resultados das pesquisas.
- Stemming: É o processo de reduzir as palavras ao seu radical ou forma base. Por exemplo, "correndo", "corre" e "correu" podem ser reduzidos ao radical "corr", facilitando a indexação e a pesquisa no banco de dados.
Essas técnicas são aplicadas para melhorar a eficiência dos sistemas de recuperação de informação e análise de bancos de dados textuais. A afirmativa está correta, pois identifica métodos comuns que auxiliam no pré-processamento e filtragem de conteúdo textual.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Processamento de linguagem natural
normalização
remoção de stopwprds (não não é incluído)
remoção de numerais
correção ortográfica
stemming (padroniza por meio do radical)
lemming (deixa na forma singular e masculina)
Gabarito Certo!
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo