Em relação à busca de frase em um banco de dados textual, c...
I. Os métodos de arquivos invertidos são caracterizados por possuírem duas partes principais: vocabulário e listas invertidas, sendo que o vocabulário é uma estrutura de busca que contém todos os diferentes termos existentes no texto de forma desordenada.
II. O arquivo invertido é como uma lista ordenada de palavras-chave. Sendo que por palavra existe um apontador para cada um dos documentos onde ela ocorre e sua posição nesse documento.
III. No método de índices para a próxima palavra, para cada termo distinto do vocabulário é criado uma lista de termos que ocorrem em uma posição posterior no texto, juntamente com apontadores de posição para essas ocorrências.
IV. No método de índices para a próxima palavra, os níveis são implementados como árvores binárias, sendo que as palavras existentes no documento que possuem sucessoras, ficam no primeiro nível e no nível seguinte ao índice para a próxima palavra.
Está correto o que se afirma em:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a A - II, III e IV, somente.
Para entender a questão, é importante ter conhecimento sobre banco de dados textuais e os métodos de indexação como arquivos invertidos e índices para a próxima palavra. Estes conceitos são fundamentais para eficiência na recuperação de informações em grandes volumes de dados textuais.
A descrição II está correta, pois arquivos invertidos organizam as palavras-chave em uma lista ordenada e associam a cada palavra um conjunto de apontadores para os documentos e as posições em que ela ocorre.
A descrição III está correta ao explicar que, para cada termo do vocabulário, indexa-se a palavra subsequente no texto, criando uma lista de termos sucessores com seus respectivos apontadores de posição. Esta técnica melhora a busca por frases ao prever qual palavra vem a seguir em um texto.
A afirmação IV está correta porque indica que, nos índices para a próxima palavra, as palavras com sucessoras podem ser organizadas em estruturas como árvores binárias, facilitando a busca por sequências de palavras.
Assim, as descrições II, III e IV estão corretas e descrevem adequadamente as técnicas de indexação de banco de dados textuais para buscas de frases, ao passo que a descrição I está incorreta, pois o vocabulário em métodos de arquivos invertidos deve ser uma estrutura ordenada, não desordenada, para permitir buscas eficientes.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
https://disciplinas.dcc.ufba.br/pub/MATA60/SemestreCorrente/Mineracao_de_Dados_e_banco_de_dados_Textuais.pdf
I: ERRADO. Um arquivo invertido possui duas partes principais: uma estrutura de busca, chamada de vocabulário, contendo todos os termos distintos existentes no texto indexados e, para cada termo, uma lista invertida que armazena os identificadores dos registros contendo o termo.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo