Segundo Baeza-Yates e Ribeiro-Neto (2013), no capítulo 7, de...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a letra A. Vamos entender por quê.
A questão aborda a classificação de textos, que é um tema fundamental em Biblioteconomia e Ciência da Informação. Desde os primórdios, como na Grande Biblioteca de Alexandria, a organização de documentos sempre foi uma preocupação para bibliotecários, especialmente com o aumento de coleções. A classificação de textos envolve agrupar documentos por tópicos ou outras características como linguagem, gênero, entre outros, sendo uma prática essencial para a organização e recuperação de informações.
Justificando a alternativa correta (A): A classificação de textos pode realmente se tornar mais sofisticada ao se adicionar exemplos de documentos pré-classificados por seres humanos. Esses documentos servem como dados de treinamento para ajustar ou treinar classificadores, o que é uma aplicação de algoritmos de aprendizagem supervisionada. Esse método permite que o sistema aprenda com dados rotulados para fazer previsões ou classificações corretas em novos dados.
Analisando as alternativas incorretas:
Alternativa B: Embora muitos algoritmos de classificação de texto realmente utilizem aprendizado de máquina, mencionando aprendizagem profunda ou árvores de decisão, a questão não está focada apenas nesses métodos específicos. A alternativa correta precisa ressaltar o papel dos exemplos pré-classificados, o que não ocorre aqui.
Alternativa C: Embora algoritmos de aprendizagem supervisionada possam usar funções de aprendizagem e dados de teste, a expressão "deep learning" não é exclusiva nem obrigatória para todos os algoritmos de aprendizagem supervisionada. A afirmação torna-se restritiva e imprecisa.
Alternativa D: Aprendizagem não supervisionada, por definição, não utiliza dados de treinamento rotulados. "Deep learning" pode ser usado, mas não é uma característica distintiva da aprendizagem não supervisionada como apresentado aqui. Portanto, a alternativa está incorreta ao afirmar que há uma necessidade de dados de treinamento nesse contexto.
Alternativa E: Nesta alternativa, há uma confusão conceitual. O conjunto de treinamento é usado para treinar classificadores, mas para avaliação, utiliza-se o conjunto de teste, que é separado justamente para avaliar a eficácia do classificador. Assim, a alternativa confunde o propósito dos conjuntos de dados.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
```Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
O aprendizado supervisionado precisa que os dados sejam rotulados para identificar padrões, isto é, para que a aprendizagem supervisionada funcione é preciso inserir os valores de entrada, no mesmo momento em que antecipa o valor de saída esperado, conhecido como sinal de supervisão. A aprendizagem supervisionada possui duas técnicas: classificação e previsão.
O erro da E:
Para avaliação dos classificadores, são utilizados documentos pré-selecionados, para os quais as classes são conhecidas – o conjunto de TESTES.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo