Um analista recebeu uma enorme quantidade de dados referente...

Próximas questões
Com base no mesmo assunto
Q2869992 Arquitetura de Software

Um analista recebeu uma enorme quantidade de dados referentes a alunos de uma universidade. Ele precisa criar um software que preveja quais alunos poderiam abandonar o curso, para que medidas dentro da universidade possam ser tomadas, de forma preventiva. Nos dados de alunos já conhecidos, têm-se a idade, o bairro de residência, a cidade natal, o salário médio da família, a escolaridade dos pais, a porcentagem concluída do curso, o índice de rendimento acadêmico e a situação (matriculado, trancado, abandono). Para criar esse software, o analista precisará usar algoritmos de Data Mining, mais especificamente aprendizado de máquina _____________________ para a tarefa de _____________________.

Assinale a alternativa que preenche corretamente as lacunas acima, na ordem em que aparecem no texto.

Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: B - supervisionado – classificação

Para resolver essa questão, é essencial que você compreenda os conceitos de aprendizado de máquina e as diferentes abordagens que ele pode utilizar, tais como aprendizado supervisionado e não supervisionado. Vamos detalhar esses conceitos para facilitar a compreensão.

Aprendizado supervisionado: Nesta abordagem, o algoritmo é treinado em um conjunto de dados rotulados, o que significa que cada exemplo de treinamento é composto de uma entrada e uma saída esperada. O objetivo é fazer o algoritmo aprender a mapear entradas para saídas corretas. Existem principalmente duas tarefas no aprendizado supervisionado:

  • Classificação: Aqui, o algoritmo aprende a categorizar os dados em classes distintas. No caso apresentado pela questão, a situação do aluno (matriculado, trancado, abandono) é uma classificação.
  • Regressão: Neste caso, o algoritmo aprende a prever valores contínuos. Este não é o foco da questão, pois não estamos prevendo um valor contínuo, mas sim categorizando.

Aprendizado não supervisionado: Aqui, o algoritmo trabalha com dados não rotulados e tenta encontrar padrões ou estruturas dentro do conjunto de dados. As principais tarefas incluem:

  • Agrupamento (Clustering): O algoritmo divide os dados em grupos com base em alguma similaridade. Não se aplica à nossa questão, pois não estamos agrupando alunos, mas classificando.
  • Descoberta de regras de associação: Encontra relações entre variáveis em grandes bases de dados. Também não é o foco da questão.

Predição: Esse termo é mais geral e pode se referir tanto a classificação quanto a regressão, dependendo do contexto. Na questão, queremos categorizar os alunos, então o termo mais específico é classificação.

Analisando as alternativas:

  • A - não supervisionado – regressão: Incorreto, pois a regressão é uma tarefa de aprendizado supervisionado, não de aprendizado não supervisionado.
  • B - supervisionado – classificação: Correto, pois a tarefa de prever se um aluno irá abandonar o curso é uma tarefa de classificação com aprendizado supervisionado.
  • C - supervisionado – agrupamento: Incorreto, pois o agrupamento é uma técnica de aprendizado não supervisionado.
  • D - não supervisionado – descoberta de regras de associação: Incorreto, pois a descoberta de regras de associação não se aplica à classificação de alunos.
  • E - não supervisionado – predição: Incorreto, pois a predição é um termo abrangente que não define claramente a tarefa de classificação que é supervisionada.

Espero que esta explicação tenha sido útil para entender melhor os conceitos e a questão apresentada.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo