Um analista recebeu uma enorme quantidade de dados referente...
Um analista recebeu uma enorme quantidade de dados referentes a alunos de uma universidade. Ele precisa criar um software que preveja quais alunos poderiam abandonar o curso, para que medidas dentro da universidade possam ser tomadas, de forma preventiva. Nos dados de alunos já conhecidos, têm-se a idade, o bairro de residência, a cidade natal, o salário médio da família, a escolaridade dos pais, a porcentagem concluída do curso, o índice de rendimento acadêmico e a situação (matriculado, trancado, abandono). Para criar esse software, o analista precisará usar algoritmos de Data Mining, mais especificamente aprendizado de máquina _____________________ para a tarefa de _____________________.
Assinale a alternativa que preenche corretamente as lacunas acima, na ordem em que aparecem no texto.
- Gabarito Comentado (1)
- Aulas (1)
- Comentários (0)
- Estatísticas
- Cadernos
- Criar anotações
- Notificar Erro
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: B - supervisionado – classificação
Para resolver essa questão, é essencial que você compreenda os conceitos de aprendizado de máquina e as diferentes abordagens que ele pode utilizar, tais como aprendizado supervisionado e não supervisionado. Vamos detalhar esses conceitos para facilitar a compreensão.
Aprendizado supervisionado: Nesta abordagem, o algoritmo é treinado em um conjunto de dados rotulados, o que significa que cada exemplo de treinamento é composto de uma entrada e uma saída esperada. O objetivo é fazer o algoritmo aprender a mapear entradas para saídas corretas. Existem principalmente duas tarefas no aprendizado supervisionado:
- Classificação: Aqui, o algoritmo aprende a categorizar os dados em classes distintas. No caso apresentado pela questão, a situação do aluno (matriculado, trancado, abandono) é uma classificação.
- Regressão: Neste caso, o algoritmo aprende a prever valores contínuos. Este não é o foco da questão, pois não estamos prevendo um valor contínuo, mas sim categorizando.
Aprendizado não supervisionado: Aqui, o algoritmo trabalha com dados não rotulados e tenta encontrar padrões ou estruturas dentro do conjunto de dados. As principais tarefas incluem:
- Agrupamento (Clustering): O algoritmo divide os dados em grupos com base em alguma similaridade. Não se aplica à nossa questão, pois não estamos agrupando alunos, mas classificando.
- Descoberta de regras de associação: Encontra relações entre variáveis em grandes bases de dados. Também não é o foco da questão.
Predição: Esse termo é mais geral e pode se referir tanto a classificação quanto a regressão, dependendo do contexto. Na questão, queremos categorizar os alunos, então o termo mais específico é classificação.
Analisando as alternativas:
- A - não supervisionado – regressão: Incorreto, pois a regressão é uma tarefa de aprendizado supervisionado, não de aprendizado não supervisionado.
- B - supervisionado – classificação: Correto, pois a tarefa de prever se um aluno irá abandonar o curso é uma tarefa de classificação com aprendizado supervisionado.
- C - supervisionado – agrupamento: Incorreto, pois o agrupamento é uma técnica de aprendizado não supervisionado.
- D - não supervisionado – descoberta de regras de associação: Incorreto, pois a descoberta de regras de associação não se aplica à classificação de alunos.
- E - não supervisionado – predição: Incorreto, pois a predição é um termo abrangente que não define claramente a tarefa de classificação que é supervisionada.
Espero que esta explicação tenha sido útil para entender melhor os conceitos e a questão apresentada.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo