Acerca de Big Data, business intelligence e machine learning...
Acerca de Big Data, business intelligence e machine learning julgue o item a seguir.
Os métodos de aprendizado supervisionado são capazes de
identificar padrões em um conjunto de dados sem a
necessidade de receberem dados de treinamento rotulados.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E - Errado
Para compreender a questão, é fundamental entender o que é o aprendizado supervisionado, um dos ramos do machine learning. No aprendizado supervisionado, um algoritmo é treinado em um conjunto de dados que já contém as respostas desejadas, chamadas de labels ou rótulos. Esse tipo de aprendizado é como um processo de aprendizagem onde o modelo, como um aluno, é guiado por um professor que fornece as respostas corretas durante o treinamento.
O treinamento envolve a apresentação de exemplos de dados que são rotulados de forma a permitir que o algoritmo faça a associação entre os dados de entrada e a saída desejada. Com o tempo, o modelo ajusta seus parâmetros internos para ser capaz de fazer previsões ou classificações precisas quando apresentado a novos dados, mas sempre dentro do contexto que foi treinado.
Dessa forma, a afirmação de que os métodos de aprendizado supervisionado são capazes de identificar padrões em um conjunto de dados sem a necessidade de receberem dados de treinamento rotulados é incorreta. Na verdade, o que define o aprendizado supervisionado é exatamente a necessidade de tais dados rotulados. Sem eles, o algoritmo não teria a "supervisão" que o nome sugere.
O contraste pode ser feito com o aprendizado não supervisionado, onde o algoritmo procura identificar padrões e estruturas em dados que não estão rotulados. A confusão entre os dois tipos pode ser uma armadilha comum em questões de concurso, então é crucial estar claro sobre as diferenças entre os métodos de aprendizado.
Portanto, a alternativa correta é E - Errado, já que, ao contrário do que sugere o enunciado, os métodos de aprendizado supervisionado requerem, sim, dados de treinamento rotulados.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gab E
A questão inverteu os conceitos.
No APRENDIZADO SUPERVISIONADO há a interação humana, por meio do fornecimento de categorias de dados previamente definidas, de modo que o algoritmo irá classificar os dados novos inseridos de acordo com as classes de dados históricos fornecidas anteriormente.
Por sua vez, no APRENDIZADO NÃO SUPERVISIONADO, não há a supervisão ou interação humana, de modo que não há a inclusão de classes de dados previamente. Com isso, o algoritmo irá apenas analisar os dados novos inseridos, sendo realizada, por si só, a categorização dos dados, sem nenhuma interferência humana ao longo do processo.
Mais uma:
(CESPE - 2018 - IPHAN) Na busca de padrões no data mining, é comum a utilização do aprendizado não supervisionado, em que um agente externo apresenta ao algoritmo alguns conjuntos de padrões de entrada e seus correspondentes padrões de saída, comparando-se a resposta fornecida pelo algoritmo com a resposta esperada. (errado)
um bizu;
-se começar com A é não supervisionado
-se não começar com A é supervisionado
Tipos de técnica (Método de classificação para mineração de dados)
- Associação
➟ Não supervisionado
➟ Identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros.
Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos a servidores de dados também estão envolvidos em processos ligados a roubo de dados sigilosos
Análise de agrupamentos (Clusterização ou análise de aglomerações ou análise de partições)
➟ Não supervisionado
➟ Busca classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters
- Padrões sequenciais ou regressão
➟ Supervisionado
➟ Identificar sequências que ocorrem em determinados registros. Por exemplo: 32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica ajuízam uma causa contra o INSS solicitando ressarcimento monetário
- Classificação
➟ Supervisionado
➟ As categorias são definidas antes da análise dos dados.
- Classificação envolve descrever os dados em função de algumas classes pré determinadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado.
tmj
1. Aprendizado supervisionado
No aprendizado de máquina supervisionado, os algoritmos são treinados a partir de exemplos rotulados.
O programador humano insere dados mostrando o que é “certo” e o que é “errado”.
O sistema, então, aprende a fazer comparações e a resposta que ele for dar vai ser com base nos exemplos que ele recebeu.
2. Aprendizado não-supervisionado
Já no aprendizado não supervisionado, o sistema age totalmente por si só. A ele não são colocados exemplos rotulados para que ele possa fazer comparações.
O “certo” e o “errado” não são informados ao sistema, cabendo a ele fazer a identificação de padrões e características em comum dos dados que são inseridos.
3. Aprendizado semi-supervisionado
Nesse tipo de machine learning, o sistema consegue lidar com dados rotulados ou não-rotulados. Geralmente, essa modalidade é empregada quando o custo para rotular os dados é muito elevado.
4. Aprendizado por reforço
No aprendizado por reforço, utiliza-se a lógica da “tentativa e erro”. Dessa forma, o sistema aprende quais ações são as “melhores” a serem tomadas.
Ou seja, nessa modalidade, o ensinamento da máquina é feito com base na experiência. Ela, então, aprende com os próprios erros.
Os métodos de aprendizado supervisionado, como regressão linear, árvores de decisão e redes neurais, dependem da disponibilidade de dados rotulados para aprender e fazer previsões precisas. Esses algoritmos aprendem a relação entre as entradas e as saídas desejadas por meio dos exemplos fornecidos durante o treinamento. Sem os rótulos nos dados de treinamento, o modelo não possui referência para entender qual é a resposta correta para uma determinada entrada, tornando impossível identificar padrões ou fazer previsões precisas.
No APRENDIZADO SUPERVISIONADO há a interação humana, por meio do fornecimento de categorias de dados previamente definidas, de modo que o algoritmo irá classificar os dados novos inseridos de acordo com as classes de dados históricos fornecidas anteriormente.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo