Em machine learning, a categoria de aprendizagem por reforço...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Correta: Alternativa A
A aprendizagem por reforço é uma categoria de machine learning onde um agente aprende a tomar decisões através das recompensas ou penalidades que recebe como resultado de suas ações em um ambiente. Este processo é análogo à maneira como um ser humano ou animal pode aprender a partir das consequências de suas ações. Diferentemente de outros tipos de aprendizado de máquina, como a aprendizagem supervisionada ou a não-supervisionada, a aprendizagem por reforço não depende de um conjunto de dados com exemplos corretos previamente etiquetados, e sim do feedback contínuo sobre o desempenho das ações escolhidas pelo agente.
Na opção A, a referência a um software interagindo com um ambiente dinâmico como, por exemplo, veículos autônomos, é uma aplicação típica de aprendizagem por reforço. Os veículos autônomos devem constantemente tomar decisões (como acelerar, frear, mudar de faixa) e essas decisões são refinadas com base em recompensas (chegar ao destino de forma eficiente e segura) e penalidades (evitar acidentes ou violações de trânsito). Portanto, a Alternativa A está correta porque descreve adequadamente a natureza interativa e adaptativa da aprendizagem por reforço em ambientes complexos e mutáveis.
Quanto às demais alternativas: a B descreve a aprendizagem não-supervisionada, onde o algoritmo tenta encontrar padrões nos dados sem etiquetas prévias; a C é muito genérica e poderia aplicar-se a diferentes tipos de aprendizado de máquina; a D refere-se mais diretamente à aprendizagem supervisionada, onde um modelo é treinado com entradas e saídas predefinidas; e a E também descreve a aprendizagem supervisionada, onde um "orientador" fornece os exemplos de entradas e saídas que o modelo deve aprender.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gab: A
Errei e busquei info...
Eis alguns exemplos bem conhecidos de aplicações de machine learning, dos quais você já deve ter ouvido falar:
Os carros autônomos super esperados do Google? A essência do machine learning;
Ofertas recomendadas como as da Amazon e da Netflix?
Aplicações de machine learning para o dia-a-dia;
Saber o que seus clientes estão falando de você no Twitter?
Machine learning combinado com criação de regras linguísticas;
Detecção de fraudes? Um dos usos mais óbvios e importantes de machine learning no mundo de hoje.
Fonte: https://www.sas.com/pt_br/insights/analytics/machine-learning.html
Acho que seria mais ou menos isso. Se eu estiver equivocado por favor me corrijam.
a) aprendizagem por reforço (gabarito)
b) aprendizagem não supervisionada
c) aprendizagem supervisionada (regressão)
d) aprendizagem supervisionada (classificação)
e) aprendizagem supervisionada (regressão)
"Aprendizado por reforço é um ramo estudado em estatística, psicologia,neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina e inteligência artificial, e é um método de programação de agentes através do oferecimento de recompensas e punições, sem a necessidade de especificar como uma tarefa deve ser realizada. É entendido como o problema encontrado por um agente que deve aprender como se comportar em um ambiente dinâmico através de interações do tipo “tentativa e erro”. A abordagem que é utilizada nesse trabalho é feita usando-se técnicas estatísticas e métodos de programação dinâmica, buscando estimar qual a vantagem em se tomar determinadas ações em diferentes estados do ambiente (...)"
link da Fonte:
https://www.maxwell.vrac.puc-rio.br/19637/19637_4.PDF
"O aprendizado de máquina (em inglês, machine learning) é um método de que automatiza a construção de modelos analíticos. É um ramo da baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana."
Machine Learning da maneira mais básica é a prática de usar algoritmos para coletar dados, aprender com eles, e então fazer uma determinação ou predição sobre alguma coisa no mundo. Então ao invés de implementar as rotinas de software na mão, com um set específico de instruções para completar uma tarefa em particular, a máquina é “treinada” usando uma quantidade grande de dados e algoritmos que dão e ela a habilidade de aprender como executar a tarefa.
GABARITO: LETRA "A"
Fonte: https://medium.com
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo