Em machine learning, a categoria de aprendizagem por reforço...

Próximas questões
Com base no mesmo assunto
Q949804 Banco de Dados
Em machine learning, a categoria de aprendizagem por reforço identifica as tarefas em que
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Correta: Alternativa A

A aprendizagem por reforço é uma categoria de machine learning onde um agente aprende a tomar decisões através das recompensas ou penalidades que recebe como resultado de suas ações em um ambiente. Este processo é análogo à maneira como um ser humano ou animal pode aprender a partir das consequências de suas ações. Diferentemente de outros tipos de aprendizado de máquina, como a aprendizagem supervisionada ou a não-supervisionada, a aprendizagem por reforço não depende de um conjunto de dados com exemplos corretos previamente etiquetados, e sim do feedback contínuo sobre o desempenho das ações escolhidas pelo agente.

Na opção A, a referência a um software interagindo com um ambiente dinâmico como, por exemplo, veículos autônomos, é uma aplicação típica de aprendizagem por reforço. Os veículos autônomos devem constantemente tomar decisões (como acelerar, frear, mudar de faixa) e essas decisões são refinadas com base em recompensas (chegar ao destino de forma eficiente e segura) e penalidades (evitar acidentes ou violações de trânsito). Portanto, a Alternativa A está correta porque descreve adequadamente a natureza interativa e adaptativa da aprendizagem por reforço em ambientes complexos e mutáveis.

Quanto às demais alternativas: a B descreve a aprendizagem não-supervisionada, onde o algoritmo tenta encontrar padrões nos dados sem etiquetas prévias; a C é muito genérica e poderia aplicar-se a diferentes tipos de aprendizado de máquina; a D refere-se mais diretamente à aprendizagem supervisionada, onde um modelo é treinado com entradas e saídas predefinidas; e a E também descreve a aprendizagem supervisionada, onde um "orientador" fornece os exemplos de entradas e saídas que o modelo deve aprender.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Gab: A


Errei e busquei info...


Eis alguns exemplos bem conhecidos de aplicações de machine learning, dos quais você já deve ter ouvido falar:


Os carros autônomos super esperados do Google? A essência do machine learning;



Ofertas recomendadas como as da Amazon e da Netflix?

Aplicações de machine learning para o dia-a-dia;

Saber o que seus clientes estão falando de você no Twitter?

Machine learning combinado com criação de regras linguísticas;

Detecção de fraudes? Um dos usos mais óbvios e importantes de machine learning no mundo de hoje.




Fonte: https://www.sas.com/pt_br/insights/analytics/machine-learning.html

Acho que seria mais ou menos isso. Se eu estiver equivocado por favor me corrijam.


a) aprendizagem por reforço (gabarito)

b) aprendizagem não supervisionada

c) aprendizagem supervisionada (regressão)

d) aprendizagem supervisionada (classificação)

e) aprendizagem supervisionada (regressão)




"Aprendizado por reforço é um ramo estudado em estatística, psicologia,neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina e inteligência artificial, e é um método de programação de agentes através do oferecimento de recompensas e punições, sem a necessidade de especificar como uma tarefa deve ser realizada. É entendido como o problema encontrado por um agente que deve aprender como se comportar em um ambiente dinâmico através de interações do tipo “tentativa e erro”. A abordagem que é utilizada nesse trabalho é feita usando-se técnicas estatísticas e métodos de programação dinâmica, buscando estimar qual a vantagem em se tomar determinadas ações em diferentes estados do ambiente (...)"


link da Fonte:

https://www.maxwell.vrac.puc-rio.br/19637/19637_4.PDF

"O aprendizado de máquina (em inglês, machine learning) é um método de  que automatiza a construção de modelos analíticos. É um ramo da  baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana."

Machine Learning da maneira mais básica é a prática de usar algoritmos para coletar dados, aprender com eles, e então fazer uma determinação ou predição sobre alguma coisa no mundo. Então ao invés de implementar as rotinas de software na mão, com um set específico de instruções para completar uma tarefa em particular, a máquina é “treinada” usando uma quantidade grande de dados e algoritmos que dão e ela a habilidade de aprender como executar a tarefa.

 

GABARITO: LETRA "A"

Fonte: https://medium.com

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo