Um pesquisador iniciante em aprendizado de máquina trabalha...

Próximas questões
Com base no mesmo assunto
Q2383272 Algoritmos e Estrutura de Dados
Um pesquisador iniciante em aprendizado de máquina trabalhava com um modelo de classificação binário com as duas classes equilibradas. Inicialmente, ele fez a avaliação de seu modelo, separando 20% dos dados disponíveis para a avaliação, e o treinou com 80% dos dados, fazendo o processo apenas uma vez. Depois, a pedido de seu chefe, ele trocou a forma de avaliação, separando o conjunto de dados em 10 partes e escolhendo, em 10 rodadas, uma parte diferente para avaliação e as outras para treinamento.
Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

A alternativa correta é B - hold-out e k-fold. Vamos entender por que essa é a resposta certa e por que as outras alternativas estão incorretas.

Primeiro, vamos revisar os conceitos abordados na questão:

Hold-out é uma técnica de avaliação de modelos em que os dados são divididos em duas partes: uma parte para treinamento e outra para teste. No caso descrito, o pesquisador separou 20% dos dados para avaliação e usou 80% dos dados para treinamento. Isso é típico da técnica de hold-out, que permite uma avaliação simples e rápida do modelo.

k-fold cross-validation (validação cruzada k-fold) é uma técnica mais robusta onde os dados são divididos em k partes (ou "folds"). Em cada uma das k iterações, um fold diferente é usado para avaliação e os restantes k-1 folds são usados para treinamento. No caso descrito na questão, o pesquisador dividiu os dados em 10 partes (10-fold cross-validation), utilizando cada parte como conjunto de avaliação uma vez e as outras 9 partes como conjunto de treinamento. Isso melhora a estimativa da performance do modelo em comparação com o hold-out.

Agora, vamos analisar as alternativas incorretas:

A - estratificação e hold-out: Estratificação é uma técnica usada para garantir que cada conjunto de treinamento e teste tenha a mesma proporção de classes. Não se refere às técnicas de hold-out e k-fold descritas na questão.

C - leave-one-out e estratificação: Leave-one-out é uma forma extrema de validação cruzada onde k é igual ao número de amostras nos dados, ou seja, cada amostra é usada uma vez como conjunto de teste e o restante das amostras são usadas para treinamento. Estratificação, como já mencionado, não se aplica ao contexto dado.

D - leave-one-out e k-fold: Embora k-fold esteja correto para a segunda técnica descrita, leave-one-out não corresponde à primeira técnica, que é um simples hold-out.

E - Monte Carlo e leave-p-out: Monte Carlo é uma técnica de simulação que pode ser usada para validação, mas não foi a técnica descrita na questão. Leave-p-out é outra variação de validação cruzada que não se aplica diretamente aos cenários descritos.

Portanto, a alternativa B descreve corretamente as duas técnicas de avaliação de modelos mencionadas na questão: hold-out e k-fold cross-validation.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

B) Hold-out e k-fold.

Explicação:

1. Hold-out:

  • A primeira forma de avaliação, em que o pesquisador separou 20% dos dados para avaliação e treinou o modelo com 80% dos dados, é conhecida como hold-out.
  • Essa é uma técnica simples e comumente utilizada para avaliar modelos de aprendizado de máquina.
  • No entanto, o hold-out pode apresentar algumas desvantagens, como a alta variância na estimativa do desempenho do modelo, especialmente quando se trabalha com conjuntos de dados pequenos.

2. K-fold:

  • A segunda forma de avaliação, em que o pesquisador dividiu o conjunto de dados em 10 partes e, em 10 rodadas, utilizou uma parte diferente para avaliação e as outras para treinamento, é conhecida como k-fold.
  • Essa técnica é mais robusta que o hold-out, pois utiliza a média dos resultados obtidos em cada rodada para estimar o desempenho do modelo.
  • O k-fold é uma técnica mais eficiente para conjuntos de dados pequenos, pois permite que todos os dados sejam utilizados para treinamento e avaliação.

Outras alternativas:

  • Estratificação: A estratificação é uma técnica utilizada para garantir que a divisão dos dados em conjuntos de treinamento e avaliação preserve a distribuição das classes. Essa técnica é especialmente útil quando as classes são desbalanceadas.
  • Leave-one-out: O leave-one-out é uma técnica de avaliação em que o modelo é treinado em todas as amostras do conjunto de dados, exceto uma, que é utilizada para avaliação. Essa técnica é computacionalmente mais cara que o k-fold, mas pode fornecer uma estimativa mais precisa do desempenho do modelo.
  • Monte Carlo: O método de Monte Carlo é uma técnica de simulação que pode ser utilizada para avaliar modelos de aprendizado de máquina. Essa técnica é especialmente útil quando o modelo é muito complexo ou quando o conjunto de dados é muito grande.

Recomendações:

  • A escolha da melhor técnica de avaliação depende do tipo de modelo, do tamanho do conjunto de dados e da natureza do problema que está sendo tratado.
  • É importante testar diferentes técnicas de avaliação para encontrar a que melhor se adapta ao seu problema.

1. Hold-out:

  • "A validação holdout é a técnica mais simples e comumente utilizada para avaliar modelos de aprendizado de máquina." - Fundamentos de Aprendizado de Máquina: , Aurélien Géron, p. 375.
  • "No entanto, a validação holdout pode apresentar algumas desvantagens, como a alta variância na estimativa do desempenho do modelo, especialmente quando se trabalha com conjuntos de dados pequenos." - Aprendizado de Máquina: , Tom Mitchell, p. 242.

2. K-fold:

  • "A validação cruzada k-fold é uma técnica mais robusta que a validação holdout, pois utiliza a média dos resultados obtidos em cada rodada para estimar o desempenho do modelo." - Aprendizado de Máquina: Uma Abordagem Prática: , Trevor Hastie, Robert Tibshirani and Jerome Friedman, p. 284.
  • "O k-fold é uma técnica mais eficiente para conjuntos de dados pequenos, pois permite que todos os dados sejam utilizados para treinamento e avaliação." - Deep Learning: , Ian Goodfellow, Yoshua Bengio and Aaron Courville, p. 352.

Outras técnicas:

  • Estratificação:
  • "A estratificação é uma técnica utilizada para garantir que a divisão dos dados em conjuntos de treinamento e avaliação preserve a distribuição das classes." - Aprendizado de Máquina para Processamento de Linguagem Natural: , Yoav Goldberg, p. 212.
  • Leave-one-out:
  • "O leave-one-out é uma técnica de avaliação em que o modelo é treinado em todas as amostras do conjunto de dados, exceto uma, que é utilizada para avaliação." - Aprendizado de Máquina: , Tom Mitchell, p. 243.
  • Monte Carlo:
  • "O método de Monte Carlo é uma técnica de simulação que pode ser utilizada para avaliar modelos de aprendizado de máquina." - Probabilidade e Estatística para Ciência da Computação: , Michael Mitzenmacher and Eli Upfal, p. 432.

Recomendações:

  • "A escolha da melhor técnica de avaliação depende do tipo de modelo, do tamanho do conjunto de dados e da natureza do problema que está sendo tratado." - Aprendizado de Máquina: , Tom Mitchell, p. 244.
  • "É importante testar diferentes técnicas de avaliação para encontrar a que melhor se adapta ao seu problema." - Fundamentos de Aprendizado de Máquina: , Aurélien Géron, p. 376.

Hold-out é um termo genérico para descrever o processo de separar o data set em grupos de treino e teste, geralmente é algo como 80-20.

K-fold é quando ao invés de fazer apenas um hold-out, serão feitos K holds-outs, com partes diferentes do data-set.

Leave-one-out é um k-fold quando k é igual ao número de amostras do data-set.

O objetivo de todas essas técnicas é evitar o vício do modelo em uma amostragem específica, o famoso overfitting. Uma forma intuitiva de observar o overfitting é se você fosse à Índia viajar e fosse enganado por um taxista, e logo, assume que TODOS os taxistas indianos são golpistas. É uma generalização sem base na realidade.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo