Um pesquisador iniciante em aprendizado de máquina trabalha...
Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é B - hold-out e k-fold. Vamos entender por que essa é a resposta certa e por que as outras alternativas estão incorretas.
Primeiro, vamos revisar os conceitos abordados na questão:
Hold-out é uma técnica de avaliação de modelos em que os dados são divididos em duas partes: uma parte para treinamento e outra para teste. No caso descrito, o pesquisador separou 20% dos dados para avaliação e usou 80% dos dados para treinamento. Isso é típico da técnica de hold-out, que permite uma avaliação simples e rápida do modelo.
k-fold cross-validation (validação cruzada k-fold) é uma técnica mais robusta onde os dados são divididos em k partes (ou "folds"). Em cada uma das k iterações, um fold diferente é usado para avaliação e os restantes k-1 folds são usados para treinamento. No caso descrito na questão, o pesquisador dividiu os dados em 10 partes (10-fold cross-validation), utilizando cada parte como conjunto de avaliação uma vez e as outras 9 partes como conjunto de treinamento. Isso melhora a estimativa da performance do modelo em comparação com o hold-out.
Agora, vamos analisar as alternativas incorretas:
A - estratificação e hold-out: Estratificação é uma técnica usada para garantir que cada conjunto de treinamento e teste tenha a mesma proporção de classes. Não se refere às técnicas de hold-out e k-fold descritas na questão.
C - leave-one-out e estratificação: Leave-one-out é uma forma extrema de validação cruzada onde k é igual ao número de amostras nos dados, ou seja, cada amostra é usada uma vez como conjunto de teste e o restante das amostras são usadas para treinamento. Estratificação, como já mencionado, não se aplica ao contexto dado.
D - leave-one-out e k-fold: Embora k-fold esteja correto para a segunda técnica descrita, leave-one-out não corresponde à primeira técnica, que é um simples hold-out.
E - Monte Carlo e leave-p-out: Monte Carlo é uma técnica de simulação que pode ser usada para validação, mas não foi a técnica descrita na questão. Leave-p-out é outra variação de validação cruzada que não se aplica diretamente aos cenários descritos.
Portanto, a alternativa B descreve corretamente as duas técnicas de avaliação de modelos mencionadas na questão: hold-out e k-fold cross-validation.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
B) Hold-out e k-fold.
Explicação:
1. Hold-out:
- A primeira forma de avaliação, em que o pesquisador separou 20% dos dados para avaliação e treinou o modelo com 80% dos dados, é conhecida como hold-out.
- Essa é uma técnica simples e comumente utilizada para avaliar modelos de aprendizado de máquina.
- No entanto, o hold-out pode apresentar algumas desvantagens, como a alta variância na estimativa do desempenho do modelo, especialmente quando se trabalha com conjuntos de dados pequenos.
2. K-fold:
- A segunda forma de avaliação, em que o pesquisador dividiu o conjunto de dados em 10 partes e, em 10 rodadas, utilizou uma parte diferente para avaliação e as outras para treinamento, é conhecida como k-fold.
- Essa técnica é mais robusta que o hold-out, pois utiliza a média dos resultados obtidos em cada rodada para estimar o desempenho do modelo.
- O k-fold é uma técnica mais eficiente para conjuntos de dados pequenos, pois permite que todos os dados sejam utilizados para treinamento e avaliação.
Outras alternativas:
- Estratificação: A estratificação é uma técnica utilizada para garantir que a divisão dos dados em conjuntos de treinamento e avaliação preserve a distribuição das classes. Essa técnica é especialmente útil quando as classes são desbalanceadas.
- Leave-one-out: O leave-one-out é uma técnica de avaliação em que o modelo é treinado em todas as amostras do conjunto de dados, exceto uma, que é utilizada para avaliação. Essa técnica é computacionalmente mais cara que o k-fold, mas pode fornecer uma estimativa mais precisa do desempenho do modelo.
- Monte Carlo: O método de Monte Carlo é uma técnica de simulação que pode ser utilizada para avaliar modelos de aprendizado de máquina. Essa técnica é especialmente útil quando o modelo é muito complexo ou quando o conjunto de dados é muito grande.
Recomendações:
- A escolha da melhor técnica de avaliação depende do tipo de modelo, do tamanho do conjunto de dados e da natureza do problema que está sendo tratado.
- É importante testar diferentes técnicas de avaliação para encontrar a que melhor se adapta ao seu problema.
1. Hold-out:
- "A validação holdout é a técnica mais simples e comumente utilizada para avaliar modelos de aprendizado de máquina." - Fundamentos de Aprendizado de Máquina: , Aurélien Géron, p. 375.
- "No entanto, a validação holdout pode apresentar algumas desvantagens, como a alta variância na estimativa do desempenho do modelo, especialmente quando se trabalha com conjuntos de dados pequenos." - Aprendizado de Máquina: , Tom Mitchell, p. 242.
2. K-fold:
- "A validação cruzada k-fold é uma técnica mais robusta que a validação holdout, pois utiliza a média dos resultados obtidos em cada rodada para estimar o desempenho do modelo." - Aprendizado de Máquina: Uma Abordagem Prática: , Trevor Hastie, Robert Tibshirani and Jerome Friedman, p. 284.
- "O k-fold é uma técnica mais eficiente para conjuntos de dados pequenos, pois permite que todos os dados sejam utilizados para treinamento e avaliação." - Deep Learning: , Ian Goodfellow, Yoshua Bengio and Aaron Courville, p. 352.
Outras técnicas:
- Estratificação:
- "A estratificação é uma técnica utilizada para garantir que a divisão dos dados em conjuntos de treinamento e avaliação preserve a distribuição das classes." - Aprendizado de Máquina para Processamento de Linguagem Natural: , Yoav Goldberg, p. 212.
- Leave-one-out:
- "O leave-one-out é uma técnica de avaliação em que o modelo é treinado em todas as amostras do conjunto de dados, exceto uma, que é utilizada para avaliação." - Aprendizado de Máquina: , Tom Mitchell, p. 243.
- Monte Carlo:
- "O método de Monte Carlo é uma técnica de simulação que pode ser utilizada para avaliar modelos de aprendizado de máquina." - Probabilidade e Estatística para Ciência da Computação: , Michael Mitzenmacher and Eli Upfal, p. 432.
Recomendações:
- "A escolha da melhor técnica de avaliação depende do tipo de modelo, do tamanho do conjunto de dados e da natureza do problema que está sendo tratado." - Aprendizado de Máquina: , Tom Mitchell, p. 244.
- "É importante testar diferentes técnicas de avaliação para encontrar a que melhor se adapta ao seu problema." - Fundamentos de Aprendizado de Máquina: , Aurélien Géron, p. 376.
Hold-out é um termo genérico para descrever o processo de separar o data set em grupos de treino e teste, geralmente é algo como 80-20.
K-fold é quando ao invés de fazer apenas um hold-out, serão feitos K holds-outs, com partes diferentes do data-set.
Leave-one-out é um k-fold quando k é igual ao número de amostras do data-set.
O objetivo de todas essas técnicas é evitar o vício do modelo em uma amostragem específica, o famoso overfitting. Uma forma intuitiva de observar o overfitting é se você fosse à Índia viajar e fosse enganado por um taxista, e logo, assume que TODOS os taxistas indianos são golpistas. É uma generalização sem base na realidade.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo