Em uma nota técnica do Ipea sobre emprego público nos
governos subnacionais brasileiros, no ano de 2016, aparece menção sobre o fato de as bases utilizadas possuirem outliers, ou valores atípicos.
A construção de um modelo preditivo a partir dos dados dessas bases, usando árvores aleatórias, Random
Forests,

Question

Em uma nota técnica do Ipea sobre emprego público nos
governos subnacionais brasileiros, no ano de 2016, aparece menção sobre o fato de as bases utilizadas possuirem outliers, ou valores atípicos.
A construção de um modelo preditivo a partir dos dados dessas bases, usando árvores aleatórias, Random
Forests,   Alternativa A: apresentaria uma redução de variância.  Ou Alternativa B: seria inadequado, devido à sensibilidade a outliers de
Random Forests. Ou Alternativa C: teria uma tendência a overfitting. Ou Alternativa D: teria propensão a underfitting. Ou Alternativa E: teria dependência de linearidade nos dados.

Qconcursos · Accepted Answer

Alternativa [A] apresentaria uma redução de variância.  ```html
A alternativa A é a correta.

O tema da questão aborda o uso de modelos preditivos, especificamente o Random Forest, que é uma técnica de aprendizagem de máquina baseada em árvores de decisão. Um dos pontos fortes do Random Forest é a sua capacidade de reduzir a variância de um modelo, o que é conseguido ao combinar previsões de múltiplas árvores de decisão.

Justificativa da alternativa correta: A alternativa A apresentaria uma redução de variância. Random Forests são projetados para minimizar a variância através do uso de múltiplas árvores de decisão. Ao agregar as previsões dessas árvores, o algoritmo é capaz de suavizar e reduzir a variância, tornando o modelo mais robusto e eficaz na generalização de dados novos, mesmo quando esses dados apresentam valores atípicos ou outliers.

Análise das alternativas incorretas:

B - Seria inadequado, devido à sensibilidade a outliers de Random Forests. Esta afirmação é incorreta. Na verdade, Random Forests são menos sensíveis a outliers em comparação a algoritmos de árvore de decisão únicos, já que os efeitos de outliers podem ser diluídos ao agregar as previsões de muitas árvores.

C - Teria uma tendência a overfitting. Embora overfitting possa ocorrer em alguns modelos, Random Forest tende a ser menos propenso a overfitting devido à combinação de muitos modelos independentes, que ajuda a generalizar melhor para novos dados.

D - Teria propensão a underfitting. Underfitting ocorre quando um modelo é muito simples e não consegue capturar as tendências dos dados. Random Forest, ao utilizar múltiplas árvores de decisão, é geralmente capaz de capturar essas tendências de forma eficaz, reduzindo a chance de underfitting.

E - Teria dependência de linearidade nos dados. Esta é uma declaração incorreta, pois Random Forest não pressupõe linearidade nos dados. Na verdade, uma das vantagens deste método é sua flexibilidade para capturar relações não-lineares nos dados.

Gostou do comentário? Deixe sua avaliação aqui embaixo!
```

SEJA VITALÍCIO

SEJA VITALÍCIO

Em uma nota técnica do Ipea sobre emprego público nos gover...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas