Para ilustrar a importância da análise gráfica em análises ...

Próximas questões
Com base no mesmo assunto
Q892461 Estatística

Para ilustrar a importância da análise gráfica em análises de regressão linear, F. J. Anscombe produziu quatro conjuntos de pares (x, y) a partir das mesmas estatísticas suficientes, como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de observações. Os diagramas de dispersão para as quatro bases de dados, juntamente com a reta da regressão (y = 4 + 0,5 x), encontram-se abaixo.


Imagem associada para resolução da questão


Com base nesses gráficos, considere as seguintes afirmativas:


I – O gráfico B mostra um valor influente para gerar uma regressão linear.

II – O gráfico C mostra uma possível observação outlier na regressão linear.

III – O gráfico D mostra uma possível observação outlier na regressão linear.


Está correto SOMENTE o que se afirma em

Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Solução em vídeo:

https://youtu.be/DpNu2vQZ0Ro

Gabarito: D

A existência de outliers implica, tipicamente, em prejuízos a interpretação dos resultados dos testes estatísticos aplicados às amostras.

No Gráfico C, o outlier é identificado como o ponto separado acima que implica neste prejuízo.

GABARITO D

Outlier é, de forma simples, é o ponto que está mais distante da reta na diagonal. Ou seja, só tem outlier no gráfico C, então III é falsa e II é verdadeira.

A primeira afirmativa pergunta se tem valor influente no gráfico A, que é um ponto que é muito diferente dos outros no gráfico. Não tem. Logo, só a II é verdadeira.

Errado: Com base nos dados constrói-se o diagrama de dispersão, que deve exibir uma tendência linear para que se possa usar a regressão linear. Este diagrama permite decidir empiricamente:

• se um relacionamento linear (comportamento tipo reta) entre as variáveis X e Y deve ser assumido

• se o grau de relacionamento linear entre as variáveis é forte ou fraco, conforme o modo como se situam os pontos em redor de uma recta imaginária que passa através do enxame de pontos.

O gráfico B, por sua vez, sugere uma regressão não linear entre as variáveis (pelo comportamento tipo curvo).

II – O gráfico C mostra uma possível observação outlier na regressão linear.

Correto: Outliervalor aberrante ou valor atípico, é uma observação que apresenta um grande afastamento das demais da série (que está "fora" dela), ou que é inconsistente. A existência de outliers implica, tipicamente, em prejuízos a interpretação dos resultados dos testes estatísticos aplicados às amostras.

No gráfico C, o ponto isolado acima de todos os outros é um outlier.

III - Errado: O ponto isolado mais afastado presente no gráfico D está sobre a reta de regressão linear proposta. Dessa forma ele não é um outlier. Tal ponto foi o único que apresentou abscissa bem superior às dos demais pontos, ele acaba sendo um ponto influente para a regressão; ele vai pesar bastante na determinação da reta.

OBSERVAÇÃO: pontos aberrantes, influentes são pontos de alavanca. Ou seja, tendem a alterar a inclinação da reta de regressão quando ha inserção dos mesmos nos cálculos dos parâmetros. Pode-se dizer que seriam "outliers extremos", ou seja, mais extremos ainda que os outliers.

Gabarito: Letra D

eu acho essa prova de 2018 uma das mais difíceis na história do BB

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo