Para ilustrar a importância da análise gráfica em análises ...
Para ilustrar a importância da análise gráfica em análises de regressão linear, F. J. Anscombe produziu quatro conjuntos de pares (x, y) a partir das mesmas estatísticas suficientes, como: coeficientes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de observações. Os diagramas de dispersão para as quatro bases de dados, juntamente com a reta da regressão (y = 4 + 0,5 x), encontram-se abaixo.
Com base nesses gráficos, considere as seguintes afirmativas:
I – O gráfico B mostra um valor influente para gerar uma regressão linear.
II – O gráfico C mostra uma possível observação outlier na regressão linear.
III – O gráfico D mostra uma possível observação outlier na regressão linear.
Está correto SOMENTE o que se afirma em
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Solução em vídeo:
https://youtu.be/DpNu2vQZ0Ro
Gabarito: D
A existência de outliers implica, tipicamente, em prejuízos a interpretação dos resultados dos testes estatísticos aplicados às amostras.
No Gráfico C, o outlier é identificado como o ponto separado acima que implica neste prejuízo.
GABARITO D
Outlier é, de forma simples, é o ponto que está mais distante da reta na diagonal. Ou seja, só tem outlier no gráfico C, então III é falsa e II é verdadeira.
A primeira afirmativa pergunta se tem valor influente no gráfico A, que é um ponto que é muito diferente dos outros no gráfico. Não tem. Logo, só a II é verdadeira.
I – Errado: Com base nos dados constrói-se o diagrama de dispersão, que deve exibir uma tendência linear para que se possa usar a regressão linear. Este diagrama permite decidir empiricamente:
• se um relacionamento linear (comportamento tipo reta) entre as variáveis X e Y deve ser assumido
• se o grau de relacionamento linear entre as variáveis é forte ou fraco, conforme o modo como se situam os pontos em redor de uma recta imaginária que passa através do enxame de pontos.
O gráfico B, por sua vez, sugere uma regressão não linear entre as variáveis (pelo comportamento tipo curvo).
II – O gráfico C mostra uma possível observação outlier na regressão linear.
Correto: Outlier, valor aberrante ou valor atípico, é uma observação que apresenta um grande afastamento das demais da série (que está "fora" dela), ou que é inconsistente. A existência de outliers implica, tipicamente, em prejuízos a interpretação dos resultados dos testes estatísticos aplicados às amostras.
No gráfico C, o ponto isolado acima de todos os outros é um outlier.
III - Errado: O ponto isolado mais afastado presente no gráfico D está sobre a reta de regressão linear proposta. Dessa forma ele não é um outlier. Tal ponto foi o único que apresentou abscissa bem superior às dos demais pontos, ele acaba sendo um ponto influente para a regressão; ele vai pesar bastante na determinação da reta.
OBSERVAÇÃO: pontos aberrantes, influentes são pontos de alavanca. Ou seja, tendem a alterar a inclinação da reta de regressão quando ha inserção dos mesmos nos cálculos dos parâmetros. Pode-se dizer que seriam "outliers extremos", ou seja, mais extremos ainda que os outliers.
Gabarito: Letra D
eu acho essa prova de 2018 uma das mais difíceis na história do BB
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo