Questões de Concurso
Sobre modelos lineares em estatística
Foram encontradas 535 questões
Um analista do Ministério Público supõe que existe uma relação linear entre duas variáveis não negativas: o número de denúncias de infrações ambientas (y) e o acesso à informação e comunicação (x) de diferentes regiões administrativas. Para verificar sua hipótese, realizou um estudo e obteve o seguinte diagrama de dispersão:
Considere que r seja o coeficiente de correlação linear amostral entre as variáveis e que b seja o coeficiente de inclinação no ajuste da reta de regressão y = a + bx aos dados observados. Com base nessas informações, é correto afirmar que:
Y = αX + β + e
pelo método de mínimos quadrados usual e mostrou as seguintes estimativas dos coeficientes: α = 3,4 e b = 0,5; além disso, obteve-se um coeficiente de correlação amostral igual a 0,9.
Com base nesses dados, avalie se as afirmativas a seguir estão corretas.
I. A porcentagem da variação total dos dados que é explicada pela regressão é menor do que 60%. II. A reta de regressão obtida ajusta bem o modelo. III. O intercepto α = 3,4 mostra que a valor grandes de x correspondem valores grandes de y.
Está correto o que se afirma em
Tendo em vista a interpretação de resultados de modelos de regressão linear múltipla, assinale a alternativa correta.
Considere que:
■ As estimativas pelo método de mínimos quadrados ordinários para o coeficiente linear α é igual a 1,5 e, para o coeficiente angular β é de 2,0 e que a variável x não está correlacionada com o erro ε. ■ Os resíduos das amostras envolvidas são independentes e identicamente distribuídos, com distribuição normal, média igual a 0,0 e variância com valor constante. ■ O valor assumido para x é igual a 3,0.
Diante do exposto, assinale a alternativa que traz o valor predito para y.
Analise a seguinte situação, observando os dados da do quadro de ANOVA a seguir.
Um criador separou seu rebanho em três grupos, cada um com espécies diferentes: X, Y e Z. Em dado momento, ele resolveu testar se as espécies diferem de peso, ou seja, ele pretende descobrir se há mais variação de peso entre os grupos de cada espécie ou dentro de cada grupo.
Assim, ele tem as seguintes hipóteses estatísticas:
■ H0 Todas as espécies têm o mesmo peso, ou seja, o criador tem menos variação entre os grupos do que dentro dos grupos. ■ H1 As espécies diferem em peso, ou seja, o criador observa mais variação entre os grupos do que dentro dos grupos.
Considerando que o criador adota o seguinte critério de decisão:
■ Se o Fcalculado for menor ou igual ao Fcrítico para α = 0,05, aceita-se a hipótese nula H0. ■ Se o Fcalculado for maior que o Fcrítico para α = 0,05, aceita-se a hipótese alternativa H1.
Assinale a alternativa correta.
Com base nestes pressupostos, analise as afirmativas abaixo com relação ao conjunto de dados X.
1. O pressuposto da homocedasticidade é satisfeito quando a variação em torno da reta de regressão aumenta conforme variam os valores de X. 2. O pressuposto da independência de erros é satisfeito quando os erros em torno da reta de regressão são constantes para cada valor de X. 3. O pressuposto da normalidade de erros é satisfeito quando os erros em torno da reta de regressão são distribuídos de forma normal para cada valor de X.
Assinale a alternativa que indica todas as afirmativas corretas.
Assinale a alternativa que contém a expressão estatística utilizada como base para o gráfico de controle T2 de Hotelling.
Identifique abaixo as afirmativas verdadeiras ( V ) e as falsas ( F ) a respeito do coeficiente de determinação R2.
( ) O R2 está sempre entre os valores 0 e 1. ( ) O R2 pode atingir valores de –1 a 1, dependendo da força da correlação entre as variáveis. ( ) Se aumentarmos o número de variáveis independentes, o coeficiente R2 pode aumentar ou permanecer igual, mas nunca decrescer. ( ) O R2 indica a porcentagem em que a variação explicada pela regressão representa da variação total.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
( ) São modelos caracterizados por conter efeitos aleatórios e efeitos fixos. ( ) São usados para conjuntos de dados com estrutura multinível, ou seja, para análise de dados com estrutura hierárquica. ( ) Podem existir em casos onde existem somente efeitos aleatórios nas variáveis preditoras do modelo.
Assinale a alternativa que indica a sequência correta, de cima para baixo
Assinale a alternativa que indica o valor mais próximo do Fcalculado.
Wi = 0,5 + 0,1*Ei + 0,2*Di + ui,
em que wi é o logaritmo neperiano do salário, Ei é o logaritmo neperiano dos anos de estudo e Di é uma variável binária igual a 1 se homem e a 0 se mulher.
Considere que todas as estimativas são estatisticamente significativas a 1%.
A partir das estimativas acima, é possível concluir que, em média,
Y = XB + u,
sendo Y um vetor nx1, X uma matriz nxk, B um vetor kx1 e u um vetor nx1. Y é a variável dependente, X representa um conjunto de regressores, B os parâmetros populacionais do modelo e u o termo aleatório.
As hipóteses a seguir são necessárias para que o estimador de MQO de B seja não viesado, à exceção de uma. Assinale-a.
Considere o modelo de regressão linear simples:
yi = a + bxi + ui,
em que y é a variável dependente, x é a variável explicativa, a é ointercepto, b é o coeficiente de inclinação e u, o termo aleatóriodo modelo.
A partir de uma amostra aleatória, obtém-se as seguintesinformações:
Assim, os estimadores dos parâmetros α e b que minimizam asoma dos quadrados dos resíduos são, respectivamente, iguais a
I. Usar a equação de regressão para predições, mesmo que o gráfico da reta de regressão no diagrama de dispersão não indicar que a reta de regressão se ajusta aos dados de maneira razoavelmente boa. II. Usar a equação de regressão para predições apenas se o coeficiente de correlação linear r indicar que há uma correlação linear entre as duas variáveis. III. Usar a equação de regressão para predições apenas se os dados não forem muito além do alcance dos dados amostrais disponíveis.
Está CORRETO apenas o que se afirma em:
1.A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação existente entre duas variáveis, a partir de n observações dessas variáveis. 2.O modelo probabilístico, empregado na análise de regressão, é composto por três partes, uma que diz respeito às variáveis, outra aos parâmetros, e outra ao erro de estimativa. 3.A finalidade de uma equação de regressão seria estimar valores de uma variável, com base em valores conhecidos da outra.
Assinale a alternativa que indica todas as afirmativas
corretas.