Questões de Concurso
Sobre modelos lineares em estatística
Foram encontradas 535 questões
Quando após o ajuste de um modelo linear simples, verifica-se que o ajuste é perfeito, ou seja, todos os resíduos são 0 (zero), isso implica que o coeficiente de determinação R2:
O gráfico a seguir ilustra os resíduos obtidos após o ajuste de um modelo de regressão linear simples versus o valor ajustado desse mesmo modelo. O que se pode afirmar sobre a variância dos dados?
Gráfico dos Resíduos
Analisando o gráfico a seguir e supondo que a variável X tem poder de explicação sobre a variável Y, qual modelo abaixo é o mais adequado para representar essa relação, em que ∈ é um ruído branco?
Seja o modelo de regressão linear yi = β0 + β1x1 + β2x2 + β3x3 + εi com i = 1, 2, ..... , n e onde yi é a variável dependente (resposta), xi com i = 1, 2 e 3 são as variáveis explicativas (independentes) e εi o erro inerente à variável resposta . Então, é correto afirmar que
O gráfico de resíduos a seguir foi obtido em uma sequência temporal.
Esse comportamento dos resíduos indica
Considere o conjunto de dados e a informação a seguir:
Deseja-se encontrar um modelo de regressão polinomial de 2º grau Y = a0 + a1 X + a2 X2 que melhor se encaixe nesse conjunto de dados.
Estimando-se pelo método dos mínimos quadrados, os valores de a0, a1 e a2 serão dados, respectivamente, por
Entre exemplos de métricas de avaliação utilizadas para modelos de classificação binária, é correto citar
• a taxa de precisão (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos positivos);
• a taxa de sensibilidade (razão entre verdadeiros positivos e o total dos verdadeiros positivos e falsos negativos, também conhecida por recall); e
• o escore F1 (F1-score, também chamado de F-measure), que relaciona as taxas de precisão e de sensibilidade.
Suponha a existência de um modelo de classificação binária cuja taxa de precisão é de 90,00% e cuja taxa de sensibilidade é de 75,00%. Utilize aproximação de duas casas decimais.
O escore F1 referente a esse modelo é
Um economista tentando estimar os preços dos apartamentos disponíveis para venda definiu o seguinte modelo: lnyi=β0+β1 lnxi+β2 Di+ui , em que Yi representa o preço dos apartamentos em reais, xi é o tamanho do imóvel, medido em m2 , Di é uma variável dummy indicando se existe um parque ou praça pública, no raio de 200 metros de distância do imóvel, e ui é o termo de erro aleatório. O modelo foi estimado pelo método dos mínimos quadrados ordinários, com uma amostra de tamanho n = 732 e o resultado da estimação está descrito, a seguir.
Parâmetro |
Coeficiente |
Erro-padrão |
p-valor |
β0 |
10,66 |
0,085 |
0,000 |
β1 |
0,30 |
0,019 |
0,000 |
β2 |
0,12 |
0,06 |
0,067 |
R 2 = 0,95 R 2 ajust. = 0,94
De acordo com os resultados estimados, a existência de um parque próximo ao imóvel, aumenta o seu valor, ceteris paribus, em
Observação: Para as questões que assim necessitarem, há tabelas estatísticas disponibilizadas no final deste caderno.
Para responder às questões de números 57 e 58, considere o texto a seguir.
Suponha que uma análise de regressão com dados das variáveis x e y indicou correlação linear entre elas, obtendo-se para coeficientes os seguintes valores: 0,78 para o coeficiente de determinação, – 0,28 para o coeficiente de inclinação e 52,10 para o coeficiente linear (ou de interceptação).
Entre as alternativas seguintes, o valor mais próximo do coeficiente de correlação entre as variáveis é:
Observação: Para as questões que assim necessitarem, há tabelas estatísticas disponibilizadas no final deste caderno.
Para responder às questões de números 57 e 58, considere o texto a seguir.
Suponha que uma análise de regressão com dados das variáveis x e y indicou correlação linear entre elas, obtendo-se para coeficientes os seguintes valores: 0,78 para o coeficiente de determinação, – 0,28 para o coeficiente de inclinação e 52,10 para o coeficiente linear (ou de interceptação).
Com relação à equação da reta de regressão, podemos usá-la para diversas estimativas. Se o fizermos para x = 60, obteremos o correspondente y. Dos valores a seguir, o que mais se aproxima de y é:
Observação: Para as questões que assim necessitarem, há tabelas estatísticas disponibilizadas no final deste caderno.
O gráfico a seguir é o diagrama de dispersão obtido com uma amostra de trabalhadores de certa região para estudar a possível correlação entre o tempo médio de escolaridade e a renda média anual.
GRÁFICO 2
Tempo médio escolaridade X Renda média anual
Admitindo uma correlação linear entre as variáveis e considerando os coeficientes r de correlação e b de inclinação da reta de regressão associada, é correto afirmar que:
Considere o conjunto de dados e a informação a seguir:
Informação:
Deseja-se encontrar um modelo de regressão polinomial de 2ograu Y = α0 + α1 X + α2 X2 que melhor se encaixe nesse conjunto de dados.
Estimando-se pelo método dos mínimos quadrados, os valores deα0, α1 e α2 serão dados, respectivamente, por
Ao se considerar um modelo linear de dados transformados para encontrar as constantes α e β do modelo de regressão não-linear y = αeβx que melhor se ajusta aos dados (x1, y1),...,(xn, yn), a soma dos quadrados dos resíduos que deve ser minimizada é dada por:
A respeito de um modelo de regressão logística para uma variável resposta Y considerando a função de ligação canônica
associada ao modelo Bernoulli, chamada de logit, é INCORRETO afirmar que:
Determinado Ministério Público Estadual coletou dados nas 53 comarcas do Estado com o intuito de estudar a relação entre o tempo médio (Y), em dias, gasto na triagem inicial de denúncias de abuso recebidas pela comarca e duas variáveis explicativas: o número de servidores lotados no setor responsável por avaliar as denúncias na comarca (X1); e o número de municípios atendidos pela comarca (X2). Considere o ajuste do modelo de regressão linear múltipla Yi = β0 + β1X1i + β2X2i + ɛi , onde i = 1,..., 53 e ɛ1,..., ɛ53 são erros independentes com ɛi⁓N(0, σ2) para todo i. Os seguintes resultados foram obtidos pelo método de máxima verossimilhança: 0 = 21, 5, 1 = – 2,8 e 2 = 3,5. Adicionalmente, tem-se que SQRegressão = 346,5 e SQResíduos = 185, 5. Com base nessas informações, é correto afirmar que:
De acordo com essas informações, assinale a alternativa correta.
Considere uma regressão y = α + βx + ε que tem R2 (coeficiente de determinação) igual a A. A seguir, é acrescentada uma variável irrelevante z, de modo que a regressão y = α + βx + γz + ε tenha R2 igual a B.
É correto afirmar que