Questões de Concurso
Sobre modelos lineares em estatística
Foram encontradas 578 questões
I. O valor da variável dependente Y é considerado como o de uma variável aleatória, que depende de valores fixos (não aleatórios) da variável independente X.
II. Uma relação teórica em linha reta existe entre Y e o valor esperado de X para cada um dos valores possíveis de X. Essa linha de regressão teórica: E (Y ̸X) = α + βX possui uma inclinação α e uma interseção β. Os coeficientes de regressão α e β constituem parâmetros de população, cujos valores são desconhecidos e se deseja estimá-los.
III. Associada a cada valor de X, existe uma distribuição de probabilidade p(y ̸x) dos valores possíveis da variável aleatória Y. Quando X for igual a um valor xi, o valor de Y observado será obtido da distribuição de probabilidade p(y ̸xi) e não estará necessariamente na linha de regressão teórica.
Quanto às premissas subjacentes ao modelo de regressão linear simples, está correto o que se afirma apenas em

Com base no modelo ajustado e, ainda, considerando o nível de 5% de significância, assinale a afirmativa INCORRETA.

Tem-se que

Considerando o quadro precedente, que mostra parte de uma típica tabela de análise de variância (ANOVA) referente ao ajuste de um modelo de regressão linear que possui um intercepto e cujos coeficientes foram estimados pelo método de mínimos quadrados ordinários, julgue o item a seguir.
A variância dos resíduos é inferior a 0,90.
Considerando o quadro precedente, que mostra parte de uma típica tabela de análise de variância (ANOVA) referente ao ajuste de um modelo de regressão linear que possui um intercepto e cujos coeficientes foram estimados pelo método de mínimos quadrados ordinários, julgue o item a seguir.
O valor da razão F é igual a 14.
Na tabela a seguir, a variável produção mensal, dada em toneladas, é registrada como um número inteiro; a variável teor de ferro representa a porcentagem de ferro em determinada amostra; e a variável profundidade é dada em metros.
A partir dessas informações, julgue o próximo item.
As variáveis mina, tipo de minério, teor de ferro, profundidade e produção mensal são, respectivamente, do tipo qualitativa nominal, qualitativa ordinal, quantitativa contínua, quantitativa discreta e quantitativa contínua.
No que se refere a modelagem estatística de dados, julgue o item subsecutivo.
O modelo de árvore de decisão é utilizado quando a resposta é binária, como, por exemplo, prever se um cliente fará ou não determinada compra com base em seu histórico de compras.
As tabelas precedentes mostram as estimativas dos coeficientes e seus respectivos erros padrão proporcionados pelo método de mínimos quadrados ordinários em um modelo de regressão linear com um intercepto e 4 variáveis regressoras (X1, X2, X3 e X4) para modelar uma variável dependente Y. As tabelas mostram, ainda, o tamanho da amostra, o coeficiente de determinação (R2 ) e o erro quadrático médio desse modelo, que foi igual a 36. Com base nessas informações e nos dados das tabelas, julgue o item subsequente.
Se a variável Y for considerada normal, e assumindo-se que a aproximação normal seja válida para a distribuição dos estimadores dos coeficientes do modelo, é correto concluir que todos os coeficientes são estatisticamente significativos com p-valores inferiores a 1%.
As tabelas precedentes mostram as estimativas dos coeficientes e seus respectivos erros padrão proporcionados pelo método de mínimos quadrados ordinários em um modelo de regressão linear com um intercepto e 4 variáveis regressoras (X1, X2, X3 e X4) para modelar uma variável dependente Y. As tabelas mostram, ainda, o tamanho da amostra, o coeficiente de determinação (R2 ) e o erro quadrático médio desse modelo, que foi igual a 36. Com base nessas informações e nos dados das tabelas, julgue o item subsequente.
O valor do R2 ajustado (R2ajustado) é superior a 60%.

Sabe-se que:

Considerando os dados acima, a equação resultante da regressão linear é dada por

Além disso, o Fator de Inflação da Variância (VIF) associado à variável X1 foi calculado, retornando o valor 5,0. Com base nas informações fornecidas, assinale a afirmativa correta
Determinado Juiz está analisando a eficácia de um modelo de regressão linear simples que prevê, para cada processo, o valor das indenizações com base no tempo de tramitação. O modelo apresenta um coeficiente de determinação igual a 0,81. Com base no valor obtido para esse coeficiente, analise as afirmativas a seguir.
I. O modelo explica 81% das variações nos valores das indenizações em relação aos valores reais observados.
II. O coeficiente de correlação linear de Pearson entre as variáveis envolvidas é 0,9.
III. Um coeficiente de determinação de 0,81 garante que o modelo não apresente problemas de multicolinearidade.
Está correto o que se afirma em
Em uma fiscalização sobre possíveis irregularidades no recolhimento de impostos de uma empresa de construção civil, o auditor fiscal investiga a relação entre o número de projetos concluídos pela empresa e o faturamento mensal declarado nos últimos 12 meses. A empresa alega que o faturamento está diretamente relacionado à quantidade de projetos concluídos e que flutuações no faturamento se devem exclusivamente ao número de obras finalizadas em cada mês. Para verificar essa justificativa, o auditor coletou dados mensais (12 meses, assumindo independência dos dados entre os meses) sobre a quantidade de projetos concluídos (X, em unidades) e o faturamento correspondente (Y, em milhares de reais). Os dados revelaram que o desvio-padrão de X foi SX = 2, enquanto o desvio-padrão de Y foi SY = 8. A correlação entre a quantidade de projetos e o faturamento foi de 0,6. O auditor fiscal decide empregar uma regressão linear simples para verificar a relação entre o número de projetos concluídos e o faturamento mensal da empresa, buscando identificar se há uma tendência clara ou se existem desvios significativos que possam indicar sonegação ou subdeclaração de receitas. Utilizando o método dos mínimos quadrados para ajustar a reta de regressão de Y em X, o auditor concluiu corretamente que, para cada projeto finalizado no período, em média, o faturamento:
1 > x <- c(2,1,3,5,6)
2 > y <- matrix(1:25, nrow = 5)
Com base no código precedente, escrito em R, em que os números à esquerda do sinal “>” indicam o número da linha do código, julgue o item a seguir, assumindo que a tecla Enter foi pressionada após cada linha de comando do código.
O comando x + 1 e o comando c(x,1) produzem o mesmo resultado.
1 > x <- c(2,1,3,5,6)
2 > y <- matrix(1:25, nrow = 5)
Com base no código precedente, escrito em R, em que os números à esquerda do sinal “>” indicam o número da linha do código, julgue o item a seguir, assumindo que a tecla Enter foi pressionada após cada linha de comando do código.
O comando p <- x * y produzirá a variável p, que é a matriz produto resultante da multiplicação do vetor-linha x pela matriz y.
Julgue o item a seguir, em relação às técnicas de amostragem.
A amostragem sistemática envolve a partição da população em grupos internamente homogêneos de igual tamanho, para evitar viés na estimativa dos parâmetros populacionais.
Q tem 4 categorias.