Questões de Estatística - Estatística descritiva (análise exploratória de dados) para Concurso

Foram encontradas 3.852 questões

Q537308 Estatística

Em um estudo sobre o valor de juros (R$ ) e encargos pagos versus tempo de atraso (dias) considerando o pagamento da fatura de cartão de crédito de 30 clientes, foi construído um diagrama de dispersão e ajustado um modelo de regressão linear simples, seguido de quatro gráficos diagnósticos, apresentados a seguir.


coeficientes de regressão:

                            estimate   std.   error   t value    Pr(>|t|)

(intercept)              11,6624       1,8222     6,400   6,28e-07 ***

tempo                       2,1936      0,3347     6,553   4,19e-07 ***

---

signif. codes:   0   ‘***’   0,001 ‘**’  0,01 ‘ * ’  0,05 ‘ .’    0,1 ‘  ’ 1


residual standard error: 5,036 on 28 degrees of freedom

multiple R-squared: 0,6053, adjusted R-squared: 0,5912

F-statistic: 42,94 on 1 and 28 DF, p-value: 4,186e-07



Acerca das informações e das figuras apresentadas, julgue o item subsequente.
Para cada dia de atraso, é esperado um valor de juros adicional de 2,19 reais.
Alternativas
Q537307 Estatística

Em um estudo sobre o valor de juros (R$ ) e encargos pagos versus tempo de atraso (dias) considerando o pagamento da fatura de cartão de crédito de 30 clientes, foi construído um diagrama de dispersão e ajustado um modelo de regressão linear simples, seguido de quatro gráficos diagnósticos, apresentados a seguir.


coeficientes de regressão:

                            estimate   std.   error   t value    Pr(>|t|)

(intercept)              11,6624       1,8222     6,400   6,28e-07 ***

tempo                       2,1936      0,3347     6,553   4,19e-07 ***

---

signif. codes:   0   ‘***’   0,001 ‘**’  0,01 ‘ * ’  0,05 ‘ .’    0,1 ‘  ’ 1


residual standard error: 5,036 on 28 degrees of freedom

multiple R-squared: 0,6053, adjusted R-squared: 0,5912

F-statistic: 42,94 on 1 and 28 DF, p-value: 4,186e-07



Acerca das informações e das figuras apresentadas, julgue o item subsequente.
É esperado que os resíduos sejam simétricos e mesocúrticos, se a suposição de normalidade for plausível.
Alternativas
Q537306 Estatística

Em um estudo sobre o valor de juros (R$ ) e encargos pagos versus tempo de atraso (dias) considerando o pagamento da fatura de cartão de crédito de 30 clientes, foi construído um diagrama de dispersão e ajustado um modelo de regressão linear simples, seguido de quatro gráficos diagnósticos, apresentados a seguir.


coeficientes de regressão:

                            estimate   std.   error   t value    Pr(>|t|)

(intercept)              11,6624       1,8222     6,400   6,28e-07 ***

tempo                       2,1936      0,3347     6,553   4,19e-07 ***

---

signif. codes:   0   ‘***’   0,001 ‘**’  0,01 ‘ * ’  0,05 ‘ .’    0,1 ‘  ’ 1


residual standard error: 5,036 on 28 degrees of freedom

multiple R-squared: 0,6053, adjusted R-squared: 0,5912

F-statistic: 42,94 on 1 and 28 DF, p-value: 4,186e-07



Acerca das informações e das figuras apresentadas, julgue o item subsequente.
A soma de quadrados da regressão é maior que 1.000.
Alternativas
Q537305 Estatística

Em um estudo sobre o valor de juros (R$ ) e encargos pagos versus tempo de atraso (dias) considerando o pagamento da fatura de cartão de crédito de 30 clientes, foi construído um diagrama de dispersão e ajustado um modelo de regressão linear simples, seguido de quatro gráficos diagnósticos, apresentados a seguir.


coeficientes de regressão:

                            estimate   std.   error   t value    Pr(>|t|)

(intercept)              11,6624       1,8222     6,400   6,28e-07 ***

tempo                       2,1936      0,3347     6,553   4,19e-07 ***

---

signif. codes:   0   ‘***’   0,001 ‘**’  0,01 ‘ * ’  0,05 ‘ .’    0,1 ‘  ’ 1


residual standard error: 5,036 on 28 degrees of freedom

multiple R-squared: 0,6053, adjusted R-squared: 0,5912

F-statistic: 42,94 on 1 and 28 DF, p-value: 4,186e-07



Acerca das informações e das figuras apresentadas, julgue o item subsequente.
Os gráficos projetados nas margens do diagrama de dispersão são chamados de desenho esquemático ou boxplot, que resume graficamente a tendência central e a dispersão dos dados, sendo construído utilizando-se mínimo, máximo, média e quartis.
Alternativas
Q537304 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.
O teste de Ljung-box tem o objetivo de avaliar valores de resíduos de grandeza atípica. Valores-p muito baixos em um determinado atraso (lag) sugerem um possível padrão residual de autocorrelação residual.
Alternativas
Q537303 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.
O critério de informação de Akaike (AIC) deve ser utilizado para selecionar o modelo que melhor se ajusta à série. Assim como o máximo da função de verossimilhança, deve-se preferir o modelo com o maior AIC.
Alternativas
Q537302 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.

Utilizando o operador translação definido como BXt = Xt -1, é correto concluir que um modelo AR(2) deve ser descrito na forma Φ(B)Xt = αt, em que Φ(B) = 1 - Φ1B - Φ2B2 e αt representa um ruído branco.

Alternativas
Q537301 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.
É comum denotar o primeiro modelo ajustado como ARIMA(1,0,0), um modelo autorregressivo de primeira ordem, e o segundo como ARIMA(1,0,1), um modelo autorregressivo de segunda ordem.
Alternativas
Q537300 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.
Apesar de a primeira operação diferença ter sido aplicada à série de saldo, nota-se que, em torno de 200 dias, existe uma grande variabilidade, o que sugere que uma segunda operação diferença poderia ser aplicada, com o objetivo de melhorar a estacionarieda de da série.
Alternativas
Q537299 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.

Observando o gráfico da série de salário, nota-se que esta sofreu uma operação diferença, definida por Δx1 = x1-x1-1, com o objetivo de torná-la estacionária e garantir que as características da série para Xt+ sejam as mesmas para X1, que é a variável aleatória geradora de x1 .


Alternativas
Q537298 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.

Os autovalores da matriz associada à forma quadrática 3x12 + 2x22 - 2√2x1x2 são 4 e 1.

Alternativas
Q537297 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
Considerando uma matriz A simétrica, positiva definida, a sua decomposição espectral pode ser obtida a partir da solução da equação característica |A - λI| = 0, utilizada nesse caso para calcular os autovetores. Os autovalores associados ao problema são determinados a partir da expressão Aei = λiei.
Alternativas
Q537296 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O impacto das diferenças de escalas entre as variáveis estudadas é minimizado quando se utiliza a matriz de correlação como medida de similaridade.
Alternativas
Q537295 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
A variância amostral de um componente principal é igual ao seu respectivo autovalor e a covariância amostral entre dois componentes principais é igual a zero.
Alternativas
Q537293 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O ângulo formado pelas setas no BIPLOT enfatiza a correlação entre as variáveis.
Alternativas
Q537291 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
Um método adequado que poderia ser utilizado para construir o dendograma é o método de agrupamento K-médias (ou K-means).
Alternativas
Q537279 Estatística

Um banco deseja fazer um estudo sobre o tempo que as pessoas levam para pagar o limite utilizado no cheque especial. O estatístico responsável acredita que esse tempo pode ser modelado por uma distribuição exponencial. Entretanto, antes de prosseguir com o trabalho, ele decide fazer algumas simulações.

Considerando essa situação, julgue o item subsequente.

Uma forma de estimar a variância de um estimador é o método Jackknife. Dado o conjunto de dados A = {33, 14, 25, 40}, então todas as amostras Jackknife possíveis, com k=1, são as do conjunto J = {(14,25,40), (33,25,40), (33,14,40), (33,14,25)}.

Alternativas
Q537261 Estatística

Deseja-se estudar a relação entre a quantidade de chuvas (em mm) e a produção de soja em um determinado município. Para isso, utilizou-se a técnica de regressão linear simples, sendo sua matriz de análise de variância (ANOVA) apresentada abaixo.


A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência estatística.
O coeficiente de determinação é aproximadamente 0,59.
Alternativas
Q536078 Estatística

Julgue o item seguinte, relativo à violação das suposições básicas dos modelos clássicos de regressão.


Na presença de multicolinearidade, a variância e a covariância dos estimadores serão afetadas, sendo possível que sejam alterados tanto os sinais quanto a magnitude dos estimadores.

Alternativas
Q536050 Estatística
Considerando que um pesquisador, usando métodos computacionais, deseje estudar o impacto dos congestionamentos urbanos no consumo de combustível e no meio ambiente e que, para isso, deva gerar uma variável aleatória uniformemente distribuída no intervalo [0,1] (U), uma variável aleatória normal padrão (Z) e uma variável aleatória exponencial com média unitária (Y), julgue o item que se segue.


A variável Z pode ser obtida mediante a padronização da variável Y, ou seja, Z = (Y - μ)/σ , em que μ e σ representam,  respectivamente, a média e o desvio padrão de Y.
Alternativas
Respostas
2261: C
2262: C
2263: C
2264: E
2265: C
2266: E
2267: C
2268: E
2269: E
2270: C
2271: C
2272: E
2273: C
2274: C
2275: C
2276: E
2277: C
2278: C
2279: C
2280: E