Questões de Concurso Sobre estatística descritiva (análise exploratória de dados) em estatística

Foram encontradas 3.963 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q537299 Estatística

No estudo de insolvência de empresas, foi determinada a série temporal do saldo em conta corrente de uma pessoa jurídica, após a operação x1 - x1 - 1. Um economista precisou fazer a previsão para a semana seguinte (6 dias) e decidiu ajustar um modelo de séries temporais que modelasse o problema. Com esse propósito, foram então ajustados dois modelos ARIMA. A descrição dos seus dados e gráficos diagnósticos (resíduos padronizados, correlograma dos resíduos e os valores-p do teste de Ljung-Box) é apresentada a seguir.



coeficientes:

              AR1 intercepto

         0,5217      -0,0589

e.p. 0,0363         0,2309

σ2 = 6,738: logaritmo da verossimilhança = -1305,2, 

AIC = 2616,39


coeficientes:

               AR1       AR2   intercepto

           0,9969  -0,9077     -0,0612

e.p.     0,0175   0,0173      0,0503

σ2 = 1,149: logaritmo da verossimilhança = -820,46,

AIC = 1648,91


Morettin e Toloi. Análise de séries temporais.

São Paulo: Ed. Edgard Blücher, 2004.

Com base nas informações e nas figuras apresentadas, julgue o item seguinte.

Observando o gráfico da série de salário, nota-se que esta sofreu uma operação diferença, definida por Δx1 = x1-x1-1, com o objetivo de torná-la estacionária e garantir que as características da série para Xt+ sejam as mesmas para X1, que é a variável aleatória geradora de x1 .


Alternativas
Q537298 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.

Os autovalores da matriz associada à forma quadrática 3x12 + 2x22 - 2√2x1x2 são 4 e 1.

Alternativas
Q537297 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
Considerando uma matriz A simétrica, positiva definida, a sua decomposição espectral pode ser obtida a partir da solução da equação característica |A - λI| = 0, utilizada nesse caso para calcular os autovetores. Os autovalores associados ao problema são determinados a partir da expressão Aei = λiei.
Alternativas
Q537296 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O impacto das diferenças de escalas entre as variáveis estudadas é minimizado quando se utiliza a matriz de correlação como medida de similaridade.
Alternativas
Q537295 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
A variância amostral de um componente principal é igual ao seu respectivo autovalor e a covariância amostral entre dois componentes principais é igual a zero.
Alternativas
Q537293 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O ângulo formado pelas setas no BIPLOT enfatiza a correlação entre as variáveis.
Alternativas
Q537291 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
Um método adequado que poderia ser utilizado para construir o dendograma é o método de agrupamento K-médias (ou K-means).
Alternativas
Q537279 Estatística

Um banco deseja fazer um estudo sobre o tempo que as pessoas levam para pagar o limite utilizado no cheque especial. O estatístico responsável acredita que esse tempo pode ser modelado por uma distribuição exponencial. Entretanto, antes de prosseguir com o trabalho, ele decide fazer algumas simulações.

Considerando essa situação, julgue o item subsequente.

Uma forma de estimar a variância de um estimador é o método Jackknife. Dado o conjunto de dados A = {33, 14, 25, 40}, então todas as amostras Jackknife possíveis, com k=1, são as do conjunto J = {(14,25,40), (33,25,40), (33,14,40), (33,14,25)}.

Alternativas
Q537261 Estatística

Deseja-se estudar a relação entre a quantidade de chuvas (em mm) e a produção de soja em um determinado município. Para isso, utilizou-se a técnica de regressão linear simples, sendo sua matriz de análise de variância (ANOVA) apresentada abaixo.


A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência estatística.
O coeficiente de determinação é aproximadamente 0,59.
Alternativas
Q536078 Estatística

Julgue o item seguinte, relativo à violação das suposições básicas dos modelos clássicos de regressão.


Na presença de multicolinearidade, a variância e a covariância dos estimadores serão afetadas, sendo possível que sejam alterados tanto os sinais quanto a magnitude dos estimadores.

Alternativas
Q536050 Estatística
Considerando que um pesquisador, usando métodos computacionais, deseje estudar o impacto dos congestionamentos urbanos no consumo de combustível e no meio ambiente e que, para isso, deva gerar uma variável aleatória uniformemente distribuída no intervalo [0,1] (U), uma variável aleatória normal padrão (Z) e uma variável aleatória exponencial com média unitária (Y), julgue o item que se segue.


A variável Z pode ser obtida mediante a padronização da variável Y, ou seja, Z = (Y - μ)/σ , em que μ e σ representam,  respectivamente, a média e o desvio padrão de Y.
Alternativas
Q536042 Estatística

                


      Um estudo para investigar a associação da pressão arterial diastólica com o tempo acumulado de trabalho dos motoristas de ônibus em determinada cidade considerou o modelo de regressão linear na forma yi = β0 + β1X1i + β2X2i + β3X1iX2i + εi, em que yi  representa a pressão arterial diastólica (mmHg) do motorista i, X1i é a idade (em anos) do motorista i, X2i  denota o logaritmo natural do tempo de trabalho (em meses) do motorista i e εi representa o erro aleatório com média nula e variância σ2. Esse estudo foi realizado com base em uma amostra aleatória de 1.000 motoristas de ônibus. A tabela acima apresenta a estimativa de cada parâmetro βi (i = 0,1, 2, 3) obtida pelo método de mínimos quadrados ordinários, o erro padrão, a razão t e o p-valor correspondentes.

Com base nessas informações e na tabela apresentada, julgue o item a seguir.



Para se obter a estimativa de um coeficiente do modelo pelo método de mínimos quadrados ordinários, exige-se que o erro aleatório εi siga uma distribuição normal com média 0 e variância σ2
Alternativas
Q536032 Estatística
Considere que a quantidade de carga perdida (Y, em kg) em operações de transbordo seja uma variável aleatória com função de densidade de probabilidade    em que   0 < a ≤ y ≤ b . Considere, ainda, que Y1Y2, ...., Yn representa uma amostra aleatória simples retirada dessa distribuição e que  Y(1) ≤  Y(2)  ≤ ...., ≤ Y(n) representam suas estatísticas de ordem. Com base nessas informações, julgue o item.


Com base nessas informações, julgue o item.


Com base apenas na média amostral, não é possível obter estimativas dos parâmetros a e b pelo método dos momentos.



Alternativas
Q536031 Estatística
Considere que a quantidade de carga perdida (Y, em kg) em operações de transbordo seja uma variável aleatória com função de densidade de probabilidade    em que   0 < a ≤ y ≤ b . Considere, ainda, que Y1Y2, ...., Yn representa uma amostra aleatória simples retirada dessa distribuição e que  Y(1) ≤  Y(2)  ≤ ...., ≤ Y(n) representam suas estatísticas de ordem. Com base nessas informações, julgue o item.


Com base nessas informações, julgue o item.


A média amostral ( Imagem associada para resolução da questão) é um estimador não tendencioso da Y distribuição de perdas Y. Nesse caso, o valor esperado de Imagem associada para resolução da questão  é igual a  (a + b)/2.
Alternativas
Q536030 Estatística
Considere que a quantidade de carga perdida (Y, em kg) em operações de transbordo seja uma variável aleatória com função de densidade de probabilidade    em que   0 < a ≤ y ≤ b . Considere, ainda, que Y1Y2, ...., Yn representa uma amostra aleatória simples retirada dessa distribuição e que  Y(1) ≤  Y(2)  ≤ ...., ≤ Y(n) representam suas estatísticas de ordem. Com base nessas informações, julgue o item.


Com base nessas informações, julgue o item.


A moda amostral é um estimador do parâmetro b.


Alternativas
Q536028 Estatística
Considere que a distribuição das velocidades v dos veículos (em km/h) em uma via seja uma variável aleatória V com função de distribuição acumulada  Imagem associada para resolução da questão . A partir dessas informações, julgue o item que se segue.


A média das velocidades dos veículos nessa via é de 100 km/h.
Alternativas
Q536026 Estatística
Considere que a distribuição das velocidades v dos veículos (em km/h) em uma via seja uma variável aleatória V com função de distribuição acumulada  Imagem associada para resolução da questão . A partir dessas informações, julgue o item que se segue.


O desvio padrão da distribuição das velocidades dos veículos nessa via é superior a 20 km/h.


Alternativas
Q536025 Estatística
Suponha que X e Y sejam variáveis aleatórias de um mesmo espaço amostral e que E(X|Y = y) = Var(X|Y = y) = 4y2 em que Y segue uma distribuição normal com média zero e desvio padrão 1. Com base nessas informações, julgue o seguinte item.


O desvio padrão de X é igual a 6.


Alternativas
Q536023 Estatística
Suponha que X e Y sejam variáveis aleatórias de um mesmo espaço amostral e que E(X|Y = y) = Var(X|Y = y) = 4y2 em que Y segue uma distribuição normal com média zero e desvio padrão 1. Com base nessas informações, julgue o seguinte item.


As variáveis aleatórias X e Y são dependentes e possuem correlação linear estritamente positiva.


Alternativas
Q536019 Estatística
Considere que o tempo de duração (X, em horas) de uma viagem por via ferroviária seja uma variável aleatória com função de densidade de probabilidade expressa por f(x) = 2e-2(x-5) em que x  > 5 horas. Com base nessas informações, julgue o próximo item.


A moda da distribuição X é superior a 6 horas.
Alternativas
Respostas
2381: C
2382: C
2383: E
2384: C
2385: C
2386: C
2387: E
2388: C
2389: C
2390: C
2391: E
2392: E
2393: C
2394: E
2395: C
2396: C
2397: E
2398: C
2399: E
2400: E