Questões de Estatística - Estatística descritiva (análise exploratória de dados) para Concurso

Foram encontradas 3.852 questões

Q457303 Estatística
De uma população com 1.000 famílias, tomou-se uma amostra aleatória simples de 50 famílias, na qual foram observadas as seguintes variáveis:

X = número de pessoas na família e Y = gasto mensal com saúde, em reais.

imagem-016.jpg
Alternativas
Q457297 Estatística
O preço de um produto, denotado por Z, é uma composição dos preços de dois elementos que o compõe, denotados por X e Y.Sabe-se que: 

I. Z = 2X + Y II. A distribuição conjunta de X e Y é dada na tabela a seguir, onde os valores de X e Y são dados em centenas de reais: 

                                                     Imagem associada para resolução da questão

Nessas condições, a probabilidade do produto custar mais do que 500 reais é igual a
Alternativas
Q457291 Estatística
O Departamento de RH de um órgão público colheu informações sobre a variável X, que representa o tempo para a realização de determinada tarefa. Para a realização da pesquisa foi colhida uma amostra aleatória, sem reposição, de tamanho n da população de 100 funcionários que realizam a tarefa, observando-se os valores de X obtidos. Sejam Xi = tempo que o funcionário i leva para realizar a tarefa, i = 1,2,3,...,n, e imagem-010.jpg Sabendo-se que a variância de X é igual 1/11 da variância de X , o valor de n é igual a
Alternativas
Q457288 Estatística
O seguinte modelo foi ajustado a uma série temporal de vendas de um produto:

imagem-009.jpg
Está correto o que consta APENAS em
Alternativas
Q457286 Estatística
O objetivo de um estudo é testar a hipótese de igualdade das médias de um atributo X, a um determinado nível de significância α, correspondente a 3 grupos I, II e III, independentes, cada um contendo 15 observações obtidas aleatoriamente. Pelo quadro de análise de variância, observou-se os seguintes resultados com relação às respectivas observações sabendo-se que o valor da estatística F (F calculado) utilizado para a tomada de decisão é igual a 33,6.

Fonte de variação / Soma de quadrados
Entre grupos: X
Dentro dos grupos: Y
Total: 78

O valor do módulo de (X - Y) é igual a
Alternativas
Q457284 Estatística
Suponha que a quantidade consumida (Y) de determinado produto por uma família depende do preço do produto (X2) e da renda da família (X3). Consultando, aleatoriamente, 10 famílias e considerando Yi como sendo o número de unidades consumidas do produto pela família i (i = 1,2, 3, ... ,10), X2 como sendo o preço unitário (em reais) pago pela família i e X3i como sendo a renda anual (em 1.000 reais) da família i, adotou-se o seguinte modelo linear Yi = β1 + β2X2i + β3X3i + εi para prever Y, em que εi é o erro aleatório com as respectivas hipóteses do modelo de regressão linear múltipla. Utilizando o método dos mínimos quadrados, obteve-se as estimativas dos parâmetros desconhecidos β1 , β2 e β3 , com base nas informações apresentadas pelas 10 famílias. Pelo quadro de análise de variância verifica-se que a variação residual corresponde a 17,5% da variação total. Então, o valor da estatística F (F calculado) utilizado para verificar a existência da regressão, a um determinado nível de significância, é igual a
Alternativas
Q457283 Estatística
A equação da reta y = a + bx foi obtida pelo método dos mínimos quadrados, com base em 10 observações (xi , yi ), i = 1, 2, 3, ...,10, em que foi adotado o modelo linear yi = α + βxi + εi. As estimativas de α e β são respectivamente a e b, i corresponde a i-ésima observação e εi é o erro aleatório com as correspondentes hipóteses do modelo linear simples. Sabe-se que a reta determinada pela equação acima passa pelos pontos ( 20 , 40 ) e ( 100 , 20 ).

imagem-007.jpg
A estimativa da variância σ2 do modelo teórico é igual a
Alternativas
Q457282 Estatística
A equação da reta y = a + bx foi obtida pelo método dos mínimos quadrados, com base em 10 observações (xi , yi ), i = 1, 2, 3, ...,10, em que foi adotado o modelo linear yi = α + βxi + εi. As estimativas de α e β são respectivamente a e b, i corresponde a i-ésima observação e εi é o erro aleatório com as correspondentes hipóteses do modelo linear simples. Sabe-se que a reta determinada pela equação acima passa pelos pontos ( 20 , 40 ) e ( 100 , 20 ).

imagem-007.jpg
O coeficiente de explicação (R2), definido como sendo o resultado da divisão da variação explicada pela variação total é, em %, igual a
Alternativas
Q457279 Estatística
Um noticiário divulga que o salário médio de uma determinada carreira profissional é de R$ 4.150,00. Como há uma suspeita de que o salário médio (μ) desta carreira é superior a R$ 4.150,00, extrai-se uma amostra aleatória da população destes salários de tamanho igual a 256, detectando uma média igual a R$ 4.180,00. Foram formuladas as hipóteses H0: μ = R$ 4.150,00 (hipótese nula) e H1: μ > R$ 4.150,00 (hipótese alternativa), considerando que a população é normalmente distribuída e de tamanho infinito. Considere na curva normal padrão (Z) as probabilidades P(Z > 2,33) = 0,01 e P(Z > 1,64) = 0,05. Se o desvio padrão populacional é igual a R$ 225,00, então, com base na amostra, H0
Alternativas
Q457278 Estatística
Uma empresa possui em estoque 2.501 tubos verificando-se que a população formada pelas medidas de seus comprimentos (em metros) apresenta uma distribuição normal com média µ e um desvio padrão populacional igual a 2,5 m. Uma amostra aleatória de tamanho 100 é extraída desta população, sem reposição, apurando-se uma média amostral igual a 10 m. Considerando na curva normal padrão (Z) as probabilidades P(Z > 1,96) = 0,025 e P(Z > 1,64) = 0,05, obtém-se que o intervalo de confiança para μ, ao nível de confiança de 95%, é
Alternativas
Q457273 Estatística
Os estimadores não viesados E1 = mX - mY + Z e E2 = (m - 12)X - mY + 13Z, em que m é um parâmetro real, são utilizados para a obtenção da média μ de uma população normal com variância unitária. (X, Y, Z) é uma amostra aleatória extraída desta população, com reposição. Considerando o maior valor inteiro m tal que E1 é mais eficiente que E2, tem-se que a variância de E1 é igual a
Alternativas
Q457271 Estatística
Seja X uma população { X1, X2, X3, ... , X100 } formada por 100 números estritamente positivos com um desvio padrão igual a 4 e com a soma dos quadrados de todos estes 100 números igual a 41.600. Seja Y uma outra população { Y1, Y2, Y3, ... , Y50 } formada por 50 números também estritamente positivos com uma média igual a da população anterior e com a soma dos quadrados de todos estes 50 números igual a 20.200. Os coeficientes de variação de X e de Y
Alternativas
Q457270 Estatística
Em uma determinada carreira profissional composta por 400 trabalhadores, verifica-se que a média aritmética das alturas de todos os trabalhadores é igual a 170 cm. Sabe-se que a média aritmética das alturas dos 250 trabalhadores do sexo masculino é igual à média aritmética das alturas dos 150 trabalhadores do sexo feminino. Os desvios padrões das alturas dos trabalhadores do sexo masculino e dos trabalhadores do sexo feminino são iguais a 12 cm e 20 cm, respectivamente. A variância (em cm2) das alturas de todos os trabalhadores desta carreira profissional é igual a
Alternativas
Q457269 Estatística
Em um treinamento destinado aos recém-formados de uma faculdade é realizado um levantamento com relação às idades (em anos) de seus participantes e obteve-se a seguinte tabela:

imagem-003.jpg
Em um treinamento destinado aos recém-formados de uma faculdade é realizado um levantamento com relação às idades (em anos) de seus participantes e obteve-se a seguinte tabela: 

                          Idade (anos)                           23          24         25       26      27     Total                           Número de participantes        5          35         20      15        5        80 


Sendo Me, Md, e Mo os valores da média aritmética (em anos por participante), da mediana e da moda, respectivamente, observa-se, com relação à tabela, que
Alternativas
Q457268 Estatística
O histograma, abaixo, refere-se à distribuição dos salários dos funcionários lotados em um setor de um órgão público. No eixo das abscissas constam os intervalos de classe em R$ (todos fechados à esquerda e abertos à direita) e no eixo das ordenadas as respectivas densidades de frequências em (R$)−1. Define-se densidade de frequência de um intervalo como sendo o resultado da divisão da respectiva frequência relativa pela correspondente amplitude do intervalo. 

                                 Imagem associada para resolução da questão



Se o número de funcionários que tem um salário inferior a R$ 5.000,00 é igual a 56, então verifica-se que o número de funcionários que tem um salário igual ou superior a R$ 2.000,00 e inferior a R$ 8.000,00 é igual a
Alternativas
Q457078 Estatística
Inicialmente, a média aritmética dos faturamentos dos últimos cinco meses de uma loja foi de R$ 126.000,00. Porém, após uma revisão, verificou-se que o faturamento do último mês, no valor de R$ 134.000,00, estava errado. Após a devida correção, a nova média dos faturamentos dos últimos cinco meses foi de R$ 125.000,00. Determine o valor correto do faturamento do último mês.
Alternativas
Q457077 Estatística
A tabela a seguir contém o faturamento dos últimos cinco meses de um hotel. Pode-se afirmar que o desvio-padrão X, dos faturamentos na tabela, pertence ao intervalo:

imagem-002.jpg
Alternativas
Q452951 Estatística
O modelo de componentes principais é utilizado para representar a estrutura de variância-covariância em função de um número reduzido de combinações lineares das variáveis originais, com o objetivo de se ter uma redução de dados e uma melhor interpretação destes. Para o vetor aleatório imagem-050.jpgcom matriz de covariância S e autovalores iguais a imagem-051.jpg, e as combinações lineares:

imagem-052.jpg

O modelo de componentes principais corresponde às combinações lineares não correlacionadas imagem-053.jpg com vetores de coeficientes imagem-054.jpg de comprimento unitário, que apresentam as maiores variâncias Var imagem-055.jpg. Diante do exposto, é correto afirmar que


I. o primeiro componente principal é a combinação linear imagem-056.jpg que maximiza Var imagem-058.jpg sujeito a imagem-059.jpg = 1.

II. o i-ésimo componente principal é a combinação linear imagem-060.jpg que maximiza Var imagem-057.jpg = 1 e Cov (imagem-062.jpg, imagem-064.jpg) = 0, para k < i.

III. sendo imagem-065.jpg os autovalores e ei os autovetores de S, o i-ésimo componente principal é dado por imagem-066.jpg + imagem-067.jpg, onde i = 1, ··· p.

IV. Var imagem-069.jpg= 0, para i = 1,2, ···, p e i ≠ k.

V. a proporção da variância total devido ao k-ésimo componente principal é dada por imagem-070.jpg para k = 1, ···, p.

Estão corretas apenas as afirmativas
Alternativas
Q452950 Estatística
“A análise de resíduos de um modelo de regressão linear múltipla pode ser utilizada para verificar se o modelo se adequa aos dados. Nesse sentido, gráficos e testes ajudam a identificar discrepâncias entre os valores observados da variável resposta e os valores preditos pelo modelo.” De acordo com o trecho anterior, marque V para as afirmativas verdadeiras e F para as falsas.
( ) Quando os pontos do diagrama de dispersão do resíduo padronizado versus variável explicativa apresentar uma tendência, a inclusão do logaritmo da variável explicativa pode melhorar o modelo.
( ) Quando os pontos do diagrama de dispersão do resíduo versus variável omitida no modelo apresentar uma tendência linear, a inclusão da variável omitida pode melhorar o modelo.
( ) Quando o desenho esquemático (boxplot) dos resíduos padronizados apresentar observações além dos limites superior ou inferior, existe uma forte indicação da presença de outliers que devem ser investigados.
( ) Quando o desenho esquemático dos resíduos tem a distância entre a mediana e o primeiro quartil e a distância entre a mediana e o terceiro quartil bem distintas, existe uma forte indicação de que a distribuição das observações são assimétricas e o componente aleatório do modelo pode não ter distribuição normal.
( ) A suposição de homocedasticidade dos resíduos pode ser avaliada através de: teste de Levéne; teste de Brown & Forsythe; gráfico de resíduos versus valores preditos pelo modelo; gráfico do resíduo versus cada uma das variáveis incluídas no modelo.
A sequência está correta em
Alternativas
Q452946 Estatística
Uma série temporal corresponde a um conjunto de observações que são, naturalmente, ordenadas pelo tempo, espaço, profundidade etc., que apresentam dependência em observações vizinhas. As observações correspondem a um processo imagem-041.jpg, e

I. que pode ser discreto, se T = imagem-043.jpg; contínuo, se T = imagem-044.jpg, ou multivariado, se imagem-045.jpg.

II. imagem-047.jpg pode ser uma variável discreta ou contínua.

III. os dois principais objetivos da análise de uma série temporal, a saber: compreender o mecanismo gerador e predizer o comportamento gerador e o comportamento futuro.

IV. a tendência é um efeito de longo prazo na média. Sazonalidade é um efeito ligado às variações periódicas. Ciclos são variações periódicas não associadas automaticamente a nenhuma medida temporal.

V. apresenta a família de modelos paramétricos de séries temporais, escrita de tal modo que cada observação corresponde a um sinal mais um ruído não correlacionado.

Estão corretas apenas as afirmativas
Alternativas
Respostas
2441: B
2442: D
2443: E
2444: A
2445: E
2446: E
2447: C
2448: A
2449: D
2450: C
2451: A
2452: D
2453: E
2454: B
2455: C
2456: A
2457: B
2458: D
2459: E
2460: B