Questões de Concurso Comentadas sobre estatística descritiva (análise exploratória de dados) em estatística

Foram encontradas 801 questões

Q2107976 Estatística

Suponha que uma pesquisa com amostra aleatória de 150 usuários de transporte público de uma cidade revelou que 90 deles estão insatisfeito com o serviço. Construindo-se um intervalo de confiança 01_76.png (12×19) ± E01_76.png (12×19) é a proporção amostral e E é a margem de erro estimada) para a proporção de insatisfeitos, verifica-se que o limite superior do intervalo é 0,6784 e que o desvio padrão das proporções amostrais é 0,04.


De acordo com esses dados, a alternativa que corresponde ao nível de significância da estimativa é:


(Tabela de Distribuição Normal-Padrão anexada a esta prova.)

Alternativas
Q2107972 Estatística

A distribuição de frequência da tabela 1 resulta de uma pesquisa para a variável quantitativa x.


Tabela 1


01_72.png (361×218)


Considerando os dados da tabela 1 e a informação de que o resultado da variância obtida a partir deles pode ser bem aproximado por s² = 4, então a alternativa em que estão representados os valores dos extremos do intervalo01_72 2.png (14×17)+ s , onde 01_72 2.png (14×17) é a média e s é o desvio padrão, é:

Alternativas
Q2103603 Estatística
O aumento do tamanho amostral, o qual é obtido pelos resultados numéricos de vários estudos que examinam uma questão clínica, e caracteriza o método estatístico de análise de evidência reunida sistematicamente, corresponde à  
Alternativas
Q2101324 Estatística
Seja μ o tempo médio para que uma ação penal pública iniciada por um Promotor de Justiça seja analisada pelo Juiz de uma determinada comarca. Considere as hipóteses H0: μ = 7 (hipótese nula) e H1: μ > 7 (hipótese alternativa). Considerando uma amostra de n = 16 ações penais públicas iniciadas pelo Promotor; um desvio-padrão σ = 4; um nível de significância de 5%; e que o valor verdadeiro de μ é de 10 dias; o poder deste teste será igual a:
(Dados: P(Z > -1,64) = 0,950; P(Z > -1,96) = 0,975; P(t15 > -1,75) = 0,950; P(t15 > -2, 13) = 0,975; onde Z é uma variável aleatória com distribuição Normal-padrão e tk é uma variável aleatória com distribuição t-Student com K graus de liberdade.)
Alternativas
Q2101319 Estatística
Considere que o Ministério Público do Trabalho (MPT) oferece cursos de qualificação profissional em 100 municípios brasileiros: 20 na região Sul (S); 30 na região Sudeste (SD); 15 na região Centro-Oeste (CO); 20 na região Nordeste (ND); e, 15 na região Norte (N). O MPT cogita acrescentar mais um curso à lista de cursos atualmente disponíveis. No intuito de estimar a demanda mensal média e a demanda mensal total pelo novo curso em cada região, procedeu-se à implementação do curso cogitado em 4 municípios da região Sul; 6 da região Sudeste; 3 da região Centro-Oeste; 4 da região Nordeste; e, 3 da região Norte, os quais foram selecionados aleatoriamente. Ao longo de alguns meses, apurou-se, com base nas quantidades de pessoas que se inscreveram no novo curso, os resultados das médias amostrais em cada região: 
Imagem associada para resolução da questão

A partir desses dados amostrais e utilizando-se dos procedimentos apropriados ao plano amostral adotado, a demanda mensal média populacional pelo novo curso, denotada por μ, foi estimada pontualmente, sendo tal estimativa denotada porImagem associada para resolução da questão . Além disso, calculou-se a margem de erro associada ao intervalo de 95% de confiança para μ como sendo igual 15,5. Com base nesses dados, conclui-se que o valor de Imagem associada para resolução da questão, a estimativa pontual para a demanda mensal média populacional μ e o intervalo de 95% de confiança para a demanda populacional total pelo novo curso são, respectivamente: 
Alternativas
Q2101318 Estatística
São resumidos a seguir os resultados da análise de variância resultante do ajuste de um modelo de regressão linear homocedástico definido como Yi = β0 + β1X1i + ... + βpXpi i, onde i = 1, . . . , n e i são erros independentes e normalmente distribuídos com média igual a zero e variância σ2. A estimação foi feita utilizando o método dos mínimos quadrados ordinários:

• Soma de Quadrados Total = 5.000;
• Soma de Quadrados dos Resíduos = 1.800;
• Graus de Liberdade Total = 40; e,
• Graus de Liberdade da Regressão = 4.
Com base nesses resultados, marque V para as afirmativas verdadeiras e F para as falsas. 
( ) A estimativa não-viesada para σ é igual a 50.
( ) A amostra é composta por n = 40 observações.
( ) O modelo apresenta um total de p = 4 variáveis explicativas.
( ) A raiz quadrada do coeficiente de determinação R² é igual a 0,80.
( ) Sabendo que a região crítica (RC) do teste F associado ao problema é RC = {Fobs > 2,63} para 95% de confiança, onde Fobs representa o valor observado da estatística de teste, conclui-se que pelo menos uma das variáveis explicativas incluídas no modelo é significativa para explicar a variável dependente, com 5% de significância.

A sequência está correta em
Alternativas
Q2101317 Estatística
Considere as variáveis aleatórias discretas X e Y e sua distribuição de probabilidade conjunta p(x, y) dada a seguir:
Imagem associada para resolução da questão

Analise as afirmativas a seguir.
I. Cov (X, Y) = 0.
II. X e Y são independentes.
III. P (X = 1IY = 0) = 0,25.
Está correto o que se afirma em
Alternativas
Q2101316 Estatística
Considere que de uma amostra X1, X2, ..., Xn de tamanho n se tenha calculado a média aritmética simples amostral Xn, a mediana da amostra Mdn e a variância amostral S2n. Seja Xn+1 uma nova observação coletada que, juntamente com as n observações anteriores, irá compor uma amostra com n + 1 observações. Denote, respectivamente, por Xn+1 Mdn+1 e S a média aritmética simples, a mediana e a variância da amostra formada pelas n + 1 observações. São feitas as seguintes afirmativas:

I. Imagem associada para resolução da questão
II. Se n for ímpar, então Mdn+1 = Imagem associada para resolução da questão, onde X[k] representa o valor na kª posição na amostra de n + 1 observações ordenadas.
III.Imagem associada para resolução da questão
Assinale a alternativa correta.
Alternativas
Q2101314 Estatística
Para se fazer a estimação intervalar da média populacional μ de uma variável aleatória X que segue uma distribuição Normal (μ, σ2), com σ2 = 64, extraiu-se uma amostra aleatória de tamanho n = 36. A média e a variância amostrais obtidas são dadas por  = 57 e 2  = 49, respectivamente. Deseja-se fazer a estimação com um nível de 90% de confiança. Então, os limites inferior e superior aproximados do intervalo de confiança desejado são, respectivamente: 
(Dados: P(Z ≤ 1,28) = 0,90; P(Z ≤ 1,64) = 0,95; P(t35 ≤ 1,31) = 0,90; P(t35 ≤ 1,69) = 0,95; onde Z é uma variável aleatória com distribuição Normal-padrão e tk é uma variável aleatória com distribuição t-Student com K graus de liberdade.)
Alternativas
Q2101311 Estatística
Sejam x1, x2,…, x100 valores distintos observados de uma variável aleatória contínua X que tem distribuição unimodal, formando uma amostra de tamanho n = 100. Denote a média aritmética simples amostral por Imagem associada para resolução da questão e a moda da amostra por Mo(x), a qual é igual à metade de Imagem associada para resolução da questão . É necessariamente correto afirmar que: 
Alternativas
Q2101306 Estatística
Ao analisar os dados de uma variável X, Gilberto calculou medidas de dispersão como o desvio-padrão S dos dados. Entretanto, Gilberto foi comunicado que, após uma mudança na legislação, será melhor trabalhar com a transformação Y = 3X + 7. Após realizar a devida transformação em sua base de dados, o desvio-padrão calculado da variável transformada será dado por: 
Alternativas
Q2101305 Estatística

Um analista do Ministério Público supõe que existe uma relação linear entre duas variáveis não negativas: o número de denúncias de infrações ambientas (y) e o acesso à informação e comunicação (x) de diferentes regiões administrativas. Para verificar sua hipótese, realizou um estudo e obteve o seguinte diagrama de dispersão:


Imagem associada para resolução da questão


Considere que r seja o coeficiente de correlação linear amostral entre as variáveis e que b seja o coeficiente de inclinação no ajuste da reta de regressão y = a + bx aos dados observados. Com base nessas informações, é correto afirmar que:

Alternativas
Q2101298 Estatística
O tempo de atendimento Y, em minutos, de um setor de processos de determinada repartição pública possui função densidade de probabilidade acumulada dada por:

F (y) = 1 – e–λy , y > 0 e λ > 0,

em que λ é um parâmetro populacional. Qual é o tempo mediano, em minutos, de atendimento nesse setor?
Alternativas
Q2100917 Estatística
A tabela representa a distribuição das notas de desempenho dos candidatos em um processo de seleção para uma vaga de emprego. A última fase do processo de seleção consiste em uma entrevista, que será realizada apenas com os candidatos que obtiveram desempenho acima da nota de corte, calculada com base no valor do sexto decil, cujo valor é 51,8:
Imagem associada para resolução da questão

“De acordo com os dados apresentados, é correto afirmar que 60% dos candidatados obtiveram notas ____________ de 51,8; portanto, a empresa realizará ____________ 40 entrevistas.” Assinale a alternativa que completa correta e sequencialmente a afirmativa anterior.
Alternativas
Q2094340 Estatística

Considerando uma variável aleatória contínua X com a função densidade de probabilidade dada por:

Imagem associada para resolução da questão


julgue o item.



C = 2/25.

Alternativas
Q2094337 Estatística

Considerando uma variável aleatória discreta X com a função de probabilidade dada por

Imagem associada para resolução da questão




julgue o item.



β = 3/4.

Alternativas
Q2086195 Estatística
Considere que X e Y são duas variáveis aleatórias e independentes que representam duas quantidades físicas. Adicionalmente, sabe- -se que V(X) = 1 e V(Y) = 3, em que V representa a variância. Com base nessas informações, o desvio-padrão da variável W = 2X + 7 Y é:
Alternativas
Q2086185 Estatística
Com o objetivo de construir um índice de criminalidade, a técnica multivariada de análise de componentes principais foi utilizada em um banco de dados com 16 variáveis. De acordo com a abordagem que utiliza a matriz de covariância entre as variáveis, os quatro maiores autovalores observados foram iguais a 5; 3; 2; e, 1. O percentual de variação que é explicado por esses autovalores é:
Alternativas
Q2086184 Estatística
A construção de gráficos no software R foi revolucionada com a criação do pacote ggplot2, fruto de uma tese de doutorado. A essência desse pacote é a construção de gráficos camada por camada, deixando os gráficos naturalmente mais bonitos, permitindo uma fácil personalização. As funções do pacote ggplot2 responsáveis por gerar um histograma e um boxplot são, respectivamente:
Alternativas
Respostas
201: B
202: C
203: C
204: A
205: E
206: B
207: B
208: E
209: B
210: A
211: B
212: B
213: C
214: D
215: A
216: E
217: E
218: B
219: C
220: E