Questões de Concurso Sobre estatística
Foram encontradas 11.296 questões
Considere o conjunto de dados:
É correto afirmar que os comandos do software R para produzir como saída o histograma dos dados são:
O diagrama de Ramo e Folhas é um gráfico típico de
Uma descrição típica da amostra, cuja distribuição de frequências está adiante, é composta da descrição gráfica e descrição numérica. São estatísticas descritivas da amostra os valores
O Boxplot é um gráfico típico de
Um grande Sistema de Armazenamento de Água para abastecimento de uma região metropolitana, em determinado momento de um período, tem um volume de 1,269 milhões de m3 de água. Em um dia qualquer desse período, a entrada de suprimento de água é igualmente provável para os valores de 3,00; 3,50 e 4,00 unidades de volume de água. Já a demanda é também equiprovável e poderá ter valores de 2,50; 3,00 e 3,50 unidades de volume. Então, considerando o suprimento como a variável aleatória X e a demanda como a variável aleatória Y, é correto afirmar que a função de probabilidade conjunta dessas variáveis aleatórias, P(X=x, Y=y), e as funções de probabilidade marginais, P(X=x) e P(Y=y), são iguais, respectivamente, a
Um produto eletrônico tem o seu tempo de garantia modelado por uma distribuição Exponencial. Uma amostra com tamanho n = 100 itens do produto, obtida da assistência técnica, forneceu média amostral de 3,505 anos. A direção da empresa deseja saber qual é o percentual de itens que receberiam manutenção por falha após a entrega do produto se fosse concedida uma garantia de 48 meses. O estatístico da empresa fez os cálculos e afirma que o percentual de itens sujeitos à manutenção é de
Após revisar 16 relatórios, um analista verificou que 3 deles continham erros. Escolhendo ao acaso 2 desses relatórios, a probabilidade de que ambos contenham erros é de:
Considerando-se a série de números a seguir: 3, 6, 6, 9, 14, 16. Em relação a certas medidas centrais e de dispersão é correto afirmar que:
Joana, Maria e Lúcia são as costureiras de uma pequena empresa. Se Joana faz 5 peças por hora, Lúcia faz 4 peças por hora e a empresa faz em média 5 peças por hora, então Maria faz:
Em uma empresa de produção de energia elétrica, no período de 6 meses, ocorreram 12 acidentes do trabalho com lesão sem afastamento e 6 acidentes do trabalho com lesão com afastamento. A empresa possui 2.000 empregados que trabalham em média 200 horas por mês.
A taxa de frequência de acidentes acumulada é deA estrutura de correlação do vetor aleatório com dimensão é dada pela matriz Então, as componentes principais correspondentes são:
A estrutura de covariância de um vetor aleatório é dada pela matriz .
Então, o coeficiente de correlação entre as variáveis e o par de autovalores da matriz são:
A matriz de correlação do vetor aleatório tem os autovalores λ1 = 2,35 ; λ2 = 0,56 e λ3 = 0,09.
Então, quando se aplica uma Análise Fatorial aos dados e são extraídos dois fatores, perde-se
Uma fábrica de papel de jornal está interessada em avaliar e identificar o mais importante de dois relacionamentos: 10. entre o vetor das características de qualidade do papel, X, de dimensão p e o vetor das características do cavaco da madeira, Y , de dimensão q; 20. entre o vetor das características de qualidade do papel, X, e o vetor das características da pasta, Z, de dimensão r. Então, neste caso, deve-se estimar
Seja o modelo de regressão linear , em que Y é o vetor das respostas (variável dependente) de dimensão n, X é matriz do modelo de ordem n x p, é o vetor de parâmetros de dimensão p e é o vetor dos erros de dimensão n. Então, admitindo que os erros são i.i.d. com distribuição Normal (Gaussiana) com média zero e variância σ2, o estimador de mínimos quadrados ordinários do vetor de parâmetros e o pivô usado para testar a hipótese nula H0i: βi = 0 i = 0, 1, 2, ..... p-1 são, respectivamente,
Seja o par (xi, yi) i = 1, 2, ..... , n de variáveis aleatórias para o qual pode-se assumir o modelo Normal Bivariado na modelagem da distribuição conjunta f(x, y), ou seja, f(x,y) = , em que μ1 e μ2 são as médias de X e Y, respectivamente, as variâncias correspondentes a X e Y, já ρ é o coeficiente de correlação entre X e Y. Nestas condições, é possível afirmar que , com e sendo os estimadores UMVU de μ1 e μ2 respectivamente, é
Para se medir a adequação do ajuste de um modelo de regressão linear a um conjunto de dados relacionando a variável resposta yi com as p - 1 variáveis explicativas xij j = 1, 2, ..... , p - 1 e i = 1, 2, .... , n observações, deve-se comparar a Soma de Quadrados da Regressão (SQRegr) com a Soma de Quadrados Total (SQT) obtendo-se o coeficiente de correlação
Os problemas que podem surgir no ajuste de um modelo linear aos dados da variável resposta (Y) contra as variáveis explicativas (X1, X2, ...., Xp-1) são de natureza diferente, podem ser causados de formas diferentes e têm consequências também deferentes. É possível agrupar esses problemas em quatro (4) grupos importantes. São eles:
A detecção de pontos com grande influência no ajuste de um modelo linear aos dados, Y = , é feita usando-se a denominada matriz chapéu H. No caso de se considerar apenas os valores das variáveis explicativas Xi i= 1, 2, ..... , p-1, trabalha-se com os elementos da diagonal principal. Então, a matriz chapéu é dada por:
No planejamento de uma carta de controle, é necessário especificar o tamanho da amostra que será tomada sistematicamente do processo de produção, bem como a frequência da amostragem. Em uma Curva Característica de Operação, CCO, é fácil ver que amostras com tamanhos maiores facilitarão a tarefa de detectar aumentos ou diminuição na média do processo. Considere a CCO para carta de controle a três desvios padrões, com desvio padrão σ suposto conhecido. Se a média do processo salta do valor de controle μ0, para outro valor μ1 = μ0 + kσ, a probabilidade da carta não detectar esta mudança na primeira amostra após esta ocorrência é chamada de risco β (ou erro β) e é dada por