Questões de Estatística - Estatística descritiva (análise exploratória de dados) para Concurso
Foram encontradas 3.852 questões
X = número de pessoas na família e Y = gasto mensal com saúde, em reais.
I. Z = 2X + Y II. A distribuição conjunta de X e Y é dada na tabela a seguir, onde os valores de X e Y são dados em centenas de reais:
Nessas condições, a probabilidade do produto custar mais do que 500 reais é igual a
Fonte de variação / Soma de quadrados
Entre grupos: X
Dentro dos grupos: Y
Total: 78
O valor do módulo de (X - Y) é igual a
Idade (anos) 23 24 25 26 27 Total Número de participantes 5 35 20 15 5 80
Sendo Me, Md, e Mo os valores da média aritmética (em anos por participante), da mediana e da moda, respectivamente, observa-se, com relação à tabela, que
Se o número de funcionários que tem um salário inferior a R$ 5.000,00 é igual a 56, então verifica-se que o número de funcionários que tem um salário igual ou superior a R$ 2.000,00 e inferior a R$ 8.000,00 é igual a
O modelo de componentes principais corresponde às combinações lineares não correlacionadas com vetores de coeficientes de comprimento unitário, que apresentam as maiores variâncias Var . Diante do exposto, é correto afirmar que
I. o primeiro componente principal é a combinação linear que maximiza Var sujeito a = 1.
II. o i-ésimo componente principal é a combinação linear que maximiza Var = 1 e Cov (, ) = 0, para k < i.
III. sendo os autovalores e ei os autovetores de S, o i-ésimo componente principal é dado por + , onde i = 1, ··· p.
IV. Var = 0, para i = 1,2, ···, p e i ≠ k.
V. a proporção da variância total devido ao k-ésimo componente principal é dada por para k = 1, ···, p.
Estão corretas apenas as afirmativas
( ) Quando os pontos do diagrama de dispersão do resíduo padronizado versus variável explicativa apresentar uma tendência, a inclusão do logaritmo da variável explicativa pode melhorar o modelo.
( ) Quando os pontos do diagrama de dispersão do resíduo versus variável omitida no modelo apresentar uma tendência linear, a inclusão da variável omitida pode melhorar o modelo.
( ) Quando o desenho esquemático (boxplot) dos resíduos padronizados apresentar observações além dos limites superior ou inferior, existe uma forte indicação da presença de outliers que devem ser investigados.
( ) Quando o desenho esquemático dos resíduos tem a distância entre a mediana e o primeiro quartil e a distância entre a mediana e o terceiro quartil bem distintas, existe uma forte indicação de que a distribuição das observações são assimétricas e o componente aleatório do modelo pode não ter distribuição normal.
( ) A suposição de homocedasticidade dos resíduos pode ser avaliada através de: teste de Levéne; teste de Brown & Forsythe; gráfico de resíduos versus valores preditos pelo modelo; gráfico do resíduo versus cada uma das variáveis incluídas no modelo.
A sequência está correta em
I. que pode ser discreto, se T = ; contínuo, se T = , ou multivariado, se .
II. pode ser uma variável discreta ou contínua.
III. os dois principais objetivos da análise de uma série temporal, a saber: compreender o mecanismo gerador e predizer o comportamento gerador e o comportamento futuro.
IV. a tendência é um efeito de longo prazo na média. Sazonalidade é um efeito ligado às variações periódicas. Ciclos são variações periódicas não associadas automaticamente a nenhuma medida temporal.
V. apresenta a família de modelos paramétricos de séries temporais, escrita de tal modo que cada observação corresponde a um sinal mais um ruído não correlacionado.
Estão corretas apenas as afirmativas