Questões de Concurso Sobre estatística descritiva (análise exploratória de dados) em estatística
Foram encontradas 3.862 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
O modelo de componentes principais corresponde às combinações lineares não correlacionadas com vetores de coeficientes de comprimento unitário, que apresentam as maiores variâncias Var . Diante do exposto, é correto afirmar que
I. o primeiro componente principal é a combinação linear que maximiza Var sujeito a = 1.
II. o i-ésimo componente principal é a combinação linear que maximiza Var = 1 e Cov (, ) = 0, para k < i.
III. sendo os autovalores e ei os autovetores de S, o i-ésimo componente principal é dado por + , onde i = 1, ··· p.
IV. Var = 0, para i = 1,2, ···, p e i ≠ k.
V. a proporção da variância total devido ao k-ésimo componente principal é dada por para k = 1, ···, p.
Estão corretas apenas as afirmativas
( ) Quando os pontos do diagrama de dispersão do resíduo padronizado versus variável explicativa apresentar uma tendência, a inclusão do logaritmo da variável explicativa pode melhorar o modelo.
( ) Quando os pontos do diagrama de dispersão do resíduo versus variável omitida no modelo apresentar uma tendência linear, a inclusão da variável omitida pode melhorar o modelo.
( ) Quando o desenho esquemático (boxplot) dos resíduos padronizados apresentar observações além dos limites superior ou inferior, existe uma forte indicação da presença de outliers que devem ser investigados.
( ) Quando o desenho esquemático dos resíduos tem a distância entre a mediana e o primeiro quartil e a distância entre a mediana e o terceiro quartil bem distintas, existe uma forte indicação de que a distribuição das observações são assimétricas e o componente aleatório do modelo pode não ter distribuição normal.
( ) A suposição de homocedasticidade dos resíduos pode ser avaliada através de: teste de Levéne; teste de Brown & Forsythe; gráfico de resíduos versus valores preditos pelo modelo; gráfico do resíduo versus cada uma das variáveis incluídas no modelo.
A sequência está correta em
I. que pode ser discreto, se T = ; contínuo, se T = , ou multivariado, se .
II. pode ser uma variável discreta ou contínua.
III. os dois principais objetivos da análise de uma série temporal, a saber: compreender o mecanismo gerador e predizer o comportamento gerador e o comportamento futuro.
IV. a tendência é um efeito de longo prazo na média. Sazonalidade é um efeito ligado às variações periódicas. Ciclos são variações periódicas não associadas automaticamente a nenhuma medida temporal.
V. apresenta a família de modelos paramétricos de séries temporais, escrita de tal modo que cada observação corresponde a um sinal mais um ruído não correlacionado.
Estão corretas apenas as afirmativas