Questões de Estatística - Componentes principais para Concurso
Foram encontradas 36 questões
matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117
matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117
I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.
II. é a matriz de covariâncias do vetor aleatório X de dimensão (2X1), então a matriz de correlações de X é P =
III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.
IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.
Está correto o que se afirma APENAS em
I. Na análise fatorial nenhuma variável é definida como dependente ou independente.
II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.
III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.
IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.
Está correto o que consta APENAS em
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?