Questões de Concurso
Sobre componentes principais em estatística
Foram encontradas 36 questões
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a
De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
I. Retirar a multicolinearidade das variáveis pela transformação de um conjunto de variáveis originais intercorrelacionadas em um novo conjunto de variáveis não correlacionadas (componentes principais). II. Reduzir muitas variáveis a eixos ortogonais que representam algumas variáveis, o que permite explicar a variação dos dados de forma decrescente e independente. III. Apresentar pouca sensibilidade a outliers, notadamente quando há duplas ausências.
Está correto o que se afirma em
Tabela 5. Dados da questão 53 Variável Fator 1 Fator 2 X1padronizada 0,80 0,10 X2 padronizada 0,20 0,76
Nesse caso, pode-se dizer que a correlação estimada, pelo modelo de análise fatorial, entre as variáveis X1 e X2 é aproximadamente igual a
Com base nessas informações, assinale a alternativa que completa corretamente as lacunas da frase a seguir.
A matriz Σpxp é ________ e as variâncias das (p-q) componentes principais são ______.
Assinale o objetivo principal dessa técnica.
( ) Para utilizar a Regressão logística não são necessárias as suposições de que a amostra tenha urna distribuição normal multivariada e que as matrizes de variância/covariância sejam iguais dento dos grupos. ( ) Tanto a análise discriminante quanto a Regressão Logística têm testes estatísticos diretos, habilidade para incorporar efeitos não lineares, e uma gama extensiva de diagnósticos. ( ) Uma vantagem da regressão logística é que só se precisa saber se um evento (ocorrência ou não, fracasso ou sucesso) aconteceu e podemos dessa forma utilizar um valor dicotômico como variável dependente. O procedimento prediz a estimativa da probabilidade que o evento vai ou não acontecer. ( ) Em vez de minimizar o quadrado dos desvios, a Regressão Logística minimiza a probabilidade de que o evento ocorra.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
Considerando a análise de componentes principais, assinale a alternativa que traz a taxa de variação explicada por autovalor1 e autovalor2.
I. O objetivo principal da ACP é obter variáveis não correlacionadas que retenham a maior parte da estrutura de variabilidade e correlação, a partir das variáveis originais, por meio de transformações lineares para reduzir a dimensão, medida pelo número de variáveis, da matriz de dados. II. A ACP possibilita a compreensão de aspectos do comportamento dos dados difíceis de serem deduzidos a partir das variáveis originais. III. Em geral, a ACP permite que se usem metodologias de análise univariada.
As afirmativas são, respectivamente,
Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:
Componente Autovalor Percentagem da variância Percentagem Acumulada
1 5,813 69,095 69,095
2 2,350 27,933 97,028
3 0,25 2,971 100,000
Variável Autovetor 1 Autovetor 2 Autovetor 3
X1 -0,39 0,0 0,89
X2 0,95 0,0 0,40
X3 0,00 1,0 0,0
Considerando o exposto, assinale a alternativa que apresenta a primeira
componente principal.
matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117
matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117
I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.
II. é a matriz de covariâncias do vetor aleatório X de dimensão (2X1), então a matriz de correlações de X é P =
III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.
IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.
Está correto o que se afirma APENAS em
I. Na análise fatorial nenhuma variável é definida como dependente ou independente.
II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.
III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.
IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.
Está correto o que consta APENAS em
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?