Questões de Concurso Sobre componentes principais em estatística

Foram encontradas 36 questões

Q2568645 Estatística
Técnica de análise multivariada que permite estabelecer a probabilidade de ocorrência de determinado evento para situações em que a variável dependente é qualitativa e de natureza dicotômica. Pode ser utilizada mesmo quando alguns dos pressupostos da análise discriminante não forem atendidos. Com base nesse conceito, assinale a alternativa correta.
Alternativas
Q2383284 Estatística
Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a
Alternativas
Q2353399 Estatística
Considere a realização de uma pesquisa exploratória para estudar o comportamento de indivíduos em relação ao hábito de se socializarem. Vinte e uma pessoas responderam a um conjunto de sete variáveis relacionadas ao tema. A escala de medida foi de 1 a 5, onde 1 representava a discordância total e 5 representava concordância total quanto à afirmação expressa na variável. Foi realizada uma análise fatorial ortogonal com extração das cargas fatoriais pelo método de componentes principais baseado na matriz de correlação das sete variáveis disponíveis.

Imagem associada para resolução da questão


De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
Alternativas
Q2341836 Estatística
A análise de componentes principais é utilizada para
Alternativas
Q2217344 Estatística
Avalie se são vantagens da análise de componentes principais:
I. Retirar a multicolinearidade das variáveis pela transformação de um conjunto de variáveis originais intercorrelacionadas em um novo conjunto de variáveis não correlacionadas (componentes principais). II. Reduzir muitas variáveis a eixos ortogonais que representam algumas variáveis, o que permite explicar a variação dos dados de forma decrescente e independente. III. Apresentar pouca sensibilidade a outliers, notadamente quando há duplas ausências.
Está correto o que se afirma em 
Alternativas
Q2214172 Estatística
Numa pesquisa, observou-se uma amostra aleatória de tamanho n=100 do vetor aleatório X = [X1 X2 ... Xp]T, p =12. Um modelo de análise fatorial ortogonal com dois fatores foi ajustado aos dados utilizando-se a matriz de correlação amostral das 12 variáveis. O método de Componentes Principais foi utilizado na estimação das cargas fatoriais. Na tabela 5 apresentam-se os valores das cargas fatoriais estimadas para as variáveis Xe Xpadronizadas. 
              Tabela 5. Dados da questão 53 Variável                  Fator 1                Fator 2 X1padronizada           0,80                    0,10 Xpadronizada           0,20                    0,76
Nesse caso, pode-se dizer que a correlação estimada, pelo modelo de análise fatorial, entre as variáveis XXé aproximadamente igual a  
Alternativas
Q2214164 Estatística
Seja [X1 X2 ... Xp]T um vetor aleatório de dimensão px1, p=10. Sabe-se que a matriz de covariâncias do vetor dada por Σpxp tem apenas q autovalores maiores do que zero, q<p. Uma análise de componentes principais foi realizada via decomposição da matriz Σpxp.
Com base nessas informações, assinale a alternativa que completa corretamente as lacunas da frase a seguir.
A matriz Σpxp é ________ e as variâncias das (p-q) componentes principais são ______. 
Alternativas
Q2164555 Estatística
Considere que um índice de desempenho acadêmico de 120 estudantes de uma instituição foi construído através da análise de componentes principais, tomando como base os valores das suas notas em quatro disciplinas X = (X1, X2, X3, X4). Os autovalores extraídos da matriz de covariâncias foram, respectivamente, iguais a 13, 4, 2, 1 e o primeiro autovetor normalizado foi e1 = (0,5; 0,2; 0,5; 0,7). O percentual de explicação da primeira componente principal e o valor do índice de desempenho de um estudante com notas X = (60, 70, 85, 80) são, respectivamente:
Alternativas
Q2096289 Estatística
A Análise de Componentes Principais (PCA) é uma técnica de transformação de dados que tem como objetivo encontrar as direções de maior variação nos dados, geralmente representadas pelos chamados componentes principais, e gerar novas representações dos dados.
Assinale o objetivo principal dessa técnica. 
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073939 Estatística
Identifique abaixo as afirmativas verdadeiras ( V ) e as falsas ( F ) sobre a Regressão Logística.
( ) Para utilizar a Regressão logística não são necessárias as suposições de que a amostra tenha urna distribuição normal multivariada e que as matrizes de variância/covariância sejam iguais dento dos grupos. ( ) Tanto a análise discriminante quanto a Regressão Logística têm testes estatísticos diretos, habilidade para incorporar efeitos não lineares, e uma gama extensiva de diagnósticos. ( ) Uma vantagem da regressão logística é que só se precisa saber se um evento (ocorrência ou não, fracasso ou sucesso) aconteceu e podemos dessa forma utilizar um valor dicotômico como variável dependente. O procedimento prediz a estimativa da probabilidade que o evento vai ou não acontecer. ( ) Em vez de minimizar o quadrado dos desvios, a Regressão Logística minimiza a probabilidade de que o evento ocorra.

Assinale a alternativa que indica a sequência correta, de cima para baixo.
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073938 Estatística
Considere a matriz de variância e covariância a seguir, e que os dois maiores autovalores dessa matriz sejam autovalor1 = 5,7 e autovalor2 = 4,3.
Imagem associada para resolução da questão



Considerando a análise de componentes principais, assinale a alternativa que traz a taxa de variação explicada por autovalor1 e autovalor2.
Alternativas
Q2023201 Estatística
Em relação à Análise de Componentes Principais (ACP), avalie se as afirmativas a seguir são falsas (F) ou verdadeiras (V).
I. O objetivo principal da ACP é obter variáveis não correlacionadas que retenham a maior parte da estrutura de variabilidade e correlação, a partir das variáveis originais, por meio de transformações lineares para reduzir a dimensão, medida pelo número de variáveis, da matriz de dados. II. A ACP possibilita a compreensão de aspectos do comportamento dos dados difíceis de serem deduzidos a partir das variáveis originais. III. Em geral, a ACP permite que se usem metodologias de análise univariada.
As afirmativas são, respectivamente,
Alternativas
Q1160288 Estatística
Considerando as informações contidas na questão anterior n° 56, referente à análise de componentes principais, qual é a matriz de covariâncias do vetor de componentes principais?
Alternativas
Q1160287 Estatística

Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:


Componente     Autovalor     Percentagem da variância     Percentagem Acumulada

         1                 5,813                       69,095                                     69,095

         2                 2,350                       27,933                                     97,028

         3                 0,25                           2,971                                   100,000


Variável     Autovetor 1     Autovetor 2     Autovetor 3

    X1              -0,39                 0,0                 0,89

    X2               0,95                 0,0                 0,40

    X3               0,00                 1,0                 0,0

Considerando o exposto, assinale a alternativa que apresenta a primeira componente principal.

Alternativas
Q818213 Estatística
São técnicas, da Análise Multivariada, que estudam a estrutura de covariância de um vetor aleatório:
Alternativas
Q537294 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O segundo componente principal representa o antagonismo entre saldo e salário versus tempo e idade.
Alternativas
Q537292 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
No dendograma, nota-se que idade e tempo foram as variáveis mais relevantes. Porém, saldo médio e salário foram mais relevantes na análise de componentes principais. Isso enfatiza que os propósitos das análises são diferentes, conduzindo a conclusões diferentes.
Alternativas
Ano: 2015 Banca: FCC Órgão: CNMP Prova: FCC - 2015 - CNMP - Analista do CNMP - Estatística |
Q481337 Estatística
Considere as seguintes afirmações:

I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.

II.imagem-026.jpg é a matriz de covariâncias do vetor aleatório X de dimensão (2X1), então a matriz de correlações de X é P = imagem-027.jpg

III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.

IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.

Está correto o que se afirma APENAS em
Alternativas
Q457299 Estatística
Sobre análise multivariada, considere:

I. Na análise fatorial nenhuma variável é definida como dependente ou independente.

II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.

III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.

IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.

Está correto o que consta APENAS em
Alternativas
Q443964 Estatística
A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:

I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.

II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.

III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.

IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.

VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.

Dentre as seis afirmações dadas, quantas são falsas?
Alternativas
Respostas
1: B
2: D
3: A
4: B
5: B
6: A
7: A
8: C
9: B
10: C
11: D
12: C
13: B
14: A
15: C
16: C
17: E
18: E
19: E
20: C