Questões de Concurso
Sobre análise multivariada em estatística
Foram encontradas 140 questões
Acerca de planejamento de pesquisa estatística, julgue o item que se segue.
Em um modelo estatístico, o erro total corresponde à soma
dos desvios das observações em relação ao modelo.
Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:
Componente Autovalor Percentagem da variância Percentagem Acumulada
1 5,813 69,095 69,095
2 2,350 27,933 97,028
3 0,25 2,971 100,000
Variável Autovetor 1 Autovetor 2 Autovetor 3
X1 -0,39 0,0 0,89
X2 0,95 0,0 0,40
X3 0,00 1,0 0,0
Considerando o exposto, assinale a alternativa que apresenta a primeira
componente principal.
No estudo da análise multivariada, existe uma técnica para análise de dados que tem como objetivo dividir os elementos da amostra, ou população, em grupos de forma que os elementos pertencentes a um mesmo grupo sejam similares entre si com respeito às variáveis que neles foram medidas, e os elementos em grupos diferentes sejam heterogêneos com relação a essas mesmas características.
Essa técnica denomina-se análise
Um estudo de análise fatorial considerou um conjunto de dados constituído por cinco variáveis. Restringindo-se aos dois primeiros fatores, a tabela a seguir mostra as cargas fatoriais correspondentes a essas variáveis e as respectivas comunalidades.
As comunalidades c1 e c2 são iguais.
Julgue o item que se segue, relativo a análise multivariada.
Em uma análise de componente principal (PCA), o primeiro
componente principal será aquele determinado pelo autovetor
do maior autovalor entre aqueles da matriz de variâncias e
covariâncias do conjunto em análise.
A respeito das medidas de similaridade e dissimilaridade no âmbito da teoria de análise de agrupamentos (cluster), considere as seguintes afirmativas:
1. A distância de Minkowsky entre dois pontos Xl e Xk é muito mais afetada pela presença de valores discrepantes na amostra do que a distância euclidiana. Para λ = 1, a distância de Minkowsky é conhecida como city-block ou Manhattan.
2. O coeficiente de concordância positiva é definido como o número de pares realmente concordantes em relação ao número total de pares. Quanto maior o seu valor, maior é a concordância entre os elementos comparados, razão pela qual é um índice de similaridade.
3. A distância euclidiana média revela que, quanto menor o valor da distância, maior será a similaridade dos elementos comparados; portanto é um índice de discordância ou de dissimilaridade.
4. O coeficiente de Jaccard tem o mesmo objetivo que o coeficiente de concordância positiva. A diferença é que a proporção de pares concordantes é calculada em relação ao número total de pares, excluindo-se os pares do tipo (0 0).
Assinale a alternativa correta.

I. A análise fatorial é, geralmente, aplicada sobre variáveis métricas, apesar de existirem métodos especiais para o emprego dessa técnica a variáveis dicotômicas. II. Na análise discriminante, a variável dependente deve ser não métrica e as variáveis independentes devem indicar diferenças entre, pelo menos, dois grupos. III. A análise de correspondência não é adequada para pesquisa aleatória e não é sensível a observações atípicas. IV. Na análise de agrupamentos, as medidas de similaridade mais utilizadas são as correlacionais.
Está correto o que consta APENAS em

matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117

matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117
No que se refere aos métodos estatísticos de análise multivariada empregados na situação descrita acima, julgue o seguinte item.
Empregando-se a análise discriminante, é possível separar estatisticamente os usuários insatisfeitos daqueles que se consideram satisfeitos, com base nas características do usuário. Essa técnica é uma forma especializada de regressão em que se ajusta a probabilidade de um indivíduo pertencer a um grupo ou a outro grupo com base no seu perfil (como, por exemplo, idade, gênero, renda e escolaridade).
Considere:
I. O dendograma é uma representação gráfica útil na análise de agrupamentos que mostra como os agrupamentos são combinados em cada passo do procedimento.
II. Na análise fatorial os métodos de rotação têm por objetivo simplificar as linhas e colunas da matriz fatorial para facilitar a sua interpretação. Os métodos de rotação podem ser ortogonais ou oblíquos.
III. Sabe-se que a variável aleatória tem distribuição multivariada com vetor de medias μ e matriz de covariâncias
V dadas por: μ =
e V =
. Sendo Z = 2X1 + X2, a variância de Z é igual a 9.
IV. As técnicas de análise multivariada podem ser classificadas como técnicas de dependência e de interdependência. A análise fatorial é uma técnica de interdependência.
Está correto o que se afirma APENAS em
I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.
II.


III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.
IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.
Está correto o que se afirma APENAS em