Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 135 questões

Q895768 Estatística

Um estudo de análise fatorial considerou um conjunto de dados constituído por cinco variáveis. Restringindo-se aos dois primeiros fatores, a tabela a seguir mostra as cargas fatoriais correspondentes a essas variáveis e as respectivas comunalidades. 


                          

Com referência a essas informações e à tabela precedente, julgue o item subsecutivo.

As comunalidades c1 e c2 são iguais.
Alternativas
Q876253 Estatística

Julgue o item que se segue, relativo a análise multivariada.


Em uma análise de componente principal (PCA), o primeiro componente principal será aquele determinado pelo autovetor do maior autovalor entre aqueles da matriz de variâncias e covariâncias do conjunto em análise.

Alternativas
Ano: 2013 Banca: NC-UFPR Órgão: UFPR Prova: NC-UFPR - 2013 - UFPR - Estatístico |
Q827153 Estatística

A respeito das medidas de similaridade e dissimilaridade no âmbito da teoria de análise de agrupamentos (cluster), considere as seguintes afirmativas:

1. A distância de Minkowsky entre dois pontos Xl e Xk é muito mais afetada pela presença de valores discrepantes na amostra do que a distância euclidiana. Para λ = 1, a distância de Minkowsky é conhecida como city-block ou Manhattan.

2. O coeficiente de concordância positiva é definido como o número de pares realmente concordantes em relação ao número total de pares. Quanto maior o seu valor, maior é a concordância entre os elementos comparados, razão pela qual é um índice de similaridade.

3. A distância euclidiana média revela que, quanto menor o valor da distância, maior será a similaridade dos elementos comparados; portanto é um índice de discordância ou de dissimilaridade.

4. O coeficiente de Jaccard tem o mesmo objetivo que o coeficiente de concordância positiva. A diferença é que a proporção de pares concordantes é calculada em relação ao número total de pares, excluindo-se os pares do tipo (0 0).

Assinale a alternativa correta.

Alternativas
Q818213 Estatística
São técnicas, da Análise Multivariada, que estudam a estrutura de covariância de um vetor aleatório:
Alternativas
Q814707 Estatística
O governo do Estado do Paraná deseja avaliar as condições de vida dos seus habitantes, e para isso realizou um levantamento do perfil socioeconômico da população, utilizando informações do Censo Demográfico de 2010, disponibilizadas pelo Instituto de Geografia e Estatística (IBGE), com intuito de criar um indicador que represente as variáveis originais, obtendo assim uma medida geral e sintética da condição de vida da população paranaense. Nesse sentido, empregou-se a técnica de Análise Multivariada de Dados - Análise Fatorial. Diante do exposto e com base na tabela abaixo que apresenta os resultados da Análise Fatorial, é correto afirmar: Imagem associada para resolução da questão
Alternativas
Q785225 Estatística
Sobre a análise fatorial e suas propriedades, assinale a afirmativa INCORRETA.
Alternativas
Q783191 Estatística
Acerca da Análise Multivariada, considere: I. Na análise fatorial, o critério varimax é um método de rotação fatorial ortogonal para se conseguir uma estrutura fatorial simplificada. II. O princípio subjacente da análise de correlação canônica é desenvolver uma combinação linear de cada conjunto de variáveis, dependentes e independentes, visando minimizar a correlação entre os dois conjuntos. III. A análise de correspondência acomoda tanto dados não métricos quanto relações não lineares. IV. A análise discriminante é apropriada quando a variável dependente é categórica e as variáveis independentes são métricas. Está correto o que consta APENAS em 
Alternativas
Q782464 Estatística
Considere as seguintes afirmações:
I. A análise fatorial é, geralmente, aplicada sobre variáveis métricas, apesar de existirem métodos especiais para o emprego dessa técnica a variáveis dicotômicas. II. Na análise discriminante, a variável dependente deve ser não métrica e as variáveis independentes devem indicar diferenças entre, pelo menos, dois grupos. III. A análise de correspondência não é adequada para pesquisa aleatória e não é sensível a observações atípicas. IV. Na análise de agrupamentos, as medidas de similaridade mais utilizadas são as correlacionais.
Está correto o que consta APENAS em
Alternativas
Q770470 Estatística
Na Análise Fatorial Exploratória, a comunalidade é um dos principais indicadores de ajuste de aplicação da técnica. A definição mais adequada para essa medida é:
Alternativas
Q537294 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O segundo componente principal representa o antagonismo entre saldo e salário versus tempo e idade.
Alternativas
Q537292 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
No dendograma, nota-se que idade e tempo foram as variáveis mais relevantes. Porém, saldo médio e salário foram mais relevantes na análise de componentes principais. Isso enfatiza que os propósitos das análises são diferentes, conduzindo a conclusões diferentes.
Alternativas
Q536060 Estatística
   Para avaliar o desempenho do transporte público por ônibus em determinada cidade, realizou-se um estudo estatístico mediante o uso de técnicas de análise multivariada de dados. Por meio desse estudo, foram identificados os grupos (homogêneos) de usuários, considerando-se a satisfação global dos serviços de transporte público, assim como os principais fatores que influenciam na opinião sobre esses serviços. O estudo identificou, por exemplo, aspectos como confiabilidade, segurança, tarifa e locais de parada como os mais importantes para se discriminar os usuários insatisfeitos daqueles que se consideram satisfeitos.


No que se refere aos métodos estatísticos de análise multivariada empregados na situação descrita acima, julgue o seguinte item.


Empregando-se a análise discriminante, é possível separar estatisticamente os usuários insatisfeitos daqueles que se consideram satisfeitos, com base nas características do usuário. Essa técnica é uma forma especializada de regressão em que se ajusta a probabilidade de um indivíduo pertencer a um grupo ou a outro grupo com base no seu perfil (como, por exemplo, idade, gênero, renda e escolaridade).


Alternativas
Q521286 Estatística

Considere:


I. O dendograma é uma representação gráfica útil na análise de agrupamentos que mostra como os agrupamentos são combinados em cada passo do procedimento.


II. Na análise fatorial os métodos de rotação têm por objetivo simplificar as linhas e colunas da matriz fatorial para facilitar a sua interpretação. Os métodos de rotação podem ser ortogonais ou oblíquos.


III. Sabe-se que a variável aleatória Imagem associada para resolução da questão tem distribuição multivariada com vetor de medias μ e matriz de covariâncias V dadas por: μ = Imagem associada para resolução da questão e V = Imagem associada para resolução da questão . Sendo Z = 2X1 + X2, a variância de Z é igual a 9.


IV. As técnicas de análise multivariada podem ser classificadas como técnicas de dependência e de interdependência. A análise fatorial é uma técnica de interdependência.


Está correto o que se afirma APENAS em

Alternativas
Ano: 2015 Banca: FCC Órgão: CNMP Prova: FCC - 2015 - CNMP - Analista do CNMP - Estatística |
Q481337 Estatística
Considere as seguintes afirmações:

I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.

II.imagem-026.jpg é a matriz de covariâncias do vetor aleatório X de dimensão (2X1), então a matriz de correlações de X é P = imagem-027.jpg

III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.

IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.

Está correto o que se afirma APENAS em
Alternativas
Q463069 Estatística
Seja Y uma variável qualitativa binária.

Selecionou-se uma amostra aleatória simples, de tamanho 16, Y1 , Y2 , ..., Y16 , para se estudar uma característica tal que: imagem-011.jpg

Sabe-se que ocorreram 10 sucessos.
A variância dessa amostra é
Alternativas
Q457299 Estatística
Sobre análise multivariada, considere:

I. Na análise fatorial nenhuma variável é definida como dependente ou independente.

II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.

III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.

IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.

Está correto o que consta APENAS em
Alternativas
Q452952 Estatística
O modelo de análise fatorial representa a estrutura de cova- riância entre muitas variáveis aleatórias imagem-071.jpg, através de poucas variáveis não observáveis F´ = [imagem-072.jpg imagem-073.jpg ] também conhecidas como fatores, construtos ou fatores comuns. Sendo E(X) = µ e V(X) = S, o modelo fatorial é expresso por X – µ = LF + e. A matriz imagem-074.jpg é conhecida como matriz das cargas fatoriais e seus elementos, imagem-076.jpg , carga da variável i no fator j e as variáveis aleatórias F e em + p são não observáveis. Analise as afirmativas, marque V para as verdadeiras e F para as falsas.

( ) No modelo fatorial ortogonal, as variáveis não observáveis F e e são independentes, E(F) = 0, V(F) = E(F´F) = I, E(e) = 0, V(e) = E(e´e) = ?. A matriz ? é não diagonal, V(X) = S = L´L + ? e Cov (X, F) = L.
( ) Um método de estimação para as cargas do modelo fatorial ortogonal é através de componentes principais, onde se utiliza a decomposição espectral da matriz S.
( ) Para se utilizar o método de máxima verossimilhança para estimar as cargas, é acrescida a suposição de que F e e têm distribuição normal multivariada. As comunalidades (elementos da diagonal LL´) têm como estimadores a proporção da variância total estimada pelo particular fator.
( ) Para melhorar a explicação do modelo fatorial, sem alterar a ortogonalidade dos fatores, muitas vezes, usa- se uma transformação ortogonal das cargas fatoriais, que, consequentemente, transforma os fatores. Esse procedimento é conhecido como rotação fatorial.
( ) Dependendo da natureza dos dados, os fatores não precisam ser ortogonais. Assim, para melhorar a explicação do modelo fatorial, pode-se utilizar a rotação oblíqua, onde cada variável é expressa em termos de um número máximo de fatores.
A sequência está correta em
Alternativas
Q443964 Estatística
A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:

I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.

II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.

III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.

IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.

VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.

Dentre as seis afirmações dadas, quantas são falsas?
Alternativas
Q424237 Estatística
Considere as afirmativas abaixo.

I. O estimador de intensidade é útil para nos fornecer uma visão geral da distribuição em primeira ordem dos eventos.

II. O kernel é dependente do raio e pode ser utilizado na avaliação da distribuição de eventos pontuais.

III. Akrigagem é um método de interpolação aplicado apenas para análises de dados quantitativos.

Está(ão) correta(s) a(s) afirmativa(s):
Alternativas
Q424236 Estatística
A figura abaixo indica um diagrama de espalhamento de Moran para um determinado índice, em que o quadrante Q2 indica valores:

imagem-005.jpg
Alternativas
Respostas
61: C
62: C
63: D
64: C
65: E
66: B
67: E
68: B
69: C
70: C
71: E
72: E
73: C
74: E
75: B
76: E
77: C
78: C
79: C
80: E