Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 135 questões

Q2382972 Estatística
Considere o texto sobre economias de aglomeração no Brasil.

Quanto maior a escala da urbanização, maiores tendem a ser os ganhos de produtividade das firmas. Do mesmo modo, a maior diversidade de bens e serviços ofertados, de interações sociais e econômicas e de serviços públicos disponíveis para consumo da coletividade torna-se um diferencial de grande significado para a localização empresarial. Para o Brasil, no processo de desconcentração produtiva, mostrou-se que a localização de firmas industriais adquiriu um comportamento fortemente associado a economias de aglomeração dadas pelo estoque de infraestrutura e mão de obra qualificada: o tecido industrial tornou-se concentrado — e desconcentrou concentradamente — em uma grande porção do território entre o Sul e o Sudeste. Consideradas, de um lado, as motivações e lógicas do setor privado e os estímulos do mercado mundial e do território inercial do desenvolvimento brasileiro e, de outro lado, as motivações e os esforços governamentais, em sentido amplo, para atuação sobre novas geografias econômicas nacionais, identificam-se cinco tipos preferenciais de territórios predominantemente impactados e redefinidos pela potência das forças em atuação.
MONTEIRO NETO, A.; SILVA, R.; SEVERIAN, D. O território das atividades industriais no Brasil: a força das economias de aglomeração e urbanização. In: MONTEIRO NETO, A. (org.). Brasil, Brasis: reconfigurações territoriais da indústria no século XXI. Brasília, DF: Ipea, 2021, p. 256-258. Adaptado.

Na tipologia mencionada acima, encontram-se rearranjos territoriais que se prestam à análise das formas de aglomeração e os que concorrem para a desaglomeração.
Considerando-se especificamente os vetores que levam à concentração produtiva, identificam-se territórios predominantemente impactados e (re)definidos por
Alternativas
Q2353403 Estatística
A respeito da análise de conglomerados, analise as afirmativas a seguir.
I. Na execução do algoritmo K-means, é possível que a alocação de observações aos clusters não mude entre duas iterações sucessivas.
II. O uso de duas medidas de similaridade distintas pode produzir dois dendrogramas diferentes ao se aplicar um algoritmo de agrupamento aglomerativo para o mesmo conjunto de dados.
III. Em uma análise envolvendo duas variáveis, considere que, após a primeira iteração do algoritmo K-Means aplicado para agrupar sete observações em três clusters, C1, C2 e C3, obteve-se a seguinte configuração: C1={(2,2), (4,4), (6,6)}; C2={(0,4), (4,0)} e C3={(5,5), (9,9)}. Então, os respectivos centroides que darão seguimento à próxima iteração serão C1=(4,4), C2=(2,2) e C3=(7,7).
Está correto o que se afirma em
Alternativas
Q2353399 Estatística
Considere a realização de uma pesquisa exploratória para estudar o comportamento de indivíduos em relação ao hábito de se socializarem. Vinte e uma pessoas responderam a um conjunto de sete variáveis relacionadas ao tema. A escala de medida foi de 1 a 5, onde 1 representava a discordância total e 5 representava concordância total quanto à afirmação expressa na variável. Foi realizada uma análise fatorial ortogonal com extração das cargas fatoriais pelo método de componentes principais baseado na matriz de correlação das sete variáveis disponíveis.

Imagem associada para resolução da questão


De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
Alternativas
Q2341836 Estatística
A análise de componentes principais é utilizada para
Alternativas
Q2251217 Estatística
Em uma pesquisa foram identificadas as preferenciais por 3 tipos de equipamentos sociais para bairros da cidade de Itaipu segundo três classes de renda. Dada a tabela a seguir, pode-se notar que as preferências dos pesquisados variam conforme a classe de renda Imagem associada para resolução da questão

A técnica adequada de análise multivariada que resulta em uma medida padronizada que considera simultaneamente as diferenças entre as preferências para diferentes combinações de equipamentos sociais, segundo as 3 classes de renda, é
Alternativas
Q2251206 Estatística
A análise fatorial tem como objetivo principal descrever a variabilidade original de um vetor aleatório X com m componentes,
Alternativas
Q2219860 Estatística

      Um estudo coletou dados acerca da idade e do tempo de estudo de N = 62 indivíduos, dos quais 31 são do sexo masculino e 31 são do sexo feminino. As matrizes de covariância amostrais para os indivíduos do sexo masculino — S1 — e feminino — S2 —, referentes aos dados de idade e tempo de estudo,

são 


Acerca da estatística M, referida no texto, julgue os itens subseqüentes.
I M segue aproximadamente uma distribuição qui-quadrado.
II A distribuição amostral de M pressupõe que o par formado pela idade e o tempo de estudo siga aproximadamente uma distribuição normal bivariada.
III Para um valor N suficientemente grande, a estatística M segue aproximadamente uma distribuição normal padrão.
A quantidade de itens certos é igual a
Alternativas
Q2219859 Estatística

      Um estudo coletou dados acerca da idade e do tempo de estudo de N = 62 indivíduos, dos quais 31 são do sexo masculino e 31 são do sexo feminino. As matrizes de covariância amostrais para os indivíduos do sexo masculino — S1 — e feminino — S2 —, referentes aos dados de idade e tempo de estudo,

são 


A partir das informações apresentadas no texto, |S| é igual a
Alternativas
Q2217347 Estatística
Suponha que dois avaliadores tenham avaliado 100 propostas e que os resultados foram:
Imagem associada para resolução da questão

Para se avaliar a concordância entre os avaliadores, optou-se por usar o coeficiente Kappa, que é, no caso, igual a 
Alternativas
Q2217344 Estatística
Avalie se são vantagens da análise de componentes principais:
I. Retirar a multicolinearidade das variáveis pela transformação de um conjunto de variáveis originais intercorrelacionadas em um novo conjunto de variáveis não correlacionadas (componentes principais). II. Reduzir muitas variáveis a eixos ortogonais que representam algumas variáveis, o que permite explicar a variação dos dados de forma decrescente e independente. III. Apresentar pouca sensibilidade a outliers, notadamente quando há duplas ausências.
Está correto o que se afirma em 
Alternativas
Q2214174 Estatística
A tabela 6 apresenta alguns resultados da comparação realizada por meio de um teste t-Student, entre as médias da variável durabilidade que foi medida em itens selecionados aleatoriamente de dois lotes diferentes manufaturados pelo mesmo processo de produção, mas com matérias primas provenientes de fornecedores diferentes. Quanto maior o valor amostral observado maior é a durabilidade do item. Sendo assim, o objetivo é produzir itens com matéria-prima que resulte em maior durabilidade média. O teste t-Student foi realizado a 10% de significância. 
Imagem associada para resolução da questão

Pode-se, então, concluir que, na manufatura de itens desse processo de produção
Alternativas
Q2214172 Estatística
Numa pesquisa, observou-se uma amostra aleatória de tamanho n=100 do vetor aleatório X = [X1 X2 ... Xp]T, p =12. Um modelo de análise fatorial ortogonal com dois fatores foi ajustado aos dados utilizando-se a matriz de correlação amostral das 12 variáveis. O método de Componentes Principais foi utilizado na estimação das cargas fatoriais. Na tabela 5 apresentam-se os valores das cargas fatoriais estimadas para as variáveis Xe Xpadronizadas. 
              Tabela 5. Dados da questão 53 Variável                  Fator 1                Fator 2 X1padronizada           0,80                    0,10 Xpadronizada           0,20                    0,76
Nesse caso, pode-se dizer que a correlação estimada, pelo modelo de análise fatorial, entre as variáveis XXé aproximadamente igual a  
Alternativas
Q2214166 Estatística
Utilizou-se o método de agrupamento de Ward para separar em k=3 grupos, um conjunto de dados composto por n=230 elementos, tendo-se utilizado para agrupamento oito variáveis quantitativas medidas para cada elemento amostral. A partição resultou em valores de Soma de Quadrados entre grupos igual a 11.458,00 e Soma de Quadrados dentro dos grupos igual a 5.392,00.
Portanto, o valor do coeficiente de correlação intraclasse é igual a
Alternativas
Q2214164 Estatística
Seja [X1 X2 ... Xp]T um vetor aleatório de dimensão px1, p=10. Sabe-se que a matriz de covariâncias do vetor dada por Σpxp tem apenas q autovalores maiores do que zero, q<p. Uma análise de componentes principais foi realizada via decomposição da matriz Σpxp.
Com base nessas informações, assinale a alternativa que completa corretamente as lacunas da frase a seguir.
A matriz Σpxp é ________ e as variâncias das (p-q) componentes principais são ______. 
Alternativas
Q2214159 Estatística
Uma análise de agrupamento (cluster) foi realizada pelo método de ligação completa. A distância euclidiana ao quadrado foi utilizada na comparação dos elementos amostrais. Três variáveis aleatórias foram medidas em cada elemento amostral. Na tabela 2 apresentam-se os valores observados de dois elementos da amostra.
                 Tabela 2. Dados da questão 40    Elemento        Variável 1       Variável 2       Variável 3    1                     2                     3                     2    2                    -2                     2                     3
O valor da distância entre esses dois elementos amostrais é igual a
Alternativas
Q2164555 Estatística
Considere que um índice de desempenho acadêmico de 120 estudantes de uma instituição foi construído através da análise de componentes principais, tomando como base os valores das suas notas em quatro disciplinas X = (X1, X2, X3, X4). Os autovalores extraídos da matriz de covariâncias foram, respectivamente, iguais a 13, 4, 2, 1 e o primeiro autovetor normalizado foi e1 = (0,5; 0,2; 0,5; 0,7). O percentual de explicação da primeira componente principal e o valor do índice de desempenho de um estudante com notas X = (60, 70, 85, 80) são, respectivamente:
Alternativas
Q2164544 Estatística
A similaridade é um critério para medir a distância entre dois vetores, sendo um conceito essencial na análise de agrupamentos. A distância Euclidiana está entre as medidas de similaridade mais comuns. Considere que a variável X represente a idade (em anos) e que a variável Y represente a média do rendimento semestral global (medido numa escala de 0 a 10) de estudantes de um Instituto Federal de Educação. A tabela a seguir apresenta dados observados para as variáveis X e Y para três estudantes desse Instituto:
Estudante       Idade (X)    Rendimento (Y)    1                          21                   7    2                          22                   8    3                          18                   6
A distância Euclidiana para esse conjunto de dados é igual a:
Alternativas
Q2132858 Estatística

    Em uma análise dos resultados das urnas eleitorais, decidiu-se verificar quais variáveis estão mais relacionadas ao voto em candidatos de direita ou de esquerda. Os votos para os candidatos de direita e de esquerda foram analisados em separado para as 27 unidades da federação (UF), tendo como variáveis explicativas a idade (x1) e os anos de estudo (x2) dos eleitores. Em cada UF, foram analisados os votos de y eleitores e as estatísticas descritivas das variáveis utilizadas são mostradas na tabela a seguir.


00_84 - 92 .png (405×472)


Com base nessas informações, julgue o próximo item.


Em média, os candidatos de esquerda receberam mais votos que os candidatos da direita.

Alternativas
Q2096289 Estatística
A Análise de Componentes Principais (PCA) é uma técnica de transformação de dados que tem como objetivo encontrar as direções de maior variação nos dados, geralmente representadas pelos chamados componentes principais, e gerar novas representações dos dados.
Assinale o objetivo principal dessa técnica. 
Alternativas
Q2086179 Estatística
Após a extração dos fatores em uma análise fatorial, pode ser calculado o grau de adaptação das variáveis aos fatores por meio das cargas fatoriais. Normalmente, o que acontece é que a maior parte das variáveis tem cargas altas no fator mais importante e cargas baixas nos outros fatores, tornando a interpretação mais difícil. Nesse sentido, a técnica de rotação de fatores é utilizada para atingir uma melhor distinção entre os fatores. Nesse contexto, analise as afirmativas a seguir.
I. A rotação quartimax visa maximizar a dispersão da carga dos fatores de uma variável por todos os fatores, geralmente acarretando em muitas variáveis com cargas altas em um único fator.
II. A rotação varimax facilita a interpretação das cargas fatoriais.
III. A rotação promax é um método rápido desenvolvido para bancos de dados muito grandes.
É correto o que se afirma em
Alternativas
Respostas
21: C
22: A
23: A
24: B
25: C
26: C
27: C
28: A
29: C
30: B
31: A
32: A
33: D
34: A
35: D
36: C
37: A
38: E
39: B
40: A