Questões de Concurso
Sobre análise multivariada em estatística
Foram encontradas 135 questões
Quanto maior a escala da urbanização, maiores tendem a ser os ganhos de produtividade das firmas. Do mesmo modo, a maior diversidade de bens e serviços ofertados, de interações sociais e econômicas e de serviços públicos disponíveis para consumo da coletividade torna-se um diferencial de grande significado para a localização empresarial. Para o Brasil, no processo de desconcentração produtiva, mostrou-se que a localização de firmas industriais adquiriu um comportamento fortemente associado a economias de aglomeração dadas pelo estoque de infraestrutura e mão de obra qualificada: o tecido industrial tornou-se concentrado — e desconcentrou concentradamente — em uma grande porção do território entre o Sul e o Sudeste. Consideradas, de um lado, as motivações e lógicas do setor privado e os estímulos do mercado mundial e do território inercial do desenvolvimento brasileiro e, de outro lado, as motivações e os esforços governamentais, em sentido amplo, para atuação sobre novas geografias econômicas nacionais, identificam-se cinco tipos preferenciais de territórios predominantemente impactados e redefinidos pela potência das forças em atuação.
MONTEIRO NETO, A.; SILVA, R.; SEVERIAN, D. O território das atividades industriais no Brasil: a força das economias de aglomeração e urbanização. In: MONTEIRO NETO, A. (org.). Brasil, Brasis: reconfigurações territoriais da indústria no século XXI. Brasília, DF: Ipea, 2021, p. 256-258. Adaptado.
Na tipologia mencionada acima, encontram-se rearranjos territoriais que se prestam à análise das formas de aglomeração e os que concorrem para a desaglomeração.
Considerando-se especificamente os vetores que levam à concentração produtiva, identificam-se territórios predominantemente impactados e (re)definidos por
I. Na execução do algoritmo K-means, é possível que a alocação de observações aos clusters não mude entre duas iterações sucessivas.
II. O uso de duas medidas de similaridade distintas pode produzir dois dendrogramas diferentes ao se aplicar um algoritmo de agrupamento aglomerativo para o mesmo conjunto de dados.
III. Em uma análise envolvendo duas variáveis, considere que, após a primeira iteração do algoritmo K-Means aplicado para agrupar sete observações em três clusters, C1, C2 e C3, obteve-se a seguinte configuração: C1={(2,2), (4,4), (6,6)}; C2={(0,4), (4,0)} e C3={(5,5), (9,9)}. Então, os respectivos centroides que darão seguimento à próxima iteração serão C1=(4,4), C2=(2,2) e C3=(7,7).
Está correto o que se afirma em
De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
A técnica adequada de análise multivariada que resulta em uma medida padronizada que considera simultaneamente as diferenças entre as preferências para diferentes combinações de equipamentos sociais, segundo as 3 classes de renda, é
Um estudo coletou dados acerca da idade e do tempo de estudo de N = 62 indivíduos, dos quais 31 são do sexo masculino e 31 são do sexo feminino. As matrizes de covariância amostrais para os indivíduos do sexo masculino — S1 — e feminino — S2 —, referentes aos dados de idade e tempo de estudo,
são
I M segue aproximadamente uma distribuição qui-quadrado.
II A distribuição amostral de M pressupõe que o par formado pela idade e o tempo de estudo siga aproximadamente uma distribuição normal bivariada.
III Para um valor N suficientemente grande, a estatística M segue aproximadamente uma distribuição normal padrão.
A quantidade de itens certos é igual a
Um estudo coletou dados acerca da idade e do tempo de estudo de N = 62 indivíduos, dos quais 31 são do sexo masculino e 31 são do sexo feminino. As matrizes de covariância amostrais para os indivíduos do sexo masculino — S1 — e feminino — S2 —, referentes aos dados de idade e tempo de estudo,
são
Para se avaliar a concordância entre os avaliadores, optou-se por usar o coeficiente Kappa, que é, no caso, igual a
I. Retirar a multicolinearidade das variáveis pela transformação de um conjunto de variáveis originais intercorrelacionadas em um novo conjunto de variáveis não correlacionadas (componentes principais). II. Reduzir muitas variáveis a eixos ortogonais que representam algumas variáveis, o que permite explicar a variação dos dados de forma decrescente e independente. III. Apresentar pouca sensibilidade a outliers, notadamente quando há duplas ausências.
Está correto o que se afirma em
Pode-se, então, concluir que, na manufatura de itens desse processo de produção
Tabela 5. Dados da questão 53 Variável Fator 1 Fator 2 X1padronizada 0,80 0,10 X2 padronizada 0,20 0,76
Nesse caso, pode-se dizer que a correlação estimada, pelo modelo de análise fatorial, entre as variáveis X1 e X2 é aproximadamente igual a
Portanto, o valor do coeficiente de correlação intraclasse é igual a
Com base nessas informações, assinale a alternativa que completa corretamente as lacunas da frase a seguir.
A matriz Σpxp é ________ e as variâncias das (p-q) componentes principais são ______.
Tabela 2. Dados da questão 40 Elemento Variável 1 Variável 2 Variável 3 1 2 3 2 2 -2 2 3
O valor da distância entre esses dois elementos amostrais é igual a
Estudante Idade (X) Rendimento (Y) 1 21 7 2 22 8 3 18 6
A distância Euclidiana para esse conjunto de dados é igual a:
Em uma análise dos resultados das urnas eleitorais, decidiu-se verificar quais variáveis estão mais relacionadas ao voto em candidatos de direita ou de esquerda. Os votos para os candidatos de direita e de esquerda foram analisados em separado para as 27 unidades da federação (UF), tendo como variáveis explicativas a idade (x1) e os anos de estudo (x2) dos eleitores. Em cada UF, foram analisados os votos de y eleitores e as estatísticas descritivas das variáveis utilizadas são mostradas na tabela a seguir.
Com base nessas informações, julgue o próximo item.
Em média, os candidatos de esquerda receberam mais votos
que os candidatos da direita.
Assinale o objetivo principal dessa técnica.
I. A rotação quartimax visa maximizar a dispersão da carga dos fatores de uma variável por todos os fatores, geralmente acarretando em muitas variáveis com cargas altas em um único fator.
II. A rotação varimax facilita a interpretação das cargas fatoriais.
III. A rotação promax é um método rápido desenvolvido para bancos de dados muito grandes.
É correto o que se afirma em