Questões de Concurso
Sobre componentes principais em estatística
Foram encontradas 37 questões
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?

I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.
Com base nessas informações, julgue os itens a seguir.
Com base nessas informações, julgue os itens a seguir.
Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.
A partir dessa situação, julgue o item.
Em uma análise multivariada, as variáveis X1, X2 e X3 possuem
matriz de covariâncias dada por, e as seguintes componentes principais:
C1 = 0,7071X1 + 0,7071X2;
C2 = 0,7071X1 – 0,7071X2;
C3 = X3.
Com base nessas informações, julgue o item.
Nessa situação, considerando-se p =10, é correto afirmar que ρ < 0,75.
I. Na análise de componentes principais a informação contida em um vetor aleatório
p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional
(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.
II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.
III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.
Dentre as afirmações acima são verdadeiras APENAS
I. Os componentes principais amostrais são combinações lineares das variáveis mensuradas que maximizam a variação total da amostra e que são mutuamente ortogonais.
II. O algoritmo das k-médias é um tipo de agrupamento não hierárquico que particiona n objetos em k grupos.
III. O método de correlação canônica analisa combinações não lineares das variáveis em dois grupos para determinar as combinações que possuem a maior correlação.
Assinale
principais.
I. Na análise de correspondência usa-se como medida de similaridade a distância Euclidiana média.
II. O objetivo principal da análise de componentes principais é o de explicar a estrutura de variância e covariância de um vetor aleatório, composto por n variáveis aleatórias, através da construção de combinações lineares das variáveis originais.
III. O escalonamento dimensional é uma técnica matemática apropriada para representar graficamente n elementos num espaço de dimensão menor que o original, tendo-se em consideração a distância ou similaridade que os elementos têm entre si.
IV. Na análise de agrupamentos, uma medida de similaridade que pode ser utilizada é a distância Euclidiana.
Dentre essas afirmações citadas são verdadeiras SOMENTE
I. Na análise de componentes principais a obtenção das componentes principais envolve a decomposição da matriz de covariâncias do vetor aleatório de interesse.
II. Na análise discriminante não é necessário que os grupos nos quais cada elemento amostral pode ser classificado sejam conhecidos à priori.
III. O escalonamento dimensional gera uma medida de ajuste denominada Stress que quanto mais próxima de 1 estiver melhor será o ajuste.
IV. Na análise de agrupamentos, para que se possa proceder ao agrupamento de elementos, é necessário se decidir à priori a medida de similaridade ou dissimilaridade que será usada.
Dentre essas afirmações citadas são verdadeiras SOMENTE
