Questões de Concurso
Sobre análise multivariada em estatística
Foram encontradas 140 questões
Selecionou-se uma amostra aleatória simples, de tamanho 16, Y1 , Y2 , ..., Y16 , para se estudar uma característica tal que:

Sabe-se que ocorreram 10 sucessos.
A variância dessa amostra é
I. Na análise fatorial nenhuma variável é definida como dependente ou independente.
II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.
III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.
IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.
Está correto o que consta APENAS em





( ) No modelo fatorial ortogonal, as variáveis não observáveis F e e são independentes, E(F) = 0, V(F) = E(F´F) = I, E(e) = 0, V(e) = E(e´e) = ?. A matriz ? é não diagonal, V(X) = S = L´L + ? e Cov (X, F) = L.
( ) Um método de estimação para as cargas do modelo fatorial ortogonal é através de componentes principais, onde se utiliza a decomposição espectral da matriz S.
( ) Para se utilizar o método de máxima verossimilhança para estimar as cargas, é acrescida a suposição de que F e e têm distribuição normal multivariada. As comunalidades (elementos da diagonal LL´) têm como estimadores a proporção da variância total estimada pelo particular fator.
( ) Para melhorar a explicação do modelo fatorial, sem alterar a ortogonalidade dos fatores, muitas vezes, usa- se uma transformação ortogonal das cargas fatoriais, que, consequentemente, transforma os fatores. Esse procedimento é conhecido como rotação fatorial.
( ) Dependendo da natureza dos dados, os fatores não precisam ser ortogonais. Assim, para melhorar a explicação do modelo fatorial, pode-se utilizar a rotação oblíqua, onde cada variável é expressa em termos de um número máximo de fatores.
A sequência está correta em
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?
I. O estimador de intensidade é útil para nos fornecer uma visão geral da distribuição em primeira ordem dos eventos.
II. O kernel é dependente do raio e pode ser utilizado na avaliação da distribuição de eventos pontuais.
III. Akrigagem é um método de interpolação aplicado apenas para análises de dados quantitativos.
Está(ão) correta(s) a(s) afirmativa(s):

I. análise do nível de fusão;
II. análise do nível de similaridade;
III. análise do coeficiente R2 ;
IV. estatística pseudo F.
Para auxiliar na decisão do número final de grupos que define a partição dos dados, pode-se utilizar os critérios apresentados nas alternativas
I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
I. Seja X uma variável aleatória normal univariada com média µ1 e variância σ21 e Y uma variável aleatória normal univariada com média µ2 e variância σ22 . Nessas condições, o vetor

II. Se Σ é a matriz de covariâncias de um determinado vetor aleatório, então Σ é uma matriz positiva definida.
III. A variância total de um vetor aleatório é dada pelo traço de sua matriz de covariâncias.
IV. Se


Está correto o que consta APENAS em
Considere que, na análise discriminante por meio do escore quadrático, o vetor x seja classificado na população k se


Na análise discriminante por meio do escore de Fisher, convencionou-se que os dados seguem distribuição normal.
No agrupamento hierárquico, o critério denominado complete-linkage consiste em atualizar as distâncias entre dois grupos recém-agrupados como sendo o valor mínimo entre eles.
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.
Na análise fatorial, a rotação varimax, que não é ortogonal, tem por objetivo maximizar a variância das cargas fatoriais.
I. A análise de correspondência permite estudar associação entre variáveis qualitativas.
II. Na análise discriminante a variável dependente deve ser métrica.
III. Na análise de regressão múltipla uma forma de identificar colinearidade entre as variáveis independentes é examinar as correlações entre essas variáveis.
IV. Na análise de conglomerados, as técnicas hierárquicas exigem que o usuário identifique previamente o número de grupos desejado, mas essa exigência não prevalece nas técnicas não hierárquicas.
Está correto o que se afirma APENAS em
A estatística F revela se há interação entre variáveis em um modelo multivariado e possibilita o aumento da percepção acerca dos impactos da alteração de um valor em determinada variável nas demais variáveis do modelo.
Em um modelo de regressão múltipla, o coeficiente de determinação múltipla é uma medida que varia entre zero e um. O acréscimo de uma variável ao modelo causará, sempre, sua redução.
O coeficiente de determinação R2 é utilizado para julgar a adequação de um modelo de regressão e pode ser compreendido como a quantidade de variabilidade nos dados explicada pelo modelo de regressão. R2 mede, com boa precisão, a magnitude da inclinação da reta de regressão.