Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 140 questões

Q2164555 Estatística
Considere que um índice de desempenho acadêmico de 120 estudantes de uma instituição foi construído através da análise de componentes principais, tomando como base os valores das suas notas em quatro disciplinas X = (X1, X2, X3, X4). Os autovalores extraídos da matriz de covariâncias foram, respectivamente, iguais a 13, 4, 2, 1 e o primeiro autovetor normalizado foi e1 = (0,5; 0,2; 0,5; 0,7). O percentual de explicação da primeira componente principal e o valor do índice de desempenho de um estudante com notas X = (60, 70, 85, 80) são, respectivamente:
Alternativas
Q2164544 Estatística
A similaridade é um critério para medir a distância entre dois vetores, sendo um conceito essencial na análise de agrupamentos. A distância Euclidiana está entre as medidas de similaridade mais comuns. Considere que a variável X represente a idade (em anos) e que a variável Y represente a média do rendimento semestral global (medido numa escala de 0 a 10) de estudantes de um Instituto Federal de Educação. A tabela a seguir apresenta dados observados para as variáveis X e Y para três estudantes desse Instituto:
Estudante       Idade (X)    Rendimento (Y)    1                          21                   7    2                          22                   8    3                          18                   6
A distância Euclidiana para esse conjunto de dados é igual a:
Alternativas
Q2132858 Estatística

    Em uma análise dos resultados das urnas eleitorais, decidiu-se verificar quais variáveis estão mais relacionadas ao voto em candidatos de direita ou de esquerda. Os votos para os candidatos de direita e de esquerda foram analisados em separado para as 27 unidades da federação (UF), tendo como variáveis explicativas a idade (x1) e os anos de estudo (x2) dos eleitores. Em cada UF, foram analisados os votos de y eleitores e as estatísticas descritivas das variáveis utilizadas são mostradas na tabela a seguir.


00_84 - 92 .png (405×472)


Com base nessas informações, julgue o próximo item.


Em média, os candidatos de esquerda receberam mais votos que os candidatos da direita.

Alternativas
Q2096289 Estatística
A Análise de Componentes Principais (PCA) é uma técnica de transformação de dados que tem como objetivo encontrar as direções de maior variação nos dados, geralmente representadas pelos chamados componentes principais, e gerar novas representações dos dados.
Assinale o objetivo principal dessa técnica. 
Alternativas
Q2086179 Estatística
Após a extração dos fatores em uma análise fatorial, pode ser calculado o grau de adaptação das variáveis aos fatores por meio das cargas fatoriais. Normalmente, o que acontece é que a maior parte das variáveis tem cargas altas no fator mais importante e cargas baixas nos outros fatores, tornando a interpretação mais difícil. Nesse sentido, a técnica de rotação de fatores é utilizada para atingir uma melhor distinção entre os fatores. Nesse contexto, analise as afirmativas a seguir.
I. A rotação quartimax visa maximizar a dispersão da carga dos fatores de uma variável por todos os fatores, geralmente acarretando em muitas variáveis com cargas altas em um único fator.
II. A rotação varimax facilita a interpretação das cargas fatoriais.
III. A rotação promax é um método rápido desenvolvido para bancos de dados muito grandes.
É correto o que se afirma em
Alternativas
Q2080040 Estatística
A estatística multivariada compreende um conjunto de técnicas que analisam simultaneamente um conjunto de variáveis que caracterizam os objetos ou indivíduos de uma amostra. Dentre as técnicas estatísticas mais utilizadas, há uma responsável por explorar as diferenças de grupos distintos de observações que foram previamente definidos para, em seguida, permitir a classificação mais provável de novas observações em um dos grupos. Para isso, é construída uma regra matemática ou de classificação para decidir qual é o grupo mais provável que o novo objeto pertencerá, minimizando o custo de classificação incorreta. A técnica estatística multivariada responsável por esse objetivo é a análise:
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073945 Estatística
Considere a seguinte situação:

Um produtor deseja avaliar a qualidade dos cogumelos Shitakes que produz. Assim, considerando que suas mudas desta variedade de cogumelos estão numeradas de 1246 a 1640, ele pretende obter uma amostra sistemática de 50 mudas para este estudo.
Com base na situação exposta, qual é a quantidade total de mudas de cogumelo Shitake que possui este produtor?
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073944 Estatística
Imagem associada para resolução da questão





Em análise fatorial, fatores são abstrações empíricas que podemos visualizar como eixos de um sistema de coordenadas onde representamos as variáveis.
Identifique abaixo as afirmativas verdadeiras ( V ) e as falsas ( F ) em relação ao assunto.
( ) Considerando a representação gráfica, entende-se por carga fatorial a coordenada de uma variável ao longo do eixo. ( ) As cargas fatoriais podem ser inseridas em uma matriz onde as colunas representam cada fator e as linhas representam as cargas fatoriais de cada uma das variáveis nos fatores. ( ) Em uma boa solução na análise fatorial, esperamos sempre que uma variável tenha carga fatorial baixa no fator ao qual pertence e carga alta nos demais fatores. ( ) Considerando a representação gráfica, se cada eixo do gráfico representa um fator, as coordenadas das variáveis ao longo de cada eixo representam a força da relação entre a variável e cada fator. Em uma situação ideal, uma variável deveria ter uma coordenada alta para um dos eixos e coordenadas baixas para todos os outros eixos, ou seja, para os fatores.
Assinale a alternativa que indica a sequência correta, de cima para baixo
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073939 Estatística
Identifique abaixo as afirmativas verdadeiras ( V ) e as falsas ( F ) sobre a Regressão Logística.
( ) Para utilizar a Regressão logística não são necessárias as suposições de que a amostra tenha urna distribuição normal multivariada e que as matrizes de variância/covariância sejam iguais dento dos grupos. ( ) Tanto a análise discriminante quanto a Regressão Logística têm testes estatísticos diretos, habilidade para incorporar efeitos não lineares, e uma gama extensiva de diagnósticos. ( ) Uma vantagem da regressão logística é que só se precisa saber se um evento (ocorrência ou não, fracasso ou sucesso) aconteceu e podemos dessa forma utilizar um valor dicotômico como variável dependente. O procedimento prediz a estimativa da probabilidade que o evento vai ou não acontecer. ( ) Em vez de minimizar o quadrado dos desvios, a Regressão Logística minimiza a probabilidade de que o evento ocorra.

Assinale a alternativa que indica a sequência correta, de cima para baixo.
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073938 Estatística
Considere a matriz de variância e covariância a seguir, e que os dois maiores autovalores dessa matriz sejam autovalor1 = 5,7 e autovalor2 = 4,3.
Imagem associada para resolução da questão



Considerando a análise de componentes principais, assinale a alternativa que traz a taxa de variação explicada por autovalor1 e autovalor2.
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073937 Estatística
O objetivo principal para a aplicação da análise discriminante é classificar novos casos dentro dos grupos estudados. Para a classificação, podem ser utilizados os métodos do ponto de corte; da teoria da decisão estatística; da função de classificação e da distância de Mahalanobis.
Analise as afirmativas abaixo sobre a análise discriminante.
1. O método da teoria da decisão estatística pode ser usado para determinar a qual grupo pertence um provável caso e considera que há tantas funções de classificação quanto há grupos. 2. O método do ponto de corte objetiva encontrar o escore discriminante ou valor de corte, que divide o espaço discriminante em regiões mutuamente exclusivas e exaustivas. 3. No método do ponto de corte, o valor de corte selecionado é aquele que minimiza o número de classificações incorretas 4. O método da teoria da decisão estatística é baseado na teoria de Bayes e consiste em minimizar os erros de classificações corretas levando em consideração os custos da classificação correta.
Assinale a alternativa que indica todas as afirmativas corretas.
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073934 Estatística
Em um conjunto de dados formado por quatro variáveis foi realizado um estudo de análise fatorial.
A tabela a seguir apresenta as cargas fatoriais correspondentes a essas variáveis e as respectivas comunalidades.
Imagem associada para resolução da questão


Restringindo-se aos dois primeiros fatores:
Alternativas
Q2023210 Estatística
Avalie se as afirmativas a seguir, relativas à Análise fatorial, estão corretas:
I. É usada para investigar padrões em um número grande de variáveis e determinar se a informação pode ser resumida a um conjunto menor de fatores, ou seja, ela determina se é possível reduzir o número de dimensões necessárias para se descrever dados derivados de um grande número de medidas.
II. Como princípio básico da análise fatorial, devem ser retidos apenas fatores com autovalores pequenos. III. São critérios para definir o número de fatores que serão extraídos, além do critério do autovalor: critério do diagrama de inclinação e critério da porcentagem de variância.
IV. Após a definição do número de fatores do modelo, os passos seguintes são: extração dos fatores e rotação dos fatores.
Estão corretas as afirmativas: 
Alternativas
Q2023201 Estatística
Em relação à Análise de Componentes Principais (ACP), avalie se as afirmativas a seguir são falsas (F) ou verdadeiras (V).
I. O objetivo principal da ACP é obter variáveis não correlacionadas que retenham a maior parte da estrutura de variabilidade e correlação, a partir das variáveis originais, por meio de transformações lineares para reduzir a dimensão, medida pelo número de variáveis, da matriz de dados. II. A ACP possibilita a compreensão de aspectos do comportamento dos dados difíceis de serem deduzidos a partir das variáveis originais. III. Em geral, a ACP permite que se usem metodologias de análise univariada.
As afirmativas são, respectivamente,
Alternativas
Q1987154 Estatística
As afirmativas a seguir, acerca da análise de componentes principais (ACP) estão corretas, à exceção de uma. Assinale-a.
Alternativas
Q1970636 Estatística
Quanto à análise multivariada, 
Alternativas
Q1946356 Estatística

Considere o conjunto de valores: {∛8, √225, √0,25, ∛0,125, ∛135}. Qual o valor modal desse conjunto? 

Alternativas
Q1929200 Estatística
O gestor de uma grande sociedade empresária, para definir metas e indicadores de desempenho, cria uma base de dados com os resultados da última avaliação realizada com os funcionários. Essa avaliação formou uma base que pretende ser utilizada para tomada de decisões como promoções, aumentos salariais, transferências e até demissões.
Cada funcionário foi avaliado segundo os critérios de pontualidade, assiduidade, motivação, satisfação no trabalho e cumprimento das tarefas designadas, recebendo uma nota de 0 a 10 pontos para cada critério. Para simplificar a análise, agruparam-se os funcionários por similaridade de acordo com os critérios mencionados.
A técnica de análise multivariada mais adequada para criar os grupos e analisar o desempenho dos funcionários é:
Alternativas
Q1929199 Estatística
Suponha X = (X1X2X3X4)uma distribuição normal multivariada com matriz de covariância

Imagem associada para resolução da questão

A variância de X1X2X3X4 é:
Alternativas
Q1902548 Estatística
Em relação à distribuição Normal, assinale V para a afirmativa verdadeira e F para a falsa.
( ) Se X segue uma distribuição Normal, então a média é igual à mediana e igual à moda.
( ) Quando o tamanho da amostra é grande, a distribuição normal serve como aproximação da distribuição binomial.
( ) Quanto menor a variância, mais achatada é a função densidade de probabilidade da distribuição Normal.
As afirmativas são, respectivamente,
Alternativas
Respostas
41: C
42: A
43: E
44: B
45: A
46: B
47: C
48: B
49: C
50: D
51: B
52: B
53: D
54: C
55: D
56: D
57: D
58: D
59: B
60: B