Questões de Estatística - Análise Multivariada para Concurso

Q3208387

Ano: 2025 Banca: CESPE / CEBRASPE Órgão: FUNPRESP-EXE Prova: CESPE / CEBRASPE - 2025 - FUNPRESP-EXE - Analista de Previdência Complementar - Área 8: Estatística, Ciência de Dados e Inovação |

Q3208387 Estatística

No que se refere a modelagem estatística de dados, julgue o item subsecutivo.

O modelo de árvore de decisão é utilizado quando a resposta é binária, como, por exemplo, prever se um cliente fará ou não determinada compra com base em seu histórico de compras.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3156892

Ano: 2025 Banca: CESPE / CEBRASPE Órgão: PC-DF Prova: CESPE / CEBRASPE - 2025 - PC-DF - Gestor de Apoio as Atividades Policiais Civis - Especialidade: Analista de Informática: Desenvolvimento de Sistemas |

Q3156892 Estatística

A respeito de inteligência artificial, de tipos de análise de dados e de Big Data, julgue o item que se segue.

Modelos discriminativos classificam dados conhecidos em categorias, enquanto modelos generativos preveem características completas a partir de um rótulo, explorando probabilidades conjuntas.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3154825

Ano: 2025 Banca: FGV Órgão: TCE-PI Prova: FGV - 2025 - TCE-PI - Auditor de Controle Externo - Controle Externo - Específica de Tecnologia da Informação - Sistemas, Engenharia de Dados e Ciência de Dados (Manhã) |

Q3154825 Estatística

No campo da mineração de dados existem alguns problemas fundamentais que costumam aparecer com frequência em variados cenários de aplicação. O estudo desses problemas fornece ferramentas ao analista de dados que são aplicáveis em diferentes projetos de mineração de dados. Nesse conjunto se encontram os problemas de determinação de padrões, classificação de dados, segmentação de dados (clustering) e detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.

I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.

II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.

III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.

Está correto o que se afirma em

A

I, apenas.

B

I e II, apenas.

C

I e III, apenas.

D

II e III, apenas.

E

I, II e III.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3171142

Ano: 2024 Banca: IBFC Órgão: TRF - 5ª REGIÃO Prova: IBFC - 2024 - TRF - 5ª REGIÃO - Analista Judiciário - Área Apoio Especializado - Especialidade: Análise de Dados |

Q3171142 Estatística

A Análise de grupos, também conhecida como agrupamento de dados, é um termo genérico usado para designar um amplo espectro de métodos numéricos de análise de dados multivariados com o objetivo de descobrir grupos homogêneos de objetos. O agrupamento de objetos em diferentes grupos pode simplesmente representar uma forma conveniente de organizar grandes bases de dados de maneira que elas sejam mais facilmente compreendidas ou pesquisadas e, também, para realizar tarefas muito mais sofisticadas, como tomada de decisão em processos críticos. Diante do exposto, assinale a alternativa correta em relação aos itens que apresentam um algoritmo de agrupamento.

A

Decision Tree (Árvore de decisão)

B

k- Nearest (k-Próximos)

C

k-NN (k-Vizinhos-Próximos)

D

k-Means (k-Médias)

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3044868

Ano: 2024 Banca: CESGRANRIO Órgão: BNDES Prova: CESGRANRIO - 2024 - BNDES - Analista - Análise de Sistemas - Desenvolvimento (Manhã) |

Q3044868 Estatística

A lógica fuzzy é uma extensão da lógica booleana. Embora as técnicas de controle possam ser implementadas por modelos matemáticos, as implementações baseadas na lógica fuzzy apresentam um melhor desempenho.

Qual é o aspecto fundamental da lógica fuzzy?

A

É ideal para sistemas em que as variáveis de entrada têm limites bem definidos e não variam.

B

Permite modelar situações em que os limites entre categorias são difusos e não nitidamente definidos.

C

Requer que todas as regras sejam expressas em termos de “se-então” para funcionar corretamente.

D

Utiliza sempre conjuntos crisp para representar valores de entrada e saída.

E

Utiliza somente funções lineares para representar a pertinência dos elementos aos conjuntos fuzzy.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3029120

Ano: 2024 Banca: FGV Órgão: TRF - 1ª REGIÃO Prova: FGV - 2024 - TRF - 1ª REGIÃO - Analista Judiciário - Área Apoio Especializado - Especialidade: Análise de Dados |

Q3029120 Estatística

Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores
xA = [2, −2, 0, 1,] e xB = [−4, 0, 2, −4].
Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente:

A

-4/3 e 15;

B

-2/3 e 9;

C

-2/3 e 15;

D

2/3 e 9;

E

2/3 e 15.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3028907

Ano: 2024 Banca: COMVEST UFAM Órgão: UFAM Prova: COMVEST UFAM - 2024 - UFAM - Estatístico |

Q3028907 Estatística

Sobre a análise discriminante, é CORRETO afirmar que:

A

ela é usada para prever uma variável dependente contínua, com base em variáveis independentes categóricas.

B

a análise discriminante linear (LDA) assume que as variáveis independentes têm distribuição normal e que as matrizes de covariância dos grupos são iguais.

C

ela é um método não supervisionado de aprendizado de máquina que requer apenas dados não rotulados para treinamento.

D

as funções discriminantes são construídas para maximizar a variação total dos dados, sem considerar a separação entre os grupos.

E

ela busca encontrar as variáveis independentes que têm menor correlação entre si, para melhorar a separação entre os grupos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q3016885

Ano: 2024 Banca: IPEFAE Órgão: Prefeitura de Santa Adélia - SP Prova: IPEFAE - 2024 - Prefeitura de Santa Adélia - SP - Químico |

Q3016885 Estatística

O professor instruiu o aluno de iniciação científica em química a apresentar, em seu relatório semestral, a média dos valores obtidos de densidade do ferro, seguido de um indicador que representasse a exatidão da medida. No campo da estatística, a exatidão pode ser expressa pelo seguinte cálculo:

A

desvio padrão.

B

coeficiente de variação.

C

média ponderada.

D

erro absoluto.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2568645

Ano: 2024 Banca: Instituto Access Órgão: CEASA-ES Prova: Instituto Access - 2024 - CEASA-ES - Técnico em Estatística |

Q2568645 Estatística

Técnica de análise multivariada que permite estabelecer a probabilidade de ocorrência de determinado evento para situações em que a variável dependente é qualitativa e de natureza dicotômica. Pode ser utilizada mesmo quando alguns dos pressupostos da análise discriminante não forem atendidos. Com base nesse conceito, assinale a alternativa correta.

A

Análise de Cluster.

B

Regressão Logística.

C

Análise Fatorial.

D

MDS.

E

Regressão Múltipla.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2568644

Ano: 2024 Banca: Instituto Access Órgão: CEASA-ES Prova: Instituto Access - 2024 - CEASA-ES - Técnico em Estatística |

Q2568644 Estatística

No que se refere a técnica de análise multivariada de dependência, assinale a alternativa correta.

A

Regressão Múltipla.

B

MDS.

C

Análise de Cluster.

D

Análise Fatorial.

E

Nenhuma das alternativas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2568643

Ano: 2024 Banca: Instituto Access Órgão: CEASA-ES Prova: Instituto Access - 2024 - CEASA-ES - Técnico em Estatística |

Q2568643 Estatística

No que se refere a técnica de análise multivariada de interdependência, assinale a alternativa correta.

A

Regressão Múltipla.

B

Análise discriminante.

C

Regressão Logística.

D

Análise Fatorial.

E

Nenhuma das alternativas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2567316

Ano: 2024 Banca: INSTITUTO AOCP Órgão: TRF - 2ª REGIÃO Prova: INSTITUTO AOCP - 2024 - TRF - 2ª REGIÃO - Analista Judiciário - Área Apoio Especializado - Estatística |

Q2567316 Estatística

Na Análise de Agrupamento, os grupos são formados com base em medidas de “proximidade - distância” ou “similaridade” entre os itens que podem ser representados por vetores aleatórios quando suas características são quantitativas. Os agrupamentos podem ser do tipo Aglomerativo Hierárquico e do tipo Não Hierárquico, sendo que Dendrograma do Método Aglomerativo Hierárquico pode ser feito usando

A

Distância Logística e Método de Ligação do Vizinho Mais Próximo.

B

Distância Logística e Método de Ligação do Vizinho Mais Longe.

C

Distância de Lyapunov e Método de Ligação Completa.

D

Distância Euclidiana e Método de Ligação de Ward.

E

Distância de Lyapunov e Método de Ligação do Vizinho Mais Longe.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2567300

Ano: 2024 Banca: INSTITUTO AOCP Órgão: TRF - 2ª REGIÃO Prova: INSTITUTO AOCP - 2024 - TRF - 2ª REGIÃO - Analista Judiciário - Área Apoio Especializado - Estatística |

Q2567300 Estatística

Em uma pesquisa sobre caraterísticas de condenados em uma determinada Vara Federal, uma amostra aleatória de condenados de tamanho n foi tomada e investigou-se nos respectivos processos suas características. Os resultados observados recebiam avaliação dos psicólogos em notas em uma escala até 7 pontos. As notas se referem às características: C1, C2, C3, C4 e C5. Os resultados foram tabulados e a matriz de correlação R construída. Após ser aplicada a Análise Fatorial na matriz R, obtiveram-se os resultados tabelados a seguir:

Análise Fatorial

Imagem associada para resolução da questão

Pesos dos fatores após rotação Varimax

Imagem associada para resolução da questão

Então, é correto afirmar que

A

seguindo o Critério de Kaiser, extrai-se m = 2, dois fatores comuns, já que apenas os dois primeiros autovalores são maiores do que 1. A expressão do fator mais importante rotacionado é 0,0108421.C1 + 0,972815.C2 + 0,088226.C3 + 0,690747.C4 + 0,936633.C5 que explica 57,447% da variância explicada.

B

seguindo o Critério de Kaiser, extrai-se m = 3, três fatores, já que o percentual acumulado de variância explicada é maior que 95%. A expressão do fator mais importante rotacionado é 0,0108421.F1 + 0,994863.F2 + 0,027380.F3 + 0,023226.F4 - 0,094024.F5 que explica 57,447% da variância explicada.

C

seguindo o Critério de Kaiser, extrai-se m = 4, quatro fatores, já que o percentual acumulado de variância explicada é maior que 95%. A expressão do fator mais importante rotacionado é 0,690747.F1 + 0,377609.F2 + 0,616215.F3 + 0,022874.F4 + 0,005875.F5 que explica 57,447% da variância explicada.

D

a soma dos autovalores é aproximadamente igual a p = 5, o número de componentes do vetor observado; portanto, deve-se extrair m = 5, cinco fatores comuns, alcançando 100% da variância explicada.

E

a soma dos autovalores é aproximadamente igual a p = 5, o número de componentes do vetor observado; portanto, isso indica que se deve extrair apenas um único fator, ou seja, o Fator 1 (F1).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2447363

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Estatístico |

Q2447363 Estatística

Na análise fatorial, um dos métodos mais conhecidos para a determinação do número m de fatores do modelo é o critério de Kaiser, de acordo com o qual o valor de m é dado pelo número de autovalores

A

maiores ou iguais a zero.

B

maiores ou iguais a um.

C

menores ou iguais a zero.

D

menores ou iguais a um.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2447351

Ano: 2024 Banca: IV - UFG Órgão: TJ-AC Prova: CS-UFG - 2024 - TJ-AC - Analista Judiciário - Estatístico |

Q2447351 Estatística

Quando se adota que os erros do modelo de regressão linear multivariado seguem uma distribuição normal, após o ajuste do modelo, é preciso verificar tal suposição. A partir dos resíduos, o gráfico utilizado para essa verificação é o gráfico de

A

barra.

B

dispersão.

C

quantil-quantil.

D

séries temporais.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2445341

Ano: 2024 Banca: CESPE / CEBRASPE Órgão: Petrobras Prova: CESPE / CEBRASPE - 2024 - Petrobras - Técnico Júnior - Ênfase: Química de Petróleo |

Q2445341 Estatística

Texto associado

A equação y = mx + b, com m = 2,09 e b = 0,257, foi obtida na calibração de um método para a determinação cromatográfica de isoctano em misturas de hidrocarbonetos. Nessa equação, o eixo x apresenta valores de concentração de isoctano, em porcentagem molar, e o eixo y, a área sob o pico cromatográfico, em uma unidade arbitrária.

Tendo como referência as informações precedentes, julgue o item subsecutivo, a respeito de fundamentos de estatística.

Se uma amostra de hidrocarbonetos contém 5% de isoctano em quantidade de matéria analisada pelo método descrito, então a área sob o pico cromatográfico do isoctano terá valor superior a 10 unidades arbitrárias.

Certo

Errado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2383284

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383284 Estatística

Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a

A

média dos dados

B

mediana dos dados

C

soma total dos dados

D

variância máxima dos dados

E

correlação mínima entre os dados

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2382974

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa - Políticas Públicas e Desenvolvimento |

Q2382974 Estatística

Considere o texto sobre a teoria locacional de Christaller.

O alemão Walter Christaller (1893-1969) almejou responder a questões que ainda hoje desafiam os pesquisadores: o que explica o tamanho, a distribuição e o número de cidades? Em seu livro Die zentralen Örte in Süddeutschland, Christaller seguiu a tradição geométrica alemã para esboçar as simples regras que permitiriam responder a essa pergunta e chegou à teoria dos lugares centrais. Ele buscou determinar o formato das áreas de mercado em que todos os consumidores são atendidos e, ao mesmo tempo, a distância em relação às firmas é minimizada. Para se chegar à distribuição espacial dos lugares centrais, são necessários três princípios, sendo que um deles é o da minimização das distâncias entre os centros, que faz com que os ofertantes de bens de ordem imediatamente inferior se localizem no ponto médio da linha que une os centros de ordem superior.
MONASTERIO, L.; CAVALCANTE, L. Fundamentos do pensamento econômico regional. In: CRUZ, B. et al. (org.). Economia regional e urbana. Teorias e métodos com ênfase no Brasil. Brasília, DF: Ipea, 2011, p.56. Adaptado.

Nesse texto sobre a teoria dos lugares centrais, é descrito o princípio

A

administrativo

B

da recursividade

C

da sustentabilidade

D

de transporte

E

de mercado

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2382972

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa - Políticas Públicas e Desenvolvimento |

Q2382972 Estatística

Considere o texto sobre economias de aglomeração no Brasil.

Quanto maior a escala da urbanização, maiores tendem a ser os ganhos de produtividade das firmas. Do mesmo modo, a maior diversidade de bens e serviços ofertados, de interações sociais e econômicas e de serviços públicos disponíveis para consumo da coletividade torna-se um diferencial de grande significado para a localização empresarial. Para o Brasil, no processo de desconcentração produtiva, mostrou-se que a localização de firmas industriais adquiriu um comportamento fortemente associado a economias de aglomeração dadas pelo estoque de infraestrutura e mão de obra qualificada: o tecido industrial tornou-se concentrado — e desconcentrou concentradamente — em uma grande porção do território entre o Sul e o Sudeste. Consideradas, de um lado, as motivações e lógicas do setor privado e os estímulos do mercado mundial e do território inercial do desenvolvimento brasileiro e, de outro lado, as motivações e os esforços governamentais, em sentido amplo, para atuação sobre novas geografias econômicas nacionais, identificam-se cinco tipos preferenciais de territórios predominantemente impactados e redefinidos pela potência das forças em atuação.
MONTEIRO NETO, A.; SILVA, R.; SEVERIAN, D. O território das atividades industriais no Brasil: a força das economias de aglomeração e urbanização. In: MONTEIRO NETO, A. (org.). Brasil, Brasis: reconfigurações territoriais da indústria no século XXI. Brasília, DF: Ipea, 2021, p. 256-258. Adaptado.

Na tipologia mencionada acima, encontram-se rearranjos territoriais que se prestam à análise das formas de aglomeração e os que concorrem para a desaglomeração.
Considerando-se especificamente os vetores que levam à concentração produtiva, identificam-se territórios predominantemente impactados e (re)definidos por

A

oferta mundial de commodities, especialmente oriundas do agronegócio, como nas áreas da fronteira agrícola.

B

investimentos realizados ou orientados pelo Estado em infraestruturas logísticas e de energia etc., como no Nordeste.

C

forças inerciais dos fatores de aglomeração e de urbanização e das vantagens locacionais da rede urbana, como na faixa costeira.

D

impulsos das políticas sociais, pelas melhorias das condições de vida e pela ampliação do mercado interno de consumo, como na Amazônia.

E

implantação de investimentos pontuais com tendência a se constituírem em polos isolados com baixa indução do entorno e da hinterlândia, como no Norte.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2353403

Ano: 2024 Banca: Instituto Consulplan Órgão: DPE-PR Prova: Instituto Consulplan - 2024 - DPE-PR - Analista da Defensoria Pública - Estatística |

Q2353403 Estatística

A respeito da análise de conglomerados, analise as afirmativas a seguir.
I. Na execução do algoritmo K-means, é possível que a alocação de observações aos clusters não mude entre duas iterações sucessivas.
II. O uso de duas medidas de similaridade distintas pode produzir dois dendrogramas diferentes ao se aplicar um algoritmo de agrupamento aglomerativo para o mesmo conjunto de dados.
III. Em uma análise envolvendo duas variáveis, considere que, após a primeira iteração do algoritmo K-Means aplicado para agrupar sete observações em três clusters, C1, C2 e C3, obteve-se a seguinte configuração: C1={(2,2), (4,4), (6,6)}; C2={(0,4), (4,0)} e C3={(5,5), (9,9)}. Então, os respectivos centroides que darão seguimento à próxima iteração serão C1=(4,4), C2=(2,2) e C3=(7,7).
Está correto o que se afirma em

A

I, II e III.

B

I e II, apenas.

C

I e III, apenas.

D

II e III, apenas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

SEJA VITALÍCIO

SEJA VITALÍCIO

Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 140 questões