Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 140 questões

Q3208387 Estatística

No que se refere a modelagem estatística de dados, julgue o item subsecutivo.


O modelo de árvore de decisão é utilizado quando a resposta é binária, como, por exemplo, prever se um cliente fará ou não determinada compra com base em seu histórico de compras. 

Alternativas
Q3156892 Estatística

A respeito de inteligência artificial, de tipos de análise de dados e de Big Data, julgue o item que se segue.


Modelos discriminativos classificam dados conhecidos em categorias, enquanto modelos generativos preveem características completas a partir de um rótulo, explorando probabilidades conjuntas.

Alternativas
Q3154825 Estatística
No campo da mineração de dados existem alguns problemas fundamentais que costumam aparecer com frequência em variados cenários de aplicação. O estudo desses problemas fornece ferramentas ao analista de dados que são aplicáveis em diferentes projetos de mineração de dados. Nesse conjunto se encontram os problemas de determinação de padrões, classificação de dados, segmentação de dados (clustering) e detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.

I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.

II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.

III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.


Está correto o que se afirma em
Alternativas
Q3171142 Estatística
A Análise de grupos, também conhecida como agrupamento de dados, é um termo genérico usado para designar um amplo espectro de métodos numéricos de análise de dados multivariados com o objetivo de descobrir grupos homogêneos de objetos. O agrupamento de objetos em diferentes grupos pode simplesmente representar uma forma conveniente de organizar grandes bases de dados de maneira que elas sejam mais facilmente compreendidas ou pesquisadas e, também, para realizar tarefas muito mais sofisticadas, como tomada de decisão em processos críticos. Diante do exposto, assinale a alternativa correta em relação aos itens que apresentam um algoritmo de agrupamento.
Alternativas
Q3044868 Estatística

A lógica fuzzy é uma extensão da lógica booleana. Embora as técnicas de controle possam ser implementadas por modelos matemáticos, as implementações baseadas na lógica fuzzy apresentam um melhor desempenho.

Qual é o aspecto fundamental da lógica fuzzy?

Alternativas
Q3029120 Estatística
Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores
xA = [2, −2, 0, 1,] e xB = [−4, 0, 2, −4].
Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente: 
Alternativas
Q3028907 Estatística
Sobre a análise discriminante, é CORRETO afirmar que: 
Alternativas
Q3016885 Estatística

O professor instruiu o aluno de iniciação científica em química a apresentar, em seu relatório semestral, a média dos valores obtidos de densidade do ferro, seguido de um indicador que representasse a exatidão da medida. No campo da estatística, a exatidão pode ser expressa pelo seguinte cálculo: 

Alternativas
Q2568645 Estatística
Técnica de análise multivariada que permite estabelecer a probabilidade de ocorrência de determinado evento para situações em que a variável dependente é qualitativa e de natureza dicotômica. Pode ser utilizada mesmo quando alguns dos pressupostos da análise discriminante não forem atendidos. Com base nesse conceito, assinale a alternativa correta.
Alternativas
Q2568644 Estatística
No que se refere a técnica de análise multivariada de dependência, assinale a alternativa correta.
Alternativas
Q2568643 Estatística
No que se refere a técnica de análise multivariada de interdependência, assinale a alternativa correta.
Alternativas
Q2567316 Estatística
Na Análise de Agrupamento, os grupos são formados com base em medidas de “proximidade - distância” ou “similaridade” entre os itens que podem ser representados por vetores aleatórios quando suas características são quantitativas. Os agrupamentos podem ser do tipo Aglomerativo Hierárquico e do tipo Não Hierárquico, sendo que Dendrograma do Método Aglomerativo Hierárquico pode ser feito usando 
Alternativas
Q2567300 Estatística

Em uma pesquisa sobre caraterísticas de condenados em uma determinada Vara Federal, uma amostra aleatória de condenados de tamanho n foi tomada e investigou-se nos respectivos processos suas características. Os resultados observados recebiam avaliação dos psicólogos em notas em uma escala até 7 pontos. As notas se referem às características: C1, C2, C3, C4 e C5. Os resultados foram tabulados e a matriz de correlação R construída. Após ser aplicada a Análise Fatorial na matriz R, obtiveram-se os resultados tabelados a seguir:

Análise Fatorial

Imagem associada para resolução da questão


Pesos dos fatores após rotação Varimax 

Imagem associada para resolução da questão

Então, é correto afirmar que 

Alternativas
Q2447363 Estatística
Na análise fatorial, um dos métodos mais conhecidos para a determinação do número m de fatores do modelo é o critério de Kaiser, de acordo com o qual o valor de m é dado pelo número de autovalores
Alternativas
Q2447351 Estatística
Quando se adota que os erros do modelo de regressão linear multivariado seguem uma distribuição normal, após o ajuste do modelo, é preciso verificar tal suposição. A partir dos resíduos, o gráfico utilizado para essa verificação é o gráfico de
Alternativas
Q2445341 Estatística
        A equação y = mx + b, com m = 2,09 e b = 0,257, foi obtida na calibração de um método para a determinação cromatográfica de isoctano em misturas de hidrocarbonetos. Nessa equação, o eixo x apresenta valores de concentração de isoctano, em porcentagem molar, e o eixo y, a área sob o pico cromatográfico, em uma unidade arbitrária.  

Tendo como referência as informações precedentes, julgue o item subsecutivo, a respeito de fundamentos de estatística.


Se uma amostra de hidrocarbonetos contém 5% de isoctano em quantidade de matéria analisada pelo método descrito, então a área sob o pico cromatográfico do isoctano terá valor superior a 10 unidades arbitrárias.

Alternativas
Q2383284 Estatística
Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a
Alternativas
Q2382974 Estatística
Considere o texto sobre a teoria locacional de Christaller.

O alemão Walter Christaller (1893-1969) almejou responder a questões que ainda hoje desafiam os pesquisadores: o que explica o tamanho, a distribuição e o número de cidades? Em seu livro Die zentralen Örte in Süddeutschland, Christaller seguiu a tradição geométrica alemã para esboçar as simples regras que permitiriam responder a essa pergunta e chegou à teoria dos lugares centrais. Ele buscou determinar o formato das áreas de mercado em que todos os consumidores são atendidos e, ao mesmo tempo, a distância em relação às firmas é minimizada. Para se chegar à distribuição espacial dos lugares centrais, são necessários três princípios, sendo que um deles é o da minimização das distâncias entre os centros, que faz com que os ofertantes de bens de ordem imediatamente inferior se localizem no ponto médio da linha que une os centros de ordem superior.
MONASTERIO, L.; CAVALCANTE, L. Fundamentos do pensamento econômico regional. In: CRUZ, B. et al. (org.). Economia regional e urbana. Teorias e métodos com ênfase no Brasil. Brasília, DF: Ipea, 2011, p.56. Adaptado.

Nesse texto sobre a teoria dos lugares centrais, é descrito o princípio
Alternativas
Q2382972 Estatística
Considere o texto sobre economias de aglomeração no Brasil.

Quanto maior a escala da urbanização, maiores tendem a ser os ganhos de produtividade das firmas. Do mesmo modo, a maior diversidade de bens e serviços ofertados, de interações sociais e econômicas e de serviços públicos disponíveis para consumo da coletividade torna-se um diferencial de grande significado para a localização empresarial. Para o Brasil, no processo de desconcentração produtiva, mostrou-se que a localização de firmas industriais adquiriu um comportamento fortemente associado a economias de aglomeração dadas pelo estoque de infraestrutura e mão de obra qualificada: o tecido industrial tornou-se concentrado — e desconcentrou concentradamente — em uma grande porção do território entre o Sul e o Sudeste. Consideradas, de um lado, as motivações e lógicas do setor privado e os estímulos do mercado mundial e do território inercial do desenvolvimento brasileiro e, de outro lado, as motivações e os esforços governamentais, em sentido amplo, para atuação sobre novas geografias econômicas nacionais, identificam-se cinco tipos preferenciais de territórios predominantemente impactados e redefinidos pela potência das forças em atuação.
MONTEIRO NETO, A.; SILVA, R.; SEVERIAN, D. O território das atividades industriais no Brasil: a força das economias de aglomeração e urbanização. In: MONTEIRO NETO, A. (org.). Brasil, Brasis: reconfigurações territoriais da indústria no século XXI. Brasília, DF: Ipea, 2021, p. 256-258. Adaptado.

Na tipologia mencionada acima, encontram-se rearranjos territoriais que se prestam à análise das formas de aglomeração e os que concorrem para a desaglomeração.
Considerando-se especificamente os vetores que levam à concentração produtiva, identificam-se territórios predominantemente impactados e (re)definidos por
Alternativas
Q2353403 Estatística
A respeito da análise de conglomerados, analise as afirmativas a seguir.
I. Na execução do algoritmo K-means, é possível que a alocação de observações aos clusters não mude entre duas iterações sucessivas.
II. O uso de duas medidas de similaridade distintas pode produzir dois dendrogramas diferentes ao se aplicar um algoritmo de agrupamento aglomerativo para o mesmo conjunto de dados.
III. Em uma análise envolvendo duas variáveis, considere que, após a primeira iteração do algoritmo K-Means aplicado para agrupar sete observações em três clusters, C1, C2 e C3, obteve-se a seguinte configuração: C1={(2,2), (4,4), (6,6)}; C2={(0,4), (4,0)} e C3={(5,5), (9,9)}. Então, os respectivos centroides que darão seguimento à próxima iteração serão C1=(4,4), C2=(2,2) e C3=(7,7).
Está correto o que se afirma em
Alternativas
Respostas
1: E
2: C
3: D
4: D
5: B
6: C
7: E
8: D
9: B
10: A
11: D
12: D
13: A
14: B
15: C
16: C
17: D
18: D
19: C
20: A