Questões de Concurso Público IPEA 2024 para Técnico de Planejamento e Pesquisa -Ciência de Dados

Foram encontradas 19 questões

Q2383237 Estatística
Em um estudo de saúde pública, um pesquisador está analisando um conjunto de dados que inclui informações sobre idade, peso, altura e nível de atividade física dos participantes, no entanto ele percebe que alguns dados referentes ao peso estão ausentes.
Considerando-se a necessidade de manter a precisão e a confiabilidade do estudo, qual das seguintes abordagens seria a mais apropriada para tratar esses dados ausentes sobre o peso dos participantes?
Alternativas
Q2383255 Estatística
Em um estudo sobre tráfico de pessoas realizado pelo Ipea, os autores trazem as seguintes afirmações:

I - “Na medida em que haja desacordo sobre a definição de tráfico de pessoas entre diferentes países [...], os números globais do tráfico de pessoas são provavelmente enviesados” (p.23).
II - “Em tese, identificar as vítimas do tráfico de pessoas poderia ser difícil, pois estas fazem parte de populações com baixa visibilidade (por exemplo, profissionais do sexo, imigrantes indocumentados)” (p.24).

MORAES, R. F. de et al. Uma solução em busca de um problema: repensando o enfrentamento ao tráfico de pessoas no Brasil. Rio de Janeiro: Ipea, 2022.

Ambas as afirmações se referem a vieses de seleção da amostra, e esses vieses
Alternativas
Q2383256 Estatística
Sejam Y e Z variáveis aleatórias independentes e identicamente distribuídas, assumindo valores inteiros.
Considere as seguintes informações:

* Prob(Y + Z > 4) = 0;
* Prob(Y + Z > -3) = 1;
* Prob(YZ = 0) = 0;
* E(Z) = 0;
* E(Y2 + Z2) = 16/5.

Quanto vale Prob(Y2 + Z2 > 16/5)? 
Alternativas
Q2383257 Estatística
Considere um exame para detectar o uso de uma droga. Suponha que, para um usuário da droga, o exame tenha probabilidade 0,95 de dar, corretamente, positivo. Suponha que, para um não usuário, o exame tenha probabilidade 0,9 de dar, corretamente, negativo.
Para um certo indivíduo, a probabilidade de que ele use a droga é estimada, antes do exame, como sendo de 0,8. Após a aplicação do exame, o resultado foi positivo. Seja P a probabilidade que se deve estimar, com os dados acima, de que o resultado do exame esteja errado, ou seja, de que o resultado seja um falso positivo.
Quanto vale, aproximadamente, P? 
Alternativas
Q2383258 Estatística
Um dado comum tem seis faces equiprováveis numeradas de 1 a 6. Um jogador lança três dados comuns e independentes — um vermelho, um verde e um azul — e anota a soma dos três números obtidos.
Sabendo-se que o total é maior ou igual a 16, qual é a probabilidade condicional de que os dados verde e azul marquem o mesmo número?
Alternativas
Q2383259 Estatística
Um baralho tem 26 cartas vermelhas e 26 cartas pretas. Um jogador embaralha as cartas e pousa 5 sobre a mesa, de tal forma que não se veja a cor. Ele então revela as 4 primeiras cartas: são todas vermelhas.
Qual é a probabilidade P de que a quinta carta também seja vermelha? 
Alternativas
Q2383260 Estatística
Seja l = [0,1] o intervalo unitário na reta real.
Sejam (Xi) pontos aleatórios de I, independentes e com distribuição uniforme.
Qual é a probabilidade de que valha X12 + X22 + X32 < 1? 
Alternativas
Q2383261 Estatística
Em uma maternidade, 400 bebês nasceram em uma semana. Sejam H e M os números de meninos e de meninas, respectivamente. Sabe-se, portanto, que H + M = 400. Suponha para esse problema que, para cada bebê, a probabilidade de que seja menino seja exatamente igual a 1/2; suponha também que os sexos dos bebês sejam perfeitamente independentes uns dos outros. Seja P a probabilidade condicional de que H < 90, dado que H < 100.
Aproximadamente, quanto vale P?
Alternativas
Q2383262 Estatística
Considere uma comunidade na qual o coeficiente de variação populacional (CV) da renda de seus indivíduos é de 20%.
Um conjunto de políticas públicas que elevasse a renda de todos esses indivíduos em 10% provocaria, no CV, 
Alternativas
Q2383263 Estatística
Considere a matéria a seguir, sobre a dura realidade do trabalho infantil no Brasil.

Quase 5% das crianças e adolescentes do país estão em situação de trabalho infantil, aponta IBGE
O Brasil tem um total de 38,365 milhões de pessoas com idade de 5 a 17 anos. Destas, 2,103 milhões realizam atividades econômicas ou de autoconsumo, estando 1,881 milhão em situação de trabalho infantil, o equivalente a 4,9% do total de pessoas entre 5 e 17 anos no país, segundo dados da Pesquisa Nacional por Amostra de Domicílios Contínua 2022, divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). A pesquisa também apontou que, em 2022, 756 mil crianças e adolescentes exerciam atividades da Lista TIP, do governo federal, que elenca as piores formas de trabalho infantil no país. No geral, são serviços que envolvem risco de acidentes ou são prejudiciais à saúde, como trabalho na construção civil, em matadouros, oficinas mecânicas, comércio ambulante em locais públicos, coleta de lixo, venda de bebidas alcoólicas, entre outras atividades.

Imagem associada para resolução da questão

A pesquisa do IBGE considera duas categorias de atividades:
econômica, que é a de quem trabalhou pelo menos 1 hora completa e foi remunerado em dinheiro, produtos, benefícios, etc., ou que não teve remuneração direta, mas atuou para ajudar a atividade econômica de algum parente.
de autoconsumo, que incluem pesca, criação de animais, fabricação de roupas, construção de imóveis e outras que sejam para uso exclusivo da pessoa ou de parentes.

E nem todas as pessoas de 5 a 17 anos que exercem essas atividades se enquadram na situação de trabalho infantil.
Disponível em: https://g1.globo.com/trabalho-e-carreira/noticia/2023/12/20/quase-5percent-das-criancas-e-adolescentes-do-pais-estao-emsituacao-de-trabalho-infantil-aponta-ibge.ghtml. Acesso em: 29 dez 2023. Adaptado.

Nesse contexto, considere que uma pessoa de 5 a 17 anos é escolhida ao acaso e que se deseja estimar a probabilidade de que essa pessoa exerça trabalho infantil, mas não em uma de suas piores formas, que são elencadas na lista TIP, dado que ela realiza atividades econômicas ou de autoconsumo.
Essa probabilidade é, aproximadamente, de
Alternativas
Q2383264 Estatística
Ao fim do ano de 2022, 21 instituições financeiras fizeram estimativas para o Ibovespa, principal índice de ações da bolsa brasileira (B3), mostradas na notícia do Jornal Valor Econômico de 22/12/2022, que também apresenta a média aritmética e a mediana dos dados.

Previsão para a bolsa é de alta em 2023
Casa mais otimista projeta Ibovespa em 150 mil pontos; rumo dos juros será decisivo

Imagem associada para resolução da questão

Disponível em: https://valor.globo.com/financas/noticia/2022/12/22/previsao-para-a-bolsa-e-de-alta-em-20233.ghtml. Acesso em: 29 dez. 2023. Adaptado.

No útimo pregão do ano de 2023, o Ibovespa fechou em 134.185,23 pontos, conforme dados da B3.
Considerando-se os dados apresentados, a medida de posição das estimativas das instituições financeiras que mais se aproximou do resultado real, apresentado pelo Ibovespa no último pregão do ano, foi a:
Alternativas
Q2383265 Estatística
Um técnico, a fim de monitorar a mobilidade social de renda em uma região geográfica, criou um modelo agrupando as tradicionais classes sociais A, B, C, D e E em três extratos:

Classes A e B: Alta renda
Classe C: Média renda
Classes D e E: Baixa renda
A partir de uma extensa pesquisa, verificou que as probabilidades de um indivíduo transitar de um extrato para outro ou permanecer no mesmo extrato dependiam apenas de seu extrato atual e permaneciam constantes ao longo do tempo.
Levantou, assim, para cada extrato, as seguintes probabilidades de permanência ou mudança de extrato, após o período de tempo de um ano:

Alta renda Permanência: 80% Mudança para média renda: 10% Mudança para baixa renda: 10%
Média renda Permanência: 60% Mudança para alta renda: 20% Mudança para baixa renda: 20%
Baixa renda Permanência: 70% Mudança para alta renda: 10% Mudança para média renda: 20%

A probabilidade de um indivíduo, inicialmente de média renda, ter mobilidade social de renda (ascenso ou descenso), terminando num extrato diferente do inicial, após um período de 2 anos é de
Alternativas
Q2383266 Estatística
Até o Censo de 2010, a região Norte ainda possuía mais homens do que mulheres, mas, segundo os dados do Censo 2022, divulgados em outubro de 2023 pelo IBGE, as mulheres já são a maioria em todas as regiões do Brasil.
A matéria a seguir mostra os municípios do Brasil com maior proporção de mulheres em relação a homens.

Santos (SP) tem o maior percentual de mulheres no Brasil; veja lista 
Santos, no litoral paulista, é a cidade brasileira com a maior proporção de mulheres em relação a homens, segundo dados do Censo 2022 divulgados hoje pelo IBGE.
A cidade paulista lidera o ranking de municípios com mais mulheres, com uma proporção de 54,68%.

1. Santos (SP) - 54,68%
2. Salvador (BA) - 54,49%
3. São Caetano do Sul (SP) - 54,32%
4. Niterói (RJ) - 54,19%
5. Aracaju (SE) - 54,11%

Disponível em: https://noticias.uol.com.br/cotidiano/ultimas-noticias/2023/10/27/santos-ibge-censo-2022-cidades-com-mais-mulheres.htm. Acesso em: 11 jan. 2024. Adaptado.

Suponha que a Prefeitura de Santos, cidade brasileira com o maior percentual de mulheres, de aproximadamente 55%, realize um sorteio de 4 habitantes que cadastraram suas notas fiscais num aplicativo do município. Considere, ainda, que cada munícipe efetue tais cadastramentos de forma independente dos demais habitantes.
A probabilidade de que o número de mulheres sorteadas seja maior que o de homens sorteados é de aproximadamente:
Dado 0,452 = 0,2025 0,552 = 0,3025
Alternativas
Q2383267 Estatística
Considere que o salário médio de empregados de um determinado setor de serviços do Brasil é R$ 2.300,00, com um desvio padrão conhecido de R$ 400,00. Uma empresa desse setor é selecionada ao acaso, e dela é selecionada uma amostra de 36 funcionários, resultando em um salário médio de R$ 2.500,00. Um pesquisador decide realizar um teste de hipótese unilateral com um nível de confiança de 95% para verificar se a empresa selecionada paga salários médios maiores do que a média do setor.
Considere o extrato da Tabela a seguir.

Imagem associada para resolução da questão

Qual o valor-p do teste aplicado pelo pesquisador?  
Alternativas
Q2383268 Estatística
O Quadro abaixo fornece informações sobre o índice de vendas no varejo por estado em agosto de 2023.

Imagem associada para resolução da questão

Um analista de dados resolveu verificar se há presença de outliers nesse conjunto de índices e decidiu fazer isso por meio de um Box Plot dos dados fornecidos.
Com base na técnica escolhida pelo analista, quantos índices podem ser enquadrados como outliers? 
Alternativas
Q2383269 Estatística
Uma pesquisa recente estudou a distribuição de renda familiar per capita, em salários mínimos (s.m.), de duas comunidades, Alfa e Beta, com, aproximadamente, o mesmo número de habitantes. Considerando-se e a base dos logaritmos naturais ou neperianos, na comunidade Alfa, verificou-se que tal renda pode ser bem aproximada por uma variável aleatória contínua (v.a.c.) X com função densidade de probabilidade (f.d.p.) da forma f(X = x) = r ex, 0 ≤ x ≤ 1 s.m.; já para a comunidade Beta, constatou- -se que a renda em estudo seguia aproximadamente a distribuição de uma variável aleatória contínua (v.a.c.) Y com função densidade de probabilidade (f.d.p.) da forma g(Y = y) = s y ey, 0 ≤ y ≤ 1 s.m.
Um técnico deve decidir por apenas uma das duas comunidades para receber um programa assistencial, qual seja, aquela que possua o maior número de habitantes com renda familiar per capita até meio salário mínimo.
Nesses termos, o técnico deverá optar pela comunidade: 

Dado e ≅ 1,645
Alternativas
Q2383270 Estatística
Ao criar um índice para um corpus de notícias políticas, um pesquisador decidiu usar o modelo vetorial com a medida TF-IDF.
Descobriu, porém, que essa medida pode ser calculada de várias formas, com a característica comum de calcular o peso de cada termo a partir da ideia de que esse termo  
Alternativas
Q2383282 Estatística
Alguns trabalhos publicados como notas técnicas pelo Ipea se utilizam do método de classificação denominado de Bayes Ingênuo.
No contexto do classificador Bayesiano Ingênuo, Naive Bayes, a ingenuidade do modelo é caracterizada pela(o)
Alternativas
Q2383284 Estatística
Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a
Alternativas
Respostas
1: A
2: B
3: D
4: C
5: D
6: B
7: C
8: A
9: E
10: D
11: E
12: C
13: C
14: B
15: D
16: A
17: B
18: C
19: D