Questões de Concurso Público IPEA 2024 para Técnico de Planejamento e Pesquisa -Ciência de Dados

Foram encontradas 70 questões

Q2383258 Estatística
Um dado comum tem seis faces equiprováveis numeradas de 1 a 6. Um jogador lança três dados comuns e independentes — um vermelho, um verde e um azul — e anota a soma dos três números obtidos.
Sabendo-se que o total é maior ou igual a 16, qual é a probabilidade condicional de que os dados verde e azul marquem o mesmo número?
Alternativas
Q2383259 Estatística
Um baralho tem 26 cartas vermelhas e 26 cartas pretas. Um jogador embaralha as cartas e pousa 5 sobre a mesa, de tal forma que não se veja a cor. Ele então revela as 4 primeiras cartas: são todas vermelhas.
Qual é a probabilidade P de que a quinta carta também seja vermelha? 
Alternativas
Q2383260 Estatística
Seja l = [0,1] o intervalo unitário na reta real.
Sejam (Xi) pontos aleatórios de I, independentes e com distribuição uniforme.
Qual é a probabilidade de que valha X12 + X22 + X32 < 1? 
Alternativas
Q2383261 Estatística
Em uma maternidade, 400 bebês nasceram em uma semana. Sejam H e M os números de meninos e de meninas, respectivamente. Sabe-se, portanto, que H + M = 400. Suponha para esse problema que, para cada bebê, a probabilidade de que seja menino seja exatamente igual a 1/2; suponha também que os sexos dos bebês sejam perfeitamente independentes uns dos outros. Seja P a probabilidade condicional de que H < 90, dado que H < 100.
Aproximadamente, quanto vale P?
Alternativas
Q2383262 Estatística
Considere uma comunidade na qual o coeficiente de variação populacional (CV) da renda de seus indivíduos é de 20%.
Um conjunto de políticas públicas que elevasse a renda de todos esses indivíduos em 10% provocaria, no CV, 
Alternativas
Q2383263 Estatística
Considere a matéria a seguir, sobre a dura realidade do trabalho infantil no Brasil.

Quase 5% das crianças e adolescentes do país estão em situação de trabalho infantil, aponta IBGE
O Brasil tem um total de 38,365 milhões de pessoas com idade de 5 a 17 anos. Destas, 2,103 milhões realizam atividades econômicas ou de autoconsumo, estando 1,881 milhão em situação de trabalho infantil, o equivalente a 4,9% do total de pessoas entre 5 e 17 anos no país, segundo dados da Pesquisa Nacional por Amostra de Domicílios Contínua 2022, divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). A pesquisa também apontou que, em 2022, 756 mil crianças e adolescentes exerciam atividades da Lista TIP, do governo federal, que elenca as piores formas de trabalho infantil no país. No geral, são serviços que envolvem risco de acidentes ou são prejudiciais à saúde, como trabalho na construção civil, em matadouros, oficinas mecânicas, comércio ambulante em locais públicos, coleta de lixo, venda de bebidas alcoólicas, entre outras atividades.

Imagem associada para resolução da questão

A pesquisa do IBGE considera duas categorias de atividades:
econômica, que é a de quem trabalhou pelo menos 1 hora completa e foi remunerado em dinheiro, produtos, benefícios, etc., ou que não teve remuneração direta, mas atuou para ajudar a atividade econômica de algum parente.
de autoconsumo, que incluem pesca, criação de animais, fabricação de roupas, construção de imóveis e outras que sejam para uso exclusivo da pessoa ou de parentes.

E nem todas as pessoas de 5 a 17 anos que exercem essas atividades se enquadram na situação de trabalho infantil.
Disponível em: https://g1.globo.com/trabalho-e-carreira/noticia/2023/12/20/quase-5percent-das-criancas-e-adolescentes-do-pais-estao-emsituacao-de-trabalho-infantil-aponta-ibge.ghtml. Acesso em: 29 dez 2023. Adaptado.

Nesse contexto, considere que uma pessoa de 5 a 17 anos é escolhida ao acaso e que se deseja estimar a probabilidade de que essa pessoa exerça trabalho infantil, mas não em uma de suas piores formas, que são elencadas na lista TIP, dado que ela realiza atividades econômicas ou de autoconsumo.
Essa probabilidade é, aproximadamente, de
Alternativas
Q2383264 Estatística
Ao fim do ano de 2022, 21 instituições financeiras fizeram estimativas para o Ibovespa, principal índice de ações da bolsa brasileira (B3), mostradas na notícia do Jornal Valor Econômico de 22/12/2022, que também apresenta a média aritmética e a mediana dos dados.

Previsão para a bolsa é de alta em 2023
Casa mais otimista projeta Ibovespa em 150 mil pontos; rumo dos juros será decisivo

Imagem associada para resolução da questão

Disponível em: https://valor.globo.com/financas/noticia/2022/12/22/previsao-para-a-bolsa-e-de-alta-em-20233.ghtml. Acesso em: 29 dez. 2023. Adaptado.

No útimo pregão do ano de 2023, o Ibovespa fechou em 134.185,23 pontos, conforme dados da B3.
Considerando-se os dados apresentados, a medida de posição das estimativas das instituições financeiras que mais se aproximou do resultado real, apresentado pelo Ibovespa no último pregão do ano, foi a:
Alternativas
Q2383265 Estatística
Um técnico, a fim de monitorar a mobilidade social de renda em uma região geográfica, criou um modelo agrupando as tradicionais classes sociais A, B, C, D e E em três extratos:

Classes A e B: Alta renda
Classe C: Média renda
Classes D e E: Baixa renda
A partir de uma extensa pesquisa, verificou que as probabilidades de um indivíduo transitar de um extrato para outro ou permanecer no mesmo extrato dependiam apenas de seu extrato atual e permaneciam constantes ao longo do tempo.
Levantou, assim, para cada extrato, as seguintes probabilidades de permanência ou mudança de extrato, após o período de tempo de um ano:

Alta renda Permanência: 80% Mudança para média renda: 10% Mudança para baixa renda: 10%
Média renda Permanência: 60% Mudança para alta renda: 20% Mudança para baixa renda: 20%
Baixa renda Permanência: 70% Mudança para alta renda: 10% Mudança para média renda: 20%

A probabilidade de um indivíduo, inicialmente de média renda, ter mobilidade social de renda (ascenso ou descenso), terminando num extrato diferente do inicial, após um período de 2 anos é de
Alternativas
Q2383266 Estatística
Até o Censo de 2010, a região Norte ainda possuía mais homens do que mulheres, mas, segundo os dados do Censo 2022, divulgados em outubro de 2023 pelo IBGE, as mulheres já são a maioria em todas as regiões do Brasil.
A matéria a seguir mostra os municípios do Brasil com maior proporção de mulheres em relação a homens.

Santos (SP) tem o maior percentual de mulheres no Brasil; veja lista 
Santos, no litoral paulista, é a cidade brasileira com a maior proporção de mulheres em relação a homens, segundo dados do Censo 2022 divulgados hoje pelo IBGE.
A cidade paulista lidera o ranking de municípios com mais mulheres, com uma proporção de 54,68%.

1. Santos (SP) - 54,68%
2. Salvador (BA) - 54,49%
3. São Caetano do Sul (SP) - 54,32%
4. Niterói (RJ) - 54,19%
5. Aracaju (SE) - 54,11%

Disponível em: https://noticias.uol.com.br/cotidiano/ultimas-noticias/2023/10/27/santos-ibge-censo-2022-cidades-com-mais-mulheres.htm. Acesso em: 11 jan. 2024. Adaptado.

Suponha que a Prefeitura de Santos, cidade brasileira com o maior percentual de mulheres, de aproximadamente 55%, realize um sorteio de 4 habitantes que cadastraram suas notas fiscais num aplicativo do município. Considere, ainda, que cada munícipe efetue tais cadastramentos de forma independente dos demais habitantes.
A probabilidade de que o número de mulheres sorteadas seja maior que o de homens sorteados é de aproximadamente:
Dado 0,452 = 0,2025 0,552 = 0,3025
Alternativas
Q2383267 Estatística
Considere que o salário médio de empregados de um determinado setor de serviços do Brasil é R$ 2.300,00, com um desvio padrão conhecido de R$ 400,00. Uma empresa desse setor é selecionada ao acaso, e dela é selecionada uma amostra de 36 funcionários, resultando em um salário médio de R$ 2.500,00. Um pesquisador decide realizar um teste de hipótese unilateral com um nível de confiança de 95% para verificar se a empresa selecionada paga salários médios maiores do que a média do setor.
Considere o extrato da Tabela a seguir.

Imagem associada para resolução da questão

Qual o valor-p do teste aplicado pelo pesquisador?  
Alternativas
Q2383268 Estatística
O Quadro abaixo fornece informações sobre o índice de vendas no varejo por estado em agosto de 2023.

Imagem associada para resolução da questão

Um analista de dados resolveu verificar se há presença de outliers nesse conjunto de índices e decidiu fazer isso por meio de um Box Plot dos dados fornecidos.
Com base na técnica escolhida pelo analista, quantos índices podem ser enquadrados como outliers? 
Alternativas
Q2383269 Estatística
Uma pesquisa recente estudou a distribuição de renda familiar per capita, em salários mínimos (s.m.), de duas comunidades, Alfa e Beta, com, aproximadamente, o mesmo número de habitantes. Considerando-se e a base dos logaritmos naturais ou neperianos, na comunidade Alfa, verificou-se que tal renda pode ser bem aproximada por uma variável aleatória contínua (v.a.c.) X com função densidade de probabilidade (f.d.p.) da forma f(X = x) = r ex, 0 ≤ x ≤ 1 s.m.; já para a comunidade Beta, constatou- -se que a renda em estudo seguia aproximadamente a distribuição de uma variável aleatória contínua (v.a.c.) Y com função densidade de probabilidade (f.d.p.) da forma g(Y = y) = s y ey, 0 ≤ y ≤ 1 s.m.
Um técnico deve decidir por apenas uma das duas comunidades para receber um programa assistencial, qual seja, aquela que possua o maior número de habitantes com renda familiar per capita até meio salário mínimo.
Nesses termos, o técnico deverá optar pela comunidade: 

Dado e ≅ 1,645
Alternativas
Q2383270 Estatística
Ao criar um índice para um corpus de notícias políticas, um pesquisador decidiu usar o modelo vetorial com a medida TF-IDF.
Descobriu, porém, que essa medida pode ser calculada de várias formas, com a característica comum de calcular o peso de cada termo a partir da ideia de que esse termo  
Alternativas
Q2383271 Engenharia de Software
Na avaliação de um modelo criado por aprendizado de máquina em um experimento que buscava identificar textos de opinião sobre o desempenho da economia, separando-os dos que não forneciam opinião alguma, só fatos e dados, foi encontrada a seguinte matriz de confusão:
Imagem associada para resolução da questão

Considerando-se que, nessa matriz, as linhas indicam a resposta correta e as colunas indicam a previsão, a acurácia é de
Alternativas
Q2383272 Algoritmos e Estrutura de Dados
Um pesquisador iniciante em aprendizado de máquina trabalhava com um modelo de classificação binário com as duas classes equilibradas. Inicialmente, ele fez a avaliação de seu modelo, separando 20% dos dados disponíveis para a avaliação, e o treinou com 80% dos dados, fazendo o processo apenas uma vez. Depois, a pedido de seu chefe, ele trocou a forma de avaliação, separando o conjunto de dados em 10 partes e escolhendo, em 10 rodadas, uma parte diferente para avaliação e as outras para treinamento.
Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como
Alternativas
Q2383273 Engenharia de Software
Em processamento de linguagem natural, o modelo Skip-Gram é uma técnica popular para treinar word embeddings.
O treinamento do modelo Skip-Gram destaca-se de outras técnicas, como o Continuous Bag of Words (CBOW), por ter a seguinte característica:
Alternativas
Q2383274 Algoritmos e Estrutura de Dados
No gráfico XY, são apresentados pontos que representam duas propriedades de elementos de duas classes, R e S. Os pontos da classe R, representados como círculos, são [(3,5),(3,4),(2,3)], enquanto os pontos da classe S, representados como quadrados, são [(4,3),(4,2),(4,1),(3,1),(2,2)]. É necessário classificar pontos novos, de acordo com o algoritmo K-NN, com K=3, considerando a distância euclidiana.

Imagem associada para resolução da questão

Nesse contexto, as classes dos pontos [(3,2),(3,3) e (4,4)] são, respectivamente:
Alternativas
Q2383275 Engenharia de Software
Na arquitetura de redes neurais, diferentes funções de ativação são utilizadas nas camadas de neurônios para aplicar transformações não lineares aos dados. Uma dessas funções é a ReLU, conhecida por sua eficácia em diversos modelos de aprendizado profundo.
Ao implementar a função ReLU, um pesquisador deve seguir a fórmula:
Alternativas
Q2383276 Engenharia de Software
Em redes convolucionais, o tamanho do passo normalmente é menor que o tamanho do filtro.
Se o tamanho do passo for maior que o tamanho do filtro, é possível que
Alternativas
Q2383277 Engenharia de Software
O método de POS-tagging, ou Part of Speech tagging, é uma tarefa do processamento de linguagem natural em que
Alternativas
Respostas
41: D
42: B
43: C
44: A
45: E
46: D
47: E
48: C
49: C
50: B
51: D
52: A
53: B
54: E
55: B
56: B
57: C
58: B
59: C
60: A