Questões de Concurso para IPEA

Q2384627

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa - Políticas Públicas e Sociedade |

Q2384627 Pedagogia

Um instituto deseja realizar uma pesquisa qualitativa para avaliar a importância de habilidades sociais de jovens no mercado de trabalho. A pesquisa conta com perguntas abertas obtidas por meio de entrevistas com empregadores e empregados de empresas de vários setores do comércio. O pesquisador deseja, também, fazer uma análise detalhada dos dados coletados, de forma a permitir a descoberta de temas relacionados ao foco da pesquisa.

Assim, para atingir o objetivo proposto, o método a ser usado nessa pesquisa deverá ser o método de codificação

A

aberta

B

axial

C

seletiva

D

temática

E

por incidência

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2384626

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa - Políticas Públicas e Sociedade |

Q2384626 Estatística

Usando a base de dados de indivíduos pertencentes ao Sistema de Saúde, um pesquisador desenvolveu um modelo logístico para prever a chance de um indivíduo ter ou não ter uma determinada doença em função do tempo de prática de esporte. O modelo ajustado pelo pesquisador apresentou o seguinte resultado:

Imagem associada para resolução da questão

Imagem associada para resolução da questão

Considerando-se que exp(-0,45) ≈ 0,65, com base no resultado obtido, a que conclusão chegou o pesquisador?

A

Para um aumento de um ano na prática de esporte, a chance de ter a doença aumenta 45%.

B

Para um aumento de um ano na prática de esporte, a chance de ter a doença diminui 45%.

C

Para um aumento de um ano na prática de esporte, a chance de ter a doença aumenta 35%.

D

Para um aumento de um ano na prática de esporte, a chance de ter a doença diminui 35%.

E

Para um aumento de um ano na prática de esporte, a chance de ter a doença diminui 65%.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2384625

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa - Políticas Públicas e Sociedade |

Q2384625 Estatística

Um analista de planejamento coletou dados sobre o percentual de recursos aplicados pelo governo federal na educação, considerando as regiões do Brasil e os níveis de ensino (Básico e Superior). O analista tem interesse de saber se as regiões do Brasil aplicam os mesmos percentuais de recursos nesses níveis de educação.

Que teste deve usar o analista para atingir o seu propósito?

A

Independência

B

Aderência

C

Homogeneidade

D

t de Student com n-1 graus de liberdade

E

Kolmogorov-Sminov

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383287

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383287 Engenharia de Software

No aprendizado não supervisionado, os dados de treinamento não têm rótulos. O objetivo é agrupar instâncias semelhantes em clusters. Nesse contexto, suponha que se deseja executar um algoritmo de agrupamento para tentar detectar grupos de visitantes semelhantes em um blog. Em nenhum momento é informado ao algoritmo a que grupo um visitante pertence, mas ele encontra essas conexões sem ajuda. Por exemplo, o algoritmo pode notar que 40% dos visitantes são homens que adoram histórias em quadrinhos e, geralmente, leem o blog à noite, enquanto 20% são jovens amantes de ficção científica que visitam o blog durante os fins de semana, e assim por diante. Deseja-se, nesse caso, usar um algoritmo de agrupamento hierárquico para subdividir cada grupo em grupos menores, o que pode ajudar a direcionar as postagens do blog para cada grupo específico.
Nesse cenário, qual é o algoritmo mais apropriado para fazer o agrupamento desejado?

A

Agglomerative Hierarchical Clustering

B

Principal Component Analysis (PCA)

C

Linear Regression Clustering

D

k-DBSCAN Clustering

E

L-Means Clustering

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383286

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383286 Algoritmos e Estrutura de Dados

A biblioteca Scikit-Learn emprega o algoritmo Classification And Regression Tree (CART) para treinar Árvores de Decisão. O algoritmo CART baseia-se na recursividade e na estratégia de divisão binária para construir uma árvore de decisão. Inicialmente, a árvore é representada por um único nó, que contém todos os dados de treinamento. A cada passo, o algoritmo busca a melhor maneira de dividir o conjunto de dados. A recursividade continua até que uma condição de parada seja atendida, como atingir uma profundidade máxima da árvore. Uma vez construída a árvore, a fase de predição ocorre ao percorrer a estrutura da árvore de acordo com as condições estabelecidas nos nós, levando a uma predição (inferência) para uma determinada entrada.
Considerando-se que n corresponde ao número de features e m ao número de instâncias, qual é a complexidade computacional assintótica de predição para árvores de decisão treinadas com o algoritmo CART?

A

O(m)

B

O(m²)

C

O(n × m log(m))

D

O(n² × m log(m))

E

O(log₂ (m))

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383285

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383285 Engenharia de Software

As árvores de decisão são um modelo de aprendizado de máquina que opera por meio da construção de uma estrutura em forma de árvore para tomar decisões e que oferece uma compreensão clara da lógica de decisão e da hierarquia de características que contribuem para as predições finais. Elas são versáteis e podem ser usadas tanto para tarefas de classificação quanto para as de regressão.
Nesse contexto, considere a construção de uma árvore de regressão usando a classe DecisionTreeRegressor do ScikitLearn e seu treinamento em um conjunto de dados quadrático com max_depth=2, conforme mostrado a seguir:

from sklearn.tree import DecisionTreeRegressor
tree_reg = DecisionTreeRegressor(max_depth=2)
tree_reg.fit(X, y)

A árvore resultante é representada na Figura a seguir.

Imagem associada para resolução da questão

GÉRON, A. Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniquesto Build Intelligent Systems. 2 ed. Sebastopol, CA: O’Reilly Media, Inc.: 2019, p. 183.

Considerando-se o cenário apresentado e que se deseja fazer uma predição para uma nova instância, com x1 = 0.6, qual será o valor predito?

A

0.015

B

0.074

C

0.111

D

0.259

E

110

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383284

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383284 Estatística

Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a

A

média dos dados

B

mediana dos dados

C

soma total dos dados

D

variância máxima dos dados

E

correlação mínima entre os dados

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383283

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383283 Engenharia de Software

Em uma nota técnica do Ipea sobre emprego público nos governos subnacionais brasileiros, no ano de 2016, aparece menção sobre o fato de as bases utilizadas possuirem outliers, ou valores atípicos.
A construção de um modelo preditivo a partir dos dados dessas bases, usando árvores aleatórias, Random Forests,

A

apresentaria uma redução de variância.

B

seria inadequado, devido à sensibilidade a outliers de Random Forests.

C

teria uma tendência a overfitting.

D

teria propensão a underfitting.

E

teria dependência de linearidade nos dados.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383282

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383282 Estatística

Alguns trabalhos publicados como notas técnicas pelo Ipea se utilizam do método de classificação denominado de Bayes Ingênuo.
No contexto do classificador Bayesiano Ingênuo, Naive Bayes, a ingenuidade do modelo é caracterizada pela(o)

A

dependência direta entre todas as variáveis preditoras

B

ênfase na complexidade do modelo

C

suposição de independência condicional entre as variáveis preditoras

D

utilização de distribuição de probabilidade uniforme

E

uso exclusivo de variáveis contínuas

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383281

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383281 Engenharia de Software

Um cientista de dados está utilizando máquinas de vetor de suporte (SVM) em um projeto de classificação, pois deseja evitar o overfitting do modelo aos dados de treinamento.
Qual das seguintes técnicas auxilia a prevenir o overfitting em SVM?

A

Apagar algumas ligações da rede.

B

Garantir que o hiperplano divida perfeitamente os pontos.

C

Misturar o conjunto de teste com o de treinamento.

D

Usar todos os pontos para a tomada de decisão.

E

Utilizar um kernel linear.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383280

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383280 Engenharia de Software

Em um projeto de classificação de textos, um modelo de machine learning foi aplicado em um conjunto de teste e apresentou os seguintes resultados: uma precisão de 80% e uma revocação de 70%.
Com base nessas informações e considerando-se apenas a parte inteira da porcentagem, qual é o F1 Score desse modelo?

A

2%

B

18%

C

37%

D

74%

E

98%

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383279

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383279 Engenharia de Software

Um pesquisador possui um conjunto de dados consistindo em características diversas, features, e suas respectivas classificações, labels. Ele deseja dividir esse conjunto de dados em conjuntos distintos, para treinamento e para teste, com o objetivo de validar a eficácia de um modelo de aprendizado de máquina.
Nesse contexto, qual função do SciKit-learn ele deve utilizar para realizar essa divisão de maneira eficiente e adequada?

A

sample_test_train

B

slice_train_test

C

split_learning

D

split_test_train

E

train_test_split

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383278

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383278 Engenharia de Software

Uma cientista de dados percebeu que, ao processar alguns documentos, seria melhor remover palavras que aparecem em quase todo texto, as stop-words.
Para começar sua lista de stop-words, ela pode escolher listar todos os

A

adjetivos e preposições

B

advérbios e pronomes

C

artigos e preposições

D

artigos e substantivos

E

substantivos e verbos

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383277

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383277 Engenharia de Software

O método de POS-tagging, ou Part of Speech tagging, é uma tarefa do processamento de linguagem natural em que

A

cada palavra do texto recebe um rótulo indicando sua classe gramatical.

B

cada palavra do texto recebe um rótulo indicando sua função sintática na sentença.

C

cada palavra do texto recebe um rótulo indicando sua função semântica na sentença.

D

cada sentença do texto recebe um rótulo indicando a quem pertence a fala.

E

cada sentença do texto recebe um rótulo indicando o tipo de ato de fala que representa.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383276

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383276 Engenharia de Software

Em redes convolucionais, o tamanho do passo normalmente é menor que o tamanho do filtro.
Se o tamanho do passo for maior que o tamanho do filtro, é possível que

A

a camada de pooling fique sensível demais a pequenas variações.

B

o modelo apresente características de overfitting.

C

informações importantes sejam perdidas.

D

um aumento significativo na dimensão espacial da entrada aconteça.

E

um aumento significativo na dimensão espacial da saída aconteça.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383275

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383275 Engenharia de Software

Na arquitetura de redes neurais, diferentes funções de ativação são utilizadas nas camadas de neurônios para aplicar transformações não lineares aos dados. Uma dessas funções é a ReLU, conhecida por sua eficácia em diversos modelos de aprendizado profundo.
Ao implementar a função ReLU, um pesquisador deve seguir a fórmula:

A

f(x) = 1/1+e^-x

B

C

f(x) = tanh(x)

D

f(x) = max (0, x) - max (0, -x)

E

f(x) = √x²+1-1

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383274

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383274 Algoritmos e Estrutura de Dados

No gráfico XY, são apresentados pontos que representam duas propriedades de elementos de duas classes, R e S. Os pontos da classe R, representados como círculos, são [(3,5),(3,4),(2,3)], enquanto os pontos da classe S, representados como quadrados, são [(4,3),(4,2),(4,1),(3,1),(2,2)]. É necessário classificar pontos novos, de acordo com o algoritmo K-NN, com K=3, considerando a distância euclidiana.

Imagem associada para resolução da questão

Nesse contexto, as classes dos pontos [(3,2),(3,3) e (4,4)] são, respectivamente:

A

[R,R,S]

B

[R,S,R]

C

[S,R,R]

D

[S,R,S]

E

[R,R,R]

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383273

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383273 Engenharia de Software

Em processamento de linguagem natural, o modelo Skip-Gram é uma técnica popular para treinar word embeddings.
O treinamento do modelo Skip-Gram destaca-se de outras técnicas, como o Continuous Bag of Words (CBOW), por ter a seguinte característica:

A

utilizar contextos adjacentes para prever uma palavra- -alvo.

B

focar em prever palavras de contexto a partir de uma palavra-alvo.

C

treinar cada palavra em uma janela de contexto separadamente.

D

gerar embeddings, baseados em dependências sintáticas.

E

empregar uma abordagem de bag-of-words para a geração de embeddings.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383272

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383272 Algoritmos e Estrutura de Dados

Um pesquisador iniciante em aprendizado de máquina trabalhava com um modelo de classificação binário com as duas classes equilibradas. Inicialmente, ele fez a avaliação de seu modelo, separando 20% dos dados disponíveis para a avaliação, e o treinou com 80% dos dados, fazendo o processo apenas uma vez. Depois, a pedido de seu chefe, ele trocou a forma de avaliação, separando o conjunto de dados em 10 partes e escolhendo, em 10 rodadas, uma parte diferente para avaliação e as outras para treinamento.
Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como

A

estratificação e hold-out

B

hold-out e k-fold

C

leave-one-out e estratificação

D

leave-one-out e k-fold

E

Monte Carlo e leave-p-out

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383271

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383271 Engenharia de Software

Na avaliação de um modelo criado por aprendizado de máquina em um experimento que buscava identificar textos de opinião sobre o desempenho da economia, separando-os dos que não forneciam opinião alguma, só fatos e dados, foi encontrada a seguinte matriz de confusão:
Imagem associada para resolução da questão

Considerando-se que, nessa matriz, as linhas indicam a resposta correta e as colunas indicam a previsão, a acurácia é de

A

8%

B

44%

C

48%

D

88%

E

92%

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

🚨 ÚLTIMOS DESCONTOS: ATÉ 67% OFF! 🚨

🚨 ÚLTIMOS DESCONTOS: ATÉ 67% OFF! 🚨

Foram encontradas 1.406 questões

Resolva questões gratuitamente!

, continue estudando de graça!