Questões de Concurso Comentadas para IPEA

Q2383286

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383286 Algoritmos e Estrutura de Dados

A biblioteca Scikit-Learn emprega o algoritmo Classification And Regression Tree (CART) para treinar Árvores de Decisão. O algoritmo CART baseia-se na recursividade e na estratégia de divisão binária para construir uma árvore de decisão. Inicialmente, a árvore é representada por um único nó, que contém todos os dados de treinamento. A cada passo, o algoritmo busca a melhor maneira de dividir o conjunto de dados. A recursividade continua até que uma condição de parada seja atendida, como atingir uma profundidade máxima da árvore. Uma vez construída a árvore, a fase de predição ocorre ao percorrer a estrutura da árvore de acordo com as condições estabelecidas nos nós, levando a uma predição (inferência) para uma determinada entrada.
Considerando-se que n corresponde ao número de features e m ao número de instâncias, qual é a complexidade computacional assintótica de predição para árvores de decisão treinadas com o algoritmo CART?

A

O(m)

B

O(m²)

C

O(n × m log(m))

D

O(n² × m log(m))

E

O(log₂ (m))

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383283

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383283 Engenharia de Software

Em uma nota técnica do Ipea sobre emprego público nos governos subnacionais brasileiros, no ano de 2016, aparece menção sobre o fato de as bases utilizadas possuirem outliers, ou valores atípicos.
A construção de um modelo preditivo a partir dos dados dessas bases, usando árvores aleatórias, Random Forests,

A

apresentaria uma redução de variância.

B

seria inadequado, devido à sensibilidade a outliers de Random Forests.

C

teria uma tendência a overfitting.

D

teria propensão a underfitting.

E

teria dependência de linearidade nos dados.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383281

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383281 Engenharia de Software

Um cientista de dados está utilizando máquinas de vetor de suporte (SVM) em um projeto de classificação, pois deseja evitar o overfitting do modelo aos dados de treinamento.
Qual das seguintes técnicas auxilia a prevenir o overfitting em SVM?

A

Apagar algumas ligações da rede.

B

Garantir que o hiperplano divida perfeitamente os pontos.

C

Misturar o conjunto de teste com o de treinamento.

D

Usar todos os pontos para a tomada de decisão.

E

Utilizar um kernel linear.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383280

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383280 Engenharia de Software

Em um projeto de classificação de textos, um modelo de machine learning foi aplicado em um conjunto de teste e apresentou os seguintes resultados: uma precisão de 80% e uma revocação de 70%.
Com base nessas informações e considerando-se apenas a parte inteira da porcentagem, qual é o F1 Score desse modelo?

A

2%

B

18%

C

37%

D

74%

E

98%

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383279

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383279 Engenharia de Software

Um pesquisador possui um conjunto de dados consistindo em características diversas, features, e suas respectivas classificações, labels. Ele deseja dividir esse conjunto de dados em conjuntos distintos, para treinamento e para teste, com o objetivo de validar a eficácia de um modelo de aprendizado de máquina.
Nesse contexto, qual função do SciKit-learn ele deve utilizar para realizar essa divisão de maneira eficiente e adequada?

A

sample_test_train

B

slice_train_test

C

split_learning

D

split_test_train

E

train_test_split

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383278

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383278 Engenharia de Software

Uma cientista de dados percebeu que, ao processar alguns documentos, seria melhor remover palavras que aparecem em quase todo texto, as stop-words.
Para começar sua lista de stop-words, ela pode escolher listar todos os

A

adjetivos e preposições

B

advérbios e pronomes

C

artigos e preposições

D

artigos e substantivos

E

substantivos e verbos

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383277

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383277 Engenharia de Software

O método de POS-tagging, ou Part of Speech tagging, é uma tarefa do processamento de linguagem natural em que

A

cada palavra do texto recebe um rótulo indicando sua classe gramatical.

B

cada palavra do texto recebe um rótulo indicando sua função sintática na sentença.

C

cada palavra do texto recebe um rótulo indicando sua função semântica na sentença.

D

cada sentença do texto recebe um rótulo indicando a quem pertence a fala.

E

cada sentença do texto recebe um rótulo indicando o tipo de ato de fala que representa.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383276

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383276 Engenharia de Software

Em redes convolucionais, o tamanho do passo normalmente é menor que o tamanho do filtro.
Se o tamanho do passo for maior que o tamanho do filtro, é possível que

A

a camada de pooling fique sensível demais a pequenas variações.

B

o modelo apresente características de overfitting.

C

informações importantes sejam perdidas.

D

um aumento significativo na dimensão espacial da entrada aconteça.

E

um aumento significativo na dimensão espacial da saída aconteça.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383275

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383275 Engenharia de Software

Na arquitetura de redes neurais, diferentes funções de ativação são utilizadas nas camadas de neurônios para aplicar transformações não lineares aos dados. Uma dessas funções é a ReLU, conhecida por sua eficácia em diversos modelos de aprendizado profundo.
Ao implementar a função ReLU, um pesquisador deve seguir a fórmula:

A

f(x) = 1/1+e^-x

B

Imagem associada para resolução da questão

C

f(x) = tanh(x)

D

f(x) = max (0, x) - max (0, -x)

E

f(x) = √x²+1-1

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383273

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383273 Engenharia de Software

Em processamento de linguagem natural, o modelo Skip-Gram é uma técnica popular para treinar word embeddings.
O treinamento do modelo Skip-Gram destaca-se de outras técnicas, como o Continuous Bag of Words (CBOW), por ter a seguinte característica:

A

utilizar contextos adjacentes para prever uma palavra- -alvo.

B

focar em prever palavras de contexto a partir de uma palavra-alvo.

C

treinar cada palavra em uma janela de contexto separadamente.

D

gerar embeddings, baseados em dependências sintáticas.

E

empregar uma abordagem de bag-of-words para a geração de embeddings.

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383272

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383272 Algoritmos e Estrutura de Dados

Um pesquisador iniciante em aprendizado de máquina trabalhava com um modelo de classificação binário com as duas classes equilibradas. Inicialmente, ele fez a avaliação de seu modelo, separando 20% dos dados disponíveis para a avaliação, e o treinou com 80% dos dados, fazendo o processo apenas uma vez. Depois, a pedido de seu chefe, ele trocou a forma de avaliação, separando o conjunto de dados em 10 partes e escolhendo, em 10 rodadas, uma parte diferente para avaliação e as outras para treinamento.
Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como

A

estratificação e hold-out

B

hold-out e k-fold

C

leave-one-out e estratificação

D

leave-one-out e k-fold

E

Monte Carlo e leave-p-out

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383268

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383268 Estatística

O Quadro abaixo fornece informações sobre o índice de vendas no varejo por estado em agosto de 2023.

Imagem associada para resolução da questão

Um analista de dados resolveu verificar se há presença de outliers nesse conjunto de índices e decidiu fazer isso por meio de um Box Plot dos dados fornecidos.
Com base na técnica escolhida pelo analista, quantos índices podem ser enquadrados como outliers?

A

0

B

1

C

2

D

3

E

4

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383267

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383267 Estatística

Considere que o salário médio de empregados de um determinado setor de serviços do Brasil é R$ 2.300,00, com um desvio padrão conhecido de R$ 400,00. Uma empresa desse setor é selecionada ao acaso, e dela é selecionada uma amostra de 36 funcionários, resultando em um salário médio de R$ 2.500,00. Um pesquisador decide realizar um teste de hipótese unilateral com um nível de confiança de 95% para verificar se a empresa selecionada paga salários médios maiores do que a média do setor.
Considere o extrato da Tabela a seguir.

Imagem associada para resolução da questão

Qual o valor-p do teste aplicado pelo pesquisador?

A

0,0010

B

0,0013

C

0,0017

D

0,0025

E

0,0031

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383264

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383264 Estatística

Ao fim do ano de 2022, 21 instituições financeiras fizeram estimativas para o Ibovespa, principal índice de ações da bolsa brasileira (B3), mostradas na notícia do Jornal Valor Econômico de 22/12/2022, que também apresenta a média aritmética e a mediana dos dados.

Previsão para a bolsa é de alta em 2023
Casa mais otimista projeta Ibovespa em 150 mil pontos; rumo dos juros será decisivo

Imagem associada para resolução da questão

Disponível em: https://valor.globo.com/financas/noticia/2022/12/22/previsao-para-a-bolsa-e-de-alta-em-20233.ghtml. Acesso em: 29 dez. 2023. Adaptado.

No útimo pregão do ano de 2023, o Ibovespa fechou em 134.185,23 pontos, conforme dados da B3.
Considerando-se os dados apresentados, a medida de posição das estimativas das instituições financeiras que mais se aproximou do resultado real, apresentado pelo Ibovespa no último pregão do ano, foi a:

A

mediana

B

média geométrica

C

média harmônica

D

menor moda

E

maior moda

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383263

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383263 Estatística

Considere a matéria a seguir, sobre a dura realidade do trabalho infantil no Brasil.

Quase 5% das crianças e adolescentes do país estão em situação de trabalho infantil, aponta IBGE
O Brasil tem um total de 38,365 milhões de pessoas com idade de 5 a 17 anos. Destas, 2,103 milhões realizam atividades econômicas ou de autoconsumo, estando 1,881 milhão em situação de trabalho infantil, o equivalente a 4,9% do total de pessoas entre 5 e 17 anos no país, segundo dados da Pesquisa Nacional por Amostra de Domicílios Contínua 2022, divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). A pesquisa também apontou que, em 2022, 756 mil crianças e adolescentes exerciam atividades da Lista TIP, do governo federal, que elenca as piores formas de trabalho infantil no país. No geral, são serviços que envolvem risco de acidentes ou são prejudiciais à saúde, como trabalho na construção civil, em matadouros, oficinas mecânicas, comércio ambulante em locais públicos, coleta de lixo, venda de bebidas alcoólicas, entre outras atividades.

Imagem associada para resolução da questão

A pesquisa do IBGE considera duas categorias de atividades:
• econômica, que é a de quem trabalhou pelo menos 1 hora completa e foi remunerado em dinheiro, produtos, benefícios, etc., ou que não teve remuneração direta, mas atuou para ajudar a atividade econômica de algum parente.
• de autoconsumo, que incluem pesca, criação de animais, fabricação de roupas, construção de imóveis e outras que sejam para uso exclusivo da pessoa ou de parentes.

E nem todas as pessoas de 5 a 17 anos que exercem essas atividades se enquadram na situação de trabalho infantil.
Disponível em: https://g1.globo.com/trabalho-e-carreira/noticia/2023/12/20/quase-5percent-das-criancas-e-adolescentes-do-pais-estao-emsituacao-de-trabalho-infantil-aponta-ibge.ghtml. Acesso em: 29 dez 2023. Adaptado.

Nesse contexto, considere que uma pessoa de 5 a 17 anos é escolhida ao acaso e que se deseja estimar a probabilidade de que essa pessoa exerça trabalho infantil, mas não em uma de suas piores formas, que são elencadas na lista TIP, dado que ela realiza atividades econômicas ou de autoconsumo.
Essa probabilidade é, aproximadamente, de

A

2,9%

B

35,9%

C

46,5%

D

53,5%

E

59,8%

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383261

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383261 Estatística

Em uma maternidade, 400 bebês nasceram em uma semana. Sejam H e M os números de meninos e de meninas, respectivamente. Sabe-se, portanto, que H + M = 400. Suponha para esse problema que, para cada bebê, a probabilidade de que seja menino seja exatamente igual a 1/2; suponha também que os sexos dos bebês sejam perfeitamente independentes uns dos outros. Seja P a probabilidade condicional de que H < 90, dado que H < 100.
Aproximadamente, quanto vale P?

A

P < 1/400

B

1/400 < P < 1/10

C

1/10 < P < 1/4

D

1/4 < P < 1/2

E

P > 1/2

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383254

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383254 Programação

Uma lista é uma estrutura de dados versátil e fundamental usada para organizar e armazenar coleções de itens. As listas em Python oferecem uma maneira dinâmica e eficiente de lidar com sequências de itens. Por terem a capacidade de adicionar, remover e modificar elementos, essas listas desempenham um papel crucial em muitos programas em Python, tornando-se uma ferramenta essencial para tarefas que vão desde o armazenamento simples de dados até algoritmos mais complexos e manipulação de dados.
Nesse contexto, considere duas listas, L1 e L2, que foram implementadas em Python. As configurações iniciais dessas listas são as seguintes:

L1 = [1, 2, 3]
L2 = [3, 4, 5]

Em seguida, foram feitas as seguintes operações:

L1.append(3)
L3 = L1
L3.append(7)
L1.append(8)
L4 = L1 + L2

Qual é o valor de L4?

A

[1, 2, 3, 4, 5]

B

[1, 2, 3, 3, 4, 5]

C

[1, 2, 3, 3, 8, 3, 4, 5]

D

[1, 2, 3, 3, 3, 4, 5, 7, 8]

E

[1, 2, 3, 3, 7, 8, 3, 4, 5]

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383253

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383253 Programação

Python é dinamicamente tipado, o que significa que os tipos de variáveis são determinados em tempo de execução com base nos valores atribuídos, proporcionando flexibilidade durante o desenvolvimento. Essa dinamicidade permite a criação de código versátil e adaptável.
Nesse contexto, considere o seguinte trecho de código:

a = 5
b = 5
c = '5'
d = (a + b) + c

Qual é o resultado da variável d?

A

'555'

B

15

C

'105'

D

555

E

erro

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383252

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383252 Programação

Um programa em Python contém um vetor unidimensional, de tamanho 20, chamado vetor, criado com o Numpy. Deseja-se obter, em apenas uma expressão, uma matriz de 4 linhas e 5 colunas criada linha a linha a partir dos elementos desse vetor.
Para tal fim, a expressão a ser utilizada é

A

np.split(vetor, 4)

B

vetor.reshape(5, 4)

C

np.reshape(vetor, (4, 5))

D

vetor.transpose(4, 5)

E

np.array(vetor, shape=(4, 5))

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Q2383251

Ano: 2024 Banca: CESGRANRIO Órgão: IPEA Prova: CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |

Q2383251 Programação

Na programação funcional, que é um paradigma suportado pela Linguagem Scala, uma das práticas fundamentais é o uso de funções puras.
A principal propriedade que caracteriza uma função pura é a(o)

A

baixa coesão

B

ausência de efeitos colaterais

C

incapacidade de chamar outra função

D

alto acoplamento

E

encapsulamento aberto

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

🚨 ÚLTIMOS DESCONTOS: ATÉ 67% OFF! 🚨

🚨 ÚLTIMOS DESCONTOS: ATÉ 67% OFF! 🚨

Foram encontradas 547 questões

Resolva questões gratuitamente!

, continue estudando de graça!