Questões de Concurso Público BNDES 2024 para Analista - Ciência de Dados (Manhã)

Foram encontradas 70 questões

Q3048097 Estatística
Considere um grupo de 600 funcionários de uma empresa que registram os seguintes valores com relação ao tempo de permanência em um curso de aperfeiçoamento:

Média = 9 dias
1o Quartil = 5 dias
3o Quartil = 15 dias
Coeficiente de variação = 20%

Considerando-se essas informações, é possível concluir que
Alternativas
Q3048098 Economia
Considere a seguinte estimativa da Função Cobb-Douglas, com o produto sendo explicado pelos fatores de produção capital e trabalho, resumida no quadro abaixo.

Estimativa da Função Cobb-Douglas:
Variável dependente: LnPRODUTO
Método: Mínimos Quadrados
Amostra: 1-51
Observações incluídas: 51

Imagem associada para resolução da questão

Nesse contexto, a partir da interpretação desses resultados, é possível concluir que
Alternativas
Q3048099 Estatística
Diferentemente dos modelos de equação única, nos modelos de equações simultâneas há mais do que uma variável dependente ou endógena envolvida.
Quando isso acontece, um método recomendado para contornar esse viés de endogeneidade é o
Alternativas
Q3048100 Comércio Internacional (Exterior)
Quando os agentes econômicos possuem incertezas em relação a variação cambial, isto é, do preço do Real em relação ao Dólar (R$/US$), eles procuram se proteger de suas posições descobertas, realizando uma operação conhecida por swap cambial, ou seja, uma troca de moedas. O swap cambial utilizado pelo Banco Central do Brasil é um contrato padrão que utiliza como taxa de juros a taxa DI (Depósito Interbancário) de um dia e a variação da taxa de câmbio Real/Dólar.
Na operação de swap cambial, a(o)
Alternativas
Q3048101 Estatística
Um dos tipos importantes de dados utilizados em análises são os de séries temporais.
Nas análises aplicadas às séries temporais,
Alternativas
Q3048102 Estatística
Os modelos de vetores autorregressivos (VAR) são uma classe de modelos estatísticos usados para capturar as interações dinâmicas entre múltiplas séries temporais.
Uma característica dessa categoria de modelos VAR é que  
Alternativas
Q3048103 Matemática Financeira
Considere um investidor que tenha a opção de aplicar seus recursos de R$ 60.000,00 à taxa de juros compostos de 9,9% ao semestre (opção P) ou à taxa de 20,78% ao ano (opção Q).
Ao comparar essas duas opções de investimento, conclui-se que
Alternativas
Q3048104 Banco de Dados
Os bancos de dados relacionais permitem a modelagem e a persistência de dados estruturados. Uma característica de tais bancos de dados é que eles possuem metadados. Considere que um banco de dados possui uma tabela relacional chamada PRODUTO e que essa tabela possui atributos, tais como a identificação do produto, o nome do produto e o seu valor de venda.
Nesse cenário, os metadados relativos à tabela PRODUTO são utilizados pelo seu respectivo Sistema Gerenciador de Banco de Dados Relacionais (SGBDR) para
Alternativas
Q3048105 Banco de Dados
Data warehouses (DW) e data lakes (DL) são repositórios de dados especializados, com objetivos distintos dos bancos de dados relacionais e NoSQL.
Nesse contexto, ao comparar DW a DL, verifica-se que
Alternativas
Q3048106 Banco de Dados
O modelo relacional de dados é amplamente utilizado em bancos de dados. A organização de dados em tabelas (relações), com suas respectivas linhas (tuplas) e colunas (atributos), é de fácil compreensão. Os Sistemas Gerenciadores de Bancos de Dados Relacionais (SGBDR) tornam possível persistir dados em tabelas com qualidade e recuperar esses mesmos dados de forma rápida e eficiente.
Segundo o modelo relacional de dados, uma tabela pode ter
Alternativas
Q3048107 Banco de Dados
Em um Sistema Gerenciador de Banco de Dados (SGBD), os índices são estruturas de dados que têm por objetivo tornar mais rápido o acesso aos dados. Índices são utilizados tanto em SGBD relacionais quanto em SGBD NoSQL.
Considerando-se uma tabela T1 em um SGBD relacional, quanto a esses índices, verifica-se que
Alternativas
Q3048108 Arquitetura de Software
O Microsoft Team Data Science Process (TDSP) é uma metodologia que define, entre outros conceitos, um ciclo de vida para projetos de ciência de dados.
A TDSP possui cinco estágios principais, de modo que na etapa de
Alternativas
Q3048109 Banco de Dados
Um conjunto de dados numéricos com significativa diversidade foi apresentado à equipe de análise de dados de uma empresa. Como parte do processo decisório, os analistas necessitavam transformar um dos atributos numéricos em faixas de valores, a fim de permitir classificá-los em um universo de possibilidades. Para isso, decidiram, na etapa de enriquecimento de dados, criar um atributo, derivado do atributo numérico supracitado, em um processo de transformação de dados conhecido por discretização.
Uma das características das técnicas de discretização é que
Alternativas
Q3048110 Estatística
Uma equipe de análise de riscos de um banco de investimentos precisa avaliar o risco de diferentes carteiras de clientes, que possuem ativos em escalas variadas. Para isso, ela decidiu utilizar modelos de aprendizado de máquina, a fim de auxiliar o seu processo de tomada de decisão. Os analistas da equipe perceberam que parte dos ativos disponíveis poderia influenciar desproporcionalmente a análise de risco. Assim, decidiram aplicar a técnica de normalização z-score. Com essa medida, pretendem reduzir a influência de uma variação abrupta no treinamento dos modelos de aprendizado de máquina, promovendo uma comparação justa entre os ativos e uma avaliação mais precisa do risco em cada carteira. Considere que W seja o conjunto de todos os valores em reais dos ativos de carteiras de investimentos que a equipe de analistas precisa avaliar.
Uma das características da normalização z-score é que, em sua definição original (clássica), essa normalização  
Alternativas
Q3048111 Banco de Dados
Uma equipe de ciência de dados está trabalhando na construção de um modelo preditivo utilizando um grande conjunto de dados. Durante esse processo, os cientistas de dados estão realizando o feature engineering para criar e selecionar as variáveis mais relevantes, além de aplicar técnicas de divisão de dados para garantir a eficácia e a generalização do modelo.
Considerando-se esse contexto, qual combinação de técnicas maximizará a performance do modelo?
Alternativas
Q3048112 Engenharia de Software
Uma equipe de cientistas de dados está desenvolvendo um modelo preditivo e deseja otimizar seus hiperparâmetros para maximizar a performance do modelo.
Considerando-se as técnicas de otimização de hiperparâmetros, para encontrar a configuração de hiperparâmetros, essa equipe de cientistas deverá
Alternativas
Q3048113 Engenharia de Software
Como parte do processo de desenvolvimento de uma aplicação para analisar grandes volumes de textos, diversas tarefas de Processamento de Linguagem Natural (NLP, sigla em inglês) estão sendo implementadas para melhorar a eficácia e a precisão dessa aplicação.
Diante disso, para a aplicação dessas tarefas, é necessário
Alternativas
Q3048114 Governança de TI
Uma empresa está implementando um programa de governança de dados para melhorar a qualidade e a integridade dos dados que utiliza em suas operações diárias. As seguintes diretrizes foram passadas ao time de implantação:

1. Garantir que os dados sejam precisos, completos e atualizados em tempo real, para apoiar a tomada de decisões estratégicas.
2. Implementar políticas que assegurem a conformidade com regulamentos de privacidade de dados, como a Lei Geral de Proteção de Dados Pessoais (LGPD).
3. Adotar as melhores práticas do Data Management Body of Knowledge (DMBOK) para estruturar seu programa de governança de dados.

Com base nos conceitos de governança de dados do DMBOK, quais ações são necessárias para implementar as diretrizes mencionadas? 
Alternativas
Q3048115 Estatística
Uma equipe precisa apresentar os resultados de diversas análises para diferentes públicos. Cada visualização deve ser escolhida e projetada de forma a comunicar claramente os insights obtidos, considerando as boas práticas de design e de acessibilidade.
Serão apresentados, em momentos diferentes, os seguintes dados:

1. Distribuição de idades de uma pesquisa populacional, que possui um grande número de participantes.
2. Comparação de receitas mensais de diferentes setores de uma empresa ao longo de um ano.
3. Proporção de vendas de diferentes produtos de uma loja durante o último trimestre.
4. Análise de correlação entre as variáveis “horas de estudo” e “nota final” de estudantes.

Considerando-se as boas práticas de design e acessibilidade, quais tipos de gráficos devem ser utilizados para a visualização dessas quatro situações?
Alternativas
Q3048116 Engenharia de Software
Ao avaliar a performance de diversos modelos preditivos para um problema de regressão e outro de classificação, várias métricas podem ser utilizadas para determinar qual modelo oferece o melhor desempenho. Considere as métricas para regressão e classificação, bem como as técnicas de detecção de overfitting e underfitting.
Nesse contexto, quais métricas devem ser utilizadas para determinar qual modelo oferece o melhor desempenho?
Alternativas
Respostas
41: E
42: B
43: D
44: E
45: C
46: C
47: C
48: C
49: D
50: A
51: C
52: B
53: C
54: D
55: E
56: C
57: B
58: D
59: D
60: D