Questões CVM 2024 para Analista CVM - Perfil 7 - Ciência de Dados - Tarde

Q2517618

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517618 Engenharia de Software

Considere um modelo de rede neural projetado para tarefas de classificação de imagens. A arquitetura da rede consiste em várias camadas, incluindo camadas de entrada, ocultas e de saída. Durante o treinamento, o modelo aprende a atribuir imagens de entrada a classes predefinidas (por exemplo, “gato”, “cachorro”, “pássaro”, etc.).

Sobre o papel da camada de saída nessa rede neural, é correto afirmar que ela:

A

garante que a rede neural generalize bem para dados não vistos, prevenindo o sobreajuste;

B

ajusta os pesos dos neurônios ocultos para minimizar o erro de classificação durante o treinamento;

C

mapeia as características aprendidas para rótulos de classe específicos com base em padrões aprendidos;

D

realiza a extração de características aprendendo representações hierárquicas a partir de valores de pixel brutos;

E

calcula a soma ponderada das características de entrada e aplica uma função de ativação para produzir probabilidades de classe.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517619

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517619 Algoritmos e Estrutura de Dados

O cientista de dados Pedro trabalha em um projeto que envolve a previsão dos movimentos de um braço robótico em um ambiente complexo. Pedro tem um fluxograma de um algoritmo de aprendizado por reforço que é capaz de se adaptar dinamicamente ao ambiente e ajustar suas ações com base nos resultados de ações anteriores.

O algoritmo representado pelo referido fluxograma que deve ser empregado para a realização da tarefa de Pedro é o:

A

Máquina de Vetores de Suporte (SVM);

B

Rede Neural Convolucional (CNN);

C

Long Short-Term Memory (LSTM);

D

Twin Delayed Deep Deterministic Policy Gradient (TD3);

E

K-Vizinhos Mais Próximos (KNN).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517620

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517620 Engenharia de Software

Considere uma estrutura específica de rede neural recorrente, conhecida como Long Short-Term Memory (LSTM). Essa estrutura é projetada para enfrentar desafios como capturar dependências de longo prazo e mitigar o problema do gradiente que desaparece.

A inovação arquitetônica distintiva da LSTM é(são):

A

o recorte de gradiente;

B

as células de memória com mecanismos de gating;

C

os mecanismos de atenção;

D

as conexões de salto;

E

as camadas de Max-pooling.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517621

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517621 Engenharia de Software

A abordagem que garante uma exploração completa das combinações de hiperparâmetros na identificação da configuração ideal para maximizar o desempenho do modelo de aprendizado de máquina é a:

A

realização de uma Grid Search, explorando sistematicamente os valores de hiperparâmetros predefinidos para identificar a combinação ideal para maximizar o desempenho do modelo;

B

utilização de uma Busca Aleatória, amostrando aleatoriamente o espaço de hiperparâmetros, oferecendo uma abordagem mais eficiente para o ajuste de hiperparâmetros em comparação com os métodos exaustivos;

C

implementação de uma Validação Cruzada K-fold, particionando o conjunto de dados em K subconjuntos para treinar e avaliar iterativamente o modelo, fornecendo uma avaliação robusta de seu desempenho de generalização;

D

aplicação de métodos Ensemble, combinando vários modelos para aproveitar suas diversas forças, visando a melhorar o desempenho geral, particularmente quando os modelos individuais apresentam diferentes tipos de erros;

E

utilização de uma Feature Scaling, normalizando a escala das características de entrada para garantir comparações justas entre diferentes variáveis, o que é particularmente benéfico para algoritmos sensíveis a diferenças de escala.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517622

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517622 Segurança da Informação

Um cientista trabalha em um projeto de cibersegurança no qual deve identificar atividades de rede incomuns, que podem indicar possíveis ameaças de segurança. Após coletar dados sobre o tráfego de rede, o cientista percebe que alguns pontos de dados exibem padrões significativamente diferentes da maioria.

O método que deve ser aplicado para detectar as anomalias, identificando outliers isolados nos dados e possíveis ameaças de segurança, é o:

A

Isolation Forest;

B

Box Plot (IQR);

C

Local Outlier Factor (LOF);

D

do desvio padrão;

E

DBSCAN (Density-Based Spatial Clustering of Applications with Noise).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517623

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517623 Banco de Dados

Observe os conjuntos de dados a seguir.

Imagem associada para resolução da questão

Para desidentificar o Conjunto de Dados Sensíveis A e gerar o Conjunto de Dados B, a técnica de anonimização que deve ser aplicada é o(a):

A

adição de ruído no atributo ID;

B

truncagem no atributo Nome;

C

encobrimento no atributo Profissão;

D

supressão no atributo CEP;

E

blurring no atributo Situação.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517624

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517624 Banco de Dados

O analista João desenvolveu diversos dashboards na plataforma Microsoft Power BI e solicitou ao programador web Pedro que disponibilizasse aquelas análises no portal de acesso à informação da CVM.

Para inserir os dashboards desenvolvidos por João na página web da CVM, o recurso do Power BI que Pedro deve usar é o(a):

A

Modelo semântico;

B

Relatório Paginado;

C

Conexão com fontes de dados Web;

D

Análise Integrada (Embedded Analytics);

E

Visualização Narrativa Inteligente (Smart Narrative).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517625

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517625 Banco de Dados

Para tomar decisões diárias, o analista João precisa consultar o preço de diversas ações do mercado financeiro, bem como outros dados da CVM. Contudo, ao acessar o ambiente de BigData da CVM, João verificou que os preços das ações desse ambiente demoravam para ser atualizados.

João procurou o arquiteto de BigData da CVM para tratar a dimensão da qualidade de dados denominada:

A

validade (validity);

B

correspondência (matching);

C

unicidade (uniqueness);

D

consistência (consistency);

E

temporalidade (timeliness).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517626

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517626 Sistemas Operacionais

O cientista de dados Miguel decidiu buscar um serviço de nuvem que forneça recursos de computação sob demanda, tais como servidores, rede, armazenamento e outros, para construir seu ambiente de análise e exploração de dados, podendo incorporar sistemas operacionais e aplicativos.

Para isso, Miguel deve contratar o serviço de nuvem:

A

DaaS;

B

FaaS;

C

IaaS;

D

PaaS;

E

SaaS.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517627

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517627 Direito Digital

O sistema CVMWeb armazena os dados pessoais dos consultores de valores mobiliários, como nome, telefone e e-mail. Uma entidade financeira privada solicita, ao setor de recursos humanos da CVM, os dados de contato dos consultores cadastrados para oferecer linhas de crédito e financiamento imobiliário.

Nesse contexto, é correto afirmar que o pedido foi:

A

negado, pois há incompatibilidade entre a finalidade original da coleta e a finalidade proposta para o compartilhamento, além de não haver enquadramento em uma das exceções previstas (Art. 26º, § 1, da LGPD);

B

analisado pela autoridade competente, que decidiu que os dados dos consultores inativos poderão ser compartilhados atendendo ao princípio da não discriminação (Art. 6º, IX, da LGPD);

C

enviado para a Autoridade Nacional de Privacidade de Dados, que deverá emitir um parecer autorizando o compartilhamento (Art. 30º, da LGPD);

D

atendido, com base no Art. 7º, II, da LGPD, segundo o qual o compartilhamento de dados pessoais pelo Poder Público poderá ser realizado “para o cumprimento de obrigação legal ou regulatória pelo controlador”;

E

legitimado pelo Art. 26º § 1º da LGPD: “É autorizado ao Poder Público transferir a entidades privadas dados pessoais constantes de bases de dados a que tenha acesso desde que previamente tratados.”

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517628

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517628 Banco de Dados

As informações são a base de toda tomada de decisão e gestão de empresas, sendo um diferencial importante o uso de grandes volumes de dados de diversas fontes.

Nesse contexto, as soluções de Big Data para análise de dados devem ter a capacidade de:

A

processar dados heterogêneos, de alto volume e alta velocidade, utilizando estruturas computacionais aprimoradas para a automação de processos e tomadas de decisão;

B

operar dados homogêneos, de alto volume e limitada velocidade, gerando valor agregado para o negócio da empresa;

C

manusear volumes de dados armazenados localmente, heterogêneos e com atividades semiestruturadas, agregando valor ao processo decisório da empresa;

D

processar grandes volumes de dados homogêneos, cujo objetivo principal é a implementação de técnicas avançadas de criptografia;

E

auxiliar no processo de gestão empresarial, processando dados heterogêneos, de alto volume e alta velocidade, descartando domínios de dados e transações.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517629

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517629 Programação

Texto associado

Texto 1

Aline, cientista de dados da CVM, foi designada para aferir a reação à prova da CVM entre os usuários de uma rede social de textos curtos usando técnicas de análise de sentimentos. Para isso, ela realiza um processo de KDD. Nesse processo, Aline opta por representar os textos obtidos da rede social no formato de vetores reais de baixa dimensionalidade, calculados a partir das representações das palavras obtidas de um modelo de linguagem pré-treinado utilizando a técnica word2vec.

Considerando o texto 1, a representação das palavras que será utilizada por Aline é chamada de:

A

TF-IDF;

B

tokens;

C

n-gramas;

D

bag-of-words;

E

word embeddings.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517630

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517630 Banco de Dados

Texto associado

Texto 1

Aline, cientista de dados da CVM, foi designada para aferir a reação à prova da CVM entre os usuários de uma rede social de textos curtos usando técnicas de análise de sentimentos. Para isso, ela realiza um processo de KDD. Nesse processo, Aline opta por representar os textos obtidos da rede social no formato de vetores reais de baixa dimensionalidade, calculados a partir das representações das palavras obtidas de um modelo de linguagem pré-treinado utilizando a técnica word2vec.

Considerando o texto 1, a fase do KDD em que Aline gera os vetores a partir dos textos é chamada de:

A

seleção dos dados;

B

limpeza dos dados;

C

mineração dos dados;

D

transformação dos dados;

E

enriquecimento dos dados.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517631

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517631 Estatística

Alexandre recebe a tarefa de treinar um sistema de detecção de fraudes no banco em que trabalha. Para isso, ele testa cinco modelos, M1, M2, M3, M4 e M5, que possuem, respectivamente, 2, 2, 2, 3 e 3 parâmetros. Alexandre realiza uma seleção bayesiana dos modelos, usando o critério de informação bayesiano.
Sabendo que o tamanho da amostra é 200 e que os valores maximizados das funções de verossimilhança dos modelos são 0,3; 0,4; 0,5; 0,3 e 0,5, respectivamente, Alexandre seleciona o modelo:
(se necessário, use ln(2) = 0,7; ln(3) = 1,1 e ln(5) = 1,6)

A

M1;

B

M2;

C

M3;

D

M4;

E

M5.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517632

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517632 Banco de Dados

Flávia, responsável pelo setor de análise de dados de uma rede de concessionárias de carros, está realizando o pré-processamento dos dados dos clientes da rede. Entre os atributos do conjunto de dados, estão os CPFs dos clientes, o seu sexo e a quantidade de carros que eles já compraram na rede.

Esses três atributos podem ser classificados, respectivamente, como:

A

qualitativo nominal, qualitativo nominal e quantitativo discreto;

B

qualitativo nominal, qualitativo ordinal e quantitativo discreto;

C

qualitativo nominal, qualitativo nominal e quantitativo contínuo;

D

qualitativo ordinal, qualitativo nominal e quantitativo discreto;

E

quantitativo discreto, qualitativo nominal e quantitativo contínuo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517633

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517633 Algoritmos e Estrutura de Dados

Uma certa organização busca melhorar a qualidade e agilidade do seu atendimento eletrônico. Para isso um projeto foi criado para agrupar os e-mails recebidos de acordo com o tipo de problema a ser resolvido e assim repassá-los para o setor mais apropriado.

A equipe responsável pela implementação do projeto resolveu utilizar um modelo de linguagem recente para representar o máximo possível de informação contida num e-mail em um vetor de dimensão 768. Entretanto, depararam-se com o seguinte problema: as distâncias entre os vetores se mostraram muito pequenas, tornando o agrupamento por diversos algoritmos muito pouco significativo.

Com esse último problema em mente, a sequência mais apropriada de algoritmos a ser aplicada sobre os vetores, de forma a obter um agrupamento significativo dos e-mails, é:

A

PCA → t-SNE → KNN;

B

UMAP → KNN;

C

t-SNE → HDBSCAN → K-Means;

D

UMAP → HDBSCAN;

E

K-Means -> t-SNE.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517634

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517634 Banco de Dados

Uma equipe de analistas de dados preparou um modelo preditivo cuja entrada consiste em planilhas contendo uma matriz de valores reais entre 1 e 10. Tais planilhas são obtidas de um sistema externo à equipe. O modelo foi treinado com um conjunto de planilhas que foi coletado pelos analistas, de forma a obter uma amostra representativa dos dados a serem utilizados. A média e o desvio padrão de duas colunas importantes foram calculados do conjunto de treinamento, como uma forma simples de verificar a consistência da distribuição dos dados, sendo seus valores 4,89 e 3,08, respectivamente. O modelo obteve bons resultados durante sua etapa de testes, com uma precisão de 94%.

Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.

A explicação mais adequada à situação descrita é:

A

as planilhas atuais contêm ruído: valores ausentes nas colunas importantes;

B

a distribuição dos valores nas planilhas atuais não corresponde mais aos dados usados no treinamento, pois foram coletadas em momentos diferentes (drifting);

C

a distribuição dos valores nas planilhas atuais não corresponde mais aos dados usados no treinamento devido a uma mudança na posição das colunas;

D

a distribuição dos valores nas planilhas de treinamento não corresponde aos dados atuais, pois a amostra obtida pelos analistas não foi representativa;

E

as planilhas atuais contêm ruído: valores fora do intervalo definido para o modelo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517635

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517635 Banco de Dados

Visando a maximizar a eficiência de uma equipe de auditores fiscais, um sistema de classificação de documentação foi encomendado à equipe de ciência de dados, com o objetivo de decidir, com base nos documentos obtidos durante uma fiscalização, se um exame detalhado de documentação é ou não necessário.

Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.

Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:

A

acurácia;

B

revocação;

C

F1-score;

D

precisão;

E

AUC.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517636

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517636 Banco de Dados

Para ser utilizado em um modelo neural de regressão, um conjunto de dados precisa ser tratado de tal forma que todos os atributos de entrada sejam representados como um ou mais valores numéricos no intervalo [0, 1].

Os atributos de uma observação são: idade (inteiro >= 18), escolaridade (fundamental, médio, superior, pós-graduação), estado de residência (Acre, Alagoas, …, Tocantins, incluindo Distrito Federal) e local de trabalho (empresa, home office, misto).

O número mínimo de valores necessários para representar uma observação com os atributos acima descritos para o modelo de regressão, de forma que não ocorra perda de informação ordinal nem inserção de vieses nos dados, é:

A

4;

B

10;

C

16;

D

32;

E

35.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517637

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517637 Banco de Dados

Ao receber um conjunto de dados para elaborar um modelo preditivo, uma equipe de analistas de dados percebeu que havia uma quantidade significativa de dados faltantes em certos atributos. Foi então debatido o uso de duas técnicas para lidar com esse problema: (1) remoção de observações contendo dados ausentes e (2) “inputação” multivariável, sendo que apenas uma das duas seria aplicada.

Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:

A

o intervalo dos atributos com dados faltantes e a fração de dados faltantes;

B

o número de observações e a fração de dados faltantes;

C

a fração de atributos com dados faltantes e o intervalo dos atributos com dados faltantes ;

D

uma medida de dependência estatística entre os atributos e a fração de atributos com dados faltantes;

E

o número de observações e uma medida de dependência estatística entre os atributos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

SEJA VITALÍCIO

SEJA VITALÍCIO

Questões de Concurso Público CVM 2024 para Analista CVM - Perfil 7 - Ciência de Dados - Tarde

Foram encontradas 70 questões