Questões CVM 2024 para Analista CVM - Perfil 7 - Ciência de Dados - Tarde

Q2517623

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517623 Banco de Dados

Observe os conjuntos de dados a seguir.

Imagem associada para resolução da questão

Para desidentificar o Conjunto de Dados Sensíveis A e gerar o Conjunto de Dados B, a técnica de anonimização que deve ser aplicada é o(a):

A

adição de ruído no atributo ID;

B

truncagem no atributo Nome;

C

encobrimento no atributo Profissão;

D

supressão no atributo CEP;

E

blurring no atributo Situação.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517624

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517624 Banco de Dados

O analista João desenvolveu diversos dashboards na plataforma Microsoft Power BI e solicitou ao programador web Pedro que disponibilizasse aquelas análises no portal de acesso à informação da CVM.

Para inserir os dashboards desenvolvidos por João na página web da CVM, o recurso do Power BI que Pedro deve usar é o(a):

A

Modelo semântico;

B

Relatório Paginado;

C

Conexão com fontes de dados Web;

D

Análise Integrada (Embedded Analytics);

E

Visualização Narrativa Inteligente (Smart Narrative).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517625

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517625 Banco de Dados

Para tomar decisões diárias, o analista João precisa consultar o preço de diversas ações do mercado financeiro, bem como outros dados da CVM. Contudo, ao acessar o ambiente de BigData da CVM, João verificou que os preços das ações desse ambiente demoravam para ser atualizados.

João procurou o arquiteto de BigData da CVM para tratar a dimensão da qualidade de dados denominada:

A

validade (validity);

B

correspondência (matching);

C

unicidade (uniqueness);

D

consistência (consistency);

E

temporalidade (timeliness).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517628

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517628 Banco de Dados

As informações são a base de toda tomada de decisão e gestão de empresas, sendo um diferencial importante o uso de grandes volumes de dados de diversas fontes.

Nesse contexto, as soluções de Big Data para análise de dados devem ter a capacidade de:

A

processar dados heterogêneos, de alto volume e alta velocidade, utilizando estruturas computacionais aprimoradas para a automação de processos e tomadas de decisão;

B

operar dados homogêneos, de alto volume e limitada velocidade, gerando valor agregado para o negócio da empresa;

C

manusear volumes de dados armazenados localmente, heterogêneos e com atividades semiestruturadas, agregando valor ao processo decisório da empresa;

D

processar grandes volumes de dados homogêneos, cujo objetivo principal é a implementação de técnicas avançadas de criptografia;

E

auxiliar no processo de gestão empresarial, processando dados heterogêneos, de alto volume e alta velocidade, descartando domínios de dados e transações.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517630

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517630 Banco de Dados

Texto associado

Texto 1

Aline, cientista de dados da CVM, foi designada para aferir a reação à prova da CVM entre os usuários de uma rede social de textos curtos usando técnicas de análise de sentimentos. Para isso, ela realiza um processo de KDD. Nesse processo, Aline opta por representar os textos obtidos da rede social no formato de vetores reais de baixa dimensionalidade, calculados a partir das representações das palavras obtidas de um modelo de linguagem pré-treinado utilizando a técnica word2vec.

Considerando o texto 1, a fase do KDD em que Aline gera os vetores a partir dos textos é chamada de:

A

seleção dos dados;

B

limpeza dos dados;

C

mineração dos dados;

D

transformação dos dados;

E

enriquecimento dos dados.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517632

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517632 Banco de Dados

Flávia, responsável pelo setor de análise de dados de uma rede de concessionárias de carros, está realizando o pré-processamento dos dados dos clientes da rede. Entre os atributos do conjunto de dados, estão os CPFs dos clientes, o seu sexo e a quantidade de carros que eles já compraram na rede.

Esses três atributos podem ser classificados, respectivamente, como:

A

qualitativo nominal, qualitativo nominal e quantitativo discreto;

B

qualitativo nominal, qualitativo ordinal e quantitativo discreto;

C

qualitativo nominal, qualitativo nominal e quantitativo contínuo;

D

qualitativo ordinal, qualitativo nominal e quantitativo discreto;

E

quantitativo discreto, qualitativo nominal e quantitativo contínuo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517634

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517634 Banco de Dados

Uma equipe de analistas de dados preparou um modelo preditivo cuja entrada consiste em planilhas contendo uma matriz de valores reais entre 1 e 10. Tais planilhas são obtidas de um sistema externo à equipe. O modelo foi treinado com um conjunto de planilhas que foi coletado pelos analistas, de forma a obter uma amostra representativa dos dados a serem utilizados. A média e o desvio padrão de duas colunas importantes foram calculados do conjunto de treinamento, como uma forma simples de verificar a consistência da distribuição dos dados, sendo seus valores 4,89 e 3,08, respectivamente. O modelo obteve bons resultados durante sua etapa de testes, com uma precisão de 94%.

Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.

A explicação mais adequada à situação descrita é:

A

as planilhas atuais contêm ruído: valores ausentes nas colunas importantes;

B

a distribuição dos valores nas planilhas atuais não corresponde mais aos dados usados no treinamento, pois foram coletadas em momentos diferentes (drifting);

C

a distribuição dos valores nas planilhas atuais não corresponde mais aos dados usados no treinamento devido a uma mudança na posição das colunas;

D

a distribuição dos valores nas planilhas de treinamento não corresponde aos dados atuais, pois a amostra obtida pelos analistas não foi representativa;

E

as planilhas atuais contêm ruído: valores fora do intervalo definido para o modelo.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517635

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517635 Banco de Dados

Visando a maximizar a eficiência de uma equipe de auditores fiscais, um sistema de classificação de documentação foi encomendado à equipe de ciência de dados, com o objetivo de decidir, com base nos documentos obtidos durante uma fiscalização, se um exame detalhado de documentação é ou não necessário.

Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.

Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:

A

acurácia;

B

revocação;

C

F1-score;

D

precisão;

E

AUC.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517636

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517636 Banco de Dados

Para ser utilizado em um modelo neural de regressão, um conjunto de dados precisa ser tratado de tal forma que todos os atributos de entrada sejam representados como um ou mais valores numéricos no intervalo [0, 1].

Os atributos de uma observação são: idade (inteiro >= 18), escolaridade (fundamental, médio, superior, pós-graduação), estado de residência (Acre, Alagoas, …, Tocantins, incluindo Distrito Federal) e local de trabalho (empresa, home office, misto).

O número mínimo de valores necessários para representar uma observação com os atributos acima descritos para o modelo de regressão, de forma que não ocorra perda de informação ordinal nem inserção de vieses nos dados, é:

A

4;

B

10;

C

16;

D

32;

E

35.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517637

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517637 Banco de Dados

Ao receber um conjunto de dados para elaborar um modelo preditivo, uma equipe de analistas de dados percebeu que havia uma quantidade significativa de dados faltantes em certos atributos. Foi então debatido o uso de duas técnicas para lidar com esse problema: (1) remoção de observações contendo dados ausentes e (2) “inputação” multivariável, sendo que apenas uma das duas seria aplicada.

Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:

A

o intervalo dos atributos com dados faltantes e a fração de dados faltantes;

B

o número de observações e a fração de dados faltantes;

C

a fração de atributos com dados faltantes e o intervalo dos atributos com dados faltantes ;

D

uma medida de dependência estatística entre os atributos e a fração de atributos com dados faltantes;

E

o número de observações e uma medida de dependência estatística entre os atributos.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517641

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517641 Banco de Dados

Uma certa organização gostaria de compartilhar dados com um grupo de pesquisadores de uma universidade para a condução de um estudo sobre problemas ergonômicos nos seus escritórios. Entre os dados coletados, há informações sensíveis sobre seus funcionários; portanto, o responsável pela coleta decidiu anonimizar os dados. Isso foi feito removendo-se nomes e outros campos identificadores e adicionando-se um número identificador próprio a cada funcionário. Dessa forma, a identidade dos funcionários seria preservada. Após a verificação de uma amostra, o pesquisador responsável pelo estudo recomendou medidas que deveriam ser aplicadas antes que os dados pudessem ser aceitos para o estudo.

O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:

A

os dados podem ser reidentificados usando uma combinação dos campos restantes → embaralhamento dos campos;

B

o número identificador não é suficiente para separar os dados → hashing usando os campos restantes;

C

os dados podem ser reidentificados utilizando dados externos ao conjunto compartilhado → privacidade diferencial;

D

os dados podem ser reidentificados através de engenharia reversa do número identificador → randomização não linear dos identificadores;

E

o campos restantes podem ser usados para deduzir informação não inclusa no conjunto de dados → k-anonimato.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517646

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517646 Banco de Dados

Documentos do Jupyter Notebook são salvos com a extensão .ipynb, mas internamente eles são documentos do tipo:

A

DTD;

B

HTML;

C

JSON;

D

XHTML;

E

XML.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517647

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517647 Banco de Dados

Observe o Modelo de Entidades e Relacionamentos a seguir.

Imagem associada para resolução da questão

Com base nos relacionamentos apresentados, está explícito que:

A

I e J podem se relacionar com B;

B

H transforma A em uma entidade-forte;

C

B é um relacionamento semântico ternário;

D

G tem uma dependência do tipo todo-parte em relação a C;

E

I é um tipo de E dependente do relacionamento com B.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517648

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517648 Banco de Dados

O modelo relacional representa o banco de dados como uma coleção de relações. Considere a relação COLABORADOR apresentada a seguir, cuja chave primária é Matricula.

Imagem associada para resolução da questão

Imagem associada para resolução da questão

Na relação COLABORADOR, o(a):

A

superchave padrão é representada pelos atributos Matricula e Cpf;

B

estado de relação atual reflete a cardinalidade dos domínios e o produto cartesiano;

C

ordenação das tuplas faz parte da definição da relação sendo influenciada pela alteração da ordem das tuplas;

D

domínio de cada atributo é um conjunto de valores atômicos, indivisível em se tratando de modelo relacional formal;

E

restrição de integridade referencial garante que nenhum valor da chave primária será NULL.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517649

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517649 Banco de Dados

As transações em banco de dados possuem propriedades que buscam proteger dados contra perdas ou danos.
A propriedade durabilidade tem relação com:

A

a técnica de recuperação, para desfazer quaisquer efeitos de transações não completadas por algum motivo;

B

as restrições de integridade especificadas para o esquema, bem como quaisquer outras restrições no banco de dados;

C

o subsistema de recuperação do Sistema Gerenciador de Banco de Dados, por meio do log do sistema, para transações confirmadas e modificáveis pela execução de outra transação futura;

D

o ocultamento das atualizações por parte de cada transação até que esta esteja confirmada;

E

os níveis de durabilidade de uma transação variando do nível 1 ao 3, de forma a evitar atualizações perdidas.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517650

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517650 Banco de Dados

Os Sistemas Gerenciadores de Banco de Dados (SGBD) comerciais implementam internamente técnicas para processar, otimizar e executar consultas de alto nível.

Uma estratégia eficiente utilizada pelo otimizador de consultas do SGBD considera o uso de:

A

regras heurísticas de forma a realizar restrições (seleções) antes de projeções para reduzir o número de atributos para as projeções;

B

estimativas de custo para identificar restrições (seleções) mais eficientes como entrada para execução das projeções com menos atributos;

C

regras heurísticas de forma a realizar restrições (seleções) antes de projeções para reduzir o número de tuplas para as projeções;

D

estimativas de custo para consultas compiladas com o intuito de realizar junções e projeções antes das restrições (seleções);

E

regras heurísticas associadas a estimativas de custo para consultas interpretadas para eliminar o produto cartesiano.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517651

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517651 Banco de Dados

Diante de várias reclamações de performance em resposta a consultas a dados por meio de um dos sistemas estruturantes de uma autarquia federal, a equipe de tecnologia identificou que o motivo estava na lentidão para recuperação de registros na base de dados utilizada pelo sistema. Para agilizar a recuperação de registros em resposta a uma pesquisa que utiliza um campo que comporta valores repetidos, a equipe de tecnologia criou índices.
Considerando que já existe um índice primário para o conjunto de dados em questão, a equipe criou um índice:

A

multinível secundário esparso de chave candidata;

B

de agrupamento (clustering) denso para o campo de ordenação física;

C

bitmap para um ou mais campos de pesquisa para os quais há grandes variações de valores;

D

de hash para o campo de pesquisa que é utilizado para organização do índice primário;

E

secundário não denso para o campo de pesquisa com um nível de indireção extra para múltiplos ponteiros.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517652

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517652 Banco de Dados

Janine é a responsável pela administração dos bancos de dados gerenciados pelo PostgreSQL de uma autarquia federal. Durante a criação de um banco de dados, Janine especificou a criação de um tablespace diferente do tablespace default.

O tablespace criado por Janine:

A

é independente dos metadados contidos no diretório de dados principal;

B

será tratado pelo PostgreSQL como uma coleção autônoma de arquivos de dados;

C

pode ser anexado a outro cluster de banco de dados diferente daquele no qual foi criado;

D

pode ter uma rotina de backup individual, independente de outros componentes do banco de dados;

E

requer que o superusuário do banco de dados conceda o privilégio de criação no tablespace aos usuários comuns do banco de dados.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517653

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517653 Banco de Dados

O analista Gabriel fez um levantamento das bases de dados existentes na CVM e percebeu que havia Data Marts distintos, criados para atender a requisitos analíticos específicos de cada Superintendência, como: Relações Institucionais, Auditoria e Registro de Valores Imobiliários. Cada Data Mart foi construído de forma independente, o que dificultava análises integradas para relacionar dados das diferentes Superintendências. Gabriel observou que havia várias dimensões em comum nos Data Marts. Para permitir análises integradas padronizando e compartilhando as dimensões em comum dos Data Marts da CVM, Gabriel implementou um(a):

A

Data Mart Híbrido;

B

Data Mart Dependente;

C

Modelo de Dados Normalizado;

D

Repositório de Metadados Mestres Corporativos;

E

Arquitetura e Matriz de Barramento de Data Warehouse.

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Q2517654

Ano: 2024 Banca: FGV Órgão: CVM Prova: FGV - 2024 - CVM - Analista CVM - Perfil 7 - Ciência de Dados - Tarde |

Q2517654 Banco de Dados

Para apoiar análises sobre os fundadores de empresas ao longo do tempo, elaborou-se, inicialmente, o seguinte modelo multidimensional de dados, no qual a tabela FATO FUNDAÇÃO EMPRESAS se relaciona com múltiplos valores da tabela DIMENSÃO FUNDADOR.

Imagem associada para resolução da questão

No caso apresentado, a implementação de uma dimensão multivalorada deve ser realizada por meio da aplicação da técnica de modelagem multidimensional:

A

Tabela Ponte (Bridge Tables);

B

Tabela Fato sem Fatos (Factless Fact Tables);

C

Dimensão Degenerada (Degenerate Dimensions);

D

Dimensão Floco de Neve (Snowflaked Dimensions);

E

Dimensão que Desempenha Múltiplos Papéis (Role-Playing Dimensions).

Você errou! Resposta:

Acesse Comentários para encontrar explicações sobre a solução da questão.

Parabéns! Você acertou!

Aprenda mais ensinando outros alunos ao comentar esta questão.

Quer um estudo ilimitado?

Quer um estudo ilimitado?

Questões de Concurso Público CVM 2024 para Analista CVM - Perfil 7 - Ciência de Dados - Tarde

Foram encontradas 26 questões