Questões de Concurso Público CVM 2024 para Analista CVM - Perfil 7 - Ciência de Dados - Tarde
Foram encontradas 26 questões
Observe os conjuntos de dados a seguir.
Para desidentificar o Conjunto de Dados Sensíveis A e gerar o
Conjunto de Dados B, a técnica de anonimização que deve ser
aplicada é o(a):
Para inserir os dashboards desenvolvidos por João na página web da CVM, o recurso do Power BI que Pedro deve usar é o(a):
João procurou o arquiteto de BigData da CVM para tratar a dimensão da qualidade de dados denominada:
Nesse contexto, as soluções de Big Data para análise de dados devem ter a capacidade de:
Esses três atributos podem ser classificados, respectivamente, como:
Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.
A explicação mais adequada à situação descrita é:
Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.
Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:
Os atributos de uma observação são: idade (inteiro >= 18), escolaridade (fundamental, médio, superior, pós-graduação), estado de residência (Acre, Alagoas, …, Tocantins, incluindo Distrito Federal) e local de trabalho (empresa, home office, misto).
O número mínimo de valores necessários para representar uma observação com os atributos acima descritos para o modelo de regressão, de forma que não ocorra perda de informação ordinal nem inserção de vieses nos dados, é:
Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:
O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:
Observe o Modelo de Entidades e Relacionamentos a seguir.
Com base nos relacionamentos apresentados, está explícito que:
![Imagem associada para resolução da questão](https://qcon-assets-production.s3.amazonaws.com/images/provas/112426/Captura_de%20Tela%20%284983%29.png)
Na relação COLABORADOR, o(a):
A propriedade durabilidade tem relação com:
Uma estratégia eficiente utilizada pelo otimizador de consultas do SGBD considera o uso de:
Considerando que já existe um índice primário para o conjunto de dados em questão, a equipe criou um índice:
O tablespace criado por Janine:
![Imagem associada para resolução da questão](https://qcon-assets-production.s3.amazonaws.com/images/provas/112426/Captura_de%20Tela%20%284984%29.png)
No caso apresentado, a implementação de uma dimensão multivalorada deve ser realizada por meio da aplicação da técnica de modelagem multidimensional: