Questões de Concurso Sobre banco de dados em banco de dados

Foram encontradas 1.315 questões

Q2517653 Banco de Dados
O analista Gabriel fez um levantamento das bases de dados existentes na CVM e percebeu que havia Data Marts distintos, criados para atender a requisitos analíticos específicos de cada Superintendência, como: Relações Institucionais, Auditoria e Registro de Valores Imobiliários. Cada Data Mart foi construído de forma independente, o que dificultava análises integradas para relacionar dados das diferentes Superintendências. Gabriel observou que havia várias dimensões em comum nos Data Marts. Para permitir análises integradas padronizando e compartilhando as dimensões em comum dos Data Marts da CVM, Gabriel implementou um(a):
Alternativas
Q2517646 Banco de Dados
Documentos do Jupyter Notebook são salvos com a extensão .ipynb, mas internamente eles são documentos do tipo:
Alternativas
Q2517641 Banco de Dados
Uma certa organização gostaria de compartilhar dados com um grupo de pesquisadores de uma universidade para a condução de um estudo sobre problemas ergonômicos nos seus escritórios. Entre os dados coletados, há informações sensíveis sobre seus funcionários; portanto, o responsável pela coleta decidiu anonimizar os dados. Isso foi feito removendo-se nomes e outros campos identificadores e adicionando-se um número identificador próprio a cada funcionário. Dessa forma, a identidade dos funcionários seria preservada. Após a verificação de uma amostra, o pesquisador responsável pelo estudo recomendou medidas que deveriam ser aplicadas antes que os dados pudessem ser aceitos para o estudo.

O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:
Alternativas
Q2517637 Banco de Dados
Ao receber um conjunto de dados para elaborar um modelo preditivo, uma equipe de analistas de dados percebeu que havia uma quantidade significativa de dados faltantes em certos atributos. Foi então debatido o uso de duas técnicas para lidar com esse problema: (1) remoção de observações contendo dados ausentes e (2) “inputação” multivariável, sendo que apenas uma das duas seria aplicada.

Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:
Alternativas
Q2517636 Banco de Dados
Para ser utilizado em um modelo neural de regressão, um conjunto de dados precisa ser tratado de tal forma que todos os atributos de entrada sejam representados como um ou mais valores numéricos no intervalo [0, 1].

Os atributos de uma observação são: idade (inteiro >= 18), escolaridade (fundamental, médio, superior, pós-graduação), estado de residência (Acre, Alagoas, …, Tocantins, incluindo Distrito Federal) e local de trabalho (empresa, home office, misto).

O número mínimo de valores necessários para representar uma observação com os atributos acima descritos para o modelo de regressão, de forma que não ocorra perda de informação ordinal nem inserção de vieses nos dados, é:
Alternativas
Q2517635 Banco de Dados
Visando a maximizar a eficiência de uma equipe de auditores fiscais, um sistema de classificação de documentação foi encomendado à equipe de ciência de dados, com o objetivo de decidir, com base nos documentos obtidos durante uma fiscalização, se um exame detalhado de documentação é ou não necessário.

Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.

Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:
Alternativas
Q2517634 Banco de Dados
Uma equipe de analistas de dados preparou um modelo preditivo cuja entrada consiste em planilhas contendo uma matriz de valores reais entre 1 e 10. Tais planilhas são obtidas de um sistema externo à equipe. O modelo foi treinado com um conjunto de planilhas que foi coletado pelos analistas, de forma a obter uma amostra representativa dos dados a serem utilizados. A média e o desvio padrão de duas colunas importantes foram calculados do conjunto de treinamento, como uma forma simples de verificar a consistência da distribuição dos dados, sendo seus valores 4,89 e 3,08, respectivamente. O modelo obteve bons resultados durante sua etapa de testes, com uma precisão de 94%.

Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.

A explicação mais adequada à situação descrita é:
Alternativas
Q2517632 Banco de Dados
Flávia, responsável pelo setor de análise de dados de uma rede de concessionárias de carros, está realizando o pré-processamento dos dados dos clientes da rede. Entre os atributos do conjunto de dados, estão os CPFs dos clientes, o seu sexo e a quantidade de carros que eles já compraram na rede.

Esses três atributos podem ser classificados, respectivamente, como:
Alternativas
Q2517623 Banco de Dados

Observe os conjuntos de dados a seguir.



Imagem associada para resolução da questão



Para desidentificar o Conjunto de Dados Sensíveis A e gerar o Conjunto de Dados B, a técnica de anonimização que deve ser aplicada é o(a):

Alternativas
Q2514691 Banco de Dados
Sobre os formatos NetCDF4 e HDF5, no contexto de armazenamento e processamento de dados científicos, assinale a afirmativa correta.
Alternativas
Q2514689 Banco de Dados
Sobre dados no formato NetCDF4, assinale a afirmativa incorreta.
Alternativas
Q2514667 Banco de Dados
Em relação a uma função do tipo janela (Window Functions), analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Cria uma tabela não materializada no banco de dados, de forma que suas consultas são executadas todas as vezes em que a tabela é referenciada.
( ) Permite realizar cálculos utilizando um conjunto de linhas que possuem alguma relação com a linha em questão.

( ) É comparável ao tipo de cálculos realizados por funções de agregação

As afirmativas são, respectivamente,
Alternativas
Q2509353 Banco de Dados
Quanto aos processos de ETL, ao JSON, ao XML e às técnicas para pré‑processamento de dados, julgue o item.
A imputação por moda é uma técnica comumente utilizada no pré‑processamento de dados, para se lidar com valores ausentes.
Alternativas
Q2509352 Banco de Dados
Quanto aos processos de ETL, ao JSON, ao XML e às técnicas para pré‑processamento de dados, julgue o item.
A finalidade principal do XML é criar uma interface automatizada para a execução de operações matemáticas complexas.
Alternativas
Q2509351 Banco de Dados
Quanto aos processos de ETL, ao JSON, ao XML e às técnicas para pré‑processamento de dados, julgue o item.
JSON pode ser definido como um formato leve de troca de informações/dados entre sistemas. 
Alternativas
Q2501773 Banco de Dados
As técnicas de controle de concorrência são usadas para garantir a propriedade de não interferência ou isolamento das transações executadas simultaneamente. Algumas das principais técnicas usadas para controlar a execução concorrente de transações são baseadas no conceito de bloqueio de itens de dados. Considerando os tipos de bloqueios, assinale a opção que contém o esquema de bloqueio que possui dois estados — bloqueado e desbloqueado — e que é considerado muito restritivo para itens de banco de dados, porque no máximo uma transação pode manter um bloqueio em determinado item. 
Alternativas
Q2498241 Banco de Dados
Um analista de sistemas está desenvolvendo uma aplicação corporativa que requer a manipulação eficiente de grandes volumes de dados. Qual tipo de banco de dados seria mais adequado para atender a essa necessidade, proporcionando desempenho otimizado e escalabilidade?
Alternativas
Q2495482 Banco de Dados
O banco de dados do sistema acadêmico de uma universidade é composto pelas seguintes tabelas, cujas chaves primárias estão sublinhadas:

ALUNO (MATRICULA, NOME) CURSO (CODIGO, NOME, DATA_INICIO) TURMA (COD_DISCIPLINA, NUMERO) PROFESSOR (DEPARTAMENTO, NUMERO, NOME) DISCIPLINA (COD_DISCIPLINA, NOME, CARGA_HORARIA)

Para fins de documentação, um programador resolveu criar um modelo E-R a partir do esquema desse banco de dados.
Nesse modelo E-R, a(s) entidade(s) fraca(s) é(são) APENAS:
Alternativas
Q2493437 Banco de Dados
Marisa, chefe do centro de dados (CD) da empresa X, recebeu uma ligação na madrugada informando que tinha havido queda de luz e que nenhum dos geradores disponíveis assumira a geração de energia. Ela então foi ao CD e, após o restabelecimento da luz, solicitou aos presentes que verificassem seus sistemas. Contudo, foram identificadas falhas de discos e, com isso, não haveria acessos aos arquivos de log.

Marisa chamou seus funcionários e orientou, corretamente, que eles recuperassem os bancos de dados a partir do(a):
Alternativas
Q2493430 Banco de Dados
Edgar, DBA de uma multinacional, recebeu um e-mail do usuário A. Nele, o usuário informava que, ao executar uma transação em um registro na tabela de pessoal, obtinha valores incorretos. Pouco tempo depois, recebeu um e-mail do usuário B, no qual este relatava acessar o mesmo registro do usuário A e informava que, às vezes, os dados ficavam incorretos. Edgar identificou que as duas transações acessavam os mesmos itens do banco de dados e tinham problemas em suas serializações, o que tornava o valor do item incorreto.

Edgar identificou um problema chamado:
Alternativas
Respostas
201: E
202: C
203: C
204: E
205: D
206: B
207: E
208: A
209: A
210: B
211: B
212: D
213: C
214: E
215: C
216: B
217: B
218: A
219: A
220: A