Questões de Banco de Dados para Concurso

Foram encontradas 12.812 questões

Q2517641 Banco de Dados
Uma certa organização gostaria de compartilhar dados com um grupo de pesquisadores de uma universidade para a condução de um estudo sobre problemas ergonômicos nos seus escritórios. Entre os dados coletados, há informações sensíveis sobre seus funcionários; portanto, o responsável pela coleta decidiu anonimizar os dados. Isso foi feito removendo-se nomes e outros campos identificadores e adicionando-se um número identificador próprio a cada funcionário. Dessa forma, a identidade dos funcionários seria preservada. Após a verificação de uma amostra, o pesquisador responsável pelo estudo recomendou medidas que deveriam ser aplicadas antes que os dados pudessem ser aceitos para o estudo.

O problema que mais provavelmente motivou a recomendação do pesquisador e uma medida que pode mitigar esse problema são, respectivamente:
Alternativas
Q2517637 Banco de Dados
Ao receber um conjunto de dados para elaborar um modelo preditivo, uma equipe de analistas de dados percebeu que havia uma quantidade significativa de dados faltantes em certos atributos. Foi então debatido o uso de duas técnicas para lidar com esse problema: (1) remoção de observações contendo dados ausentes e (2) “inputação” multivariável, sendo que apenas uma das duas seria aplicada.

Duas características do conjunto de dados que devem ser prioritariamente consideradas na escolha entre as duas técnicas são:
Alternativas
Q2517636 Banco de Dados
Para ser utilizado em um modelo neural de regressão, um conjunto de dados precisa ser tratado de tal forma que todos os atributos de entrada sejam representados como um ou mais valores numéricos no intervalo [0, 1].

Os atributos de uma observação são: idade (inteiro >= 18), escolaridade (fundamental, médio, superior, pós-graduação), estado de residência (Acre, Alagoas, …, Tocantins, incluindo Distrito Federal) e local de trabalho (empresa, home office, misto).

O número mínimo de valores necessários para representar uma observação com os atributos acima descritos para o modelo de regressão, de forma que não ocorra perda de informação ordinal nem inserção de vieses nos dados, é:
Alternativas
Q2517635 Banco de Dados
Visando a maximizar a eficiência de uma equipe de auditores fiscais, um sistema de classificação de documentação foi encomendado à equipe de ciência de dados, com o objetivo de decidir, com base nos documentos obtidos durante uma fiscalização, se um exame detalhado de documentação é ou não necessário.

Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.

Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:
Alternativas
Q2517634 Banco de Dados
Uma equipe de analistas de dados preparou um modelo preditivo cuja entrada consiste em planilhas contendo uma matriz de valores reais entre 1 e 10. Tais planilhas são obtidas de um sistema externo à equipe. O modelo foi treinado com um conjunto de planilhas que foi coletado pelos analistas, de forma a obter uma amostra representativa dos dados a serem utilizados. A média e o desvio padrão de duas colunas importantes foram calculados do conjunto de treinamento, como uma forma simples de verificar a consistência da distribuição dos dados, sendo seus valores 4,89 e 3,08, respectivamente. O modelo obteve bons resultados durante sua etapa de testes, com uma precisão de 94%.

Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.

A explicação mais adequada à situação descrita é:
Alternativas
Q2517632 Banco de Dados
Flávia, responsável pelo setor de análise de dados de uma rede de concessionárias de carros, está realizando o pré-processamento dos dados dos clientes da rede. Entre os atributos do conjunto de dados, estão os CPFs dos clientes, o seu sexo e a quantidade de carros que eles já compraram na rede.

Esses três atributos podem ser classificados, respectivamente, como:
Alternativas
Q2517630 Banco de Dados
Texto 1


Aline, cientista de dados da CVM, foi designada para aferir a reação à prova da CVM entre os usuários de uma rede social de textos curtos usando técnicas de análise de sentimentos. Para isso, ela realiza um processo de KDD. Nesse processo, Aline opta por representar os textos obtidos da rede social no formato de vetores reais de baixa dimensionalidade, calculados a partir das representações das palavras obtidas de um modelo de linguagem pré-treinado utilizando a técnica word2vec.
Considerando o texto 1, a fase do KDD em que Aline gera os vetores a partir dos textos é chamada de:
Alternativas
Q2517628 Banco de Dados
As informações são a base de toda tomada de decisão e gestão de empresas, sendo um diferencial importante o uso de grandes volumes de dados de diversas fontes.

Nesse contexto, as soluções de Big Data para análise de dados devem ter a capacidade de:
Alternativas
Q2517625 Banco de Dados
Para tomar decisões diárias, o analista João precisa consultar o preço de diversas ações do mercado financeiro, bem como outros dados da CVM. Contudo, ao acessar o ambiente de BigData da CVM, João verificou que os preços das ações desse ambiente demoravam para ser atualizados.

João procurou o arquiteto de BigData da CVM para tratar a dimensão da qualidade de dados denominada:
Alternativas
Q2517624 Banco de Dados
O analista João desenvolveu diversos dashboards na plataforma Microsoft Power BI e solicitou ao programador web Pedro que disponibilizasse aquelas análises no portal de acesso à informação da CVM.

Para inserir os dashboards desenvolvidos por João na página web da CVM, o recurso do Power BI que Pedro deve usar é o(a):
Alternativas
Q2517623 Banco de Dados

Observe os conjuntos de dados a seguir.



Imagem associada para resolução da questão



Para desidentificar o Conjunto de Dados Sensíveis A e gerar o Conjunto de Dados B, a técnica de anonimização que deve ser aplicada é o(a):

Alternativas
Q2517020 Banco de Dados

SQL (Structured Query Language) é uma linguagem usada para interagir com bancos de dados relacionais.


Relativamente a SQL, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.


( ) A cláusula WHERE só é utilizada associada ao comando SELECT.


( ) O comando CREATE TABLE cria uma nova tabela no banco de dados e o comando INSERT INTO permite popular essa tabela por meio da inserção de registros.


( ) O comando INNER JOIN é utilizado para unir os resultados de duas ou mais consultas SELECT e o seu resultado é um conjunto de linhas provenientes das tabelas envolvidas.


( ) Os comandos ALTER TABLE e UPDATE são comandos usados para atualizar registros em tabelas de um banco de dados.


( ) SQL suporta o conceito de chaves primárias e chaves estrangeiras para manter a integridade dos dados e as relações entre as tabelas.


As afirmativas são, respectivamente, 

Alternativas
Q2517019 Banco de Dados

Relativamente a Bancos de Dados Relacionais, analise os itens a seguir.


I. As tabelas são os componentes fundamentais de um banco de dados relacional e são usadas para organizar e armazenar dados de forma estruturada.


II. As tabelas podem estar relacionadas entre si por meio de chaves estrangeiras.


III. Os relacionamentos em um banco de dados relacional são conexões lógicas entre diferentes tabelas que permitem combinar dados e estão restritos a relacionamentos um-para-um entre tabelas.


IV. SQL (Structured Query Language) é uma linguagem usada exclusivamente para definir a estrutura dos dados, o que inclui a criação, alteração da estrutura e deleção de tabelas. Para manipular dados em um banco de dados relacional (consultar, inserir, deletar e alterar registros) é necessário utilizar outra linguagem.


V. A chave primária é uma coluna (ou conjunto de colunas) com valor único para cada linha de uma tabela e é usada para identificar registros de forma única.


Está correto o que se afirma em 

Alternativas
Q2516603 Banco de Dados
A criação de índices espaciais otimiza o armazenamento e a busca por dados de interesse do usuário, em comparação com a busca sequencial. Algumas heurísticas foram propostas e implementadas com essa finalidade, com destaque naquelas que se baseiam em árvores.
Assinale a opção que melhor descreve uma R-Tree.
Alternativas
Q2516592 Banco de Dados
O desenvolvimento de ferramentas para manipulação de arquivos com estrutura multidimensional viabiliza a realização de operações aritméticas e lógicas sobre os valores armazenados. Neste contexto, a iniciativa netCDF Operators (NCO) disponibiliza um conjunto de programas com algumas funcionalidades úteis.
Os formatos suportados pelo NCO, além do netCDF, para entrada de dados em seus programas, são
Alternativas
Q2516591 Banco de Dados
NetCDF (Network Common Data Form) é um formato de arquivo adotado como padrão pela comunidade científica internacional para o compartilhamento de dados científicos especializados, de natureza multidimensional (multivariáveis).
Além do formato NetCDF, outro formato matricial que pode ser empregado para criar, acessar e compartilhar dados multidimensionais é o
Alternativas
Q2515936 Banco de Dados
Maria, analista de mercado da CVM, precisa analisar milhares de negociações financeiras para obter insights e tomar decisões ao longo do dia. Maria apresentou a demanda para Tiago, o arquiteto de big data da CVM.
Para processar as negociações financeiras como uma sequência de eventos no tempo, agrupando e filtrando os dados à medida que são capturados, o componente da arquitetura de big data que Tiago deve desenvolver é o:
Alternativas
Q2515462 Banco de Dados
SQL (Structured Query Language) é uma linguagem declarativa padrão usada para gerenciar e manipular bancos de dados relacionais. Ela fornece um conjunto de comandos que permitem aos usuários realizarem diversas operações, como consultar, inserir, atualizar e excluir dados de bancos de dados relacionais.

Relacione as linguagens declarativas às suas respectivas propriedades.

1. DDL – Data Definition Language.
2. DML – Data Manipulation Language.
3. DTL – Data Transaction Language.
4. DCL – Data Control Language.

( ) Contém o comando SELECT.
( ) Contém os comandos COMMIT e ROLLBACK.
( ) Utilizada para dar acesso aos usuários.
( ) Contém os comandos CREATE, ALTER e DROP.
( ) Contém os comandos INSERT, UPDATE e DELETE.

Assinale a opção que indica a relação correta, segundo a ordem apresentada.
Alternativas
Q2515461 Banco de Dados
Para que o sistema de banco de dados seja funcional, ele precisa recuperar dados de maneira eficiente. A necessidade de eficiência tem levado os projetistas a usarem estruturas de dados complexas para representar dados no banco de dados. Como muitos usuários de sistema de banco de dados não são treinados em computação, os desenvolvedores ocultam a complexidade dos usuários sob vários níveis de abstração de dados, para simplificar as interações do usuário com o sistema. Com relação à abstração de dados, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) O nível lógico descreve em detalhes estruturas de dados complexas de baixo nível.
( ) O nível de visão fornece um mecanismo de segurança de modo a evitar que os usuários acessem certas partes do banco de dados.
( ) O nível físico descreve quais dados estão armazenados no banco de dados e que relações existem entre eles.
( ) O nível lógico descreve o banco de dados inteiro em termos de um pequeno número de estruturas relativamente simples.
As afirmativas são, respectivamente,
Alternativas
Q2515460 Banco de Dados
Os sistemas de bancos de dados são fundamentais na organização e gestão de informações em praticamente todos os setores da sociedade moderna. Eles permitem armazenar grandes volumes de dados de forma estruturada, garantindo sua integridade, segurança e acessibilidade.
Assinale a opção que apresenta seus principais componentes.
Alternativas
Respostas
701: C
702: E
703: D
704: B
705: E
706: A
707: D
708: A
709: E
710: D
711: A
712: B
713: D
714: D
715: A
716: C
717: D
718: B
719: A
720: E