Questões de Concurso Comentadas sobre banco de dados em banco de dados

Foram encontradas 1.167 questões

Q2383239 Banco de Dados
Considere o seguinte texto sobre integração de dados.
Como viabilizar o compartilhamento efetivo de dados e informações das cadeias agropecuárias entre instituições de governo e dessas com a sociedade? Esta foi a principal questão que os participantes do 1º Painel de Cadeias Agropecuárias e Dados Abertos buscaram responder na tarde de quinta-feira (2/12), durante webinar realizado pelo Instituto de Pesquisa Econômica Aplicada (Ipea). 
Disponível em: https://www.ipea.gov.br/portal/categorias/45-todas-as-noticias/noticias/11394-especialistas-debatem-abertura- -e-integracao-de-dados-de-cadeias-agropecuarias?highlight= WyJhYmFzdGVjaW1lbnRvIiwiYWd1YSIsIidcdTAwZTFndWEiLCJhZ3VhJywiXQ==. Acesso em: 5 jan. 2024.

Considerando-se o questionamento apresentado no texto e sabendo-se que, quando da integração de conjuntos de dados de múltiplas fontes, matching é uma questão relevante, o problema de identificação de entidades em múltiplas fontes de dados remete ao desafio de 
Alternativas
Q2383236 Banco de Dados
Considere um conjunto de dados que inclui as variáveis idade, altura e peso. Os dados de idade estão entre 0 e 100 anos, os dados de altura estão entre 1,50 e 2,00 metros e os dados de peso estão entre 50 e 100 kg.
Qual das seguintes técnicas de normalização numérica é mais adequada para esse conjunto de dados?
Alternativas
Q2383235 Banco de Dados
A deduplicação de dados é uma técnica importante no gerenciamento de informações, especialmente em ambientes onde grandes volumes de dados são gerados e armazenados. Essa técnica é necessária em ambientes onde grandes volumes de dados são gerados porque pode ajudar a reduzir o consumo de armazenamento e a aumentar a eficiência dos processos de análise de dados.
A deduplicação de dados é útil, por exemplo, no domínio da medicina, em que há grandes conjuntos de dados genômicos que são analisados para identificar padrões e mutações associadas a doenças específicas. Nesse cenário, a deduplicação é vital para assegurar a precisão das análises, pois, se amostras de DNA de um mesmo paciente são coletadas e sequenciadas em diferentes momentos e locais, pode haver uma repetição inadvertida dessas amostras no banco de dados. Nesse contexto, a deduplicação de dados é crucial para a integridade da pesquisa, pois dados duplicados podem levar a interpretações errôneas, como a superestimação da prevalência de uma mutação genética rara.
A técnica de deduplicação de dados consiste em um processo de
Alternativas
Q2383234 Banco de Dados
A partir de dados da pesquisa Perfil do Processado e Produção de Provas nas Ações Criminais por Tráfico de Drogas, realizada em dezembro de 2023 pelo Instituto de Pesquisa Econômica Aplicada (Ipea), é possível levantar informações sociodemográficas sobre os bairros em que o direito à inviolabilidade domiciliar é relativizado. Os resultados revelam que os bairros mais ricos e aqueles de população predominantemente branca são praticamente imunes às entradas em domicílio, as quais se concentram substancialmente nos bairros mais pobres e naqueles com população predominantemente negra ou minoritariamente branca.
Qual técnica de desidentificação de dados sensíveis é a mais adequada para preservar a privacidade dos indivíduos processados, permitindo, ainda, a análise sociodemográfica dos bairros? 
Alternativas
Q2383232 Banco de Dados
A limpeza de dados, data cleansing, é uma tarefa importante que pode ser complexa e demorada, no entanto é um investimento fundamental que pode melhorar a qualidade e a utilidade dos dados para futuras análises.
Seja um conjunto de dados com informações de saúde referentes a uma população. Pode-se limpar esses dados para identificar e tratar valores extremos, discrepantes, contraditórios ou inválidos. Com isso, há maior confiabilidade para estimar a prevalência, a incidência, a mortalidade e os fatores de risco de uma doença naquela população representada por aqueles dados.
Por exemplo, seja o conjunto de dados abaixo referente a uma amostra de 5 indivíduos em uma mesma cidade, na qual um analista percebeu a necessidade de limpeza de dados por conta de potenciais inconsistências.

Indivíduo 1: Sexo: Feminino; Idade: 8 anos; Altura: 1,15m; Peso: 40kg; Batimento Cardíaco em Repouso: 85 bpm
Indivíduo 2: Sexo: Masculino; Idade: 22 anos; Altura: 1,60m; Peso: 60kg; Batimento Cardíaco em Repouso: 72 bpm
Indivíduo 3: Sexo: Feminino; Idade: 40 anos; Altura: 1,60m; Peso: 55kg; Batimento Cardíaco em Repouso: 10 bpm
Indivíduo 4: Sexo: Masculino; Idade: 55 anos; Altura: 1,90m; Peso: 100kg; Batimento Cardíaco em Repouso: 70 bpm
Indivíduo 5: Sexo: Feminino; Idade: 70 anos; Altura: 1,50m; Peso: 60kg; Batimento Cardíaco em Repouso: 70 bpm

Qual ação é a única claramente necessária para realizar data cleansing neste conjunto de dados específico?
Alternativas
Q2383231 Banco de Dados
Um cientista de dados precisa discretizar uma variável, representando distâncias entre cidades em quilômetros em 10 intervalos com, aproximadamente, o mesmo número de observações.
Nesse contexto, a técnica mais adequada é a discretização
Alternativas
Q2383218 Banco de Dados
O processo de ingestão de dados é normalmente dividido em três etapas principais:

1 - Extração, ou coleta, de dados das fontes disponíveis;
2 - Transformação dos dados coletados para que atendam às necessidades específicas de processamento e análise; e
3 - Carga dos dados em algum repositório de destino, como um banco de dados relacional ou um data lake.

Essas três etapas podem variar dependendo de os dados serem estruturados ou não.

Nesse contexto, verifica-se que, na etapa de 
Alternativas
Q2383133 Banco de Dados
Uma organização está implementando práticas de gerenciamento de dados para aprimorar a qualidade e a integridade dos dados em seus sistemas.
Nesse contexto, qual conceito do DAMA DMBoK destaca a importância de garantir que os dados sejam precisos e atendam aos requisitos de qualidade?
Alternativas
Q2380293 Banco de Dados
Sobre o conceito e importância de análise de dados, assinale se a asserção (A) é verdadeira e se a razão (R) é uma explicação correta da asserção:


(A): A análise de dados é crucial para as organizações modernas, pois transforma grandes volumes de dados brutos em insights acionáveis que podem informar decisões estratégicas.
(R): A análise de dados permite às organizações identificarem tendências, padrões e anomalias, otimizando processos e melhorando a tomada de decisões baseada em evidências.


Indique se:
Alternativas
Q2376999 Banco de Dados
Os bancos de dados chave-valor são um tipo de banco de dados NoSQL que armazena dados como pares chavevalor, onde cada valor é associado a uma chave única. Uma característica fundamental dos bancos de dados chavevalor é 
Alternativas
Q2374008 Banco de Dados
Uma transação em um banco de dados ou sistema de armazenamento de dados é qualquer operação tratada como uma unidade de trabalho. As transações são totalmente executadas ou não executadas, mantendo o sistema de armazenamento em um estado consistente. Quando essas transações possuem características especiais que garantem sua consistência, elas são denominadas transações ACID.
As quatro principais características que definem uma transação ACID são:
Alternativas
Q2370364 Banco de Dados
O teorema CAP nos bancos de dados NoSQL, foi originalmente introduzido como o princípio CAP, pode ser usado para explicar alguns dos requisitos em sistemas distribuídos com replicação. As três letras da sigla CAP referem-se a três propriedades desejáveis de distribuição com dados replicados.
Em relação ao CAP, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas (F).

(   ) As três letras significam: Completeness, em português completude, Atomicity, em português atomicidade e Partition tolerance, em português, tolerância de partição.
(   ) A atomicidade significa que cada solicitação de leitura ou gravação para um item de dados será processada com sucesso ou receber uma mensagem informando que a operação não pode ser concluída.
(   ) A Tolerância de partição significa que o sistema não pode continuar operando com consistência se a rede que conecta os nós apresentar muitas falhas em duas ou mais partições, onde os nós em cada partição não podem se comunicar.

As afirmativas são, respectivamente, 
Alternativas
Q2370359 Banco de Dados

Atualmente existem diversos tipos de bancos de dados NoSQL. Relacione cada tipo de banco NoSQL a seguir com sua descrição.



1. MongoDB


2. Neo4J


3. HBase


4. Redis



(   ) Começou como um banco de dados orientados a grafos e evoluiu para um rico ecossistema com inúmeras ferramentas de apoio. Utiliza a Cypher como sua linguagem de consultas.


(   ) Banco de dados multiplataforma orientado a documentos. Fornece alto desempenho, alta disponibilidade e fácil escalabilidade. Utiliza documentos semelhantes ao JSON como esquema. É publicado sob uma combinação da Licença Pública Geral GNU e Apache.


(   ) Banco de código aberto com licença BSD, é capaz de armazenar estrutura de dados na memória. Fornece estruturas de dados como strings, hashes, listas, conjuntos, conjuntos classificados com consultas de intervalo, bitmaps, hiperlogs, índices geoespaciais e fluxos. Possui replicação integrada, script Lua, transações e diferentes níveis de persistência em disco, e fornece alta disponibilidade.


(   ) Banco de dados do Hadoop. Capaz de hospedar tabelas muito grandes com bilhões de linhas e milhões de colunas. É um banco de dados não relacional de código aberto, distribuído e modelado a partir do Big Table do Google.



Assinale a opção que indica a relação correta, na ordem apresentada. 

Alternativas
Q2367132 Banco de Dados

Julgue o item a seguir que tratam de extração e representação de conhecimento. 


As ferramentas de tratamento de dados oferecem recursos que contemplam tanto a limpeza e padronização de dados, com funcionalidades que incluem correções de erros e remoção de duplicatas, quanto a transformação de dados, com funcionalidades que incluem filtragem de dados, junções de tabelas, agregações e cálculos. 

Alternativas
Q2367110 Banco de Dados

Com base em obtenção, limpeza e pré-processamento de dados, julgue o próximo item. 


No processo de análise, as atividades de limpeza, filtragem e estruturação dos dados estão concentradas na etapa de compreensão dos dados. 

Alternativas
Q2367109 Banco de Dados

Com base em obtenção, limpeza e pré-processamento de dados, julgue o próximo item. 


A normalização de um conjunto de dados tem como objetivo representar todos os valores desse conjunto em uma escala de 0 a 1. 

Alternativas
Q2367108 Banco de Dados

Com base em obtenção, limpeza e pré-processamento de dados, julgue o próximo item.


Em um processo de análise de dados, os shadow systems não representam dados consolidados, por isso devem ser excluídos de todas as fases do projeto.  

Alternativas
Q2367107 Banco de Dados

Com base em obtenção, limpeza e pré-processamento de dados, julgue o próximo item. 


O pré-processamento de dados deve ocorrer em bases de informações não estruturadas, com o objetivo de diminuir a quantidade de dados a serem processados. 

Alternativas
Q2367106 Banco de Dados

Com base em obtenção, limpeza e pré-processamento de dados, julgue o próximo item. 


O objetivo da classificação na fase de pré-processamento é o particionamento de um grupo de documentos em subgrupos, com características em comum. 

Alternativas
Q2367105 Banco de Dados

Com base em obtenção, limpeza e pré-processamento de dados, julgue o próximo item. 


A análise descritiva tem como objetivo responder à pergunta ‘o que aconteceu?’, ao passo que a análise diagnóstica visa responder à questão ‘por que isso aconteceu?’. 

Alternativas
Respostas
221: B
222: A
223: E
224: E
225: C
226: E
227: E
228: B
229: A
230: C
231: B
232: E
233: E
234: C
235: E
236: C
237: E
238: C
239: E
240: C