Questões de Concurso
Sobre banco de dados em banco de dados
Foram encontradas 1.315 questões
Analise a tabela abaixo para responder à questão.
Tabela ContasPagar
SELECT MAX(Valor) AS Valor FROM ContasPagar
WHERE Efetuado = 1 ORDER BY 1 DESC
Assinale a alternativa que apresenta o valor que será informado.

Com base na matriz de confusão e nas métricas indicadas, afirma-se que a
A respeito de dado, informação, conhecimento e inteligência, julgue o item a seguir.
Dados abertos são disponibilizados sob uma modalidade de
licença que permite sua livre utilização, consumo ou
cruzamento, por qualquer pessoa, e estão sujeitos, no
máximo, ao crédito da autoria ou da fonte.
Acerca dos Sistemas Gerenciadores de Banco de Dados(SGBD) PostgreSQL, Oracle e MySQL e da visualização e da análise exploratória de dados, julgue o item.
Os gráficos de pizza não são utilizados na visualização
e na análise exploratória de dados.
A distribuição P de Benford para d dígitos é descrita como
O principal motivador para paralelizar uma rotina é
Como viabilizar o compartilhamento efetivo de dados e informações das cadeias agropecuárias entre instituições de governo e dessas com a sociedade? Esta foi a principal questão que os participantes do 1º Painel de Cadeias Agropecuárias e Dados Abertos buscaram responder na tarde de quinta-feira (2/12), durante webinar realizado pelo Instituto de Pesquisa Econômica Aplicada (Ipea).
Disponível em: https://www.ipea.gov.br/portal/categorias/45-todas-as-noticias/noticias/11394-especialistas-debatem-abertura- -e-integracao-de-dados-de-cadeias-agropecuarias?highlight= WyJhYmFzdGVjaW1lbnRvIiwiYWd1YSIsIidcdTAwZTFndWEiLCJhZ3VhJywiXQ==. Acesso em: 5 jan. 2024.
Considerando-se o questionamento apresentado no texto e sabendo-se que, quando da integração de conjuntos de dados de múltiplas fontes, matching é uma questão relevante, o problema de identificação de entidades em múltiplas fontes de dados remete ao desafio de
Qual das seguintes técnicas de normalização numérica é mais adequada para esse conjunto de dados?
A deduplicação de dados é útil, por exemplo, no domínio da medicina, em que há grandes conjuntos de dados genômicos que são analisados para identificar padrões e mutações associadas a doenças específicas. Nesse cenário, a deduplicação é vital para assegurar a precisão das análises, pois, se amostras de DNA de um mesmo paciente são coletadas e sequenciadas em diferentes momentos e locais, pode haver uma repetição inadvertida dessas amostras no banco de dados. Nesse contexto, a deduplicação de dados é crucial para a integridade da pesquisa, pois dados duplicados podem levar a interpretações errôneas, como a superestimação da prevalência de uma mutação genética rara.
A técnica de deduplicação de dados consiste em um processo de
Qual técnica de desidentificação de dados sensíveis é a mais adequada para preservar a privacidade dos indivíduos processados, permitindo, ainda, a análise sociodemográfica dos bairros?
Seja um conjunto de dados com informações de saúde referentes a uma população. Pode-se limpar esses dados para identificar e tratar valores extremos, discrepantes, contraditórios ou inválidos. Com isso, há maior confiabilidade para estimar a prevalência, a incidência, a mortalidade e os fatores de risco de uma doença naquela população representada por aqueles dados.
Por exemplo, seja o conjunto de dados abaixo referente a uma amostra de 5 indivíduos em uma mesma cidade, na qual um analista percebeu a necessidade de limpeza de dados por conta de potenciais inconsistências.
Indivíduo 1: Sexo: Feminino; Idade: 8 anos; Altura: 1,15m; Peso: 40kg; Batimento Cardíaco em Repouso: 85 bpm
Indivíduo 2: Sexo: Masculino; Idade: 22 anos; Altura: 1,60m; Peso: 60kg; Batimento Cardíaco em Repouso: 72 bpm
Indivíduo 3: Sexo: Feminino; Idade: 40 anos; Altura: 1,60m; Peso: 55kg; Batimento Cardíaco em Repouso: 10 bpm
Indivíduo 4: Sexo: Masculino; Idade: 55 anos; Altura: 1,90m; Peso: 100kg; Batimento Cardíaco em Repouso: 70 bpm
Indivíduo 5: Sexo: Feminino; Idade: 70 anos; Altura: 1,50m; Peso: 60kg; Batimento Cardíaco em Repouso: 70 bpm
Qual ação é a única claramente necessária para realizar data cleansing neste conjunto de dados específico?
Nesse contexto, a técnica mais adequada é a discretização
1 - Extração, ou coleta, de dados das fontes disponíveis;
2 - Transformação dos dados coletados para que atendam às necessidades específicas de processamento e análise; e
3 - Carga dos dados em algum repositório de destino, como um banco de dados relacional ou um data lake.
Essas três etapas podem variar dependendo de os dados serem estruturados ou não.
Nesse contexto, verifica-se que, na etapa de
Nesse contexto, qual conceito do DAMA DMBoK destaca a importância de garantir que os dados sejam precisos e atendam aos requisitos de qualidade?
(A): A análise de dados é crucial para as organizações modernas, pois transforma grandes volumes de dados brutos em insights acionáveis que podem informar decisões estratégicas.
(R): A análise de dados permite às organizações identificarem tendências, padrões e anomalias, otimizando processos e melhorando a tomada de decisões baseada em evidências.
Indique se:
As quatro principais características que definem uma transação ACID são:
Em relação ao CAP, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas (F).
( ) As três letras significam: Completeness, em português completude, Atomicity, em português atomicidade e Partition tolerance, em português, tolerância de partição.
( ) A atomicidade significa que cada solicitação de leitura ou gravação para um item de dados será processada com sucesso ou receber uma mensagem informando que a operação não pode ser concluída.
( ) A Tolerância de partição significa que o sistema não pode continuar operando com consistência se a rede que conecta os nós apresentar muitas falhas em duas ou mais partições, onde os nós em cada partição não podem se comunicar.
As afirmativas são, respectivamente,
Atualmente existem diversos tipos de bancos de dados NoSQL. Relacione cada tipo de banco NoSQL a seguir com sua descrição.
1. MongoDB
2. Neo4J
3. HBase
4. Redis
( ) Começou como um banco de dados orientados a grafos e evoluiu para um rico ecossistema com inúmeras ferramentas de apoio. Utiliza a Cypher como sua linguagem de consultas.
( ) Banco de dados multiplataforma orientado a documentos. Fornece alto desempenho, alta disponibilidade e fácil escalabilidade. Utiliza documentos semelhantes ao JSON como esquema. É publicado sob uma combinação da Licença Pública Geral GNU e Apache.
( ) Banco de código aberto com licença BSD, é capaz de armazenar estrutura de dados na memória. Fornece estruturas de dados como strings, hashes, listas, conjuntos, conjuntos classificados com consultas de intervalo, bitmaps, hiperlogs, índices geoespaciais e fluxos. Possui replicação integrada, script Lua, transações e diferentes níveis de persistência em disco, e fornece alta disponibilidade.
( ) Banco de dados do Hadoop. Capaz de hospedar tabelas muito grandes com bilhões de linhas e milhões de colunas. É um banco de dados não relacional de código aberto, distribuído e modelado a partir do Big Table do Google.
Assinale a opção que indica a relação correta, na ordem apresentada.