Questões de Banco de Dados - Big Data para Concurso
Foram encontradas 238 questões
Com relação a Big Data, julgue o item seguinte.
Big Data é um conjunto de dados maior e mais complexo de
novas fontes de dados que softwares tradicionais de
processamento de dados não conseguem gerenciar devido ao
seu volume.
Com relação a Big Data, julgue o item seguinte.
Entre as quatro análises possíveis no Big Data, a análise
diagnóstica tem como foco recomendar ações específicas a
serem tomadas, e seus resultados podem ser usados para
melhorar a eficiência, a eficácia e a produtividade das
empresas.
Julgue o item subsecutivo, a respeito de integração de dados e big data.
A atomicidade é um dos recursos da propriedade de
variedade do big data, e garante que todas as alterações
sejam efetivadas no banco de dados, sem permitir
atualização parcial.
Acerca de técnicas de modelagem de BI (business intelligence), de big data e de linguagem de manipulação de dados (DML), julgue o item que se segue.
Variedade, uma das métricas de big data, é caracterizada por
armazenar e processar uma quantidade de dados muito maior
do que os bancos de dados tradicionais foram projetados
para suportar, incluindo os bancos de dados relacionais
paralelos.
1. Data Warehouse.
2. Data Mart.
3. Data Lake.
4. Big Data.
5. Business Intelligence e Analytics.
6. Mineração de Dados.
( ) Ambiente de armazenamento de dados centralizado que integra informações de várias fontes para suportar a análise de negócios.
( ) Conjunto de ferramentas, técnicas e processos para coletar, organizar e analisar informações para fins estratégicos.
( ) Subconjunto de um Data Warehouse, geralmente focado em um único departamento ou área de negócios.
( ) Processo de descoberta de padrões, tendências e informações úteis em conjuntos de dados.
( ) Abordagem flexível e escalável para armazenar grandes volumes de dados de diferentes tipos.
( ) Conjuntos de dados extremamente grandes e complexos, muitas vezes além da capacidade de ferramentas de processamento de dados tradicionais.
A sequência está correta em
( ) Existem diversas tecnologias para processamento e análise de Big Data, mas a maioria possui algumas características comuns. Ou seja, adotam técnicas de escalonamento e processamento paralelo; utilizam dados não relacionais, e aplicam análises avançadas e visualização de dados.
( ) Existem três tecnologias de Big Data que se destacam: MapReduce, Hadoop e NoSQL. O Hadoop é uma técnica popularizada pelo Google que distribui o processamento de dados em grandes arquivos de dados multiestruturados em um grande cluster que pode ser alcançado dividindo o processamento em pequenas unidades de trabalho que podem ser executadas em paralelo.
( ) O MapReduce é um modelo de programação e uma implementação associada para processar e gerar grandes conjuntos de dados. Os programas escritos neste estilo funcional são automaticamente paralelizados e executados em um grande cluster de máquinas de alto desempenho. O modelo que programadores sem qualquer experiência com sistemas paralelos e distribuídos utilizem facilmente os recursos.
As afirmativas são, respectivamente,
Data lake é um repositório onde os dados podem ser armazenados em vários formatos, incluindo-se registros estruturados e formatos de arquivo não estruturados.
No que se refere a noções de Big Data, julgue o item subsequente.
Dados estruturados e semiestruturados são tipos de Big Data,
enquanto os dados não estruturados não se enquadram nos
requisitos para Big Data.
No que se refere a noções de Big Data, julgue o item subsequente.
Os bancos de dados de Big Data ingerem, preparam e
armazenam rapidamente grandes quantidades de dados
diversos em um formato que as ferramentas analíticas
possam usar.
1. Valor
2. Volume
3. Variedade
4. Velocidade
5. Veracidade
6. Validade
Assinale a alternativa que indica todas as afirmativas corretas.
Para isso, a característica de banco de dados massivos (Big Data) sobre os tipos de dados e heterogeneidade das fontes de dados que Jair deve considerar é:
Uma das principais características de um banco de dados Big Data é:
Spark é uma arquitetura de sistema operacional para trabalhar com dados organizados de forma hierárquica, utilizando-se o módulo Spark SQL, que permite consultar arquivos pelo seu conteúdo.
Julgue o item a seguir, relativos ao Hadoop e ao Spark.
Hadoop é uma plataforma de código aberto que oferece uma
solução tecnológica confiável e escalável para
armazenamento e análise de grande quantidade de dados.
Um sistema de aprendizado não supervisionado, dotado de um conjunto de dados de treinamento que foram classificados manualmente, tenta aprender, a partir desses dados de treinamento, uma forma de classificá-los, bem como de classificar novos dados, ainda não observados.
Um gráfico muito útil para a etapa de análise de dados é o box plot, que ajuda a identificar a distribuição real ou padrão dos valores dos dados, permite visualizar mediana, quartis, valores mínimos e máximos, além de identificar possíveis outliers.