Questões de Concurso
Sobre big data em banco de dados
Foram encontradas 286 questões
O componente Spark Core
1. Volume.
2. Variedade.
3. Veracidade.
4. Velocidade.
( ) É um termo cunhado pela IBM que está sendo usado como o quarto “V” para descrever Big Data. Refere-se à conformidade com os fatos: precisão, qualidade ou confiabilidade dos dados. Ferramentas e técnicas são frequentemente usadas para lidar com Big Data, transformando os dados em insights de qualidade e confiáveis.
( ) Significa a celeridade com que os dados estão sendo produzidos e com que presteza os dados devem ser processados (ou seja, capturados, armazenados e analisados) para atender a necessidade ou demanda. Talvez seja a característica mais negligenciada do Big Data.
( ) É a característica mais comum do Big Data. Muitos fatores contribuíram ao aumento exponencial na quantidade de dados, como dados baseados em transações armazenados ao longo dos anos, os dados das mídias sociais, aumentando a quantidade de dados de sensores, dados RFID e GPS gerados automaticamente e assim por diante.
( ) Atualmente os dados hoje possuem diversos e tipos e formatos, desde bancos de dados relacionais aos XML e dados capturados por sensores, vídeo, áudio. Segundo estimativas, 80 a 85 por cento de todos os dados das organizações estão em algum tipo de formato não estruturado ou semiestruturado.
A relação correta, na ordem dada, é
Sobre as características do Big Data, analise os itens a seguir.
I. Veracidade.
II. Valor.
III. Validade.
Está correto o que se afirma em
Com relação a Big Data, julgue o item seguinte.
Volume, variedade, velocidade, valor, veracidade,
variabilidade e visualização são conceitos abrangidos na
definição de Big Data.
Com relação a Big Data, julgue o item seguinte.
Big Data é um conjunto de dados maior e mais complexo de
novas fontes de dados que softwares tradicionais de
processamento de dados não conseguem gerenciar devido ao
seu volume.
Com relação a Big Data, julgue o item seguinte.
Entre as quatro análises possíveis no Big Data, a análise
diagnóstica tem como foco recomendar ações específicas a
serem tomadas, e seus resultados podem ser usados para
melhorar a eficiência, a eficácia e a produtividade das
empresas.
Julgue o item subsecutivo, a respeito de integração de dados e big data.
A atomicidade é um dos recursos da propriedade de
variedade do big data, e garante que todas as alterações
sejam efetivadas no banco de dados, sem permitir
atualização parcial.
Acerca de técnicas de modelagem de BI (business intelligence), de big data e de linguagem de manipulação de dados (DML), julgue o item que se segue.
Variedade, uma das métricas de big data, é caracterizada por
armazenar e processar uma quantidade de dados muito maior
do que os bancos de dados tradicionais foram projetados
para suportar, incluindo os bancos de dados relacionais
paralelos.
1. Data Warehouse.
2. Data Mart.
3. Data Lake.
4. Big Data.
5. Business Intelligence e Analytics.
6. Mineração de Dados.
( ) Ambiente de armazenamento de dados centralizado que integra informações de várias fontes para suportar a análise de negócios.
( ) Conjunto de ferramentas, técnicas e processos para coletar, organizar e analisar informações para fins estratégicos.
( ) Subconjunto de um Data Warehouse, geralmente focado em um único departamento ou área de negócios.
( ) Processo de descoberta de padrões, tendências e informações úteis em conjuntos de dados.
( ) Abordagem flexível e escalável para armazenar grandes volumes de dados de diferentes tipos.
( ) Conjuntos de dados extremamente grandes e complexos, muitas vezes além da capacidade de ferramentas de processamento de dados tradicionais.
A sequência está correta em
( ) Existem diversas tecnologias para processamento e análise de Big Data, mas a maioria possui algumas características comuns. Ou seja, adotam técnicas de escalonamento e processamento paralelo; utilizam dados não relacionais, e aplicam análises avançadas e visualização de dados.
( ) Existem três tecnologias de Big Data que se destacam: MapReduce, Hadoop e NoSQL. O Hadoop é uma técnica popularizada pelo Google que distribui o processamento de dados em grandes arquivos de dados multiestruturados em um grande cluster que pode ser alcançado dividindo o processamento em pequenas unidades de trabalho que podem ser executadas em paralelo.
( ) O MapReduce é um modelo de programação e uma implementação associada para processar e gerar grandes conjuntos de dados. Os programas escritos neste estilo funcional são automaticamente paralelizados e executados em um grande cluster de máquinas de alto desempenho. O modelo que programadores sem qualquer experiência com sistemas paralelos e distribuídos utilizem facilmente os recursos.
As afirmativas são, respectivamente,
I. Sistemas de simulação é o uso de um sistema integrado, baseado em computador, que consiste em simulação, visualização 3D, análises e ferramentas de colaboração para criar definições de processos de manufatura e produto simultaneamente.
II. A interconexão entre objetos por meio de infraestrutura habilitadora (eletrônica, software, sensores e/ou atuadores), com capacidade de computação distribuída e organizados em redes, que passam a se comunicar e interagir, podendo ser remotamente monitorados e/ou controlados, resultando em ganhos de eficiência, caracteriza o conceito de Cloud Computing.
III. Big Data consiste no uso de tecnologias digitais para transformar processos de produção, de desenvolvimento de produtos e/ou modelos de negócios, visando à otimização e à eficiência nos processos. A transformação digital abrange: projeto e implementação de plano de digitalização, sensoriamento, aquisição e tratamento de dados.
Data lake é um repositório onde os dados podem ser armazenados em vários formatos, incluindo-se registros estruturados e formatos de arquivo não estruturados.
No que se refere a noções de Big Data, julgue o item subsequente.
Dados estruturados e semiestruturados são tipos de Big Data,
enquanto os dados não estruturados não se enquadram nos
requisitos para Big Data.
No que se refere a noções de Big Data, julgue o item subsequente.
Os bancos de dados de Big Data ingerem, preparam e
armazenam rapidamente grandes quantidades de dados
diversos em um formato que as ferramentas analíticas
possam usar.
1. Valor
2. Volume
3. Variedade
4. Velocidade
5. Veracidade
6. Validade
Assinale a alternativa que indica todas as afirmativas corretas.