Questões de Concurso
Comentadas sobre big data em banco de dados
Foram encontradas 222 questões
No que se refere a modelagem dimensional, mineração de dados e big data, julgue o item subsequente.
Em big data, a premissa variedade refere-se ao acréscimo dos volumosos tipos de dados semiestruturados e não estruturados aos
tradicionais conjuntos de dados estruturados das organizações, responsável por impor desafios contextuais adicionais para o
armazenamento, o tratamento e a análise dos dados dessas organizações.
( ) Em um sistema BigData, o pipeline de dados implementa as etapas necessárias para mover dados de sistemas de origem, transformar esses dados com base nos requisitos e armazenar os dados em um sistema de destino, incluindo todos os processos necessários para transformar dados brutos em dados preparados que os usuários podem consumir.
( ) Dentre os métodos de manipulação de valores ausentes, em processamento massivo e paralelo, consta a normalização numérica, que se refere ao processo de ajustar os dados para que estejam em uma escala comparável, geralmente entre 0 e 1.
( ) A demanda crescente por medidas de criptografia ponta a ponta (da produção ao backup) tornam menos eficazes e relevantes tecnologias legadas, como a deduplicação de dados (data deduplication), que busca ajudar a otimizar o armazenamento e melhorar o desempenho de um sistema ao estabelecer processo de identificar e eliminar dados duplicados em um sistema.
As afirmativas são, respectivamente,
Esses resultados vieram com a adoção da tecnologia nos processos cotidianos, e também com o investimento em pesquisas [...]. Agora, o agronegócio pode estar diante de um novo salto de produtividade; big data e machine learning são ferramentas que estão ganhando espaço e que podem, novamente, transformar o cenário do campo.
Disponível em: https://summitagro.estadao.com.br/tendencias-e- -tecnologia/como-big-data-e-machine-learning-sao-aplicados-no- -agronegocio/. Acesso em: 5 jan. 2024. Adaptado.
A utilização da plataforma paralela de processamento MapReduce aplica-se adequadamente como um framework de processamento de Big Data, visando à escalabilidade para as aplicações.
Nesse contexto, uma característica inerente à MapReduce é a
O componente Spark Core
1. Volume.
2. Variedade.
3. Veracidade.
4. Velocidade.
( ) É um termo cunhado pela IBM que está sendo usado como o quarto “V” para descrever Big Data. Refere-se à conformidade com os fatos: precisão, qualidade ou confiabilidade dos dados. Ferramentas e técnicas são frequentemente usadas para lidar com Big Data, transformando os dados em insights de qualidade e confiáveis.
( ) Significa a celeridade com que os dados estão sendo produzidos e com que presteza os dados devem ser processados (ou seja, capturados, armazenados e analisados) para atender a necessidade ou demanda. Talvez seja a característica mais negligenciada do Big Data.
( ) É a característica mais comum do Big Data. Muitos fatores contribuíram ao aumento exponencial na quantidade de dados, como dados baseados em transações armazenados ao longo dos anos, os dados das mídias sociais, aumentando a quantidade de dados de sensores, dados RFID e GPS gerados automaticamente e assim por diante.
( ) Atualmente os dados hoje possuem diversos e tipos e formatos, desde bancos de dados relacionais aos XML e dados capturados por sensores, vídeo, áudio. Segundo estimativas, 80 a 85 por cento de todos os dados das organizações estão em algum tipo de formato não estruturado ou semiestruturado.
A relação correta, na ordem dada, é
Sobre as características do Big Data, analise os itens a seguir.
I. Veracidade.
II. Valor.
III. Validade.
Está correto o que se afirma em
Com relação a Big Data, julgue o item seguinte.
Volume, variedade, velocidade, valor, veracidade,
variabilidade e visualização são conceitos abrangidos na
definição de Big Data.
Com relação a Big Data, julgue o item seguinte.
Big Data é um conjunto de dados maior e mais complexo de
novas fontes de dados que softwares tradicionais de
processamento de dados não conseguem gerenciar devido ao
seu volume.
Com relação a Big Data, julgue o item seguinte.
Entre as quatro análises possíveis no Big Data, a análise
diagnóstica tem como foco recomendar ações específicas a
serem tomadas, e seus resultados podem ser usados para
melhorar a eficiência, a eficácia e a produtividade das
empresas.
Julgue o item subsecutivo, a respeito de integração de dados e big data.
A atomicidade é um dos recursos da propriedade de
variedade do big data, e garante que todas as alterações
sejam efetivadas no banco de dados, sem permitir
atualização parcial.
Acerca de técnicas de modelagem de BI (business intelligence), de big data e de linguagem de manipulação de dados (DML), julgue o item que se segue.
Variedade, uma das métricas de big data, é caracterizada por
armazenar e processar uma quantidade de dados muito maior
do que os bancos de dados tradicionais foram projetados
para suportar, incluindo os bancos de dados relacionais
paralelos.
1. Data Warehouse.
2. Data Mart.
3. Data Lake.
4. Big Data.
5. Business Intelligence e Analytics.
6. Mineração de Dados.
( ) Ambiente de armazenamento de dados centralizado que integra informações de várias fontes para suportar a análise de negócios.
( ) Conjunto de ferramentas, técnicas e processos para coletar, organizar e analisar informações para fins estratégicos.
( ) Subconjunto de um Data Warehouse, geralmente focado em um único departamento ou área de negócios.
( ) Processo de descoberta de padrões, tendências e informações úteis em conjuntos de dados.
( ) Abordagem flexível e escalável para armazenar grandes volumes de dados de diferentes tipos.
( ) Conjuntos de dados extremamente grandes e complexos, muitas vezes além da capacidade de ferramentas de processamento de dados tradicionais.
A sequência está correta em
( ) Existem diversas tecnologias para processamento e análise de Big Data, mas a maioria possui algumas características comuns. Ou seja, adotam técnicas de escalonamento e processamento paralelo; utilizam dados não relacionais, e aplicam análises avançadas e visualização de dados.
( ) Existem três tecnologias de Big Data que se destacam: MapReduce, Hadoop e NoSQL. O Hadoop é uma técnica popularizada pelo Google que distribui o processamento de dados em grandes arquivos de dados multiestruturados em um grande cluster que pode ser alcançado dividindo o processamento em pequenas unidades de trabalho que podem ser executadas em paralelo.
( ) O MapReduce é um modelo de programação e uma implementação associada para processar e gerar grandes conjuntos de dados. Os programas escritos neste estilo funcional são automaticamente paralelizados e executados em um grande cluster de máquinas de alto desempenho. O modelo que programadores sem qualquer experiência com sistemas paralelos e distribuídos utilizem facilmente os recursos.
As afirmativas são, respectivamente,
Data lake é um repositório onde os dados podem ser armazenados em vários formatos, incluindo-se registros estruturados e formatos de arquivo não estruturados.
No que se refere a noções de Big Data, julgue o item subsequente.
Dados estruturados e semiestruturados são tipos de Big Data,
enquanto os dados não estruturados não se enquadram nos
requisitos para Big Data.
No que se refere a noções de Big Data, julgue o item subsequente.
Os bancos de dados de Big Data ingerem, preparam e
armazenam rapidamente grandes quantidades de dados
diversos em um formato que as ferramentas analíticas
possam usar.