Questões de Banco de Dados - Big Data para Concurso
Foram encontradas 232 questões
Com relação às arquiteturas de big data, analise as afirmativas a seguir.
I. As arquiteturas de big data suportam um ou mais tipos de carga de trabalho, por exemplo, processamento em lote de fontes de big data em repouso; processamento em tempo real de big data em movimento; exploração interativa de big data e análise preditiva e aprendizado de máquina.
II. A arquitetura kappa aborda o problema da baixa latência criando dois caminhos para o fluxo de dados. Todos os dados que entram no sistema passam por dois caminhos: a camada de lote (caminho frio) que armazena os dados de entrada em sua forma bruta e executa o processamento os dados em lote, e a camada de velocidade (hot path) que analisa os dados em tempo real. Essa camada é projetada para ter baixa latência, em detrimento da precisão.
III. A arquitetura lambda, posterior à kappa, foi proposta para ser uma alternativa para mitigar os problemas da baixa latência. Lambda tem os mesmos objetivos da kappa, mas com uma distinção importante: todos os dados fluem por um único caminho, usando um sistema de processamento de fluxo de dados. Semelhante à camada de velocidade da arquitetura lambda, todo o processamento de eventos é realizado através de um fluxo único de entrada.
Está correto o que se afirma em
Leia o fragmento a seguir.
“Atualmente, no contexto do Big Data e Data Analytics, faz-se referência às características enunciadas por pesquisadores e produtores de soluções como sendo um conjunto de cinco Vs. Originalmente, a definição clássica de Big Data fez referência a três Vs fundamentais: _____, _____ e _____ de dados que demandam formas inovadoras e rentáveis de processamento da informação, para melhor percepção e tomada de decisão.”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.
Julgue o próximo item, a respeito de ETL, ELT e data lake.
Data lake é um tipo de repositório que armazena grandes
volumes de dados, sob um esquema de banco de dados
comum, unificado, visando responder perguntas específicas
do negócio; esse sistema de armazenamento também oferece
uma visão multidimensional dos dados atômicos e
resumidos.
O HDFS fornece acesso de alto rendimento a grandes conjuntos de dados; o sistema armazena, separadamente, metadados do sistema de arquivos e dados de aplicativos: enquanto os metadados são armazenados em um servidor dedicado, denominado NameNode, os dados da aplicação são armazenados em outros servidores, denominados DataNodes.
Acerca das noções de Big Data, julgue o item.
O Big Data é definido unicamente como uma tecnologia
de ponta que proporciona, por meio de uma pequena
quantidade dados, uma mudança nas formas
tradicionais de análise de dados.