Questões de Concurso
Foram encontradas 349 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Com relação aos estágios do processamento e otimização de consultas SQL em sistemas de bancos de dados distribuídos, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) A consulta de entrada em dados distribuídos é especificada formalmente usando uma linguagem de consultas, que depois, é traduzida para uma consulta algébrica em relações globais. A tradução refere-se ao esquema conceitual global e não leva em consideração a distribuição e a replicação de dados.
( ) Em bancos de dados distribuídos, a fragmentação resulta em relações armazenadas em sites separados com alguns fragmentos. Este estágio mapeia a consulta distribuída no esquema global para as consultas separadas em fragmentos individuais, usando informações de distribuição e replicação de dados.
( ) A otimização local da consulta consiste em construir uma estratégia com base em uma lista de candidatas que está mais próxima do ideal. A lista de consultas otimizadas pode ser obtida ao permutar a ordenação das operações em uma consulta de fragmentos geradas em estágios anteriores.
As afirmativas são, na ordem apresentada, respectivamente,
Com relação às arquiteturas de big data, analise as afirmativas a seguir.
I. As arquiteturas de big data suportam um ou mais tipos de carga de trabalho, por exemplo, processamento em lote de fontes de big data em repouso; processamento em tempo real de big data em movimento; exploração interativa de big data e análise preditiva e aprendizado de máquina.
II. A arquitetura kappa aborda o problema da baixa latência criando dois caminhos para o fluxo de dados. Todos os dados que entram no sistema passam por dois caminhos: a camada de lote (caminho frio) que armazena os dados de entrada em sua forma bruta e executa o processamento os dados em lote, e a camada de velocidade (hot path) que analisa os dados em tempo real. Essa camada é projetada para ter baixa latência, em detrimento da precisão.
III. A arquitetura lambda, posterior à kappa, foi proposta para ser uma alternativa para mitigar os problemas da baixa latência. Lambda tem os mesmos objetivos da kappa, mas com uma distinção importante: todos os dados fluem por um único caminho, usando um sistema de processamento de fluxo de dados. Semelhante à camada de velocidade da arquitetura lambda, todo o processamento de eventos é realizado através de um fluxo único de entrada.
Está correto o que se afirma em
Leia o fragmento a seguir.
“Atualmente, no contexto do Big Data e Data Analytics, faz-se referência às características enunciadas por pesquisadores e produtores de soluções como sendo um conjunto de cinco Vs. Originalmente, a definição clássica de Big Data fez referência a três Vs fundamentais: _____, _____ e _____ de dados que demandam formas inovadoras e rentáveis de processamento da informação, para melhor percepção e tomada de decisão.”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.
Julgue o próximo item, a respeito de ETL, ELT e data lake.
Data lake é um tipo de repositório que armazena grandes
volumes de dados, sob um esquema de banco de dados
comum, unificado, visando responder perguntas específicas
do negócio; esse sistema de armazenamento também oferece
uma visão multidimensional dos dados atômicos e
resumidos.
O HDFS fornece acesso de alto rendimento a grandes conjuntos de dados; o sistema armazena, separadamente, metadados do sistema de arquivos e dados de aplicativos: enquanto os metadados são armazenados em um servidor dedicado, denominado NameNode, os dados da aplicação são armazenados em outros servidores, denominados DataNodes.