Os sistemas de banco de dados NoSQL surgiram como uma
resposta às limitações dos bancos de dados relacionais
tradicionais, especialmente em contextos de Big Data e
aplicações web em larga escala. Considerando as
categorias de bancos de dados NoSQL, qual das seguintes
opções descreve corretamente um banco de dados baseado
em documentos?
O Apache Spark oferece várias bibliotecas integradas que
ampliam suas capacidades para além do processamento de
dados em lote. Entre essas bibliotecas, qual é projetada
especificamente para simplificar o desenvolvimento de
algoritmos de machine learning em larga escala?
O Apache Spark é conhecido por sua capacidade de
processar grandes volumes de dados de forma eficiente,
usando um modelo de processamento paralelo e distribuído.
Uma das principais abstrações do Spark é o RDD (Resilient
Distributed Dataset). Qual característica dos RDDs contribui
diretamente para a eficiência do processamento de dados
no Spark?
O modelo de programação MapReduce é essencial no
ecossistema Hadoop para processamento paralelo e
distribuído de grandes volumes de dados. Qual é a principal
função do componente "Reduce" no modelo MapReduce?
O Apache Hadoop YARN (Yet Another Resource
Negotiator) elevou o gerenciamento de recursos e
agendamento de tarefas em clusters Hadoop a um novo
patamar com sua arquitetura mais flexível e eficiente. Qual
dos seguintes benefícios é proporcionado pelo YARN em
comparação ao modelo original do Hadoop?