O Banco Nossa Caixa é o primeiro banco do hemisfério sul a i...
Do Banco Nossa Caixa
Disponível em: https://www.saopaulo.sp.gov.br/ultimas-noticias/ nossa-caixa-usa-sistema-pioneiro-de-processamento-de-dados/. Acesso em: 5 jan. 2024.
No modelo de arquitetura Massively Parallel Processor, MPP, extensibilidade e escalabilidade são características comuns e vantajosas no armazenamento e no processamento de dados paralelos.
Nesse contexto, qual modelo de processamento se enquadra à arquitetura MPP?
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa Correta: C - memória distribuída (shared-nothing)
A arquitetura Massively Parallel Processor (MPP) é um modelo de processamento de dados em que cada nó de processamento possui sua própria memória privada (RAM) e espaço de armazenamento (disco). Este modelo é conhecido como shared-nothing, pois nenhum recurso de hardware é compartilhado entre os nós. Cada nó opera independentemente, o que permite uma excelente escalabilidade e extensibilidade. Quando o sistema precisa crescer em capacidade de processamento ou armazenamento, simplesmente adicionam-se mais nós à configuração.
Esta arquitetura é especialmente vantajosa para aplicações que requerem um grande volume de processamento de dados e para ambientes onde a carga de trabalho pode ser distribuída eficientemente entre vários processadores trabalhando em paralelo. O modelo MPP garante que, mesmo que um nó falhe, os outros podem continuar operando sem interrupção, o que é um aspecto crucial para sistemas que exigem alta disponibilidade e robustez, como o sistema de processamento paralelo descrito no contexto da questão com o Banco Nossa Caixa.
As demais alternativas não correspondem ao modelo de processamento paralelo em arquitetura MPP:
- Disco compartilhado (shared-disk) refere-se a um modelo onde vários sistemas compartilham o mesmo armazenamento de disco, mas cada sistema tem sua própria memória local.
- Memória compartilhada (shared-memory) é um modelo onde vários processadores compartilham a mesma memória central, o que pode levar a gargalos devido à contenção de recursos.
- Três esquemas (ANSI/SPARC) é um framework conceitual para design de sistemas de banco de dados, não um modelo de processamento paralelo.
- Visões materializadas (materialized view) são recursos de alguns SGBDs que armazenam o resultado de uma consulta complexa para uso posterior, mas não são um modelo de processamento paralelo.
Portanto, diante do que foi apresentado, a alternativa C é a que corretamente identifica a arquitetura MPP como sendo de memória distribuída (shared-nothing).
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
A-correta.
O modelo de processamento que se enquadra na arquitetura MPP (Massively Parallel Processor) é o disco compartilhado (shared-disk).
- Memória compartilhada (shared-memory): Não se aplica à arquitetura MPP, pois os nodos não compartilham a memória.
- Memória distribuída (shared-nothing): Cada nó possui sua própria memória e disco, não havendo compartilhamento de recursos.
- Três esquemas (ANSI/SPARC): Refere-se a um modelo de arquitetura de banco de dados, não à arquitetura MPP.
- Visões materializadas (materialized view): São tabelas pré-calculadas que podem ser usadas para melhorar o desempenho de consultas, não se relacionando com a arquitetura MPP.
Características do modelo disco compartilhado:
- Nodos independentes: Cada nó possui sua própria CPU, memória e sistema operacional, funcionando como um computador individual.
- Disco compartilhado: Todos os nodos acessam o mesmo disco de armazenamento, onde os dados são armazenados.
- Particionamento de dados: Os dados são divididos em partições e distribuídos pelo disco compartilhado.
- Processamento paralelo: Cada nó processa uma partição dos dados de forma independente e simultânea.
- Escalabilidade: É possível adicionar mais nodos ao sistema para aumentar a capacidade de processamento e armazenamento.
Vantagens do modelo disco compartilhado:
- Alta escalabilidade: Permite lidar com grandes volumes de dados de forma eficiente.
- Boa performance: O processamento paralelo em vários nodos garante um bom desempenho.
- Alta disponibilidade: Se um nó falhar, os outros nodos continuam operando, garantindo a disponibilidade do sistema.
Desvantagens do modelo disco compartilhado:
- Complexidade: A implementação e o gerenciamento do sistema podem ser complexos.
- Custo: O hardware e o software necessários para o sistema podem ser caros.
- Gargalo de acesso ao disco: O acesso ao disco compartilhado pode se tornar um gargalo quando o número de nodos aumenta.
As três alternativas que correspondem a arquiqueturas de processamento paralelo são A, B e C.
Shared memory: os nós compartilham memória primária e secundária (RAM e HD, por exemplo).
Shared Disk: os nós só compartilham memória secundária.
Shared nothing: o nome é meio intuitivo. Nada é compartilhado. Mas os nós têm processamento e armazenamento idênticos. O principal objetivo é gerar redundância e reduzir os riscos.
A questão diz que esse tipo de arquiquetura continua funcionando em caso de catastrofes físicas em um dos nós. O que significa que não pode se tratar nem de shared-memory nem de shared-disk. Pois, se os nós compartilhassem algum hardware, um é dependente do outro.
FONTE PARA ESTUDO: Fundamentals of Database Systems, Navathe. Página 887
existe uma diferença abismal entre memória distribuida e shared-nothing
No modelo de arquitetura Massively Parallel Processor (MPP), a **memória distribuída (shared-nothing)** é a abordagem que se enquadra perfeitamente.
### Análise das Opções
Vamos analisar as diferentes opções de arquitetura de processamento:
1. **Disco Compartilhado (Shared-Disk)**:
- Todos os nós têm acesso ao mesmo armazenamento de disco. Embora ofereça vantagens em termos de simplicidade de acesso aos dados, não é a abordagem típica usada em MPP, pois pode se tornar um gargalo de I/O.
2. **Memória Compartilhada (Shared-Memory)**:
- Todos os processadores compartilham a mesma memória. Este modelo não escala bem para um grande número de processadores devido à contenção de memória e ao limite físico da memória compartilhada.
3. **Memória Distribuída (Shared-Nothing)**:
- Cada nó possui sua própria memória e disco, e os nós se comunicam entre si via rede. Este é o modelo de processamento que se enquadra à arquitetura MPP. Ele permite uma excelente escalabilidade e extensibilidade, pois cada nó opera de forma independente e paralela, o que é ideal para processamento de dados massivamente paralelo.
4. **Três Esquemas (ANSI/SPARC)**:
- Refere-se a um padrão de arquitetura de banco de dados, que divide a arquitetura em três níveis: interno, conceitual e externo. Não está diretamente relacionado ao modelo de processamento MPP.
5. **Visões Materializadas (Materialized View)**:
- São uma técnica de banco de dados para armazenar o resultado de uma consulta. Não estão diretamente relacionadas ao modelo de processamento paralelo, embora possam ser usadas em sistemas que implementam MPP para melhorar a performance de consultas complexas.
### Conclusão
A arquitetura MPP é caracterizada pela **memória distribuída (shared-nothing)**, onde cada nó é independente e possui sua própria memória e armazenamento, permitindo uma alta escalabilidade e eficiência no processamento paralelo de grandes volumes de dados.
Portanto, a resposta correta é:
**C. memória distribuída (shared-nothing)**
Gabarito: C
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo