O Banco Nossa Caixa é o primeiro banco do hemisfério sul a i...

Próximas questões
Com base no mesmo assunto
Q2383224 Banco de Dados
O Banco Nossa Caixa é o primeiro banco do hemisfério sul a implantar o GDPS (Processamento Paralelo em Locais Geograficamente Distantes, na sigla em inglês), sistema que processa, simultaneamente, todos os dados da instituição em dois locais fisicamente separados. A tecnologia garante o armazenamento e a continuidade do funcionamento de todos os canais de atendimento e de negócios do banco, ainda que a operação de um dos equipamentos responsáveis por essas funções seja interrompida por um blecaute ou incêndio, por exemplo. O banco investiu R$ 80 milhões no projeto, que levou quatro anos desde a concepção até a implantação.
Do Banco Nossa Caixa
Disponível em: https://www.saopaulo.sp.gov.br/ultimas-noticias/ nossa-caixa-usa-sistema-pioneiro-de-processamento-de-dados/. Acesso em: 5 jan. 2024.

No modelo de arquitetura Massively Parallel Processor, MPP, extensibilidade e escalabilidade são características comuns e vantajosas no armazenamento e no processamento de dados paralelos.

Nesse contexto, qual modelo de processamento se enquadra à arquitetura MPP?
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa Correta: C - memória distribuída (shared-nothing)

A arquitetura Massively Parallel Processor (MPP) é um modelo de processamento de dados em que cada nó de processamento possui sua própria memória privada (RAM) e espaço de armazenamento (disco). Este modelo é conhecido como shared-nothing, pois nenhum recurso de hardware é compartilhado entre os nós. Cada nó opera independentemente, o que permite uma excelente escalabilidade e extensibilidade. Quando o sistema precisa crescer em capacidade de processamento ou armazenamento, simplesmente adicionam-se mais nós à configuração.

Esta arquitetura é especialmente vantajosa para aplicações que requerem um grande volume de processamento de dados e para ambientes onde a carga de trabalho pode ser distribuída eficientemente entre vários processadores trabalhando em paralelo. O modelo MPP garante que, mesmo que um nó falhe, os outros podem continuar operando sem interrupção, o que é um aspecto crucial para sistemas que exigem alta disponibilidade e robustez, como o sistema de processamento paralelo descrito no contexto da questão com o Banco Nossa Caixa.

As demais alternativas não correspondem ao modelo de processamento paralelo em arquitetura MPP:

  • Disco compartilhado (shared-disk) refere-se a um modelo onde vários sistemas compartilham o mesmo armazenamento de disco, mas cada sistema tem sua própria memória local.
  • Memória compartilhada (shared-memory) é um modelo onde vários processadores compartilham a mesma memória central, o que pode levar a gargalos devido à contenção de recursos.
  • Três esquemas (ANSI/SPARC) é um framework conceitual para design de sistemas de banco de dados, não um modelo de processamento paralelo.
  • Visões materializadas (materialized view) são recursos de alguns SGBDs que armazenam o resultado de uma consulta complexa para uso posterior, mas não são um modelo de processamento paralelo.

Portanto, diante do que foi apresentado, a alternativa C é a que corretamente identifica a arquitetura MPP como sendo de memória distribuída (shared-nothing).

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A-correta.

O modelo de processamento que se enquadra na arquitetura MPP (Massively Parallel Processor) é o disco compartilhado (shared-disk).

  • Memória compartilhada (shared-memory): Não se aplica à arquitetura MPP, pois os nodos não compartilham a memória.
  • Memória distribuída (shared-nothing): Cada nó possui sua própria memória e disco, não havendo compartilhamento de recursos.
  • Três esquemas (ANSI/SPARC): Refere-se a um modelo de arquitetura de banco de dados, não à arquitetura MPP.
  • Visões materializadas (materialized view): São tabelas pré-calculadas que podem ser usadas para melhorar o desempenho de consultas, não se relacionando com a arquitetura MPP.

Características do modelo disco compartilhado:

  • Nodos independentes: Cada nó possui sua própria CPU, memória e sistema operacional, funcionando como um computador individual.
  • Disco compartilhado: Todos os nodos acessam o mesmo disco de armazenamento, onde os dados são armazenados.
  • Particionamento de dados: Os dados são divididos em partições e distribuídos pelo disco compartilhado.
  • Processamento paralelo: Cada nó processa uma partição dos dados de forma independente e simultânea.
  • Escalabilidade: É possível adicionar mais nodos ao sistema para aumentar a capacidade de processamento e armazenamento.

Vantagens do modelo disco compartilhado:

  • Alta escalabilidade: Permite lidar com grandes volumes de dados de forma eficiente.
  • Boa performance: O processamento paralelo em vários nodos garante um bom desempenho.
  • Alta disponibilidade: Se um nó falhar, os outros nodos continuam operando, garantindo a disponibilidade do sistema.

Desvantagens do modelo disco compartilhado:

  • Complexidade: A implementação e o gerenciamento do sistema podem ser complexos.
  • Custo: O hardware e o software necessários para o sistema podem ser caros.
  • Gargalo de acesso ao disco: O acesso ao disco compartilhado pode se tornar um gargalo quando o número de nodos aumenta.

As três alternativas que correspondem a arquiqueturas de processamento paralelo são A, B e C.

Shared memory: os nós compartilham memória primária e secundária (RAM e HD, por exemplo).

Shared Disk: os nós só compartilham memória secundária.

Shared nothing: o nome é meio intuitivo. Nada é compartilhado. Mas os nós têm processamento e armazenamento idênticos. O principal objetivo é gerar redundância e reduzir os riscos.

A questão diz que esse tipo de arquiquetura continua funcionando em caso de catastrofes físicas em um dos nós. O que significa que não pode se tratar nem de shared-memory nem de shared-disk. Pois, se os nós compartilhassem algum hardware, um é dependente do outro.

FONTE PARA ESTUDO: Fundamentals of Database Systems, Navathe. Página 887

existe uma diferença abismal entre memória distribuida e shared-nothing

No modelo de arquitetura Massively Parallel Processor (MPP), a **memória distribuída (shared-nothing)** é a abordagem que se enquadra perfeitamente.

### Análise das Opções

Vamos analisar as diferentes opções de arquitetura de processamento:

1. **Disco Compartilhado (Shared-Disk)**:

- Todos os nós têm acesso ao mesmo armazenamento de disco. Embora ofereça vantagens em termos de simplicidade de acesso aos dados, não é a abordagem típica usada em MPP, pois pode se tornar um gargalo de I/O.

2. **Memória Compartilhada (Shared-Memory)**:

- Todos os processadores compartilham a mesma memória. Este modelo não escala bem para um grande número de processadores devido à contenção de memória e ao limite físico da memória compartilhada.

3. **Memória Distribuída (Shared-Nothing)**:

- Cada nó possui sua própria memória e disco, e os nós se comunicam entre si via rede. Este é o modelo de processamento que se enquadra à arquitetura MPP. Ele permite uma excelente escalabilidade e extensibilidade, pois cada nó opera de forma independente e paralela, o que é ideal para processamento de dados massivamente paralelo.

4. **Três Esquemas (ANSI/SPARC)**:

- Refere-se a um padrão de arquitetura de banco de dados, que divide a arquitetura em três níveis: interno, conceitual e externo. Não está diretamente relacionado ao modelo de processamento MPP.

5. **Visões Materializadas (Materialized View)**:

- São uma técnica de banco de dados para armazenar o resultado de uma consulta. Não estão diretamente relacionadas ao modelo de processamento paralelo, embora possam ser usadas em sistemas que implementam MPP para melhorar a performance de consultas complexas.

### Conclusão

A arquitetura MPP é caracterizada pela **memória distribuída (shared-nothing)**, onde cada nó é independente e possui sua própria memória e armazenamento, permitindo uma alta escalabilidade e eficiência no processamento paralelo de grandes volumes de dados.

Portanto, a resposta correta é:

**C. memória distribuída (shared-nothing)**

Gabarito: C

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo