Introducción.


La mayoría de los sistemas de multiprocesadores con memoria compartida consisten en elementos de procesamiento conectados a una memoria compartida y periféricos mediante un bus compartido.

Existen principalmente dos tipos de fallas que pueden afectar a un sistema de multiprocesadores :

Cuando múltiples procesadores están compartiendo datos en memoria, en el momentode producirse una falla, la coherencia de estos datos se pierde, de modo que la falla de un procesador podría afectar el funcionamiento de los otros.

Luego, para la construcción de sistemas tolerantes a fallas, es preciso diseñar protocolos (implementados vía hardware) que aseguren la posibilidad de poder restablecer la coherencia de los datos contenidos en la memoria compartida, cuando ocurre una falla, de manera de que todos los procesadores puedan retomar las aplicaciones en ejecución.

Una de las soluciones que se plantean es el uso de la "Recoveable Shared Memory" (RSM) que implementaría dichos protocolos.