Contingencia total (Disaster Recovery Plan – DRP)

Mientras que el backup normal te protege contra un borrado de archivos o un fallo de un disco, la contingencia está diseñada para sobrevivir a un «desastre total» (un incendio, una inundación o un ataque masivo de ransomware).

En una estrategia de Contingencia total (Disaster Recovery Plan – DRP), los conceptos de RTO y RPO se llevan al límite de la siguiente manera:

1. El escenario de Contingencia

Imagina que el centro de datos principal (Sitio A) desaparece. Para cumplir con los objetivos, necesitas:

  • Un Centro de Respaldo (Sitio B): Una ubicación geográfica distinta (para que no les afecte el mismo desastre).
  • Hardware redundante: No solo copias de seguridad, sino servidores y electrónica de red ya instalados y listos para arrancar.
2. Cómo influye el RTO en la Contingencia

El RTO aquí es el tiempo que tardas en «levantar» el Sitio B.

  • Cold Site (Sitio Frío): Tienes el espacio y la luz, pero hay que instalarlo todo. El RTO es de días o semanas. Es barato pero muy lento.
  • Warm Site (Sitio Templado): El hardware ya está allí, pero hay que restaurar los datos desde las últimas cintas. El RTO es de horas.
  • Hot Site (Sitio Caliente): Todo está encendido y los datos están sincronizados en tiempo real. El RTO es de minutos o casi cero. Es el más caro.
3. Cómo influye el RPO en la Contingencia

Aquí es donde entra la Replicación:

  • Replicación Asíncrona: Los datos se envían del Sitio A al B con un pequeño retraso. Si el Sitio A cae, el Sitio B podría estar unos minutos por detrás. Tu RPO es de minutos.
  • Replicación Síncrona: El dato no se da por escrito en el Sitio A hasta que el Sitio B confirma que también lo tiene. Tu RPO es cero (no pierdes ni un solo dato), pero necesitas una conexión de fibra óptica extremadamente rápida y de baja latencia entre ambos sitios.
4. El «Bare Metal Restore»

En las preguntas de contingencia, a veces aparece este término. Significa restaurar un sistema completo desde cero (incluyendo sistema operativo, drivers y aplicaciones) sobre un hardware que está totalmente «vacío» o «desnudo» (bare metal). Es un proceso clave para cumplir el RTO en un escenario de desastre.

Resumen para recordar:

  • Backup: Te da un RPO aceptable (recuperas datos de ayer).
  • Alta Disponibilidad (HA): Te da un RTO bajísimo (si un servidor falla, el otro entra en milisegundos), pero solo a nivel local.
  • Contingencia: Es la suma de Backup + Replicación + Procedimientos para que todo el negocio funcione en otro lugar tras un desastre.