Mientras que el backup normal te protege contra un borrado de archivos o un fallo de un disco, la contingencia está diseñada para sobrevivir a un «desastre total» (un incendio, una inundación o un ataque masivo de ransomware).
En una estrategia de Contingencia total (Disaster Recovery Plan – DRP), los conceptos de RTO y RPO se llevan al límite de la siguiente manera:
1. El escenario de Contingencia
Imagina que el centro de datos principal (Sitio A) desaparece. Para cumplir con los objetivos, necesitas:
- Un Centro de Respaldo (Sitio B): Una ubicación geográfica distinta (para que no les afecte el mismo desastre).
- Hardware redundante: No solo copias de seguridad, sino servidores y electrónica de red ya instalados y listos para arrancar.
2. Cómo influye el RTO en la Contingencia
El RTO aquí es el tiempo que tardas en «levantar» el Sitio B.
- Cold Site (Sitio Frío): Tienes el espacio y la luz, pero hay que instalarlo todo. El RTO es de días o semanas. Es barato pero muy lento.
- Warm Site (Sitio Templado): El hardware ya está allí, pero hay que restaurar los datos desde las últimas cintas. El RTO es de horas.
- Hot Site (Sitio Caliente): Todo está encendido y los datos están sincronizados en tiempo real. El RTO es de minutos o casi cero. Es el más caro.
3. Cómo influye el RPO en la Contingencia
Aquí es donde entra la Replicación:
- Replicación Asíncrona: Los datos se envían del Sitio A al B con un pequeño retraso. Si el Sitio A cae, el Sitio B podría estar unos minutos por detrás. Tu RPO es de minutos.
- Replicación Síncrona: El dato no se da por escrito en el Sitio A hasta que el Sitio B confirma que también lo tiene. Tu RPO es cero (no pierdes ni un solo dato), pero necesitas una conexión de fibra óptica extremadamente rápida y de baja latencia entre ambos sitios.
4. El «Bare Metal Restore»
En las preguntas de contingencia, a veces aparece este término. Significa restaurar un sistema completo desde cero (incluyendo sistema operativo, drivers y aplicaciones) sobre un hardware que está totalmente «vacío» o «desnudo» (bare metal). Es un proceso clave para cumplir el RTO en un escenario de desastre.
Resumen para recordar:
- Backup: Te da un RPO aceptable (recuperas datos de ayer).
- Alta Disponibilidad (HA): Te da un RTO bajísimo (si un servidor falla, el otro entra en milisegundos), pero solo a nivel local.
- Contingencia: Es la suma de Backup + Replicación + Procedimientos para que todo el negocio funcione en otro lugar tras un desastre.