Tema 28. Sistemas y Estrategias de Backup

1. Hardware y Software de Backup

El sistema de backup se apoya en una infraestructura física y lógica diseñada para garantizar la integridad de los datos.

  • Hardware:
    • Librerías de Cintas: Son dispositivos robóticos que gestionan múltiples cintas (como las LTO3 de 400GB). Incluyen un almacén (slots para las cintas), drives (lectores/escritores) y un robot encargado de mover las cintas.
    • SAN (Storage Area Network): Red de alta velocidad (normalmente fibra óptica) independiente de la red LAN. Conecta los servidores a los dispositivos de almacenamiento mediante tarjetas HBA (identificadas por un WWN único).
    • NAS vs. SAN: Mientras que el NAS (Network Attached Storage) usa protocolos de red comunes (TCP/IP) y se ve como una unidad de red, la SAN se ve como un disco local a nivel de bloque.
  • Software:
    • Comercial (Privativo): Destacan herramientas como Veritas NetBackup, IBM Tivoli y HP EBS. Estos suelen tener una arquitectura basada en un Master Server (gestiona la lógica y el catálogo) y Media Servers (escriben físicamente los datos).
    • Libre: Herramientas como Amanda o comandos nativos del sistema operativo como tar, dump/restore (Linux) y ufsdump (Solaris).
2. Estrategias de Backup a Disco

Esta estrategia se utiliza cuando se requiere rapidez o cuando los sistemas no se integran directamente con librerías de cintas.

3. Replicación Local y Remota

La replicación busca mantener una copia exacta de los datos en otro lugar para asegurar la continuidad del negocio.

  • Replicación Local: Se realiza dentro del mismo centro de datos, habitualmente entre cabinas de almacenamiento (ej. Hitachi). Sirve para proteger contra fallos de hardware específicos.
  • Replicación Remota: Los datos se envían a un centro de datos geográficamente distante.
    • Síncrona: El dato se escribe en ambos sitios a la vez. Es muy segura pero requiere latencias muy bajas.
    • Asíncrona: Se escribe en el origen y luego se envía al destino. Tolera mayores distancias pero puede haber una pequeña pérdida de datos si ocurre un desastre justo antes del envío.
  • Herramientas: Se mencionan soluciones como rsnapshot para replicación basada en ficheros y mecanismos de cabina como SNDR.
4. Estrategias de Recuperación (Restore)

La recuperación es el proceso crítico que justifica la existencia del backup. Se basa en dos conceptos clave: RPO (cuánto dato podemos permitirnos perder) y RTO (cuánto tiempo podemos estar parados).

  • Tipos de Restore según el Backup:
    • Incremental Diferencial: Para restaurar, se necesita el último backup completo y todos los incrementales posteriores. Es más lento de restaurar pero el backup es rápido.
    • Incremental Acumulativo: Solo se necesita el último completo y el último acumulativo. La restauración es más ágil.
  • Estrategia de Contingencia: Es la recuperación total ante un desastre. Implica restaurar el sistema operativo (Bare Metal Restore), las aplicaciones y, finalmente, los datos.
  • Puntos de recuperación: El software (como NetBackup) permite elegir una fecha y hora específica del catálogo para volver exactamente a ese estado, siempre que la política de retención (tiempo que se guarda la copia) lo permita.
¿Cómo influyen en el Backup?
  1. Políticas de Copia: Si configuras un Backup Incremental Diferencial diario, tu RPO es de 24 horas. Si añades backups de logs cada hora, reduces tu RPO a 1 hora.
  2. Estrategias de Recuperación: El uso de RMAN (para Oracle) permite restaurar bases de datos rápidamente a un punto específico en el tiempo, ayudando a cumplir con RPOs muy ajustados.
  3. Replicación Local/Remota: Cuando el RTO/RPO es cercano a cero, ya no hablamos de backup tradicional, sino de Replicación Síncrona, donde el dato se escribe en dos sitios a la vez (si cae el sitio A, el sitio B tiene el 100% de los datos y puede arrancar de inmediato).

En resumen, el RPO mira hacia el pasado (cuánto dato pierdo desde la última copia) y el RTO mira hacia el futuro (cuánto tardo en volver a estar online).

Diferencias entre Alta Disponibilidad, Backup y Contingencia

Son conceptos de hardware/infraestructura distintos:

  • Alta Disponibilidad (HA): Hardware duplicado (clusters) para que, si falla un servidor, el otro siga funcionando al momento. No protege contra el borrado accidental de un archivo (porque se borraría en los dos sitios).
  • Backup: Copia de seguridad para recuperar datos perdidos o volver a un punto anterior en el tiempo.
  • Contingencia (DRP): Un plan y hardware preparado en una ubicación distinta para levantar todo el centro de datos si el principal se quema o inunda.