Solución 1:
¡Intente usar la versión 3 de rsync si tiene que sincronizar muchos archivos! V3 crea su lista de archivos de forma incremental y es mucho más rápido y usa menos memoria que la versión 2.
Dependiendo de su plataforma, esto puede marcar una gran diferencia. En OSX, la versión 2.6.3 tardaría más de una hora o fallaría al intentar crear un índice de 5 millones de archivos mientras que la versión 3.0.2 que compilé comenzó a copiarse de inmediato.
Solución 2:
Usando --link-dest
para crear copias de seguridad basadas en instantáneas que aprovechen el espacio, por lo que parece tener varias copias completas de los datos de la copia de seguridad (una para cada ejecución de copia de seguridad), pero los archivos que no cambian entre ejecuciones están vinculados en lugar de crear nuevas copias para ahorrar espacio.
(en realidad, todavía uso el rysnc
-seguido-de-cp -al
método que logra lo mismo, consulte http://www.mikerubel.org/computers/rsync_snapshots/ para ver un resumen antiguo pero muy bueno de ambas técnicas y problemas relacionados)
La principal desventaja de esta técnica es que si un archivo está dañado debido a un error de disco, también está dañado en todas las instantáneas que se vinculan a ese archivo, pero también tengo copias de seguridad fuera de línea que protegerían contra esto en una medida decente. La otra cosa a tener en cuenta es que su sistema de archivos tiene suficientes inodos o se quedará sin ellos antes de que realmente se quede sin espacio en disco (aunque nunca he tenido problemas con los valores predeterminados de ext2/3).
Además, nunca olvides el muy útil --dry-run
para un poco de paranoia saludable, especialmente cuando estás usando el --delete*
opciones.
Solución 3:
Si necesita actualizar un sitio web con algunos archivos grandes a través de un enlace lento, puede transferir los archivos pequeños de esta manera:
rsync -a --max-size=100K /var/www/ allí:/var/www/
luego haz esto para los archivos grandes:
rsync -a --min-size=100K --bwlimit=100 /var/www/ allí:/var/www/
rsync tiene muchas opciones que son útiles para los sitios web. Desafortunadamente, no tiene una forma integrada de detectar actualizaciones simultáneas, por lo que debe agregar lógica a los scripts cron para evitar escrituras superpuestas de archivos grandes.
Solución 4:
Uso la opción --existing cuando intento mantener un pequeño subconjunto de archivos de un directorio sincronizado con otra ubicación.
Solución 5:
--time-limit
Cuando se usa esta opción, rsync se detendrá después de T minutos y saldrá. Creo que esta opción es útil cuando sincroniza una gran cantidad de datos durante la noche (horas no ocupadas) y luego se detiene cuando es hora de que las personas comiencen a usar la red, durante el día (horas ocupadas).
--stop-at=y-m-dTh:m
Esta opción le permite especificar a qué hora detener rsync.
Batch Mode
El modo por lotes se puede utilizar para aplicar el mismo conjunto de actualizaciones a muchos sistemas idénticos.