No bastante lo que solicitó, pero con un efecto muy similar (es decir, "paga" el almacenamiento solo por los archivos que realmente han cambiado):
Usando rsync, creando enlaces duros para archivos sin cambios.
La gran ventaja es que cada "instantánea" es una copia de seguridad completa por derecho propio, es decir, en la recuperación solo tiene que restaurar esa instantánea (en lugar de recuperar una base y sus incrementos).
Hay buena documentación sobre ese enfoque disponible en www.mikerubel.org/computers/rsync_snapshots/
Duplicidad realiza copias de seguridad de los directorios produciendo volúmenes cifrados en formato tar y cargándolos en un servidor de archivos remoto o local. Debido a que duplicity usa librsync, los archivos incrementales ocupan menos espacio y solo registran las partes de los archivos que han cambiado desde la última copia de seguridad. Debido a que duplicity usa GnuPG para encriptar y/o firmar estos archivos, estarán a salvo de espionaje y/o modificación por parte del servidor.
http://duplicity.nongnu.org/
Duplicity implementa un esquema de copia de seguridad tradicional, donde el archivo inicial contiene toda la información (copia de seguridad completa) y en el futuro solo se agrega la información modificada. Sin embargo, aquí hay algunas ventajas que puede tener sobre otras soluciones similares:
-
Fácil de usar:aunque la duplicidad es una utilidad de línea de comandos, la semántica es relativamente simple. Para tomar un ejemplo básico, este comando realiza una copia de seguridad del directorio /usr en el host más remoto host.net a través de scp:
duplicity /usr scp://host.net/target_dir
-
Archivos cifrados y firmados:los archivos que produce la duplicidad se pueden cifrar y firmar utilizando GnuPG, el estándar para la criptología de software libre. La ubicación remota no podrá inferir mucho sobre las copias de seguridad además de su tamaño y cuándo se cargan. Además, si los archivos se modifican en el lado remoto, esto se detectará al restaurar.
-
Uso eficiente del ancho de banda y del espacio:Duplicity utiliza el algoritmo rsync para que solo las partes modificadas de los archivos se envíen al archivo cuando se realiza una copia de seguridad incremental. Por ejemplo, si un archivo de registro largo aumenta solo unas pocas líneas de texto, se enviará una pequeña diferencia y se guardará en el archivo. Otros programas de copia de seguridad pueden guardar una copia completa del archivo.
-
Formato de archivo estándar:aunque los datos de archivo estarán encriptados, en su interior se encuentran en archivos de formato GNU-tar estándar. Una copia de seguridad completa contiene tarballs normales y las copias de seguridad incrementales son archivos tar de archivos nuevos y los deltas de copias de seguridad anteriores. Los deltas están en el formato producido por la utilidad de línea de comandos rdiff de librsync. Aunque nunca debería tener que mirar un archivo de duplicidad manualmente, si surge la necesidad, se pueden producir y procesar utilizando GnuPG, rdiff y tar.
-
Elección del protocolo remoto:Duplicity no impone muchas exigencias a su servidor de archivo. Siempre que los archivos se puedan guardar, leer, enumerar y eliminar desde una ubicación, esa ubicación se puede usar como un backend de duplicidad. Además de aumentar las opciones para el usuario, puede hacer que un servidor sea más seguro, ya que los clientes solo requieren un acceso mínimo.
Actualmente se admiten el almacenamiento de archivos local, scp/ssh, ftp, rsync, HSI, WebDAV, Tahoe-LAFS y Amazon S3, y otros no deberían ser difíciles de agregar.