Esta característica se llama deduplicación . Ninguno de los sistemas de archivos populares de Linux (ext*) lo admite, pero aparentemente, ZFS lo admite parcialmente. También hay una tabla que enumera los sistemas de archivos, entre otros, la deduplicación, pero no parece haber ninguna opción popular; sin embargo, es una característica planificada para Btrfs.
Supongo que revisar periódicamente su sistema de archivos y crear enlaces duros apropiados es lo mejor que puede hacer en este momento, aunque eso no implica copiar en escritura.
La palabra clave principal que desea buscar es "copiar al escribir". BTRFS tiene una operación de clonación que hace exactamente lo que quieres, y cp --reflink
hará lo que está buscando, siempre que su sistema tenga un kernel lo suficientemente moderno y coreutils 7.5. Wiki Source Además, bedup es una herramienta que fusionará duplicados en un volumen completo. CoW también es la característica impulsora de la tecnología de instantáneas de btrfs, IIRC.
Existe un sistema de archivos en línea S3QL diseñado para copias de seguridad con gran capacidad de deduplicación.