GNU/Linux >> Tutoriales Linux > >> Linux

¿Cómo quitar el Bom de un archivo Utf-8?

Tengo un archivo en codificación UTF-8 con BOM y quiero eliminar el BOM. ¿Existen herramientas de línea de comandos de Linux para eliminar la lista de materiales del archivo?

$ file test.xml
test.xml:  XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines

Respuesta aceptada:

Si no está seguro de si el archivo contiene una BOM UTF-8, entonces esto (suponiendo que la implementación de GNU de sed ) eliminará la lista de materiales si existe, o no realizará cambios si no existe.

sed '1s/^xEFxBBxBF//' < orig.txt > new.txt

También puede sobrescribir el archivo existente con -i opción:

sed -i '1s/^xEFxBBxBF//' orig.txt

Si está utilizando la versión BSD de sed (por ejemplo, macOS), entonces necesita que bash haga el escape:

 sed $'1s/xefxbbxbf//' < orig.txt > new.txt

¿Cerrar la salida estándar (>&-)?

¿Cómo cambiar permanentemente el tipo de fuente Tty de la consola para que se mantenga después de reiniciar?

Linux

Cómo quitar el escritorio de Unity de Ubuntu 17.10

Cómo quitar la contraseña de un archivo PDF en Linux

Cómo obtener el nombre de archivo de la ruta completa en Linux

Cómo quitar líneas de un archivo usando el comando Sed

Cómo quitar (^M) caracteres de un archivo en Linux

Cómo quitar todos los caracteres de espacio en blanco de un archivo de texto