GNU/Linux >> Tutoriales Linux >  >> Linux

¿Cómo buscar caracteres no válidos en Gedit?

Tengo un dilema sobre si editar un archivo javascript o no. Cuando lo abro con gedit, muestra la siguiente advertencia:

El archivo que abrió tiene algunos caracteres no válidos. Si continúa
editando este archivo, podría dañar este documento. También puede elegir
otra codificación de caracteres e intentarlo de nuevo.

La codificación actual es UTF-8. Dado que el archivo tiene más de 100 000 líneas de código, ¿existe una forma rápida de escanear los caracteres no válidos?

Respuesta aceptada:

Como el archivo es UTF-8, puede ejecutar isutf8. Un paquete de utilidades adicional.
Le brinda línea, carácter y compensación para bytes incorrectos.

Luego use xxd, hexdump o similares para analizar.

Desafortunadamente se detiene en el primer accidente. Pero, de nuevo, depende del archivo. Podría
ser que solo hay un byte defectuoso 😉

Tenga algún código C que haga un análisis similar pero para todo el archivo. Está en
un disco en algún lugar olvidado hace mucho tiempo. Podría intentar encontrarlo si es necesario.

Si no, lo rápido y no eso la forma sucia sería hacer una diferencia entre
una copia guardada con gedit, como propuso el buen sr. @vonbrand.


Linux
  1. Cómo escanear un servidor Debian en busca de rootkits con Rkhunter

  2. Cómo crear un pem para su SSL existente

  3. Cómo configurar Sudo sin contraseña para un usuario específico

  4. ¿Cómo puedo buscar un patrón de varias líneas en un archivo?

  5. ¿Cómo buscar contenido después del patrón?

Cómo usar CherryTree para tomar notas

Cómo usar el comando SCP para la transferencia de archivos

Cómo comprobar (escanear) los puertos abiertos en Linux

Cómo limitar la profundidad del 'árbol' para el listado de archivos recursivos

Cómo quitar (^M) caracteres de un archivo en Linux

Cómo instalar Android File Transfer para Linux en Ubuntu