Tengo un dilema sobre si editar un archivo javascript o no. Cuando lo abro con gedit, muestra la siguiente advertencia:
El archivo que abrió tiene algunos caracteres no válidos. Si continúa
editando este archivo, podría dañar este documento. También puede elegir
otra codificación de caracteres e intentarlo de nuevo.
La codificación actual es UTF-8. Dado que el archivo tiene más de 100 000 líneas de código, ¿existe una forma rápida de escanear los caracteres no válidos?
Respuesta aceptada:
Como el archivo es UTF-8, puede ejecutar isutf8. Un paquete de utilidades adicional.
Le brinda línea, carácter y compensación para bytes incorrectos.
Luego use xxd, hexdump o similares para analizar.
Desafortunadamente se detiene en el primer accidente. Pero, de nuevo, depende del archivo. Podría
ser que solo hay un byte defectuoso 😉
Tenga algún código C que haga un análisis similar pero para todo el archivo. Está en
un disco en algún lugar olvidado hace mucho tiempo. Podría intentar encontrarlo si es necesario.
Si no, lo rápido y no eso la forma sucia sería hacer una diferencia entre
una copia guardada con gedit, como propuso el buen sr. @vonbrand.