(No es demasiado cortés responder a sus propias preguntas, pero terminé con esto).
LanguageTool es un muy buen corrector gramatical independiente basado en Java. Sin embargo, funciona en texto sin formato. Por lo tanto, necesitaba convertir mi documento LaTeX en un documento de texto lo más simple posible. No es una tarea sencilla. Logré hacerlo usando el siguiente truco:
- Hice arreglos para que todos los flotadores mantuvieran sus posiciones usando el paquete de flotadores y la opción H. Esto es necesario para que los subtítulos no rompan los párrafos al transformarse en texto sin formato.
- Quité los números de línea usando el paquete nopageno.
- Usé un script sed para hacer algunos ajustes más finos, como agregar puntos a los nombres de las secciones y las etiquetas de descripción. No publico el guión aquí, ya que es realmente específico de mi propio estilo y convenciones.
- Después de este preprocesamiento, compilé a DVI y ejecuté
catdvi -s
. - Utilicé otra secuencia de comandos sed simple para deshacerme de las líneas vacías y los saltos de página. El resultado final es una conversión textual razonable del documento LaTeX, en el que puede trabajar LanguageTool.
Todavía hay algunas molestias sobrantes, como listas de programas en línea, que el corrector gramatical no puede entender, pero en conjunto obtuve una verificación de pruebas automatizada decente :)
Escribí un corrector gramatical para verificar documentos TeX llamado LyX-GC. También se puede usar en línea como una aplicación web.
Puede usar LanguageTool como back-end. Las principales ventajas sobre el uso directo de LanguageTool son que (1) filtra el TeX para evitar falsos positivos de LanguageTool que intenta interpretar los comandos de TeX como inglés y (2) tiene cientos de sus propias reglas, incluidas las reglas específicas de TeX. Por ejemplo, sabe que "See \ref{lem:foo}
" debería ser realmente "See Lemma \ref{lem:foo}
". (Además, si usa LyX, LyX-GC obviamente tiene la ventaja de poder integrarse con LyX).
LyX-GC realmente solo es compatible con inglés (aunque hay soporte experimental en francés en el repositorio de git).
Acabo de terminar de escribir una nueva herramienta para revisar la ortografía y la gramática directamente en archivos LaTeX, llamada TeXtidote. :
https://sylvainhalle.github.io/textidote
El programa puede eliminar las marcas del archivo y enviarlo a la biblioteca de Language Tool, que realiza una verificación tanto de la ortografía como de la gramática en una docena de idiomas. Lo que es exclusivo de TeXtidote es que realiza un seguimiento de la posición relativa de las palabras entre el texto original y el "limpio". Esto significa que puede traducir los mensajes de Language Tool a su ubicación correcta directamente en su archivo fuente. De forma predeterminada, TeXtidote produce un informe HTML que muestra sus fuentes originales, con los errores encontrados por Language Tool resaltados en la ubicación correcta:
La herramienta es gratuita y fácil de instalar (independiente del sistema operativo, requiere Java). ¡Os animo a que lo probéis y me digáis qué os parece! (Se puede encontrar más información sobre la descarga/instalación/uso en la página Léame del repositorio de GitHub; haga clic en el botón "Descargar" en el sitio web para llegar allí).