spark-submit
imprime la mayor parte de su salida en STDERR
Para redirigir toda la salida a un archivo, puede usar:
spark-submit something.py > results.txt 2>&1
O
spark-submit something.py &> results.txt
Si ejecuta Spark-Submit en un clúster, los registros se almacenan con el Id. de la aplicación. Puede ver los registros una vez que finaliza la aplicación.
yarn logs --applicationId <your applicationId> > myfile.txt
Debería traerte el registro de tu trabajo
El ID de la aplicación de su trabajo se proporciona cuando envía el trabajo Spark. Podrá verlo en la consola donde está enviando o desde la interfaz de usuario de Hadoop.