35,719
edits
No edit summary |
(Updating to match new version of source page) |
||
Line 198: | Line 198: | ||
== Suivi des tâches == | == Suivi des tâches == | ||
=== Current jobs === | |||
Par défaut, [https://slurm.schedmd.com/squeue.html squeue] montre toutes les tâches gérées à ce moment par l'ordonnanceur. Le résultat sera plus rapide si vous demandez uniquement vos propres tâches avec | Par défaut, [https://slurm.schedmd.com/squeue.html squeue] montre toutes les tâches gérées à ce moment par l'ordonnanceur. Le résultat sera plus rapide si vous demandez uniquement vos propres tâches avec | ||
Line 209: | Line 211: | ||
scontrol show job -dd <jobid> | scontrol show job -dd <jobid> | ||
==== Email notification ==== | |||
Pour recevoir par courriel certains renseignements sur une tâche, utilisez les diverses options avec | |||
[https://slurm.schedmd.com/sbatch.html sbatch], par exemple | |||
#SBATCH --mail-user=<email_address> | |||
#SBATCH --mail-type=BEGIN | |||
#SBATCH --mail-type=END | |||
#SBATCH --mail-type=FAIL | |||
#SBATCH --mail-type=REQUEUE | |||
#SBATCH --mail-type=ALL | |||
=== Completed jobs === | |||
Get a short summary of the CPU- and memory-efficiency of a job with <code>seff</code>: | |||
$ seff 12345678 | |||
Job ID: 12345678 | |||
Cluster: cedar | |||
User/Group: jsmith/jsmith | |||
State: COMPLETED (exit code 0) | |||
Cores: 1 | |||
CPU Utilized: 02:48:58 | |||
CPU Efficiency: 99.72% of 02:49:26 core-walltime | |||
Job Wall-clock time: 02:49:26 | |||
Memory Utilized: 213.85 MB | |||
Memory Efficiency: 0.17% of 125.00 GB | |||
<div class="mw-translate-fuzzy"> | |||
Pour connaître les renseignements sur une tâche complétée, utilisez [https://slurm.schedmd.com/sacct.html sacct]; ajoutez <code>--format</code> pour savoir le résultat de la tâche, ainsi | Pour connaître les renseignements sur une tâche complétée, utilisez [https://slurm.schedmd.com/sacct.html sacct]; ajoutez <code>--format</code> pour savoir le résultat de la tâche, ainsi | ||
sacct -j <jobid> | sacct -j <jobid> | ||
sacct -j <jobid> --format=JobID,JobName,MaxRSS,Elapsed | sacct -j <jobid> --format=JobID,JobName,MaxRSS,Elapsed | ||
</div> | |||
S'il y a défaillance d'un nœud au cours de l'exécution d'une tâche, celle-ci peut être relancée. <code>sacct</code> montre normalement le dernier enregistrement pour la dernière exécution (présumée réussie). Pour consulter tous les enregistrements relatifs à une tâche, ajoutez l'option <code>--duplicates</code>. | S'il y a défaillance d'un nœud au cours de l'exécution d'une tâche, celle-ci peut être relancée. <code>sacct</code> montre normalement le dernier enregistrement pour la dernière exécution (présumée réussie). Pour consulter tous les enregistrements relatifs à une tâche, ajoutez l'option <code>--duplicates</code>. | ||
Line 218: | Line 248: | ||
La commande [https://slurm.schedmd.com/sstat.html sstat] fournit des renseignements sur l'état d'une tâche en cours d'exécution; la commande [https://slurm.schedmd.com/sacct.html sacct] est utilisée pour les tâches qui sont complétées. | La commande [https://slurm.schedmd.com/sstat.html sstat] fournit des renseignements sur l'état d'une tâche en cours d'exécution; la commande [https://slurm.schedmd.com/sacct.html sacct] est utilisée pour les tâches qui sont complétées. | ||
=== Surveillance d'une tâche en cours === | === Surveillance d'une tâche en cours === |