rsnt_translations
57,772
edits
(Updating to match new version of source page) |
No edit summary |
||
Line 7: | Line 7: | ||
* Les grappes de Calcul Canada sont sensibles aux récentes vulnérabilités Meltdown et Spectre; le système d'exploitation sera mis à jour (voir [[Meltdown and Spectre bugs/fr|Bogues Meltdown et Spectre]]). | * Les grappes de Calcul Canada sont sensibles aux récentes vulnérabilités Meltdown et Spectre; le système d'exploitation sera mis à jour (voir [[Meltdown and Spectre bugs/fr|Bogues Meltdown et Spectre]]). | ||
==Ordonnanceur== | ==Ordonnanceur== | ||
*Slurm peut émettre le message ''Exceeded step memory limit at some point'', ce qui peut surprendre et entraîner un problème pour les tâches dépendantes. | *Slurm peut émettre le message ''Exceeded step memory limit at some point'', ce qui peut surprendre et entraîner un problème pour les tâches dépendantes. | ||
:*L’ordonnanceur rapporte correctement l’utilisation que les opérations de lecture/écriture font de la mémoire. Cette utilisation, surtout dans le cas des écritures en mémoire tampon, n’était pas visible auparavant car l’interpréteur dirige habituellement ces écritures vers le système de fichiers. | :*L’ordonnanceur rapporte correctement l’utilisation que les opérations de lecture/écriture font de la mémoire. Cette utilisation, surtout dans le cas des écritures gardées en mémoire tampon, n’était pas visible auparavant car l’interpréteur dirige habituellement ces écritures vers le système de fichiers. | ||
:*Le même message peut être émis quand l’interpréteur termine des processus (''OOM kill'') dû à une mémoire insuffisante; les répercussions sur le code de sortie sont cependant différentes. | :*Le même message peut être émis quand l’interpréteur termine des processus (''OOM kill'') dû à une mémoire insuffisante; les répercussions sur le code de sortie sont cependant différentes. | ||
:*L’état ''DerivedExitStatus 0:125'' indique que la tâche a atteint la limite de la mémoire, mais qu’elle n’a pas été terminée par ''OOM kill''. | :*L’état ''DerivedExitStatus 0:125'' indique que la tâche a atteint la limite de la mémoire, mais qu’elle n’a pas été terminée par ''OOM kill''. | ||
:*Un état 0 :125 NE PERMET PAS l’exécution d’une tâche ayant une dépendance ''afterok''. Il s’agit d’un bogue qui sera éliminé dans la version 17.11.3 de l’ordonnanceur; la correction permettra de distinguer entre les tâches terminées par ''OOM kill'' et les conditions qui ne nécessitent qu’une alerte. Slurm limitera toujours l’utilisation de la mémoire pour les ''cgroups''; les opérations en entrée/sortie seront toujours considérées et l’utilisateur sera averti quand la quantité de mémoire utilisée dépasse la quantité demandée. | |||
* The CC Slurm configuration encourages whole-node jobs. When appropriate, users should request whole-node rather than per-core resources. Read about [[Job_scheduling_policies#Whole_nodes_versus_cores|whole node scheduling]]. | * The CC Slurm configuration encourages whole-node jobs. When appropriate, users should request whole-node rather than per-core resources. Read about [[Job_scheduling_policies#Whole_nodes_versus_cores|whole node scheduling]]. |