Using GPUs with Slurm/fr: Difference between revisions

no edit summary
(Updating to match new version of source page)
No edit summary
Line 102: Line 102:
=== Ordonnancement d'un nœud ''GPU large'' pour Cedar ===
=== Ordonnancement d'un nœud ''GPU large'' pour Cedar ===


<div class="mw-translate-fuzzy">
Sur [[Cedar/fr|Cedar]] se trouvent des nœuds de type ''GPU large'' qui ont chacun quatre cartes Tesla P100 16Go, alors que les autres nœuds sont de 12Go.
Sur la grappe [[Cedar/fr|Cedar]] se trouvent des nœuds de type ''GPU large'' qui ont chacun quatre cartes Tesla P100 16Go, alors que les autres nœuds sont de 12Go.
Les nœuds de type ''GPU large'' utilisent le même connecteur PCI, ce qui fait que la latence dans les communications entre GPU est plus faible; cependant, la bande passante entre CPU et GPU est plus basse que dans le cas des nœuds GPU réguliers. De plus, la mémoire vive des nœuds est de 256Go plutôt que de 128Go.
Les nœuds de type ''GPU large'' utilisent le même connecteur PCI, ce qui fait que la latence dans les communications entre GPU est plus faible; cependant, la bande passante entre CPU et GPU est plus basse que dans le cas des nœuds GPU réguliers. De plus, la mémoire vive des nœuds est de 256Go plutôt que de 128Go.
Pour utiliser ces nœuds, il faut demander des nœuds entiers et indiquer <code>lgpu</code>. Les tâches avec GPU ont un '''temps d'exécution maximal de 24 heures'''. Il peut arriver que des tâches GPU courtes soient exécutées sur ces nœuds par [[Job_scheduling_policies/fr#Remplissage_(backfilling)|remplissage (''backfilling'')]] si aucune tâche pour nœud entier n'est en attente.
Pour utiliser ces nœuds, il faut demander des nœuds entiers et indiquer <code>lgpu</code>. Le temps d'exécution maximal pour ces tâches est passé de 24 haures à 28 jours.
</div>


{{File
{{File
rsnt_translations
56,437

edits