Using GPUs with Slurm/fr: Difference between revisions

Updating to match new version of source page
No edit summary
(Updating to match new version of source page)
Line 6: Line 6:
Le tableau suivant décrit les nœuds avec GPUs présentement disponibles avec [[Cedar/fr|Cedar]] et [[Graham/fr|Graham]].
Le tableau suivant décrit les nœuds avec GPUs présentement disponibles avec [[Cedar/fr|Cedar]] et [[Graham/fr|Graham]].


<div class="mw-translate-fuzzy">
{| class="wikitable"
{| class="wikitable"
|-
|-
Line 16: Line 17:
| 160 || ''GPU base'', Graham || 32|| 128Go || 2  || NVIDIA P100-PCIE-12GB || un GPU par socket CPU
| 160 || ''GPU base'', Graham || 32|| 128Go || 2  || NVIDIA P100-PCIE-12GB || un GPU par socket CPU
|}
|}
</div>


== Tâches avec un seul cœur ==
== Tâches avec un seul cœur ==
Line 102: Line 104:
=== Ordonnancement d'un nœud ''GPU large'' pour Cedar ===
=== Ordonnancement d'un nœud ''GPU large'' pour Cedar ===


<div class="mw-translate-fuzzy">
Sur la grappe [[Cedar/fr|Cedar]] se trouve des nœuds de type ''GPU large'' qui ont chacun quatre cartes Tesla P100 16Go; les autres nœuds sont de 12Go. Les GPUs du groupe spécial utilisent le all use the same PCI switch so the inter-GPU communication latency is lower, but bandwidth between CPU and GPU is lower than on the regular GPU nodes. The nodes also have 256 GB RAM instead of 128GB. In order to use these nodes you must specify <code>lgpu</code>. By-gpu requests can '''only run up to 24 hours'''.
Sur la grappe [[Cedar/fr|Cedar]] se trouve des nœuds de type ''GPU large'' qui ont chacun quatre cartes Tesla P100 16Go; les autres nœuds sont de 12Go. Les GPUs du groupe spécial utilisent le all use the same PCI switch so the inter-GPU communication latency is lower, but bandwidth between CPU and GPU is lower than on the regular GPU nodes. The nodes also have 256 GB RAM instead of 128GB. In order to use these nodes you must specify <code>lgpu</code>. By-gpu requests can '''only run up to 24 hours'''.
</div>


{{File
{{File
Line 121: Line 125:
===Regroupement de tâches pour un seul GPU===
===Regroupement de tâches pour un seul GPU===


<div class="mw-translate-fuzzy">
If user needs to run 4 x single GPU codes or 2 x 2-GPU codes in a node for '''longer than 24 hours''', [https://www.gnu.org/software/parallel/ GNU Parallel] is recommended. A simple example is given below:
If user needs to run 4 x single GPU codes or 2 x 2-GPU codes in a node for '''longer than 24 hours''', [https://www.gnu.org/software/parallel/ GNU Parallel] is recommended. A simple example is given below:
<pre>
<pre>
Line 126: Line 131:
</pre>
</pre>
GPU id will be calculated by slot id {%} minus 1. {#} is the job id, starting from 1.
GPU id will be calculated by slot id {%} minus 1. {#} is the job id, starting from 1.
</div>


A params.input file should include input parameters in each line like:
A params.input file should include input parameters in each line like:
38,892

edits