Cedar/fr: Difference between revisions

Jump to navigation Jump to search
Updating to match new version of source page
No edit summary
(Updating to match new version of source page)
Line 1: Line 1:
<noinclude><languages />
<noinclude><languages />


<div class="mw-translate-fuzzy">
{| class="wikitable"
{| class="wikitable"
|-
|-
Line 11: Line 12:
| État de la grappe :  <b>http://status.alliancecan.ca/</b>
| État de la grappe :  <b>http://status.alliancecan.ca/</b>
|}
|}
</div>


<div class="mw-translate-fuzzy">
Cedar est une grappe hétérogène adaptée pour une grande variété de types de tâches; elle est située à l'Université Simon-Fraser. Son nom rappelle le [https://fr.wikipedia.org/wiki/Thuja_plicata cèdre de l'Ouest], arbre officiel de la Colombie-Britannique dont la signification spirituelle est importante pour les Premières Nations de la région.
Cedar est une grappe hétérogène adaptée pour une grande variété de types de tâches; elle est située à l'Université Simon-Fraser. Son nom rappelle le [https://fr.wikipedia.org/wiki/Thuja_plicata cèdre de l'Ouest], arbre officiel de la Colombie-Britannique dont la signification spirituelle est importante pour les Premières Nations de la région.
<br/>
<br/>
Le fournisseur est Scalar Decisions Inc.; les nœuds sont des produits Dell; le système de fichiers de stockage <tt>/scratch</tt> haute performance est de DDN; la réseautique est d'Intel. Un système de refroidissement liquide utilise des échangeurs de chaleur à même les portes arrière.   
Le fournisseur est Scalar Decisions Inc.; les nœuds sont des produits Dell; le système de fichiers de stockage <tt>/scratch</tt> haute performance est de DDN; la réseautique est d'Intel. Un système de refroidissement liquide utilise des échangeurs de chaleur à même les portes arrière.
</div>  


Voyez de courtes vidéos sur les [[Getting started with the new national systems/fr| notions de base pour l'utilisation de Cedar]].
Voyez de courtes vidéos sur les [[Getting started with the new national systems/fr| notions de base pour l'utilisation de Cedar]].
Line 20: Line 24:
=Stockage=
=Stockage=


<div class="mw-translate-fuzzy">
{| class="wikitable sortable"
{| class="wikitable sortable"
|-
|-
Line 40: Line 45:
* est sauvegardé chaque jour
* est sauvegardé chaque jour
|}
|}
</div>


<div class="mw-translate-fuzzy">
Le stockage temporaire (''scratch'') est un système de fichiers Lustre basé sur la technologie DDN, modèle ES14K. Il est composé de 640 disques NL-SAS de 8To chacun, avec un double contrôleur de métadonnées dont les disques sont des SSD.
Le stockage temporaire (''scratch'') est un système de fichiers Lustre basé sur la technologie DDN, modèle ES14K. Il est composé de 640 disques NL-SAS de 8To chacun, avec un double contrôleur de métadonnées dont les disques sont des SSD.
</div>


=Réseautique haute performance=
=Réseautique haute performance=


<div class="mw-translate-fuzzy">
''Réseautique Intel OmniPath (version 1, bande passante de 100Gbit/s).''
''Réseautique Intel OmniPath (version 1, bande passante de 100Gbit/s).''
</div>


Une réseautique à faible latence et haute performance pour tous les nœuds de calcul et le stockage temporaire.
Une réseautique à faible latence et haute performance pour tous les nœuds de calcul et le stockage temporaire.
Line 79: Line 89:
|}
|}


<div class="mw-translate-fuzzy">
Remarquez que la quantité de mémoire disponible est moindre que la valeur arrondie suggérée par la configuration matérielle. Par exemple, les nœuds de type ''base 128G'' ont effectivement 128Gio de mémoire vive, mais une certaine quantité est utilisée en permanence par le noyau (''kernel'') et le système d'exploitation. Pour éviter la perte de temps encourue par le ''swapping'' ou le ''paging'', l'ordonnanceur n'allouera jamais une tâche dont les exigences dépassent la quantité de mémoire disponible indiquée dans le tableau ci-dessus.
Remarquez que la quantité de mémoire disponible est moindre que la valeur arrondie suggérée par la configuration matérielle. Par exemple, les nœuds de type ''base 128G'' ont effectivement 128Gio de mémoire vive, mais une certaine quantité est utilisée en permanence par le noyau (''kernel'') et le système d'exploitation. Pour éviter la perte de temps encourue par le ''swapping'' ou le ''paging'', l'ordonnanceur n'allouera jamais une tâche dont les exigences dépassent la quantité de mémoire disponible indiquée dans le tableau ci-dessus.
</div>


Tous les nœuds ont de l'espace de stockage local temporaire. Les nœuds de calcul (à l'exception des nœuds GPU) ont deux disques SSD de 480Go pour une capacité totale de 960Go. Les nœuds GPU ont un disque SSD de 800Go ou de 480Go. Pour accéder le stockage local, il est recommandé d'utiliser le répertoire temporaire <code>$SLURM_TMPDIR</code> créé par l'ordonnanceur à cet effet; consultez [[Running_jobs/fr|Exécuter des tâches]].
Tous les nœuds ont de l'espace de stockage local temporaire. Les nœuds de calcul (à l'exception des nœuds GPU) ont deux disques SSD de 480Go pour une capacité totale de 960Go. Les nœuds GPU ont un disque SSD de 800Go ou de 480Go. Pour accéder le stockage local, il est recommandé d'utiliser le répertoire temporaire <code>$SLURM_TMPDIR</code> créé par l'ordonnanceur à cet effet; consultez [[Running_jobs/fr|Exécuter des tâches]].


<div class="mw-translate-fuzzy">
==Sélectionner un type de nœud==
==Sélectionner un type de nœud==
Un certain nombre de nœuds de 48 cœurs sont réservés pour les tâches qui nécessitent des nœuds entiers. Aucun nœud de 32 cœurs n'est réservé pour les calculs avec des nœuds entiers. '''Les tâches qui nécessitent moins de 48 cœurs par nœud pourraient donc avoir à partager des nœuds avec d'autres tâches'''.
Un certain nombre de nœuds de 48 cœurs sont réservés pour les tâches qui nécessitent des nœuds entiers. Aucun nœud de 32 cœurs n'est réservé pour les calculs avec des nœuds entiers. '''Les tâches qui nécessitent moins de 48 cœurs par nœud pourraient donc avoir à partager des nœuds avec d'autres tâches'''.
<br>
<br>
La plupart des applications peuvent être exécutées sur les nœuds Broadwell, Skylake ou Cascade Lake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez <code>--constraint=cascade</code>, <code>--constraint=skylake</code> ou <code>--constraint=broadwell</code>.  Si vous avez besoin d'un nœud AVX512, utilisez <code>--constraint=[skylake|cascade]</code>.  Consultez [[Running_jobs/fr#Sélectionner_une_architecture_CPU|Sélectionner une architecture CPU]].
La plupart des applications peuvent être exécutées sur les nœuds Broadwell, Skylake ou Cascade Lake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez <code>--constraint=cascade</code>, <code>--constraint=skylake</code> ou <code>--constraint=broadwell</code>.  Si vous avez besoin d'un nœud AVX512, utilisez <code>--constraint=[skylake|cascade]</code>.  Consultez [[Running_jobs/fr#Sélectionner_une_architecture_CPU|Sélectionner une architecture CPU]].
</div>


= Modification à la politique de soumission et exécution de tâches =
= Modification à la politique de soumission et exécution de tâches =


<div class="mw-translate-fuzzy">
Depuis le 17 avril 2019, les tâches ne peuvent plus être exécutées dans le système de fichiers <code>/home</code>. Cette modification a pour but de diminuer la charge et d'améliorer le temps de réponse en mode interactif dans <code>/home</code>. Si le message <code>Submitting jobs from directories residing in /home is not permitted</code> s'affiche, transférez les fichiers vers votre répertoire <code>/project</code> ou <code>/scratch</code> et soumettez la tâche à partir du nouvel emplacement.
Depuis le 17 avril 2019, les tâches ne peuvent plus être exécutées dans le système de fichiers <code>/home</code>. Cette modification a pour but de diminuer la charge et d'améliorer le temps de réponse en mode interactif dans <code>/home</code>. Si le message <code>Submitting jobs from directories residing in /home is not permitted</code> s'affiche, transférez les fichiers vers votre répertoire <code>/project</code> ou <code>/scratch</code> et soumettez la tâche à partir du nouvel emplacement.
</div>


==Performance==
==Performance==
La performance théorique maximale en double précision est de 6547 téraflops pour les CPU auxquels s'ajoutent 7434 téraflops pour les GPU, pour un total de près de 14 pétaflops.
La performance théorique maximale en double précision est de 6547 téraflops pour les CPU auxquels s'ajoutent 7434 téraflops pour les GPU, pour un total de près de 14 pétaflops.


<div class="mw-translate-fuzzy">
La topologie réseau est une composition d'îlots avec un facteur de blocage de 2:1 entre chacun. La plupart des îlots ont 32 nœuds entièrement reliés par une interconnexion (''Omni-Path fabric'') non-bloquante.
La topologie réseau est une composition d'îlots avec un facteur de blocage de 2:1 entre chacun. La plupart des îlots ont 32 nœuds entièrement reliés par une interconnexion (''Omni-Path fabric'') non-bloquante.
<br>
<br>
Line 103: Line 120:
* 6 îlots avec 32 nœuds GPU V100;
* 6 îlots avec 32 nœuds GPU V100;
* 2 îlots chacun avec 24 nœuds Broadwell de type ''large memory''.
* 2 îlots chacun avec 24 nœuds Broadwell de type ''large memory''.
</div>


<noinclude>
<noinclude>
</noinclude>
</noinclude>
38,757

edits

Navigation menu