Other languages:

English
français

Disponibilité : depuis le 30 juin 2017, dans le cadre du concours d'allocation des ressources pour 2017
Nœud frontal (login node) : cedar.calculcanada.ca
Point de chute Globus : computecanada.ca#cedar
État de la grappe : http://status.calculcanada.ca/

Cedar est une grappe hétérogène adaptée pour une grande variété de types de tâches; elle est située à l'Université Simon-Fraser. Son nom rappelle le cèdre de l'Ouest, arbre officiel de la Colombie-Britannique dont la signification spirituelle est importante pour les Premières Nations de la région.
Le fournisseur est Scalar Decisions Inc.; les nœuds sont des produits Dell; le système de fichiers de stockage /scratch haute performance est de DDN; la réseautique est d'Intel. Un système de refroidissement liquide utilise des échangeurs de chaleur à même les portes arrière.

Voyez de courtes vidéos sur les notions de base pour l'utilisation de Cedar.

Stockage

espace home volume total 526To	localisation des répertoires home chaque répertoire home a un petit quota fixe non alloué via le service d'accès rapide ou le concours d'allocation de ressources; le stockage de grande envergure se fait sur l'espace project est sauvegardé chaque jour
espace scratch, volume total 5.4Po système de fichiers parallèle de haute performance	stockage scratch actif ou temporaire non alloué grand quota fixe, par utilisateur les données inactives sont purgées
espace project volume total 23Po stockage persistant externe	fait partie de la cyberinfrastructure nationale de données ne convient pas aux tâches d'écriture et de lecture parallèles; utiliser plutôt l'espace scratch grand quota ajustable, par projet est sauvegardé chaque jour

Le stockage temporaire (scratch) est un système de fichiers Lustre basé sur la technologie DDN, modèle ES14K. Il est composé de 640 disques NL-SAS de 8To chacun, avec un double contrôleur de métadonnées dont les disques sont des SSD.

Réseautique haute performance

Réseautique Intel OmniPath (version 1, bande passante de 100Gbit/s).

Une réseautique à faible latence et haute performance pour tous les nœuds de calcul et le stockage temporaire.

L'architecture a été planifiée pour supporter de multiples tâches parallèles utilisant jusqu'à 1024 cœurs Broadwell (32 nœuds) ou 1536 cœurs Skylake (32 nœuds) ou 1536 cœurs Cascade Lake (32 nœuds) grâce à une réseautique non bloquante. Pour les plus grandes tâches, le réseau a un facteur de blocage de 2:1. Même pour les tâches de plusieurs milliers de cœurs, Cedar est une bonne option.

Caractéristiques des nœuds

Cedar offre 94,528 cœurs CPU pour le calcul et 1352 GPU.

nœuds	cœurs	mémoire disponible	CPU	stockage	GPU
576	32	125G ou 128000M	2 x Intel E5-2683 v4 Broadwell @ 2.1Ghz	2 x SSD 480G	-
96	32	250G ou 257000M	2 x Intel E5-2683 v4 Broadwell @ 2.1Ghz	2 x SSD 480G	-
24	32	502G ou 515000M	2 x Intel E5-2683 v4 Broadwell @ 2.1Ghz	2 x SSD 480G	-
24	32	1510G ou 1547000M	2 x Intel E5-2683 v4 Broadwell @ 2.1Ghz	2 x SSD 480G	-
4	32	3022G ou 3095000M	4 x Intel E7-4809 v4 Broadwell @ 2.1Ghz	2 x SSD 480G	-
114	24	125G ou 128000M	2 x Intel E5-2650 v4 Broadwell @ 2.2GHz	1 x SSD 800G	4 x NVIDIA P100 Pascal (mémoire HBM2 12G)
32	24	250G ou 257000M	2 x Intel E5-2650 v4 Broadwell @ 2.2GHz	1 x SSD 800G	4 x NVIDIA P100 Pascal (mémoire HBM2 16G)
192	32	187G ou 192000M	2 x Intel Silver 4216 Cascade Lake @ 2.1GHz	1 x SSD 480G	4 x NVIDIA V100 Volta (mémoire HBM2 32G)
640	48	187G ou 192000M	2 x Intel Platinum 8160F Skylake @ 2.1Ghz	2 x SSD 480G	-
768	48	187G ou 192000M	2 x Intel Platinum 8260 Cascade Lake @ 2.4Ghz	2 x SSD 480G	-

Remarquez que la quantité de mémoire disponible est moindre que la valeur arrondie suggérée par la configuration matérielle. Par exemple, les nœuds de type base 128G ont effectivement 128Gio de mémoire vive, mais une certaine quantité est utilisée en permanence par le noyau (kernel) et le système d'exploitation. Pour éviter la perte de temps encourue par le swapping ou le paging, l'ordonnanceur n'allouera jamais une tâche dont les exigences dépassent la quantité de mémoire disponible indiquée dans le tableau ci-dessus.

Tous les nœuds ont de l'espace de stockage local temporaire. Les nœuds de calcul (à l'exception des nœuds GPU) ont deux disques SSD de 480Go pour une capacité totale de 960Go. Les nœuds GPU ont un disque SSD de 800Go ou de 480Go. Pour accéder le stockage local, il est recommandé d'utiliser le répertoire temporaire $SLURM_TMPDIR créé par l'ordonnanceur à cet effet; consultez Exécuter des tâches.

Sélectionner un type de nœud

La plupart des applications peuvent être exécutées sur les nœuds Broadwell, Skylake ou Cascade Lake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez --constraint=cascade, --constraint=skylake ou --constraint=broadwell. Si vous avez besoin d'un nœud AVX512, utilisez --constraint=[skylake|cascade]. Consultez Sélectionner une architecture CPU.

Modification à la politique de soumission et exécution de tâches

Depuis le 17 avril 2019, les tâches ne peuvent plus être exécutées dans le système de fichiers /home. Cette modification a pour but de diminuer la charge et d'améliorer le temps de réponse en mode interactif dans /home. Si le message Submitting jobs from directories residing in /home is not permitted s'affiche, transférez les fichiers vers votre répertoire /project ou /scratch et soumettez la tâche à partir du nouvel emplacement.

Performance

La performance théorique maximale en double précision est de 6547 teraflops pour les CPU auxquels s'ajoutent 7434 teraflops pour les GPU, pour un total de près de 14 petaflops.

La topologie réseau est une composition d'ilots avec un facteur de blocage de 2:1 entre les ilots. La plupart des ilots ont 32 nœuds complètement reliés par une interconnexion non-blocante (Omni-Path fabric).

18 ilots de 32 nœuds Broadwell chacun avec 32 cœurs, soit 1024 cœurs par ilot
44 ilots de 32 nœuds Skylake et Cascade Lake chacun avec 48 cœurs, soit 1536 cœurs par ilot
4 ilots avec 32 nœuds GPU P100
6 ilots avec 32 nœuds GPU V100
2 ilots chacun avec 24 nœuds Broadwell de type large memory

Cedar

Contents

Stockage

Réseautique haute performance

Caractéristiques des nœuds

Sélectionner un type de nœud

Modification à la politique de soumission et exécution de tâches

Performance

Navigation menu

Cedar

Stockage

Réseautique haute performance

Caractéristiques des nœuds

Sélectionner un type de nœud

Modification à la politique de soumission et exécution de tâches

Performance

Navigation menu

Search