Hélios
Helios sera fermé définitivement à la fin 2022. En prévision de cette fermeture, l'accès interactif via SSH sera fermé à compté du 26 octobre 2022. L'accès via Globus pour récupérer vos données sera permis jusqu'au 28 novembre, moment auquel Helios sera fermé.
Disponibilité : mars 2014 |
Nœud frontal : helios.calculquebec.ca |
Point de chute Globus : computecanada#helios-dtn |
Nœud de copie (rsync, scp, sftp,...) : helios.calculquebec.ca |
Hélios est un superordinateur composé de nœuds à processeurs graphiques (GPGPU) qui a été installé dans le centre de calcul à l'université Laval au printemps 2014. Le serveur a été acheté à partir de fonds combinés de chercheurs de l'Université Laval, de l'Université de Montréal, ainsi qu'à partir de fonds de Calcul Québec. Jusqu'au déploiement de Cedar et Graham, Hélios était le plus grand déploiement de GPGPU administré par Calcul Canada, à la fois en termes de nombre de GPU et de puissance de calcul.
Transférer vos données[edit]
En date de janvier 2020, Hélios est en train d'être migré afin d'être uniformisé avec les nouveaux standards de Calcul Canada. Cela signifie :
- Une migration des identifiants de connexion de Calcul Québec vers ceux de Calcul Canada
- Une migration de l'ordonnanceur Moab vers l'ordonnanceur Slurm
- Une réorganisation des systèmes de fichiers afin de correspondre à la structure utilisée sur les autres grappes nationales
- Une mise à jour des logiciels et du système de modules
Pour cette migration, vous devrez transférer vos fichiers de l'ancien système de fichiers vers le nouveau. Pour ce faire, nous vous suggérons d'utiliser Globus entre les points de chute computecanada#colosse vers computecanada#helios-dtn.
Particularités[edit]
Notre politique veut que les nœuds de calcul de Hélios n'aient pas accès à l'internet. Pour y faire exception, contactez le soutien technique en expliquant ce dont vous avez besoin et pourquoi. Notez que l'outil crontab
n'est pas offert.
Chaque tâche devrait être d'une durée d’au moins une heure (au moins cinq minutes pour les tâches de test) et un utilisateur ne peut avoir plus de 1000 tâches (en exécution et en attente) à la fois. La durée maximale d'une tâche est 7 jours (168 heures).
Sauvegardes[edit]
Contrairement aux nouvelles grappes nationales, il n'y a pas de sauvegarde des systèmes de fichiers d'Hélios. Vous devez donc conserver vos propres copies en lieu sûr.
Jupyter[edit]
En plus de l'interface d'accès traditionnelle via SSH, Hélios propose une interface JupyterHub pour accéder à l'infrastructure. Pour y accéder, connectez-vous via l'adresse https://jupyterhub.helios.calculquebec.ca/hub/spawn.
Environnement logiciel[edit]
Hélios utilise la version AVX de l'environnement logiciel de Calcul Canada. Vous pouvez trouver la liste des logiciels disponibles sous l'onglet AVX (Helios) de la page Logiciels disponibles.
GPU disponibles[edit]
Hélios possède deux types de GPU : NVIDIA K20 et NVIDIA K80. Pour spécifier l'un ou l'autre des deux types, utilisez les options suivantes dans votre script de soumission :
#SBATCH --gres=gpu:k20:1
ou
#SBATCH --gres=gpu:k80:1
Stockage[edit]
Hélios a un seul système de fichiers Lustre de 392To. Celui-ci est cependant divisé en trois espaces avec des quotas distincts, tel que sur les nouvelles grappes de calcul de Calcul Canada. Il n'y a aucune sauvegarde du système de fichiers.
HOME Système de fichiers Lustre |
|
SCRATCH Système de fichiers Lustre |
|
PROJECT Système de fichiers Lustre |
|
Pour les transferts de données par Globus, on devrait utiliser le point de chute computecanada#helios-dtn
, alors que pour les outils comme rsync et scp, on peut utiliser un nœud
de connexion.
Caractéristiques des nœuds[edit]
nœuds | cœurs | mémoire disponible | CPU | stockage | GPU |
---|---|---|---|---|---|
15 | 20 | 110G | 2 x Intel Xeon Ivy Bridge E5-2670 v2 @ 2.5 GHz | 1 x HDD de 2T | 8 x NVidia K20 (mémoire 5G) |
8 | 24 | 256G | 2 x Intel Xeon Ivy Bridge E5-2697 v2 @ 2.7 GHz | 2 x SSD de 180G (330G utilisable) | 8 x NVidia K80 (16 GPU, mémoire de 12G/GPU) |