Environnements logiciels standards
Description
Nos environnements logiciels sont rendus disponibles par un ensemble de modules qui vous permettent d'alterner entre différentes versions d'un paquet logiciel. Ces modules sont organisés selon une structure en arbre dont le tronc est composé des mêmes utilitaires que ceux offerts dans les environnements Linux. Les branches principales de ce tronc sont les versions des compilateurs auxquelles sont rattachées des sous-branches pour chaque version de MPI ou CUDA.
Un environnement logiciel standard est composé d’une combinaison particulière de modules de compilation et de modules MPI groupés dans un module appelé StdEnv
. Ces environnements sont communément utilisés par notre équipe technique pour construire d’autres logiciels.
En date d’octobre 2020, les trois versions des environnements standards étaient 2016.4, 2018.3, et 2020 avec chaque version comportant des améliorations importantes.
Nous décrivons ici les différences entre les versions et expliquons pourquoi il est préférable d’installer la plus récente.
Les plus récentes versions des paquets logiciels sont habituellement installées dans le plus récent environnement logiciel.
StdEnv/2016.4
Cette première version de notre environnement logiciel a été installée en 2016 avec la mise en service des grappes [Cedar/fr|Cedar] et [Graham/fr|Graham]. Les compilateurs par défaut sont GCC 5.4.0 et Intel 2016.4. L’implémentation MPI par défaut est Open MPI 2.1.1. La plupart des logiciels compilés dans cet environnement ne supportent pas les instructions AVX512, contrairement aux processeurs Skylake de Béluga, [Niagara/fr|Niagara] et aux récents ajouts à Cedar et Graham.
Activez cet environnement avec la commande
[name@server ~]$ module load StdEnv/2016.4
StdEnv/2018.3
Cette deuxième version de notre environnement logiciel a été installée en 2018, avec la mise en service de la grappe Béluga, peu après le déploiement de [Niagara/fr|Niagara]. Les compilateurs par défaut sont passés à GCC 7.3.0 et Intel 2018.3. L’implémentation MPI par défaut est passée à Open MPI 3.1.2. Il s’agit de la première version à offrir le support des instructions AVX512.
Activez cet environnement avec la commande
[name@server ~]$ module load StdEnv/2018.3
StdEnv/2020
Cette plus récente version de notre environnement logiciel est celle qui a connu le plus de modifications. Les compilateurs par défaut sont passés à GCC 9.3.0 et Intel 2020.1. MPI par défaut est passée à Open MPI 4.0.3.
Activez cet environnement avec la commande
[name@server ~]$ module load StdEnv/2020
Amélioration de la performance
Les binaires générés avec le compilateur Intel supportent automatiquement les jeux d’instructions AVX2 et AVX512. Techniquement, ce sont des binaires multiarchitecture, aussi appelés fat binaries. Ceci signifie que quand vous utilisez une grappe comme Cedar ou Graham qui ont connu plusieurs générations de processeurs, vous n’avez plus besoin de charger manuellement un des modules arch si vous utilisez des paquets logiciels générés avec le compilateur Intel.
Certains paquets logiciels installés auparavant avec GCC ou Intel se trouvent maintenant à un niveau plus bas de la hiérarchie, ce qui fait que le même module est visible peu importe le compilateur qui est chargé; c’est le cas par exemple pour les modules [R/fr|R] et pour plusieurs paquets en bio-informatique pour lesquels le module gcc
devait auparavant être chargé. Ceci a été rendu possible pas des optimisations spécifiques aux architectures CPU que nous avons effectuées sous le niveau du compilateur.
Nous avons aussi installé une version plus récente de GNU C Library qui offre des fonctions mathématiques optimisées. Ceci a nécessité une plus récente version du noyau Linux (voir ci-dessous).
Couche de compatibilité
La couche de compatibilité est un niveau de la hiérarchie en dessous de celui des compilateurs et des paquets logiciels pour que ces derniers soient indépendants du système d’exploitation sous-jacent et qu’ils fonctionnent autant sous CentOS que sous Ubuntu ou Fedora.Un changement majeur dans la version 2020 a été de changer d'outil pour la couche de compatibilité en passant de Nix package manager à Gentoo Prefix.
Noyau Linux
Les versions 2016.4 et 2018.3 nécessitent une version du noyau Linux 2.6.32 ou plus, ce qui est supporté à partir de CentOS 6. La version 2020 demande un noyau Linux 3.10 ou plus, ce qui est supporté à partir de CentOS 7. Les autres distributions Linux ont habituellement un noyau beaucoup plus récent et vous n’aurez donc pas à changer votre distribution Linux si vous utilisez cet environnement standard sous une autre que CentOS.
Changez la version par défaut
Nous planifions installer StdEnv/2020
sur toutes nos grappes, mais elles utilisent présentement des versions par défaut différentes. En date d’août 2020,
- Cedar et Graham utilisent
StdEnv/2016.4
; - Béluga utilise
StdEnv/2018.3
; - l’environnement par défaut sur Niagara devient
StdEnv/2018.3
avec la commande module load CCEnv StdEnv.
Vous pouvez changer la version par défaut de l’environnement logiciel que vous utilisez avec la commande suivante (version 2020 dans cet exemple)
[name@server ~]$ echo "module-version StdEnv/2020 default" >> $HOME/.modulerc
Dois-je réinstaller ou recompiler mon code pour travailler dans un nouvel environnement standard?
Oui. Si vous compilez votre propre code ou que vous installez des paquets R ou Python, vous devriez recompiler le code ou réinstaller ces paquets avec l’environnement logiciel standard le plus récent.