Anaconda: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
No edit summary
 
(53 intermediate revisions by 8 users not shown)
Line 1: Line 1:
== Description ==
<languages />
[[Category:Software]]
<translate>
<!--T:24-->
Anaconda est une distribution de Python. Nous demandons à nos utilisateurs de '''ne pas installer Anaconda sur nos grappes'''. On vous recommande d'utiliser des autres pistes comme un environnement virtuel ou bien un conteneur [[Apptainer/fr | Apptainer]], pour les cas les plus compliqués.


Anaconda est une distribution Open Source de [[Python]] et R qui cherche à simplifier la gestions des modules et le déploiement.
== N'installez pas Anaconda sur nos grappes == <!--T:26-->


== Installation ==
<!--T:27-->
Nous sommes conscients qu'Anaconda est largement utilisé dans plusieurs domaines étudiés par nos utilisateurs (la science des données, l'IA, la bioinformatique, etc). Anaconda est une solution intéressante pour simplifier la gestion de Python et de librairies sur un ordinateur personnel. Cependant, sur une grappe comme celles maintenues par l'Alliance, la gestion des librairies doit être faite par notre personnel, afin d'assurer une compatibilité et une performance maximales. Voici une liste de raisons:


Les distributions de Python installées sur les serveurs de Calcul Canada sont compilées à partir des sources disponibles sur [http://www.python.org python.org]. Les usagers sont cependant libres d'installer Anaconda dans leur propre répertoire. Les instructions suivantes permettent de simplifier cette tâche et ainsi éviter des erreurs de compatibilité.
<!--T:28-->
* Anaconda installe très souvent des logiciels (compilateurs, bibliothèques scientifiques etc.) qui existent déjà sur les grappes de l'Alliance comme modules, avec une configuration qui n'est pas optimale.
* installe des binaires qui ne sont pas optimisés pour les processeurs de nos grappes.
* fait de mauvaises suppositions sur l'emplacement de bibliothèques.
* s'installe dans le <code>$HOME</code> par défaut, où il place une énorme quantité de fichiers. L'installation d'Anaconda seule peut prendre près de la moitié de votre quota sur le nombre de fichiers dans votre espace personnel.
* est plus lent pour installer des paquets
* modifie <code>$HOME/.bashrc</code>, ce qui peut causer des conflits.


=== Répertoire personnel (une installation par usager) ===
== Comment transitionner de Conda vers virtualenv == <!--T:29-->


Par défaut, l'installation est réalisée dans votre répertoire personnel, seul vous pouvez y accéder. Si vous souhaitez partager votre installation avec l'ensemble de votre groupe, utilisez plutôt les instructions de la section suivante.
<!--T:30-->
[[Python#Creating_and_using_a_virtual_environment|Virtualenv]] vous offre toutes les fonctionnalités dont vous avez besoin pour utiliser Python sur nos grappes. Voici comment passer à virtualenv si vous utilisez Anaconda sur votre ordinateur personnel:


Pour installer Anaconda avec Python 2, lancez la commande suivante:
<!--T:31-->
{{Command|eb Anaconda2-4.4.0.eb}}
# Listez les dépendances (requis) de l'application que vous voulez utiliser. Afin de ce faire, vous pouver :
## Exécuter <code>pip show <nom_paquet></code> depuis votre environement virtuel (si le paquet existe sur [https://pypi.org/ PyPI])
## Ou, vérifier s'il existe un fichier <tt>requirements.txt</tt> dans le dépôt Git.
## Ou, vérifier la variable <tt>install_requires</tt> du fichier <tt>setup.py</tt> qui énumère les requis.
# Trouvez quelles dépendances sont des paquets Python, et lesquelles sont des librairies fournies par Anaconda. Par exemple, CUDA et CuDNN sont des librairies disponible sur l'Anaconda Cloud, mais que vous ne devez pas installer vous-même sur nos grappes. Elles sont déjà installées.
# Retirez de la liste de dépendance tout ce qui n'est pas un paquet Python (par exemple, retirez <code>cudatoolkit</code> et <code>cudnn</code>).
# Utilisez un [[Python#Creating_and_using_a_virtual_environment|virtualenv]], dans lequel vous installerez ces dépendances.


Pour Anaconda avec Python 3, lancez la commande suivante:
<!--T:32-->
{{Command|eb Anaconda3-4.4.0.eb}}
Votre application devrait fonctionner. Si ce n'est pas le cas, n'hésitez pas à contacter notre soutien technique.


=== Répertoire de projet (une installation par groupe) ===
==Usage d'Apptainer== <!--T:35-->


Pour installer Anaconda avec Python 2, lancez la commande suivante:
<!--T:36-->
{{Command|eb --prefix{{=}}$(readlink $PROJECT) Anaconda2-4.4.0.eb}}
Dans certaines situations, la complexité des dépendances d'un logiciel exige une solution où l'on peut maîtriser entièrement l'environnement. Pour ces situations, on recommande l'outil [[Apptainer/fr | Apptainer]] : notez qu'une image Docker peut être convertie en image Apptainer. Le seul inconvénient de Apptainer, c'est que les images consomment beaucoup d'espace disque, alors si votre groupe de recherche prévoit d'utiliser plusieurs images, il serait sage de les regrouper ensemble dans un seul répertoire de l'espace projet du groupe pour éviter les doublons.


Pour Anaconda avec Python 3, lancez la commande suivante:
== Exemples spécifiques où Anaconda ne fonctionne pas == <!--T:33-->
{{Command|eb --prefix{{=}}$(readlink $PROJECT) Anaconda3-4.4.0.eb}}
;R : Une recette conda force l'installation de R. Cette installation ne performe pas aussi bien que le R disponible par les modules (qui lui utilise Intel MKL). Ce même R fonctionne mal et les tâches meurent, gaspillant ainsi des ressources et votre temps.


L'installation d'Anaconda produit automatiquement un fichier module que vous pourrez charger à l'aide de la commande du même nom. Pour que la commande module trouve le fichier en question, vous devez lui indiquer où le trouver à l'aide de la commande suivante :
</translate>
{{Command|module use $PROJECT/modules/*/Core}}
 
Si vous souhaitez que le module soit disponible chaque fois que vous vous connectez, vous pouvez ajouter la commande précédente à la fin de votre fichier <code>.bashrc</code>.
 
=== Autre version ===
 
Pour l'installation d'une version d'Anaconda différente, nous vous recommandons de contacter l'équipe de support par courriel à  [mailto:support@calculcanada.ca support@calculcanada.ca] .
 
== Utilisation ==
 
Charger le module Anaconda 2
{{Command|module load anaconda2}}
 
ou Anaconda 3
{{Command|module load anaconda3}}
 
=== conda ===
 
Vous pouvez installer des modules Python dans votre installation d'Anaconda en utilisant la commande conda directement. Par exemple, pour installer le module Theano
{{Command|conda install theano}}

Latest revision as of 16:08, 16 January 2024

Other languages:

Anaconda est une distribution de Python. Nous demandons à nos utilisateurs de ne pas installer Anaconda sur nos grappes. On vous recommande d'utiliser des autres pistes comme un environnement virtuel ou bien un conteneur Apptainer, pour les cas les plus compliqués.

N'installez pas Anaconda sur nos grappes[edit]

Nous sommes conscients qu'Anaconda est largement utilisé dans plusieurs domaines étudiés par nos utilisateurs (la science des données, l'IA, la bioinformatique, etc). Anaconda est une solution intéressante pour simplifier la gestion de Python et de librairies sur un ordinateur personnel. Cependant, sur une grappe comme celles maintenues par l'Alliance, la gestion des librairies doit être faite par notre personnel, afin d'assurer une compatibilité et une performance maximales. Voici une liste de raisons:

  • Anaconda installe très souvent des logiciels (compilateurs, bibliothèques scientifiques etc.) qui existent déjà sur les grappes de l'Alliance comme modules, avec une configuration qui n'est pas optimale.
  • installe des binaires qui ne sont pas optimisés pour les processeurs de nos grappes.
  • fait de mauvaises suppositions sur l'emplacement de bibliothèques.
  • s'installe dans le $HOME par défaut, où il place une énorme quantité de fichiers. L'installation d'Anaconda seule peut prendre près de la moitié de votre quota sur le nombre de fichiers dans votre espace personnel.
  • est plus lent pour installer des paquets
  • modifie $HOME/.bashrc, ce qui peut causer des conflits.

Comment transitionner de Conda vers virtualenv[edit]

Virtualenv vous offre toutes les fonctionnalités dont vous avez besoin pour utiliser Python sur nos grappes. Voici comment passer à virtualenv si vous utilisez Anaconda sur votre ordinateur personnel:

  1. Listez les dépendances (requis) de l'application que vous voulez utiliser. Afin de ce faire, vous pouver :
    1. Exécuter pip show <nom_paquet> depuis votre environement virtuel (si le paquet existe sur PyPI)
    2. Ou, vérifier s'il existe un fichier requirements.txt dans le dépôt Git.
    3. Ou, vérifier la variable install_requires du fichier setup.py qui énumère les requis.
  2. Trouvez quelles dépendances sont des paquets Python, et lesquelles sont des librairies fournies par Anaconda. Par exemple, CUDA et CuDNN sont des librairies disponible sur l'Anaconda Cloud, mais que vous ne devez pas installer vous-même sur nos grappes. Elles sont déjà installées.
  3. Retirez de la liste de dépendance tout ce qui n'est pas un paquet Python (par exemple, retirez cudatoolkit et cudnn).
  4. Utilisez un virtualenv, dans lequel vous installerez ces dépendances.

Votre application devrait fonctionner. Si ce n'est pas le cas, n'hésitez pas à contacter notre soutien technique.

Usage d'Apptainer[edit]

Dans certaines situations, la complexité des dépendances d'un logiciel exige une solution où l'on peut maîtriser entièrement l'environnement. Pour ces situations, on recommande l'outil Apptainer : notez qu'une image Docker peut être convertie en image Apptainer. Le seul inconvénient de Apptainer, c'est que les images consomment beaucoup d'espace disque, alors si votre groupe de recherche prévoit d'utiliser plusieurs images, il serait sage de les regrouper ensemble dans un seul répertoire de l'espace projet du groupe pour éviter les doublons.

Exemples spécifiques où Anaconda ne fonctionne pas[edit]

R
Une recette conda force l'installation de R. Cette installation ne performe pas aussi bien que le R disponible par les modules (qui lui utilise Intel MKL). Ce même R fonctionne mal et les tâches meurent, gaspillant ainsi des ressources et votre temps.