Galaxy/fr: Difference between revisions
No edit summary |
No edit summary |
||
Line 48: | Line 48: | ||
Chaque groupe de recherche peut obtenir une instance Galaxy sur la grappe Cedar. Puisque l’installation demande une configuration particulière, [[Technical support/fr | contactez notre équipe technique]]. | Chaque groupe de recherche peut obtenir une instance Galaxy sur la grappe Cedar. Puisque l’installation demande une configuration particulière, [[Technical support/fr | contactez notre équipe technique]]. | ||
=== Structure du répertoire === | |||
L’installation se fait habituellement dans le répertoire /project du groupe de recherche. Le nom du répertoire le plus haut est formé par les deux premiers caractères du nom de la chercheuse ou du chercheur principal (CP), auxquels est ajouté ''glxy''. Par exemple, pour le CP ''davidc'', le nom du répertoire source sera ''daglxy''; le répertoire sera localisé dans <tt>/project/group name/</tt> où ''group name'' est le nom du groupe par défaut pour ce CP (<tt>def-davidc</tt>). Le répertoire principal pour Galaxy contient un ensemble de sous-répertoires qui est quelque peu différent du paquet Galaxy original, soit%nbsp;: | L’installation se fait habituellement dans le répertoire /project du groupe de recherche. Le nom du répertoire le plus haut est formé par les deux premiers caractères du nom de la chercheuse ou du chercheur principal (CP), auxquels est ajouté ''glxy''. Par exemple, pour le CP ''davidc'', le nom du répertoire source sera ''daglxy''; le répertoire sera localisé dans <tt>/project/group name/</tt> où ''group name'' est le nom du groupe par défaut pour ce CP (<tt>def-davidc</tt>). Le répertoire principal pour Galaxy contient un ensemble de sous-répertoires qui est quelque peu différent du paquet Galaxy original, soit%nbsp;: | ||
Line 96: | Line 92: | ||
** By default, jobs are submitted to the Cedar cluster. | ** By default, jobs are submitted to the Cedar cluster. | ||
* Avoid running locally: | |||
** Running jobs on the gateway machine is not recommended due to limited memory and inefficiency. | |||
L’équipe GenAP a aussi développé des outils pour cellules uniques qui sont intégrés avec les outils de visualisation GenAP. | L’équipe GenAP a aussi développé des outils pour cellules uniques qui sont intégrés avec les outils de visualisation GenAP. | ||
La communauté de la recherche Galaxy participe activement à la synchronisation des génomes de référence et des fichiers d’index de GenAP avec le site principal usegalaxy.org. | La communauté de la recherche Galaxy participe activement à la synchronisation des génomes de référence et des fichiers d’index de GenAP avec le site principal usegalaxy.org. |
Revision as of 20:55, 4 December 2024
Introduction
Galaxy est une plateforme web open source pour la recherche biomédicale traitant de grandes quantités de données. La plateforme rend la biologie computationnelle plus accessible, sans exiger une grande expérience en programmation ou en administration de systèmes. Conçue au départ pour la recherche en génomique, Galaxy s’adapte aujourd'hui à la plupart des domaines et sert de système de gestion du flux de travail en bio-informatique. Cette liste de tutoriels présente une bonne vue d’ensemble des possibilités qu’offre Galaxy.
Vous avez deux options pour utiliser Galaxy :
- accéder directement à UseGalaxy Canada,
- demander une instance de Galaxy sur Cedar.
Tableau comparatif des options
UseGalaxy Canada | Instance de Galaxy sur Cedar | |
---|---|---|
Serveur | nuages Béluga et Arbutus | Cedar |
Configuration | aucune configuration nécessaire | vous-même |
Connaissance préalable de Linux | aucune connaissance préalable | connaissance avancée |
Gestion/Mises à jour | notre équipe UseGalaxy Canada | vous-même |
Configuration du serveur | aucune | vous-même |
Outils préinstallés | synchronisés avec UseGalaxy.eu | outils par défaut (sous-ensemble) |
Intégration avec Irida | non | oui |
Génomes de référence | contenus dans CVMFS | gérés par vous-même |
Quota | 500GB par utilisateur | espace de stockage alloué par concours |
La plateforme UseGalaxy est fortement recommandée pour le traitement de gros fichiers ou pour des tâches qui nécessitent plusieurs CPU ou GPU.
Accéder directement à UseGalaxy Canada
Pour accéder à UseGalaxy Canada, simplement suivre le lien https://starthere.usegalaxy.ca, puis cliquer sur le bouton de connexion via CILogon et sélectionner votre établissement pour vous authentifier. La plateforme détecte si vous êtes un utilisateur canadien et vous octroie automatiquement une allocation par défaut de 500GB de stockage.
Le site https://starthere.usegalaxy.ca fournit toute l’information nécessaire concernant UseGalaxy.ca et Galaxy en général, de même qu’un formulaire si vous avez besoin d’assistance, voulez rapporter un problème, ou encore faire installer de nouveaux outils ou bases de données.
Demander une instance de Galaxy sur Cedar
Chaque groupe de recherche peut obtenir une instance Galaxy sur la grappe Cedar. Puisque l’installation demande une configuration particulière, contactez notre équipe technique.
Structure du répertoire
L’installation se fait habituellement dans le répertoire /project du groupe de recherche. Le nom du répertoire le plus haut est formé par les deux premiers caractères du nom de la chercheuse ou du chercheur principal (CP), auxquels est ajouté glxy. Par exemple, pour le CP davidc, le nom du répertoire source sera daglxy; le répertoire sera localisé dans /project/group name/ où group name est le nom du groupe par défaut pour ce CP (def-davidc). Le répertoire principal pour Galaxy contient un ensemble de sous-répertoires qui est quelque peu différent du paquet Galaxy original, soit%nbsp;:
- config : contient tous les fichiers de configuration pour préparer et optimiser le serveur Galaxy. Dans cette page, nous présenterons seulement les principes de base pour notre environnement de calcul haute performance,
- galaxy.log : ce fichier contient tous les messages générés à l'ouverture et à la fermeture du serveur,
- server.log : ce fichier contient tous les messages générés pendant l'exécution.
Propriété et modification des fichiers
* file_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir
, chemins vers les outils, les ToolSheds et les dépendances.
Gestion du serveur Galaxy
Il y a deux manières d'utiliser les outils dans une instance de Galaxy :
- localement, sur la passerelle où le serveur de Galaxy est installé,
- en soumettant une tâche sur Cedar.
Configuration du serveur Galaxy
La configuration du serveur se fait avec les fichiers du répertoire config. Nous n’expliquons pas ici en détail comment configurer et optimiser Galaxy. Nous vous invitons plutôt à consulter | le site web de Galaxy.
À l’installation, les variables de base sont paramétrées par l’administrateur dans le fichier de configuration galaxy.yml. Vous pouvez modifier les autres fichiers et variables de ce fichier, mais nous recommandons fortement de ne pas modifier les variables de base suivantes :
- In file
galaxy.yml
(the main configuration file):http:
contains your unique port numberdatabase_connection
is the name of your Galaxy database and your database server.virtualenv
is the path to a Python virtual environment in the gateway machinefile_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir
are appropriate paths for tools, tool sheds and dependencies.
Other variables and files in this directory can be changed by the user.
Utiliser les outils
Documentation
La documentation de GenAP présente plus de 50 tutoriels et une introduction à Galaxy sur GenAP.
Où analyser les données
- Default configuration:
- Galaxy uses
job_conf.xml
to define how and where jobs are executed. - By default, jobs are submitted to the Cedar cluster.
- Galaxy uses
- Avoid running locally:
- Running jobs on the gateway machine is not recommended due to limited memory and inefficiency.
L’équipe GenAP a aussi développé des outils pour cellules uniques qui sont intégrés avec les outils de visualisation GenAP.
La communauté de la recherche Galaxy participe activement à la synchronisation des génomes de référence et des fichiers d’index de GenAP avec le site principal usegalaxy.org.