Galaxy/fr: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
(Created page with "=== Structure du répertoire ===")
No edit summary
 
(47 intermediate revisions by 3 users not shown)
Line 6: Line 6:
Galaxy est une plateforme web ''open source'' pour la recherche biomédicale traitant de grandes quantités de données. La plateforme rend la biologie computationnelle plus accessible, sans exiger une grande expérience en programmation ou en administration de systèmes. Conçue au départ pour la recherche en génomique, Galaxy s’adapte aujourd'hui à la plupart des domaines et sert de système de gestion du flux de travail en bio-informatique.
Galaxy est une plateforme web ''open source'' pour la recherche biomédicale traitant de grandes quantités de données. La plateforme rend la biologie computationnelle plus accessible, sans exiger une grande expérience en programmation ou en administration de systèmes. Conçue au départ pour la recherche en génomique, Galaxy s’adapte aujourd'hui à la plupart des domaines et sert de système de gestion du flux de travail en bio-informatique.


Pour un aperçu des applications, voyez [https://galaxyproject.org/learn/ cette liste de tutoriels].
[https://training.galaxyproject.org/ Cette liste de tutoriels] montre les diverses applications de Galaxy.


== Disponible sur Cedar seulement==
== Disponible sur Cedar seulement==
Line 14: Line 14:
=== Structure du répertoire ===
=== Structure du répertoire ===


Galaxy is usually installed on the project directory of the group and it contains several sub-directories. The name of the Galaxy top directory is determined by taking the first two character of PI username + "glxy". For example if PI username is "davidc" the Galaxy top directory will be "daglxy" and it is located in <code>/project/group name/</code> where <code>group name</code> is the default group name of PI, eg., <code>def-davidc</code>. Galaxy main directory contains the following sub-directories which is slightly different than the original Galaxy package.
L’installation se fait habituellement dans le répertoire /project du groupe de recherche. Le nom du répertoire source est formé par les deux premiers caractères du nom de la chercheuse ou du chercheur principal (CP), auxquels est ajouté ''glxy''. Par exemple, pour le CP ''davidc'', le nom du répertoire source sera ''daglxy''; le répertoire sera localisé dans <tt>/project/group name/</tt> où ''group name'' est le nom du groupe par défaut pour ce CP (<tt>def-davidc</tt>). Le répertoire principal pour Galaxy contient un ensemble de sous-répertoires qui est quelque peu différent du paquet Galaxy original, soit :


* '''config''': contains all required configuration files to set up and optimize the Galaxy server. Below we explain some basic concepts of some of the configuration files that need to be set up in order to be compatible with our HPC environment, however, we will not cover all concepts.   
* '''config''' : contient tous les fichiers de configuration pour préparer et optimiser le serveur Galaxy. Dans cette page, nous présenterons seulement les principes de base pour notre environnement de calcul haute performance.   
* '''galaxy''': contains the core Galaxy package which is written mostly in Python.  
* '''galaxy''' : contient le paquet de base, écrit principalement en Python.  
* '''logs''': contains two files, <code>galaxy.log</code> and <code>server.log</code>.  All messages during startup or shutdown of the server are written in <code>server.log</code> while all messages during the run are written in <code>galaxy.log</code>.
* '''logs''' : contient le fichier <tt>galaxy.log</tt> qui enregistre les messages générés à l’exécution et le fichier <tt>server.log</tt> qui enregistre les messages générés au démarrage et à l’arrêt du serveur.  
* '''plugins''': contains all plugins. In the original Galaxy package, this directory is located in the <code>galaxy</code> directory.  
* '''plugins''' : contient les extensions; dans le paquet Galaxy original, ce répertoire se trouve dans le répertoire <tt>galaxy</tt>.
* '''tmp''': contains all temporary files that Galaxy needs for compiling and installing toolsheds.  
* '''tmp''' : contient les fichiers temporaires pour la compilation et l’installation des outils (Galaxy ToolShed).
* '''venv''': a Python virtual environment directory that contains all Python package dependencies.
* '''venv''' : répertoire de l’environnement virtuel Python qui contient les dépendances pour les paquets Python.
* '''tool-data''': contains data used by tools. See the samples in [https://galaxyproject.org/admin/data-integration data-integration].
* '''tool-data''' : contient les données utilisées par les outils; voir les exemples dans[https://galaxyproject.org/admin/data-integration Data Integration for Local Instances].
* '''tool-dependencies''': contains all packages needed for toolsheds. By default, packages in this directory are installed using Anaconda.  
* '''tool-dependencies''' : contient tous les paquets nécessaires aux outils ToolShed; ces paquets sont installés avec Anaconda.  
* '''database''': contains input, output, and error files of all jobs that run on cluster nodes.
* '''database''' : contient les fichiers d’erreurs et les fichiers d’entrée et de sortie pour les tâches exécutées sur les nœuds des grappes.


=== Galaxy files ownership and modification ===
=== Propriété et modification des fichiers ===


All files of your Galaxy instance belong to a "pseudo-account", a shared account that is generated by an administrator at installation time. A pseudo-account does not belong to an individual person, but belongs to a specific group. Everyone in the group can log in to the pseudo-account using [https://docs.computecanada.ca/wiki/Using_SSH_keys_in_Linux SSH keys]. The name of the pseudo-account in this case is the same name as the top Galaxy directory explained above, eg., <code>daglxy</code>. In order to modify any file of your Galaxy instance, e.g. configuration files, you first need to log in to the pseudo-account. Before you can log in you must generate an SSH key pair, store your public key somewhere in your <code>home</code> directory, and let the administrator know about that. The administrator will store your public key in an appropriate place, after which you can log in to your pseudo-account.
Les fichiers d’une instance Galaxy appartiennent à un ''pseudo-compte'', qui est un compte partagé créé à l’installation par un administrateur. Un tel compte n’est la propriété individuelle de personne, mais appartient plutôt à un groupe particulier. Les personnes faisant partie du groupe peuvent se connecter au compte via les [[SSH Keys/fr |clés SSH]]. Le nom du pseudo-compte est le même que celui du répertoire source; dans le cas de l’exemple utilisé ci-dessus, ce nom serait ''daglxy''. Pour pouvoir modifier les fichiers de l’instance, par exemple les fichiers de configuration, vous devez vous connecter au pseudo-compte. Pour ce faire, il faut d’abord générer une paire de clés SSH, enregistrer votre clé publique dans votre répertoire /home et en informer l’administrateur qui placera votre clé publique au bon endroit.


=== Galaxy server management ===
=== Gestion du serveur Galaxy ===


Starting Galaxy server is the first thing that needs to be done by users. Galaxy server should NOT be run on cedar login node or any compute node. We have a dedicated server called  "gateway" and it is used for this purpose. It contains a web server with relevant Cedar filesystems, <code>/project</code> and <code>/home</code> directories mounted on it. Users cannot make a SSH connection to this machine due to security reasons, however we have designed a web site on this machine that allows users to start/stop  their own galaxy server. The website also allows users to user Galaxy web interface to communicate with the server. To do that please go to the website [https://gateway.cedar.computecanada.ca/ https://gateway.cedar.computecanada.ca/] and click on Galaxy link. You will be asked to enter your username and password. Your username and password is the same as your computecanada one. Once you authenticate then you will be automatically redirect to your galaxy server manager website where you can manage your server or use Galaxy web interface.
La première chose à faire est de démarrer le serveur Galaxy. Ce serveur ne doit pas être utilisé sur un nœud de calcul, ni un nœud de connexion de Cedar, mais plutôt sur un serveur dédié appelé «&nbsp;passerelle&nbsp;» (''gateway''). La passerelle contient un serveur web avec les répertoires /project et /home ainsi que les systèmes de fichiers particuliers à Cedar. Il n'est pas possible de s'y connecter par SSH pour des raisons de sécurité, mais le serveur Galaxy peut être démarré et arrêté via un site web que nous avons conçu. Par ce site, vous pouvez aussi accéder à l’interface web du serveur Galaxy.


=== Galaxy configuration ===
Dans https://gateway.cedar.computecanada.ca/, cliquez sur le bouton'' Galaxy'' et entrez les identifiants pour votre compte Calcul Canada. Après l’authentification, le site web de votre gestionnaire de serveur Galaxy sera affiché et vous pourrez utiliser les fonctions de gestion du serveur ou l’interface web Galaxy.


Files in the <code>config</code> directory are used to configure your Galaxy server. Configuring and optimizing Galaxy is tricky and explaining all the configuration files is beyond the scope of this article. If you want more information about this we recommend you read documentation on the [https://docs.galaxyproject.org/en/master/admin/config.html Galaxy website].  We list below some basic variables that are set for you by the administrator.  We strongly recommend you do not change them.
=== Configuration du serveur Galaxy ===


* In file <code>galaxy.yml</code> (the main configuration file):
La configuration du serveur se fait avec les fichiers du répertoire <tt>config</tt>. Nous n’expliquons pas ici en détail comment configurer et optimiser Galaxy. Nous vous invitons plutôt à consulter [https://docs.galaxyproject.org/en/master/admin/config.html | le site web de Galaxy].<br>
** <code>http:</code> contains your unique port number
À l’installation, les variables de base sont paramétrées par l’administrateur dans le fichier de configuration <tt>galaxy.yml</tt>. Vous pouvez modifier les autres fichiers et variables de ce fichier, mais nous recommandons fortement de ne pas modifier les variables de base suivantes&nbsp;:
** <code>database_connection</code> is the name of your Galaxy database and your database server.
** <code>virtualenv</code> is the path to a [[Python#Creating_and_using_a_virtual_environment|Python virtual environment]] in the gateway machine
** <code>file_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir</code> are appropriate paths for tools, tool sheds and dependencies.




* <code>http:</code>, votre numéro de port unique;
* <code>database_connection</code>, noms de votre base de données et de votre serveur de base de données;
* <code>virtualenv</code>, chemin vers un [[Python/fr#Créer_et_utiliser_un_environnement_virtuel|environnement virtuel Python]]  situé sur la passerelle;
** <code>file_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir</code>, chemins vers les outils, les ToolSheds et les dépendances.
<!--T:16-->
Other variables and files in this directory can be changed by the user.
Other variables and files in this directory can be changed by the user.
=== Utiliser les outils ===


=== Running Tools ===
La plateforme Galaxy est configurée pour soumettre des tâches à la grappe Cedar selon les variables définies dans le fichier <tt>job_conf.xml</tt>. Vous devrez peut-être modifier certains paramètres selon les outils que vous utilisez. Assurez-vous de bien comprendre le rôle des variables; par exemple, certains outils ont besoin de plus de mémoire ou de plus de temps d’exécution. Pour chaque outil que vous utilisez, faites des tests pour identifier les valeurs optimales.  
 
There are basically two ways one can run tools in a Galaxy instance.  One can run them "locally", which in this case means running on the gateway machine, or one can run them by [[Running jobs|submitting jobs]] to the cluster.
 
Please DO NOT run tools locally at Cedar, because the gateway machine has little memory and cannot run jobs efficiently. Galaxy is configured to submit jobs to the cluster using the file <code>job_conf.xml</code>. Some variables in this file are already set by the administrator for submitting jobs. However, you may need to optimize the entries in this file depending on the tools you will use. Please first examine the file to understand these variables and the way they are used. For example, some tools require more memory or more walltime. Please perform some tests to find out optimized job specification values for every tool you would like to run.
 
== GenAP ==


Comme la passerelle a peu de mémoire et ne traite pas les tâches de manière efficace, nous vous demandons de ne pas utiliser les outils Galaxy localement. Soumettez plutôt vos tâches à Cedar.


The [https://www.genap.ca/ Genetics and Genomics Analysis Platform] (GenAP) is a computing infrastructure and software environment for life science researchers offering services since 2015. GenAP aims at facilitating the work of researchers and students by offering out of the box Web applications running on an infrastructure that currently leverages Compute Canada Cloud and HPC resources.
== Galaxy sur GenAP ==


Any Compute Canada user can [https://www.genap.ca/p/help/introduction request an account on GenAP] free of charges. Non-Computer Canada users can be [https://www.genap.ca/static/subsections/help/tutorials/GenAP_Online_Tutorials__Accounts_and_Authentication.pdf invited] if they have a CC sponsor.


La plateforme [https://www.genap.ca/ GenAP (Genetics and Genomics Analysis Platform)] est une infrastructure de calcul et un environnement logiciel pour la recherche en sciences de la vie. Depuis 2015, elle offre des applications web faciles à utiliser mettant à profit les ressources infonuagiques et les ressources de calcul haute performance de l'Alliance.


== Galaxy on GenAP ==
Les personnes qui détiennent un compte avec l'Alliance peuvent  [https://www.genap.ca/p/help/introduction demander un compte GenAP] sans frais. Les autres chercheuses ou chercheurs parrainés peuvent [https://www.genap.ca/static/subsections/help/tutorials/GenAP_Online_Tutorials__Accounts_and_Authentication.pdf être invités] par la chercheuse principale ou le chercheur principal qui les parraine.
GenAP offers the ability to use your own privately accessed Galaxy instance, loaded with 700+ preinstalled tools. The GenAP-Galaxy is fully integrated with the GenAP infrastructure, allowing users to leverage storage and compute resources from Compute Canada as well as interact with other GenAP applications.  


===  Tools ===
GenAP offre la possibilité d’utiliser votre propre instance Galaxy avec plus de 700 outils préinstallés. GenAP-Galaxy est parfaitement intégrée avec l’infrastructure GenAP et permet de bien utiliser nos ressources de calcul et de stockage, en plus d’interagir avec certaines autres applications GenAP.  
GenAP-Galaxy comes with more than 700 pre-installed tools and reference Genomes. There is no need for user configuration or installation.


The GenAP team has also developed some Single-Cell tools that are integrated with GenAP visualization tools.
===Outils===
Il n’est pas nécessaire de configurer ou installer GenAP-Galaxy qui fournit des génomes de référence et plus de 700 outils préinstallés.


GenAP has also close ties with the main Galaxy community and updates of reference genomes and index files are synchronized with the main usegalaxy.org.
L’équipe GenAP a aussi développé des outils pour cellules uniques qui sont intégrés avec les outils de visualisation GenAP.


GenAP-Galaxy tries to keep its tool set as close as possible to the main Galaxy (usegalaxy.org).  
La communauté de la recherche Galaxy participe activement à la synchronisation des génomes de référence et des fichiers d’index de GenAP avec le site principal usegalaxy.org.


In some cases we can add new tools on request, however, this decision is made on a per case basis.  
Les outils de GenAP-Galaxy sont le plus près possible de ceux de la plateforme Galaxy principale (usegalaxy.org).  


For safety reasons users are not allowed to install tools.
Pour des raisons de sécurité, l’installation des outils se fait par notre équipe technique.  


===  Running tools ===
L’ajout de nouveaux outils se fait au cas par cas, après analyse.


There is no need for any configuration on GenAP-Galaxy. All tools, index files and reference genomes come pre-installed.
=== Utiliser les outils ===


The jobs are submitted to a cluster using slurm (no configuration needed). Jobs are submitted with default parameters ( 10GB RAM, 24hrs,  2 CPUs ).  
Il n’est pas nécessaire de configurer GenAP-Galaxy puisque tous les outils, les fichiers d’index et les génomes de référence sont préinstallés.


Through the '''Job Resources Parameters''' menu users can modify the default walltime, number of processors and RAM of a job. This is specially useful for large jobs (such as genome assembly), where the default may not be enough.
Les tâches sont soumises à nos grappes via Slurm (aucune configuration requise) avec les paramètres par défaut, soit mémoire vive de 10Go, durée de 24 heures et deux CPU.  


Toutefois, pour des tâches intensives comme l’assemblage, ces paramètres peuvent être modifiés dans le menu ''Job Resources Parameters'' si les valeurs par défaut ne sont pas suffisantes.




=== Galaxy documentation ===
GenAP has a vast [https://www.genap.ca/p/help/galaxy-in-genap documentation] on data analysis ( +50 tutorials ) and also [https://www.genap.ca/p/help/galaxy-in-genap how to get started] with Galaxy on GenAP.


===Documentation===
La [https://www.genap.ca/p/help/galaxy-in-genap documentation de GenAP] présente plus de 50 tutoriels et une introduction à Galaxy sur GenAP.


== GenAP or Cedar, where to analyze my data ? ==
==Où analyser les données==


This table is to help new user to choose where to run their data. Each of these two Galaxies have specific features that may be more suitable for some research groups.
Pour vous aider à décider où analyser vos données, voyez cette comparaison entre GenAP et Cedar.


{| class="wikitable"
{| class="wikitable"
|-
|-
! Feature !! GenAP !! Cedar
!  !! GenAP !! Cedar
|-
|-
| Server || Arbutus || Cedar
| Serveur || Arbutus || Cedar
|-
|-
| Galaxy configuration || None || High (done by user)
| Configuration de Galaxy|| aucune|| groupe de recherche
|-
|-
| Required knowledge of Linux || None || High
| Expérience avec Linux || aucune|| beaucoup
|-
|-
| Management/Updates || GenAP team || User
| Gestion et mises à jour ||équipe  GenAP || groupe de recherche
|-
|-
| Configuration || None || User
| Configuration du serveur|| aucune|| groupe de recherche
|-
|-
| Pre-installed tools || Yes || Yes (subset)
| Outils préinstallés || tous || sous-ensemble
|-
|-
| Irida integration || No || Yes
| Intégration avec Irida || oui || non
|-
|-
| Reference Genome || Yes (through CVMFS) || Managed by user
| Génomes de référence || oui (via CVMFS) || non (groupe de recherche)
|-
|-
| Quota || 1.5 TB (default) || storage RAC
| Quota || 1.5 To par défaut|| espace de stockage alloué via les concours d’allocation des ressources
|}
|}

Latest revision as of 20:56, 4 November 2024

Other languages:


Introduction

Galaxy est une plateforme web open source pour la recherche biomédicale traitant de grandes quantités de données. La plateforme rend la biologie computationnelle plus accessible, sans exiger une grande expérience en programmation ou en administration de systèmes. Conçue au départ pour la recherche en génomique, Galaxy s’adapte aujourd'hui à la plupart des domaines et sert de système de gestion du flux de travail en bio-informatique.

Cette liste de tutoriels montre les diverses applications de Galaxy.

Disponible sur Cedar seulement

Chaque groupe de recherche peut obtenir une instance Galaxy sur la grappe Cedar. Puisque l’installation demande une configuration particulière, contactez notre équipe technique.

Structure du répertoire

L’installation se fait habituellement dans le répertoire /project du groupe de recherche. Le nom du répertoire source est formé par les deux premiers caractères du nom de la chercheuse ou du chercheur principal (CP), auxquels est ajouté glxy. Par exemple, pour le CP davidc, le nom du répertoire source sera daglxy; le répertoire sera localisé dans /project/group name/group name est le nom du groupe par défaut pour ce CP (def-davidc). Le répertoire principal pour Galaxy contient un ensemble de sous-répertoires qui est quelque peu différent du paquet Galaxy original, soit :

  • config : contient tous les fichiers de configuration pour préparer et optimiser le serveur Galaxy. Dans cette page, nous présenterons seulement les principes de base pour notre environnement de calcul haute performance.
  • galaxy : contient le paquet de base, écrit principalement en Python.
  • logs : contient le fichier galaxy.log qui enregistre les messages générés à l’exécution et le fichier server.log qui enregistre les messages générés au démarrage et à l’arrêt du serveur.
  • plugins : contient les extensions; dans le paquet Galaxy original, ce répertoire se trouve dans le répertoire galaxy.
  • tmp : contient les fichiers temporaires pour la compilation et l’installation des outils (Galaxy ToolShed).
  • venv : répertoire de l’environnement virtuel Python qui contient les dépendances pour les paquets Python.
  • tool-data : contient les données utilisées par les outils; voir les exemples dansData Integration for Local Instances.
  • tool-dependencies : contient tous les paquets nécessaires aux outils ToolShed; ces paquets sont installés avec Anaconda.
  • database : contient les fichiers d’erreurs et les fichiers d’entrée et de sortie pour les tâches exécutées sur les nœuds des grappes.

Propriété et modification des fichiers

Les fichiers d’une instance Galaxy appartiennent à un pseudo-compte, qui est un compte partagé créé à l’installation par un administrateur. Un tel compte n’est la propriété individuelle de personne, mais appartient plutôt à un groupe particulier. Les personnes faisant partie du groupe peuvent se connecter au compte via les clés SSH. Le nom du pseudo-compte est le même que celui du répertoire source; dans le cas de l’exemple utilisé ci-dessus, ce nom serait daglxy. Pour pouvoir modifier les fichiers de l’instance, par exemple les fichiers de configuration, vous devez vous connecter au pseudo-compte. Pour ce faire, il faut d’abord générer une paire de clés SSH, enregistrer votre clé publique dans votre répertoire /home et en informer l’administrateur qui placera votre clé publique au bon endroit.

Gestion du serveur Galaxy

La première chose à faire est de démarrer le serveur Galaxy. Ce serveur ne doit pas être utilisé sur un nœud de calcul, ni un nœud de connexion de Cedar, mais plutôt sur un serveur dédié appelé « passerelle » (gateway). La passerelle contient un serveur web avec les répertoires /project et /home ainsi que les systèmes de fichiers particuliers à Cedar. Il n'est pas possible de s'y connecter par SSH pour des raisons de sécurité, mais le serveur Galaxy peut être démarré et arrêté via un site web que nous avons conçu. Par ce site, vous pouvez aussi accéder à l’interface web du serveur Galaxy.

Dans https://gateway.cedar.computecanada.ca/, cliquez sur le bouton Galaxy et entrez les identifiants pour votre compte Calcul Canada. Après l’authentification, le site web de votre gestionnaire de serveur Galaxy sera affiché et vous pourrez utiliser les fonctions de gestion du serveur ou l’interface web Galaxy.

Configuration du serveur Galaxy

La configuration du serveur se fait avec les fichiers du répertoire config. Nous n’expliquons pas ici en détail comment configurer et optimiser Galaxy. Nous vous invitons plutôt à consulter | le site web de Galaxy.
À l’installation, les variables de base sont paramétrées par l’administrateur dans le fichier de configuration galaxy.yml. Vous pouvez modifier les autres fichiers et variables de ce fichier, mais nous recommandons fortement de ne pas modifier les variables de base suivantes :


  • http:, votre numéro de port unique;
  • database_connection, noms de votre base de données et de votre serveur de base de données;
  • virtualenv, chemin vers un environnement virtuel Python situé sur la passerelle;
    • file_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir, chemins vers les outils, les ToolSheds et les dépendances.

Other variables and files in this directory can be changed by the user.

Utiliser les outils

La plateforme Galaxy est configurée pour soumettre des tâches à la grappe Cedar selon les variables définies dans le fichier job_conf.xml. Vous devrez peut-être modifier certains paramètres selon les outils que vous utilisez. Assurez-vous de bien comprendre le rôle des variables; par exemple, certains outils ont besoin de plus de mémoire ou de plus de temps d’exécution. Pour chaque outil que vous utilisez, faites des tests pour identifier les valeurs optimales.

Comme la passerelle a peu de mémoire et ne traite pas les tâches de manière efficace, nous vous demandons de ne pas utiliser les outils Galaxy localement. Soumettez plutôt vos tâches à Cedar.

Galaxy sur GenAP

La plateforme GenAP (Genetics and Genomics Analysis Platform) est une infrastructure de calcul et un environnement logiciel pour la recherche en sciences de la vie. Depuis 2015, elle offre des applications web faciles à utiliser mettant à profit les ressources infonuagiques et les ressources de calcul haute performance de l'Alliance.

Les personnes qui détiennent un compte avec l'Alliance peuvent demander un compte GenAP sans frais. Les autres chercheuses ou chercheurs parrainés peuvent être invités par la chercheuse principale ou le chercheur principal qui les parraine.

GenAP offre la possibilité d’utiliser votre propre instance Galaxy avec plus de 700 outils préinstallés. GenAP-Galaxy est parfaitement intégrée avec l’infrastructure GenAP et permet de bien utiliser nos ressources de calcul et de stockage, en plus d’interagir avec certaines autres applications GenAP.

Outils

Il n’est pas nécessaire de configurer ou installer GenAP-Galaxy qui fournit des génomes de référence et plus de 700 outils préinstallés.

L’équipe GenAP a aussi développé des outils pour cellules uniques qui sont intégrés avec les outils de visualisation GenAP.

La communauté de la recherche Galaxy participe activement à la synchronisation des génomes de référence et des fichiers d’index de GenAP avec le site principal usegalaxy.org.

Les outils de GenAP-Galaxy sont le plus près possible de ceux de la plateforme Galaxy principale (usegalaxy.org).

Pour des raisons de sécurité, l’installation des outils se fait par notre équipe technique.

L’ajout de nouveaux outils se fait au cas par cas, après analyse.

Utiliser les outils

Il n’est pas nécessaire de configurer GenAP-Galaxy puisque tous les outils, les fichiers d’index et les génomes de référence sont préinstallés.

Les tâches sont soumises à nos grappes via Slurm (aucune configuration requise) avec les paramètres par défaut, soit mémoire vive de 10Go, durée de 24 heures et deux CPU.

Toutefois, pour des tâches intensives comme l’assemblage, ces paramètres peuvent être modifiés dans le menu Job Resources Parameters si les valeurs par défaut ne sont pas suffisantes.


Documentation

La documentation de GenAP présente plus de 50 tutoriels et une introduction à Galaxy sur GenAP.

Où analyser les données

Pour vous aider à décider où analyser vos données, voyez cette comparaison entre GenAP et Cedar.

GenAP Cedar
Serveur Arbutus Cedar
Configuration de Galaxy aucune groupe de recherche
Expérience avec Linux aucune beaucoup
Gestion et mises à jour équipe GenAP groupe de recherche
Configuration du serveur aucune groupe de recherche
Outils préinstallés tous sous-ensemble
Intégration avec Irida oui non
Génomes de référence oui (via CVMFS) non (groupe de recherche)
Quota 1.5 To par défaut espace de stockage alloué via les concours d’allocation des ressources