Galaxy/fr: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
FuzzyBot (talk | contribs)
Updating to match new version of source page
Tag: Reverted
Diane27 (talk | contribs)
No edit summary
Tag: Manual revert
Line 35: Line 35:
|}
|}


<div class="mw-translate-fuzzy">
La plateforme UseGalaxy est fortement recommandée pour le traitement de gros fichiers ou pour des tâches qui nécessitent plusieurs CPU ou GPU.
La plateforme UseGalaxy est fortement recommandée pour le traitement de gros fichiers ou pour des tâches qui nécessitent plusieurs CPU ou GPU.
</div>


== Accéder directement à UseGalaxy Canada ==
== Accéder directement à UseGalaxy Canada ==

Revision as of 20:09, 5 December 2024


Introduction

Galaxy est une plateforme web open source pour la recherche biomédicale traitant de grandes quantités de données. La plateforme rend la biologie computationnelle plus accessible, sans exiger une grande expérience en programmation ou en administration de systèmes. Conçue au départ pour la recherche en génomique, Galaxy s’adapte aujourd'hui à la plupart des domaines et sert de système de gestion du flux de travail en bio-informatique. Cette liste de tutoriels présente une bonne vue d’ensemble des possibilités qu’offre Galaxy.

Vous avez deux options pour utiliser Galaxy :

  • accéder directement à UseGalaxy Canada,
  • demander une instance de Galaxy sur Cedar.

Tableau comparatif des options

UseGalaxy Canada Instance de Galaxy sur Cedar
Serveur nuages Béluga et Arbutus Cedar
Configuration aucune configuration nécessaire vous-même
Connaissance préalable de Linux aucune connaissance préalable connaissance avancée
Gestion/Mises à jour notre équipe UseGalaxy Canada vous-même
Configuration du serveur aucune vous-même
Outils préinstallés synchronisés avec UseGalaxy.eu outils par défaut (sous-ensemble)
Intégration avec Irida non oui
Génomes de référence contenus dans CVMFS gérés par vous-même
Quota 500GB par utilisateur espace de stockage alloué par concours

La plateforme UseGalaxy est fortement recommandée pour le traitement de gros fichiers ou pour des tâches qui nécessitent plusieurs CPU ou GPU.

Accéder directement à UseGalaxy Canada

Pour accéder à UseGalaxy Canada, simplement suivre le lien https://starthere.usegalaxy.ca, puis cliquer sur le bouton de connexion via CILogon et sélectionner votre établissement pour vous authentifier. La plateforme détecte si vous êtes un utilisateur canadien et vous octroie automatiquement une allocation par défaut de 500GB de stockage.

Le site https://starthere.usegalaxy.ca fournit toute l’information nécessaire concernant UseGalaxy.ca et Galaxy en général, de même qu’un formulaire si vous avez besoin d’assistance, voulez rapporter un problème, ou encore faire installer de nouveaux outils ou bases de données.


Demander une instance de Galaxy sur Cedar

Chaque groupe de recherche peut obtenir une instance Galaxy sur la grappe Cedar. Puisque l’installation demande une configuration particulière, contactez notre équipe technique.

Structure du répertoire

L’installation se fait habituellement dans le répertoire /project du groupe de recherche. Le nom du répertoire le plus haut est formé par les deux premiers caractères du nom de la chercheuse ou du chercheur principal (CP), auxquels est ajouté glxy. Par exemple, pour le CP davidc, le nom du répertoire source sera daglxy; le répertoire sera localisé dans /project/group name/group name est le nom du groupe par défaut pour ce CP (def-davidc). Le répertoire principal pour Galaxy contient un ensemble de sous-répertoires qui est quelque peu différent du paquet Galaxy original, soit%nbsp;:

  • config : contient tous les fichiers de configuration pour préparer et optimiser le serveur Galaxy. Dans cette page, nous présenterons seulement les principes de base pour notre environnement de calcul haute performance,
  • galaxy.log : ce fichier contient tous les messages générés à l'ouverture et à la fermeture du serveur,
  • server.log : ce fichier contient tous les messages générés pendant l'exécution.

Propriété et modification des fichiers

* file_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir, chemins vers les outils, les ToolSheds et les dépendances.

Gestion du serveur Galaxy

Il y a deux manières d'utiliser les outils dans une instance de Galaxy :

  • localement, sur la passerelle où le serveur de Galaxy est installé,
  • en soumettant une tâche sur Cedar.

Configuration du serveur Galaxy

La configuration du serveur se fait avec les fichiers du répertoire config. Nous n’expliquons pas ici en détail comment configurer et optimiser Galaxy. Nous vous invitons plutôt à consulter | le site web de Galaxy.
À l’installation, les variables de base sont paramétrées par l’administrateur dans le fichier de configuration galaxy.yml. Vous pouvez modifier les autres fichiers et variables de ce fichier, mais nous recommandons fortement de ne pas modifier les variables de base suivantes :

  • In file galaxy.yml (the main configuration file):
    • http: contains your unique port number
    • database_connection is the name of your Galaxy database and your database server.
    • virtualenv is the path to a Python virtual environment in the gateway machine
    • file_path, new_file_path, tool_config_file, shed_tool_config_file, tool_dependency_dir, tool_data_path, visualization_plugins_directory, job_working_directory, cluster_files_directory, template_cache_path, citation_cache_data_dir, citation_cache_lock_dir are appropriate paths for tools, tool sheds and dependencies.

Other variables and files in this directory can be changed by the user.

Utiliser les outils

Documentation

La documentation de GenAP présente plus de 50 tutoriels et une introduction à Galaxy sur GenAP.

Où analyser les données

  • Default configuration:
    • Galaxy uses job_conf.xml to define how and where jobs are executed.
    • By default, jobs are submitted to the Cedar cluster.
  • Avoid running locally:
    • Running jobs on the gateway machine is not recommended due to limited memory and inefficiency.

L’équipe GenAP a aussi développé des outils pour cellules uniques qui sont intégrés avec les outils de visualisation GenAP.

La communauté de la recherche Galaxy participe activement à la synchronisation des génomes de référence et des fichiers d’index de GenAP avec le site principal usegalaxy.org.