QIIME

From Alliance Doc
Revision as of 17:59, 7 February 2022 by FuzzyBot (talk | contribs) (Updating to match new version of source page)
Jump to navigation Jump to search
Other languages:

QIIME (pour Quantitative Insights Into Microbial Ecology) est un pipeline bio-informatique open source pour l’analyse de microbiomes. À partir de données brutes de séquençage d’ADN générées par des plateformes comme Illumina, QIIME produit des graphiques et statistiques de haute qualité pour, entre autres, le démultiplexage, le filtrage de qualité, la sélection d’OTU, l’attribution taxonomique, la reconstruction phylogénétique et l’analyse de la diversité.

NOTE : Le 1er janvier 2018, QIIME 2 a remplacé QIIME 1 qui est depuis obsolète.

Note : Depuis février 2020, il n'est pas possible d'installer QIIME avec Anaconda ou Miniconda en raison de plusieurs problèmes dus aux environnements Conda.

Installation

L’installation peut se faire en utilisant Singularity ou EasyBuild. Il est préférable d'utiliser Singularity pour éviter que plusieurs milliers de fichiers soient générés dans votre répertoire home, ce qui risquerait de dépasser le quota sur le nombre de fichiers.

Utilisation avec Singularity

Les développeurs de QIIME2 publient des images sur DockerHub. Pour utiliser ces images avec les ressources de Calcul Canada, il faut d'abord créer une image Singularity comme suit :

[name@server ~]$ module load singularity
[name@server ~]$ singularity build qiime2-2019.10.sif docker://qiime2/core:2019.10


[name@server ~]$ module load singularity
[name@server ~]$ singularity build qiime2-2019.10.sif docker://qiime2/core:2019.10
[name@server ~]$ module load singularity
[name@server ~]$ singularity build qiime2-2021.11.sif docker://quay.io/qiime2/core:2021.11


Cette étape du build pourrait prendre plus d'une heure, mais il ne faut l'effectuer qu'une seule fois. Sauvegardez le fichier image (dans notre exemple qiime2-2019.10.sif) pour pouvoir le réutiliser plus tard.

Exécutez ensuite votre programme comme décrit dans la page Singularity. De façon générale, chaque commande QIIME est exécutée dans un énoncé singularity exec comme suit :


[name@server ~]$ singularity exec qiime2-2019.10.sif <your QIIME command>


Votre script SBATCH ressemblerait à

#!/bin/bash
#SBATCH --time=15:00:00
#SBATCH --account=def-someuser

singularity exec -B $PWD:/home -B /scratch/someuser:/outputs \
  -B /projects/someuser/path/to/inputs:/inputs qiime2-2019.10.sif \
  qiime tools import --type 'FeatureData[Sequence]' \
  --input-path /inputs/some_fastafile.fa \
  --output-path /outputs/some_output_feature.qza

singularity exec -B $PWD:/home -B /scratch/someuser:/outputs \
  -B /projects/someuser/path/to/inputs:/inputs qiime2-2019.10.sif \
  qiime tools import \
  --type 'FeatureData[Taxonomy]' \
  --input-format HeaderlessTSVTaxonomyFormat \
  --input-path /inputs/some_taxonomy_file.tax \
  --output-path /outputs/some_output_ref-taxonomy.qza

singularity exec -B $PWD:/home -B /scratch/someuser:/outputs \
  -B /projects/someuser/path/to/inputs:/inputs qiime2-2019.10.sif \
  qiime feature-classifier fit-classifier-naive-bayes \
  --i-reference-reads  /outputs/some_output_feature.qza \
  --i-reference-taxonomy /outputs/some_output_ref-taxonomy.qza \
  --o-classifier /outputs/some_output_classifier.qza

Notez qu'il est important d'utiliser l'option bind (-B) avec chacun des répertoires avec lesquels vous voulez travailler quand des programmes sont exécutés dans votre conteneur. Pour plus d'information, voyez le webinaire Singularity.

La première fois que des données sont importées en format QIIME, vous pourriez recevoir un message semblable à

Timezone offset does not match system offset: 0 != -18000. Please, check your config files.

Vous pouvez contourner ceci en définissant un fuseau horaire avant d'invoquer Singularity, comme suit :

[name@server ~]$ export TZ='UTC'
[name@server ~]$ singularity exec qiime2-2019.10.sif qiime tools import ...


Références

Site web QIIME