QIIME
QIIME (pour Quantitative Insights Into Microbial Ecology) est un pipeline bio-informatique open source pour l’analyse de microbiomes. À partir de données brutes de séquençage d’ADN générées par des plateformes comme Illumina, QIIME produit des graphiques et statistiques de haute qualité pour, entre autres, le démultiplexage, le filtrage de qualité, la sélection d’OTU, l’attribution taxonomique, la reconstruction phylogénétique et l’analyse de la diversité.
NOTE : Le 1er janvier 2018, QIIME 2 a remplacé QIIME 1 qui est depuis obsolète.
Note : Depuis février 2020, il n'est pas possible d'installer QIIME avec Anaconda ou Miniconda en raison de plusieurs problèmes dus aux environnements Conda.
Installation
L’installation peut se faire en utilisant Apptainer ou EasyBuild. Il est préférable d'utiliser Apptainer pour éviter que plusieurs milliers de fichiers soient générés dans votre répertoire home, ce qui risquerait de dépasser le quota sur le nombre de fichiers.
Utilisation avec Apptainer
Les développeurs de QIIME2 publient des images sur Quay.io. Pour utiliser ces images avec nos ressources, il faut d'abord créer une image Apptainer comme suit :
[name@server ~]$ module load apptainer
[name@server ~]$ apptainer build qiime2-2021.11.sif docker://quay.io/qiime2/core:2021.11
Cette étape du build pourrait prendre plus d'une heure, mais il ne faut l'effectuer qu'une seule fois. Sauvegardez le fichier image (dans notre exemple qiime2-2021.11.sif
) pour pouvoir le réutiliser plus tard.
Exécutez ensuite votre programme comme décrit dans la page Apptainer. De façon générale, chaque commande QIIME est exécutée dans un énoncé apptainer exec
comme suit :
[name@server ~]$ apptainer exec qiime2-2021.11.sif <your QIIME command>
Votre script SBATCH ressemblerait à
#!/bin/bash #SBATCH --time=15:00:00 #SBATCH --account=def-someuser apptainer exec -B $PWD:/home -B /scratch/someuser:/outputs \ -B /projects/def-somePI/someuser/path/to/inputs:/inputs qiime2-2021.11.sif \ qiime tools import --type 'FeatureData[Sequence]' \ --input-path /inputs/some_fastafile.fa \ --output-path /outputs/some_output_feature.qza apptainer exec -B $PWD:/home -B /scratch/someuser:/outputs \ -B /projects/def-somePI/someuser/path/to/inputs:/inputs qiime2-2021.11.sif \ qiime tools import \ --type 'FeatureData[Taxonomy]' \ --input-format HeaderlessTSVTaxonomyFormat \ --input-path /inputs/some_taxonomy_file.tax \ --output-path /outputs/some_output_ref-taxonomy.qza apptainer exec -B $PWD:/home -B /scratch/someuser:/outputs \ -B /projects/def-somePI/someuser/path/to/inputs:/inputs qiime2-2021.11.sif \ qiime feature-classifier fit-classifier-naive-bayes \ --i-reference-reads /outputs/some_output_feature.qza \ --i-reference-taxonomy /outputs/some_output_ref-taxonomy.qza \ --o-classifier /outputs/some_output_classifier.qza
Notez qu'il est important d'utiliser l'option bind (-B
) avec chacun des répertoires avec lesquels vous voulez travailler quand des programmes sont exécutés dans votre conteneur. Pour plus d'information, voyez le webinaire Apptainer.
La première fois que des données sont importées en format QIIME, vous pourriez recevoir un message semblable à
Timezone offset does not match system offset: 0 != -18000. Please, check your config files.
Vous pouvez contourner ceci en définissant un fuseau horaire avant d'invoquer Singularity, comme suit :
[name@server ~]$ export TZ='UTC'
[name@server ~]$ apptainer exec qiime2-2021.11.sif qiime tools import ...