QIIME
QIIME (pour Quantitative Insights Into Microbial Ecology) est un pipeline bio-informatique open source pour l’analyse de microbiomes. À partir de données brutes de séquençage d’ADN générées par des plateformes comme Illumina, QIIME produit des graphiques et statistiques de haute qualité pour, entre autres, le démultiplexage, le filtrage de qualité, la sélection d’OTU, l’attribution taxonomique, la reconstruction phylogénétique et l’analyse de la diversité.
NOTE : Le 1er janvier 2018, QIIME 2 a remplacé QIIME 1 qui est depuis obsolète.
Note : Depuis février 2020, il n'est pas possible d'installer QIIME avec Anaconda ou Miniconda en raison de plusieurs problèmes dus aux environnements Conda.
Installation
L’installation peut se faire en utilisant Singularity ou EasyBuild. Il est préférable d'utiliser Singularity pour éviter que plusieurs milliers de fichiers soient générés dans votre répertoire home, ce qui risquerait de dépasser le quota sur le nombre de fichiers.
Utilisation avec Singularity
Les développeurs de QIIME2 publient des images sur DockerHub. Pour utiliser ces images avec les ressources de Calcul Canada, il faut d'abord créer une image Singularity comme suit :
[name@server ~]$ module load singularity
[name@server ~]$ singularity build qiime2-2019.10.sif docker://qiime2/core:2019.10
Cette étape du build pourrait prendre plus d'une heure, mais il ne faut l'effectuer qu'une seule fois. Sauvegardez le fichier image (dans notre exemple qiime2-2019.10.sif
) pour pouvoir le réutiliser plus tard.
Exécutez ensuite votre programme comme décrit dans la page Singularity. De façon générale, chaque commande QIIME est exécutée dans un énoncé singularity exec
comme suit :
[name@server ~]$ singularity exec qiime2-2019.10.sif <your QIIME command>
Votre script SBATCH ressemblerait à
#!/bin/bash #SBATCH --time=15:00:00 #SBATCH --account=def-someuser singularity exec -B $PWD:/home -B /scratch/someuser:/outputs \ -B /projects/someuser/path/to/inputs:/inputs qiime2-2019.10.sif \ qiime tools import --type 'FeatureData[Sequence]' \ --input-path /inputs/some_fastafile.fa \ --output-path /outputs/some_output_feature.qza singularity exec -B $PWD:/home -B /scratch/someuser:/outputs \ -B /projects/someuser/path/to/inputs:/inputs qiime2-2019.10.sif \ qiime tools import \ --type 'FeatureData[Taxonomy]' \ --input-format HeaderlessTSVTaxonomyFormat \ --input-path /inputs/some_taxonomy_file.tax \ --output-path /outputs/some_output_ref-taxonomy.qza singularity exec -B $PWD:/home -B /scratch/someuser:/outputs \ -B /projects/someuser/path/to/inputs:/inputs qiime2-2019.10.sif \ qiime feature-classifier fit-classifier-naive-bayes \ --i-reference-reads /outputs/some_output_feature.qza \ --i-reference-taxonomy /outputs/some_output_ref-taxonomy.qza \ --o-classifier /outputs/some_output_classifier.qza
Notez qu'il est important d'utiliser l'option bind (-B) avec chacun des répertoires avec lesquels vous voulez travailler quand des programmes sont exécutés dans votre conteneur. Pour plus d'information, voyez le webinaire Singularity.
La première fois que des données sont importées en format QIIME, vous pourriez recevoir un message semblable à
Timezone offset does not match system offset: 0 != -18000. Please, check your config files.
Vous pouvez contourner ceci en définissant un fuseau horaire avant d'invoquer Singularity, comme suit :
[name@server ~]$ export TZ='UTC'
[name@server ~]$ singularity exec qiime2-2019.10.sif qiime tools import ...
Utilisation avec un wheel EasyBuild
Si la solution avec Singularity ne convient pas à vos besoins, Calcul Canada fournit un paquet EasyBuild que vous pouvez utiliser avec la commande eb
. Pour installer la version 2019.7, lancez
[name@server ~]$ eb --rebuild Miniconda3-4.7.10.eb QIIME2-2019.7.eb
Le temps d’attente sera long, mais vous pourrez ensuite charger le module qiime/2019.7 avec
[name@server ~]$ module load qiime2/2019.7
Parce que ceci crée tous les paquets requis par QIIME, beaucoup de fichiers seront générés dans votre répertoire home
. Comme ceci utilisera presque la moitié de l'espace total qui vous est alloué, nous vous recommandons de supprimer ces fichiers une fois que vos calculs seront terminés. Pour sa part, la solution avec Singularity ne crée qu'un seul gros fichier plutôt que des milliers de petits fichiers et c'est pourquoi elle est recommandée.