BUSCO/fr: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
(Created page with "====Sounmettre une tâche====")
No edit summary
 
(58 intermediate revisions by 2 users not shown)
Line 7: Line 7:
Pour plus d'information, consultez [https://busco.ezlab.org/busco_userguide.html le manuel de l'utilisateur].
Pour plus d'information, consultez [https://busco.ezlab.org/busco_userguide.html le manuel de l'utilisateur].


<div class="mw-translate-fuzzy">
== Versions disponibles ==
<b>2.</b> Copiez le fichier de paramètres.
Les versions récentes sont disponibles dans des <i>wheels</i> et les plus anciennes versions sont dans un module (voir la section [[BUSCO/fr#Modules|Modules]] ci-dessous).
{{Command|cp -v $EBROOTBUSCO/config/config.ini.default $HOME/busco_config.ini}}
ou
{{Command|wget -O $HOME/busco_config.ini https://gitlab.com/ezlab/busco/raw/master/config/config.ini.default}}
</div>


Pour connaître la dernière version disponible, lancez
Pour connaître la dernière version disponible, lancez
{{Command|avail_wheel busco}}
{{Command|avail_wheel busco}}


<div class="mw-translate-fuzzy">
== Wheel Python ==
<b>3.</b> Modifier le fichier de paramètres. Les chemins pour les outils externes sont situés à la fin de ce fichier; nous en reproduisons le contenu ici :
=== Installation ===
</div>
<b>1.</b> Chargez les modules requis.
{{Commands
|module load StdEnv/2020 gcc/9.3.0 python/3.10 augustus/3.5.0 hmmer/3.3.2 blast+/2.13.0 metaeuk/6 prodigal/2.6.3 r/4.3.1 bbmap/38.86}}


<div class="mw-translate-fuzzy">
<b>2.</b> Créez l'environnement virtuel.
<b>5.</b> Testez l'installation.
{{Commands
</div>
|virtualenv ~/busco_env
|source ~/busco_env/bin/activate
}}


'''3.''' Install the wheel and its dependencies:
<b>3.</b> Installez le wheel et ses dépendances.
{{Command
{{Command
|prompt=(busco_env) $
|prompt=(busco_env) $
|pip install biopython pandas busco --no-index
|pip install --no-index biopython{{=}}{{=}}1.81 pandas{{=}}{{=}}2.1.0 busco{{=}}{{=}}5.5.0
}}
}}


<div class="mw-translate-fuzzy">
<b>4.</b> Validez l'installation.
{{Commands
{{Command
|export BUSCO_CONFIG_FILE{{=}}$HOME/busco_config.ini
|prompt=(busco_env) $
|export AUGUSTUS_CONFIG_PATH{{=}}$HOME/augustus_config
|busco --help
|run_BUSCO.py --in $EBROOTBUSCO/sample_data/target.fa --out TEST --lineage_path $EBROOTBUSCO/sample_data/example --mode genome
}}
}}
</div>


<div class="mw-translate-fuzzy">
<b>5.</b> Gelez l’environnement et le fichier <i>requirements.txt</i> pour utiliser ce fichier, voir le script bash montré au point 8.
==== Test ====
 
<b>4.</b> Téléchargez les données de test:
{{Command
{{Commands
|prompt=(busco_env) $
|wget https://gitlab.com/ezlab/busco/-/raw/master/test_data/bacteria/genome.fna
|pip freeze > ~/busco-requirements.txt
|wget https://busco-data.ezlab.org/v5/data/lineages/bacteria_odb10.2020-03-06.tar.gz
}}
}}
</div>


<div class="mw-translate-fuzzy">
=== Utilisation ===
<b>5.</b> Lancez la commande
==== Ensembles de données ====
{{Command|busco --offline --in genome.fna --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK-1} }}
<b>6.</b> Avant de soumettre une tâche, les ensembles de données doivent être téléchargés de
</div>
[https://busco-data.ezlab.org/v5/data/ BUSCO data].


You can access the available datasets in your terminal by typing <code>busco --list-datasets</code>.
Pour connaître les ensembles de données disponibles, entrez <code>busco --list-datasets</code> dans votre terminal.


You have '''two''' options for datasets download:
Vous pouvez utiliser l'une des deux commandes suivantes :
*<code>busco</code>
*<code>wget</code>


===== Busco download command =====
===== <b>6.1</b>  Téléchargement avec la commande <code>busco</code> =====
'''6.1''' Use busco download command (preferred method). Here is one example:
Cette option est recommandée. Entrez la commande suivante dans votre répertoire de travail pour télécharger l’ensemble de données, par exemple
 
{{Command
Type this command in your working directory to download one particular dataset:
 
{{Commands
|busco --download bacteria_odb10
|busco --download bacteria_odb10
}}
}}


It is also possible to do a bulk download by using the following arguments in place of the dataset name: "all", "prokaryota", "eukaryota", or "virus".
Il est aussi possible de télécharger plusieurs ensembles de données en une opération en ajoutant les arguments <code>all</code>, <code>prokaryota</code>, <code>eukaryota</code> ou <code>virus</code>, par exemple


{{Commands
{{Commands
|busco --download virus
|busco --download virus
}}
}}
Ceci permet de
::1. créer une hiérarchie pour les ensembles de données,
::2. télécharger les ensembles de données appropriés,
::3. décompresser le ou les fichiers,
::4. si plusieurs fichiers sont téléchargés, ils seront automatiquement ajoutés au répertoire des lignées.


This will:
La hiérarchie sera semblable à
 
::1. Create Busco directory hierarchy for datasets.
::2. Download the appropriate datasets.
::3. Decompress the file(s).
::4. If you download multiple files, they will all be automatically added in the lineages directory.
 
Directories hierarchy will look as follows:
 
<blockquote>
<blockquote>
* busco_downloads/
* busco_downloads/
Line 101: Line 93:
</blockquote>
</blockquote>


Doing so, all your lineage files should be in '''busco_downloads/lineages/'''. When referring <code>--download_path busco_downloads/</code> in your busco command line, it will know where to find the lineage dataset argument <code>--lineage_dataset bacteria_odb10</code>. If the busco_download directory is not in your working directory, you would need to provide full path.
Tous les fichiers de lignées se trouveront alors dans <b>busco_downloads/lineages/</b>. La présence de <code>--download_path busco_downloads/</code> dans la ligne de commande BUSCO indiquera où trouver l’argument <code>--lineage_dataset bacteria_odb10</code> pour l'ensemble de données. Si <i>busco_download</i> n’est pas votre répertoire de travail, il faudra fournir le chemin complet.


=====Wget download command =====
=====<b>6.2</b> Téléchargement avec la commande <code>wget</code>  =====
'''6.2''' Use wget download command. Here is one example:


All files must be decompressed: <code>tar -xvf file.tar.gz</code>
Tous les fichiers doivent être décompressés avec <code>tar -xvf file.tar.gz</code>.
{{Commands
{{Commands
|mkdir -p busco_downloads/lineages
|mkdir -p busco_downloads/lineages
Line 114: Line 105:
}}
}}


<div class="mw-translate-fuzzy">
==== Test ====
<b>4.</b> Copiez le répertoire de configuration d’Augustus à un endroit accessible en écriture.
<b>7.</b> Téléchargement des fichiers de génome.
{{Command|cp -r $EBROOTAUGUSTUS/config $HOME/augustus_config}}
</div>


{{Commands
{{Commands
Line 123: Line 112:
}}
}}


<div class="mw-translate-fuzzy">
<b>8.</b> Exécution.
= Dépannage =
== Message ''Cannot write to Augustus config path'' ==
Vérifiez que le fichier de configuration se trouve à un endroit accessible en écriture et que la variable <code>AUGUSTUS_CONFIG_PATH</code> a bien été définie.
</div>


Command to run a single genome:
Pour un seul génome :


{{Command|busco --offline --in genome.fna --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/}}
{{Command|busco --offline --in genome.fna --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/}}


Command to run multiple genomes that would be saved in the '''genome/''' directory: (As describe here, genome folder would need to be in the current directory or you would need to provide the full path).
Pour plusieurs génomes, le répertoire genome/ doit se trouver dans le répertoire courant, autrement il faut donner le chemin complet&nbsp;:


{{Command|busco --offline --in genome/ --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/}}
{{Command|busco --offline --in genome/ --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/}}


<div class="mw-translate-fuzzy">
La commande pour un seul génome devrait être exécutée sous les 60 secondes. Les tâches de production qui nécessitent plus de temps doivent être [[Running jobs/fr|soumises à l'ordonnanceur]].
Cette commande devrait prendre moins de 60 secondes. Les tâches dont la production est plus longue doivent être [[Running jobs/fr|soumises à l'ordonnanceur]].
</div>


<div class="mw-translate-fuzzy">
===== Conseils pour BUSCO =====
== Versions disponibles ==
Les versions récentes sont disponibles dans des <i>wheels</i> et la plus ancienne version dans un module (voir la section Modules ci-dessous).
</div>


Specify <tt>--in genome.fna</tt> for single file analysis,
Utilisez <code>--in genome.fna</code> pour analyser un seul fichier.


Specify <tt>--in genome/</tt> for multiple files analysis.
Utilisez <code>--in genome/</code> pour analyser plusieurs fichiers.


<div class="mw-translate-fuzzy">
===== Conseils pour Slurm  =====
La version 3.0.2 est un module sur cvmfs et accessible sur toutes les grappes; les renseignements sur comment l'utiliser sont montrés ci-dessous. Il est possible d'installer localement les [https://gitlab.com/ezlab/busco versions plus récentes] en utilisant un [[Python/fr#Cr.C3.A9er_et_utiliser_un_environnement_virtuel|environnement virtuel]] comme suit :
Utilisez <code>--offline</code> pour éviter l'utilisation de l’internet.
</div>


{{Commands|
Utilisez <code>--cpu</code> avec <code>$SLURM_CPUS_PER_TASK</code> dans le script de la tâche pour utiliser le nombre alloué de CPU.
~ $ module load python/3.7.4
~ $ git clone https://gitlab.com/ezlab/busco.git
~ $ virtualenv /home/$USER/busco_env
~ $ source /home/$USER/busco_env/bin/activate
(busco_env) [~]$ pip install Biopython
(busco_env) [~]$ cd ~/busco
(busco_env) [~]$ python setup.py install
(busco_env) [~]$ cp -r scripts test_data /home/$USER/busco_env/
}}


et ajoutez ''home/$USER/busco_env/scripts'' au chemin.
Utilisez <code>--restart</code> pour reprendre une tâche interrompue.


====Sounmettre une tâche====
====Soumettre une tâche====


Here you have an example of a submission script. You can submit as so: <code>sbatch run_busco.sh</code>.
Vous pouvez soumettre le script suivant avec <code>sbatch run_busco.sh</code>.


{{File
{{File
Line 186: Line 156:


# Load modules dependencies.
# Load modules dependencies.
module load StdEnv/2020 gcc python augustus hmmer blast+ metaeuk prodigal r bbmap
module load StdEnv/2020 gcc/9.3.0 python/3.10 augustus/3.5.0 hmmer/3.3.2 blast+/2.13.0 metaeuk/6 prodigal/2.6.3 r/4.3.1 bbmap/38.86


# Generate your virtual environment in $SLURM_TMPDIR.
# Generate your virtual environment in $SLURM_TMPDIR.
Line 201: Line 171:
}}
}}


====Augustus parameters====
====Paramètres Augustus ====
'''9.''' For advanced users who want to use Augustus parameters: <code>--augustus_parameters="--yourAugustusParameter".</code>
<b>9.</b> Si vous avez plus d'expérience, vous pouvez utiliser les paramètres Argutus : <code>--augustus_parameters="--yourAugustusParameter"</code>.


Copy the Augustus config directory to a writable location:
*Copiez le répertoire <i>config</i> d'Augustus à un endroit où la lecture est possible.
{{Command|cp -r $EBROOTAUGUSTUS/config $HOME/augustus_config}}
{{Command|cp -r $EBROOTAUGUSTUS/config $HOME/augustus_config}}


Make sure to define the <code>AUGUSTUS_CONFIG_PATH</code> environment variable:
*Assurez-vous de définir la variable d'environnement  <code>AUGUSTUS_CONFIG_PATH</code>.
{{Command|export AUGUSTUS_CONFIG_PATH{{=}}$HOME/augustus_config}}
{{Command|export AUGUSTUS_CONFIG_PATH{{=}}$HOME/augustus_config}}


====SEPP parameters====
====Paramètres SEPP ====
'''10.''' To use SEPP parameters, you need to install SEPP locally in your virtual environment. This should be done in a login node.
<b>10.</b> Pour utiliser ces paramètres, SEPP doit être installé localement dans votre environnement virtuel, ce que vous devez faire à partir du nœud de connexion.


'''10.1.''' Activate your BUSCO virtual environment:
<b>10.1.</b> Activez votre environnement virtuel BUSCO.
{{Commands
{{Commands
|source busco_env/bin/activate
|source busco_env/bin/activate
}}
}}


'''10.2.''' Install dendropy:
<b>10.2.</b> Installez DendroPy.
{{Commands
{{Commands
|pip install 'dendropy<4.6'
|pip install 'dendropy<4.6'
}}
}}


'''10.3.''' Install SEPP:
<b>10.3.</b> Installez SEPP.
{{Commands
{{Commands
|git clone https://github.com/smirarab/sepp.git
|git clone https://github.com/smirarab/sepp.git
Line 231: Line 201:
}}
}}


'''10.4.''' Validate the installation:
<b>10.4.</b> Validez l'installation.
{{Commands
{{Commands
|cd
|cd
Line 237: Line 207:
}}
}}


'''10.5.''' When using SEPP, because it is installed locally you cannot create the virtual environment as we have described in previous submission script demo. You simply need to add this command which activates your local virtual environment just after the loading module command line:
<b>10.5.</b> Puisque SEPP est installé localement, vous ne pouvez pas utiliser le script ci-dessus pour créer votre environnement virtuel. Pour activer votre environnement virtuel, ajoutez la commande suivante sur la ligne qui suit la commande de chargement du module.
{{Commands
{{Commands
|source ~/busco_env/bin/activate
|source ~/busco_env/bin/activate
}}
}}


== Modules ==  
== Modules ==  


{{Warning
{{Warning
|title=Deprecation
|title=Cette section est obsolète.
|content=This section is outdated. We are currently working on updating it.
|content=Veuillez utiliser les wheels qui sont disponibles.
}}
}}


<b>1.</b> Chargez les modules nécessaires.
<b>1.</b> Chargez les modules nécessaires.
{{Command|module load StdEnv/2018.3 gcc/7.3.0 openmpi/3.1.4 busco/3.0.2 r/4.0.2}}
{{Command|module load StdEnv/2018.3 gcc/7.3.0 openmpi/3.1.4 busco/3.0.2 r/4.0.2}}
Ceci charge aussi les modules pour <code>augustus, blast+, hmmer</code> et d'autres paquets requis par BUSCO.
Ceci charge aussi les modules pour Augustus, BLAST+, HMMER et d'autres paquets requis par BUSCO.


<div class="mw-translate-fuzzy">
<b>2.</b> Copiez le fichier de configuration
La commande <code>run_BUSCO.py</code> devrait prendre moins de 60 secondes. Les tâches dont la production est plus longue doivent être  [[Running jobs/fr|soumises à l'ordonnanceur]].
{{Command|cp -v $EBROOTBUSCO/config/config.ini.default $HOME/busco_config.ini}}
</div>
ou
{{Command|wget -O $HOME/busco_config.ini https://gitlab.com/ezlab/busco/raw/master/config/config.ini.default}}


<div class="mw-translate-fuzzy">
<b>3.</b> Modifiez le fichier de configuration. Les endroits où se trouvent les outils externes sont définis dans la dernière section.
Pour plus d’information, consultez le [https://busco.ezlab.org/busco_userguide.html manuel d'utilisation].
</div>
{{File
{{File
   |name=partial_busco_config.ini
   |name=partial_busco_config.ini
Line 299: Line 266:
}}
}}


<div class="mw-translate-fuzzy">
<b>4.</b>  Copiez le répertoire <code>config</code> d’Augustus à un endroit où la lecture est possible.
Pour connaître la plus récente version, lancez
{{Command|cp -r $EBROOTAUGUSTUS/config $HOME/augustus_config}}
{{Command|avail_wheel busco}}
 
== Wheels Python ==
<b>5.</b> Vérifiez si tout fonctionne bien.
=== Installation ===
<b>1.</b> Chargez les modules nécessaires.
{{Commands
|module load StdEnv/2020 gcc python/3.10
|module load python augustus hmmer blast+ metaeuk prodigal r}}
</div>


<div class="mw-translate-fuzzy">
<b>2.</b> Créez l'environnement virtuel.
{{Commands
{{Commands
|virtualenv busco_env
|export BUSCO_CONFIG_FILE{{=}}$HOME/busco_config.ini
|source busco_env/bin/activate
|export AUGUSTUS_CONFIG_PATH{{=}}$HOME/augustus_config
|run_BUSCO.py --in $EBROOTBUSCO/sample_data/target.fa --out TEST --lineage_path $EBROOTBUSCO/sample_data/example --mode genome
}}
}}
</div>


<div class="mw-translate-fuzzy">
La commande <code>run_BUSCO.py</code> devrait être exécutée sous les 60 secondes. Les tâches de production qui nécessitent plus de temps doivent être [[Running jobs/fr|soumises à l'ordonnanceur]].
<b>3.</b> Installez le wheel et ses dépendances.
{{Command
|prompt=(busco_env) $
|pip install biopython pandas busco --no-index
}}
</div>


<div class="mw-translate-fuzzy">
= Dépannage =
=== Utilisation ===
== Erreur : <i>Cannot write to Augustus config path</i> ==
==== Ensembles de données ====
Assurez-vous d’avoir copié le répertoire <i>config</i> d’Augustus à un endroit où la lecture est possible et d’avoir exporté la variable <code>AUGUSTUS_CONFIG_PATH</code>.
Avant de soumettre votre tâche, chargez les ensembles de données à partir de [https://busco-data.ezlab.org/v5/data/ Index of /v5/data/].
</div>
 
<div class="mw-translate-fuzzy">
=== Options pour votre script ===
Spécifiez <code>--offline</code> pour ne pas utiliser l'internet.
</div>

Latest revision as of 15:37, 5 May 2024

Other languages:


BUSCO (pour Benchmarking Universal Single-Copy Orthologs) est une application qui permet d'évaluer la complétude de l'assemblage et de l'annotation de génomes.

Pour plus d'information, consultez le manuel de l'utilisateur.

Versions disponibles

Les versions récentes sont disponibles dans des wheels et les plus anciennes versions sont dans un module (voir la section Modules ci-dessous).

Pour connaître la dernière version disponible, lancez

Question.png
[name@server ~]$ avail_wheel busco

Wheel Python

Installation

1. Chargez les modules requis.

[name@server ~]$ module load StdEnv/2020 gcc/9.3.0 python/3.10 augustus/3.5.0 hmmer/3.3.2 blast+/2.13.0 metaeuk/6 prodigal/2.6.3 r/4.3.1 bbmap/38.86


2. Créez l'environnement virtuel.

[name@server ~]$ virtualenv ~/busco_env
[name@server ~]$ source ~/busco_env/bin/activate


3. Installez le wheel et ses dépendances.

Question.png
(busco_env) $ pip install --no-index biopython==1.81 pandas==2.1.0 busco==5.5.0

4. Validez l'installation.

Question.png
(busco_env) $ busco --help

5. Gelez l’environnement et le fichier requirements.txt pour utiliser ce fichier, voir le script bash montré au point 8.

Question.png
(busco_env) $ pip freeze > ~/busco-requirements.txt

Utilisation

Ensembles de données

6. Avant de soumettre une tâche, les ensembles de données doivent être téléchargés de BUSCO data.

Pour connaître les ensembles de données disponibles, entrez busco --list-datasets dans votre terminal.

Vous pouvez utiliser l'une des deux commandes suivantes :

  • busco
  • wget
6.1 Téléchargement avec la commande busco

Cette option est recommandée. Entrez la commande suivante dans votre répertoire de travail pour télécharger l’ensemble de données, par exemple

Question.png
[name@server ~]$ busco --download bacteria_odb10

Il est aussi possible de télécharger plusieurs ensembles de données en une opération en ajoutant les arguments all, prokaryota, eukaryota ou virus, par exemple

[name@server ~]$ busco --download virus

Ceci permet de

1. créer une hiérarchie pour les ensembles de données,
2. télécharger les ensembles de données appropriés,
3. décompresser le ou les fichiers,
4. si plusieurs fichiers sont téléchargés, ils seront automatiquement ajoutés au répertoire des lignées.

La hiérarchie sera semblable à

  • busco_downloads/
  • information/
lineages_list.2021-12-14.txt
  • lineages/
bacteria_odb10
actinobacteria_class_odb10
actinobacteria_phylum_odb10
  • placement_files/
list_of_reference_markers.archaea_odb10.2019-12-16.txt

Tous les fichiers de lignées se trouveront alors dans busco_downloads/lineages/. La présence de --download_path busco_downloads/ dans la ligne de commande BUSCO indiquera où trouver l’argument --lineage_dataset bacteria_odb10 pour l'ensemble de données. Si busco_download n’est pas votre répertoire de travail, il faudra fournir le chemin complet.

6.2 Téléchargement avec la commande wget

Tous les fichiers doivent être décompressés avec tar -xvf file.tar.gz.

[name@server ~]$ mkdir -p busco_downloads/lineages
[name@server ~]$ cd busco_downloads/lineages
[name@server ~]$ wget https://busco-data.ezlab.org/v5/data/lineages/bacteria_odb10.2020-03-06.tar.gz
[name@server ~]$ tar -xvf bacteria_odb10.2020-03-06.tar.gz


Test

7. Téléchargement des fichiers de génome.

[name@server ~]$ wget https://gitlab.com/ezlab/busco/-/raw/master/test_data/bacteria/genome.fna


8. Exécution.

Pour un seul génome :

Question.png
[name@server ~]$ busco --offline --in genome.fna --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/

Pour plusieurs génomes, le répertoire genome/ doit se trouver dans le répertoire courant, autrement il faut donner le chemin complet :

Question.png
[name@server ~]$ busco --offline --in genome/ --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/

La commande pour un seul génome devrait être exécutée sous les 60 secondes. Les tâches de production qui nécessitent plus de temps doivent être soumises à l'ordonnanceur.

Conseils pour BUSCO

Utilisez --in genome.fna pour analyser un seul fichier.

Utilisez --in genome/ pour analyser plusieurs fichiers.

Conseils pour Slurm

Utilisez --offline pour éviter l'utilisation de l’internet.

Utilisez --cpu avec $SLURM_CPUS_PER_TASK dans le script de la tâche pour utiliser le nombre alloué de CPU.

Utilisez --restart pour reprendre une tâche interrompue.

Soumettre une tâche

Vous pouvez soumettre le script suivant avec sbatch run_busco.sh.


File : run_busco.sh

#!/bin/bash

#SBATCH --job-name=busco9_run
#SBATCH --account=def-someprof    # adjust this to match the accounting group you are using to submit jobs
#SBATCH --time=01:00:00           # adjust this to match the walltime of your job
#SBATCH --cpus-per-task=8         # adjust depending on the size of the genome(s)/protein(s)/transcriptome(s)
#SBATCH --mem=20G                 # adjust this according to the memory you need

# Load modules dependencies.
module load StdEnv/2020 gcc/9.3.0 python/3.10 augustus/3.5.0 hmmer/3.3.2 blast+/2.13.0 metaeuk/6 prodigal/2.6.3 r/4.3.1 bbmap/38.86

# Generate your virtual environment in $SLURM_TMPDIR.
virtualenv --no-download ${SLURM_TMPDIR}/env
source ${SLURM_TMPDIR}/env/bin/activate

# Install busco and its dependencies.
pip install --no-index --upgrade pip
pip install --no-index --requirement ~/busco-requirements.txt

# Edit with the proper arguments, run your commands.
busco --offline --in genome.fna --out TEST --lineage_dataset bacteria_odb10 --mode genome --cpu ${SLURM_CPUS_PER_TASK:-1} --download_path busco_download/


Paramètres Augustus

9. Si vous avez plus d'expérience, vous pouvez utiliser les paramètres Argutus : --augustus_parameters="--yourAugustusParameter".

  • Copiez le répertoire config d'Augustus à un endroit où la lecture est possible.
Question.png
[name@server ~]$ cp -r $EBROOTAUGUSTUS/config $HOME/augustus_config
  • Assurez-vous de définir la variable d'environnement AUGUSTUS_CONFIG_PATH.
Question.png
[name@server ~]$ export AUGUSTUS_CONFIG_PATH=$HOME/augustus_config

Paramètres SEPP

10. Pour utiliser ces paramètres, SEPP doit être installé localement dans votre environnement virtuel, ce que vous devez faire à partir du nœud de connexion.

10.1. Activez votre environnement virtuel BUSCO.

[name@server ~]$ source busco_env/bin/activate


10.2. Installez DendroPy.

[name@server ~]$ pip install 'dendropy<4.6'


10.3. Installez SEPP.

[name@server ~]$ git clone https://github.com/smirarab/sepp.git
[name@server ~]$ cd sepp
[name@server ~]$ python setup.py config
[name@server ~]$ python setup.py install


10.4. Validez l'installation.

[name@server ~]$ cd
[name@server ~]$ run_sepp.py -h


10.5. Puisque SEPP est installé localement, vous ne pouvez pas utiliser le script ci-dessus pour créer votre environnement virtuel. Pour activer votre environnement virtuel, ajoutez la commande suivante sur la ligne qui suit la commande de chargement du module.

[name@server ~]$ source ~/busco_env/bin/activate


Modules

Cette section est obsolète.

Veuillez utiliser les wheels qui sont disponibles.



1. Chargez les modules nécessaires.

Question.png
[name@server ~]$ module load StdEnv/2018.3 gcc/7.3.0 openmpi/3.1.4 busco/3.0.2 r/4.0.2

Ceci charge aussi les modules pour Augustus, BLAST+, HMMER et d'autres paquets requis par BUSCO.

2. Copiez le fichier de configuration

Question.png
[name@server ~]$ cp -v $EBROOTBUSCO/config/config.ini.default $HOME/busco_config.ini

ou

Question.png
[name@server ~]$ wget -O $HOME/busco_config.ini https://gitlab.com/ezlab/busco/raw/master/config/config.ini.default

3. Modifiez le fichier de configuration. Les endroits où se trouvent les outils externes sont définis dans la dernière section.

File : partial_busco_config.ini

[tblastn]
# path to tblastn
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/blast+/2.7.1/bin/

[makeblastdb]
# path to makeblastdb
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/blast+/2.7.1/bin/

[augustus]
# path to augustus
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/augustus/3.3/bin/

[etraining]
# path to augustus etraining
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/augustus/3.3/bin/

# path to augustus perl scripts, redeclare it for each new script
[gff2gbSmallDNA.pl]
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/augustus/3.3/scripts/
[new_species.pl]
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/augustus/3.3/scripts/
[optimize_augustus.pl]
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/augustus/3.3/scripts/

[hmmsearch]
# path to HMMsearch executable
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/hmmer/3.1b2/bin/

[Rscript]
# path to Rscript, if you wish to use the plot tool
path = /cvmfs/soft.computecanada.ca/easybuild/software/2017/avx512/Compiler/gcc7.3/r/4.0.2/bin/


4. Copiez le répertoire config d’Augustus à un endroit où la lecture est possible.

Question.png
[name@server ~]$ cp -r $EBROOTAUGUSTUS/config $HOME/augustus_config

5. Vérifiez si tout fonctionne bien.

[name@server ~]$ export BUSCO_CONFIG_FILE=$HOME/busco_config.ini
[name@server ~]$ export AUGUSTUS_CONFIG_PATH=$HOME/augustus_config
[name@server ~]$ run_BUSCO.py --in $EBROOTBUSCO/sample_data/target.fa --out TEST --lineage_path $EBROOTBUSCO/sample_data/example --mode genome


La commande run_BUSCO.py devrait être exécutée sous les 60 secondes. Les tâches de production qui nécessitent plus de temps doivent être soumises à l'ordonnanceur.

Dépannage

Erreur : Cannot write to Augustus config path

Assurez-vous d’avoir copié le répertoire config d’Augustus à un endroit où la lecture est possible et d’avoir exporté la variable AUGUSTUS_CONFIG_PATH.