Parasail/fr: Difference between revisions
(Updating to match new version of source page) |
No edit summary |
||
(6 intermediate revisions by 2 users not shown) | |||
Line 3: | Line 3: | ||
[https://github.com/jeffdaily/parasail parasail] est une bibliothèque SIMD C (C99) qui contient des implémentations d'algorithmes d'alignement de séquences par paires Smith-Waterman (alignement local), Needleman-Wunsch (alignement global) et autres alignements semi-globaux. | [https://github.com/jeffdaily/parasail parasail] est une bibliothèque SIMD C (C99) qui contient des implémentations d'algorithmes d'alignement de séquences par paires Smith-Waterman (alignement local), Needleman-Wunsch (alignement global) et autres alignements semi-globaux. | ||
{{Note | {{Note | ||
|Depuis StdEnv/2023, l'extension parasail-python fait partie du module parasail. Avec StdEnv/2020, le module doit être chargé pour que l'extension Python soit installée dans un environnement virtuel. | |Depuis StdEnv/2023, l'extension parasail-python fait partie du module parasail. Avec StdEnv/2020, le module doit cependant être chargé pour que l'extension Python soit installée dans un environnement virtuel. | ||
}} | }} | ||
= Utilisation = | = Utilisation = | ||
Pour connaître la version disponible, utilisez | |||
Pour connaître la version disponible, | |||
{{Command|module spider parasail}} | {{Command|module spider parasail}} | ||
Chargez la bibliothèque avec | Chargez la bibliothèque avec | ||
Line 42: | Line 38: | ||
Comparez les résultats d'un alignement local avec BioPython et parasail. | Comparez les résultats d'un alignement local avec BioPython et parasail. | ||
1. Préparez le script Python. | 1. Préparez le script Python. | ||
{{File | {{File | ||
Line 50: | Line 45: | ||
import parasail | import parasail | ||
from Bio.Align import PairwiseAligner | from Bio.Align import PairwiseAligner | ||
A = "ACGT" * 1000 | A = "ACGT" * 1000 | ||
Line 65: | Line 59: | ||
}} | }} | ||
2. Préparez le script de soumission selon votre environnement. | 2. Préparez le script de soumission selon votre environnement. | ||
<tabs> | <tabs> | ||
Line 78: | Line 71: | ||
#SBATCH --mem-per-cpu=3G # increase as needed | #SBATCH --mem-per-cpu=3G # increase as needed | ||
#SBATCH --time=1:00:00 | #SBATCH --time=1:00:00 | ||
module load parasail/2.6.2 python/3.11 scipy-stack/2023b | module load parasail/2.6.2 python/3.11 scipy-stack/2023b | ||
Line 101: | Line 93: | ||
}} | }} | ||
Installez maintenant la version choisie dans votre environnement virtuel. | |||
{{File | {{File | ||
|name=submit-parasail.sh | |name=submit-parasail.sh | ||
Line 112: | Line 103: | ||
#SBATCH --mem-per-cpu=3G # increase as needed | #SBATCH --mem-per-cpu=3G # increase as needed | ||
#SBATCH --time=1:00:00 | #SBATCH --time=1:00:00 | ||
module load StdEnv/2020 gcc parasail/2.5 python/3.10 | module load StdEnv/2020 gcc parasail/2.5 python/3.10 | ||
# Install any other requirements, such as Biopython | # Install any other requirements, such as Biopython | ||
virtualenv --no-download $SLURM_TMPDIR/env | virtualenv --no-download $SLURM_TMPDIR/env | ||
Line 122: | Line 111: | ||
pip install --no-index --upgrade pip | pip install --no-index --upgrade pip | ||
pip install --no-index parasail==1.2.4 biopython==1.83 | pip install --no-index parasail==1.2.4 biopython==1.83 | ||
python parasail-sw.py | python parasail-sw.py | ||
Line 129: | Line 117: | ||
</tabs> | </tabs> | ||
3. Soumettez la tâche avec | 3. Soumettez la tâche avec | ||
{{Command | {{Command | ||
|sbatch submit-parasail.sh | |sbatch submit-parasail.sh | ||
}} | }} | ||
4. Une fois la tâche terminée, vérifiez le résultat dans le fichier de sortie de l'ordonnanceur Slurm. | 4. Une fois la tâche terminée, vérifiez le résultat dans le fichier de sortie de l'ordonnanceur Slurm. | ||
{{Command | {{Command | ||
Line 144: | Line 129: | ||
biopython: 4000.0 | biopython: 4000.0 | ||
}} | }} | ||
==== Paquets Python disponibles ==== | ==== Paquets Python disponibles ==== | ||
Les exigences des paquets Python qui dépendent de parasail seront satisfaites en chargeant | Les exigences des paquets Python qui dépendent de parasail seront satisfaites en chargeant le module parasail. | ||
{{Command | {{Command | ||
|pip list {{!}} grep parasail | |pip list {{!}} grep parasail | ||
Line 154: | Line 137: | ||
parasail 1.3.4 | parasail 1.3.4 | ||
}} | }} | ||
Latest revision as of 14:11, 28 June 2024
parasail est une bibliothèque SIMD C (C99) qui contient des implémentations d'algorithmes d'alignement de séquences par paires Smith-Waterman (alignement local), Needleman-Wunsch (alignement global) et autres alignements semi-globaux.
Utilisation
Pour connaître la version disponible, utilisez
[name@server ~]$ module spider parasail
Chargez la bibliothèque avec
[name@server ~]$ module load parasail/2.6.2
Avec le binaire parasail_aligner
Il est important de définir le nombre de fils selon le nombre de cœurs alloués à votre tâche, par exemple
parasail_aligner -t ${SLURM_CPUS_PER_TASK:-1} ...}}
Extension Python
Le module contient des liaisons pour plusieurs versions de Python. Pour connaître les versions compatibles de Python, lancez
[name@server ~]$ module spider parasail/1.3.4
Utiliser l'extension
1. Chargez les modules requis.
[name@server ~]$ module load parasail/2.6.2 python/3.11 scipy-stack/2023b
2. Importez parasail 1.3.4.
[name@server ~]$ python -c "import parasail"
L'importation est réussie quand la commande ne retourne rien.
Exemple
Comparez les résultats d'un alignement local avec BioPython et parasail.
1. Préparez le script Python.
import parasail
from Bio.Align import PairwiseAligner
A = "ACGT" * 1000
# parasail
matrix = parasail.matrix_create("ACGT", 1, 0)
parasail_score = parasail.sw(A, A, 1, 1, matrix).score
# biopython
bio_score = PairwiseAligner().align(A, A)[0].score
print('parasail:', parasail_score)
print('biopython:', bio_score)
2. Préparez le script de soumission selon votre environnement.
#!/bin/bash
#SBATCH --account=def-someuser # replace with your PI account
#SBATCH --cpus-per-task=1
#SBATCH --mem-per-cpu=3G # increase as needed
#SBATCH --time=1:00:00
module load parasail/2.6.2 python/3.11 scipy-stack/2023b
# Install any other requirements, such as Biopython
virtualenv --no-download $SLURM_TMPDIR/env
source $SLURM_TMPDIR/env/bin/activate
pip install --no-index --upgrade pip
pip install --no-index biopython==1.83
python parasail-sw.py
2.1. Identify available wheels first :
[name@server ~]$ avail_wheel parasail
name version python arch
-------- --------- -------- -------
parasail 1.2.4 py2,py3 generic
Installez maintenant la version choisie dans votre environnement virtuel.
#!/bin/bash
#SBATCH --account=def-someuser # replace with your PI account
#SBATCH --cpus-per-task=1
#SBATCH --mem-per-cpu=3G # increase as needed
#SBATCH --time=1:00:00
module load StdEnv/2020 gcc parasail/2.5 python/3.10
# Install any other requirements, such as Biopython
virtualenv --no-download $SLURM_TMPDIR/env
source $SLURM_TMPDIR/env/bin/activate
pip install --no-index --upgrade pip
pip install --no-index parasail==1.2.4 biopython==1.83
python parasail-sw.py
3. Soumettez la tâche avec
[name@server ~]$ sbatch submit-parasail.sh
4. Une fois la tâche terminée, vérifiez le résultat dans le fichier de sortie de l'ordonnanceur Slurm.
[name@server ~]$ less slurm-*.out
parasail: 4000
biopython: 4000.0
Paquets Python disponibles
Les exigences des paquets Python qui dépendent de parasail seront satisfaites en chargeant le module parasail.
[name@server ~]$ pip list | grep parasail
parasail 1.3.4