ÉcoleCQ2019

From Alliance Doc
Jump to navigation Jump to search
This site replaces the former Compute Canada documentation site, and is now being managed by the Digital Research Alliance of Canada.

Ce site remplace l'ancien site de documentation de Calcul Canada et est maintenant géré par l'Alliance de recherche numérique du Canada.

École de printemps Calcul Québec 2019

Analyse de données avec Python - Objectifs

Intro au supercalculateur

  • Aller sur le wiki de Calcul Canada et chercher École 2019
  • Téléverser le fichier de soumission proposé sur le wiki vers le cluster : ecole2019.calculquebec.cloud
  • Créer un répertoire sur le cluster qui contiendra le script de soumission et y déplacer le script
  • Augmenter la durée de la tâche à 2 minutes avec nano
  • Modifier l'account avec nano pour utiliser : def-sponsor00
  • Soumettre la tâche
  • Récupérer les fichiers de résultats sur votre ordinateur

Intro à OpenRefine

  • Importer le projet OpenRefine produit par la tâche (projet.json)
  • Annuler l'opération éliminant les lignes qui auraient des données d'extermination manquante
  • Remplacer les données manquantes du nombre d'extermination par un 0
  • Ajouter une colonne quadrimestre:
    • janvier à avril = 1
    • mai à août = 2
    • septembre à décembre = 3
  • Sauvegarder le jeu de données résultats

Intro à Pandas / Python

  • Téléverser le résultat vers Jupyter
  • Ouvrir le jeu de données résultat avec Pandas
  • Calculer la moyenne du nombre d'extermination par arrondissement
  • Calculer la somme d'exterminations par quadrimestre par année
  • Tracer un histogramme empilé
    • du nombre d'extermination total par quadrimestre, par année
    • du nombre d'extermination total par année, par quadrimestre
  • Discuter des différences entre les deux graphiques

Intro au supercalculateur

Script de soumission

File : job.sh

#!/bin/bash
#SBATCH --time=00:00:30
#SBATCH --account=def-xyz
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=1
#SBATCH --mem=512M

/project/def-sponsor00/projet/bin/simulation_punaises.py 5000