Renouvellement de l'infrastructure : Travaux terminés
Jump to navigation
Jump to search
Le tableau ci-dessous montre les travaux qui sont terminés.
Début | Fin | État | Système | Type | Description |
2025-01-13 | 2025-02-14 | terminé | Béluga, Narval | baisse de service temporaire | Les tests de performance et de stabilité de Rorqual nous obligent à éteindre tous les nœuds de calcul de Béluga et environ la moitié des nœuds de calcul de Narval entre 8h le 13 janvier et 12h le 31 janvier 2025 (HNE). Sur Béluga, les tâches prévues pour se terminer après 8 h le 13 janvier resteront en file d’attente jusqu’au retour en service complet de la grappe. Pendant ce temps, les nœuds de connexion et l’accès aux données resteront disponibles. Sur Narval, environ la moitié des nœuds de chaque type (CPU, GPU, grande mémoire) seront éteints. Pendant ce temps, le stockage sur Béluga sera dirigé sur Narval. Les instances infonuagiques des nuages Béluga et Juno ne seront pas touchées par cette interruption.
MISE À JOUR DU 30 JANVIER : la capacité de calcul de Narval est à 100% jusqu'au 6 février et ensuite à 30% pour les derniers tests de Rorqual. Béluga et Narval devraient être de retour à 100% le 14 février. (détails sur https://status.alliancecan.ca). |
2025-01-22 | 2025-01-22 (1 jour) | terminé | Niagara, Mist | arrêt des services | Les nœuds de calcul seront fermés entre 8h et 17h (HNE) pour nous permettre d'apporter des améliorations et préparer la transition vers le nouveau system Trillium.
Par contre, les nœuds de connexion, les systèmes de fichiers et le système HPSS resteront disponibles. L'ordonnanceur retiendra les tâches soumises jusqu'à la fin des travaux. |
2025-01-13 | 2025-01-21 (9 jours) | terminé | Cedar (100%) | arrêt complet des services | La grappe sera fermée en préparation du renouvellement de l'infrastructure. Les tâches seront mises en attente mais pourraient être exécutées si elles peuvent se terminer avant la fermeture. Les tâches qui ne pourront pas être exécutées resteront en attente jusqu'à ce que la grappe soit de nouveau disponible (le 21 janvier). Le système de fichiers /scratch sera migré vers un nouvel espace de stockage. Veuillez immédiatement déplacer les données importantes vers vos répertoires /project, /nearline ou /home. Le nuage Cedar n'est pas touché par les travaux. |
2024-11-25 | 2024-11-26 | terminé | Niagara | fermeture | Une coupure d'alimentation complète aura lieu pour les mises à niveau du panneau principal en vue de la configuration de la nouvelle grappe Trillium. Tous les services, y compris la grappe et l'ordonnanceur, seront suspendus pendant cette période. L'ordonnanceur conservera les tâches qui ne peuvent pas se terminer avant la fermeture. Nous vous encourageons à soumettre des tâches plus petites et de courte durée pour optimiser l'utilisation des nœuds inactifs avant le début des travaux. |
2024-11-07 | 2024-11-08 | terminé | Niagara | fermeture | Tous les systèmes et le stockage du centre de données SciNet (Niagara, Mist, HPSS, Rouge, Teach, JupyterHub, Balam) seront fermés de 7h à 17h HE. Cette interruption est nécessaire pour installer un nouvel équipement électrique (onduleur) dans le cadre d'une mise à niveau des systèmes. L'ordonnanceur conservera les tâches qui ne peuvent pas se terminer avant la fermeture. Nous vous suggérons de donner la priorité aux tâches courtes pour utiliser les nœuds autrement inactifs avant les travaux. |
2024-11-07, 6h HNP | 2024-11-08, 6h HNP | terminé | Cedar | fermeture partielle | Les nœuds de calcul ne seront pas disponibles. Cependant, les nœuds de connexion, le stockage et les services infonuagiques de Cedar resteront en fonction. |