Infrastructure renewal/fr: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
(Updating to match new version of source page)
(Updating to match new version of source page)
Line 28: Line 28:
|-
|-
| '''Start Time''' || '''End Time'''  || '''System''' || '''Description'''
| '''Start Time''' || '''End Time'''  || '''System''' || '''Description'''
|-
| Nov 7, 2024 || Nov 8, 2024 (1 day) || Niagara || All systems and storage located at the SciNet Datacenter (Niagara, Mist, HPSS, Rouge, Teach, JupyterHub, Balam) will be unavailable from 7 a.m. to 5 p.m. ET. This outage is required to install new electrical equipment (UPS) for the upcoming systems refresh. The work is expected to be completed in one day. The scheduler will hold jobs that cannot finish before the start of the shutdown. Users are encouraged to submit small and short jobs that can take advantage of this, as the scheduler may be able to fit these jobs in before the maintenance on otherwise idle nodes.
|-
|-
| Nov 7, 2024 6am PST || Nov 8, 2024 6am PST || Cedar || Cedar compute nodes will be unavailable during this period (jobs will not run). Cedar login nodes and storage, as well as Cedar cloud will remain online and are not affected by this work.   
| Nov 7, 2024 6am PST || Nov 8, 2024 6am PST || Cedar || Cedar compute nodes will be unavailable during this period (jobs will not run). Cedar login nodes and storage, as well as Cedar cloud will remain online and are not affected by this work.   
Line 54: Line 56:
<i>en préparation</i>
<i>en préparation</i>


<div class="mw-translate-fuzzy">
==Béluga, grappe de calcul (aucun changement au nuage)==
==Béluga, grappe de calcul (aucun changement au nuage)==
[[Béluga]]
[[Béluga]]
Le nom du système qui remplacera Béluga est Rorqual.
Le nom du système qui remplacera Béluga est Rorqual.
<i>en préparation</i>
<i>en préparation</i>
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
The cluster replacing [[Beluga/en|Béluga]] will be named '''Rorqual'''. Specifications are available on [[Rorqual/en|this page]].
</div>


==Cedar, grappe de calcul et nuage==
==Cedar, grappe de calcul et nuage==

Revision as of 22:22, 28 October 2024

Other languages:

Importante mise à jour de notre infrastructure de calcul informatique de pointe

L'importante mise à jour de notre infrastructure de calcul informatique de pointe permettra d’améliorer nos services de calcul de haute performance et nos services infonuagiques pour soutenir la recherche au Canada.
Cette mise à jour verra le remplacement de près de 80 % de nos équipements actuels qui approchent de leur fin de vie. Le nouveau matériel offrira une vitesse de traitement plus rapide, une plus grande capacité de stockage et une fiabilité améliorée.

Les systèmes touchés sont

Spécifications techniques

Technical specifications for each new system will be provided further down this page in future updates. Generally, they will be similar in architecture to the current systems, but with considerably increased capacity and performance.
For example, we expect to have fewer compute nodes, but each node will have a significant increase in the number of its cores, for an overall increase in the total number of CPU cores.

Impacts

Arrêts de services

Il y aura beaucoup de travaux faits au cours de l'hiver 2024-2025 et le printemps 2025. L'installation et la transition vers les nouveaux systèmes nous obligeront à suspendre les services en raison de l'espace et de l'alimentation électrique.
Nous vous recommandons de tenir compte de cette possibilité dans votre planification du programme de recherche et des examens, etc.

Start Time End Time System Description
Nov 7, 2024 Nov 8, 2024 (1 day) Niagara All systems and storage located at the SciNet Datacenter (Niagara, Mist, HPSS, Rouge, Teach, JupyterHub, Balam) will be unavailable from 7 a.m. to 5 p.m. ET. This outage is required to install new electrical equipment (UPS) for the upcoming systems refresh. The work is expected to be completed in one day. The scheduler will hold jobs that cannot finish before the start of the shutdown. Users are encouraged to submit small and short jobs that can take advantage of this, as the scheduler may be able to fit these jobs in before the maintenance on otherwise idle nodes.
Nov 7, 2024 6am PST Nov 8, 2024 6am PST Cedar Cedar compute nodes will be unavailable during this period (jobs will not run). Cedar login nodes and storage, as well as Cedar cloud will remain online and are not affected by this work.

Concours pour l'allocation des ressources

La transition aura un impact sur le concours pour l'allocation des ressources, mais le processus de présentation des demandes reste inchangé. Nous vous rappelons que la date limite pour présenter une demande est le 30 octobre 2024.
Les allocations pour la période 2024-2025 resteront en vigueur tant que le système utilisé est en service.
Si vous détenez des allocations pour la période 2024-2025 et pour la période 2025-2026, aucune ressource ne vous sera disponible pendant un certain temps puisque les services existants seront fermés avant que tous les nouveaux soient en fonction. Vous pourrez alors utiliser votre allocation par défaut (def-xxxxxx) sur le nouveau système parce que votre allocation pour 2025-2026 ne sera disponible que lorsque tous les nouveaux systèmes seront en fonction.

Activités générales

2024-10-07 Les mises à jour de l'infrastructure (alimentation et refroidissement) sont en analyse. Les calendriers ne sont toujours pas disponibles, mais des arrêts de service d'un jour ou plus devraient être ncessaires en novembre.
2024-10-13 Les soumissions aux appels d'offres ont été analysées pour tous les sites sauf Rorqual (qui remplacera Béluga) et les fournisseurs ont reçu les bons de commande. Le processus pour le stockage sur Rorqual est toujours en cours et devrait être fermé le 18 septembre. Tous les sites travaillent sur la conception des l'infrastructure (alimentation et refroidissement) et la mise en œuvre. Il y aura sans doute des arrêts de services au cours de l'automne pour permettre les travaux de câblage et de plomberie.
2024-10-03 Tous les sites ont préparé leurs appels d'offres et planifient les biens livrables et les bons de commande avec les fournisseurs.

Activités par système

Arbutus, nuage

Arbutus en préparation

Béluga, grappe de calcul (aucun changement au nuage)

Béluga Le nom du système qui remplacera Béluga est Rorqual. en préparation

The cluster replacing Béluga will be named Rorqual. Specifications are available on this page.

Cedar, grappe de calcul et nuage

Cedar en préparation

Graham, grappe de calcul et nuage

Graham en préparation

Niagara, grappe de calcul

Niagara en préparation

Foire aux questions

Mes données seront-elles migrées sur leur nouveau système?

La migration des données est la responsabilité de chacun des sites hôtes nationaux; vous recevrez l'information sur les actions à prendre.

Les arrêts de service sont-ils prévisibles?

Chacun des sites hôtes nationaux gère les arrêts de service qui seront requis pendant l'installation et la transition; ils seront rapportés sur notre page web sur l'État des systèmes. La présente page wiki sera modifiée au fur et à mesure que l'information est disponible et vous recevrez périodiquement par courriel des avis et des mises à jour.

Qui peut répondre à mes questions sur la transition?

Le soutien technique tentera de vous informer, mais il se peut que l'information ne leur soit pas encore connue.

Les nouveaux systèmes sont-ils compatibles avec mes tâches et mes applications?

Règle générale, oui. Il est possible que certaines applications doivent être recompilées ou reconfigurées selon les nouveaux CPU et GPU. Vous recevrez l'information au fur et à mesure de la transition.

Les logiciels sur les systèmes existants seront-ils toujours disponibles?

Oui, notre environnement logiciel standard sera disponible sur les nouveaux systèmes.

Les arrêts de service seront-ils échelonnés?

Nous ferons tout ce qui est possible pour limiter les arrêts de service qui se chevauchent, mais comme nous sommes très contraints par les calendriers de livraison et les délais de financement, il y aura probablement des périodes où plusieurs de nos systèmes seront hors ligne simultanément. Nous vous en informerons le plus tôt possible.

Est-il possible d'acheter le matériel qui sera retiré de l'infrastructure?

La grande partie de l'équipement est la propriété des établissements hôtes qui s'en départissent selon les standards que chacun établit. En règle générale, le matériel est acheminé au recyclage. Contactez l'établissement hôte pour savoir s'il existe la possibilité de vous en procurer.