Known issues/fr: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
No edit summary
No edit summary
 
(52 intermediate revisions by 3 users not shown)
Line 1: Line 1:
<languages />
<languages />
=Rapporter un problème=
Pour rapporter un problème, contactez le [[Technical support/fr|soutien technique]].


= Problèmes généraux =
*Les problèmes décrits ici sont ceux qui touchent plusieurs utilisatrices et utilisateurs, mais qui peuvent prendre beaucoup de temps à régler ou dont la correction n'est pas encore planifiée.
*L'état courant des systèmes est rapporté sur cette [http://status.computecanada.ca/ page web]; comme la mise à jour des renseignements n'est pas encore automatisée, un certain délai est à prévoir.
* Les grappes de Calcul Canada sont sensibles aux récentes vulnérabilités Meltdown et Spectre; le système d'exploitation sera mis à jour (voir [[Meltdown and Spectre bugs/fr|Bogues Meltdown et Spectre]]).


==Ordonnanceur==
*Les problèmes qui touchent plusieurs utilisatrices et utilisateurs et que nous sommes en train de traiter sont affichés sur [https://status.alliancecan.ca/ la page de l'état des systèmes]; il peut s'agir par exemple d'une panne ou de la défaillance  d'une grappe.
*Slurm peut émettre le message ''Exceeded step memory limit at some point'', ce qui peut surprendre et entraîner un problème pour les tâches dépendantes.
:*L’ordonnanceur rapporte correctement l’utilisation que les opérations de lecture/écriture font de la mémoire. Cette utilisation, surtout dans le cas des écritures gardées en mémoire tampon, n’était pas visible auparavant car l’interpréteur dirige habituellement ces écritures vers le système de fichiers.
:*Le même message peut être émis quand l’interpréteur termine des processus (''OOM kill'') dû à une mémoire insuffisante; les répercussions sur le code de sortie sont cependant différentes.
:*L’état ''DerivedExitStatus 0:125'' indique que la tâche a atteint la limite de la mémoire, mais qu’elle n’a pas été terminée par ''OOM kill''.
:*Un état 0 :125 NE PERMET PAS l’exécution d’une tâche ayant une dépendance ''afterok''. Il s’agit d’un bogue qui sera éliminé dans la version 17.11.3 de l’ordonnanceur; la correction permettra de distinguer entre les tâches terminées par ''OOM kill'' et les conditions qui ne nécessitent qu’une alerte. Slurm limitera toujours l’utilisation de la mémoire pour les ''cgroups''; les opérations en entrée/sortie seront toujours considérées et l’utilisateur sera averti quand la quantité de mémoire utilisée dépasse la quantité demandée.


*La configuration de Slurm privilégie les tâches qui utilisent des nœuds entiers; il est donc préférable de demander des nœuds entiers plutôt qu’un nombre de cœurs (voir [[Job scheduling policies/fr# Nœuds_entiers_ou_cœurs|Nœuds_entiers_ou_cœurs]]).
*Les problèmes spécifiques à un paquet logiciel sont signalés sur la page wiki dédiée à ce paquet.  


*Par défaut, les paramètres d’environnement d’une tâche sont déterminés par l’interpréteur qui soumet la tâche. Si ce n’est pas ce que vous voulez, ceci peut produire des résultats impossibles à reproduire. Pour faire en sorte que la tâche soit exécutée dans un environnement vierge, utilisez le paramètre <tt>--export=none</tt> ou ajoutez <tt>#SBATCH --export=NONE</tt> au script.
==Rapporter un problème==
Pour rapporter un problème, contactez le [[Technical support/fr|soutien technique]].
 
= Problèmes généraux =  
*L'état courant des systèmes est rapporté sur [https://status.alliancecan.ca/ cette page]; comme la mise à jour des renseignements se fait manuellement, un certain délai est à prévoir avant qu'un problème rapporté y soit affiché.


==Quotas et systèmes de fichiers==  
===Ordonnanceur===
=== Erreurs de quota sur le système de fichiers /projet ===
Voir la page [[Frequently_Asked_Questions/fr|Foire aux questions]].


=== Nearline ===
Aucun problème rapporté.
*Les fonctionnalités nearline ne sont pas encore disponibles; pour la date planifiée, voyez [[National_Data_Cyberinfrastructure/fr|Cyberinfrastructure nationale de données]].
**Mise à jour en date du 17 juillet : pas  encore disponibles. Pour obtenir votre quota alloué pour 2017, contactez le [[Technical support/fr|soutien technique]].  


=== Liens symboliques aux répertoires projet ===  
===Quotas et systèmes de fichiers===
À la connexion aux nouvelles grappes, les liens symboliques ne sont pas toujours créés dans le compte de l'utilisateur, tel que décrit à la page [[Project_layout/fr|Espace projet]]. Si c'est le cas, vérifiez que votre accès à la grappe est activé en consultant la [https://ccdb.computecanada.ca/services/resources base de données de Calcul Canada].


= Problèmes rapportés pour Cedar =  
==== Répertoire /project non disponible ====
*L'espace de stockage [[Project_layout/fr|<code>/project</code>]] est généralement alloué le prochain jour ouvrable suivant la création d'un compte par un chercheur principal.


Rien à signaler.
==Problèmes rapportés, par grappe==


= Problèmes rapportés pour Graham =  
===Béluga===
* Une mise à jour des nœuds est en cours pour contrer les récentes vulnérabilités Meltdown et Spectre. Les nœuds seront redémarrés à tour de rôle pour éviter l'interruption du service.
Aucun problème rapporté.
*Les nœuds de calcul n'accèdent pas à l'Internet.
**Solution : Contactez le [[Technical support/fr|soutien technique]] et expliquez pourquoi vous demandez l'accès à des sites particuliers.


* crontab n'est pas disponible sur Graham
===Cedar===
Aucun problème rapporté.


= Problèmes divers=  
===Graham===
L'espace /scratch est souvent lent, mais il sera bientôt remplacé.


*Les modules ne fonctionnent pas pour les interpréteurs autres que bash(sh) et tcsh.
===Narval===
**Solution temporaire : (semble fonctionner, mais des tests complets sont indiqués).
Aucun problème rapporté.
***<tt>source $LMOD_PKG/init/zsh</tt>
***<tt>source $LMOD_PKG/init/ksh</tt>

Latest revision as of 19:01, 29 October 2024

Other languages:
  • Les problèmes décrits ici sont ceux qui touchent plusieurs utilisatrices et utilisateurs, mais qui peuvent prendre beaucoup de temps à régler ou dont la correction n'est pas encore planifiée.
  • Les problèmes qui touchent plusieurs utilisatrices et utilisateurs et que nous sommes en train de traiter sont affichés sur la page de l'état des systèmes; il peut s'agir par exemple d'une panne ou de la défaillance d'une grappe.
  • Les problèmes spécifiques à un paquet logiciel sont signalés sur la page wiki dédiée à ce paquet.

Rapporter un problème

Pour rapporter un problème, contactez le soutien technique.

Problèmes généraux

  • L'état courant des systèmes est rapporté sur cette page; comme la mise à jour des renseignements se fait manuellement, un certain délai est à prévoir avant qu'un problème rapporté y soit affiché.

Ordonnanceur

Aucun problème rapporté.

Quotas et systèmes de fichiers

Répertoire /project non disponible

  • L'espace de stockage /project est généralement alloué le prochain jour ouvrable suivant la création d'un compte par un chercheur principal.

Problèmes rapportés, par grappe

Béluga

Aucun problème rapporté.

Cedar

Aucun problème rapporté.

Graham

L'espace /scratch est souvent lent, mais il sera bientôt remplacé.

Narval

Aucun problème rapporté.