rsnt_translations
53,770
edits
No edit summary |
No edit summary |
||
Line 85: | Line 85: | ||
La plupart des applications peuvent être exécutées sur les nœuds Broadwell et Skylake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez <code>--constraint=skylake</code> ou <code>--constraint=broadwell</code>; consultez [[Running_jobs/fr#Sélectionner_une_architecture_CPU|Sélectionner une architecture CPU]]. | La plupart des applications peuvent être exécutées sur les nœuds Broadwell et Skylake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez <code>--constraint=skylake</code> ou <code>--constraint=broadwell</code>; consultez [[Running_jobs/fr#Sélectionner_une_architecture_CPU|Sélectionner une architecture CPU]]. | ||
==Performance== | |||
Cedar a un total de 58 416 cœurs | Cedar a en théorie un total de 58 416 cœurs CPU de calcul et 584 accélérateurs GPU. La performance théorique maximale en double précision est de 936 teraflops pour les CPU auxquels s'ajoutent 2744 teraflops pour les GPU, pour un total de 3.6 petaflops. Il y a 22 ilots de 32 nœuds complètement connectés par une interconnexion non-blocante (''Omni-Path fabric''), chacun avec un total de 1024 cœurs; chaque ilot devrait générer plus de 30 teraflops de performance double précision mesurée. Il y a un facteur de blocage de 2:1 entre les ilots de 1024 cœurs. | ||
<noinclude> | <noinclude> | ||
</noinclude> | </noinclude> |