38,757
edits
No edit summary |
(Updating to match new version of source page) |
||
Line 60: | Line 60: | ||
Cedar offre 100,400 cœurs CPU pour le calcul et 1352 GPU. TurboBoost est désactivé sur tous les nœuds. | Cedar offre 100,400 cœurs CPU pour le calcul et 1352 GPU. TurboBoost est désactivé sur tous les nœuds. | ||
<div class="mw-translate-fuzzy"> | |||
{| class="wikitable sortable" | {| class="wikitable sortable" | ||
! nœuds !! cœurs !! mémoire disponible !! CPU !! stockage !! GPU | ! nœuds !! cœurs !! mémoire disponible !! CPU !! stockage !! GPU | ||
Line 83: | Line 84: | ||
| 768 || 48 || 187G ou 192000M || 2 x Intel Platinum 8260 Cascade Lake @ 2.4GHz || 2 x SSD 480G || - | | 768 || 48 || 187G ou 192000M || 2 x Intel Platinum 8260 Cascade Lake @ 2.4GHz || 2 x SSD 480G || - | ||
|} | |} | ||
</div> | |||
Remarquez que la quantité de mémoire disponible est moindre que la valeur arrondie suggérée par la configuration matérielle. Par exemple, les nœuds de type <i>base 128G</i> ont effectivement 128Gio de mémoire vive, mais une certaine quantité est utilisée en permanence par le noyau (<i>kernel</i>) et le système d'exploitation. Pour éviter la perte de temps encourue par le <i>swapping</i> ou le <i>paging</i>, l'ordonnanceur n'allouera jamais une tâche dont les exigences dépassent la quantité de mémoire disponible indiquée dans le tableau ci-dessus. | Remarquez que la quantité de mémoire disponible est moindre que la valeur arrondie suggérée par la configuration matérielle. Par exemple, les nœuds de type <i>base 128G</i> ont effectivement 128Gio de mémoire vive, mais une certaine quantité est utilisée en permanence par le noyau (<i>kernel</i>) et le système d'exploitation. Pour éviter la perte de temps encourue par le <i>swapping</i> ou le <i>paging</i>, l'ordonnanceur n'allouera jamais une tâche dont les exigences dépassent la quantité de mémoire disponible indiquée dans le tableau ci-dessus. | ||
Line 100: | Line 102: | ||
La performance théorique maximale en double précision est de 6547 téraflops pour les CPU auxquels s'ajoutent 7434 téraflops pour les GPU, pour un total de près de 14 pétaflops. | La performance théorique maximale en double précision est de 6547 téraflops pour les CPU auxquels s'ajoutent 7434 téraflops pour les GPU, pour un total de près de 14 pétaflops. | ||
<div class="mw-translate-fuzzy"> | |||
La topologie réseau est une composition d'îlots avec un facteur de blocage de 2:1 entre chacun. La plupart des îlots ont 32 nœuds entièrement reliés par une interconnexion (<i>Omni-Path fabric</i>) non bloquante. | La topologie réseau est une composition d'îlots avec un facteur de blocage de 2:1 entre chacun. La plupart des îlots ont 32 nœuds entièrement reliés par une interconnexion (<i>Omni-Path fabric</i>) non bloquante. | ||
<br> | <br> | ||
Line 108: | Line 111: | ||
* 6 îlots avec 32 nœuds GPU V100; | * 6 îlots avec 32 nœuds GPU V100; | ||
* 2 îlots chacun avec 24 nœuds Broadwell de type <i>large memory</i>. | * 2 îlots chacun avec 24 nœuds Broadwell de type <i>large memory</i>. | ||
</div> | |||
<noinclude> | <noinclude> | ||
</noinclude> | </noinclude> |