rsnt_translations
56,573
edits
No edit summary |
(Created page with "* Si vos applications font surtout des opérations FP32, le modèle A100-40gb devrait être deux fois plus rapide que le P100-12gb, mais son utilisation des ressources sera quatre fois plus grande. En conséquence, pour le même nombre d'UGR, le modèle P100-12gb devrait vous permettre d'exécuter deux fois plus de calcul. * Si vos applications font surtout des opérations FP16 (ce qui est le cas en intelligence artificielle et avec les opérations à précision mixte e...") |
||
Line 29: | Line 29: | ||
{{Note|Cette nouvelle unité sera utilisée à partir du concours pour l'allocation de ressources de 2024.}} | {{Note|Cette nouvelle unité sera utilisée à partir du concours pour l'allocation de ressources de 2024.}} | ||
Comme vous le savez peut-être, la performance des GPU a considérablement augmenté ces dernières années et devrait continuer sa progression avec la prochaine génération. Par le passé et jusqu'au concours de 2023, nous traitions tous les GPU comme étant équivalents les uns aux autres, tant au moment de l'allocation que dans le calcul du nombre de groupes de ressources consommées. Ceci diminuait la complexité de??? , mais créait des problèmes d'équité, à la fois dans le processus d'attribution et lors de l'exécution des tâches. Nous ne pouvons pas continuer à traiter tous les types de GPU de la même manière. | |||
Afin de résoudre le problème d'équité, nous avons créé l'<i>unité GPU de référence</i> (ou <i>UGR</i>) qui nous permet de classer tous les modèles de GPU en production [sur la base de leur performance]. Parce qu'environ la moitié des [tâches/utilisateurs] utilisent principalement des opérations à virgule flottante simple précision ([https://en.wikipedia.org/wiki/Single-precision_floating-point_format FP32]) et le reste utilise des opérations à virgule flottante demi-précision ([https://en.wikipedia.org/wiki/Half-precision_floating-point_format FP16]), et que la plupart des utilisateurs se soucient de la mémoire sur du GPU lui-même, nous avons établi les critères d'évaluation suivants avec leur poids correspondant : | |||
{| class="wikitable" style="margin: auto;" | {| class="wikitable" style="margin: auto;" | ||
Line 109: | Line 109: | ||
|} | |} | ||
(*) | (*) Sur Graham, ces modèles sont offerts par un petit nombre de nœuds GPU fournis par contribution. Ils peuvent être utilisés, mais ne sont pas alloués par la voie du concours annuel d'allocation des ressources. | ||
Par exemple, le plus ancien modèle de GPU en production est le P100-12gb qui vaut maintenant 1.0 UGR. Les quelques prochaines générations de GPU seront comparées avec la même formule au modèle A100-40gb. | |||
==Choisir des modèles de GPU pour votre projet== | ==Choisir des modèles de GPU pour votre projet== | ||
Line 117: | Line 117: | ||
Les scores relatifs de ce tableau devraient vous aider à sélectionner le modèle convenable. Les exemples suivants pr | Les scores relatifs de ce tableau devraient vous aider à sélectionner le modèle convenable. Les exemples suivants pr | ||
* | * Si vos applications font surtout des opérations FP32, le modèle A100-40gb devrait être deux fois plus rapide que le P100-12gb, mais son utilisation des ressources sera quatre fois plus grande. En conséquence, pour le même nombre d'UGR, le modèle P100-12gb devrait vous permettre d'exécuter deux fois plus de calcul. | ||
* | * Si vos applications font surtout des opérations FP16 (ce qui est le cas en intelligence artificielle et avec les opérations à précision mixte et [https://en.wikipedia.org/wiki/Bfloat16_floating-point_format autres formats à virgule flottante]), l'utilisation d'un A100-40gb sera évalué/calculé comme utilisant quatre fois les ressources d'un P100-12gb, mais pourra faire ~30 fois plus de calcul dans le même espace de temps, ce qui vous permettrait de faire ~7.5 fois plus de calcul. | ||
==Starting from RAC 2024== | ==Starting from RAC 2024== | ||
* | * Pour le concours d'allocation de ressources pour 2024, votre demande de GPU doit indiquer le modèle de GPU | ||
* For job scheduling and for usage accounting on CCDB, the use of <i>reference GPU units</i> will take effect on April 1st, 2024, with the implementation of RAC 2024. | * For job scheduling and for usage accounting on CCDB, the use of <i>reference GPU units</i> will take effect on April 1st, 2024, with the implementation of RAC 2024. |