rsnt_translations
56,430
edits
(Created page with "= Avantages de la mémoire partagée= Jusqu'ici, tous les transferts en mémoire dans le ''kernel'' ont été via la mémoire régulière (globale) du GPU, ce qui est relative...") |
(Created page with "= Facteurs de performance de base = == Memory transfer == * PCI-e est extrêmement lent (4-6Go/s) en comparaison à la mémoire hôte et la mémoire de la carte graphique * Mi...") |
||
Line 166: | Line 166: | ||
</syntaxhighlight> | </syntaxhighlight> | ||
= | = Facteurs de performance de base = | ||
== Memory transfer == | == Memory transfer == | ||
* PCI-e | * PCI-e est extrêmement lent (4-6Go/s) en comparaison à la mémoire hôte et la mémoire de la carte graphique | ||
* | * Minimisez les copies de mémoire dans les deux directions. | ||
* | * Gardez les données sur la carte graphique le plus longtemps possible. | ||
* Sometimes it is not effificient to make the host (CPU) do non-optimal jobs; executing it on the GPU may still be faster than copying to CPU, executing, and copying back | * Sometimes it is not effificient to make the host (CPU) do non-optimal jobs; executing it on the GPU may still be faster than copying to CPU, executing, and copying back | ||
* Use memcpy times to analyse the execution times | * Use memcpy times to analyse the execution times |