CUDA tutorial/fr: Difference between revisions

no edit summary
(Created page with "= Ordonnancement des fils = Un processeur en continu (SM) exécute habituellement un bloc de fils à la fois. Le code est exécuté en groupes de 32 fils (appelés ''warps'')....")
No edit summary
Line 56: Line 56:
= Blocs de fils =
= Blocs de fils =


[[File:Cuda-threads-blocks.png|thumbnail|Figure 1. Les fils sont groupés en blocs qui forment une grille. ]]
[[File:Cuda-threads-blocks.png|thumbnail|Les fils sont groupés en blocs qui forment une grille. ]]
Pour obtenir un parallélisme intensif, on doit utiliser le plus le fils possible; puisqu'un ''kernel'' CUDA comprend un très grand nombre de fils, il faut bien les organiser. Avec CUDA, les fils sont groupés en blocs de fils, eux-mêmes formant une grille. Diviser les fils fait en sorte que :
Pour obtenir un parallélisme intensif, on doit utiliser le plus le fils possible; puisqu'un ''kernel'' CUDA comprend un très grand nombre de fils, il faut bien les organiser. Avec CUDA, les fils sont groupés en blocs de fils, eux-mêmes formant une grille. Diviser les fils fait en sorte que :
*les fils groupés coopèrent via la mémoire partagée,
*les fils groupés coopèrent via la mémoire partagée,
rsnt_translations
56,430

edits