rsnt_translations
56,430
edits
(Created page with "= Ordonnancement des fils = Un processeur en continu (SM) exécute habituellement un bloc de fils à la fois. Le code est exécuté en groupes de 32 fils (appelés ''warps'')....") |
No edit summary |
||
Line 56: | Line 56: | ||
= Blocs de fils = | = Blocs de fils = | ||
[[File:Cuda-threads-blocks.png|thumbnail| | [[File:Cuda-threads-blocks.png|thumbnail|Les fils sont groupés en blocs qui forment une grille. ]] | ||
Pour obtenir un parallélisme intensif, on doit utiliser le plus le fils possible; puisqu'un ''kernel'' CUDA comprend un très grand nombre de fils, il faut bien les organiser. Avec CUDA, les fils sont groupés en blocs de fils, eux-mêmes formant une grille. Diviser les fils fait en sorte que : | Pour obtenir un parallélisme intensif, on doit utiliser le plus le fils possible; puisqu'un ''kernel'' CUDA comprend un très grand nombre de fils, il faut bien les organiser. Avec CUDA, les fils sont groupés en blocs de fils, eux-mêmes formant une grille. Diviser les fils fait en sorte que : | ||
*les fils groupés coopèrent via la mémoire partagée, | *les fils groupés coopèrent via la mémoire partagée, |