rsnt_translations
56,430
edits
No edit summary |
No edit summary |
||
Line 59: | Line 59: | ||
Pour obtenir un parallélisme intensif, on doit utiliser le plus le fils possible; puisqu'un ''kernel'' CUDA comprend un très grand nombre de fils, il faut bien les organiser. Avec CUDA, les fils sont groupés en blocs de fils, eux-mêmes formant une grille. Diviser les fils fait en sorte que : | Pour obtenir un parallélisme intensif, on doit utiliser le plus le fils possible; puisqu'un ''kernel'' CUDA comprend un très grand nombre de fils, il faut bien les organiser. Avec CUDA, les fils sont groupés en blocs de fils, eux-mêmes formant une grille. Diviser les fils fait en sorte que : | ||
*les fils groupés coopèrent | *les fils groupés coopèrent via la mémoire partagée, | ||
*les fils d'un bloc ne coopèrent pas avec les fils des autres blocs. | *les fils d'un bloc ne coopèrent pas avec les fils des autres blocs. | ||