rsnt_translations
56,430
edits
(Created page with "Les résultats sont corrects, toutefois, loin de gagner en vitesse, l'opération a pris près de quatre fois plus de temps! Utilisons le NVIDIA Visual Profiler (<tt>nvvp</tt>...") |
(Created page with "Le programme est exécuté et on obtient un tableau chronologique du déroulement (voir l'image). On remarque que le transfert de données entre le départ et l'arrivée o...") |
||
Line 266: | Line 266: | ||
# Cliquez sur "Next" jusqu'à ce que vous puissiez cliquer sur "Finish". | # Cliquez sur "Next" jusqu'à ce que vous puissiez cliquer sur "Finish". | ||
Le programme est exécuté et on obtient un tableau chronologique du déroulement (voir l'image). On remarque que le transfert de données entre le départ et l'arrivée occupe la plus grande partie du temps d'exécution, ce qui est fréquent quand du code est porté d'un CPU vers un GPU. Nous verrons comment ceci peut être amélioré dans la prochaine partie, [https://docs.computecanada.ca/wiki/OpenACC_Tutorial_-_Data_movement/fr Mouvement des données]. | |||
== The <tt>parallel loop</tt> directive == | == The <tt>parallel loop</tt> directive == |