OpenACC Tutorial - Adding directives/fr: Difference between revisions

Created page with "Le programme est exécuté et on obtient un tableau chronologique du déroulement (voir l'image). On remarque que le transfert de données entre le départ et l'arrivée o..."
(Created page with "Les résultats sont corrects, toutefois, loin de gagner en vitesse, l'opération a pris près de quatre fois plus de temps! Utilisons le NVIDIA Visual Profiler (<tt>nvvp</tt>...")
(Created page with "Le programme est exécuté et on obtient un tableau chronologique du déroulement (voir l'image). On remarque que le transfert de données entre le départ et l'arrivée o...")
Line 266: Line 266:
# Cliquez sur "Next" jusqu'à ce que vous puissiez cliquer sur "Finish".  
# Cliquez sur "Next" jusqu'à ce que vous puissiez cliquer sur "Finish".  


This will run the program and generate a timeline of the execution. The resulting timeline is illustrated on the image on the right side. As we can see, almost all of the run time is being spent transferring data between the host and the device. This is very often the case when one ports a code from CPU to GPU. We will look at how to optimize this in the [[OpenACC Tutorial - Data movement|next part of the tutorial]].
Le programme est exécuté et on obtient un tableau chronologique du déroulement (voir l'image).     On remarque que le transfert de données entre le départ et l'arrivée occupe la plus grande partie du temps d'exécution, ce qui est fréquent quand du code est porté d'un CPU vers un GPU. Nous verrons comment ceci peut être amélioré dans la prochaine partie, [https://docs.computecanada.ca/wiki/OpenACC_Tutorial_-_Data_movement/fr Mouvement des données].


== The <tt>parallel loop</tt> directive ==
== The <tt>parallel loop</tt> directive ==
rsnt_translations
56,430

edits