Translations:AI and Machine Learning/16/fr: Difference between revisions

From Alliance Doc
Jump to navigation Jump to search
No edit summary
No edit summary
Line 1: Line 1:
Si vos calculs exigent beaucoup de temps, il est recommandé d'utiliser des points de contrôle (''checkpoints''); par exemple, plutôt que trois jours d'entraînement, on pourrait avoir trois blocs de 24 heures chacun. De cette manière, votre travail ne serait pas perdu en cas de panne et vous pourriez bénéficier d'une meilleure priorisation de vos tâches puisqu'il y a plus de nœuds qui sont réservés pour les tâches courtes.
Si vos calculs exigent beaucoup de temps, il est recommandé d'utiliser des points de contrôle (''checkpoints''); par exemple, plutôt que trois jours d'entraînement, vous pourriez avoir trois blocs de 24 heures chacun. De cette manière, votre travail ne serait pas perdu en cas de panne et vous pourriez bénéficier d'une meilleure priorisation de vos tâches puisqu'il y a plus de nœuds qui sont réservés pour les tâches courtes.
Votre bibliothèque préférée supporte probablement les ''checkpoints'' (si ce n'est pas le cas, voyez [[Points de contrôle]]). Vous trouverez des suggestions dans [[Running jobs/fr#Resoumettre_une_tâche_pour_un_calcul_de_longue_durée|Resoumettre une tâche pour un calcul de longue durée]].
Votre bibliothèque préférée supporte probablement les ''checkpoints''; voyez le cas type présenté dans [[Tutoriel Apprentissage machine\notre tutoriel]]. Si votre programme ne le permet pas, consultez la [[Points de contrôle|solution générique]].

Revision as of 15:07, 16 October 2019

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (AI and Machine Learning)
If your computations are long, you should use checkpointing. For example, if your training time is 3 days, you should split it in 3 chunks of 24 hours. This will prevent you from losing all the work in case of an outage, and give you an edge in terms of priority (more nodes are available for short jobs). Most machine learning libraries natively support checkpointing; the typical case is covered in our [[Tutoriel_Apprentissage_machine/en#Checkpointing_a_long-running_job|tutorial]]. If your program does not natively support this, we provide a [[Points de contrôle/en|general checkpointing solution]].

Si vos calculs exigent beaucoup de temps, il est recommandé d'utiliser des points de contrôle (checkpoints); par exemple, plutôt que trois jours d'entraînement, vous pourriez avoir trois blocs de 24 heures chacun. De cette manière, votre travail ne serait pas perdu en cas de panne et vous pourriez bénéficier d'une meilleure priorisation de vos tâches puisqu'il y a plus de nœuds qui sont réservés pour les tâches courtes. Votre bibliothèque préférée supporte probablement les checkpoints; voyez le cas type présenté dans Tutoriel Apprentissage machine\notre tutoriel. Si votre programme ne le permet pas, consultez la solution générique.