Le logiciel DMTCP (Distributed Multithreaded CheckPointing) permet de faire des points de contrôles de programmes sans avoir à les recompiler. Pour pouvoir l’utiliser, il faut charger le module DMTCP. La première exécution est effectuée avec le programme dmtcp_launch en spécifiant le temps entre les intervalles de sauvegarde. Le redémarrage se fait en exécutant le script dmtcp_restart_script.sh. Par défaut, ce script et les fichiers de redémarrage du programme sont écrits à l'endroit où le programme a été lancé. On peut changer l’emplacement des fichiers de sauvegarde avec l’option --ckptdir <répertoire pour les sauvegardes>. Vous pouvez faire dmtcp_launch --help pour obtenir toutes les options. Notez que DMTCP ne marche pas pour le moment avec les logiciels parallélisés par MPI.