Séminaire de recherche: rm-replay: un outil d'optimisation, d'exploration et de réglage haute fidélité pour la gestion des ressources
Uni.lu Suivre
Les systèmes de calcul intensifs hybrides et hétérogènes de pointe traitent des centaines de milliers de travaux à l'aide d'algorithmes et de paramètres de planification complexes. Les centres exploitant ces systèmes visent à atteindre des niveaux plus élevés d’utilisation des ressources tout en étant limités par le respect des contraintes politiques. Il existe un besoin critique pour un outil haute fidélité et hautes performances avec des interfaces familières qui permettent non seulement de régler et d'optimiser le planificateur de travaux opérationnel, mais également d'explorer de nouveaux algorithmes de gestion des ressources. Nous proposons une nouvelle méthodologie et un outil appelé RM-Replay qui n'est pas un simulateur mais un moteur de relecture rapide pour les charges de travail de production. Slurm est utilisé comme une plateforme pour démontrer les capacités de notre moteur de rejeu. La précision de l'outil est discutée et notre enquête montre qu'en offrant une meilleure estimation de l'exécution du travail ou en utilisant une allocation tenant compte de la topologie, les valeurs des métriques de planification varient. La méthodologie présentée pour créer des moteurs de relecture rapide peut être étendue à d'autres systèmes complexes.
Maxime Martinasso est informaticien et adjoint du responsable technique du CSCS, le Centre national suisse de superinformatique. Dans le cadre de ses fonctions, il fait partie d'une équipe qui dirige le Centre vers des objectifs stratégiques en gérant la conception et le développement d'initiatives clés telles que la technologie cloud ou l'analyse comparative du matériel. Ses intérêts portent sur la modélisation de la performance, le réseau, la gestion des ressources et la technologie HPC en général. Auparavant, Maxime était spécialiste HPC et chef d’équipe pour un grand groupe pétrolier. Il a obtenu son doctorat sur la modélisation de la performance appliquée à la technologie HPC en 2007 à l'Université Joseph Fourier, en France.
Où ça se passe ?
Maison du Nombre (MNO), Campus Belval
6 Avenue de la Fonte
Esch-sur-Alzette
Luxembourg
Tu pourrais aussi aimer :
retrouve tous les networkings et formations qui te ressemblent !
retrouve tous les networkings et formations qui te ressemblent !