Administrateur(trice) Système HPC FH
Montpellier - France
Job Summary
CDI Confirmé Centre de calcul Environnement scientifique
Démarrage : À définir
Contexte du poste
Alliance Services Plus (AS) recherche un(e) Administrateur(trice) Systèmes Linux HPC pour le compte dun client opérant des infrastructures de calcul intensif à grande échelle au service dactivités scientifiques et techniques exigeantes.
Intégré(e) au sein des équipes dexploitation vous contribuerez au maintien en condition opérationnelle dune plateforme HPC critique utilisée par une communauté importante dutilisateurs pour des travaux de simulation de modélisation et de calcul scientifique à grande échelle.
Missions principales
Dans un cadre dexploitation et dévolution des infrastructures HPC les missions pourront inclure :
Ladministration le maintien en condition opérationnelle et loptimisation denvironnements Linux à grande échelle
La gestion et lexploitation dinfrastructures de calcul intensif (clusters HPC)
Le support technique de niveau 2/3 auprès des utilisateurs scientifiques
Ladministration des ordonnanceurs de jobs et des systèmes de fichiers parallèles
Le déploiement la mise à jour et loptimisation des environnements logiciels scientifiques
Lautomatisation des tâches dadministration et dexploitation
La gestion des incidents le diagnostic et la résolution de problèmes complexes
La participation aux opérations de maintenance et aux évolutions darchitecture
La rédaction et la mise à jour de la documentation technique et des procédures
La participation à la veille technologique et à lamélioration continue des plateformes
Environnement technique
Les projets sappuient principalement sur les technologies suivantes :
Systèmes dexploitation : Linux (RHEL CentOS Rocky Linux Ubuntu)
Clusters HPC : infrastructures de calcul intensif multi-nœuds
Ordonnanceurs : Slurm (principal) PBS Pro (selon environnements)
Stockage : systèmes de fichiers distribués (Lustre GPFS)
Réseaux haute performance : InfiniBand
Automatisation & scripting : Bash Python Ansible
Gestion denvironnements logiciels : modules (Lmod / module-tcl) Spack
Supervision & exploitation : outils de monitoring HPC et systèmes
Architectures matérielles : CPU x8664 / ARM GPU (NVIDIA selon périmètre)
Profil recherché
Formation Bac5 (École dingénieur Master) ou expérience équivalente
Expérience confirmée en administration systèmes Linux dans un environnement complexe
Connaissance des environnements HPC et des contraintes associées (performance scalabilité disponibilité)
Maîtrise des outils dexploitation Linux et des mécanismes dautomatisation
Capacité à intervenir sur des infrastructures critiques en production
Qualités attendues :
Rigueur et sens de lanalyse
Autonomie et capacité à prioriser
Bon relationnel et aptitude à travailler avec des utilisateurs experts
Capacité à documenter et à formaliser les procédures
Esprit déquipe et sens du service
About Company
GECI International est un spécialiste de la Technologie et du Digital. Depuis son origine en 1980, le Groupe innove pour concevoir et développer des solutions, produits et services intelligents pour les secteurs de la Recherche, de l’Industrie et des Services.