Site Reliability Engineer (expérimenté, CDI)

ALTEN

Not Interested
Bookmark
Report This Job

profile Job Location:

Valbonne - France

profile Monthly Salary: Not Disclosed
Posted on: Yesterday
Vacancies: 1 Vacancy

Job Summary

En tant que Site Reliability Engineer (SRE) vous jouerez un rôle clé dans le maintien loptimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement dinfrastructure et dopérations pour garantir une disponibilité et une résilience maximales des services et applications critiques.

 

Missions principales: 

 

  • Maintien en conditions opérationnelles des systèmes et des applications en production en optimisant leur disponibilité performance et évolutivité.
  • Automatisation des tâches répétitives et des processus de déploiement de surveillance et dalerting.
  • Conception et mise en œuvre de solutions permettant daméliorer la fiabilité des systèmes et de réduire le taux de pannes.
  • Analyse des incidents et gestion des urgences avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et daccroître la résilience.
  • Optimisation des performances des applications et de linfrastructure notamment via la gestion des capacités et des coûts.
  • Collaboration avec les équipes de développement pour favoriser une approche DevOps et intégrer les pratiques SRE dès les phases de conception.
  • Création et suivi de métriques pour mesurer la fiabilité et les performances des systèmes (SLI SLO SLA).
  • Veille technologique pour assurer lamélioration continue des outils et des processus SRE.

Qualifications :

Compétences requises:

  • Expérience en ingénierie système : Linux/Unix gestion de serveurs stockage et réseaux.
  • Maîtrise des outils de monitoring et dalerting (ex. : Prometheus Grafana Datadog ELK Stack).
  • Compétences en automatisation : scripting (Python Bash etc.) outils de CI/CD (ex. : Jenkins GitLab CI GitHub Actions) et infrastructure-as-code (Terraform Ansible).
  • Expérience avec les environnements cloud : AWS GCP Azure ou autres services cloud ainsi que les architectures de microservices et conteneurs (Docker Kubernetes).
  • Compétences en bases de données : administration et optimisation de bases SQL et NoSQL.
  • Capacité à gérer les incidents : compétences en diagnostic et résolution de pannes dans un environnement de production.
  • Bonnes compétences en communication pour collaborer avec des équipes pluridisciplinaires et documenter les processus et solutions.

Compétences bonus

  • Expérience en tant que DevOps ingénieur système ou développeur logiciel
  • Connaissance des méthodologies de développement agile et des pratiques DevOps
  • Participation à la mise en place de processus dobservabilité de monitoring et de gestion des incidents
  • Expérience dans la gestion de la disponibilité et de la performance 
  • Résistance au stress et capacité à travailler efficacement en cas dincidents critiques.

Informations supplémentaires :

Type de contrat: CDI temps plein. 

PAS DE FULL REMOTE POSSIBLE. 

 


Remote Work :

No


Employment Type :

Full-time

En tant que Site Reliability Engineer (SRE) vous jouerez un rôle clé dans le maintien loptimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement dinfrastructure et dopérations pour garantir un...
View more view more

Key Skills

  • Kubernetes
  • FMEA
  • Continuous Improvement
  • Elasticsearch
  • Go
  • Root cause Analysis
  • Maximo
  • CMMS
  • Maintenance
  • Mechanical Engineering
  • Manufacturing
  • Troubleshooting

About Company

Company Logo

?? ?????????? ???????????? ???? ?????????????????????? ?????? ???? ???????????????? ALTEN is committed to meeting the expectations of its stakeholders and anticipating their requirements in the fields of innovation, R&D, and technological information systems. Founded in 1988 and pr ... View more

View Profile View Profile