Site Reliability Engineer (expérimenté, CDI)

Valbonne - France

Monthly Salary: Not Disclosed

Posted on: 30+ days ago

Vacancies: 1 Vacancy

Job Summary

En tant que Site Reliability Engineer (SRE) vous jouerez un rôle clé dans le maintien loptimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement dinfrastructure et dopérations pour garantir une disponibilité et une résilience maximales des services et applications critiques.

Missions principales:

Maintien en conditions opérationnelles des systèmes et des applications en production en optimisant leur disponibilité performance et évolutivité.
Automatisation des tâches répétitives et des processus de déploiement de surveillance et dalerting.
Conception et mise en œuvre de solutions permettant daméliorer la fiabilité des systèmes et de réduire le taux de pannes.
Analyse des incidents et gestion des urgences avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et daccroître la résilience.
Optimisation des performances des applications et de linfrastructure notamment via la gestion des capacités et des coûts.
Collaboration avec les équipes de développement pour favoriser une approche DevOps et intégrer les pratiques SRE dès les phases de conception.
Création et suivi de métriques pour mesurer la fiabilité et les performances des systèmes (SLI SLO SLA).
Veille technologique pour assurer lamélioration continue des outils et des processus SRE.

Qualifications :

Compétences requises:

Expérience en ingénierie système : Linux/Unix gestion de serveurs stockage et réseaux.
Maîtrise des outils de monitoring et dalerting (ex. : Prometheus Grafana Datadog ELK Stack).
Compétences en automatisation : scripting (Python Bash etc.) outils de CI/CD (ex. : Jenkins GitLab CI GitHub Actions) et infrastructure-as-code (Terraform Ansible).
Expérience avec les environnements cloud : AWS GCP Azure ou autres services cloud ainsi que les architectures de microservices et conteneurs (Docker Kubernetes).
Compétences en bases de données : administration et optimisation de bases SQL et NoSQL.
Capacité à gérer les incidents : compétences en diagnostic et résolution de pannes dans un environnement de production.
Bonnes compétences en communication pour collaborer avec des équipes pluridisciplinaires et documenter les processus et solutions.

Compétences bonus

Expérience en tant que DevOps ingénieur système ou développeur logiciel
Connaissance des méthodologies de développement agile et des pratiques DevOps
Participation à la mise en place de processus dobservabilité de monitoring et de gestion des incidents
Expérience dans la gestion de la disponibilité et de la performance
Résistance au stress et capacité à travailler efficacement en cas dincidents critiques.

Informations supplémentaires :

Type de contrat: CDI temps plein.

PAS DE FULL REMOTE POSSIBLE.

Remote Work :

Employment Type :

Full-time

Missions principales:

Maintien en conditions opérationnelles des systèmes et des applications en production en optimisant leur disponibilité performance et évolutivité.
Automatisation des tâches répétitives et des processus de déploiement de surveillance et dalerting.
Conception et mise en œuvre de solutions permettant daméliorer la fiabilité des systèmes et de réduire le taux de pannes.
Analyse des incidents et gestion des urgences avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et daccroître la résilience.
Optimisation des performances des applications et de linfrastructure notamment via la gestion des capacités et des coûts.
Collaboration avec les équipes de développement pour favoriser une approche DevOps et intégrer les pratiques SRE dès les phases de conception.
Création et suivi de métriques pour mesurer la fiabilité et les performances des systèmes (SLI SLO SLA).
Veille technologique pour assurer lamélioration continue des outils et des processus SRE.

Qualifications :

Compétences requises:

Expérience en ingénierie système : Linux/Unix gestion de serveurs stockage et réseaux.
Maîtrise des outils de monitoring et dalerting (ex. : Prometheus Grafana Datadog ELK Stack).
Compétences en automatisation : scripting (Python Bash etc.) outils de CI/CD (ex. : Jenkins GitLab CI GitHub Actions) et infrastructure-as-code (Terraform Ansible).
Expérience avec les environnements cloud : AWS GCP Azure ou autres services cloud ainsi que les architectures de microservices et conteneurs (Docker Kubernetes).
Compétences en bases de données : administration et optimisation de bases SQL et NoSQL.
Capacité à gérer les incidents : compétences en diagnostic et résolution de pannes dans un environnement de production.
Bonnes compétences en communication pour collaborer avec des équipes pluridisciplinaires et documenter les processus et solutions.

Compétences bonus

Expérience en tant que DevOps ingénieur système ou développeur logiciel
Connaissance des méthodologies de développement agile et des pratiques DevOps
Participation à la mise en place de processus dobservabilité de monitoring et de gestion des incidents
Expérience dans la gestion de la disponibilité et de la performance
Résistance au stress et capacité à travailler efficacement en cas dincidents critiques.

Informations supplémentaires :

Type de contrat: CDI temps plein.

PAS DE FULL REMOTE POSSIBLE.

Remote Work :

Employment Type :

Full-time

Key Skills

Kubernetes
FMEA
Continuous Improvement
Elasticsearch
Go
Root cause Analysis
Maximo
CMMS
Maintenance
Mechanical Engineering
Manufacturing
Troubleshooting

Apply Now

About Company

ALTEN

?? ?????????? ???????????? ???? ?????????????????????? ?????? ???? ???????????????? ALTEN is committed to meeting the expectations of its stakeholders and anticipating their requirements in the fields of innovation, R&D, and technological information systems. Founded in 1988 and pr ... View more

View Profile View Profile

AI AutoApply

Apply to 100+ jobs with one click