Telco Cloud Openshift Systems Engineer

Scalian

Job Location:

Montreal - Canada

Monthly Salary: Not Disclosed

Posted on: 30+ days ago

Vacancies: 1 Vacancy

Job Summary

Role and Responsibilities:
We are looking for a senior engineer who can bridge traditional telecom core/transport expertise with deep Kubernetes/Cloud Native skill sets to support a project to build the next generation cloud native Radio Access Network (RAN) platform that will run on RedHatOpenShift. The successful candidate will design deploy and optimize containerized Distributed Unit (DU) and Central Unit (CU) functions guarantee carrier grade performance (SR IOV CPU pinning low latency) and own the life cycle of the OpenShift clusters that host the RAN software.

Main tasks and responsibilities include:

OpenShift / Kubernetes Operations:
- Deploy and manage production-grade OpenShift clusters (4.x/5.x)
- Create and maintain Helm charts and Operators for DU/CU micro-services
- Implement and tune CI/CD pipelines (GitLab/Jenkins/ArgoCD)
- Configure and monitor CNI stacks (OVS-DPDK Multus) and SR-IOV VF pools for RAN performance
- Package DU and CU functions (e.g. O-RANDU 2G Core (MSC HLR) 5G-Core UPF) as OCI images
- Perform CPU-pinning HugePages NUMA-aware scheduling and kernel-tuning for sub-millisecond latency
- Drive rolling upgrades of DU/CU pods with zero-impact on active traffic
Performance & Reliability Engineering:
- Conduct latency throughput and jitter measurements; use Prometheus/Grafana dashboards to drive optimisation
- Diagnose pod crashes etcd corruption network-policy violations and storage-class mismatches
- Apply resource-limit policies (requests/limits) and pod-restart strategies to meet carrier SLAs
Transport & Core Expertise:
- Design UPF placement (edge vs. central gateway) and configure N2/N3 interfaces
- Work on IP routing QoS SyncE/PTP and eCPRI transport plumbing
- Collaborate with the Core-5G teams (AMF SMF UPF) to ensure inter-operability
Automation & Monitoring:
- Build Helm-based operators that self-heal (Pod-Disruption-Budgets etc.)
- Extend Prometheus exporters for RAN KPIs (PRB utilisation RRC state distribution)
- Set up Grafana alerts for latency >1ms CPU-pinning drift or VF exhaustion
Cross-Functional Coordination Stakeholder & Program Interaction:
- Support post-deployment performance reviews and on-orbit (live-network) incident investigations
- Communicate technical status risk assessments and trade-study results to senior management and/or customers or partners
- Participate in pre-sale technical workshops RFP responses and on-site demos for carriers
Integration & Verification (IVV):
- Author System Verification Master Plan covering unit-test subsystem & System tests
- Define test-automation framework set-up test-case definition results analysis and test-report certification
Configuration Documentation & Standards Management:
- Produce System Requirements Documents (SRD) Interface Control Documents (ICD) and run-books (cluster-recovery etcd restore)
- Ensure all artefacts analysis firmware deliverables and documentation are version controlled in PLM environment
- Chair design reviews (SRR PDR CDR MRR/TRRetc.)
- Support Technology Road-Mapping & Innovation

***

Rôle et responsabilités :
Nous recherchons un.e ingénieur.e senior capable de combiner une expertise traditionnelle en matière de cœur de réseau et de transport de télécommunications avec des compétences approfondies en Kubernetes et en technologies cloud natives afin de contribuer à un projet visant à développer la plateforme de réseau daccès radio (RAN) cloud native de nouvelle génération qui fonctionnera sur Red Hat OpenShift. Le candidat retenu sera chargé de concevoir de déployer et doptimiser les fonctions conteneurisées de lunité distribuée (DU) et de lunité centrale (CU) de garantir des performances de niveau opérateur (SR IOV CPU pinning faible latence) et de gérer le cycle de vie des clusters OpenShift hébergeant le logiciel RAN.

Les principales responsabilités incluent:

Opérations OpenShift / Kubernetes :
- Déployer et gérer des clusters OpenShift de niveau production (4.x/5.x)
- Créer et maintenir des Helm Charts et des opérateurs pour les microservices DU/CU
- Mettre en œuvre et optimiser les pipelines CI/CD (GitLab/Jenkins/ArgoCD)
- Configurer et surveiller les piles CNI (OVS-DPDK Multus) et les pools de VF SR-IOV pour les performances RAN
- Empaqueter les fonctions DU et CU (par exemple O-RANDU cœur 2G (MSC HLR) cœur 5G UPF) sous forme dimages OCI
- Effectuer le CPU-pinning lutilisation de HugePages la planification NUMA-aware et loptimisation du noyau pour une latence inférieure à la milliseconde
- Mener des mises à niveau progressives des pods DU/CU sans aucun impact sur le trafic actif
Ingénierie des performances et de la fiabilité :
- Effectuer des mesures de latence de débit et de gigue ; utiliser les tableaux de bord Prometheus/Grafana pour piloter loptimisation
- Diagnostiquer les plantages de pods la corruption detcd les violations des politiques réseau et les incompatibilités de classe de stockage
- Appliquer des politiques de limitation des ressources (requêtes/limites) et des stratégies de redémarrage des pods pour respecter les SLA des opérateurs
Expertise en transport et cœur de réseau :
- Concevoir le placement des UPF (passerelle périphérique ou centrale) et configurer les interfaces N2/N3
- Travailler sur le routage IP la QoS SyncE/PTP et linfrastructure de transport eCPRI
- Collaborer avec les équipes Core-5G (AMF SMF UPF) pour garantir linteropérabilité
Automatisation et surveillance :
- Développer des opérateurs basés sur Helm dotés de capacités dauto-réparation (Pod-Disruption-Budgets etc.)
- Étendre les exportateurs Prometheus pour les indicateurs de performance clés (KPI) du RAN (utilisation du PRB distribution des états RRC)
- Configurer des alertes Grafana pour une latence > 1 ms une dérive du CPU-pinning ou lépuisement des VF
Coordination interfonctionnelle interaction avec les parties prenantes et les programmes :
- Assurer le suivi des évaluations de performances après le déploiement et mener des enquêtes sur les incidents en orbite (réseau en service)
- Communiquer létat davancement technique les évaluations des risques et les résultats des analyses comparatives à la direction et/ou aux clients ou partenaires
- Participer à des ateliers techniques de prévente à la rédaction de réponses aux appels doffres et à des démonstrations sur site pour les opérateurs
Intégration et vérification (IVV) :
- Rédiger le plan directeur de vérification du système couvrant les tests unitaires les tests de sous-systèmes et les tests système
- Définir la mise en place du cadre dautomatisation des tests la définition des cas de test lanalyse des résultats et la certification des rapports de test
Gestion de la configuration de la documentation et des normes :
- Produire les documents dexigences système (SRD) les documents de contrôle dinterface (ICD) et les manuels dexploitation (récupération de cluster restauration etcd)
- Sassurer que tous les artefacts analyses micrologiciels livrables et documents sont soumis à un contrôle de version dans lenvironnement PLM
- Présider les revues de conception (SRR PDR CDR MRR/TRR etc.)
- Soutenir la feuille de route technologique et linnovation

Qualifications :

Required Qualifications:

Bachelors degree in Electrical Engineering Computer science or Telecommunications with 8 years of experience in telecom core/transport and in Cloud Native/Kubernetes environments
Demonstrated deployments of containerized DU/CU or similar RAN functions at scale
Experience with 5G Core (AMF SMF UPF) and N2/N3 interfaces; IP routing & QoS; SyncE vs. PTP; eCPRI
Ability to write/review Helm charts and develop Kubernetes Operators (Go or Ansible)
Multus OVN Kubernetes Calico or Cilium; deep understanding of SR IOV VF configuration & DPDP
Strong technical writing ability and presentation skills; comfortable interfacing with customers suppliers and senior leadership
Hands-on individual who can support systems integration processes and capability to test systems and resolve problems
High degree of attention to detail
Experience with Confluence and JIRA
Demonstrated capability to efficiently work with little to no supervision
Ability to distill complex problems to fundamentals to solve with analysis similarity or creativity
Demonstrate excellent written and oral communication skills in English; knowledge of French will be considered an asset

***

Qualifications requises :

Diplôme en génie électrique en informatique ou en télécommunications avec au moins 8 ans dexpérience dans les domaines du cœur de réseau et du transport télécoms ainsi que dans les environnements Cloud Native/Kubernetes
Expérience avérée dans le déploiement à grande échelle de fonctions RAN conteneurisées (DU/CU) ou similaires
Expérience avec le cœur de réseau 5G (AMF SMF UPF) et les interfaces N2/N3 ; routage IP et QoS ; SyncE vs PTP ; eCPRI
Capacité à rédiger/réviser des Helm Charts et à développer des opérateurs Kubernetes (Go ou Ansible)
Multus OVN Kubernetes Calico ou Cilium ; compréhension approfondie de la configuration SR IOV VF et du DPDP
Solides compétences en rédaction technique et en présentation ; aisance dans les relations avec les clients les fournisseurs et la direction
Personne pragmatique capable de soutenir les processus dintégration des systèmes et de tester les systèmes et résoudre les problèmes
Grand souci du détail
Expérience avec Confluence et JIRA
Capacité avérée à travailler efficacement avec peu ou pas de supervision
Capacité à décomposer des problèmes complexes en éléments fondamentaux pour les résoudre par lanalyse la comparaison ou la créativité
Excellentes compétences en communication écrite et orale en anglais ; la connaissance du français sera considérée comme un atout

Additional Information :

Why join our team

Gain valuable experience across various sectors and critical projects while advancing within the same company;
Enjoy a competitive salary and a comprehensive benefits package (health and dental insurance life and long-term disability insurance group RRSP with company Access continuous training to expand your knowledge and stay on the cutting edge of technology;
Access continuous training to expand your knowledge and stay on the cutting edge of technology;
Build a personalized career path aligned with your professional goals;
Explore international work opportunities through our mobility program and global presence;
Join a dynamic specialized and growing team where communication is key and each team member is valued;
Be part of a team where professional fulfillment is a priority (team buildings happy hours marathons and much more!).

***

Pourquoi rejoindre notre équipe

Acquérir une expérience enrichissante au sein de divers secteurs et projets critiques tout en évoluant dans une même entreprise ;
Profiter dun salaire compétitif et dun ensemble davantages sociaux attractifs (assurance santé et dentaire assurance vie et invalidité de longue durée REER collectif avec contribution de lentreprise congés maladie etc.) ;
Accéder à des formations continues pour élargir vos connaissances et rester à la pointe des technologies ;
Construire un plan de carrière personnalisé aligné avec vos objectifs professionnels ;
Explorer des opportunités de travail à linternational grâce à notre programme de mobilité et notre présence mondiale ;
Intégrer un groupe dynamique spécialisé et en pleine croissance où la communication est essentielle et où chaque membre de léquipe est valorisé ;
Faire partie dune équipe où lépanouissement professionnel est une priorité (team buildings 5 à 7 marathons et bien plus encore !).

Remote Work :

Employment Type :

Full-time

Role and Responsibilities:We are looking for a senior engineer who can bridge traditional telecom core/transport expertise with deep Kubernetes/Cloud Native skill sets to support a project to build the next generation cloud native Radio Access Network (RAN) platform that will run on RedHatOpenShift....

Main tasks and responsibilities include:

OpenShift / Kubernetes Operations:
- Deploy and manage production-grade OpenShift clusters (4.x/5.x)
- Create and maintain Helm charts and Operators for DU/CU micro-services
- Implement and tune CI/CD pipelines (GitLab/Jenkins/ArgoCD)
- Configure and monitor CNI stacks (OVS-DPDK Multus) and SR-IOV VF pools for RAN performance
- Package DU and CU functions (e.g. O-RANDU 2G Core (MSC HLR) 5G-Core UPF) as OCI images
- Perform CPU-pinning HugePages NUMA-aware scheduling and kernel-tuning for sub-millisecond latency
- Drive rolling upgrades of DU/CU pods with zero-impact on active traffic
Performance & Reliability Engineering:
- Conduct latency throughput and jitter measurements; use Prometheus/Grafana dashboards to drive optimisation
- Diagnose pod crashes etcd corruption network-policy violations and storage-class mismatches
- Apply resource-limit policies (requests/limits) and pod-restart strategies to meet carrier SLAs
Transport & Core Expertise:
- Design UPF placement (edge vs. central gateway) and configure N2/N3 interfaces
- Work on IP routing QoS SyncE/PTP and eCPRI transport plumbing
- Collaborate with the Core-5G teams (AMF SMF UPF) to ensure inter-operability
Automation & Monitoring:
- Build Helm-based operators that self-heal (Pod-Disruption-Budgets etc.)
- Extend Prometheus exporters for RAN KPIs (PRB utilisation RRC state distribution)
- Set up Grafana alerts for latency >1ms CPU-pinning drift or VF exhaustion
Cross-Functional Coordination Stakeholder & Program Interaction:
- Support post-deployment performance reviews and on-orbit (live-network) incident investigations
- Communicate technical status risk assessments and trade-study results to senior management and/or customers or partners
- Participate in pre-sale technical workshops RFP responses and on-site demos for carriers
Integration & Verification (IVV):
- Author System Verification Master Plan covering unit-test subsystem & System tests
- Define test-automation framework set-up test-case definition results analysis and test-report certification
Configuration Documentation & Standards Management:
- Produce System Requirements Documents (SRD) Interface Control Documents (ICD) and run-books (cluster-recovery etcd restore)
- Ensure all artefacts analysis firmware deliverables and documentation are version controlled in PLM environment
- Chair design reviews (SRR PDR CDR MRR/TRRetc.)
- Support Technology Road-Mapping & Innovation

***

Les principales responsabilités incluent:

Opérations OpenShift / Kubernetes :
- Déployer et gérer des clusters OpenShift de niveau production (4.x/5.x)
- Créer et maintenir des Helm Charts et des opérateurs pour les microservices DU/CU
- Mettre en œuvre et optimiser les pipelines CI/CD (GitLab/Jenkins/ArgoCD)
- Configurer et surveiller les piles CNI (OVS-DPDK Multus) et les pools de VF SR-IOV pour les performances RAN
- Empaqueter les fonctions DU et CU (par exemple O-RANDU cœur 2G (MSC HLR) cœur 5G UPF) sous forme dimages OCI
- Effectuer le CPU-pinning lutilisation de HugePages la planification NUMA-aware et loptimisation du noyau pour une latence inférieure à la milliseconde
- Mener des mises à niveau progressives des pods DU/CU sans aucun impact sur le trafic actif
Ingénierie des performances et de la fiabilité :
- Effectuer des mesures de latence de débit et de gigue ; utiliser les tableaux de bord Prometheus/Grafana pour piloter loptimisation
- Diagnostiquer les plantages de pods la corruption detcd les violations des politiques réseau et les incompatibilités de classe de stockage
- Appliquer des politiques de limitation des ressources (requêtes/limites) et des stratégies de redémarrage des pods pour respecter les SLA des opérateurs
Expertise en transport et cœur de réseau :
- Concevoir le placement des UPF (passerelle périphérique ou centrale) et configurer les interfaces N2/N3
- Travailler sur le routage IP la QoS SyncE/PTP et linfrastructure de transport eCPRI
- Collaborer avec les équipes Core-5G (AMF SMF UPF) pour garantir linteropérabilité
Automatisation et surveillance :
- Développer des opérateurs basés sur Helm dotés de capacités dauto-réparation (Pod-Disruption-Budgets etc.)
- Étendre les exportateurs Prometheus pour les indicateurs de performance clés (KPI) du RAN (utilisation du PRB distribution des états RRC)
- Configurer des alertes Grafana pour une latence > 1 ms une dérive du CPU-pinning ou lépuisement des VF
Coordination interfonctionnelle interaction avec les parties prenantes et les programmes :
- Assurer le suivi des évaluations de performances après le déploiement et mener des enquêtes sur les incidents en orbite (réseau en service)
- Communiquer létat davancement technique les évaluations des risques et les résultats des analyses comparatives à la direction et/ou aux clients ou partenaires
- Participer à des ateliers techniques de prévente à la rédaction de réponses aux appels doffres et à des démonstrations sur site pour les opérateurs
Intégration et vérification (IVV) :
- Rédiger le plan directeur de vérification du système couvrant les tests unitaires les tests de sous-systèmes et les tests système
- Définir la mise en place du cadre dautomatisation des tests la définition des cas de test lanalyse des résultats et la certification des rapports de test
Gestion de la configuration de la documentation et des normes :
- Produire les documents dexigences système (SRD) les documents de contrôle dinterface (ICD) et les manuels dexploitation (récupération de cluster restauration etcd)
- Sassurer que tous les artefacts analyses micrologiciels livrables et documents sont soumis à un contrôle de version dans lenvironnement PLM
- Présider les revues de conception (SRR PDR CDR MRR/TRR etc.)
- Soutenir la feuille de route technologique et linnovation

Qualifications :

Required Qualifications:

Bachelors degree in Electrical Engineering Computer science or Telecommunications with 8 years of experience in telecom core/transport and in Cloud Native/Kubernetes environments
Demonstrated deployments of containerized DU/CU or similar RAN functions at scale
Experience with 5G Core (AMF SMF UPF) and N2/N3 interfaces; IP routing & QoS; SyncE vs. PTP; eCPRI
Ability to write/review Helm charts and develop Kubernetes Operators (Go or Ansible)
Multus OVN Kubernetes Calico or Cilium; deep understanding of SR IOV VF configuration & DPDP
Strong technical writing ability and presentation skills; comfortable interfacing with customers suppliers and senior leadership
Hands-on individual who can support systems integration processes and capability to test systems and resolve problems
High degree of attention to detail
Experience with Confluence and JIRA
Demonstrated capability to efficiently work with little to no supervision
Ability to distill complex problems to fundamentals to solve with analysis similarity or creativity
Demonstrate excellent written and oral communication skills in English; knowledge of French will be considered an asset

***

Qualifications requises :

Diplôme en génie électrique en informatique ou en télécommunications avec au moins 8 ans dexpérience dans les domaines du cœur de réseau et du transport télécoms ainsi que dans les environnements Cloud Native/Kubernetes
Expérience avérée dans le déploiement à grande échelle de fonctions RAN conteneurisées (DU/CU) ou similaires
Expérience avec le cœur de réseau 5G (AMF SMF UPF) et les interfaces N2/N3 ; routage IP et QoS ; SyncE vs PTP ; eCPRI
Capacité à rédiger/réviser des Helm Charts et à développer des opérateurs Kubernetes (Go ou Ansible)
Multus OVN Kubernetes Calico ou Cilium ; compréhension approfondie de la configuration SR IOV VF et du DPDP
Solides compétences en rédaction technique et en présentation ; aisance dans les relations avec les clients les fournisseurs et la direction
Personne pragmatique capable de soutenir les processus dintégration des systèmes et de tester les systèmes et résoudre les problèmes
Grand souci du détail
Expérience avec Confluence et JIRA
Capacité avérée à travailler efficacement avec peu ou pas de supervision
Capacité à décomposer des problèmes complexes en éléments fondamentaux pour les résoudre par lanalyse la comparaison ou la créativité
Excellentes compétences en communication écrite et orale en anglais ; la connaissance du français sera considérée comme un atout

Additional Information :

Why join our team

Gain valuable experience across various sectors and critical projects while advancing within the same company;
Enjoy a competitive salary and a comprehensive benefits package (health and dental insurance life and long-term disability insurance group RRSP with company Access continuous training to expand your knowledge and stay on the cutting edge of technology;
Access continuous training to expand your knowledge and stay on the cutting edge of technology;
Build a personalized career path aligned with your professional goals;
Explore international work opportunities through our mobility program and global presence;
Join a dynamic specialized and growing team where communication is key and each team member is valued;
Be part of a team where professional fulfillment is a priority (team buildings happy hours marathons and much more!).

***

Pourquoi rejoindre notre équipe

Acquérir une expérience enrichissante au sein de divers secteurs et projets critiques tout en évoluant dans une même entreprise ;
Profiter dun salaire compétitif et dun ensemble davantages sociaux attractifs (assurance santé et dentaire assurance vie et invalidité de longue durée REER collectif avec contribution de lentreprise congés maladie etc.) ;
Accéder à des formations continues pour élargir vos connaissances et rester à la pointe des technologies ;
Construire un plan de carrière personnalisé aligné avec vos objectifs professionnels ;
Explorer des opportunités de travail à linternational grâce à notre programme de mobilité et notre présence mondiale ;
Intégrer un groupe dynamique spécialisé et en pleine croissance où la communication est essentielle et où chaque membre de léquipe est valorisé ;
Faire partie dune équipe où lépanouissement professionnel est une priorité (team buildings 5 à 7 marathons et bien plus encore !).

Remote Work :

Employment Type :

Full-time

Apply Now

About Company

Scalian

Established in 1989, the Scalian Group has nearly 5,000 employees in France and abroad. It is organized into 3 business lines specializing in Digital Transformation, Digital Systems and Operations Performance. Scalian has activities in France, the United Kingdom, Belgium, Germany, ... View more

View Profile View Profile

AI AutoApply

Apply to 100+ jobs with one click