Database Engineer – ElasticSearch OpenSearch & Apache Iceberg
Job Summary
Contexte du poste
Alliance Services Plus (AS) recherche un(e) Ingénieur(e) Base de Données Search & Data Platform pour le compte de lun de ses clients du secteur audiovisuel.
Dans le cadre de la modernisation de sa plateforme de recherche et de gestion de données le client engage une refonte de son architecture autour de principes cloud-native : clusters de recherche conteneurisés stockage objet et formats ouverts de data lake.
Vous intégrerez une équipe technique en charge de travaux de preuve de concept et dintégration amont avec pour objectif de définir les fondations techniques de la future plateforme et de produire des livrables directement exploitables en phase de construction.
Missions principales
Dans un cadre dingénierie et dexpérimentation technique les missions pourront inclure :
La conception le déploiement et lexploitation de clusters ElasticSearch / OpenSearch en environnement de preuve de concept
Lintégration de ces plateformes sur Kubernetes via opérateurs ou déploiements Helm
La définition des topologies de clusters des stratégies de réplication de partitionnement et de cycle de vie des index
La réalisation de tests de charge de benchmarks de performance et de recommandations de tuning
La définition de procédures de sauvegarde restauration et reprise dactivité via stockage objet compatible S3
La conduite dun proof of concept autour dApache Iceberg comme format de table pour data lake
Lévaluation des solutions de catalogue des moteurs de requête et des stratégies de partitionnement et dévolution de schéma
Lautomatisation du provisioning des composants dinfrastructure et de la chaîne de déploiement
La mise en place de solutions dobservabilité (métriques logs tableaux de bord)
La rédaction de documentation technique comptes-rendus dexpérimentation et transfert de connaissances auprès des équipes projet
Environnement technique
Les projets sappuient principalement sur les technologies suivantes :
Moteurs de recherche : ElasticSearch OpenSearch
Data lake : Apache Iceberg
Orchestration & conteneurs : Docker Kubernetes Helm opérateurs
Automatisation : Ansible
Stockage objet : S3 et solutions compatibles (MinIO Ceph etc.)
Observabilité : Prometheus Grafana Kibana / OpenSearch Dashboards
Moteurs de requête (selon périmètre) : Trino Spark Flink
Systèmes : Linux scripting shell fondamentaux réseau
Profil recherché
Expérience confirmée en exploitation de clusters ElasticSearch ou OpenSearch en environnement de production ou assimilé
Bonne connaissance dApache Iceberg de son modèle de catalogues et de son intégration avec des moteurs analytiques
Maîtrise dAnsible pour lautomatisation dinfrastructure et des déploiements
Expérience de déploiement et dexploitation de workloads stateful sur Kubernetes
Bonne compréhension des architectures cloud-native du stockage objet et des problématiques de performance
Qualités attendues :
Curiosité technique et autonomie
Capacité danalyse et esprit pragmatique
Aisance rédactionnelle et capacité de formalisation
Capacité à travailler en équipe dans des environnements multi-interlocuteurs
Atouts appréciés :
Connaissance des environnements data lake (Delta Lake Hudi)
Expérience avec des moteurs analytiques modernes (Trino Spark Flink Dremio)
Expérience CI/CD appliquée à linfrastructure
Connaissance du secteur audiovisuel média ou environnements réglementés
Informations complémentaires
Localisation : Bry-sur-Marne (Île-de-France) 2 jours/semaine sur site
Langues : français courant anglais technique
About Company
GECI International est un spécialiste de la Technologie et du Digital. Depuis son origine en 1980, le Groupe innove pour concevoir et développer des solutions, produits et services intelligents pour les secteurs de la Recherche, de l’Industrie et des Services.