En tant quIngnieur Data vous rejoindrez notre quipe data afin de participer des projets stratgiques danalyse de donnes et de mise en place de solutions de traitement de donnes grande chelle. Vous serez responsable de la conception de loptimisation et du dveloppement de pipelines de donnes sur des plateformes cloud avec un focus sur lutilisation de PySpark et Azure Data Factory.
Vos principales missions seront :
- Concevoir dvelopper et maintenir des pipelines de donnes grande chelle utilisant PySpark.
- Mettre en place des flux de donnes avec Azure Data Factory en intgrant des sources et destinations de donnes varies (SQL Data Lakes APIs etc.).
- Assurer lintgration de donnes provenant de systmes varis dans un environnement cloud (Azure).
- Optimiser les performances des traitements de donnes (SQL PySpark etc.).
- Collaborer avec les quipes mtier data analysts et data scientists pour comprendre les besoins et proposer des solutions efficaces et scalables.
- Participer la dfinition de larchitecture des donnes et de la stratgie de gouvernance.
- Mettre en place et assurer le monitoring des jobs de traitement de donnes (gestion des erreurs gestion des performances).
- Documenter les solutions mises en place et suivre les bonnes pratiques de dveloppement.
- Participer lamlioration continue des processus et outils existants.
Qualifications :
Nous recherchons un candidat ayant une forte expertise technique en gestion et traitement de donnes grande chelle avec les comptences suivantes :
Comptences techniques :
- Matrise de PySpark pour le traitement de donnes massives en environnement distribu.
- Exprience significative dans la mise en place et la gestion de Azure Data Factory pour la cration et lorchestration de pipelines de donnes.
- Solide exprience en bases de donnes relationnelles et non relationnelles (SQL NoSQL).
- Connaissance des outils de gestion de donnes dans lcosystme Azure (Azure Data Lake Azure SQL Database Azure Blob Storage etc.).
- Connaissances pratiques des services cloud Azure et de leur utilisation dans des solutions de traitement de donnes (Azure Databricks Azure Synapse Analytics etc.).
- Exprience avec des outils de gestion de versions (Git Azure DevOps etc.) et des bonnes pratiques de dveloppement logiciel.
- Connaissance des concepts de Big Data et de loptimisation des performances dans des environnements distribus.
Aptitudes personnelles :
- Autonomie rigueur et sens du dtail.
- Excellente capacit rsoudre des problmes techniques complexes.
- Bonnes comptences en communication et capacit travailler en quipe.
- Esprit danalyse et capacit comprendre les besoins mtier pour proposer des solutions adaptes.
Formation et exprience :
- Bac 5 en informatique data science ou dans un domaine quivalent.
- Minimum de 3 ans dexprience sur un poste similaire avec une exprience confirme en dveloppement sur PySpark et Azure Data Factory.
Informations supplmentaires :
Pourquoi rejoindre notre quipe
- Un environnement dynamique et innovant au sein dune quipe passionne par les technologies de donnes.
- La possibilit de travailler sur des projets denvergure la pointe des technologies cloud et Big Data.
- Des opportunits dvolution et de formation continue pour dvelopper vos comptences.
- Un cadre de travail flexible et des avantages attractifs.
Remote Work :
No
Employment Type :
Full-time