Au sein de léquipe Data vous prenez en charge la conception lindustrialisation et loptimisation de pipelines de données sur un environnement Big Data (Hadoop/HDFS Hive Spark). Vous garantissez la qualité la traçabilité et la disponibilité des datasets qui alimentent la BI (Power BI) et les besoins analytiques des métiers.
Responsabilités clés
Qualifications :
Profil recherché :
- 2 à 4 ans dexpérience en Data Engineering/Big Data avec réalisations probantes en PySpark/Hive et Airflow.
- Formation Bac5 (Master Big Data & IA Ingénierie Data ou équivalent).
- Aisance sur les SGBD (PostgreSQL SQL Server MySQL IBM DB2) et loptimisation de requêtes.
- Habitude des environnements Linux et scripting Shell.
- Capacité à documenter tester et monitorer des pipelines en production.
Stack technique :
- Traitement Big Data : Spark / PySpark Hive HDFS ( MapReduce/Impala appréciés).
- Langages & Data : Python SQL avancé Shell (bash).
- Orchestration : Apache Airflow.
- Dataviz/BI : Power BI (dashboards datasets).
- OS & Outils : Linux (Ubuntu/CentOS) Git/GitLab CI/CD.
- Plus : Pandas/Numpy pour prototypage notions MongoDB/HBase.
Compétences comportementales :
- Rigueur et sens de la qualité (tests revues de code documentation).
- Esprit déquipe et communication claire avec les métiers et la BI.
- Autonomie sur linvestigation dincidents et proactivité damélioration continue.
- Orientation résultats : respect des SLA et culture de la performance.
Remote Work :
No
Employment Type :
Full-time
Au sein de léquipe Data vous prenez en charge la conception lindustrialisation et loptimisation de pipelines de données sur un environnement Big Data (Hadoop/HDFS Hive Spark). Vous garantissez la qualité la traçabilité et la disponibilité des datasets qui alimentent la BI (Power BI) et les besoins a...
Au sein de léquipe Data vous prenez en charge la conception lindustrialisation et loptimisation de pipelines de données sur un environnement Big Data (Hadoop/HDFS Hive Spark). Vous garantissez la qualité la traçabilité et la disponibilité des datasets qui alimentent la BI (Power BI) et les besoins analytiques des métiers.
Responsabilités clés
Qualifications :
Profil recherché :
- 2 à 4 ans dexpérience en Data Engineering/Big Data avec réalisations probantes en PySpark/Hive et Airflow.
- Formation Bac5 (Master Big Data & IA Ingénierie Data ou équivalent).
- Aisance sur les SGBD (PostgreSQL SQL Server MySQL IBM DB2) et loptimisation de requêtes.
- Habitude des environnements Linux et scripting Shell.
- Capacité à documenter tester et monitorer des pipelines en production.
Stack technique :
- Traitement Big Data : Spark / PySpark Hive HDFS ( MapReduce/Impala appréciés).
- Langages & Data : Python SQL avancé Shell (bash).
- Orchestration : Apache Airflow.
- Dataviz/BI : Power BI (dashboards datasets).
- OS & Outils : Linux (Ubuntu/CentOS) Git/GitLab CI/CD.
- Plus : Pandas/Numpy pour prototypage notions MongoDB/HBase.
Compétences comportementales :
- Rigueur et sens de la qualité (tests revues de code documentation).
- Esprit déquipe et communication claire avec les métiers et la BI.
- Autonomie sur linvestigation dincidents et proactivité damélioration continue.
- Orientation résultats : respect des SLA et culture de la performance.
Remote Work :
No
Employment Type :
Full-time
View more
View less