Au sein du Data & IA Hub SOCOTEC vous rejoignez une équipe pluridisciplinaire chargée de concevoir déployer et maintenir larchitecture Data du groupe à léchelle internationale.
Vous contribuerez à la modernisation du Lakehouse SOCOTEC cœur de la plateforme analytique mondiale et participerez à des projets concrets de valorisation des données de la conception à la data visualisation.
Vous travaillerez sur troismissions principales :
Développer des pipelines de données de bout en bout (ingestion transformation modélisation exposition) et contribuer à la mise en place de visualisations dans Power BI ou Databricks SQL.
Améliorer en continu le Lakehouse SOCOTEC notamment sur les volets gouvernance qualité et pseudonymisation des données.
Expérimenter des solutions dIA générative appliquées à la data comme GenIE de Databricks pour transformer des requêtes textuelles en insights exploitables.
Le stack technique utilisée :
- Amazon Web Services (AWS)
- Databricks
- Fivetran
- Spark pour les pipelines ETL
- Gitlab pour versionner les sources
- S3
- Power BI loutil de BI géré avec les équipes BI
Chez SOCOTEC les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique management dune équipe (lead data) etc.
Vous aurez la possibilité dinteragir à linternational (US UK ITA ESP NL) et des opportunités de mobilité internationale sont possibles.
Vous ferez preuve dautonomie de sagacité et de qualités certaines dans la rédaction et la communication de son code. Loffre peut déboucher sur un CDI à la fin du stage.
Qualifications :
- Master en Big Data Informatique ou Ingénierie logicielle avec une forte spécialisation ou appétence pour la data et les architectures distribuées.
- Solide maîtrise des bases de données SQL et NoSQL (modélisation requêtes optimisées intégrité et performance).
- Bonne compréhension des architectures Big Data et des outils de traitement distribués (Spark Hadoop Airflow Kafka Delta Lake).
- Expérience avec les environnements de développement collaboratif : Git GitLab Jupyter Notebooks VS Code.
- Connaissances appréciées des services cloud AWS (S3 Lambda EMR Glue Redshift).
- Familiarité avec les principes dETL/ELT de Data Lakehouse et de DataOps (CI/CD monitoring qualité de données).
- Intérêt pour les technologies émergentes notamment lIA Générative et son intégration dans les plateformes Data.
- Esprit déquipe rigueur et sens de la collaboration dans un environnement agile.
- Curiosité technique et capacité à apprendre rapidement de nouveaux outils et paradigmes.
- Autonomie sens du service et goût pour la résolution de problèmes complexes.
- Anglais courant et technique à lécrit comme à loral.
Informations supplémentaires :
En intégrant le Data & IA Hub vous entrerez dans une entité avec lesprit Start-up. Vous deviendrez membre dune équipe jeune avec une politique RH tournée vers la satisfaction de ses collaborateurs.
Pour vous accompagner dans votre montée en compétences SOCOTEC financera deux certifications reconnues internationalement : Cloud Pratictioner AWS et AWS Certified Machine Learning Specialty.
Vous prendrez part à des projets captivants et de grande envergure où vous aurez un vrai
rôle à jouer !
Vous vous engagez sur la charte des valeurs qui font le socle de la société :
- Cohésion & Dynamisme
- Performance & Qualité
- Innovation & Excellence Technique
Ce stage sinscrit dans une démarche de pré-embauche : les stagiaires démontrant leur autonomie et leur maîtrise technique se voient régulièrement proposer une offre en CDI à lissue de leur stage.
Remote Work :
No
Employment Type :
Full-time
Au sein du Data & IA Hub SOCOTEC vous rejoignez une équipe pluridisciplinaire chargée de concevoir déployer et maintenir larchitecture Data du groupe à léchelle internationale.Vous contribuerez à la modernisation du Lakehouse SOCOTEC cœur de la plateforme analytique mondiale et participerez à des pr...
Au sein du Data & IA Hub SOCOTEC vous rejoignez une équipe pluridisciplinaire chargée de concevoir déployer et maintenir larchitecture Data du groupe à léchelle internationale.
Vous contribuerez à la modernisation du Lakehouse SOCOTEC cœur de la plateforme analytique mondiale et participerez à des projets concrets de valorisation des données de la conception à la data visualisation.
Vous travaillerez sur troismissions principales :
Développer des pipelines de données de bout en bout (ingestion transformation modélisation exposition) et contribuer à la mise en place de visualisations dans Power BI ou Databricks SQL.
Améliorer en continu le Lakehouse SOCOTEC notamment sur les volets gouvernance qualité et pseudonymisation des données.
Expérimenter des solutions dIA générative appliquées à la data comme GenIE de Databricks pour transformer des requêtes textuelles en insights exploitables.
Le stack technique utilisée :
- Amazon Web Services (AWS)
- Databricks
- Fivetran
- Spark pour les pipelines ETL
- Gitlab pour versionner les sources
- S3
- Power BI loutil de BI géré avec les équipes BI
Chez SOCOTEC les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique management dune équipe (lead data) etc.
Vous aurez la possibilité dinteragir à linternational (US UK ITA ESP NL) et des opportunités de mobilité internationale sont possibles.
Vous ferez preuve dautonomie de sagacité et de qualités certaines dans la rédaction et la communication de son code. Loffre peut déboucher sur un CDI à la fin du stage.
Qualifications :
- Master en Big Data Informatique ou Ingénierie logicielle avec une forte spécialisation ou appétence pour la data et les architectures distribuées.
- Solide maîtrise des bases de données SQL et NoSQL (modélisation requêtes optimisées intégrité et performance).
- Bonne compréhension des architectures Big Data et des outils de traitement distribués (Spark Hadoop Airflow Kafka Delta Lake).
- Expérience avec les environnements de développement collaboratif : Git GitLab Jupyter Notebooks VS Code.
- Connaissances appréciées des services cloud AWS (S3 Lambda EMR Glue Redshift).
- Familiarité avec les principes dETL/ELT de Data Lakehouse et de DataOps (CI/CD monitoring qualité de données).
- Intérêt pour les technologies émergentes notamment lIA Générative et son intégration dans les plateformes Data.
- Esprit déquipe rigueur et sens de la collaboration dans un environnement agile.
- Curiosité technique et capacité à apprendre rapidement de nouveaux outils et paradigmes.
- Autonomie sens du service et goût pour la résolution de problèmes complexes.
- Anglais courant et technique à lécrit comme à loral.
Informations supplémentaires :
En intégrant le Data & IA Hub vous entrerez dans une entité avec lesprit Start-up. Vous deviendrez membre dune équipe jeune avec une politique RH tournée vers la satisfaction de ses collaborateurs.
Pour vous accompagner dans votre montée en compétences SOCOTEC financera deux certifications reconnues internationalement : Cloud Pratictioner AWS et AWS Certified Machine Learning Specialty.
Vous prendrez part à des projets captivants et de grande envergure où vous aurez un vrai
rôle à jouer !
Vous vous engagez sur la charte des valeurs qui font le socle de la société :
- Cohésion & Dynamisme
- Performance & Qualité
- Innovation & Excellence Technique
Ce stage sinscrit dans une démarche de pré-embauche : les stagiaires démontrant leur autonomie et leur maîtrise technique se voient régulièrement proposer une offre en CDI à lissue de leur stage.
Remote Work :
No
Employment Type :
Full-time
View more
View less