Stagiaire en intégration de données

Not Interested
Bookmark
Report This Job

profile Job Location:

Laval - Canada

profile Monthly Salary: Not Disclosed
Posted on: 11 hours ago
Vacancies: 1 Vacancy

Department:

Finance

Job Summary

Le/la stagiaire en intégration de données jouera un rôle clé dans le développement de flux de travail de traitement des données évolutifs et automatisés afin de soutenir les initiatives de science des données en cours. Ce rôle implique la création de pipelines dingestion dans Azure Databricks la conception de flux de travail de nettoyage et de validation des données basés sur Python et PySpark ainsi que la mise en œuvre des normes de lentreprise pour garantir une traçabilité complète une provenance claire des données et des processus reproductibles.

Vos responsabilités :

  • Développer des flux de travail automatisés de nettoyage et de validation des données à laide de notebooks Python et PySpark ainsi que de pipelines Databricks pour soutenir un projet de science des données.
  • Créer des pipelines dingestion robustes dans Databricks pour charger traiter et préparer efficacement les données en vue de lanalyse et de la modélisation en aval.
  • Garantir la traçabilité complète des méthodologies de nettoyage des données en concevant des flux de travail conformes à larchitecture Medallion (Bronze Argent Or) en maintenant une provenance claire et la reproductibilité.
  • Mise en place de normes dentreprise pour les carnets de nettoyage de données afin daméliorer la lisibilité la cohérence la maintenabilité et la facilité de partage entre les équipes.
  • Développement de fonctions réutilisables et bien documentées (le cas échéant) lisibles modulaires et dotées de mécanismes de gestion des erreurs robustes pour garantir un traitement des données évolutif et fiable.

Qualifications :

Qualifications requises pour rejoindre notre équipe :

  • Baccalauréat ou maîtrise en informatique science des données ingénierie des données ou domaine connexe.
  • 1 à 2 ans dexpérience dans un environnement professionnel similaire.
  • Une expérience dun an dans la création de pipelines dingestion avec PySpark et Azure Databricks est un atout majeur.
  • Expérience pratique de projets de science des données en entreprise notamment en matière de préparation et de validation des données pour la modélisation.
  • Maîtrise de Python incluant lutilisation des notebooks Jupyter dAzure Data Warehouse et des notebooks Databricks/Fabric/PySpark.
  • Une expérience en analyse exploratoire des données (EDA) et en nettoyage stratégique des données pour des initiatives de science des données est un atout majeur.

Informations supplémentaires :

Les avantages (!) :

  • Congés payés dès le premier jour ;
  • Assurance collective complète ;
  • Télémédecine (accès illimité à un médecin 24 h/24 et 7 j/7) 
  • REER collectif avec contribution de lemployeur ;
  • Bourses détudes AIM ;
  • Programme de recommandation ;
  • Rabais exclusifs pour les employés sur les pièces dans tous les établissements Honeycomb ;
  • Activités dentreprise tout au long de lannée (barbecue fête de Noël etc.) ;
  • Excellentes possibilités davancement.

Remote Work :

No


Employment Type :

Full-time

Le/la stagiaire en intégration de données jouera un rôle clé dans le développement de flux de travail de traitement des données évolutifs et automatisés afin de soutenir les initiatives de science des données en cours. Ce rôle implique la création de pipelines dingestion dans Azure Databricks la con...
View more view more

About Company

Company Logo

American Iron & Metal (AIM) American Iron & Metal (AIM) is a family-owned, Canada-based company founded in 1936. Since that day, AIM has grown to be recognized as one of the World’s most sophisticated metal recyclers, specializing in the recovery and recycling of scrap metal by-produc ... View more

View Profile View Profile