Data Scientist Stagiaire – Génération de tests fonctionnels avec LLMs (FH)

Scalian

Not Interested
Bookmark
Report This Job

profile Job Location:

Toulouse - France

profile Monthly Salary: Not Disclosed
Posted on: 7 hours ago
Vacancies: 1 Vacancy

Job Summary

Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois

Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.

Contexte :

Les recherches sur lutilisation des Grands Modèles de Langage (ou Large Language Models LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires. Dans le domaine du software testing lun des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests telles que les tests fonctionnels. Malgré leurs succès initiaux il nest pas encore clairement établi quelle est lefficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences.

SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et lévaluation des tests générés sur des jeux de référence (benchmarks). La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte - par exemple à partir de lexpression des besoins ou des spécifications fonctionnelles - en sappuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents MoA) et Model Contex Protocol (MCP).

1 Junjie Wang et al.  Software Testing with Large Language Models: Survey Landscape and Vision  (arXiv 4 mars 2024) Junlin Wang et al.  Mixture-of-Agents Enhances Large Language Model Capabilities  (arXiv 7 juin 2024) missions sarticuleront autour des axes suivants : 

  • Contribution au développement dun pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs
  • Développement dun système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins spécifications fonctionnelles)
  • Développement dun système dagents basés sur des LLMs inspirés de larchitecture MoA appliqué à la génération de tests fonctionnels Cypress

Qualifications :

Elève ingénieur ou universitaire en dernière année de cursus BAC5 en data science :

  • Connaissances en utilisation des modèles LLMs
  • Connaissances techniques : Python : Hugging Face Transformers LangChain AutoGen MCP
  • Vous êtes curieux méthodique rigoureux et autonome

Informations supplémentaires :

Quelles seront les prochaines étapes

  • 1er entretien avec le N1
  • 2nd entretien avec la N2

 

#LI-CM4


Remote Work :

No


Employment Type :

Full-time

Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.Contexte :Les recherches sur lutilisation des Grands Modè...
View more view more

Key Skills

  • Laboratory Experience
  • Immunoassays
  • Machine Learning
  • Biochemistry
  • Assays
  • Research Experience
  • Spectroscopy
  • Research & Development
  • cGMP
  • Cell Culture
  • Molecular Biology
  • Data Analysis Skills

About Company

Company Logo

Established in 1989, the Scalian Group has nearly 5,000 employees in France and abroad. It is organized into 3 business lines specializing in Digital Transformation, Digital Systems and Operations Performance. Scalian has activities in France, the United Kingdom, Belgium, Germany, ... View more

View Profile View Profile