Data Scientist Stagiaire – Génération de tests fonctionnels avec LLMs (FH)

Toulouse - France

Monthly Salary: Not Disclosed

Posted on: 30+ days ago

Vacancies: 1 Vacancy

Job Summary

Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois

Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.

Contexte :

Les recherches sur lutilisation des Grands Modèles de Langage (ou Large Language Models LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires. Dans le domaine du software testing lun des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests telles que les tests fonctionnels. Malgré leurs succès initiaux il nest pas encore clairement établi quelle est lefficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences.

SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et lévaluation des tests générés sur des jeux de référence (benchmarks). La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte - par exemple à partir de lexpression des besoins ou des spécifications fonctionnelles - en sappuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents MoA) et Model Contex Protocol (MCP).

1 Junjie Wang et al. Software Testing with Large Language Models: Survey Landscape and Vision (arXiv 4 mars 2024) Junlin Wang et al. Mixture-of-Agents Enhances Large Language Model Capabilities (arXiv 7 juin 2024) missions sarticuleront autour des axes suivants :

Contribution au développement dun pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs
Développement dun système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins spécifications fonctionnelles)
Développement dun système dagents basés sur des LLMs inspirés de larchitecture MoA appliqué à la génération de tests fonctionnels Cypress

Qualifications :

Elève ingénieur ou universitaire en dernière année de cursus BAC5 en data science :

Connaissances en utilisation des modèles LLMs
Connaissances techniques : Python : Hugging Face Transformers LangChain AutoGen MCP
Vous êtes curieux méthodique rigoureux et autonome

Informations supplémentaires :

Quelles seront les prochaines étapes

1er entretien avec le N1
2nd entretien avec la N2

#LI-CM4

Remote Work :

Employment Type :

Full-time

Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.Contexte :Les recherches sur lutilisation des Grands Modè...

Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois

Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.

Contexte :

Contribution au développement dun pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs
Développement dun système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins spécifications fonctionnelles)
Développement dun système dagents basés sur des LLMs inspirés de larchitecture MoA appliqué à la génération de tests fonctionnels Cypress

Qualifications :

Elève ingénieur ou universitaire en dernière année de cursus BAC5 en data science :

Connaissances en utilisation des modèles LLMs
Connaissances techniques : Python : Hugging Face Transformers LangChain AutoGen MCP
Vous êtes curieux méthodique rigoureux et autonome

Informations supplémentaires :

Quelles seront les prochaines étapes

1er entretien avec le N1
2nd entretien avec la N2

#LI-CM4

Remote Work :

Employment Type :

Full-time

Key Skills

Laboratory Experience
Immunoassays
Machine Learning
Biochemistry
Assays
Research Experience
Spectroscopy
Research & Development
cGMP
Cell Culture
Molecular Biology
Data Analysis Skills

Apply Now

About Company

Scalian

Established in 1989, the Scalian Group has nearly 5,000 employees in France and abroad. It is organized into 3 business lines specializing in Digital Transformation, Digital Systems and Operations Performance. Scalian has activities in France, the United Kingdom, Belgium, Germany, ... View more

View Profile View Profile

AI AutoApply

Apply to 100+ jobs with one click