Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois
Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.
Contexte :
Les recherches sur lutilisation des Grands Modèles de Langage (ou Large Language Models LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires. Dans le domaine du software testing lun des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests telles que les tests fonctionnels. Malgré leurs succès initiaux il nest pas encore clairement établi quelle est lefficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences.
SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et lévaluation des tests générés sur des jeux de référence (benchmarks). La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte - par exemple à partir de lexpression des besoins ou des spécifications fonctionnelles - en sappuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents MoA) et Model Contex Protocol (MCP).
1 Junjie Wang et al. Software Testing with Large Language Models: Survey Landscape and Vision (arXiv 4 mars 2024) Junlin Wang et al. Mixture-of-Agents Enhances Large Language Model Capabilities (arXiv 7 juin 2024) missions sarticuleront autour des axes suivants :
- Contribution au développement dun pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs
- Développement dun système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins spécifications fonctionnelles)
- Développement dun système dagents basés sur des LLMs inspirés de larchitecture MoA appliqué à la génération de tests fonctionnels Cypress
Qualifications :
Elève ingénieur ou universitaire en dernière année de cursus BAC5 en data science :
- Connaissances en utilisation des modèles LLMs
- Connaissances techniques : Python : Hugging Face Transformers LangChain AutoGen MCP
- Vous êtes curieux méthodique rigoureux et autonome
Informations supplémentaires :
Quelles seront les prochaines étapes
- 1er entretien avec le N1
- 2nd entretien avec la N2
#LI-CM4
Remote Work :
No
Employment Type :
Full-time
Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.Contexte :Les recherches sur lutilisation des Grands Modè...
Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois
Nous disposons au sein de chez Scalian dun Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur lensemble de la France.
Contexte :
Les recherches sur lutilisation des Grands Modèles de Langage (ou Large Language Models LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires. Dans le domaine du software testing lun des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests telles que les tests fonctionnels. Malgré leurs succès initiaux il nest pas encore clairement établi quelle est lefficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences.
SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et lévaluation des tests générés sur des jeux de référence (benchmarks). La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte - par exemple à partir de lexpression des besoins ou des spécifications fonctionnelles - en sappuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents MoA) et Model Contex Protocol (MCP).
1 Junjie Wang et al. Software Testing with Large Language Models: Survey Landscape and Vision (arXiv 4 mars 2024) Junlin Wang et al. Mixture-of-Agents Enhances Large Language Model Capabilities (arXiv 7 juin 2024) missions sarticuleront autour des axes suivants :
- Contribution au développement dun pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs
- Développement dun système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins spécifications fonctionnelles)
- Développement dun système dagents basés sur des LLMs inspirés de larchitecture MoA appliqué à la génération de tests fonctionnels Cypress
Qualifications :
Elève ingénieur ou universitaire en dernière année de cursus BAC5 en data science :
- Connaissances en utilisation des modèles LLMs
- Connaissances techniques : Python : Hugging Face Transformers LangChain AutoGen MCP
- Vous êtes curieux méthodique rigoureux et autonome
Informations supplémentaires :
Quelles seront les prochaines étapes
- 1er entretien avec le N1
- 2nd entretien avec la N2
#LI-CM4
Remote Work :
No
Employment Type :
Full-time
View more
View less