Vi söker en ingenjör som kan vidareutveckla och produktionssätta en lösning för att analysera och ställa frågor mot ostrukturerade dokument med hjälp av generativ AI.
Vi har redan byggt en proof-of-concept där dokument ingestas till Databricks transformeras till embeddings och används i en RAG-baserad lösning där en agent kan svara på frågor baserat på dokumentinnehåll. Nu behöver vi någon som kan ta detta vidare till en mer robust lösning.
Arbetet handlar primärt om att utveckla pipelines och applikationslogik för dokumentanalys och retrieval med hjälp av Databricks och Mosaic AI.
Arbetsuppgifter
Rollen fokuserar på att utveckla en end-to-end pipeline för att hantera och analysera dokument.
Dokumentingestion
ingestera dokument (PDF text etc.)
extrahera text och metadata
strukturera dokument för vidare bearbetning
Preprocessing
chunking av dokument
metadatahantering
versionshantering av dokument
Embeddings och indexering
generera embeddings
bygga och uppdatera vector index
hantera uppdateringar och reindexering
Retrieval och RAG
implementera retrieval pipelines
konstruera prompts och kontext
optimera svarskvalitet
GenAI-applikation
utveckla backend eller API för en applikation där användare kan ställa frågor mot dokument
integrera mot LLM-endpoints
hantera svar kontext och citations
Robusthet och drift
göra lösningen stabil och skalbar
hantera latency kostnader och observability
förbättra kvalitet och svarsprecision
Teknisk kompetens
Databricks
Databricks notebooks / jobs
Spark / PySpark
Delta Lake
Databricks Vector Search
Mosaic AI (eller liknande LLM-integration)
GenAI
RAG-arkitektur
embeddings
vector search
prompt design
Programmering
Python
API-utveckling (. FastAPI)
Git och CI/CD
Erfarenhet
har erfarenhet av att bygga RAG-lösningar eller LLM-baserade applikationer
har arbetat praktiskt med dokumentanalys eller textdata
har erfarenhet av Databricks eller liknande data-/ML-plattform
kan ta en prototyp till en mer stabil och produktionsklar lösning
minst 10 års erfarenhet inom området
Var god förklara hur du uppfyller alla kraven.
Omfattning: 100%
Ort: Stockholm
Period:
Sista ansökningdag:
Vi presenterar löpande. Om du är intresserad av ett uppdrag rekommenderar vi att du skickar in din ansökan så snart som möjligt.
Vi är en konsultbyrå som består av drivna och branschkunniga personer i blandade åldrar med mångårig samlad erfarenhet och strävar efter att bli en komplett IT-konsultleverantör. Vi erbjuder kompetenser inom bl. a. Systemutveckling, Infrastruktur, Projektledning, Test, IT-säkerhet, Au ... View more