Python programátor doporučování a ML klasifikátorů pro
Prague - Czech Republic
Job Summary
Pracujeme na nové generaci serveru pojďte s námi porazit ostatní sociální platformy. Každý den zaznamenáváme zhruba 2 miliony zobrazení embedu vyšší desítky tisíc nových komentářů a vyšší stovky tisíc lajků. V posledních letech šlapeme do integrace velkých jazykových modelů a píšeme si vlastní jednoduché klasifikátory i doporučovací systém.
Na čem pracujeme a na co se můžete těšit
- jednoduché klasifikátory a signály z chování uživatelů a komentářů
- doporučovací logiku (personalizace trendy relevance)
- podobnost obsahu/uživatelů včetně práce s vektory a jejich vyhledáváním
- integraci velkých jazykových modelů do reálného provozu.
- Píšeme v Pythonu 3 používáme FastAPI Flask Strawberry nebo SQLAlchemy.
- Využíváme Git. Nad každou provedenou změnou v kódu se automaticky spustí testy zabalí se do docker kontejneru a nasadí se do Kubernetes.
- Provozujeme SCRUM a nezapomínáme na Code review.
- Pracujeme v menších vývojových týmech o cca pěti až osmi vývojářích. S ostatními týmy v naší divizi sdílíme technologický základ takže si rádi pomáháme a předáváme znalosti.
- Jsme u celého procesu vývoje od nápadu přes návrh architektury až po samotnou implementaci v námi zvolených technologiích.
Hledáme kolegu který...
- má zkušenost s backendem v Pythonu
- má znalost asynchronního programování a umí navrhovat věci tak aby fungovaly i ve velkém provozu
- přemýšlí o výkonu latenci cachování a škálování (aplikace i databáze)
- nám pomůže vylepšit a dále rozvíjet náš doporučovací algoritmus konkrétně:
- ví co je kolaborativní filtrování podobnost uživatelů/obsahu případně ranking
- řešil nebo chce řešit vyhledávání podobných vektorů / embeddingy / NN
- má chuť podílet se na vývoji sociálních prvků Seznamu
- rád pracuje v týmu zajímá se o nové trendy učí se novým věcem a sdílí svoje know-how s ostatními
- nebojí se řešit zajímavé problémy a přemýšlí nad nimi.
Jaké zkušenosti navíc oceníme
- Zkušenost s distribuovanou architekturou a Kafkou.
- Zabýval(a) jste se performance optimalizacemi aplikace či databáze.
- V minulosti jste již pracoval(a) na doporučovacích algoritmech.
- Hlubší znalosti databází:
- Elasticsearch (fulltext / relevance / agregace / vektorové hledání)
- Redis (cache / pipeliny / sorted sety / optimalizace)
- PostgreSQL (optimalizace dotazů komplexní práce s daty).
Jak probíhá výběrové řízení
- Prescreen
Úvodní call kde si sladíme očekávání a projdeme vaše zkušenosti. - Technický test Codility
Online doma - Technický pohovor
Osobně v Praze.
About Company
Nejnavštěvovanější český internetový portál nabízející vyhledávač, e-mail, aktuální zprávy, předpověď počasí a odkazy, které se mohou hodit.