Co děláme

Základem mnoha systémů české internetové jedničky jsou AI technologie. Tyto systémy se neobejdou bez machine learningových modelů. Naše výzkumné oddělení se stará o personalizaci celého Seznamu, hlavně pak reklamního a doporučovacího systému. Extrahujeme užitečné informace z dat, které pak poskytujeme dalším našim službám.  Naše modely hledají vzory v chování uživatelů, klasifikují obsahy stránek, snaží se pochopit záměr vyhledávacího dotazu, modelují časové řady, detekují anomálie - a to je jenom malý výčet aplikací, se kterými se výzkum setkává.

Práce výzkumníka ovšem není jenom o učení modelů a jejich vyhodnocování, ale také o jejich debugování, analýze dat, programování, navrhování efektivních algoritmů, komunikaci s produktovými manažery a vývojem, který se stará o provoz modelů v produkci.

Nezbytnou součástí je neustálé vzdělávání, studium odborných článků a udržování si přehledu o trendech, které výzkumník může získávat třeba na špičkových zahraničních konferencích.

Co Tě čeká

Zaměříš se na výzvy spojené s interpretací uživatelského chování včetně časoprostorových dat. Budeš pracovat s daty ze služeb jako je Mapy, Sklik, Zboží, Seznam Zprávy, Novinky, Kupi a mnoho dalších. Tato data budou sloužit jako vstup pro Tvoje ML modely. Setkáš se se vším, co do ML patří: rešerše SOTA, vymýšlení zcela nových řešení i tunění desetinek, zpracování a analýza dat, modelování, vyhodnocování, debugování, AB testování, MLOps, týmová práce… To vše mezi specialisty, kteří za sebou mají desítky úspěšných (i neúspěšných) aplikací ML na reálných problémech.

Jaké technologie používáme a jak fungujeme

  • Základem je Python - Pandas, Numpy, Scikit-learn atd.
  • V rámci zpracování GEO dat pracujeme s nástroji jako je GeoPandas, MovingPandas, trackintel apod.
  • Velká data zpracováváme v PySparku na Hadoop clusterech.
  • Pro analýzy využíváme nástroje Hive, Tableau a Jupyter notebooky.
  • Modely učíme s pomocí TensorFlow, PyTorch, XGboost, Catboost, Vowpal wabbit apod.
  • Pracujeme s jazykovými modely jako je například Small-E-Czech, využíváme OpenAI API s ChatGPT a pracujeme také na adopci velkých jazykových modelů
  • Vše udržujeme pomocí GitLabu a jeho CI, Dockeru.
  • S produkťáky si plánujeme svojí práci a odbavujeme ji ve dvoutýdenních sprintech.
  • Úzce spolupracujeme s vývojáři, kteří vyvíjí infrastrukturu a starají se o provoz produkčního prostředí.

Koho hledáme

  • Hledáme někoho, pro koho je Machine Learning vášeň a intenzivně se mu věnoval a také dál chce.
  • Má dobré znalosti v oblasti strojového učení, datové analýzy a statistiky.
  • Má zájem o “časoprostorová” data - jejich analýzy, zpracování, interpretace či vizualizace.
  • Ví, že optimalizace modelu představuje jen malou část problému - nebojí se kontrolování a zpracovávání dat.
  • bakalářské nebo vyšší vzdělání v oboru strojového učení nebo několikaleté ( 3+) praktické zkušenosti s realizací projektů založených na strojovém učení.
  • Umí slušně programovat v jazyce Python a navrhovat efektivní algoritmy.
  • Zpracování dat a dotazy v SQL mu nedělají problém. Spark je pro nás jedna z fundamentálních technologií. Pokud v něm umí, bod navíc.
  • Umí číst dokumentaci a odborné články v anglickém jazyce.
  • Umí pracovat samostatně a aktivně komunikovat. Pracovat v týmu Vám nedělá problémy.

Co nabízíme

  • Kreativní prostředí - budeš moct realizovat vlastní nápady a postupy.
  • Velký impakt - budeš se podílet na rozvoji systémů, které denně využívá tisíce inzerentů a ovlivňují obsah internetu pro miliony uživatelů.
  • Osobní rozvoj – budeš mít k dispozici široké možnosti vzdělávání v rámci projektů, vyhrazený čas na vzdělávání podle vlastní volby, na účast na odborných konferencích, na prezentace výzkumu na interních a externích akcích, včetně předávání znalostí napříč týmy.
  • Týmovou spolupráci – budeš spolupracovat s dalšími výzkumníky a výzkumnými týmy, předávat si s nimi informace a znalosti a společně hledat vhodné cesty a řešení.
  • Neformální prostředí – všichni si tady tykáme a nemáme předepsaný dress code.

Seznam.cz, a.s.