Ve výzkumu řešíme širokou škálu úloh pro Seznam vyhledávání z oblasti strojového učení, zejména zpracování webových stránek, textu či uživatelského chování, příležitostně i obrazu. Jelikož jsme zavedená firma se spoustou uživatelů, máme tak k dispozici velké množství různorodých dat, jejichž kvalitu zaručuje tým Bussiness Inteligence. Jako výzkum řešíme projekt od samého nápadu a formování zadání, přes přípravu dat a návrh hlavních metrik až po spolupráci na nasazení. Modely učíme na našich dedikovaných serverech s grafickými kartami pro větší výpočty. Udržování si přehledu v aktuálních trendech je nedílnou součástí naší práce, proto klademe velký důraz na vzdělávání ať už samostudiem nebo v pravidelných organizovaných reading groups. Výzkumníci mají možnost vycestovat na konferenci či přednášet na univerzitách.
Jsme tak trochu univerzální tým – řešíme zkrátka to, co je zrovna potřeba. Díky tomu se pravidelně dostáváme k pestré škále problémů i různým modalitám. Naši práci je možné potkat napříč celým vyhledáváním. Podílíme se například na enkódování HTML dokumentů, zlepšování relevance a vektorového vyhledávání v obrázkovém vyhledávání, detekci entit v dotazu) nebo třeba detekci botů. Stavíme na moderních, state-of-the-art algoritmech, které si ladíme na míru konkrétním problémům s využitím dat anotovaných našimi vlastními anotátory. Velkým benefitem je také náš vlastní GPU cluster, díky kterému můžeme rychle experimentovat i škálovat. Na projektech rádi přemýšlíme společně, takže se pravidelně potkáváme v kanceláři až třikrát týdně. A když už jsme tam, po obědě si ke kávě často střihneme i partičku ping-pongu.
Co od vás očekáváme
- Umíte programovat v jazyce Python a navrhovat efektivní algoritmy
- Orientujete se v problematice strojového učení
- Ovládáte základy Linuxu
- Máte vystudovanou vysokou školu relevantní k pozici
Co můžete očekávat
- Podílení se na formování zadání výzkumné úlohy a analýzy problému
- Příprava a analýza dat – Python, pandas, (Py)Spark, Polars
- Učení ML modelů – pracujeme se širokou škálou modelů od rozhodovacích lesů (XGBoost/CatBoost) až po hluboké neuronové sítě (PyTorch)
- Aplikace state-of-the-art metod pro zpracování jazyka a obrazu
- Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
- Vyhodnocení navržených řešení, interpretace a prezentace výsledků
- Předávání modelů a kódu do produkce např. pomocí Docker containerů
- Zajímavou a rozmanitou práci, řešení netriviálních problémů
- Velká data, možnost anotací
- Vyrábíme prototypy pro řešení těžkých problémů,
- Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
- Vlastní výkonné servery, dedikovaná výpočetní kapacita
- Sdílení znalostí a zkušeností napříč Seznamem
- Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
- Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
- Možnost HO (až 3 dny v týdnu)
Jak probíhá výběrové řízení
- Zaslání CV
Jakmile od vás obdržíme životopis, pečlivě si ho prostudujeme. Pokud budete odpovídat našim představám, ozveme se vám telefonicky. - Telefonní prescreen (cca 10 minut)
Krátce si zavoláme, abychom si ověřili základní informace – například vaše motivace, dostupnost nebo jazykové znalosti. - Rozhodnutí o postupu
Na základě prescreenu se manažer rozhodne, zda vás pozve do další fáze výběrového řízení. - Technické úkoly (2 týdny na vypracování)
Pokud postoupíte, obdržíte zadání dvou úkolů:- online programovací úloha,
- případová studie zaměřená na oblast machine learningu.
- Osobní pohovor
V případě, že budou technické úlohy vypracovány na odpovídající úrovni, pozveme vás na osobní pohovor.
Pobavíme se o vašem řešení, vaší dosavadní praxi, znalostech i o samotné pozici. Prostor bude i na vaše dotazy. - Rozhodnutí a nabídka
Po prvním kole pohovoru si obvykle manažeři udělají jasno. Pokud budete tím správným kandidátem, zašleme vám pracovní nabídku.