Latent Axiom — fundamentalny model latentnego stanu użytkownika dla wielodomenowych sekwencji zdarzeń behawioralnych

Notice description

Przedmiotem zamówienia jest usługa specjalisty – Senior Deep Learning Research Engineer do realizacji prac badawczo-rozwojowych w ramach badań przemysłowych i prac rozwojowych planowanych w projekcie.
Szczegółowy opis przedmiotu zamówienia
Zamawiający w ramach zamówienia oczekuje wykonania przez Oferenta zadań dla stanowiska specjalista – Senior Deep Learning Research Engineer w ramach projektu, dla którego wymagania i zakres zlecenia ustala się jak poniżej.
Dla zadania 1 (badania przemysłowe — Walidacja metody uczenia uniwersalnych reprezentacji ukrytych sekwencji zdarzeń — proof-of-concept w skali do ok. 100 mln parametrów)
• Współkształtowanie i wsparcie merytoryczne nad metodyką badawczą etapu walidacji oraz wyznaczanie kierunku technicznego prac, z pełnieniem roli technicznego punktu odniesienia dla zespołu badawczego.
• Zdefiniowanie architektur kandydujących do walidacji — enkodera typu seq-JEPA, w tym wariantu uwzględniającego czas (time-aware), wariantu opartego na transformacie sygnaturowej (signature transform / rough-path) oraz modelu energetycznego (energy-based model) działającego na zamrożonej przestrzeni latentnej — a także baseline'ów o porównywalnym rzędzie parametrów (autoregresywny transformer, JEPA bez warunkowania na akcję), zapewniających uczciwość i porównywalność wyników.
• Zaprojektowanie protokołu eksperymentalnego z progresją od danych syntetycznych o w pełni znanej strukturze (ukryte modele Markowa, strukturalne modele przyczynowe) do minimalnego zbioru rzeczywistego, wraz z zaprojektowaniem ablacji obejmujących regularyzację osadzeń, sposób warunkowania predyktora, reprezentację czasu oraz funkcję straty predykcji.
• Zaprojektowanie badań skalowania (rozmiar modelu, wymiar przestrzeni osadzeń) oraz krzywych efektywności próbkowania (sample efficiency) w reżimie ograniczonej liczby danych etykietowanych.
• Zdefiniowanie metodyki ewaluacji jakości reprezentacji niezależnej od konkretnego zadania (diagnostyki kolapsu osadzeń, dopasowania i równomierności, miary widmowe / efektywny rząd, probing kNN) oraz protokołu ewaluacji zadań downstream na zamrożonej reprezentacji z lekkimi adapterami (probing liniowy / MLP), wraz z doborem metryk adekwatnych do zadania (recall@k, AUC, kalibracja) i badaniem transferu między domenami.
• Zapewnienie dyscypliny naukowej i powtarzalności: prowadzenie dużych matryc konfiguracja × seed × rozmiar modelu, śledzenie stabilności między seedami i dynamiki treningu (normy gradientów, składowe funkcji straty) oraz dbałość o poprawność numeryczną metryk liczonych w dużej skali.
• Sformułowanie wniosków badawczych: ranking kandydatów, wskazanie rekomendowanej kombinacji (aggregator × regularyzator × sposób warunkowania predyktora × funkcja straty), ocena uniwersalności i transferu reprezentacji, identyfikacja ślepych zaułków oraz rekomendacja konfiguracji gotowej do skalowania.
• Mentoring mniej doświadczonych inżynierów oraz klarowne komunikowanie wyników względem kamieni milowych projektu.
Szczegółowe objaśnienie wykorzystania prac w zadaniu 1 projektu
Rezultaty prac zostaną wykorzystane do wyłonienia i udokumentowania zwalidowanej, rekomendowanej konfiguracji metody (architektura, regularyzator, sposób warunkowania predyktora, funkcja straty), stanowiącej fundament treningu wielkoskalowego w dalszej części projektu.
Okres realizacji zadania 1: 12 miesięcy.
Dla zadania 2 (badania przemysłowe — Krytyczne zbadanie kanonicznego modelu danych dla wielodomenowych, heterogenicznych strumieni zdarzeń)
• Określenie — od strony uczenia reprezentacji sekwencji — wymagań, jakie musi spełnić kanoniczny model danych i warstwa dostępu: reprezentacji zdarzeń (wspólne zmienne główne oraz payload zależny od typu zdarzenia), obsługi znaczników czasu i nieregularnych odstępów między zdarzeniami oraz deterministycznego podziału na zbiory treningowy, walidacyjny i testowy, spójnego z protokołem eksperymentalnym etapu walidacji.
• Współudział w rozstrzygnięciu, czy jeden kanoniczny schemat zdarzenia wystarcza do użytecznego, bezstratnego ujęcia danych z perspektywy treningu uniwersalnych reprezentacji, tj. czy reprezentacja jest wystarczająco bogata dla uczenia samonadzorowanego.
• Merytoryczna weryfikacja, że zintegrowany strumień danych (ścieżka wsadowa) jest przydatny do treningu i zasila eksperymenty bez doraźnego przetwarzania ad hoc.
Szczegółowe objaśnienie wykorzystania prac w zadaniu 2 projektu
Rezultaty prac zostaną wykorzystane do potwierdzenia, że kanoniczny model danych i zintegrowany strumień są adekwatne do treningu uniwersalnych reprezentacji oraz spełniają wymagania protokołu badawczego.
Okres realizacji zadania 2: 9 miesięcy.
Dla zadania 3 (eksperymentalne prace rozwojowe — Trening wielkoskalowy (rząd ~1 mld parametrów) i końcowa, wieloosiowa ewaluacja metody)
• Przyjęcie i sfinalizowanie konfiguracji docelowej (architektura, regularyzator, sposób warunkowania predyktora, funkcja straty) odziedziczonej z etapu walidacji metody oraz ustalenie finalnych hiperparametrów skali docelowej (rozmiar modelu rzędu 1 mld parametrów, wymiar przestrzeni osadzeń, długość konsumowanej historii sesji).
• Wsparcie merytoryczne nad treningiem rozproszonym wielkiej skali (multi-node / multi-GPU) oraz współudział w doborze frameworka równoległości (np. FSDP, DeepSpeed) na podstawie wcześniejszych testów.
• Zdefiniowanie procedury interwencji przy kolapsie reprezentacji lub dywergencji funkcji straty, nadzór nad monitoringiem metryk w trakcie treningu oraz nad ewentualnymi ograniczonymi ablacjami prowadzonymi na pełnej skali.
• Weryfikacja praw skalowania (scaling laws) poprzez ekstrapolację krzywych z etapu walidacji metody oraz porównanie wyników skali docelowej z etapem proof-of-concept.
• Przeprowadzenie końcowej, wieloosiowej ewaluacji obejmującej: adekwatność metody względem celu badawczego (weryfikacja hipotez na skali docelowej, ocena uniwersalności reprezentacji na pełnym, heterogenicznym strumieniu, identyfikacja ograniczeń ujawnionych dopiero na tej skali) oraz praktyczną wydajność (jakość predykcji downstream, porównanie z baseline'ami, stabilność między seedami), wraz ze współudziałem w studium wykonalności wdrożenia (feasibility).
Szczegółowe objaśnienie wykorzystania prac w zadaniu 3 projektu
Rezultaty prac zostaną wykorzystane do dostarczenia zwalidowanej na skali docelowej metody wraz z raportami adekwatności i praktycznej wydajności oraz rekomendacjami i roadmapą techniczną pod ewentualne wdrożenie poza zakresem grantu.
Okres realizacji zadania 3: 9 miesięcy.

Prace realizowane w ramach zamówienia będą dotyczyły prowadzenia i wsparcia merytorycznego nad częścią badawczo-rozwojową poświęconą projektowaniu, walidacji i skalowaniu metody uczenia uniwersalnych, samonadzorowanych (self-supervised) reprezentacji sekwencji zdarzeń użytkowników w podejściu typu JEPA (joint-embedding predictive). Specjalista pełni rolę technicznego lidera części badawczej — wyznacza kierunek techniczny i odpowiada za ciągłość metodyczną prac na całej ścieżce od etapu walidacji metody (proof-of-concept) po trening wielkoskalowy. Zakres prac obejmuje działania badawczo-technologiczne związane z:
• wyznaczaniem kierunku technicznego części badawczej oraz podejmowaniem decyzji o architekturze modeli i protokole treningu, wraz z pełnieniem roli technicznego punktu odniesienia i mentorowaniem mniej doświadczonych inżynierów;
• projektowaniem metody uczenia samonadzorowanego reprezentacji sekwencji zdarzeń (podejście typu JEPA), definiowaniem architektur kandydujących oraz baseline'ów o porównywalnym rzędzie parametrów zapewniających uczciwość porównań;
• projektowaniem protokołu eksperymentalnego, ablacji oraz badań skalowania (rozmiar modelu, wymiar przestrzeni osadzeń) i krzywych efektywności próbkowania w reżimie ograniczonej liczby danych etykietowanych;
• definiowaniem metodyki ewaluacji jakości reprezentacji niezależnej od konkretnego zadania oraz protokołu ewaluacji zadań downstream na zamrożonej reprezentacji z lekkimi adapterami, wraz z badaniem transferu między domenami;
• zapewnieniem dyscypliny naukowej i powtarzalności prac, w tym prowadzeniem dużych matryc eksperymentów oraz dbałością o poprawność numeryczną metryk liczonych w dużej skali;
• Wsparcie merytoryczne nad treningiem rozproszonym wielkiej skali (rząd ~1 mld parametrów) oraz końcową, wieloosiową ewaluacją adekwatności i praktycznej wydajności metody;
• formułowaniem wniosków badawczych, rekomendacji konfiguracji oraz roadmapy technicznej pod ewentualne wdrożenie.

Miejsce realizacji
Kraj: Polska, Województwo: mazowieckie, Powiat: Warszawa, Gmina: Włochy, Miejscowość: Warszawa

Make an offer

Time limit for receipt of tenders

Tue Jun 16 21:59:59 GMT 2026

Location

Kraj: Polska, Województwo: mazowieckie, Powiat: Warszawa, Gmina: Włochy, Miejscowość: Warszawa

Category assortment

Consultancy

Buyer details

Wirtualna Polska Media S.A.
Żwirki i Wigury 16
02-092 Warszawa
Województwo: mazowieckie
Kraj: Polska
NIP: 5272645593