Senior Data Scientist/AI Engineer (RL)

TeamQuest Sp. z o.o.

Data publikacji: 31.03.2026 Oferta wygasa: 30.04.2026

Nie czekaj!

Powiadomienia o nowych ofertach pracy

Powiadomiania o podobnych ofertach pracy:

Podałeś nieprawidłowy adres email!

TeamQuest Sp. z o.o.

TeamQuest Sp. z o.o.
Nasz klient to dynamicznie rozwijająca się firma specjalizująca się w dostarczaniu nowoczesnych rozwiązań chmurowych i aplikacji opartych na Kubernetes, mających na celu zwiększenie efektywności operacyjnej oraz obniżenie kosztów dla biznesów.

Senior Data Scientist/AI Engineer (RL)

Miejsce pracy: Białystok (podlaskie)

Numer referencyjny: 102131/praktykipl

Wymiar pracy: Pełny etat


Wymagania:

  • Ponad 5 lat doświadczenia w inżynierii oprogramowania w Pythonie.
  • Co najmniej 3 lata doświadczenia na stanowisku Data Scientist, Machine Learning/Environment Engineering.
  • Praca w godzinach 14:00 - 22:00
  • Praktyczna znajomość frameworków AI (Langchain, Langraph, mcp-server).
  • Bogate doświadczenie praktyczne w pracy ze sztuczną inteligencją, obejmujące m.in. inżynierię natychmiastową i kodowanie klimatu.


Dodatkowe atuty:

  • Znajomość Kodeksu lub Kodeksu Claude'a.
  • Doświadczenie w integrowaniu sztucznej inteligencji z systemem będzie dodatkowym atutem.
  • Zrozumienie koncepcji RL - modelowanie nagród, dynamika środowiska,

weryfikowalność, ocena i pętle interakcji agentów.

  • Znajomość instrumentów, metryk i kanałów danych do oceny RL.
  • Ekspertyza w planowaniu własnej pracy.


Oferujemy:

  • Atrakcyjne wynagrodzenia
  • Możliwość pełnej pracy zdalnej
  • Udział w interesujących prohjektach


Obowiązki:

  • Projektowanie i wdrażanie środowisk RL obsługujących ocenę agentów na dużą skalę oraz eksperymenty z uczeniem wzmacniającym.
  • Twórz potoki generowania zadań, dynamiczne zestawy danych i środowiska skryptowe o kontrolowanej złożoności i stochastyczności.
  • Opracuj weryfikatory i modele nagród, aby automatycznie oceniać trajektorie i oceniać wnioskowanie modelu.
  • Współpracuj z inżynierami infrastruktury i systemów, aby zapewnić skalowalność, powtarzalność i wyposażenie środowisk w narzędzia umożliwiające szczegółową

telemetrię.

  • Projektuj interfejsy API i struktury orkiestracji do uruchamiania, resetowania i oceniania agentów w różnych środowiskach.
  • Optymalizacja wydajności środowiska, rejestrowania i powtarzalności nagród w rozproszonych konfiguracjach