Старший DL-разработчик

apartmentYandex scheduleПолная занятость publicОфис badge5+ лет

Публичная страница вакансии: прозрачные условия, быстрый отклик, понятный следующий шаг. Для работодателя — качественный воронко-трафик, для исполнителя — ясные требования без “воды”.

description

Описание вакансии

🟣 Старший DL-разработчик в команду разработки агентов и функций YandexGPT

Наша команда разработки агентов и функций работает над тем, чтобы совершенствовать у моделей семейства YandexGPT способность взаимодействовать с окружающим миром. Становитесь частью команды и помогайте создавать технологии будущего, вместе с нами учите модели рассуждать при решении задач.

Какие задачи вас ждут:
• Новые данные и среды для обучения.
• Обучение моделей агентности.
• Усиление моделей ризонингом.

Мы ждём, что вы:
• Отлично знаете математику, классические алгоритмы и структуры данных
• Умеете программировать на языке Python
• Разбираетесь в Reinforcement Learning. Вас не пугают такие слова, как GAE, PPO, GRPO и другие версии policy optimization
• Имеете практический опыт в распределенном распределённом обучении больших моделей на основе архитектуры Transformer
• Понимаете, как устроена стадия alignment'а современных LLM

Будет плюсом, если вы:
• Обучали LLM-навыкам использования внешних инструментов (tool calling, function calling)
• Имеете практический опыт работы c инфраструктурой для RL-обучения: vLLM, SGLang, VERL

📩 на нашем сайте

#yandexgpt #DL #LLM #RL #senior

tips_and_updates

Как откликнуться эффективно