description
Описание вакансии
Наша команда разработки агентов и функций работает над тем, чтобы совершенствовать у моделей семейства YandexGPT способность взаимодействовать с окружающим миром. Становитесь частью команды и помогайте создавать технологии будущего, вместе с нами учите модели рассуждать при решении задач.
Какие задачи вас ждут:
• Новые данные и среды для обучения.
• Обучение моделей агентности.
• Усиление моделей ризонингом.
Мы ждём, что вы:
• Отлично знаете математику, классические алгоритмы и структуры данных
• Умеете программировать на языке Python
• Разбираетесь в Reinforcement Learning. Вас не пугают такие слова, как GAE, PPO, GRPO и другие версии policy optimization
• Имеете практический опыт в распределенном распределённом обучении больших моделей на основе архитектуры Transformer
• Понимаете, как устроена стадия alignment'а современных LLM
Будет плюсом, если вы:
• Обучали LLM-навыкам использования внешних инструментов (tool calling, function calling)
• Имеете практический опыт работы c инфраструктурой для RL-обучения: vLLM, SGLang, VERL
📩 на нашем сайте
#yandexgpt #DL #LLM #RL #senior
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Technical Support Specialist
Авиасейлс
Не указан
Удалённо
Полная занятость
Product Lead
Центральный университет
Не указан
Гибрид
Полная занятость
Контент-менеджер
O complex
50 000 ₽ — 120 000 ₽
Удалённо
Частичная занятость
SMM-специалист
Breaking Trends
от 60 000 ₽
Удалённо
Полная занятость
Middle Frontend-разработчик
СберБизнес
от 152 200 ₽
Офис
Полная занятость
QA Engineer
Bell Integrator
от 130 000 ₽
Офис
Полная занятость