description
Описание вакансии
Мы разрабатываем новую технологию Нейро для Алисы. Она за минуту решает поисковые задачи, которые обычно занимают у пользователя по несколько часов. Наша цель — уверенно победить конкурентов на российском рынке, среди которых есть очень сильные международные игроки.
В основе технологии — нейросеть LLM. Она общается с пользователем в режиме диалога, анализирует данные из интернета и пишет доступные, информативные, наглядные и достоверные ответы. Первый релиз продукта вышел в 2024 году под названием и принёс много профита Поиску Яндекса. Теперь эта технология стала частью Алисы и продолжает активно развиваться.
Наша команда аналитики — ключевая для развития новой Алисы. Каждые полгода совместно с командами ML и продукта мы готовим следующий релиз технологии. В основе каждого релиза — офлайн-разметка качества ответов, которую разрабатываем мы.
С помощью разметки оцениваем, насколько ответы Алисы соответствуют нашим продуктовым целям и ожиданиям пользователей:
• Сравниваем качество ответов Side-by-Side
• Измеряем количество ложной информации и галлюцинаций в ответах с помощью факт-чекинга
• Используем крауд-разметку (выполнение заданий людьми), обучаем LLM-as-a-judge, собираем ассистентов на основе LLM для помощи исполнителям в Yandex Crowd
Разметка используется как основной инструмент для замера качества — так же как таргет для RLHF при обучении нейросетей. Наши проекты одни из самых сложных и масштабных по офлайн-разметке качества в Яндексе. Мы обладаем уникальным опытом в этой области.
Наша команда вовлечена в весь цикл создания технологии от формулировки общих продуктовых требований до отладки и приёмки готовых моделей. Чтобы успешно развивать , нам нужно решать разные типы задач: от технических и аналитических до продуктовых.
Какие задачи вас ждут:
• Формализация требований к продукту
• Поиск и исправление багов LLM через обучение
• Глубокий анализ качества разметки
• Развитие больших проектов в Yandex Crowd
Мы ждём, что вы:
• Понимаете, почему важно всегда смотреть в данные
• Уверенно пишете на Python и знаете алгоритмы
• Знаете математическую статистику и использовали её для проверки гипотез
Будет плюсом, если вы:
• Интересуетесь продуктом, стремитесь понять, каким он должен быть и почему
• Умеете общаться, ясно излагать мысли, понимать и учитывать мнение коллег, убеждать
• Работали с табличными данными на SQL
• Имели дело с крауд-проектами, например делали разметку в Толоке
• Знаете основы машинного обучения
📩 на нашем сайте
#LLM #python #алиса
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Главный редактор
Рахмат
200 000 ₽ — 250 000 ₽
Удалённо
Полная занятость
Manual QA Middle Engineer
КА DevHunt
от 1 500 ₽
Удалённо
Полная занятость
Старший инженер-программист C (ядра Linux) ОС Astra Linux
Группа Астра
Не указан
Офис
Полная занятость
SMM Specialist
svechichnaya
от 40 000 ₽
Удалённо
Полная занятость
Руководитель отдела по работе с блогерами
Аравия
Не указан
Офис
Полная занятость
Графический дизайнер
WAYOUT_TEAM
от 75 000 ₽
Удалённо
Полная занятость