description
Описание вакансии
Вакансия: Deep Learning Engineer, ASR 🎧
Ищем инженера-исследователя в ML команду распознавания речи (ASR)
Мы развиваем технологии распознавания речи во всей экосистеме Сбера: от и до телефонного канала и
Задачи
Недавно мы выложили в open-source SSL модель GigaAM а ее улучшенная версия GigaAM Max уже доступна в @smartspeech_sber_bot и умных устройствах.
Следующая амбициозная цель — донести то же качество до всех поверхностей: от высоконагруженных кол-центров до компактных CPU-моделей.
Поэтому основными задачами будут исследование методов онлайн-дистилляции, обучение потоковых моделей, ансамблирование моделей в продакшене, эксперименты с новыми архитектурами и многое другое!
Требования
- python: модульный код, ООП, concurrency, pep, тесты
- хорошее знание алгоритмов и структур данных
- понимание методов оценки качества ML-систем
- глубокие теоретические знания в DL + опыт отладки/обучения (крайне желателен multi-gpu)
- знание современных подходов в NLP/Speech
- pytorch + способность разобраться во фреймворках (lightning, NeMo, fairseq, huggingface)
- docker: сборка образов для обучения/тестирования моделей
- linux, git
Будет плюсом
- знание C++
- опыт оптимизации нейросетей для инференса
- опыт работы с crowdsource-разметкой
- базовое знание цифровой обработки сигналов
Условия
- конкурентная зарплата
- еженедельные встречи с разборами статей
- возможность преподавать на курсах по речевым технологиям (МФТИ, МГУ и другие площадки)
- возможность менторить стажеров в исследовательских проектах
- сильный отдел специалистов (от низкоуровневых алгоритмов улучшения качества звука до оптимизации инференса на CUDA). Выпускники ШАД, МФТИ, ВШЭ, Сколтех, МГУ, ex-Yandex
- молодая дружная команда: собираемся в барах, на завтраках и других активностях
- гибкий график работы, удаленка по всей России
- ДМС, зал в офисе, участие и выступления на конференциях
По вопросам и откликам — пишите
Ищем инженера-исследователя в ML команду распознавания речи (ASR)
Мы развиваем технологии распознавания речи во всей экосистеме Сбера: от и до телефонного канала и
Задачи
Недавно мы выложили в open-source SSL модель GigaAM а ее улучшенная версия GigaAM Max уже доступна в @smartspeech_sber_bot и умных устройствах.
Следующая амбициозная цель — донести то же качество до всех поверхностей: от высоконагруженных кол-центров до компактных CPU-моделей.
Поэтому основными задачами будут исследование методов онлайн-дистилляции, обучение потоковых моделей, ансамблирование моделей в продакшене, эксперименты с новыми архитектурами и многое другое!
Требования
- python: модульный код, ООП, concurrency, pep, тесты
- хорошее знание алгоритмов и структур данных
- понимание методов оценки качества ML-систем
- глубокие теоретические знания в DL + опыт отладки/обучения (крайне желателен multi-gpu)
- знание современных подходов в NLP/Speech
- pytorch + способность разобраться во фреймворках (lightning, NeMo, fairseq, huggingface)
- docker: сборка образов для обучения/тестирования моделей
- linux, git
Будет плюсом
- знание C++
- опыт оптимизации нейросетей для инференса
- опыт работы с crowdsource-разметкой
- базовое знание цифровой обработки сигналов
Условия
- конкурентная зарплата
- еженедельные встречи с разборами статей
- возможность преподавать на курсах по речевым технологиям (МФТИ, МГУ и другие площадки)
- возможность менторить стажеров в исследовательских проектах
- сильный отдел специалистов (от низкоуровневых алгоритмов улучшения качества звука до оптимизации инференса на CUDA). Выпускники ШАД, МФТИ, ВШЭ, Сколтех, МГУ, ex-Yandex
- молодая дружная команда: собираемся в барах, на завтраках и других активностях
- гибкий график работы, удаленка по всей России
- ДМС, зал в офисе, участие и выступления на конференциях
По вопросам и откликам — пишите
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Tech Lead (C++)
Yandex Cloud
от 500 000 ₽
Array
Полная занятость
Специалист Поддержки Плюса Со Знанием Узбекского Языка (Частичная Занятость)
Yandex
от 14 000 ₽
Array
Частичная занятость
Системный аналитик (MarTech)
Сбер
от 150 000 ₽
Array
Полная занятость
Senior Rendering Engineer (C++)
2GIS
350 000 ₽ — 400 000 ₽
Array
Полная занятость
PHP-разработчик (Middle)
DD Planet
Не указан
Array
Полная занятость
Руководитель отдела маркетинга
Экокурорт КУКА
от 120 000 ₽
Array
Полная занятость