description
Описание вакансии
#AI #LLM #embeddings #consulting #reactnative #вакансия
AI-инженер по голосовым технологиям (React Native проект)
💰 Оплата: 180 000 –250 000 ₽
О компании
Мы — аккредитованная ИТ-компания Октема (), работаем над федеральным цифровым проектом.
Ищем разработчика с глубокими знаниями и опытом работы с технологиями распознавания речи и синтеза голоса для проекта на платформе React Native. Основные требования включают работу с моделями машинного обучения, такими как Vosk, Embedding Gemma, Piper/VITS tts ONNX
Задача
Голосовой ассистент
1. пользователь вызывает ассистента
2. озвучивает команды «записи» в приложение
Сервис должен работать в офлайн режиме
Примеры диалога ассистента и пользователя:
Пользователь: найди объект N и добавь по нему в журнал новую запись
Ассистент: объект N найден, озвучьте информацию для ввода в журнал
Пользователь: Объект осмотрел, состояние такое-то, наблюдаются такие-то проблемы
Ассистент: В журнал добавлена следующая запись (проговаривает тот же текст, что озвучил пользователь)
Используемые AI модели
Изначально на распознавание внедрили Vosk, но в ее офлайн модели были ошибки
Поэтому заменили на Sherpa-ONNX
Для синтеза речи изначально были использованы встроенные библиотеки от от Android и IOS
Но не устроила "роботизированность" голоса
Поэтому сейчас тестируем Piper, к нему тоже есть нарекания
Нужен инженер с опытом работы с указанными моделями
Требования
- Интегрировать LLM / Embeddings / AI-моделей в мобильные приложения.
- Адаптация модели Vosk для эффективного распознавания специализированных терминов и сложных понятий.
- Оптимизация процесса обработки аудиоданных для повышения точности распознавания.
- Интеграция и настройка модели Piper/VITS ONNX для улучшения качества синтеза текста в речь.
- Работа над улучшением производительности приложения на мобильных устройствах.
Будет плюсом
- Опыт с React Native bridge / native modules.
- Работа с Whisper / Gemini / Hugging Face / .
- Опыт оптимизации и портирования моделей под мобильные устройства.
Условия
- Удалённый формат, гибкий график.
- Оплата по результату (120 000 – 200 000 ₽, обсуждаемо).
- Возможность привлечения к дальнейшим задачам проекта.
Контакты
Иван Петров,
AI-инженер по голосовым технологиям (React Native проект)
💰 Оплата: 180 000 –250 000 ₽
О компании
Мы — аккредитованная ИТ-компания Октема (), работаем над федеральным цифровым проектом.
Ищем разработчика с глубокими знаниями и опытом работы с технологиями распознавания речи и синтеза голоса для проекта на платформе React Native. Основные требования включают работу с моделями машинного обучения, такими как Vosk, Embedding Gemma, Piper/VITS tts ONNX
Задача
Голосовой ассистент
1. пользователь вызывает ассистента
2. озвучивает команды «записи» в приложение
Сервис должен работать в офлайн режиме
Примеры диалога ассистента и пользователя:
Пользователь: найди объект N и добавь по нему в журнал новую запись
Ассистент: объект N найден, озвучьте информацию для ввода в журнал
Пользователь: Объект осмотрел, состояние такое-то, наблюдаются такие-то проблемы
Ассистент: В журнал добавлена следующая запись (проговаривает тот же текст, что озвучил пользователь)
Используемые AI модели
Изначально на распознавание внедрили Vosk, но в ее офлайн модели были ошибки
Поэтому заменили на Sherpa-ONNX
Для синтеза речи изначально были использованы встроенные библиотеки от от Android и IOS
Но не устроила "роботизированность" голоса
Поэтому сейчас тестируем Piper, к нему тоже есть нарекания
Нужен инженер с опытом работы с указанными моделями
Требования
- Интегрировать LLM / Embeddings / AI-моделей в мобильные приложения.
- Адаптация модели Vosk для эффективного распознавания специализированных терминов и сложных понятий.
- Оптимизация процесса обработки аудиоданных для повышения точности распознавания.
- Интеграция и настройка модели Piper/VITS ONNX для улучшения качества синтеза текста в речь.
- Работа над улучшением производительности приложения на мобильных устройствах.
Будет плюсом
- Опыт с React Native bridge / native modules.
- Работа с Whisper / Gemini / Hugging Face / .
- Опыт оптимизации и портирования моделей под мобильные устройства.
Условия
- Удалённый формат, гибкий график.
- Оплата по результату (120 000 – 200 000 ₽, обсуждаемо).
- Возможность привлечения к дальнейшим задачам проекта.
Контакты
Иван Петров,
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Менеджер по партнерскому маркетингу/Event-маркетолог
X5 Transport
Не указан
Офис
Полная занятость
SEO-специалист
Vela
от 100 000 ₽
Удалённо
Полная занятость
Редактор новостей
Mash
Не указан
Офис
Полная занятость
Финансовый директор
ГК SNS
Не указан
Офис
Полная занятость
Системный аналитик DWH
Яндекс Практикум
Не указан
Офис
Полная занятость
Менеджер по работе с олимпиадным сообществом
Яндекс
Не указан
Офис
Полная занятость