description
Описание вакансии
Краткое описание вакансии
Мы расширяем команду и готовы рассматривать ML/LLM Engineer (Speech & RAG) для разработки персонального ассистента для руководителей
Будете строить ядро ассистента: от VAD до генеративного ответа и TTS-озвучки + сможете поработать с MAS
О компании
Компания АО Мастерская
Мы создаём “Майю” — персонального AI-ассистента для руководителей, который:
узнает владельца по голосу
автоматически протоколирует встречи
формирует контекстные саммари, пишет письма, инициирует follow-ups
хранит знание в векторной базе и мгновенно отвечает на вопросы через RAG-пайплайн
Наша цель — вернуть человеку время и фокус
Обязанности
Развивать голосовой стек
доработка Wake-word, webrtcvad, адаптивное шумоподавление (DeepFilterNet);
оптимизация диаризации (PyAnnote) и ASR (Whisper / Whisper-large-v3).
LLM /RAG-пайплайн
экспериментировать с открытыми LLM + LoRA для пост-процессинга транскриптов и поисковых чанк-ответов;
строить цепочки в Llama-Index, настраивать роутинг запросов и постоянное обновление Qdrant.
Fine-Tuning & Evaluation
улучшать модели под задачи summarization, dialogue-rewrite;
разрабатывать метрики: WER, ROUGE, Recall@k, latency < 500 мс.
Требования
2+ года коммерческой разработки ПО, 1+ год — в AI-проектах.
Уверенный Python 3 + PyTorch, asyncio, aiohttp / FastAPI.
Повседневный Docker, опыт DevOps; работа с RabbitMQ или Kafka
Отличное знание PostgreSQL
Умение планировать задачи и оценивать сроки.
Опыт ASR/TTS (Whisper, Silero-TTS), VAD, аудио-DSP.
Навыки PEFT/LoRA, quantization, оптимизации LLM на ограниченном железе.
Понимание архитектуры Apple Silicon (Metal, ANE) и on-device ML-ограничений.
Будет плюсом
Практика с LLM-сервисами (GigaChat, GPT-4, Claude и др.) и понимание их ограничений.
Работа с векторными БД (Elasticsearch, Qdrant, Weaviate).
Знание LangChain, Llama-Index, DSPy и других AI-фреймворков.
Опыт prompt-инжиниринга
Условия работы
Формат: Remote-first
Доход: Почасовая ставка в рамках проекта, оплата ежемесячно (от 1200 до 2500 рублей в час)
Оформление: ИП или самозанятый (обсуждаемо)
Перки: оплаченный курсор, Gemini, OpenAI
Писать —
Мы расширяем команду и готовы рассматривать ML/LLM Engineer (Speech & RAG) для разработки персонального ассистента для руководителей
Будете строить ядро ассистента: от VAD до генеративного ответа и TTS-озвучки + сможете поработать с MAS
О компании
Компания АО Мастерская
Мы создаём “Майю” — персонального AI-ассистента для руководителей, который:
узнает владельца по голосу
автоматически протоколирует встречи
формирует контекстные саммари, пишет письма, инициирует follow-ups
хранит знание в векторной базе и мгновенно отвечает на вопросы через RAG-пайплайн
Наша цель — вернуть человеку время и фокус
Обязанности
Развивать голосовой стек
доработка Wake-word, webrtcvad, адаптивное шумоподавление (DeepFilterNet);
оптимизация диаризации (PyAnnote) и ASR (Whisper / Whisper-large-v3).
LLM /RAG-пайплайн
экспериментировать с открытыми LLM + LoRA для пост-процессинга транскриптов и поисковых чанк-ответов;
строить цепочки в Llama-Index, настраивать роутинг запросов и постоянное обновление Qdrant.
Fine-Tuning & Evaluation
улучшать модели под задачи summarization, dialogue-rewrite;
разрабатывать метрики: WER, ROUGE, Recall@k, latency < 500 мс.
Требования
2+ года коммерческой разработки ПО, 1+ год — в AI-проектах.
Уверенный Python 3 + PyTorch, asyncio, aiohttp / FastAPI.
Повседневный Docker, опыт DevOps; работа с RabbitMQ или Kafka
Отличное знание PostgreSQL
Умение планировать задачи и оценивать сроки.
Опыт ASR/TTS (Whisper, Silero-TTS), VAD, аудио-DSP.
Навыки PEFT/LoRA, quantization, оптимизации LLM на ограниченном железе.
Понимание архитектуры Apple Silicon (Metal, ANE) и on-device ML-ограничений.
Будет плюсом
Практика с LLM-сервисами (GigaChat, GPT-4, Claude и др.) и понимание их ограничений.
Работа с векторными БД (Elasticsearch, Qdrant, Weaviate).
Знание LangChain, Llama-Index, DSPy и других AI-фреймворков.
Опыт prompt-инжиниринга
Условия работы
Формат: Remote-first
Доход: Почасовая ставка в рамках проекта, оплата ежемесячно (от 1200 до 2500 рублей в час)
Оформление: ИП или самозанятый (обсуждаемо)
Перки: оплаченный курсор, Gemini, OpenAI
Писать —
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Project Manager (Content Production)
Предгорья Белухи
50 000 ₽ — 80 000 ₽
Array
Полная занятость
Middle Business Analyst (Proptech)
Parus Asset Management
200 000 ₽ — 230 000 ₽
Array
Полная занятость
Дизайнер стажер
ENDY
Не указан
Array
project
Стажёр по связям с общественностью (Fintech)
Т-Банк
Не указан
Array
Полная занятость
Менеджер по работе с партнерами (Wellness)
Fit&Lead
Не указан
Array
Полная занятость
SMM Specialist (Ecommerce)
Предгорья Белухи
50 000 ₽ — 80 000 ₽
Array
Полная занятость