ML/LLM Engineer (Speech & RAG)

apartmentАО Мастерская scheduleproject publicУдалённо badge2–4 года badge5+ лет

Публичная страница вакансии: прозрачные условия, быстрый отклик, понятный следующий шаг. Для работодателя — качественный воронко-трафик, для исполнителя — ясные требования без “воды”.

description

Описание вакансии

Краткое описание вакансии

Мы расширяем команду и готовы рассматривать ML/LLM Engineer (Speech & RAG) для разработки персонального ассистента для руководителей
Будете строить ядро ассистента: от VAD до генеративного ответа и TTS-озвучки + сможете поработать с MAS

О компании

Компания АО Мастерская

Мы создаём “Майю” — персонального AI-ассистента для руководителей, который:

узнает владельца по голосу
автоматически протоколирует встречи
формирует контекстные саммари, пишет письма, инициирует follow-ups
хранит знание в векторной базе и мгновенно отвечает на вопросы через RAG-пайплайн
Наша цель — вернуть человеку время и фокус

Обязанности

Развивать голосовой стек
доработка Wake-word, webrtcvad, адаптивное шумоподавление (DeepFilterNet);
оптимизация диаризации (PyAnnote) и ASR (Whisper / Whisper-large-v3).

LLM /RAG-пайплайн
экспериментировать с открытыми LLM + LoRA для пост-процессинга транскриптов и поисковых чанк-ответов;
строить цепочки в Llama-Index, настраивать роутинг запросов и постоянное обновление Qdrant.

Fine-Tuning & Evaluation
улучшать модели под задачи summarization, dialogue-rewrite;
разрабатывать метрики: WER, ROUGE, Recall@k, latency < 500 мс.

Требования
2+ года коммерческой разработки ПО, 1+ год — в AI-проектах.
Уверенный Python 3 + PyTorch, asyncio, aiohttp / FastAPI.
Повседневный Docker, опыт DevOps; работа с RabbitMQ или Kafka
Отличное знание PostgreSQL
Умение планировать задачи и оценивать сроки.
Опыт ASR/TTS (Whisper, Silero-TTS), VAD, аудио-DSP.
Навыки PEFT/LoRA, quantization, оптимизации LLM на ограниченном железе.
Понимание архитектуры Apple Silicon (Metal, ANE) и on-device ML-ограничений.
Будет плюсом
Практика с LLM-сервисами (GigaChat, GPT-4, Claude и др.) и понимание их ограничений.
Работа с векторными БД (Elasticsearch, Qdrant, Weaviate).
Знание LangChain, Llama-Index, DSPy и других AI-фреймворков.
Опыт prompt-инжиниринга

Условия работы

Формат: Remote-first
Доход: Почасовая ставка в рамках проекта, оплата ежемесячно (от 1200 до 2500 рублей в час)
Оформление: ИП или самозанятый (обсуждаемо)
Перки: оплаченный курсор, Gemini, OpenAI

Писать —

tips_and_updates

Как откликнуться эффективно