Senior Data Engineer

apartmentСбер scheduleПолная занятость publicОфис badge5+ лет

Публичная страница вакансии: прозрачные условия, быстрый отклик, понятный следующий шаг. Для работодателя — качественный воронко-трафик, для исполнителя — ясные требования без “воды”.

description

Описание вакансии

Senior Data Engineer
#офис #senior
Локация: Москва
Компания: Сбер
🔹Обязанности
-разработка ETL/ELT пайплайнов для сбора и предобработки web-scale данных (видео, аудио, текст, метаданные)
-создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
-обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
-построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
-оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
-масштабирование пайплайнов на распределенных кластерах.

🔹Требования
-экспертиза в построении data pipelines (Python, SQL)
-опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
-уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
-опыт работы с распределенными вычислениями (Spark/Ray/Dask) и облачными хранилищами (S3, GCS)
-знание практик data versioning (DVC) и управления метаданными
-навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом.
Контакты:

🔥 / @best_itjob / @it_rab

tips_and_updates

Как откликнуться эффективно