description
Описание вакансии
Data Scientist (Ranking&Search)
Локация: Удалённо
Компания: Lamoda Tech
ЗП:осуждается на собеседовании
Занятость: Полная
Мы в поиске Data Scientist в команду Ranking&Search.
Мы — команда, отвечающая за ML в каталоге и поиске Lamoda, ключевых источниках трафика в продукте. Наши решения напрямую влияют на бизнес-метрики компании, помогая миллионам пользователей находить идеальные товары.
У нас уже выстроен мощный двухэтапный пайплайн ранжирования и сейчас мы продолжаем развивать его с помощью передовых ML-методов. Наш фокус — fashion, это позволяет применять уникальные ML-решения: визуал, оценка сочетаемости вещей, трендовость, сезонность и т.д.
Чем предстоит заниматься:
Развитие моделей ранжирования товаров в каталоге/поиске: персонализация каталога/поиска, добавление онлайн факторов по текущей сессии, адаптация ранжирования для новых пользователей, развитие алгоритмов генерации кандидатов, создание системы совместной оптимизации различных бизнес целей компании с помощью ранжирования, улучшение пайплайна ранжирования с помощью нейросетевых моделей
Улучшение алгоритмов поиска, в том числе с использованием нейронных сетей
Развитие системы поиска: поисковые подсказки, обогащение товаров атрибутами (из фото, описания, отзывов), система фильтров, визуальные фичи в каталоге, spell-check
Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.
Почему у нас классно:
Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.
Мы ожидаем:
Опыт в области анализа данных и машинного обучения (от 3 лет);
Опыт работы с SQL, Hadoop, Hive, Spark;
Владение Python, Linux, методами работы с большими данными;
Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, CatBoost/XGBoost, PyTorch, Spark ML;
Знания теории вероятностей и математической статистики;
Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
Знание алгоритмов и структур данных;
Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
Английский язык на уровне технического чтения.
Как мы работаем:
Пишем на Python 3.6+ и PySpark 3.0;
Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.
📩 Резюме отправлять:
–––
Бесплатный постинг вакансий: @freeIT_job
Забирай 📚
Локация: Удалённо
Компания: Lamoda Tech
ЗП:осуждается на собеседовании
Занятость: Полная
Мы в поиске Data Scientist в команду Ranking&Search.
Мы — команда, отвечающая за ML в каталоге и поиске Lamoda, ключевых источниках трафика в продукте. Наши решения напрямую влияют на бизнес-метрики компании, помогая миллионам пользователей находить идеальные товары.
У нас уже выстроен мощный двухэтапный пайплайн ранжирования и сейчас мы продолжаем развивать его с помощью передовых ML-методов. Наш фокус — fashion, это позволяет применять уникальные ML-решения: визуал, оценка сочетаемости вещей, трендовость, сезонность и т.д.
Чем предстоит заниматься:
Развитие моделей ранжирования товаров в каталоге/поиске: персонализация каталога/поиска, добавление онлайн факторов по текущей сессии, адаптация ранжирования для новых пользователей, развитие алгоритмов генерации кандидатов, создание системы совместной оптимизации различных бизнес целей компании с помощью ранжирования, улучшение пайплайна ранжирования с помощью нейросетевых моделей
Улучшение алгоритмов поиска, в том числе с использованием нейронных сетей
Развитие системы поиска: поисковые подсказки, обогащение товаров атрибутами (из фото, описания, отзывов), система фильтров, визуальные фичи в каталоге, spell-check
Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.
Почему у нас классно:
Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.
Мы ожидаем:
Опыт в области анализа данных и машинного обучения (от 3 лет);
Опыт работы с SQL, Hadoop, Hive, Spark;
Владение Python, Linux, методами работы с большими данными;
Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, CatBoost/XGBoost, PyTorch, Spark ML;
Знания теории вероятностей и математической статистики;
Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
Знание алгоритмов и структур данных;
Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
Английский язык на уровне технического чтения.
Как мы работаем:
Пишем на Python 3.6+ и PySpark 3.0;
Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.
📩 Резюме отправлять:
–––
Бесплатный постинг вакансий: @freeIT_job
Забирай 📚
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Техлид 1С
mokka
350 000 ₽ — 550 000 ₽
Гибрид
Полная занятость
Middle Web Designer
Квайти
Не указан
Удалённо
Полная занятость
Java Разработчик
Ozon
Не указан
Удалённо
Полная занятость
Frontend-разработчик
РНИМУ им. Н.И. Пирогова
120 000 ₽ — 150 000 ₽
Гибрид
Полная занятость
Senior Java-разработчик
DatsTeam
Не указан
Удалённо
Полная занятость
Middle Специалист по ИБ
Korona
150 000 ₽ — 200 000 ₽
Гибрид
Полная занятость