description
Описание вакансии
Позиция: Middle +/ Senior Data Scientist
Куда? ID Collect , Департамент аналитики и рисков
Формат работы: Гибрид: Москва, м. Фили/Багратионовская/Парк Победы
Вилка гросс: 250-500K + годовой бонус до 2,5 окладов
Что нужно делать?
• Разработка и поддержка скоринговых моделей оценки и переоценки по покупкам на основе статистического анализа.
• Разработка и поддержание моделей распознавания документов и речевой аналитики (NLP).
• Автоматизация операционных процессов компании за счет внедрения алгоритмов нечеткого поиска, написания скриптов для уменьшения доли ручного труда в компании.
• Проведение углубленного статистического анализа данных, включая проверку гипотез и выявление внутренних и внешних факторов, влияющих на взыскание задолженности.
• Анализ риск-метрик, включая эффективность сборов, уровень просрочки и другие ключевые показатели.
• Взаимодействие с командами разработки и аналитики для интеграции моделей в бизнес-процессы компании.
Требования:
• Опыт работы от 2-х лет в области анализа данных и машинного обучения.
• Глубокое понимание ML-алгоритмов и продвинутые знания Python, включая основные библиотеки для машинного обучения (например, Scikit-learn, TensorFlow, PyTorch).
• Хорошие знания SQL (любой из диалектов), умение писать оптимизированные запросы.
• Опыт работы с инструментами логирования экспериментов, кода, умение писать читабельный код в Python и его оптимизировать.
• Опыт вывода моделей в Production.
• Опыт написания базовых микросервисов, работы с большими данными и инструментариями для их анализа будет преимуществом.
Ответы на 10 важных вопросов:
1. Данные: DWH на Clickhouse (данные из ПРОД и внешних источников)
2. Железо: 3 терминала
1) Intel(R) Xeon(R) Silver 4314 CPU @ 2.40GHz, 96 GB RAM, NVIDIA RTX A5000 24 GB
2) Intel(R) Xeon(R) W-2255 CPU @ 3.70GHz 3.70 GHz, 220 GB RAM
3) Intel(R) Xeon(R) Silver 4114 CPU @ 2.20GHz 2.19 GHz (процессоров: 10), 140 GB RAM
3. Масштаб влияния: ML-решения напрямую влияют на ключевые метрики бизнеса: инвестиции в портфель просроченной задолженности, эффективность операционных процессов, финансовые показатели компании.
4. Уровень развития DS: 70%классические модели, 30% NLP.
5. Роль DS: Постановка задачи в технических терминах, сбор необходимых данных, разработка модели и мониторинг работы
6. Бэкграунд руководителя: ex-Сбер.
7. Частота встреч: ~ 3 синка в неделю (зависит от проекта).
8. Карьерный рост: ревью каждые 6 месяцев.
9. Prod/Research: 80% prod, 20% research.
10. Функция сервиса/лидера: 70% execution (решение задач), 30% лидерство в рамках проекта.
Откликнуться: TG
Куда? ID Collect , Департамент аналитики и рисков
Формат работы: Гибрид: Москва, м. Фили/Багратионовская/Парк Победы
Вилка гросс: 250-500K + годовой бонус до 2,5 окладов
Что нужно делать?
• Разработка и поддержка скоринговых моделей оценки и переоценки по покупкам на основе статистического анализа.
• Разработка и поддержание моделей распознавания документов и речевой аналитики (NLP).
• Автоматизация операционных процессов компании за счет внедрения алгоритмов нечеткого поиска, написания скриптов для уменьшения доли ручного труда в компании.
• Проведение углубленного статистического анализа данных, включая проверку гипотез и выявление внутренних и внешних факторов, влияющих на взыскание задолженности.
• Анализ риск-метрик, включая эффективность сборов, уровень просрочки и другие ключевые показатели.
• Взаимодействие с командами разработки и аналитики для интеграции моделей в бизнес-процессы компании.
Требования:
• Опыт работы от 2-х лет в области анализа данных и машинного обучения.
• Глубокое понимание ML-алгоритмов и продвинутые знания Python, включая основные библиотеки для машинного обучения (например, Scikit-learn, TensorFlow, PyTorch).
• Хорошие знания SQL (любой из диалектов), умение писать оптимизированные запросы.
• Опыт работы с инструментами логирования экспериментов, кода, умение писать читабельный код в Python и его оптимизировать.
• Опыт вывода моделей в Production.
• Опыт написания базовых микросервисов, работы с большими данными и инструментариями для их анализа будет преимуществом.
Ответы на 10 важных вопросов:
1. Данные: DWH на Clickhouse (данные из ПРОД и внешних источников)
2. Железо: 3 терминала
1) Intel(R) Xeon(R) Silver 4314 CPU @ 2.40GHz, 96 GB RAM, NVIDIA RTX A5000 24 GB
2) Intel(R) Xeon(R) W-2255 CPU @ 3.70GHz 3.70 GHz, 220 GB RAM
3) Intel(R) Xeon(R) Silver 4114 CPU @ 2.20GHz 2.19 GHz (процессоров: 10), 140 GB RAM
3. Масштаб влияния: ML-решения напрямую влияют на ключевые метрики бизнеса: инвестиции в портфель просроченной задолженности, эффективность операционных процессов, финансовые показатели компании.
4. Уровень развития DS: 70%классические модели, 30% NLP.
5. Роль DS: Постановка задачи в технических терминах, сбор необходимых данных, разработка модели и мониторинг работы
6. Бэкграунд руководителя: ex-Сбер.
7. Частота встреч: ~ 3 синка в неделю (зависит от проекта).
8. Карьерный рост: ревью каждые 6 месяцев.
9. Prod/Research: 80% prod, 20% research.
10. Функция сервиса/лидера: 70% execution (решение задач), 30% лидерство в рамках проекта.
Откликнуться: TG
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Java-разработчик
LifeIT
230 000 ₽ — 330 000 ₽
Удалённо
Полная занятость
Pentester / Специалист группы анализа защищенности
Атом Безопасность
Не указан
Удалённо
Полная занятость
Data Engineer (Data Platform)
ФЛАУВАУ
300 000 ₽ — 350 000 ₽
Удалённо
Полная занятость
Backend-разработчик
Global Trads
1 800 ₽ — 3 100 ₽
Удалённо
Полная занятость
Backend Developer — Internal Tools & Analytics
Darktheme Studios
от 2 500 ₽
Удалённо
Полная занятость
Unity Developer
VivaGames
Не указан
Удалённо
Полная занятость