description
Описание вакансии
Инженер данных
#удаленка
Компания: Альфа-Банк
🔹Чем предстоит заниматься
-Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка;
-Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения;
-Разработка и поддержание в актуальном состоянии документации по разработанному функционалу;
-Своевременное отражение статуса выполнения задач в Jira;
-Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных.
🔹Наши пожелания к кандидатам
-Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas;
-Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников;
-Способность разобраться с API поставщиков данных, используя доступную документацию;
-SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum;
-Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow;
-Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark.
Контакты: %contact_placeholder%
🔥 / @best_itjob / @it_rab
#удаленка
Компания: Альфа-Банк
🔹Чем предстоит заниматься
-Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка;
-Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения;
-Разработка и поддержание в актуальном состоянии документации по разработанному функционалу;
-Своевременное отражение статуса выполнения задач в Jira;
-Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных.
🔹Наши пожелания к кандидатам
-Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas;
-Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников;
-Способность разобраться с API поставщиков данных, используя доступную документацию;
-SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum;
-Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow;
-Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark.
Контакты: %contact_placeholder%
🔥 / @best_itjob / @it_rab
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Операционный менеджер
Beam emotional marketing
Не указан
Удалённо
Полная занятость
Менеджер продукта (AI)
Яндекс
Не указан
Офис
Полная занятость
Devops Инженер (Yandex Cloud)
Yandex.Cloud
223 000 ₽ — 350 000 ₽
Удалённо
Полная занятость
Научный сотрудник (постдок)
Национальный исследовательский университет «Высшая школа экономики»
Не указан
Офис
Полная занятость
Qa Automation (C#)
NDA
200 000 ₽ — 350 000 ₽
Удалённо
Полная занятость
Менеджер по работе с маркетплейсом Wildberries
СТИН
100 000 ₽ — 140 000 ₽
Офис
Полная занятость