description
Описание вакансии
Инженер данных
Компания: Centicore
Тип занятости: #full_time
Уровень: #middle
Страна: #RU
Локация: #remote
Зарплата: от 350 000 RUB до 380 000 RUB
Компания Centicore находится в поисках Инженер данных. Наша компания занимается продуктовой разработкой проектов наших Заказчиков под ключ.
Обязанности
- Разработка пакетных ETL/ELT процессов для расчета переменных для моделей машинного обучения
- Создание витрин данных для моделей машинного обучения
- Разработка ETL/ELT процессов для обработки результатов моделей машинного обучения и передачи результатов во внешние системы
- Эффективное взаимодействие в составе команды со специалистами по анализу данных и специалистами по развитию инфраструктуры
Требования
- Хороший уровень знаний языка программирования Python – структуры данных, итераторы и декораторы, параллельное и асинхронное программирование, объектно-ориентированное и функциональное программирование
- Отличные знания SQL – создание сложных запросов с использованием табличных выражений (CTE) и оконных функций
- Понимание принципов распределенных вычислений и обработки данных
- Понимание принципов потоковой обработки данных
- Понимание принципов работы систем распределенного хранения данных – Apache Cassandra, Hadoop/HDFS, S3, форматы таблиц Hive, Iceberg
- Хорошие знания платформы Apache Spark – опыт использования библиотеки pyspark, влияние конфигурации приложения pyspark на производительность и эффективность обработки данных, отладка и анализ эффективности приложений pyspark с помощью Spark History Server
- Опыт работы с системой оркестрации задач Apache Airflow
- Опыт реализации промышленных отказоустойчивых сервисов на Python для пакетной загрузки и трансформации данных (ETL/ELT) на Spark под управлением Airflow
- Опыт работы с платформой потоковой обработки данных Apache Kafka
- Хорошие знания и опыт использования реляционных баз данных Oracle, PostgreSQL
- опыт разработки ETL/ELT – процессов на технологическом стеке Python, Spark, Hadoop/Hive/HDFS, Airflow
Дополнительная информация
Зарплата указана на руки, зависит от опыта и пожеланий кандидата
Контакты
- Telegram:
⚠️ Для удобства указывайте ссылку на вакансию
Ссылка:
Стек технологий: #python #sql #apache_cassandra #hadoop #hdfs #s3 #hive #iceberg #apache_spark #pyspark #apache_airflow #apache_kafka #oracle #postgresql
Компания: Centicore
Тип занятости: #full_time
Уровень: #middle
Страна: #RU
Локация: #remote
Зарплата: от 350 000 RUB до 380 000 RUB
Компания Centicore находится в поисках Инженер данных. Наша компания занимается продуктовой разработкой проектов наших Заказчиков под ключ.
Обязанности
- Разработка пакетных ETL/ELT процессов для расчета переменных для моделей машинного обучения
- Создание витрин данных для моделей машинного обучения
- Разработка ETL/ELT процессов для обработки результатов моделей машинного обучения и передачи результатов во внешние системы
- Эффективное взаимодействие в составе команды со специалистами по анализу данных и специалистами по развитию инфраструктуры
Требования
- Хороший уровень знаний языка программирования Python – структуры данных, итераторы и декораторы, параллельное и асинхронное программирование, объектно-ориентированное и функциональное программирование
- Отличные знания SQL – создание сложных запросов с использованием табличных выражений (CTE) и оконных функций
- Понимание принципов распределенных вычислений и обработки данных
- Понимание принципов потоковой обработки данных
- Понимание принципов работы систем распределенного хранения данных – Apache Cassandra, Hadoop/HDFS, S3, форматы таблиц Hive, Iceberg
- Хорошие знания платформы Apache Spark – опыт использования библиотеки pyspark, влияние конфигурации приложения pyspark на производительность и эффективность обработки данных, отладка и анализ эффективности приложений pyspark с помощью Spark History Server
- Опыт работы с системой оркестрации задач Apache Airflow
- Опыт реализации промышленных отказоустойчивых сервисов на Python для пакетной загрузки и трансформации данных (ETL/ELT) на Spark под управлением Airflow
- Опыт работы с платформой потоковой обработки данных Apache Kafka
- Хорошие знания и опыт использования реляционных баз данных Oracle, PostgreSQL
- опыт разработки ETL/ELT – процессов на технологическом стеке Python, Spark, Hadoop/Hive/HDFS, Airflow
Дополнительная информация
Зарплата указана на руки, зависит от опыта и пожеланий кандидата
Контакты
- Telegram:
⚠️ Для удобства указывайте ссылку на вакансию
Ссылка:
Стек технологий: #python #sql #apache_cassandra #hadoop #hdfs #s3 #hive #iceberg #apache_spark #pyspark #apache_airflow #apache_kafka #oracle #postgresql
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Старший Frontend-разработчик
OZON
Не указан
Удалённо
Полная занятость
Junior QA Automation Engineer (Python / Selenium)
Deck
Не указан
Офис
Полная занятость
UX/UI Дизайнер
SellerGroup
Не указан
Офис
Полная занятость
Senior Product Manager (AdTech)
Циан
Не указан
Офис
Полная занятость
Практикант-менеджер по вузам
Changellenge >>
Не указан
Удалённо
Частичная занятость
Графический дизайнер
СЕРКОНС
70 000 ₽ — 80 000 ₽
Удалённо
Частичная занятость