description
Описание вакансии
Data Engineer (направление качества пунктов выдачи)
#офис
Москва
Компания: OZON
🔹Вам предстоит:
-Построение и поддержка ETL/пайплайнов:
-Разработка, оптимизация и мониторинг для гарантированной доставки данных.
-Развитие сервисной модели для аналитиков:
-Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы.
-Повышение надежности и прозрачности:
-Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов.
🔹Технологический стек проекта:
-Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark).
-Аналитические СУБД: ClickHouse, Vertica, Trino
Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование).
🔹Мы ожидаем:
-Знание SQL (CTE, оконные функции, оптимизация запросов).
-Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов).
-Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow.
-Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git.
-Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop).
Контакты: %contact_placeholder%
🔥 / @best_itjob / @it_rab
#офис
Москва
Компания: OZON
🔹Вам предстоит:
-Построение и поддержка ETL/пайплайнов:
-Разработка, оптимизация и мониторинг для гарантированной доставки данных.
-Развитие сервисной модели для аналитиков:
-Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы.
-Повышение надежности и прозрачности:
-Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов.
🔹Технологический стек проекта:
-Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark).
-Аналитические СУБД: ClickHouse, Vertica, Trino
Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование).
🔹Мы ожидаем:
-Знание SQL (CTE, оконные функции, оптимизация запросов).
-Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов).
-Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow.
-Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git.
-Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop).
Контакты: %contact_placeholder%
🔥 / @best_itjob / @it_rab
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
QA Engineer (C#)
Selecty
300 000 ₽ — 369 000 ₽
Удалённо
Полная занятость
Бизнес Ассистент
Kvindo
от 40 000 ₽
Удалённо
Частичная занятость
Администратор проектов
Бизматика
160 000 ₽ — 180 000 ₽
Гибрид
Полная занятость
Unity Developer (Стажировка)
Яндекс
Не указан
Офис
Полная занятость
Редактор
NedT Agency
от 100 000 ₽
Удалённо
Полная занятость
Главный администратор баз данных
Мечел-ИнфоТех
Не указан
Удалённо
Полная занятость