description
Описание вакансии
Стажер Data Engineer [МТС Аналитика, МТС Веб Сервисы]
#гибрид #intern
Локация: Москва
Компания: МТС
🔹ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ
-Осуществлять разработку ETL pipeline над большими данными
-Оптимизировать существующие дата процессы
-Формировать проверки Data Quality
-Поддерживать высоконагруженные потоковые сервисы
-Настраивать алертинг и мониторинг процессов.
🔹Кого мы ищем
-Основы computer science (алгоритмов)
-Знание ЯП для работы с BigData
-В нашем случае Python (стандартные библиотеки: numpy, pandas, requests)
-Умение писать аналитические SQL запросы
-Опыт работы в нескольких диалектах SQL
-Пользователь Linux, git
Будет большим плюсом:
-PySpark - понимание параметров Spark сессии и планов запросов
-Понимание архитектуры MPP баз данных - Clickhouse
-Опыт работы с брокерами сообщений - Kafka
-Понимание зачем и как работает CI/CD
умение перезапустить и понять ошибку из лога
-Понимание хранилища HDFS - умение организовывать файлы нужного размера и сортировки, взаимодействие через cli
-Основы построения хранилищ данных, слои и архитектурные подходы
-Опыт работы с инструментами оркестрации процессов (мы используем Apache Airflow)
-Умение писать различные виды тестов (в том числе unit-тесты) с помощью pytest.
Контакты:
🔥 / @best_itjob / @it_rab
#гибрид #intern
Локация: Москва
Компания: МТС
🔹ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ
-Осуществлять разработку ETL pipeline над большими данными
-Оптимизировать существующие дата процессы
-Формировать проверки Data Quality
-Поддерживать высоконагруженные потоковые сервисы
-Настраивать алертинг и мониторинг процессов.
🔹Кого мы ищем
-Основы computer science (алгоритмов)
-Знание ЯП для работы с BigData
-В нашем случае Python (стандартные библиотеки: numpy, pandas, requests)
-Умение писать аналитические SQL запросы
-Опыт работы в нескольких диалектах SQL
-Пользователь Linux, git
Будет большим плюсом:
-PySpark - понимание параметров Spark сессии и планов запросов
-Понимание архитектуры MPP баз данных - Clickhouse
-Опыт работы с брокерами сообщений - Kafka
-Понимание зачем и как работает CI/CD
умение перезапустить и понять ошибку из лога
-Понимание хранилища HDFS - умение организовывать файлы нужного размера и сортировки, взаимодействие через cli
-Основы построения хранилищ данных, слои и архитектурные подходы
-Опыт работы с инструментами оркестрации процессов (мы используем Apache Airflow)
-Умение писать различные виды тестов (в том числе unit-тесты) с помощью pytest.
Контакты:
🔥 / @best_itjob / @it_rab
tips_and_updates
Как откликнуться эффективно
- arrow_right1–2 релевантных кейса (ссылки/скриншоты)
- arrow_rightСроки и формат работы (когда на связи)
- arrow_right2–3 уточняющих вопроса по задаче
handshake
Рекомендации работодателю
- arrow_rightОпишите результат и критерии приёмки
- arrow_rightУкажите бюджет/вилку — это повышает качество откликов
- arrow_rightСразу обозначьте сроки и доступность по коммуникациям
lists
Ещё вакансии
Senior Java-разработчик интеграционного сервиса ЕСЭД
MOEX
Не указан
Удалённо
Полная занятость
Senior React Developer (Облачная инфраструктура)
МТС Web Services
250 000 ₽ — 350 000 ₽
Гибрид
Полная занятость
Data Scientist
DCloud
от 300 000 ₽
Удалённо
Полная занятость
Middle/Senior Аналитик-разработчик
Ozon Ads
345 000 ₽ — 440 000 ₽
Удалённо
Полная занятость
Разработчик C++ / Senior Security Engineer
И-КОМ СОЛЮШНС
от 400 000 ₽
Удалённо
Полная занятость
iOS Разработчик
ФОДЖИН
от 150 000 ₽
Удалённо
Полная занятость