ждет
Мы команда машинного обучения ЦФТ, наша основная задача – внедрение машинного обучения в технологические и бизнес-процессы компании для повышения их эффективности. Количество задач и процессов растет, поэтому сейчас мы расширяем нашу команду и ищем новых дата-инженеров У вас будут все возможности для развития в BigData и Machine Learning.
В нашей команде дата-инженеры занимаются организацией данных и витрин для их получения. Главные потребители наших данных: data scientist’ы, которые занимаются поиском закономерностей, значимых признаков в данных и тренировкой моделей машинного обучения.
Стек: Java/Scala, инструменты Big Data и NoSql, для кода - IntelliJ Idea, Git, Maven/Gradle, JUnit.
- проектирование и построение Data warehouse компании;
- подготовка витрин данных для отчетности, бизнеса и дата аналитики;
- организация пайплайнов сбора данных от бекендов и других хранилищ;
- организация пайплайна подготовки датасетов для обучения ML моделей;
- организация сбора метрик с инфраструктуры;
- поддержка текущих ETL пайплайнов.
ищем
Какие знания для нас важны
- Java 8+, Scala или Python на хорошем уровне;
- знание алгоритмов и структур данных;
- знание SQL и принципов работы классических БД;
- желание развиваться в BigData и ML.
Какие еще навыки вам будут полезны в работе
- Hadoop, Spark, YARN, Hive, Impala;
- noSQL базы: Cassandra, Elastic;
- анализ данных при помощи Python-ноутбуков Jupiter, Zeppelin;
- работа с очередями сообщений: Kafka, Rabbit, JMS.
Формат работы: удаленно, и есть возможность работать из офиса (в РФ наши офисы есть в 11 городах).