В мире постоянно генерируются огромные объёмы информации, которые необходимо обрабатывать. Основные функции в этом процессе выполняют Data Scientist. Сегодня разбираемся кто это такие, в чём их отличия от других IT-специалистов и на какие их hard и soft skills обращают внимание консультанты GlobalCareer в процессе рекрутмента.
Кто такой Специалист по данным
Весь окружающий мир — математика, и Data Scientist — это специалист, который может всё происходящее выразить цифрами и формулами, прояснив с их помощью любые ситуации для поиска верных решений. Он работает с большим количеством информации, что позволяет видеть картину целиком, а выводы делает объективными.
Алексей Анисимов, Recruitment Team Lead, комментирует: «Data Scientist полезен практически в любой сфере, от оптимизации деятельности производственных гигантов до проработки решений в бутиковом рекламном агентстве. В компаниях, которые работают с рынком B2C, они помогают сделать эффективным маркетинг, на промышленных предприятиях участвуют в оптимизации производственных, логистических, торговых и иных процессов. В финтех-компаниях повышают рентабельность сделок и минимизируют риски, а в IT занимаются разработкой поисковых алгоритмов, систем искусственного интеллекта и многим другим».
Чем Data Scientist отличается от бизнес-аналитиков, специалистов по DWH, инженеров Big Data
Столкнувшись с дефицитом кандидатов при поиске экспертизы в Data Science, велика опасность решить, что кандидаты с похожим стеком из смежных областей (Data Warehouse, Системная и Бизнес Аналитика или Big Data) могут подойти. Но чаще всего всё не так просто.
Дело в том, что, например, бизнес-аналитики работают с качественной оценкой ситуации, в то время как Data Scientist смотрит на происходящее с точки зрения цифр и обладает более полной и объективной картиной. Специалисты по DWH нацелены на продуктивный сбор и обработку информации, и от их работы скорее будет зависеть быстрота и удобство решения задач, которые стоят перед DS. Что касается специалистов по Big Data, то они, как правило, взаимодействуют с ETL-хранилищами и витринами данных, а Data Scientist использует Big Data как метод системы хранения и обработки информации. Поэтому хоть знания и компетенции всех этих специалистов частично пересекаются с Data Scientist, они не являются взаимозаменяемыми, а работают в связке. Их совместная работа позволяет эффективно собирать, хранить и обрабатывать данные и получать нужные выводы.
Ключевые компетенции
В своей практике мы регулярно сталкиваемся с запросами по рекрутменту Data Scientist. Чаще всего мы подбираем их в финтех- и IT-компании. В приоритете опытные специалисты. Причём желательна работа в той же области: чем лучше Data Scientist знает специфику и сферу деятельности организации, тем более точно будет интерпретировать данные и больше полезных инсайтов сможет из них извлечь.
У специалистов в этой области есть несколько главных компетенций, без которых работа невозможна. А также ряд hard и soft skills будут зависеть от области деятельности компании и задач проекта, на работу в который необходим специалист. Вот основные требования, на которые обращают внимание консультанты GlobalCareer при подборе Data Scientist:
- Знания математической статистики и Machine Learning. Это одна из неотъемлемых компетенций Data Scientist. Кандидат без серьёзной математической подготовки на вакансии подобного типа скорее всего не справится с тестовым заданием. Специалист по Data Science работает с цифрами и формулами, потому должен отлично владеть и Machine Learning, и методами «ручной математики». Порой объём информации настолько велик, что обработать её без автоматизации процесса не получится, но иногда для применения Machine Learning данных недостаточно, а в отдельных областях ML системы на данный момент развития не способны быть точными на 100%. Поэтому высококвалифицированный Data Scientist должен уметь с лёгкостью применять оба подхода, чтобы, в зависимости от задачи, выбирать наиболее эффективный метод её решения.
- Инструменты хранения и обработки информации Big Data (стек Apache Hadoop, NoSQL-базы данных и т. д.). Именно эти технологии ориентированы на сбор, обработку и хранение больших объёмов данных, а т. к. работа DS направлена на выжимку из них полезной информации и идей, то без отличного владения инструментарием, делающего работу быстрой и продуктивной, не обойтись.
- Языки программирования. Чаще всего в работе мы сталкиваемся с поиском специалистов, владеющих Python или R. Это легко объяснить: Python хорошо адаптируемый под разные задачи язык, особенно в связке с фреймворками для асинхронных вычислений, применяемыми в работе Data Scientist. Язык R очень логичный, ориентированный на статистику, без которой работа DS невозможна. Но чаще всё зависит от уже используемого в компании стека технологий, что обсуждается при старте поиска.
По данным Департамента информационных технологий Москвы 20% всех открытых в июне 2020 года в столице вакансий были связаны с IT-сферой. А Data Scientist были названы в числе самых высокооплачиваемых специалистов. При этом на рынке наблюдается дефицит кандидатов из этой IT-области, поэтому крупные компании охотно организуют интересные стажировки для начинающих DS, на старте обучения оговаривая, что самые успешные студенты смогут остаться в штате по окончании курса. Также, из-за нехватки кадров, работодатели весьма лояльны к Junior Data Scientist и берут таких кандидатов с перспективой развития. Поэтому у молодых IT-специалистов, находящихся в процессе выбора сферы деятельности, есть возможность попасть на хорошо оплачиваемую и перспективную работу, выбрав этот профиль. Потребность же в Data Scientist будет только расти. Именно от этих специалистов зависит вектор развития как программирования, так и бизнеса, промышленности и науки.
В базе GlobalCareer находится больше 2 млн резюме IT-специалистов: начиная от опытных разработчиков со стандартным набором компетенций, заканчивая профессионалами с редкими hard и soft skills. Оставьте заявку на нашем сайте, и мы найдём для вас нужного кандидата.