Датасайнтист
Датасайнтист — специалист по обработке, анализу и хранению больших массивов данных, так называемых «Big Data». Ты сталкиваешься с результатами их работы каждый день. Например, это прогнозы погоды, чат-боты, голосовые помощники… А еще — алгоритмы, рекомендующие музыку и видео под вкус конкретного пользователя. Список возможных друзей в социальных сетях — тоже результат работы специалистов по Data Science.
Необходимые навыки
  • Знание математики, матанализа, математической статистики, теории вероятностей.
  • Знание английского языка.
  • Владение основными языками программирования, у которых имеются компоненты для работы с большими массивами данных: Java (Hadoop), C++ (BigARTM, Vowpel Wabbit, XGBoost), Python (Matplotlib, Numpy, Scikit, Skipy).
  • Владение статистическими инструментами — SPSS, R, MATLAB, SAS Data Miner, Tableau.
  • Основательное знание отрасли, в которой работает Data Scientist (например, если это фармацевтическая отрасль, то необходимо знание основных процессов производства, компонентов лекарств).
  • Главный базовый навык специалиста по Data Science — организация и администрация кластерных систем хранения больших массивов данных.
  • Знание законов развития бизнеса.
  • Экономические знания.
  • Отвечать на принципиальный вопрос: «Целесообразно ли решать задачу методами машинного обучения?».
  • Подготавливать данные, их разметку.
  • Принимать метрики оценки эффективности модели.
  • Разрабатывать и тренировать модели машинного обучения.
  • Защищать экономический эффект от внедрения модели.
  • Внедрять модели в производственные процессы и продукты.
  • Сопровождать модель.
Узнай о профессии больше