Дата-сайентист (Data Scientist)
Дата-сайентист – это специалист по обработке данных, собирающий и анализирующий большие наборы структурированных и неструктурированных данных. Эти специалисты анализируют, обрабатывают и моделируют данные, а затем интерпретируют результаты для создания действенных планов для компаний и других организаций.

Это аналитики, которые используют свои навыки как в области технологий, так и в социальных науках, чтобы находить неочевидные взаимосвязи и управлять данными. Они используют отраслевые знания и даже скептицизм по отношению к существующим предположениям, чтобы найти решения бизнес-задач.
Однако технические навыки – не единственное, что имеет значение. Специалисты по обработке данных часто работают в бизнес-среде и отвечают за передачу сложных идей и принятие организационных решений на основе данных. В результате для них очень важно быть эффективными коммуникаторами, лидерами и членами команды, а также аналитическими мыслителями высокого уровня.
Перед опытными специалистами по обработке данных и администраторами данных стоит задача разработать передовые методы компании, от очистки до обработки и хранения данных. Они работают кросс-функционально с другими командами в рамках своей организации, такими как маркетинг, логистика и т.д. Специалисты в этой области очень востребованы в сегодняшней экономике, связанной с данными и высокими технологиями.
Навыки
Вот составляющие специальности "Специалист по данным":
- Программирование
- Машинное обучение (ML)
- Визуализация данных (Dataviz)
- Анализ рисков
- Статистика (Statistics)
- Линейная алгебра (Linear Algebra)
- Коммуникативные навыки
- Программное обеспечение Больших данных (Big Data)
- Облачные вычисления (Cloud Computing)
Разновидности дата-сайентистов
Специалисты по обработке данных могут специализироваться в определенной отрасли или развивать серьезные навыки в таких областях, как Искусственный интеллект (AI), машинное обучение, исследования или управление базами данных. Согласно функциональной классификации выделяют три подвида специальностей:
- Дата-сайентист (Data Scientist): научные некоммерческие исследования
- Дата-инженер (Data Engineer): создание программного обеспечения
- Аналитик данных (Data Analyst): решение бизнес-задач
Существует и другая классификация, основанная на сочетании навыков и выполняемых задач:
- Инженер по машинному обучению (Machine Learning Engineer – MLE). Работая на стыке программной инженерии и науки о данных, инженеры по машинному обучению владеют широким спектром программных инструментов и имеют большой опыт в предоставлении практических программных решений. Инженер по машинному обучению берет прототипную (теоретическую) модель, предложенную специалистом по данным, и делает ее пригодной для использования в производственной среде. MLE создают программы, управляющие устройствами, и разрабатывают алгоритмы, которые помогают машинам определять закономерности в своих данных, понимать команды и даже учиться принимать собственные решения.
- Ученый в сфере Машинного обучения. В отличие от инженеров машинного обучения, специализирующихся на создании инфраструктур машинного обучения, ученые, занимающиеся машинным обучением, сосредоточены на исследовании новых подходов и исследовании новых алгоритмов. Результатами работы специалиста по машинному обучению являются отчеты и технические документы.
- Статистик. Работает как в области теоретической, так и прикладной статистики с прицелом на достижение бизнес-целей. Используя математические методы, статистики анализируют, интерпретируют и сообщают статистическую информацию, а также делают важные для бизнеса выводы на основе этих данных.
- Бизнес-аналитики. Используя соответствующие инструменты или создавая пользовательские приложения для бизнес-аналитики, они создают стратегии, которые помогают бизнесу улучшить процесс принятия решений.
- Архитектор данных. Разрабатывая, создавая и поддерживая решения для архитектуры данных компании, архитекторы данных обеспечивают высокую доступность данных компании. Они проектируют, создают и поддерживают базы данных.
- Архитектор облачной инфраструктуры. Наблюдая за большими данными компании, облачными вычислениями или общей стратегией данных, архитектор инфраструктуры переводит бизнес-требования в конкретные системные приложения. Он или она следит за тем, чтобы бизнес-системы работали, отвечали необходимым системным требованиям и могли поддерживать новые технологии.
- Архитектор приложений. Эта роль включает разработку и создание новых приложений, а также мониторинг поведения существующих приложений в организации. Архитекторы приложений разрабатывают прототипы продуктов, проводят тесты, изучают, как их приложения взаимодействуют с пользователями, и создают руководства по разработке приложений.
Фото: @anniespratt