Роли по управлению данными: архитектор данных против инженера данных, и другие
По мере того, как все больше организаций осознают важную роль, которую играют данные в их общей деловой практике, повышается потребность в квалифицированных сотрудниках для выполнения различных ролей управления данными. Но также наблюдается большая путаница в отношении различий между позициями, такими как архитектор данных, разработчик моделей данных и инженер данных, и в том, какие из них наиболее ценны для организации.
Майкл Бауэрс (Michael Bowers), главный архитектор поставщика баз данных NoSQL FairCom Corp., стремился преодолеть эту путаницу во время сеанса на первом мероприятии Dataversity Online Architecture. На онлайн-конференции обсуждались ключевые стратегии и технологии, необходимые для построения и управления современной архитектурой данных.
В своей сессии Бауэрс, имеющий более чем 30-летний опыт работы в качестве специалиста по данным, сравнил, в частности, восемь заданий по управлению данными и аналитике, включая их ключевые функции, зарплату и технические навыки, которые им требуются. Он также предложил совет о том, как повысить свою зарплату в области управления данными и как организации должны создать команду управления данными.
Описания и средние по США зарплаты, взяты с сайтов вакансий glassdoor.com, sure.com и payscale.com, а также из собственного опыта работы Bowers. Он отметил, что он владел, руководил или вел проекты, в которых участвовали сотрудники всех ролей по управлению данными, которые он обсуждал, за исключением ученого по данным.
Различия между должностями по управлению данными
По словам Бауэрса, труднее занимать должности, приносящие больше пользы бизнесу, такие как архитекторы данных, разработчики моделей данных и исследователи данных. Это потому, что люди на этих должностях, как правило, должны быть лучше знакомы с передовыми технологиями, чем другие работники управления данными.
Как сравнить эти роли по управлению данными? По словам Бауэрса, архитекторы данных проектируют и помогают внедрять системы баз данных и другие репозитории для корпоративных данных. «Они также несут ответственность за обеспечение соблюдения организациями внутренних и внешних норм в отношении данных, а также за оценку и рекомендацию новых технологий», - добавил он.
Бауэрс охарактеризовал архитектора данных как «всезнайку», который должен быть знаком с различными базами данных и другими инструментами управления данными, а также с примерами использования, технологическими затратами и ограничениями, а также тенденциями в отрасли. «Мне пришлось освоить массу технологий, чтобы стать архитектором данных», - сказал он.
По словам Бауэрса, разработчик моделей данных идентифицирует бизнес-правила и сущности в наборах данных и разрабатывает модели данных для баз данных и других систем, чтобы помочь уменьшить избыточность данных и улучшить интеграцию данных. «Разработчики данных зарабатывают в среднем меньше денег, чем многие другие ИТ-работники, но вы получаете то, за что платите», предупредил он.
«Трудно найти хорошего разработчика данных», - сказал Бауэрс. «Это искусство. Любой, кто говорит, что вы можете просто закинуть данные в компьютер и автоматически получить хорошую модель, неправ».
Он добавил, что инженеры-программисты, которые также хорошо разбираются в моделировании данных, могут обеспечить наилучшие результаты, хотя, как правило, их найм обходится дороже.
Фокус больших данных для инженеров данных, ученых по данным
По словам Бауэрса, инженер данных - это, по сути, инженер BI для больших данных. Инженеры по обработке данных создают конвейеры данных, соединяющие базы данных и большие системы данных, и, подобно архитекторам данных, они должны понимать тонкости различных облачных и локальных технологий.
По словам Бауэрса, при работе с большими данными инженеры, работающие с данными, часто отвлекаются на эти технологии, а не сосредотачиваются на обеспечении ценности для бизнеса. «Они просто проводят все свое время, играя и не заканчивая».
Между тем, специалисты по данным, которые находят, подготавливают и анализируют данные, используя алгоритмы машинного обучения и другие передовые аналитические приложения, могут получать проблемные результаты без надлежащего знания и применения статистических принципов, которые Бауэрс назвал основой науки о данных.
По его словам, разработка, тестирование и валидация прогностических моделей «действительно требует статистики PhD». «Людям действительно легко утверждать, что они учёные данных и ничего не знают о статистике».
Перекрывающиеся навыки в позициях управления данными
По словам Бауэрса, роли в управлении данными могут легко совпадать с навыками. Например, на крупных предприятиях администраторы баз данных (DBA) часто сужают специализацию до такой степени, что они просто разрабатывают, администрируют базы данных и выполняют операции на них. Но во многих небольших компаниях администратор баз данных - это больше «универсальный» сотрудник, который также занимается качеством данных, моделированием, анализом и составлением отчетов.
Тем не менее, Бауэрс сказал, что администраторы баз данных часто недооцениваются за выполняемую ими работу. При средней базовой зарплате в размере около 81 000 долларов США типичный администратор баз данных зарабатывает меньше, чем все другие должности, которые он обсуждал в области управления данными, за исключением инженера по качеству данных (74 000 долларов США) и аналитика данных (67 000 долларов США).
«Уровень квалификации, необходимый для работы администратором базы данных, особенно администратором базы данных Oracle, настолько высок, что [уровень их зарплаты] просто оскорбляет меня», - сказал Бауэрс. «Меня действительно беспокоит, что они делают так мало по сравнению с тем, что нужно, чтобы стать администратором».
Однако администраторы баз данных, которые сосредоточены только на оперативных задачах, ставят себя в трудное положение, предупредил Бауэрс. Такие администраторы существуют уже давно, поэтому их легче найти, но, по его словам, их бизнес-ценность уменьшается, поскольку автоматизированное администрирование баз данных, управляемое машинным обучением и расширенной аналитикой, становится все более распространенным.
«Они делают вещи вручную, и они не заставляют себя делать что-то новое», - сказал Бауэрс. «Если вы работающий администратор базы данных, отойдите от этого как можно быстрее и перейдите к моделированию, разработке или BI-инжинирингу».
Лучшие зарплаты и как их повысить
Самая высокая средняя базовая зарплата, указанная Бауэрсом, составляет 124 000 долларов США для архитектора данных. Далее следуют ученый по данным и инженер по данным за 117 000 долларов, инженер по бизнес-аналитике за 106 000 долларов и специалист по моделированию данных за 91 000 долларов.
Эти оклады различаются в зависимости от значения позиции для компании. Например, Бауэрс сказал, что у инженеров по обработке данных и BI-инженеров схожие функции, но инженеры по обработке данных заработают еще около 10 000 долларов из-за своего более глубокого знакомства с новыми технологиями и процессами.
Бауэрс завершил свой анализ заработной платы, объяснив, как специалисты по данным могут увеличить свою зарплату. Его первый совет: иметь глубокие знания самых разных технологий. Статистика, машинное обучение и новые технические навыки особенно ценны, сказал он. Боуэрс добавил, что более тесное сотрудничество с ИТ-менеджерами также полезно. Он сказал, что архитекторы данных зарабатывают больше денег, чем другие должности, отчасти потому, что они завоевали доверие к управлению ИТ благодаря прямому взаимодействию.
По словам Бауэрса, главное - заставить себя освоить любую технологию, которая появится на вашем пути.
«Изучите это изнутри и снаружи, примените это и затем переходите к чему-то другому», - сказал он. «В течение десятилетий вы будете поражены тем, что вы можете освоить и сделать. Но вы не можете сделать это, работая 40 часов в неделю. Вы можете работать в своей компании 40 часов в неделю, но вы должны тратить от 10 до 20 часов в неделю, чтобы овладеть технологиями за пределами вашей нынешней работы.»
Какие позиции нужно заполнить в первую очередь
По словам Бауэрса, при создании команды по управлению данными некоторые должности должны иметь приоритет над другими. По его мнению, «рабочие места», которые, по возможности, должны заполнить организации - если это возможно, - это работники, только что вышедшие из колледжа - это аналитики данных, инженеры BI и инженеры по качеству данных. Администраторы баз данных также необходимы везде, сказал он.
Полагаясь на то, что они выполняют большую часть практической работы, вы можете минимизировать количество инженеров, ученых и архитекторов данных, которых вам нужно нанять, сказал Бауэрс, назвав это наиболее экономически эффективным способом укомплектования персоналом различные роли управления данными.
Но вам нужно найти «действительно хороших людей» для последних должностей, предупредил он. В противном случае вы могли бы в конечном итоге заполнить эти ключевые должности сотрудниками, которые «могут говорить вокруг вас, и вы даже не знаете, что они просто пускают в вас дым», - сказал Бауэрс. «Вы должны нанять людей, которым доверяете и которые знают, о чем они говорят».