Leverages データ戦略ブログ

インハウスデータ組織のあたまのなか

【研究記事】データに携わる職種一覧

※長いです。あと、画像少ないです(すみません)。。(約6,700字:読了5分~10分)
目次リンクを置いておくので、特定の情報を探している方はリンク遷移してご覧ください!

本記事について

こんにちは!データ戦略室の小山です。
データアナリストとして事業部のデータ活用浸透に取り組んだ後、現在は組織直下でデータ組織全体のプロジェクトマネジメントや組織運営を担っています。

突然ですがみなさん、「データ系の職種っていまいちよくわからんな」と思ったことはないでしょうか??

最近は、弊社のデータ戦略室でも様々なポジションで採用募集を行っておりますが、人事やエージェントの方から「データ系の職種の関係性が分かりにくい」という声をよくいただきます。

他社のデータ組織の求人票などを拝見して参考にしているのですが、思ったよりも様々なポジションの名前があって、データ組織の内部の人間としてもこんがらがります。これでは普段データ系の業務が専門ではない方からしたら、「よくわからない」となるのも当然です。

そこで、採用に携わる人事やエージェントの方、今後のデータ組織内の役割設計をする立場の方、データ関係の職務についていて今後のキャリアパスを考える方などにとって多少の参考になればと思いながら、自分の情報の整理を兼ねて、データ系の職種の区分についての記事を書いてみようかと思います。

なお、このような内容については、個々人や組織によって様々な考えがあって当然のものだと思います。あくまでも私個人の中での考えであるということをご容赦いただきたいです。 また、頑張って情報整理をしてみるのですが、うまくまとめられなかったら申し訳ありません、と先に謝っておきます。

インハウスでデータ活用をする際の業務フロー

自社内にデータ分析組織を持っている企業の求人票を10社分ほど眺めてみると、非常にたくさんのポジション名があることがわかりました。

まず、なぜこんなに様々なポジション名があるのか考えると、エンジニアなどと同じく、データ系の職種は資格によって認定されるような職業ではないため、各組織内での「役割・担当職務」に対してポジション名が定義されているのではないかと気付きました。

ビジネスの中でデータを取り扱うにあたっては様々な職務(タスク)が存在します。組織内にいるメンバーに対して複数の職務を割り当てていくため、それぞれの組織によってどのような職務がどのような人に割り当てられているかが違ってきます。もっと言えば、同じポジション名でも実際に行う職務が会社によって違う、みたいなこともザラにあると思います。

ということは、まずはデータ活用の際の業務フローを考えるとある程度必要な職務が把握しやすそうです。

インハウスでデータ活用を行う際の業務フローを考えると、企画段階から含めて「データ戦略の策定」→「事業課題の把握/データを活用した課題定義」→「データ収集/加工」→「データ分析/モデル化」→「導入/社会実装」→「運用」という流れが一般的ではないかと考えます。さらに「役割・業務」という観点まで細分化すると、「データ収集/加工」以降のフェーズにおいては「企画/設計フェーズ(コードを書かない)」と「実装/コーディングフェーズ(コードを書く)」という業務の2つの業務が存在することも、データ系のポジションを理解する上では重要な要素な気がしています。

これらの概念をまとめたものに、様々な会社の求人票から得られた求人名(役割名)をマッピングしたものが下記です。

f:id:DataStrategyOffice:20210609181402p:plain

各社の求人票に記載の業務内容と必須要件を実際に読み解きつつ、自分がこれまでデータ領域に携わってきた中で「この求人名を聞くとこういうイメージを持つ」という定性的な感覚をもとにして作成しているので、個人的にはある程度納得感のいくマッピングができました。

なお、「自分は〇〇だけど、もっと業務範囲広いから!失礼な!」というご意見も多々あるとは思いますが、わかりやすくするために「敢えて分けるならば」「狭義の~~」という観点で書いている点をご容赦いただきたいです。実際、弊社としてもこれまで募集したことのある求人名は「データエンジニア」「データアーキテクト/アナリスト」「データサイエンティスト」の3つのみで、これらの3つの職種で上記の全ての領域をうまく全部カバーしながらやりくりしています。

いろんなデータポジション集めてみた

さて、全体感を把握したところで、求人票を色々見ている中で目に止まったデータ系のポジションについて、求人票の中身をまとめて解釈してみました。

なお、求人名の話はしているものの、「ポジション」というよりは「役割」として解釈いただきたいです。なぜなら、前述の通り「Aの人がBもCもやっている」という状況が現実に近いからです。あくまでも役割として細分化するならばこのように考えるとわかりやすいのではないか、という私個人の意見である点を何卒ご理解ください。もし他のご意見等があればぜひともご教示いただきたいと思っております。

ちなみに、求人名の役割とは、「採用対象となりそうな人に興味を持ってもらって求人票を開いてもらうこと」でしょう。つまり、求人名を見たときに、できる限り当該ポジションの職務内容がイメージできるような名前をつける必要があり、このあたりに求人を書いた人の思いが反映されてきます。そういう意味では、ある程度時代に合わせてキャッチーな求人名をつける、みたいなことも大事ですね。採用対象となる人に「これは自分のことっぽいな」と思ってもらえる求人名を設定するよう心がける必要があるわけです。

データサイエンティスト

「データ系の職種で何か一つ知ってるやつ言って!!」と聞いたら一番返って来そうな答えがこれではないでしょうか。「データを様々に加工して法則を読み取り、ビジネス的な解釈(考察)を与えて、新たな示唆を得ること」あたりがこの職種に求められている役割かと思います。
いわゆるデータ活用工程の「分析/モデル化」に焦点を当てているイメージですね。機械学習ディープラーニングといった技術を使用するのもこの役割の人であることが多かったです。
もともと、データサイエンティストという言葉は他の職種に比べて昔から使われている言葉です。かつての「データサイエンティスト」と今の「データサイエンティスト」が担う職務内容はかなり異なると思います。業務領域は狭くなり、より分析手法に関しての専門性の深さに重きを置いた言葉になってきている気がします。よくある他の職種との違いについては後述します。

データアナリスト

これもよく見る求人名です。ただ、データサイエンティストとデータアナリストの違いは?と言われるとやや返答に困ります。今回の調査で各社の求人票を見て抱いたイメージですが、データアナリストは「ビジネス現場から課題を見つけ出し、提案を行う」というビジネスコンサルティング的な要素が重要視されているのに対し、データサイエンティストは「機械学習モデルを生み出す」というクリエィティブ的な要素が重要視されている印象を受けます。
これは、他社の求人票の内容からも、実際にデータ系の業務を行っている肌感覚としても比較的納得のいく区分だと思います。解釈が曖昧な部分も残りますが、「機械学習」という単語をアナリストとサイエンティストの一つの分水嶺と捉えるのは大きく間違ってはなさそうです。

データエンジニア

ここ数年で流行ってますね。データエンジニア。
一言で言えば「データ基盤の構築・運用を担う役割」です。データ分析を主体に行うコンサルティング会社などでは場合によってはいない役割である場合も多いですが、インハウスでデータ分析を進める場合は是非とも仲間に入れておきたい役割です。
データ基盤とは、分析や社内活用のために必要なデータを定常的に収集、蓄積、加工して必要な人間が手に届くところにデータセットを(ほぼ)自動的かつ定常的に提供するシステムのことです。データ分析自体に主眼を置いた役割ではなく、「エンジニア」なのでプログラミングをして「システム(プロダクト)」を作ります。

データアーキテクト

データ系の業務をしていない人はあまり聞き慣れない役割かもしれません。
アーキテクトとは「設計者」という意味であり、データ設計に主眼を置いた求人名です。「データ基盤の仕様を検討するシステム設計」「現実世界の様々な現象をデータで表現する定義設計」「データ利用者が分析を行う際に使用するデータセット設計」などが主な業務になってきます。
スポット分析用だけではなく様々な場所でのデータ基盤の活用が検討されだしたり、企業全体にデータドリブン文化を広めたりするようなタイミングで、スポットを浴びる重要な役割です。 他社の求人票を見ると、この「求人」がない企業も多いですが、この「役割」は必ず存在するので、そのような会社では、データサイエンティストなりデータアナリストなりデータエンジニアなりデータコンサルタントなり、他の職種の人が自然とこの役割を兼任しているのでしょう。

機械学習エンジニア(AIエンジニア)

データサイエンティストのところで「機械学習」という単語が出てきたので、機械学習エンジニアとの違いがわかりにくくなっている方も多いのではないでしょうか。
これは、機械学習を使用して分析を行ったあとの結果の活用方法を考えるとわかりやすいです。分析結果をレポートなどにまとめてビジネスや経営に対しての提言を行うのであれば、データサイエンティストの領域と言って差し支えないですが、分析結果を使用してそれを何らかのシステムに組み込んで提供する場合はエンジニアが必要になります。
機械学習エンジニアは「エンジニア」なので、最終的には「システム(プロダクト)」を作ります。

「自分、機械学習やってます」と言われただけでは、その方がデータサイエンティストであるのか機械学習エンジニアであるのかの判断は不可能です。
ビジネスの中での機械学習システム構築の業務フローを考えると、「機械学習モデルの作成」あとに「機械学習モデルを適切に組み込んだシステム開発」という工程が発生します。もしも、データサイエンティストと機械学習エンジニアが両方存在するデータ組織であれば、モデル作成をデータサイエンティストが担当し、モデルを組み込んだシステムを構築するのを機械学習エンジニアが担当しているでしょう。
なお、組織によってはデータサイエンティストが両方やっている組織もあれば、機械学習エンジニアが両方やっている組織もあります。ただし、市場の印象として、機械学習モデルを作成しないデータサイエンティストや、システムを構築しない機械学習エンジニアは存在しないと見て間違いないのではないでしょうか。

ちなみに、組織によっては、機械学習モデルを搭載したシステム構築をデータエンジニアの役割を持つ人が兼任している場合もあると思います。両者とも「システムを作る」ということは共通なので比較的親和性のある役割です。

データコンサルタント

データコンサルタントはビジネス課題に対する解法をデータで定義し、アウトプットをもとにビジネス現場への社会実装を行っていく役割です。場合によってはデータプロジェクト全体のプロジェクトマネジメントなども行うことが多いでしょう。ビジネスドメインの知識やコンサルティングスキルに長けている人です。
これも個人的なイメージですが、「データコンサルタント」という単語を聞くと、実際にコードを書く頻度は少ないんだろうな、というイメージを持ちます。ビジネス領域とデータ領域をつなぐ上では重要な役割であり、実際の具体的なアウトプットを出す上では、これまで出てきたような「アウトプット(モノ)を作る」役割の人間と必ず協働することになります。

データマネジメント/データガバナー

データ分析やデータ活用によって創出可能な価値やその速度は、蓄積されているデータの品質によって大きく左右されます。
ビジネスを行うにあたっては様々な環境変化が起こります。それに起因して、データの定義が途中で変わってしまったり、新しいデータが生まれるようになったりと、「データを活用する」という観点においては、蓄積データの品質が損なわれるリスクが常に存在します。
そのようなリスクを事前に察知して適切な行動をとり、データの品質やセキュリティを担保するのがこの役割です。データという企業資産の価値担保をミッションとします。データ系の業務に携わらない方はイメージしづらいかもしれませんが、具体的な業務としては「個人情報を意識したデータへのアクセス権限管理」「データ品質の定義とそのモニタリング」「マスタデータ、メタデータ等の管理」「データ活用ガイドラインの策定と企業浸透」などがあります。

その他の職種

求人数としては多くありませんでしたが、企業全体のデータ戦略の策定を行う「データストラテジスト」、BIダッシュボードの実装を行う「BIエンジニア」、機械学習モデルの精度モニタリング等を含めた機械学習システム運用を行う「MLOpsエンジニア」といった職種もありました。

なぜポジションがこんなにたくさんあるのか

ここまで多くのポジションが存在する理由は、「以前に比べてデータに関する業務の複雑性が格段に増加したから」でしょう。もともとは「データアナリスト」や「データサイエンティスト」という肩書が比較的一般的な職種名であり、データ活用フローのほぼ全ての役割ををこのような人たちが担っていたのではないかと考えられます。

さらに、データに関する業務の複雑性が増加した理由を3点考えます。

まず1点目に、データの生成量が爆発的に増えた点。これは人々の行動がよりデジタル領域に移行し、生活様式的にも技術的にもデータ化できるものが増えた結果です。このような変化が起きると「データを正しく収集・加工して、利用者がデータを使いやすい環境を構築する」という役割が必要となります。

次に2点目として、企業のデータの利用シーンが大きく広がった点。もともとは、必要に応じてスポットの意思決定にデータを活用する状況が多かったはずです。しかし、データを使ったモニタリング体制やデータマートの構築、AIの安定的な稼働などが求められるようになると、安定的かつ継続的にデータを活用できる仕組みが整っていることを経営基盤として求める企業が増えました。

最後に3点目として、データ活用手法が格段に増えた点。表計算ソフトを利用した統計解析等が多くなされていた状況から、python等を用いたプログラミングによるビッグデータの処理、BIツールの導入、機械学習を用いた分析、更にはその先のAIシステムの実装、その他もろもろ、新たなデータ活用の手法、機会が一般化してきました。

これら3点から、求められる専門性がより広範囲かつ深くなったことがわかります。それぞれの組織内で、これまでの役割を再編成して分業化することにより、効率的にかつ素早く成果を上げることを目指すようになったのではないでしょうか。

データ領域に限らず一般的な組織論の考え方として、やりたいことが大きく広範囲になり、目指すべき到達点が遠くになった時点では必ずチームを作って物事を進める必要が出てきます。 個人のキャリアで考えれば、「自らがどの役割もこなせるスーパーデータ人材になる」ということは非常に魅力的です。個人の市場価値を上げるという観点では、ここまで示した複数の役割を次々に経験していくという戦略は大いにありだと思います。

しかし、組織を作る立場からすると、大きな理想を短期間で実現するためには、その組織の性質に応じて役割(業務)を適切に分けた上で分担し、異なるスキルセットの人材を以て組織構成を考えるマネージャーが多いのではないでしょうか。マネージャーや採用に関わる方などにとっては、もし今回の役割の分け方を見て、「自分たちのデータ組織はこの役割の人材が足りないなぁ」などと考える機会に少しでもなったのであれば、嬉しく思います。
自分もまだ経験の少ない身なので、もしも異なるご意見をもたれる方がいらっしゃいましたら是非、学ばせていただきたいです。

おまけ

indeedで各職種名で検索した際のヒット数が下記です。
データサイエンティストは想像通りの存在感。データエンジニアが思ったより多くてびっくり。データアーキテクトはこんなに市民権まだないのね。データマネジメントに関しては、この記事で紹介した役割ではなく「前処理」みたいなところに特化した役割の求人も混じってました。
[ 東京都内のみ、2021/06/06時点 ]

検索キーワード ヒット数
データサイエンティスト 829
データアナリスト 523
データエンジニア 687
データアーキテクト 25
機械学習エンジニア 186
データコンサルタント 262
データマネジメント 153