はじめに
こんにちは。 データ戦略室では、「レバレジーズ全社のデータ活用水準を底上げし、データが事業の競争優位性を生み出す状態を作り出す」というミッションの元、データを取得するところからデータ活用のビジネス接続まで、それぞれが専門性を活かして日々業務を行っています。今回の記事では、昨年1年を振り返ってどういった仕事をしてきたのか、今後どういったことに取り組んでいくのかということを各グループのリーダーに記載していただきました。今回の記事を通して、データ戦略室の雰囲気や会社に対して担っている役割が少しでも伝われば幸いです。
データ戦略室全体について
昨年は正社員で中途・新卒合わせて5人の方に入社していただき、業務委託でも2名の方に参画していただきました。2022年1月時点と比較して、組織の規模が1.5倍以上に大きくなっており、会社の成長スピード以上の速さで人員拡大を行っています。また、データ戦略室ではなく事業部に所属しながらもデータ整備の仕事を行う方がいたり、エンジニア組織に所属の機械学習エンジニアと一緒にMLOps化した機械学習モデルパイプラインを実装するといったこともありました。 チームの規模が大きくなったことに加え、チーム外の人と一緒に仕事をする機会が急激に増えたことにより、会社全体への影響力がより大きくなった1年だったと思います。会社としてもデータドリブンな文化形成に力をいれていることもあり、社内でのプレゼンスが高まっていることを日々感じます。
データサイエンスグループ
今年取り組んだこと
データサイエンスグループの阪上です。
データサイエンスグループは、数学・物理・統計学などをバックグラウンドに持つメンバーからなるグループで、いわゆるデータサイエンティストとして社内のデータ分析業務にあたっています。2022年に取り組んだ事柄としては、レコメンデーションエンジン開発、営業の音声解析、広告運用のための機械学習モデリング、事業関連のKPIに関する関数の推定などがあげられます。これらのプロジェクトを通じて得られた成果や学びについて記したいと思います。
手堅いプロジェクトとチャレンジングなプロジェクトのバランス
私はプロジェクトをチームとして持つ際に、データ分析から成果を生み出しやすい手堅いプロジェクトと、可能性は秘めているがやってみないとわからないチャレンジングなプロジェクトをバランスよく持つことを心がけています。 今回で言うと「レコメンデーションエンジン開発、広告運用のための機械学習モデリング」が手堅いプロジェクト(守り)、「営業の音声解析、事業関連のKPIに関する関数の推定」がチャレンジングなプロジェクト(攻め)という認識で進めてきました。 なぜ前者が手堅いのかと言うと、現状において人間がある程度の型を持って意思決定しており、その上で、それを裏付けるデータが蓄積されていたりするところにあります。 後者に関しては、なぜチャレンジングかと言うと、電話やオンライン面談によるコミュニケーションに型はなかったり、文字起こしデータの精度に限界があったり、あるいは複雑に絡み合ったKPIについて因果関係をうまくコントロールすることが難しかったりと分析の難易度が高い傾向があるところにあります。 手堅いプロジェクトは、組織の目指しているKPIにフィットするという観点で非常に重要で、「今困っている人に、今答えるのが当たり前」という文化を醸成し、機能軸組織としてのレゾンデートルだと考えています。 他方、難易度の高いプロジェクトは当然ながら失敗確率も高まりますが、それは伸び代の裏返しでもあると考えています。プロジェクトの結果から新規にデータを蓄積する動きもありますし、長期的には成果に繋がってきます。 1年後に成果が出る、3年後に成果が出るというのは結構起きているので、時代を先取りし過ぎてもそれが間違っているとは言えなさそうですね。
様々な部署との連携によるダイナミックな動き
これまで、一部のメンバーがチームを超えてプロジェクトを進めるということはあったのですが、2022年はほとんどのメンバーが営業・エンジニア・マーケターと幅広くかつ高頻度にコミュニケーションを取りプロジェクトを推進していたのが印象的でした。 関係者が増えるとタスクの調整やMTGの時間が増加するなど、ネガティブなことも当然ありますが、より大きなプロジェクトを推進できますし、普段は知れない知識を得ることができ、よりビジネスの解像度が上がるなど良いことのほうが多いと思います。 「R&Dは小規模で、手堅いプロジェクトは他部署を巻き込んで」というのをこれからも意識していきたいです。
ミッション(プロジェクト)を通じたメンバーの成長
プロジェクトを通じたメンバーの成長についてですが、あまり積極的ではないと思われたメンバーが事業部の各人に直接課題抽出に伺った、エンジニアリングに苦手意識があるメンバーがエンジニアと連携しながらその知識の差を埋めていった、コーディングばかりしているメンバーが営業組織にDX関連の知識を共有しプロジェクト推進を活発にしたなど、これまでにない側面を見れたと思いました。
今後進めていくこと
データの活用をある程度進めることができたのが2022年だったかなと思うのですが、今後はデータ活用の質として因果関係について、もっとこだわってみたいと考えています。 レコメンドに関してアルゴリズムを使ったほうが本当に良いのか、あるマーケティング施策に効果は本当にあるのか、その因果関係を明らかにするために蓄積されるべきデータは何かについて向き合っていきたいと思います。コーディングやアルゴリズム開発が仕事の多くを占めますが、企業の競争優位性に繋がるような戦略策定にもしっかり時間を割きたいですね。
ビジネスアナリティクスグループ
2022年の動き
ビジネスアナリティクスグループの小山です。
ビジネスアナリティクスグループでは、データ分析によるビジネス価値向上、課題設定、データPJの推進、事業モニタリング体制の構築など、ビジネス現場でのデータ活用推進を主に行っています。
2022年は、これまでのデータ戦略室の歴史の中でも、ビジネスアナリティクスグループの価値貢献の領域が最も広がった1年でした。
組織の拡大と分割
ビジネスアナリティクスグループはここ1年ちょっとで倍の人数規模になりました。 グループとしてやっていることは、「社内のデータ活用・モニタリング環境の構築」「データ分析による事業課題の発見、改善の提言」の2つですが、1年ほど前までは、前者にかかわる業務が多く、後者に着手できる余裕が少ないという状態でした。 しかし、採用によって仲間が増えた結果、社内での活躍領域が増したのが昨年です。 それによって、チーム内を役割によって「データアナリティクス」「データアーキテクト」の2つに分割してミッションを定義しました。
アナリティクスグループは分析課題の発掘から実行、アーキテクトグループはデータ設計やDWH、ダッシュボードの構築からデータ活用からデータの民主化の推進を主に担います。 データにかかわることは何でもやるというインハウス型のデータ組織として、また一つ階段を登った気がします。
データマネジメントの強化
社内でのデータ品質モニタリング、メタデータ管理などデータマネジメントに着手ができました。これまでは、データ戦略室内で特段データマネジメントを積極的に主導してきたわけではなかったのですが、社内でのデータ活用が拡大するにつれて、データマネジメントの必要性が増してきたからです。 自分たちとしても初の取り組みだったため、インプットしながら試行錯誤でやってきました。結果的に、メタデータポータルサイトの社内公開、データ戦略室として品質を保証しているデータソースの定義、DWH内のテーブル依存関係の可視化、データマート定義書の社内公開、など
という状態を作り上げることができ、社内でデータ分析をしたい人がより正しく早くデータを活用しやすい環境を整えることができました。
ゆずたそさん、はせりょさんのデータマネジメントが30分でわかる本には大変お世話になりました。
競合優位性の創出
現代においてデータを保有していることは大きな資産ですが、データは溜まっているだけでは価値を発揮しません。 データの適切な活用方法を考えることで、初めてデータは事業の競争優位性に転化されていきます。 昨年で言うと、レバテックプラットフォーム内でのリアルタイムIT人材市場データの公開が大きかったです。「データを蓄積していることが、サービスを選択する理由になった」という事例に今後なっていくと嬉しいですね。
また、社内の営業フローにレコメンドシステムを組み込むチャレンジができたことも大きいです。営業部内の人員規模も事業の顧客規模も大きくなってきた今、圧倒的な生産性の向上に寄与することは間違いないでしょう。 こちらは、取り組みとして成果が出たら今後別記事としてご紹介するかもしれません。
このようなPJにおいては、マーケティング責任者、システムエンジニア、営業マネージャーなど様々な人を動かしながらPJを推進していく必要がありますが、そのような影響力を発揮できるのが事業会社でインハウスのデータアナリストとして活躍していく醍醐味ではないでしょうか。
今年やりたいこと
昨年は、データガバナンスの強化や、データを使った競争優位性の創出を少しだけ意識し始められた年でした。 今年は、その意識をさらにアップデートさせ「事業のデータ戦略を描く」つまり「価値のあるデータを蓄積してデータの品質を高め、価値のあるデータ活用方針を打ち立てる」ことを組織の目標としたいです。 事業モニタリング環境の構築やデータ分析などは引き続き価値貢献していきますが、未来の事業基盤を自分たちが作るという課題にチャレンジできる人材でありたいと思う今日このごろです。
データエンジニアリンググループ
今年実現できたこと
データエンジニアリンググループの森下です。
データエンジニアリンググループでは、データ活用に必要なシステム環境の構築や実装を行っており、2022年は主に全社的に利用しているデータ活用基盤の設計〜実装〜導入や機械学習を使用した施策のMLOps導入を行ってきました。
データ活用基盤のさらなる導入と推進
データ活用基盤はBigQueryを中心にETL処理を担う部分も含めてGCP上に構築しています。昨年時点では、1つの事業部にしかBigQueryを導入できていませんでしたが、今年に入ってさらに3つの事業部へ導入することができました。基本構成は既存事業部と同じで、ワークフローエンジンにDigdag、バルクローダーにEmbulkを使用してしています。ただし、既存のデータ活用基盤はDigdagとEmbulkを同じサーバー上で動かしていましたが、今年導入した事業部に対しては、DigdagとEmbulkのサーバーを分割し、加えてインフラ構成を全てIaC化することができました。Digdag上のワークフローについては、既存事業部での経験を活かしプロジェクトやタスク分割を更に型化しています。先んじてデータ活用基盤を構築し本番導入している事業部があるからこそ、本番導入しないと見えない点や運用時にイケてない点を見つけることができ、新しく構築する際にも活かすことができています。
機械学習を用いた施策のMLOps化
データ戦略室ではさまざまな用途で機械学習モデルを作成しており、多くの施策に使用されています。しかしながら、モデルの精度モニタリングや再学習は各データサイエンティストがそれぞれのタイミングで行なっており、大幅に精度が下がっていることがわかって慌ててモデルの再学習を行うこともありました。そういった事態を防ぐために、マーケティング施策のための機械学習モデルでもMLOps化を進めていこうと考え、データエンジニア側でAWS Sagemakerを使用してMLOps体制の構築を行うことにしました。今回の取り組みについては、データサイエンティスト目線での記事がありますので、是非ともご覧ください。この事例における学習〜推論パイプラインをAWS Sagemakerで実装した部分については、また別の機会で実装したエンジニアに記載していただきますので、楽しみに待っていただけたらと思います。
今後実現していきたいこと
これまでは各所に点在しているデータをBigQueryに必要な頻度で更新する仕組みを作る、ということに重点をおいてきました。今後はデータ活用基盤を支えるインフラの強化と共に、データ活用の領域までエンジニアリングを使って貢献範囲を広げていけたらと思います。
データ活用基盤全体のIaC化および監視強化
複数事業部にそれぞれGCPプロジェクト分割して別のタイミングでデータ活用基盤を導入しているため、インフラ構成が微妙に異なったりIaC化できていないところもあります。刷新というほどではありませんが、インフラ構成の統一化やIaC化は引き続き進めていきたいと考えています。 監視については、BigQueryの課金モニタリングだけは最低限作りましたが、システム観点での監視についてはまだ改善の余地がたくさん残っています。データ活用基盤の導入や社内ユーザーに使用されるための施策を優先してきたためではあるのですが、この点については全社のSREチームと共に体制の整備を進めていきたいと考えています。
データマネジメント領域のエンジニアリング適用
これまでデータ活用基盤に関わる部分は、「ビジネス要件に合わせてデータを取得し、必要な頻度でBigQueryのデータ更新がされること」をメインに実装してきました。ただし、今後はより使用され価値を発揮するデータ活用基盤とするために、データマネジメント領域についてもエンジニアリングでできる課題解決を進めていく必要があると考えています。例えば、dbtもしくはdataformを用いたSQLワークフローの管理を進め、各テーブルの依存関係を可視化したりクエリの自動テストを行うことによって、より品質の高いデータマートを少ない工数で運用できるようにする、といったようなことを進めていきたいと考えています。
終わりに
今回は2022年のデータ戦略室の活動を振り返ってみました。各グループの活動を振り返ってみると、共通しているところではデータ戦略室内外で他職種と一緒に仕事をする機会が増えている点があるかと思います。それぞれ得意とする領域は異なりますが、「データを使って価値を出す」ことに専門性を持っている集団ですので、組織内でも組織外でも他職種と働く機会が今後も引き続き増えていくと事業に対する影響力や価値貢献も大きくなっていくのかなと思います。
データ戦略室では、データサイエンティスト・データアナリスト・データエンジニアがそれぞれの専門性を活かして日々の業務に邁進しています。
興味がある方がいらっしゃれば是非以下のリンクからご応募ください!
https://recruit.jobcan.jp/leverages/