Leverages データ戦略ブログ

インハウスデータ組織のあたまのなか

思ったより泥臭い!新卒1年目データアナリストの解体新書

はじめに

データ戦略室ビジネスアナリティクスグループの濵田です。2022年4月にレバレジーズに新卒入社してちょうど1年が経ちました。 今回は「ここ1年で何をしてきたか」と「新卒の目から見たデータ戦略室」という2つのテーマで話したいと思います。 データ戦略室での1年間を本の紹介をはさみつつ時系列順で振り返ります。

ひたすらSQLを書き続ける2カ月間

データ戦略室に配属されてすぐは武者修行としてSQLを大量に書いていた記憶があります。 当時のレバレジーズではデータウェアハウスとしてTreasureDataをメインで利用しており、全社的にTreasureDataからBigQueryへの移管が決まったことで大量のクエリ書き換えが発生していました。

この書き換えを一部自分が担当することになったのですが、

  • TreasureDataとBigQueryで使える関数が全然違う問題(特にmax_by)
  • サブクエリが多すぎて解読できない問題(頼むからwithを使ってくれ...)
  • データ連携のタイミング違いで差分検証が終わらなさすぎる問題

に悩まされ、かなりしんどい期間を過ごしていました(笑)

この期間ひたすら書き続けたことでデータを扱う基礎力が身についた気がします。

この期間に読んだ 10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く は何度も読み返すSQLのバイブルになっています。 この本に載っていたexcept演算子を用いて2つのクエリ結果に差分があるかを確認する方法はクエリ移管の際にとても役立ちました。また、分析システムのアーキテクチャに関する簡単な説明が載っており、この後担当するモニタリング環境構築でデータマートを作成する際にも非常に役に立ちました。

BIツールでモニタリング環境を整えた半年間

ある程度SQLが書けるようになってからは事業部から依頼を受けてモニタリング環境を作る業務にシフトしていきました。 スカウトアプリのプロダクト数値や採用KPI、マーケティング関連のKPIなど、様々な指標についてモニタリング環境を整えました。利用したBIツールもTableauやQuickSight、LookerStudioなど多岐にわたります。

正しくデータを扱うだけでなく、どのようにデータを見せれば良いのかについて考えるようになったのが大きな変化でした。事業責任者やマーケティング責任者といった役職の方たちが何を気にして意思決定しているのか、密にコミュニケーションをとりながらアウトプットを作りました。 最初のうちは「定常的に見る必要のない指標は除外する決断をすること」、「意思決定層を押さえることで他部署との交渉をスムーズにすること」の重要性に気づいておらず、モニタリングを作ると言い出したもののなかなか前に進まないという失敗を経験しました。現場から見たい指標を集めてきたが、量が膨大で優先順位を自分では決められないという状況に陥っていたのです。

この経験から、データだけでなくビジネス側が大事にする価値観や意思決定フローの理解も深まりました。 また、事業責任者やマーケティング責任者という意思決定レイヤーとのコミュニケーションが増えたことで事業課題を知る機会が増え、モニタリング環境構築に留まらず根本的な課題解決を任せてもらえる機会が増えました。 事業の抱える課題解決経験を積めたことやビジネスへの理解が深まったことにより、自分ができるビジネス貢献の幅が広がったなと感じています。

データ分析や機械学習へと幅を広げた3カ月間

1年目の終わりではデータをいじったり、見れるようにするだけでなく、データから何か示唆を得たり、データを利用して何かしらアプリケーションを作るという業務にシフトしていきました。 以前仕事で関わった事業部から依頼を受け、アプリ内のスカウト承諾率改善を目的とした分析やレコメンド機能の実装を担当しました。

この時期は今まで以上に事業部へ深く入り込まないと成果を出せない仕事をしていたと思います。 スカウト承諾率の分析ではユーザー理解を深めて筋の良い仮説を立てるために、デザイナーチームのUXプロジェクトに参加させてもらいました。レコメンド実装では事業部側、エンジニア側と密に連携しながらロジックの検討と実装を進めました。

レコメンド機能の実装ではアルゴリズムを体系的に理解した上で、事業部側の要件とデータ蓄積状況を考慮してロジックを決める必要がありました。多角的にロジックを比較検討しつつ事業部側の了解を取っていくプロセスは非常にやりがいのあるものでした。 特に、担当した事業部は新規事業でリソースが潤沢ではなかったため、限られた計算環境の中で動くレコメンドを実装しなければなりませんでした。そのため、計算量削減のようなエンジニアリング的視点も持つ必要があり、プロダクトへの実装は一筋縄ではいかないなと感じたことを覚えています。

データ分析について読んだ本の中では データ分析の力 因果関係に迫る思考法 がとてもわかりやすかったです。因果関係を明らかにする方法が細かい数式なしで解説されており、実施コストの高いランダム化比較実験の代わりにRDデザインや集積分析などの自然実験を利用する方法について詳しく述べられています。具体的な分析手法をそのまま自分の分析に活かすのは難しいものの、分析結果の解釈をする際に2つの群に偏りは生じていないのか、因果の方向は妥当なのかという視点は自分の分析にも活きていると感じます。

さいごに

いかがだったでしょうか?レバレジーズのデータ戦略室に配属されてからの1年間を時系列で振り返ってみました。

レバレジーズでの1年間は良い意味で予測不可能な1年間だったなと思います。自分ができることを起点にしてどんどん仕事のサイズが大きくなっていくという感覚を味わうことができました。

中でも、データ戦略室の魅力はデータという手段にとらわれずに様々な事業部の課題解決を圧倒的なスピード感で経験できることだと思います。 現に、2年目からは「とある事業部の売上人件費率を改善する」という抽象的なお題を与えられることになっています。

データ戦略室に新卒で入るとこんな経験ができるのかとイメージついたでしょうか!?新卒の方はもちろん、中途の方でもデータ戦略室に興味を持っていただける人が増えると嬉しいです。