レバレジーズ データAIブログ

インハウスデータ組織のあたまのなか

データの民主化を考える 〜正しく活用される基盤づくりとは〜

はじめに

こんにちは。
レバレジーズデータ戦略室、データアーキテクトグループの鵜飼です。

今回は、よく耳にする「データの民主化」という概念について、実現するためには一体どうしたらいいのか、自分がデータ分析基盤の活用促進を進めていく過程や、他社様の事例をから得た気付きを交えながらを書いていければと思っています。
レバレジーズでデータの民主化を完璧に実現できているわけではなく、思ったことや今後の展望を記載しておりますので、一意見としてご覧いただき、みなさんが考えるデータの民主化の理想形を教えていただけると非常に嬉しく思います!

データの民主化とは

「データの民主化」という言葉の定義は様々ですが、まとめると「組織内のすべての人が簡単にかつ正しくデータを利用できるような環境を構築すること」であるかと思います。
正しくデータを利用できるという点で、ただデータ分析基盤を提供するだけでなく、利用者の教育やデータカタログの整備等も非常に重要です。

誰もが簡単にデータにアクセスできる環境の提供を実現できている会社は多いのではないかと思う一方で、全員が「正しく」データ活用ができている状態を実現するには、いくつかの障壁があると感じています。

データの民主化を進めていく過程で起こりがちなこと

指標の定義が統一されておらず、人によって出力結果が異なる

各部署がクエリを書いてモニタリングを作成していることが多いのですが、KPIの定義が部署によって異なる場合があり、同じKPIを異なる値でモニタリングしていたり、部署間で認識の齟齬が起こったりしているという状況でした。
定義が複雑すぎるがゆえに、個人でクエリを書く際に条件の記載漏れがあり、間違ったデータを抽出している事例もありました。
せっかくデータを活用しようとしても、間違った数値で間違った意思決定をしてしまえば元も子もありません。
また、データ戦略室が管理しているモニタリングについて、KPIの定義に関する問い合わせがデータ戦略室に頻繁に寄せられ、対応に追われることもありました。

同じようなダッシュボードが複数存在する

データ組織のメンバー以外にもBIツールの編集権限を付与し、自由にダッシュボードを作成している会社の事例をよく耳にします。データ組織がレポーティングファクトリーになることを防ぎ、現場が見たいものをすぐ作れるというメリットはありますが、同じ用途のダッシュボードが重複していないかをきちんと管理し、どれを見るべきか整理されているのかなと疑問に思うことが多くあります。
また、レバレジーズでは内製のSFAツールのカラム追加や削除が頻繁に起こるので、データ組織が管理していないダッシュボードが大量にある中で影響範囲の調査を行うことは簡単ではないと感じます。

レバレジーズの取り組みと今後の展望

現在レバレジーズでは、民主化と言いつつ中央集権化を進めております。
これは、社内の人が自由にデータにアクセスできなくなるようにするという意味ではなく、データ戦略室が指標の定義やモニタリングの作成に責任を持ち、社内の全員が「正しく」データを利用できるようにするという意味です。
具体的に行ったことは下記です。

KPI定義一覧の作成

KPIの定義を明確化し事業として統一するために、事業部の共通のKPIのビジネス定義・データ定義が一覧で見れるKPI定義一覧を作成しました。

※画像は一例です

部署によって定義が異なっていたKPIは、データ戦略室が間に入り調整を行うことで、定義の統一を行いました。
一覧があることで、社内の全員が正しい定義でデータを抽出し、かつデータ戦略室内での属人化を防ぐことができました。
また、BIツールに定義一覧のURLを貼っておくことで、定義に関する問い合わせの削減にも繋がりました。

datamartの活用推進

これまでは、人によって権限は異なりますがローデータにアクセスできる人もいたので、間違ったデータの抽出が各所で散見されていました。
そのため、データ戦略室で取りまとめたKPI定義をもとに処理をしたdatamartからのデータ抽出を促すことで、ドメイン知識がなくても全員が同じ定義でデータを抽出できるような環境を構築しています。
これまでもdatamartは存在していましたが、ローデータにアクセスできる環境かつ新たなKPIが生まれやすい環境であるため、各自がデータを加工してしまっていたり、システム仕様がデータにアクセスするユーザーに伝わらず間違ったデータ抽出をしてしまっている状態だったので、今後はローデータへのアクセスを制限していくことで、個人が自由に加工したデータを意思決定に使用できないようにしていこうと考えています。
ただ、今まで使えていたデータへの権限を制限することに対して懸念の声が上がることは想定されるので、可能な限り利用者に不利益が出ないよう、要望があった指標やカラムを迅速にdatamartに追加していくことが今後求められるかと思います。

データソース、ダッシュボードの重複の解消

レバレジーズでも、過去に作成された同じようなデータソース、ダッシュボードが複数存在しております。管理も大変ですし、利用者にとってもわかりづらい状況となってしまっているので、今後徐々にですが整理して削除していきたいと考えております。
ただ、今まで使い慣れてきたものが使用できなくなることに抵抗感を抱く人も少なからずいるため、現場に入り込んでより良いものを作成することで浸透を進めていこうと思います。

終わりに

現在、データの民主化の実現に向けて、他社様の事例も参考にしながら日々試行錯誤し、基盤の整備や浸透を進めている最中です。
なにか新たな気づきがあれば、このブログで共有できればと思っています。