Leverages データ戦略ブログ

インハウスデータ組織のあたまのなか

メタデータポータルサイト運用開始までの道のり

はじめに

データ戦略室ビジネスアナリティクスグループの辰野と申します。データ戦略室に異動して、早1年が経過しました。
今回は、直近の半期に取り組んだ「メタデータポータルサイトを運用開始させるまで」について、ご紹介します。 まだ運用開始したばかりではありますが、これからメタデータ管理を始められる方にとって、少しでも参考になれば幸いです。

メタデータポータルサイトを運用させることとなった背景

今回の施策を行うこととなった背景として、全社のデータ活用レベルを上げていく中で、現在「データの民主化」を進めるフェーズであることが上げられます。 レバレジーズでは、事業部によって達成レベルは異なるものの、BIツールを使用した事業運営に必要なKPIの可視化やモニタリング体制は一定実現できている状況でした。その中で、今後はデータの民主化を促進すべく、データマネジメント強化の一環として、メタデータ管理体制の強化を行うこととなりました。 メタデータ管理として、以下の状態を作ることに定めました。

また集約と公開の手段として、ポータルサイトを使用することにしました。これらを進めていく中で気をつけた点について、順にお伝えできればと思います。

管理するメタデータの決め方・集め方

管理対象となるメタデータを決めるにあたって、まず「メタデータが必要なデータがどこで発生しそうか?」を考え「データの生成→収集→蓄積/更新→活用」の流れが分かる自社のアーキテクチャ図を元に、下記の流れで洗い出しました。

f:id:DataStrategyOffice:20220415143932p:plain

ここで気をつけた点としては、メタデータを収集するにあたって各担当者にあまり負担にならないよう、依頼前に最低限発生しそうなメタデータをテキストベースで洗い出し「存在するかしないか、不要かどうかの判断」のみで対応できる状態にしたことです。具体的には、データ活用のレベルが比較的高い事業部で洗い出したメタデータを他の事業部にも流用することで、全事業部の全メタデータ候補を一覧化しました。その後に、スプレッドシートに「アーキテクチャ図上の使用システム/ツール×メタデータの種類」分の行を設け、まず「対象物があるかどうか・存在するかどうか」を判断してもらい「既にあればURL等を添付、なければ作成してもらう」といった流れで進めました。 (参考)メタデータの種類について:「第10章メタデータ管理」.『データマネジメントが30分でわかる本』

メタデータの格納方法と管理・更新体制の決め方

メタデータの格納方法を決めるにあたって、まず満たすべき条件を決め、それに当てはまる最適な方法は何かを洗い出しました。

f:id:DataStrategyOffice:20220415141520p:plain

上記から「2.専用スプレッドシートにURLを入力して格納」「3.Googleサイト内に格納」の2つに絞り込みましたが、この時点でデータ戦略室では様々な分析やツール導入事例など、多くのデータに関わる情報が存在しているものの、メタデータ同様あらゆる場所に散在しており、いずれはまとめる必要がありました。そのため「全てのデータにかかわる情報が1箇所で取得できる状態」が理想であると考え、今回は「3.Googleサイト内に格納」で進めることにしました。
また、ポータルサイトでどのように格納させるかを考えるにあたって「最新の情報でなければ意味がない」ので、まずは「更新のしやすさ」を重視したイメージを2パターン作成し、メタデータを更新する担当者にどちらが良さそうかを判断してもらいました。その結果「メタデータごとに存在する複数の情報が一度に見れる」かつ「スプレッドシートのほうが使用に慣れている」といった理由からイメージ2を採用しました。

f:id:DataStrategyOffice:20220415141706p:plain
f:id:DataStrategyOffice:20220415141732p:plain

メタデータの管理・更新方法としては、大きく2つを設定しました。
1つ目は「月次メタデータ更新タスクの付与」です。1人で全てのメタデータを更新することは難しいため、月次でメタデータ更新タスクを各担当者に付与し、毎月チェックを行ってもらうことにしました。
2つ目は「メタデータ利用アンケートの配信」です。格納方法の際に「更新のしやすさ」を重視したと記載しましたが、とはいえ「使いやすさ」も向上させる必要があります。そのため、メタデータポータルサイト利用者向けに月次でアンケートを配信し、メタデータ利用状況をヒアリングしながら改善していくことにしました。

f:id:DataStrategyOffice:20220415141951p:plain

メタデータポータルサイト運用開始にあたって苦労したこと

管理するメタデータの決め方・集め方で「自社のアーキテクチャ図を元に洗い出した」と記載しましたが、実際にそこから洗い出すまでかなりの時間がかかりました。 今回のメタデータ管理対象とする事業部が大きく3つあり、かつ使用しているマーケティング・セールスシステムも異なっていたため、一通りメタデータ管理候補を洗い出した時点で100個近く出てきました。そこから本当に必要なメタデータかを精査し、収集し終えるまで、各担当者への依頼期間も含め1ヶ月程度かかりました。
会社の規模にもよるとは思いますが、メタデータを管理し始めるにあたって、専任者を立て、まとまった時間を確保しながら進めることは重要だと感じました。

今後の課題

メタデータポータルサイトは、まだ運用開始から1ヶ月程しか経過しておらず、多くの課題が残っています。アンケートを元に「使いやすさ」「分かりやすさ」にも注力して改善していくこと、また「ポータルサイトにアクセスすれば、全てのデータに関する情報が見つかる状態」にすべく、メタデータ以外の情報も拡充させていく必要があります。
これらに加え、今後データ品質向上やデータ活用体制の整備などにも取り組み、データ活用を推進していきたいと思います。