Marketing-Mix-Modeling（MMM）に関する所感や問題意識について

目的と背景

レバレジーズのデータ戦略室で室長をしている阪上です。今回は、最近仕事で使うことがあり、調べているMarketing Mix Modeling（MMM）について簡単に紹介したいと思います。この分野に関して、あまり国内で盛り上がっていないように感じたため、僭越ながら少しでも関心を持つ方が増えることを願って記しました。

今回は具体的に自社でどのような分析を行ったかについては記しておりませんが、今後、別の記事で用意したいと思います。

MMMとは

Marketing Mix Modeling（MMM）は各種メディアへの支出が、企業の売上にどのように影響を与えるのかを理解するために、あるいは最適なメディア投資を行うための支出の配分を決めるために使われます。主に回帰分析などの手法を用いて、時系列データである売上を同じく時系列データである各種メディアのインプレッションなどで説明づけるというアプローチが多いです。

MMMの変遷

MMMは1964年のBordenの売上に対する各メディアの影響を予測する研究（”The Concept of the Marketing Mix.”）が発端とされています。Googleの論文（”Bias Correction For Paid Search In Media Mix Modeling”）によると、これまでアメリカの大企業（フォーチュン500など）の多くがMMMのモデルを自社のデータに適用してきたとされています。つまり、アメリカにおいては四半世紀以上の歴史のある周知の手法となっているようです。

一方、日本でも広告投資の大きな企業がMMMによる分析を行っているという話を分析界隈の会合で聞くことがあります。自社でMMMモデルを開発したり、専門とする有償ツールを導入したりと取り組み方は様々あるようです。

最近では、因果推論の観点から2017年以降Google社がMMMについて調査をし、論文をパブリッシュしています。私もGoogle社の論文からMMMについて詳しく知るようになりました。

MMMをやるモチベーション

MMMに企業として挑戦するモチベーションとしては、「どれくらい広告に投資をすれば、どれくらいリターンが返ってくるかを知りたい」という点に帰着できるのではないかと思います。例えば、オフライン広告（高速道路の近くにある看板）の効果を測りたい場合、車の通行量が多ければ多いほど自社サービスのブランド名検索回数が増えるのかをMMMで分析することになります。

他方、「使い過ぎている広告があればそれを知った上でコストを下げるアクションを取りたい」というモチベーションもあります。例えば、広告効果が頭打ちになっている経路があった場合、それの予算を削り、その分を伸びる余地のある別の広告にアロケーションするというものです。

一般的にマーケティングの広告予算はかなりの金額になるため、適切にアロケーションを行うことができれば会社へのインパクトはかなり大きくなると思われます。

MMMのアプローチ方法

MMMでは、どのようなデータを使うのかというと、月次ないし週次の時系列データで2~3年分のデータを分析対象にすることが多いようです。

被説明変数として使うデータとしては、売上ないしCV数など目的に応じて設定されるものが使われ、説明変数として使うデータとしては、大きく分けて自社メディア投資（メディアインプレッション）と自社メディア投資以外（コントロール変数）に分かれます。

自社メディア投資（メディアインプレッション）としては、テレビCM・吊革広告・検索連動型広告・自然検索・アフィリエイト・DSP・メールマガジンなどがあげられます。

自社メディア投資以外（コントロール変数）としては、季節要因・カタストロフィックな事象（COVID-19や火山の噴火など）・マクロ経済情報（景気）・競合他社や競合商品の売上などがあげられます。

どのようなモデルを使っているかというと、総じて重回帰モデルが使われることが多いです。先ほどあげた被説明変数を説明変数で回帰するというアプローチとなります。当然ながら、時系列データが少ない場合、説明変数の数が多過ぎるとパラメータの推定が難しくなりますので、モデリングの難易度は決して簡単ではありません。また、誤差項が説明変数と相関してしまう場合、パラメータを適切に推定できない可能性があります。これを内生性の問題と呼びます。

他方、ベイズモデリングや状態空間モデルを取り入れたアプローチも可能で、ロジスティック分布などを用いて、パラメータに事前分布を設定し、線形モデルで推定するというアプローチなどがあります。また、階層ベイズなどへ拡張することも可能です。

当然、データの数よりもパラメータの数の方が多い場合でも、事前分布の設定により推定が可能となりますが、慎重に分析をしなければ事前分布の影響が残ってしまう懸念があります。

こちらの図は、Googleの論文のモデルと全く同じものではないのですが、MMMのモデルのアーキテクチャとして雰囲気を掴みやすいので掲載させていただきます。

f:id:DataStrategyOffice:20210831150231j:plain （ https://github.com/sibylhe/mmm_stan のModel Architectureより図を引用）

MMMにおいて土台となる重回帰のモデルにどのような仮定を置くのかというと、先行研究ではCarry Over効果や形状効果というものが仮定として置かれています。

f:id:DataStrategyOffice:20210831150333p:plain （ Bayesian Methods for Media Mix Modeling with Carryover and Shape Effects より引用）

Carry Over効果というのは、「広告の売上への効果は遅れて現れる」という仮定で、説明変数として、過去の広告投資を累積で表現するというアプローチが取られています。

f:id:DataStrategyOffice:20210831150406p:plain （ Bayesian Methods for Media Mix Modeling with Carryover and Shape Effects より引用）

他方、形状効果というのは、「一定程度、広告に投資をすると効果が頭打ちになる、あるいは経路によって大きく効果が高まる」というものです。先行研究ではHill関数という関数系が使われます。Hill関数のパラメータ推定はベイズ推定などで行われます。

最後に、MMMのモデルをどうやって評価をするかというと、重回帰モデルの場合は自由度調整済みの重決定係数を使うことになります。また、ベイズモデリングをしていたGoogleの論文ではモデルの評価に情報量基準（BIC）が使われていました。

ここは私見なのですが、機械学習と違って、当てはまりが良ければ何でもいいというわけではないのが統計モデリングの世界なので、指標に重きを置き過ぎぬよう、因果関係を意識して慎重にモデリングしたいと思うところです。

MMMの注意点

ここはこれまで統計学を学んできたものとしての意見なのですが、MMMは統計学のバックグラウンドを持たずに向き合うには色々と注意すべきところがあると考えています。
以下で、その注意点をあげていきたいと思います。

一つ目が内生性（因果推論で言うところの交絡）の問題です。MMMで扱うモデルにおいて、使うべきデータが欠落している場合、適切にパラメータを推定できなくなる危険性があります。パラメータの大きさによって意思決定をする際は注意が必要です。

二つ目が多重共線性の問題です。かなり多くの変数を使うMMMにおいては、メディア投資の経路に関して説明変数同士で相関するものはしばしば発生します。これを気にせず分析を進めるとパラメータの統計的有意性がなくなったりします。

三つ目が見せかけ相関の問題です。MMMで扱うデータは時系列データに他ならないのですが、単位根のあるような非定常の時系列データを用いて回帰をすると本来は相関をしていないにもかかわらず、相関しているように推定されてしまう、見せかけ相関の懸念があります。あるいは共和分過程かどうかを検定することも必要となります。

四つ目が事前分布の影響を引きずる問題です。MMMをベイズモデリングで行う場合、データ数が少ないと推定結果が事前分布の影響を受けやすくなります。これは分析者の事前分布に対する仮定の影響が大きくなることを意味します。これに関しては分析の信憑性に関わるところとなるので慎重にいきたいところです。

最後に、Google社の研究によるとMMMのモデリングにおいて、様々な変数を用いた際の不偏推定量は得られていないそうです。つまり、真のパラメータとは違う偏った値になってしまうということを意味しています。

データ間での因果関係を適切に推定しようとすると、Judea Pearl流の因果推論アプローチに従うというのが順当な流れなのですが、複雑なMMMモデルにおいて因果関係をうまく推定するモデルは出来ていないようです。一つの経路に関しての因果効果を見るという観点では研究が進んでいるのですが、MMMの因果関係レベルでの適切な考察が得られるのはまだまだ先になりそうです。

MMMの今後の予想

ここは私の私見によるところなのですが、MMMは効果の計測が難しいオフライン広告やクッキーに頼った広告経路において注目をおかれる手法とされていると認識しています。手法としても線形のモデルをメインとしていることから、解釈もシンプルで、マーケティングの実務をする方も理解がしやすいと思います。

しかしながら、昨今では、テレビなどの視聴データもアプリなどで細かく取得できる時代になってきたことから、MMMを使わずともこれまでオフライン広告をしていた領域での分析もこれまでよりは可能になってくると思われます。そのため、今後、MMMを使わないと広告効果を測定できないという優位性は少なくなってくるかもしれません。

ただ、MMMを複数の変数を用いた、厳格な因果推論のアプローチとして確立することができるのであれば、経済学における一般均衡理論の実証分析のように存在し続けると思います。特に、ある広告と他の広告の相互作用などがある場合、それらを考慮したモデルの方がより現実データへの当てはまりが良いはずです。

よりアカデミックな領域で手法として揉まれることで、より洗練された手法として昇華するように、実務家としては待ちわびたいと思います。