マーケティングオートメーション(MA)
2017.3.9
マーケティングオートメーションの中には自動最適化機能が組み込まれている事があります。これを人工知能と呼んでいるサービスもあります。
今回はアルゴリズムの中の一つ、バンディットアルゴリズムについてご説明します。
バンディットアルゴリズムは、今手持ちのリソースを用いてアウトプットを最適化する事が出来ます。
例えば、5000枚のコインと5台のスロット台があり、それぞれの台の当たる確率が均一でない場合に、5台に1000枚ずつ分けるのではなく一定のルールに従って振り分けることでより効果的に当てる事が出来ます。
このアルゴリズムは、
・活用(exploit)
・探索(explore)
の2つから成り立っています。
またこの時のスロット台にあたる部分をアーム(腕)と呼びます。
バンディットアルゴリズムを適用するためには条件があります。
1.アームそれぞれの当たる確率はバラバラであり、回数によって変化しない
2.アームの結果が、当たり/外れの2種類。Webでいうと、コンバージョンした、しないの2種類
3.プレイヤーはアームについて何も知らない。(互いに影響を及ぼさない)
バンディットアルゴリズムの中にも種類がありますが、最も有名なepsilon-greedy法について説明します。
1.活用(exploit)をεの確率で行い、探索(explore)を(1-ε)の確率で行う。
2.活用では、期待値の最も高いアームを引く
3.探索では、全てのアームからランダムに選択したアームを引く
この手法ではεは固定して行います。(故にεによってアウトプットに影響がある)
この手法のメリットとしては、非常に簡単に最適化が行えることです。一方でデメリットに関しては以下が挙げられます。
・探索において、明らかに結果が良くないと分かっているアームに対しても、未知のアームと同じく等しく扱われる(引かれる)
・活用においては、最も良いアームを引き続けるため、最初に、実は良くないアームを良いアームと判断してしまった場合に起動修正が効きにくい
バンディットアルゴリズムは、最適化に使われる手法です。
その中のepsilon-greedy法では簡単にバンディットアルゴリズムを使うことが出来ます。
普通に生活しているとこういうアルゴリズムに出会うことはあまりありませんが、知っていたらいつか役にたつかもしれませんね!ギャンブルをやっている方、ぜひ試してみてください(笑)
Deliways内検索Search
カテゴリーCategory