目次
運用型広告に地殻変動を起こすAIの技術
第1回ではAppierのCEOチハン・ユーさんのお話を中心にAppierという会社と、Appierの考えるAIのいまについて紹介しました。
第2回の今回は、具体的にAIをどのように活用しているかについて、企業向けAIを統括するVice Presidentのチャールズ・エンさんのお話を中心に、Appierの製品「CrossX Programmatic Platform」(CrossX運用型広告プラットフォーム)やオーディエンス分析・予測を行うデータインテリジェンスプラットフォーム「AIXON」(アイソン)に活用されているAIの技術を紹介していきます。
企業向けAI担当VPチャールズ・エンさん
GoogleのCEOのサンダー・ピチャイ氏は、2016年に発表した「This year’s Founders’ Letter」の中で、Googleの製品開発戦略を「モバイルファースト」から「AIファースト」に切り替えことを発表しています。
すべての製品をモバイルデバイスを最優先に設計する「モバイルファースト」から、AIを使って製品を開発・強化する「AIファースト」に切り替えたことで、「Googleアシスタント」はもちろんのこと、AdWordsにおいてもAIや機械学習を使った機能が続々と登場しています。
普段わたしたちが使っている運用型広告の管理画面の裏側に、AIの技術が投入されることによって大きな地殻変動が起きています。Appierの各製品に使われているAIの技術を知ることで、運用型広告の世界で起こっている地殻変動が垣間見られます。ぜひそういった視点からも、この記事をご一読いただければ幸いです。
AIを使ってユニークユーザーを判別する
Appierの製品は大きく分けて「マーケティングインテリジェンス」と「データインテリジェンス」の2つの領域があります。その根底には、AIによってデバイスやcookieを横断してユニークユーザーを特定する「クロススクリーンインテリジェンス」という高度な技術があります。
様々なデバイスやcookie情報からユニークユーザーを判別するために、ログイン情報やメールアドレスなどあらかじめユニークユーザーが特定されている「特定型」のデータと、様々な情報をもとに機会学習によって類推する「類推型」の2つの方法を採用しています。
「特定型」はデータプロバイダーやパブリッシャーのパートナー様などからデータを一部購入しています。ログインIDに近しいデータを使って、様々なデバイスから来る情報をひとつのIDにまとめ、ユニークユーザーとして判別しています。
「類推型」に関しては、インターネット上で様々なcookieやIDの情報が飛び交っていますが、そのままではユニークユーザーとして判別できないデータ群を、取得できるあらゆるシグナルを活用して機械学習の技術によって判別しています。「特定型」などで得た、正しいユニークユーザーの行動パターンを基に予測モデルを作成し、その予測モデルにユニークユーザーを判断させることになります。
例えば、広告の配信を通じて、あるパソコンから毎日特定の時間に来る cookie のデータがあったとします。また、ある別のスマートフォンからの cookie が夕方にいつもある特定のパターンで動いているとします。それらが例えばIPアドレスや地域、どういったサイトを閲覧しているか、もしくは同じサービスを利用しているか、など、取得できるあらゆるシグナルを機械学習が常に学んでいった時に、朝に来るパソコンの cookie と夕方にモバイルから来る cookie は同じ人なんじゃないか、という類推をベースにした判断が可能になります。地域によって異なりますが、その精度は8割~9割強と非常に高い精度を誇ります。
このような技術をもとに、Appierはアジアを中心に20億デバイスのデータを分析し、7億人のユニークユーザーを特定しています。この予測モデルをCEOのチハン・ユーさんを中心としたAIのスペシャリストチームが常に最適なものに保ち続けられることが強味であり、Appierのすべての製品の基礎となっています。
ユニークユーザーレベルにデータを整備することの重要性
デバイスの多様化が進むにつれてユーザーの情報は分断されてしまうため、ユーザーにとって関連性の高い広告を配信することは今後ますます難しくなっていくことが予想されます。cookieだけに頼った広告配信プラットフォームは今後淘汰されていくでしょう。ユーザーにとって邪魔にならない良い広告を提供するためには、ユニークユーザーレベルでのデータの保有が大前提となるわけです。
こうした流れをうけて、GoogleやFacebookはもちろんのこと、世界最大の広告会社であるWPP傘下のGroupMや電通、さらには楽天などの大量のログイン情報を保有する企業が広告会社への変貌を試みています。
大量のログイン情報を保有していることは確かに強みですが、ログイン情報だけでは特定できるユーザーの数に限界があるため、AppierのようなAIを使った予測モデルを構築することがとても重要になってくるわけです。
会社で支給されるPCと個人で持っているPCでは、閲覧するサイトが違う人も多いのではないでしょうか?例えば、会社のPCでは商品を閲覧するのみにとどめ、家のPCで購買をするなどといったケースがあると思います。Appierはこのようなデバイスごとの行動特性などはもちろんのこと、ユニークユーザーレベルでの興味や関心を理解して、ユーザーにとって最適な広告を最適なタイミングで配信できるように務めています。
cookieに情報を蓄積していくことがDMP1.0だとするのであれば、ユニークユーザーレベルで情報を蓄積していくことがDMP2.0と呼ぶことができるかもしれません。
オーディエンス分析を可能にする2つの手法
運用型広告配信プラットフォームである「CrossX Programmatic Platform」や、オーディエンス分析・予測を行うデータインテリジェンスプラットフォーム「AIXON」は前述のようなユニークユーザーレベルで整備したデータをもとに開発されているわけですが、運用型広告に携わる人間として気になるのは、こうしたツールを使ってコンバージョンが増えるのかどうか、というところではないでしょうか?
「AIXON」(アイソン)では、自社のCRMデータをインプットすることで、コンバージョン予測などを行うことができます。下記の画像にあるとおり、コンバージョンに関わる様々な情報をシグナルとしてAIによる予測モデルを作ることで、コンバージョン予測やオーディエンス分析が可能になります。コンバージョンの予測に関しては「決定木モデル」(Decision Tree Ensembles)と「深層学習」(Deep Learning)の2つの手法が利用されているそうです。
1. 決定木モデル(Decision Tree Ensembles)
決定木モデルは、コンバージョンの発生した経路に応じてコンバージョンを予測するモデルです。これはAdWordsの自動入札機能にも活用されているモデルなので、運用型広告に携わっている方であれば比較的イメージがつきやすいのではないでしょうか?
自動入札の場合、これまで発生したコンバージョンの履歴を学習データとして予測モデルを作り、オークション毎にコンバージョン率を計算して最適な入札価格を決定しています。
例えば、「広告が表示されるのはモバイルかデスクトップか?」といった問いが最初にあり、Yesの場合は右、Noの場合は左、といったように分岐していきます。AdWordsの自動入札の場合はこの分岐に「デバイス」「地域」「曜日・時間帯」「OS」など様々なシグナルがあり、個々のシグナルごとにYes、Noの分岐が発生するわけですが、広告が表示された時の条件が過去に最もコンバージョンした経路に近ければ近いほど入札価格は高くなり、遠ければ遠いほど入札価格は低くなるといった仕組みで自動入札は働いています。
Appierの「AIXON」によるコンバージョン予測でも同様に、このようなツリー構造の経路によってコンバージョンの予測が行われています。
2. 深層学習(Deep Learning)
コンバージョン予測には、昨今話題の深層学習(ディープラーニング)も利用されています。深層学習は、人間の脳の仕組みをもとに作られた、ニューラルネットワークに基づく予測モデルです。深層学習では、インプットしたデータ(図のx)をもとに、人間が望む結果(正しい答え、正解。図のO)が出るようパラメータ(図のS。重みとバイアス。)を調整して予測モデルを作っていきます。
例えば、ある特定のユーザーが「コンバージョンする」か「コンバージョンしない」かを予測する際、図中のxにユーザーのウェブサイトの訪問情報や、製品の閲覧情報など様々なデータをインプットしていきます。
インプットされたデータをもとに深層学習は「コンバージョンする」「コンバージョンしない」の答え(アウトプット)を出していくわけですが、実際のデータと比較した時に、本当はコンバージョンしたのに「コンバージョンしない」という答えを出した場合は深層学習が作った予測モデルが間違っているということになります。
その場合、「この答え(アウトプット)は間違っているよ」という情報を与えてあげると、深層学習は「はい、わかりました!」といった調子で図のSにあたるパラメータを自ら修正して正しい答えを出せるように調整していきます。深層学習の場合、この行為のことを「学習」と呼びます。
各ニューロンにあたるポイントのパラーメータ(図のS)が実際にどのような数値になっているかまではわかるものの、なぜそういう数値になったのかはエンジニア自信にもわからないことが深層学習による予測モデルの特徴です。
何回もデータをインプットして予測モデルに答えを出させ、その答えに対して「正」「誤」という判断を人間が与えていくことで正確な予測モデルを作っていくのが深層学習の仕組みになります。図では人間の脳で言うところのニューロンは一層だけですが、これが何層にもおよぶために”深層”学習と言われています。
アジアを制する者が世界を制する?
Appierではアジアを中心に膨大なデータをインプットし、「正」「誤」の判断を与え続けることで、コンバージョンの予測モデルを作っているというわけですが、深層学習は、ユニークユーザーの特定にも使用されています。アジアのように回線の通信速度や言語、デバイスなど、多様性があればあるほど、AIの予測モデルは学習によって鍛えられていくことになるので、ユニークユーザーの特定などに使用される予測モデルの精度に関しては、アジアを制したものが世界を制する、という可能性を孕んでいます。
CEOのチハン・ユーさんが、「2020年には、アジア太平洋地域がAIについて最も市場価値の高い地域になると言われています。」と言うのには、このような背景があるのではないかと思います。
ユーザーの趣味・嗜好を判別する技術
上述のような高度な技術を活用してユニークユーザーを特定したあとは、それぞれのユーザーにとって邪魔にならない有益な広告が配信できるよう、ユーザーごとの興味・関心を分析していくことが必要となります。
Appierでは、ユーザーが閲覧したウェブサイトをトークン化し、そのウェブサイトのテーマを表す名詞やキーワードにまとめていきます。これは、AdWordsのコンテンツターゲティングで使用されている技術に近いので、広告運用者には想像がつきやすいのではないでしょうか?
そのキーワードをウェブサイト閲覧履歴に応じてユニークユーザーに付与していくことでユーザーごとの趣味・嗜好を判断しています。
そばに同様の言葉がある2つの言葉は類似している
また、「iPhone 8」に興味があるユーザーは「iPhone 7」や「Galaxy S9」にも興味がある可能性が高いため、そのような類似性のあるトピックをAIを使って拡張させています。その際に拡張される対象となるトピックは「そばに同様の言葉がある2つの言葉は類似している」というルールに基づいて判断しているそうです。
例えば、「チームはスタジアムで”クリケット”の試合をする」という文章があったとします。この「クリケット」という単語は「サッカー」や「バスケットボール」に置き換えても意味が通じます。
このような場合、「クリケット」は「サッカー」や「バスケットボール」と類似性が高いと判断され、トピックの拡張に「サッカー」や「バスケットボール」が利用される可能性があるそうです。
こうして判別されたユニークユーザーレベルの興味・関心を今度はユーザー全体のデータと比較していきます。例えば、下の画像の左側の図は、前述のような技術で判別された興味・関心のカテゴリです。このユーザーだけのデータを見ると「旅行」カテゴリが突出していることがわかります。
しかしながら、右の図のユーザー全体の数値と比較した場合、全体の傾向としても「旅行」が抜きんでているため、このユーザーに限った傾向とは言えず、むしろ最も顕著に差が表れているのは「旅行」ではなく「食品」カテゴリです。そのため、このユーザーの特徴的な興味・関心は「旅行」ではなく「食品」であると言えます。Appierではこのような方法を使ってユーザーにとって本当に有益な広告を配信できるように努めているとのことです。
アジアの20億デバイス、7億人のユニークユーザーデータを常に処理し続け、最新のデータに保つことはもちろんのこと、世界中のウェブサイトの情報をトークン化するなど、Appierの行っていることのスケールには目をみはるものがあります。
以上、長文になりましたが、チャールズ・エンさんのお話を中心にAppierのAIによる技術を解説してきました。専門的なところもあったので少々イメージがしにくい点もあったのではないでしょうか?冒頭でも触れましたが、運用型広告の管理画面の裏側にはこうしたAIの技術が今後さらに利用されていくでしょう。自社のパフォーマンスを向上されるためにも、こうした技術を正しく理解してうまく使いこなせるようにしておきたいものです。
次回は、「AIXON」とLINEの連携を中心に紹介していく予定です。ある意味で、今回の内容を踏まえた上での応用編といった内容になりますので、ぜひ今回の記事の内容をおさえていただければ幸いです。引き続きよろしくお願い致します。