【事例紹介】ECサイトのデータ活用支援 -類似商品のクラスタリング

 2020.08.28  デジタル・アドバタイジング・コンソーシアム株式会社

近年のデータ活用は、ビッグデータと言われるデータの量だけでなくリアルタイムに集まるようになり、データを活用するためには高いレベルのデータ解析技術が欠かせません。

DACでは広告配信データ、Webのトラフィックデータ、パートナー企業のデータといった大規模データを扱っており、マーケティング活用やビジネス開発を行うために、専門のデータ解析部門によって高いデータ解析技術を維持しています。

本記事では、DACのデータ活用を支えるデータ解析の事例として、ECサイトを運営するパートナー企業のデータ解析について紹介します。

データ活用に欠かせない「データ解析」

リアルタイムでデータを集める技術の発展に伴い、大量の時系列データが集まるようになり、様々な場面で活用されています。時系列データからユーザーの行動ログと実際の購買行動の因果関係を解析したり、周期的な行動の変化を解析したりすることで、様々な施策に用いている話はみなさまも聞いたことがあるでしょう。

例えば、DACでは広告の出稿タイミングとその効果検証などに時系列データを利用しています。また、広告プランニングにおいては、効果的だった施策の時系列データからパターンを導き出し、類似したパターンを示すデータを見つけることで、効果が期待できる施策を検討することも可能です。

このように、時系列データを解析して活用する取り組みは、データを保有する企業であればデータを解析して活用することで、新たなビジネス開発ができるのではないでしょうか?

今回紹介する事例は、時系列データの類似度を測る手法の一つ「動的時間伸縮法」による、ECサイトの類似商品調査のデータ解析についてです。

データビジネスアライアンス資料ダウンロード

ECサイトのデータ解析事例「類似商品調査」

ECサイトには、ユーザーのWeb行動履歴や購買情報など多くの時系列データがリアルタイムで収集されます。保有しているデータを売上の改善やユーザーの行動解析に活用できないか、という相談があり、解析を実施してみました。

データ解析の前には仮説を立てます。今回は「商品同士の時系列的な類似度に基づいて各データをクラスタリングすることで、効果的な広告プランニングにつなげることができるのではないか?」という仮説を立て、まずは「時系列パターンで分類したときの商品間の関係性」を調査しました。調査には「動的時間伸縮法」という解析手法を利用しました。

「時系列パターンで分類したときの商品間の関係性」というのは、全く異なるカテゴリの商品でアクセスが集中した時期も異なっているような場合でも、任意の範囲で時間軸の多少のズレを許容して類似するパターンを探索したとき、似たようなトレンドを検出することができる商品を探し出す、といった調査になります。商品トレンドの類似性を自動的に特定できれば、広告やマーケティングに利用できる可能性があります。

動的時間伸縮法とは?(ECサイトの行動データによる解説)

説明を簡単にするために、技術的な要素を省いて解説します。商品トレンドの類似性を計測するために、データから横軸を「時間」、縦軸を「アクセス数」にした、下の折れ線グラフを作成します。

ECサイトデータ活用支援_挿絵1

グラフには青、オレンジ、緑の3本の線が描かれています。目視では、青とオレンジのグラフが似ていることが簡単にわかります。また、青のグラフを少し横へずらすとオレンジのグラフにほぼ重なることもわかります。青とオレンジのグラフは変化のタイミングがずれているだけで変化のパターンはほぼ同じと考えられます。

しかし、目視ではわかりやすい類似性をデータ解析で特定することは意外と難しいのです。類似性を検出する際に良く用いられる解析手法では、下グラフのように特定の時点で見ると青とオレンジよりも緑のほうが近い値をとってしまうためです。

ECサイトデータ活用支援_挿絵2

このような場合では、「動的時間伸縮法」が便利です。動的時間伸縮法は、グラフを横へずらして重なり合う部分を最大化してから、どのグラフとどのグラフが最もよく似ているかを判定できます。そのため、目視と同じように似ているグラフの組み合わせを割り出すことができるのです。

ECサイトの類似性調査の結果

今回はDACが保有しているECサイトの時系列データを解析して類似度を調べました。
その結果、例えば下図のように時間的なずれはあるが変化のパターンが似ている商品が見つかります。点線でつながっているところが対応した点です。ピークにずれがあっても似ている変化のパターンを検知できている様子が見えますでしょうか?

図2-4

また、下表のような「似ている商品カテゴリTOP3」や「似ていない商品カテゴリTOP3」を知ることもできます。例えば、エアコンは美容品、香水、スキンケアといった美容関連と類似した時系列パターンという結果から、「エアコンを購入している人は美意識が高いのでは」といった仮説の種を見出すことができます。

もちろんこれは時系列パターンの類似性でしかないので、実際にマーケティングで活用するときは、市場動向など外部からの影響も考える必要がありますが、一つの切り口の参考として使えるのではないでしょうか?

ECサイトデータ活用支援_挿絵4

ECサイトデータ活用支援_挿絵5

今回の手法を活用すれば、時系列データの類似度を目視と同じように比較することができ、例えば違うジャンルの商品でも似たようなトレンドであれば検出することができます。

あくまでも類似度ではありますが、商品に基づいたコンテンツ連動型広告の出稿やプランニングに使えると考えられます。

まとめ

時系列データは様々な場面で現れますが、多くの要素が関わっているため高度なデータ解析技術が求められます。

DACでは、様々なデータのマーケティング活用支援、解析業務に取り組んでおり、データを活用した新たなビジネス創出を進めています。データを保有している企業様はこの機会にデータを活用したビジネス創出を検討してみませんか。DACの「データビジネスアライアンス」では、データエクスチェンジによるマネタイズの他、データリッチ化によるマーケティング活用や新規ビジネス創出までを一緒に検討します。

ご興味がございましたら、ぜひお問い合わせください

関連URL

New Call-to-action

RECOMMEND関連記事


RECENT POST「データビジネスアライアンス」の最新記事


この記事が気に入ったらいいねしよう!