【コラム】データマイニングの目的~基本的意味と分析手法を徹底解説します

「データマイニング」といえば、国内最大級のネットオークションであるヤフーオークションにおいて、不正利用防止に役立つ技術としても有名です。

ネットオークションに関わる膨大なデータから、データマイニングによって不正利用者の行動パターンのモデル化に成功しています。

そこで今回は、この「データマイニング」について、基本的な意味から分析手法までまとめて解説します。

 

データマイニングとは?

データマイニング (Data mining)の「マイニング」とは、発掘や採掘を意味します。

そのためデータマイニングを直訳すれば、「データから採掘すること」となります。

一体、データから「何を」採掘するのか?と疑問に思うかもしれません。

この採掘の対象となるものこそが、データマイニングの目的です。

つまり膨大なデータから、人間では発見できない「有益な法則や相関関係、一定の傾向やパターンなど」を得ることが、データマイニングの目的といえます。

データマイニングの流れ

データマイニングを行うには、以下の流れで行うのが一般的です。

企業の持つビッグデータから有益な法則や相関関係を採掘するためには、元となるデータを漏れなく蓄積し、分析できるように整理しなければなりません。

そのためには、データの保存場所となる「データウェアハウス」を設けて、すべてのデータを更新や削除せずに、次々と蓄積させることから始めます。

蓄積されたデータの中にある「数値データ」や「記号データ」については、その形式を統一することが必要です。

形式を統一することは、データから取り出す結果の精度をより高めるためであり、データマイニングの下準備となります。

あとは目的に応じたさまざまな分析法により、データから隠れた法則を見出します。

人工知能による機械学習にて分析を行う場合には不要ですが、「回帰分析」など統計学を活用した分析を行う場合には、事前に仮説を立てる必要がある場合もあります。

 

データマイニングの3つの分析手法

データマイニングには、目的に応じたさまざまな分析手法があります。

ここでは、3つの分析手法を紹介します。

ロジスティック回帰分析

ロジスティック回帰分析は、事象が発生する確率を予測する分析方法です。

たとえばあるキャンペーンを行ったとして、顧客である企業が「購入する」もしくは「購入しない」と明確に定義づけが可能である場合、この分析手法で購入の確率が予測できます。

クラスター分析

クラスター分析は、顧客を分類する際に用いられる分析手法です。

購買行動だけでなく、趣味嗜好などのさまざまな項目から、「類似している」と判断されたまとまりを、一つの集団として分類していきます。

セグメンテーションを行う際に有益といえます。

クラスター分析によりそれぞれの集団に対して、その性質にあった広告、さらには踏み込んだ提案などが可能となり、さらに1顧客にフォーカスした1on1マーケティングも実行できるでしょう。

アソシエーション分析(マーケット・バスケット分析)

アソシエーション分析は、製品やサービスそれぞれの相関関係を発見できる分析手法です。

消費者が商品を入れた買い物かご(マーケット・バスケット)の中身から、何を購入したのか、商品の組み合わせを調べるところから、「マーケット・バスケット分析」ともいわれます。

たとえば「Aという商品を購入する顧客はBという商品も一緒に購入する」との相関関係が成り立てば、AとBの商品をともに売り込むマーケティング戦略も可能です。

具体的には、Aの商品を購入した企業に対して、Bの商品の購入を促すダイレクトメールを送信することが考えられます。

さらにはAとBを一緒に購入する理由や背景が理解できれば、同じ類似性を持つCという商品を提案することも検討できるでしょう。

 

データマイニングの本当の効果は、分析後からが勝負!

データマイニングにおいてもっとも重要なことは、分析から得た法則や傾向を活用できるか、ということです。

発見された法則や傾向、パターンなどは、単なる事実でしかありません。

2つの項目に相関関係があると分析結果が出たとしても、実際に自社のマーケティングにおいて「有益か」どうか判断する必要があるからです。

分析結果が示す事実に対して、どうしてそのような相関関係が出来上がるのか、その理由や背景を推測することも人間の知能の領域です。

法則やパターンの仕組み自体を理解しなければ、データマイニングを活かすマーケティングは行えないでしょう。

そのためには、これらを読み解けるだけのスキルを持つ人材、データサイエンスの領域に明るい人材が必要といえます。

IT技術の進化に加え、SNSの発達により、一個人、一企業のデータがあらゆるところに蓄積しています。

そのデータ量は膨大であり、マーケティングの視点からいえば、「お宝眠る鉱山」がいたるところにあるといえます。

あとは「金脈」を探り当てられるか、もしくは「金脈」と判断できるのかが重要です。最終的には人間の持つマーケティングスキルにかかってくるのかもしれません。

 

まとめ

◆データマイニングの目的は、「有益な法則や相関関係、一定の傾向やパターンなど」を得ることである

◆データマイニングは、分類するにはクラスター分析、相関関係の発見にはアソシエーション分析など、目的に応じた分析手法がある。

◆データマイニングにおいて、分析から得た法則や傾向を活用できるかが大きなポイント

Solution / ProFuture のソリューション

PAGE TOP