データマイニング

データマイニングとは

データマイニングとは、大量のデータの中から、自明ではなかった有益な情報(パターンや相関関係など)を発掘する手法です。
ネットワークの普及やコンピュータ性能の向上によって、個人や企業問わず広い範囲においてビッグデータの処理を容易に行えるようになりました。
現在は多くのビジネスの現場で活用されています。

データマイニングの手法

データ解析の手法として代表的なものに「統計分析」や「機械学習」があります。仮説の立証を求める場合には統計分析が、新たな発見を求める場合には機械学習が適しています。データマイニングで主に活用される解析手法は以下になります。

 

■クラスタリング
データ間の類似度に基づいてデータのグループ(クラスター)分けを行う解析方法

 

■ロジスティック回帰分析
「Yes」「No」などのように解答を明確に定義できるもの(2値)の予測を行う解析方法

 

■マーケット・バスケット分析
同時に購入されやすい商品を明らかにする解析方法
上記のような解析手法を活用してデータマイニングを行うことで、新たな関連性が発見でき、自社の課題解決につながるようなヒントを獲得することができます。

データマイニングの事例

データマイニングの有名な事例として、ビールと紙オムツの話があります。
これは、米国のスーパーにおける事例で、「紙おむつを購入した男性は同時に缶ビールを購入することが多い」というPOSデータの分析によって抽出されたルールに基づいてビールと紙オムツを並べて陳列するようにした結果、売り上げを伸ばすことができたというものです。
この事例では、データマイニングによって、一見関係なく見えるビールと紙オムツの間の関連性を発見することができたのです。