グローバルナビゲーションへ

本文へ

ローカルナビゲーションへ

フッターへ



データサイエンス学系 データサイエンス基盤研究室:佐野 夏樹 教授


ホーム >  入試・イベント >  【受験生必見コラム】情報&看護を徹底解説! >  データサイエンス学系 データサイエンス基盤研究室:佐野 夏樹 教授

大量のデータから価値ある情報を見い出しビジネスアクションへつなげる

大量の情報のかたまりから価値を見い出す
 大量データからの知識発見に関する研究は、データサイエンスと呼ばれることが多い。2000年頃からは、金やダイヤモンドの発掘(Mine)に例えてデータマイニングと呼ばれ、POSデータ等の購買履歴データの分析を中心に研究や実務への応用が行われてきた。
 「私は、情報の塊からビジネスアクションに結びつく知識を見つけ出す方法について研究しています。データマイニングの中にアソシエーション分析と呼ばれる分析手法がありますが、その知識発見の有名な事例として、紙オムツとビールの事例があります。」と話すのはデータサイエンス基盤研究室の佐野夏樹教授だ。
 スーパーマーケットでの販売データを分析すると、金曜日の夜に紙オムツとビールを一緒に購入することが多いことが分かった。その理由は、紙オムツを買ってくるように頼まれた父親が、ついでに自分の好きなビールを購入しているためと予測される。こうした知識が得られると、紙オムツとビールの売り場を近くに配置することで、これらの商品を同時に購入する確率を上げることが期待できるという。

大量のデータから価値ある情報を見い出す


企業によるパーソナルデータの利用
 ポイントカードを発行すると、誰が・いつ・何を購入したかという情報が、データベースに蓄積される。その情報を分析し、優良顧客の抽出や離反顧客の予測ができれば、値引きクーポンの発行等のマーケティング施策の実施が可能となる。これらの分析には、機械学習手法や回帰分析、分散分析のような統計手法が用いられるという。
 佐野先生はその具体例を次のようにいう。
 「『Amazon』を利用すると、“この商品を購入した人は、以下の商品を購入しています”と商品を推薦された経験のある人も多いと思います。これには、商品の購入履歴データを分析して、ショッピングの好みが似た顧客を複数抽出し、それらの顧客の履歴にもとづいて商品の推薦を行う協調フィルタリングと呼ばれる技術が活用されています。また、皆さんご存知の『Tポイント』は、店舗側が利用者の購入履歴データを収集・分析して、クーポン発行等のマーケティング活動に役立てているのです」。

急がれるデータ加工技術の整備
 佐野先生は現在、購買履歴などの個別のデータが誰のものか特定されないように加工する匿名化技術や、その評価方法などについて研究を行っている。
 パーソナルデータは、企業からすれば、有用な宝の山だが、個人からすれば、個人が特定され悪用される可能性もある。企業側と個人の間には、企業側の利用方法を制限すれば個人が特定されるリスクは軽減するがデータの利用価値は下がる、一方で、企業が自由にデータを利用できるようになれば個人が特定されるリスクが増加するといういわゆるトレードオフの関係にある。改定された個人情報保護法では、パーソナルデータの利活用のために、特定の個人が特定されないように加工された匿名加工情報であれば、第三者へのデータ提供が可能となった。
 「企業や事業者が収集したデータをもっと利用していくためには、このようなデータの加工技術が整備されている必要があります。特に、原データを加工するというよりは、本質的な情報を保存しながら、元のデータとは異なる擬似データを生成する方法について取り組んでいます」と佐野先生。価値のあるデータは加工技術の手にかかっている。

alt=””

佐野夏樹教授のコラム

PICK UP研究室(総合情報学部)

総合情報学部の研究室をキーワードから紹介しています。
※クリックすると、デジタルパンフレットに移動します。

研究室、分野のテーマ一覧へ戻るボタン

先生一覧から探すボタン