城田 真琴 氏 電子書籍『ビッグデータの衝撃』(東洋経済新報社 刊)より
このページは、電子書籍『ビッグデータの衝撃』(城田 真琴 著、東洋経済新報社 刊)から、良かったこと、共感したこと、気づいたことなどを取り上げ紹介しています。
・ビッグデータとは、既存の一般的な技術では管理するのが困難な大量のデータ郡である。
「既存の一般的な技術では管理するのが困難」とは、たとえば、現在の企業データベースの主流を占めるリレーション・データベースでは管理できない複雑な構造のデータを指す。あるいは、ボリュームが増大した結果、データに対するクエリ(問い合わせ)の応答時間が許容範囲を超えたりするような状態を招く膨大なデータを指す。
・ビッグデータの特性を表す3つのV
Volume
データ量(現状では数十テラバイト~数ペタバイトクラス)
Velocity
データの生成頻度、更新頻度(1秒間に数十件以上)
Variety
多様なデータ(構造化データ+非構造化データ)
・ビッグデータとは3V(Volume/Velocity/Variety)の面で管理が困難なデータ、および、それらを蓄積・処理・分析するための技術、さらに、それらのデータを分析し、有用な意味や洞察を引き出せる人材や組織を含む包括的な概念である。
・点から線の分析へ(中略)
たとえば、スーパーマーケットでは、カートに取り付けられたICタグを利用して収集した店舗内の顧客導線データを、POSなどの売上データと突き合わせることにより、購買に至った理由、至らなかった理由を分析しようとする取り組みが始まっている。
・カタリナマーケティングでは、ポイントカードなどによって顧客を識別し、POSシステムとの連動により、顧客の過去2年分の購買履歴データを蓄積している。顧客がレジで清算する際に、その買い物パターン(購入商品・購入点数・来店頻度・購入額等)をほかの数千万人のパターンと比較して、もっとも関心を引きそうなクーポンの内容を即座に計算し、その内容が反映されたクーポンをレジで打ち出す。
・カタリナマーケティングの大きな強みの1つは、米国のスーパー総売上の75%、日本でも44%を補足できるというカバレッジの広さだ。大量の購買データを押さえているため、消費者の購買行動をより精微に予測できる。
・クーポンというと、一般的にはウェブサイトから全員が同じものを印刷したり、携帯電話やスマートフォン向けにメールで配信されるものであっても、全員が同じ内容のクーポンを一斉配信で受け取るのが普通だ。しかし、マクドナルドのこのクーポンは、内容に加えて、個々の顧客の来店状況に応じて配信頻度も変えるとしており、これまでの携帯向けクーポンとは一線を画すものだといえるだろう。
・ビッグデータの活用例を列挙してみよう。
(1)商品やサービスのレコメンデーション(中略)
(2)行動ターゲティング広告(中略)
(3)(位置情報を利用した)マーケティング(中略)
(4)不正検出(中略)
(5)顧客離反分析(中略)
(6)故障予測(中略)
(7)異常の検出(中略)
(8)サービスの改善(中略)
(9)渋滞予測(中略)
(10)電力の需要予測(中略)
(11)風邪の流行を予測(中略)
(12)株式市場の予測(中略)
(13)燃料コストの最適化
・ビッグデータ活用パターンの分類(中略)
大まかに2×2の4つのパターンに類型化できる。整理するための軸は、「個別最適/全体最適」「リアルタイム型/バッチ型」である
・米プログレシッブ保険が提供する契約者の運転習性に応じて、保険料をディスカウントする“Pay as You Drive”プログラムの仕組み
・アマゾンでは、ハードウェアの能力不足を補うために、次のような対策を施している。
(1)ブラウザの背後で同社のクラウドサービス「EC2」を利用して、動画や画像などデータ量の大きなコンテンツの圧縮処理などを事前に行い、最適化してから端末側に送信する。これは同社が「スプリットブラウザ」と呼ぶもので、負荷の高い処理をクラウド上で実行させることで、端末が直接処理を行うよりも高速にコンテンツを処理できるほか、バッテリ寿命を延ばす効果も期待できる。
●電子書籍『ビッグデータの衝撃』より
城田 真琴 著
東洋経済新報社 (2013年5月初版)
※amazonで詳細を見る撃