図書館総合展に行ってきた。〜フォーラム「図書館におけるビッグデータ活用を考える」前篇
図書館総合展レポート第2弾。午後はこんなのに行ってきた。
図書館におけるビッグデータ活用を考える〜海外の先進事例とNECの取り組み
http://2013.libraryfair.jp/node/1674
参加人数は50人くらいか。システム関係の話題のためか、スーツ姿が多めの印象。以下、例によりxiao-2が聞きとれて理解できてメモできて、かつ思い出せた範囲のメモ。項目立ては適当。
-
- その前に。データ活用自体については、以前から色々な取り組みがなされている。
- 新たな特徴として、センサの活用が挙げられる。センサで収集したデータを活用することができるようになった。
- センサは進化し、小型化して、これまで集められなかった「人の情報」を集められるようになっている。
- たとえばHapifork*2では、フォークにセンサーがついていて、食べるのが早すぎるとアラームが鳴ることで肥満防止ができる。
- あるいは、安全な車。車そのものだけでなく、道路側にもセンサーを付けることで、衝突を予測して防ぐことができる。
-
- ビッグデータとは何か
- 色々な定義があるが、ここで挙げる特徴は大きく2点。1つめはデータの量が多いこと、2つめは複雑なデータであること。そういうものは従来の技術では扱えなかった。新しい手法が出てきて、分析・活用できるようになった。
- 小売業の場合、たとえばSNSに出てくるお客様の声やお客様問合せセンターに掛ってきた問合せの履歴データから商品の評判をつかむ。
- あるいは、配送ルートの最適化、ディスクストレージの需要予測など、インフラのコストを下げることができる。
- ビッグデータの特徴的な点としては、構造化されたデータに比べ、非構造データが多い。Twitterの投稿やテキストデータ、画像など。
- 今は農業、自動車など、色々な分野から問合せがある。
- ビッグデータとは何か
-
- ビッグデータ活用の具体的な事例
- 2012年のアメリカ大統領選におけるオバマ陣営の逆転勝利。これにはデータサイエンティストの分析が大きく貢献。支持者の名簿を集めて、これを分析することで戦略を立てた。
- たとえばオバマ氏自身ではなく、夫人からの呼びかけが効果的であること。西海岸に暮らす40代の有権者には、ジョージ・クルーニーの訴求性が高いこと。CMを流すなら堅い番組よりも、ゾンビ番組などのようなポピュラーなものの方が効果があること。これらがデータ分析により判明した。
- Zest Finance(http://www.zestfinance.com/)では、ビッグデータを与信評価に使うことで回収率アップ。これにより、これまでの基準では貸せなかった利用者にもお金が貸せるようになった。
- 自動車保険。Pay How You Drive(PHYD)という、運転状況に応じた保険料を設定する仕組み。危険運転をすると保険料が上がる。これによって保険会社は損をしなくなり、被保険者は安全運転へのインセンティブが与えられる。Win-Winの関係となる。
- 南アフリカで提供されているDynamic Discount Solution(DDS)。ネットワーク状況が脆弱なため、トラフィックが集中する時には接続料金を高くする。
- 埼玉県では、1ヶ月に5回以上急ブレーキが踏まれた場所について、事故予測マップを作った*3。その場所を職員が回って対策するようにしたところ、事故が3分の1になった。
- ビッグデータ活用の具体的な事例
-
- ポイントは3つ。
- 1つめは、センサー。多様なデータを収集、蓄積できるようになった。
- 2つめは、高度な分析。これには高度な技術が要る。見える化するだけでなく、予測もできるようになる。
- 3つめは、データ活用には人が大事ということ。データ活用の専門家が居ることが必要。
- ポイントは3つ。
-
- センサーについて。
- センサー、デバイス、カメラなど、実世界で収集できるデータは増えている。スマートデバイスにもセンサがついている。たとえば位置情報。観測衛星で把握できる。もちろんそのままでは使えず、加工が必要なので、そのための基盤づくりに注力しているところ。
- 例1:新東名高速道路では、道路上にセンサやカメラがたくさん設置されている。これらの情報を組み合わせて交通情報が出せる。前はデータを取るのに5分掛っていた。現在は1分でできる*4。
- 例2:ちばみどり農業組合での活用例。ビニールハウスをモニタリングし、異常が出たらアラート。現在はリタイアして農業を始める人が多いが、そういった経験の浅い人でもノウハウなしにやれる*5。
- センサーについて。
-
- 分析について。
- 集めるだけでは駄目、深く分析すること。特に紹介したいポイントは、異種混合学習、テキスト含意認識、顔画像解析。
- 異種混合学習とは、違う種類のたくさんの条件の中からパターンを見出すこと。たとえば小売業での販売予測は、これまでは人間がデータを見て予測していた。そうすると問題があって、データ自体は正しいのに、人間の側のバイアスで判断が外れてしまう。システムのみで予測することが重要。
- とある小売業の企業で、生鮮食品で試してもらった。非常に優秀な店員と同じレベルに廃棄ロスが改善。
- テキスト含意認識の例。Twitter上でデモの呼びかけ、テロ、麻薬取引などのTwitterつぶやきを探して、位置情報からマップ上に表す。リスクの高い地域が一目で分かる。
- テキスト認識は、従来は単語単位。テキスト含意認識は、これが文章単位となる。ことばが違っても同じ意味と認識できる。
- 顔画像認識
- よく誤解されるが、顔の画像を溜めているわけではない。特徴点をデータとして蓄積するだけなので、データだけ見ても識別はできない。
- 店の出入り口だけでなく、店内でどう歩いたか、どこで立ち止まったか。「買わなかった情報」が分かる。それによって、商品が売れないのはそのお客がその商品に興味が薄かったからなのか、置かれた場所が悪かったからなのかという分析ができる。
- 分析について。
- 司会
- 図書館向けのサービスはNECでも検討中。いくつか考えられる提案。
- 異種混合学習を公共図書館で活用すれば、利用履歴の統計に加えて、オンライン書店での売り上げデータを活用することもできる。あるいはニュースやソーシャルメディアで話題になっていることを捉えて、それに関連する本を探すなど。
- 官公庁や自治体については、人口や統計から「こういう本が利用されるはず」という潜在ニーズを発掘できる。選書・廃棄の判断を最適化し、貸出数増加にもつながる。
- テキスト含意認識を使えば、レファレンス事例データや、OPACの内容紹介など、文章としてのデータを扱うことができる。自治体ホームページや書評、おすすめなど、全文テキスト検索が可能になる。目次・本文そのものを検索することができれば、レファレンスやパスファインダー作成の支援も可能。調べたい時に高度なサービスを提供できる。
- 顔画像認識を使えば、入館者の属性情報を把握できる。どんな人が来るのか。某図書館でトライアルで導入してもらったら、結構正確だった。館内の位置情報を利用すれば、どのコーナーに人が立ち寄るかといった貸出以外のデータもとれる。開架/閉架の判断や、レイアウトの参考になる。
- 蔵書構成の最適化にも役立つ。
- 新館建設計画の支援。これは我が社でも実感することがある。NECはシステムベンダーなので、新館OPACが入る時に立ち会いをすることがある。そうするとOPACの操作ではなく、トイレや本の場所を利用者から聞かれることが結構ある。せっかく大きくて新しい建物になったのに、迷うのは残念。導線分析でよりよくできるかもしれない。
- 図書館向けのサービスはNECでも検討中。いくつか考えられる提案。
…ふぅ、眠くなってきたのでメモはここまで。後篇に続く。
*3:この件、こちらでも詳しく紹介されている。参考:NECホームページ 企業競争力強化に向けたビッグデータ活用とは
*4:参考:NECホームページ 新東名高速道路の裏側に迫る! 〜物流の大動脈を支える“交通管制システム”
*5:参考:NECホームページ 農業ICTクラウドサービス