第277回日本図書館研究会 研究例会「岡崎市立図書館Librahack事件から見えてきたもの」に行ってきた。

 2011年初のイベントレポートは、こういうの

日本図書館研究会 第277回研究例会 岡崎市立図書館Librahack事件から見えてきたもの
 新出氏(静岡県立中央図書館)
 上原哲太郎氏(京都大学学術情報メディアセンター)
 司会: 藤間真氏(桃山学院大学
 テーマ :岡崎市立図書館Librahack事件から見えてきたもの
 概要: 新氏には事件の概要と図書館人の立場から見えることを中心に、上原氏には自治体のIT資源導入の問題点という立ち位置から見えることを中心に、ご発表いただきます。

 昨年に引き続いてLibrahack事件がらみ。参加者は当初40名程度?開始後もだんだん増えて50名くらいか、印象としては満員御礼。年齢層も性別もたいへん幅広く、たぶんこれまで聞いた*1うちでは最も図書館色の強い集まりと思われる。

 以下、例によってxiao-2が聞きとれてメモできて理解できてかつ覚えていた範囲、のメモ。誤記・誤解はたぶんあり。→以下は自分の感想。敬称は「さん」に統一。事前に言っとくがアホみたいに長いよ。後日「図書館界」にダイジェストの記録を掲載されるそうだから、めんどくさい向きはそちらをどうぞ。

  • 司会(桃山学院大学 藤間真さん)
    • 今回の事件は図書館に限ったものではなく、公共機関全般で起こりうる問題。だが、図書館を舞台としているということで本会で取り上げた。
    • 参加者の中で、図書館にお勤めの方は何人くらい?(6割程度挙手)
    • 館種は?(公共6、大学5、専門2、学校1、その他4*2
    • コンピュータ関係の方は?(5名)
    • この研究会のことはどのメディアで知った?(Twitter3、図書館関係のML経由10、雑誌「図書館界」2)
    • 図書館関係者以外の方にも幅広く関心を持たれている問題。
  • 新出さん(静岡県立中央図書館)
    • 昨年、IOT研究会でもこの事件のことを話した。その内容とかぶるかも。
    • 自己紹介。静岡県立図書館で勤務6年目。図書館システム担当ではなく、詳しいというわけではない。
    • 自分の携わっている図書館問題研究会*3(以下、図問研)で、この事件について声明を出したので、情報関係の集まりで話してほしいと頼まれることが何度かあった。公共図書館現場から発言する人が少ないためか。
    • Librahack事件の概要。
      • 岡崎市立中央図書館のユーザであった中川氏が、自動的にアクセスするプログラムを作って走らせたところ、図書館システムがアクセスしにくい状態になったとして逮捕された事件。
      • なお、この方の実名を出したのは、産総研高木浩光先生が「逮捕そのものが不当であるので、この人の名誉回復のためにあえて実名で呼ぶ」という趣旨のことを言われていたのに倣う。
      • 5月に事件が初めて報道された時点で、このニュースを読んでいた人はどのくらい?(会場10名程度挙手)自分も読むには読んだが、その時は「なぜこんなことになったのだろう?」という程度の認識だった。
      • 中川氏の作ったプログラムの内容は、Libraの新着図書ページにアクセスしてISBNや日付のデータを取得し、毎日の新着図書が一覧できるようにするもの。作った動機は、元の図書館のHPで新着図書情報が分かりにくかったため。2か月分の大量の新着図書の情報が一度に表示される等、毎日どの資料が新しく入ったかネットで確認するのが難しい。そのデータを自動的に持ってこられる仕組みを作ろうとした。
      • 図書館員にこの事件の話をしたところ、「1秒に1回のアクセスは多いだろう」と答える人もいた。が、1秒1回というのは家庭用の普通のPCでも楽に捌けるレベル。「SPIDERING HACKS*4」でも、1秒に1-2回のアクセスは礼儀正しいレベルとしている。
      • また、今年度から国会図書館がネット情報の収集を開始*5。この収集の仕組みも、中川氏の作成したプログラムと基本的に同じ。ダウンロードの間隔は1秒程度空けるとしている。また、AmazonAPIでも1秒に1回くらいのアクセス。つまりWebの世界ではそのくらい妥当な頻度。
      • それでなぜ障害が起きたかは、高木先生のアニメ動画を参照*6。なおニュースが広がる過程で「サーバが落ちた」と表現されるケースがあったが、間違い。サーバは落ちていなくて、セッション数が上限に達しただけ。
      • 8月21日、朝日新聞で図書館システムに不具合があるとの報道。自分はこのあたりから関心を持って調べてみたが、その時点で既に技術者の方々が自主的に色々調査をしていた。図書館業界ではあまり話題になっていないが、世間的には関心を持たれているのだと感じた。
      • 9月1日に岡崎市立図書館の公式見解が出た。この内容にもネット上で批判が起こった。
      • 9月8日に「ともんけんウィークリー」で事件に関する声明を出した。指摘したのは、図書館サイトにもともと問題があった点、それにより利用者の身体の自由が侵されたという点。この内容でも、図問研内部では「拙速ではないか」という議論もあった。
      • 9月下旬に個人情報流出が発覚し、図書館側の態度が変わる。結果、11月には保守業者であるMDISとの契約解除・指名停止となった。11月30日にはMDISのお詫び掲載。12月7日には市長の謝罪があった。
    • ではどうすればよかったのか、という話。この事件では各アクターの対応にそれぞれ不備があったが、図書館サイドとしての対応を検討したい。
      • 通常こういう時は、まずISPに連絡し、アクセス元にコンタクトを取る。
      • たとえば昨年から話題になっているカーリルというサービスがある。実はこのサービスも連携先の各図書館システムで速度低下を起こしたり、停めてしまったケースもある。その場合も、サービス提供者と各図書館のシステム側とが調整して対応してきた。そのために被害届を出すようなことはなかった。
      • 次に、JPCERTIPAのような専門機関に相談する。それで明らかに事件性があると分かれば、警察に相談。IPAから最近出された「「サービス妨害攻撃の対策等調査」報告書」に、この判断チャートが載っている。今回のケースでは、いきなり岡崎署に相談してしまった。
    • ネットと図書館業界の反応に、温度差がある。
      • 事件当初から、技術者寄りの人は情報収集や調査をしていた。7月には「技術屋と法律屋の座談会」という集まりも開かれた*7
      • 図書館以外のネット等では注目されている。なぜならプログラムを書けるような多くの人が同様のことをやっているから、我が身も危ないと感じる。とある自治体で中川氏同様に自動的に図書館の情報を持ってくるサイトを作っていた人がいたが、この事件の後閉鎖された。実際に委縮効果が出ている。
    • 図書館についての問題、その1。図書館員のICT知識のレベル。
      • 1秒1アクセスというネット業界での相場観の欠如。基礎知識の不足によるもの。その裏には人材不足、正規職員の不在といった厳しい実情がある。でも「だから仕方ない」と言ってしまっていいのか。
      • ARGの岡本真氏が「なぜ事件があったとき、自ら0番台の棚に行って調べなかったのか」と言っていた。図書館員は、意外と自分に降りかかった課題の解決能力が低いところがある。どうやって勉強すればいいのか分からないという苦手意識もある。
      • 三菱総合研究所が出した報告書*8によれば、専任のシステム担当者を置いている図書館は6%、担当者を置いていない図書館は41%。本庁の情報システム担当部署との関係も薄い場合が多い。
    • 図書館についての問題、その2。外部機関との関係。
      • MDISの言い分を鵜呑みにし、客観的評価ができなかった。ベンダーとの力関係が弱い。
      • 外部の専門家との関係。高木先生が、事件報道直後に図書館に電話したところ、図書館側は取り合わなかったとのこと。技術は日進月歩で、担当者がこれさえ身につければOKということはない。それよりはトラブルの都度、専門家の話に耳を傾ける姿勢が重要。
      • 警察との関係。「警察がきちんと検討してくれれば逮捕に至らなかったのに…」という意見も聞かれたが、警察が無謬という前提で行動すべきではない。事件性の判断をアウトソーシングしてはいけない。被害届を出せば相手が逮捕されるかも知れない、という認識が図書館になかった。
    • 図書館についての問題、その3。Webサービス利用への意識。
      • 図書館では様々な利用トラブルが起こりうる。警察に相談するケースもある。だが普通は先に相手にコンタクトを取り、コミュニケーションで解決しようとする。いきなり被害届を出すというのは、図書館の対応としては異様。
      • 図書館が「図書館利用」を、リアルの場所としての図書館、貸出・閲覧といったサービスだけで意識しているからではないか。顔が見えない、意図が見えない、相手が人間かどうかも分からない(プログラムかも知れない)Webサービス利用を、伝統的サービスと同等と認識していない。
      • 岡崎市の件では図書館側から、「断りないアクセスが問題だった」という発言もあった。少し前まで多かった、「無断リンクお断り」という注意書きを連想する。
      • ある図書館で、カーリルとトラブルになったケースがあった。連携されたことでアクセス数が跳ね上がったことについて、図書館の人が「事前に一報してくれたらいいのに」と言っていた。そういう意識のままの人がいるのかも知れない。だが、ネットは誰がどうアクセスしようが自由という世界。
      • またプログラムを使ってOPACで予約をかけることについて、とある図書館人が「機械を使って自分だけ有利に予約するのは、図書館にとっては悪(xiao-2注:「公平でない」の意?)」とコメントしていたのを聞いたこともある。便利に使ってもらっている訳なのに、そういう意識の人もいる。クローリングやプログラムを使った図書館利用は正当なのか、きちんと考えられてこなかった。
      • Libraは非常によく使われている図書館で、来館者が多い。それに比べればプログラムを使ってアクセスする利用者は確かにほんのわずかで、異端であると感じるのかもしれない。「ほとんどの市民は私達のサービスに満足している」という意識があるのかもしれない。それは岡崎に限らず多くの公共図書館が持っていると思われる。
    • 図書館についての問題、その4。図書館の自由。
      • 狭義には、捜査の段階で利用者情報を警察に提供していることが図書館の自由に抵触。ただしこの場合は図書館自身が被害届を出しているので微妙なところもある。
      • アクセスログは「利用事実」に当たる、プロバイダ情報と照合すれば利用履歴が分かってしまうという意識が足りなかったのでは。
      • 広義にはもうひとつ問題。プログラムを使った利用も正当な利用であるとするなら、図書館を利用したゆえをもって利用者の身体を拘束した、しかも図書館自身がそれに関与したということになる。そちらの方が大きな問題。
      • 「新着情報をより使いやすく見たい」というのは、正当な知る自由の行使。それを妨げる結果になったという反省が図書館側に見られない。
    • とりうる方策。
      • 専門機関に相談すること。図書館にとってIPA等が敷居が高いようであれば、日本図書館協会でそういう窓口を設けてもよいのでは。
      • API提供を進める。つまり、プログラムからのアクセスの方法をあらかじめ定め、受け取りやすい形でデータを吐くということ。大手のベンダーはなぜかやりたがらないようだが。
      • 仕様作成ノウハウの共有。たとえば負荷テストをきちんと設けていれば今回の事態は防げた。
      • ユーザからの意見を聞く。図書館員自身は業務用端末から図書館システムを使うので、自館のシステムの使いにくい点に気付かない。
      • そして、やはり外部の声を聞くこと。
  • 上原哲太郎さん(京都大学学術情報メディアセンター)
    • 今日は公共のIT調達の話を中心にする。図書館プロパーでない人間からの問題提起ということ。図書館の人にこの事件についての意見を聞く機会がなかったので、この場所をもらえてよかった。
    • 自己紹介。
      • 昭和42年生、インターネット黎明期を大学で過ごす。和歌山大学でシステム情報学センター勤務、セキュリティが専門。現在は京都大学学術情報メディアセンターでの勤務に加え、自治体の情報セキュリティを支援するNPO活動をしている。
      • 子どもの頃は本の虫。中学では図書委員を務めた。当時図書室では大量に資料を買っていて、在学中に450冊から3,000冊くらいに増えた。その受け入れもNDC付与もやった。
      • 和歌山大学で、図書館と情報処理センターを合築することになった。その際の建物統合や事務の統合に関わった。したがって図書館の情報システムについても知っている。ちなみに公共図書館大学図書館の図書館システムは大きく違う。大学の場合は受け入れ先が研究室ごとに分かれていて複雑だったりする。
      • 過去に、電子ジャーナル問題というのもあった。京大内で電子ジャーナルの不正利用、具体的には利用規定で禁じられている機械的データ取得をした人がいた。出版社側は「利用者を特定して、どう処分したか教えろ」と言ってきたが、図書館としてはそんな対応はあり得ないということで議論になった。結局工夫して、今の仕組みのままで対応した。
      • 図書館は大学内で強い地位を持っていると感じる。コンピュータセンターは歴史が浅い、せいぜい30年。図書館は歴史が長い分事務組織も強固、学内政治的にも強い。
      • だが、その一方で図書館内のIT担当は窮状におかれている。和歌山大学では利用者が自由に使える端末が10台?*9あったが、非常勤の女性職員ひとりで管理していて、かなりの負担になっていた。
      • 和歌山大学京都大学は、学生の規模でいうと3倍くらい違う。和歌山大学は全体の規模の割には図書館の規模が大きい。が、どちらの大学でもIT担当として相談相手になれる職員は2人くらいしかいなかった。物足りない現状。
    • Librahack事件の提起した問題。
      • 色々な面からの問題があるが、今回取り上げることは2つ。
      • 1つ目。岡崎市立中央図書館のシステムは、そもそも変な調達。調達方式は簡易プロポーザル方式。これは従来の価格競争のみの入札がIT案件についてはそぐわないとして見直される中で利用されるようになった方式。システムについての提案を業者から出させ、提案内容と価格の両方でバランスを取りながら契約先を決めるもの。今回のシステムは、提案内容の評価が異様に高かった。なぜ?
      • 2つ目。図書館の自由の問題。経過の初期段階でWebアクセスのログを警察に提出してしまうなんて、あり得ない。
    • IT調達の経緯。
      • 岡崎市は17年度に額田町と合併。これを受けて18年度、岡崎市の旧中央図書館と額田の図書館でシステムを共通に使えるよう、一括調達で導入されたのがMELIL/CS。それ以前は違う会社の製品。20年度に中央図書館が移転し、それに伴って追加契約。同年、岡崎げんき館にも導入。
      • 合計、5年で5億のIT投資。これは長崎在住のコンサルタント前田勝之氏*10が、情報公開請求を経て調査されたもの。ちなみに岡崎市図書館の、年間の資料購入費は6000万円。
      • 「図書館システムの現状に関するアンケート」(前掲)では、年間のシステム関係費について幅広い図書館にアンケート調査している。通常、図書館費に占めるシステム関係費の割合は、資料費の1割未満。ただし、資料費を超えている図書館も6%ほどある。システムの専任職員がいない、担当者自体がいないといった実情は、新さんも触れたとおり。8割の図書館では外部IT専門家の支援がなく、85%はIT人材育成をしていない。
      • MELIL/CS導入時のプロポーザル集計表を見ると、他の1社に僅差で勝っている。高評価を受けているのが「個人情報保護に関する内規・社員研修」「セキュリティ対策」「インターネット蔵書検索」など。
    • だが実際は?
      • 実際LibraのHPをみると、高く評価できるものではない。視覚障害者への配慮がされていない、Flashがないとアクセスできないなど、Webアクセシビリティに配慮がない。
      • 蔵書検索も遅い。「図書」で検索すると、5,000件程度の結果一覧を表示するのに数秒かかった。比較のために他の市のOPACで検索すると、結果4,000件でもっと早く出る。マシンの性能ではない。岡崎市のマシンは20年度に導入した新しいもの、比較した他の市のシステムでは導入から6年経った機器。
      • さらに事件を機に色々な人がMELIL/CSを検証してみたところ、脆弱性がいくつも見つかった。にも関わらずセキュリティが高評価であった理由としては、三菱電機がMISTY*11という暗号を開発し、それを売りにしたことが考えられる。ちなみにこの暗号は実際MELIL/CSに使われているが、鍵の管理が良くないので効果を上げていない。
      • 一番の問題としては、導入館のWebサーバがネット上で丸見えの状態になっていたこと。ちなみに、他社の製品でもいくつかその状態になっているものがあった。カーリルの人が連携先の図書館すべてを調査したところ、4館ほどあったという。詳細はまだ公表できない。ただ、これらはあまり致命的な内容のものではなかった。
      • これに対して、MELIL/CSでは言わば片づけていない部屋を公開した状態。ASPスクリプト、プログラムソース、そして図書館利用者の個人情報が見える状態。皮肉にも岡崎市のデータが最も多く流出した。
      • MELIL/CSはパッケージシステムと言っているが、導入しているある図書館のHPソースをみると、別の図書館の名前がコメントとして入っている。つまり、他館でのカスタマイズの痕跡がそのまま残っている。
      • 契約書では、「社内にシステムのひな型を持ち、社内で検証したうえで実運用に適用する」となっている。だが実際には、カスタマイズした実運用システムを巻き取ってひな型として他館にインストールしていたと思われる。実際に運用しているシステムなのでデータも入っている、それごとコピーして巻き取ってしまっている。
    • なぜこういう調達になったのか。
      • 「公務員システム」の問題。公務員というのは金銭的利益よりも、身分の安定を重視するシステム。評価は減点主義でなされ、面倒を起こさないのが最も優秀とされる。一方の加点ポイントとしては、予算と人を確保する能力と、議会対応の能力。ジェネラリストが大事にされ、専門家が育たない仕組み。
      • もうひとつの問題は、原課調達主義。ものの調達が、図書館なら図書館という原課で行われる。各プロセスにおいて「予算を多く獲得すること」「トラブルが起きないこと」が重視され、それに最適化されてしまう。その過程で、IT技術や価格妥当性といった点が見過ごされがち。
      • とは言え、IT担当部署が調達すればそれで済むというものでもない。IT担当課には、原課の業務フローが分かっていない場合もある。
      • ある自治体システムの話。下水道の管のデータを情報システムに登録していく作業で、見積もりの妥当性を聞かれた。高いと思ったので内訳を見たところ根拠がめちゃくちゃ。半額にしろといったら、実際半額になった。
    • ITストックホルム症候群
      • 原課としては業者の作る見積もりが予算獲得の理由になるし、細々した作業や臨時の作業をすべて業者にやってもらえると楽。業者としては、技術的な注文はつけず、予算の妥当性もチェックすることなく、トラブルになっても滅多に損害賠償請求をしない公的機関はおいしい客。原課と業者の相互依存が生じる。このためシステム更新で業者が変わることを原課が恐れる。ベンダーロック状態。
      • Librahack事件で情報流出の起きた自治体に電話したところ、こういう反応だった。
    • 自治体が覚えておくべきこと。
      • 業者は利益を追求するもの。自治体調達だと予算が最初に確定し、その機器を4-5年は使う。業者側から見れば5年は安定した収入があるということで、いったん獲得すると手を抜く。調達の当初はエース級の技術者を投入するが、そのうち技術者の質を下げられる。
      • 機器を入札で安値で落とし、その後の保守を随意契約で確保しつづけるというのが王道パターン。
      • ITゼネコンの問題。大企業のIT部門には技術者がいない。下請け・孫請けだったり、他の子会社から出向等で来た人だったりする。自治体側の払った金額からたくさん中抜きされている。
      • MELIL/CSのソースを見ても、契約相手であるはずのMDISの名前はどこにも出てこない。最終的には個人エンジニアに仕事をさせている模様。
    • 原課調達主義からの脱却。
      • IT担当課が調達に積極的に関わること。図書館の場合、IT担当課との間には本庁と教育委員会という二重の壁がある。それを崩して連携しなくてはいけない。
      • 当然、IT担当課の増強も必要。ITスキルの向上を目指す、といっても、ITを「使える」ことと「導入できる」ことは別。やはり調達に携われるレベルにできるのはひとにぎりの人間だろう。
      • 自治体自身が仕様書を作る力を持つ必要がある。調達時の仕様書を、実質的に既存ベンダが作っているという場合がある。そういうことのないように。
      • プロポーザル方式で技術評価するのもいいが、目利きのできる人物が必要。
      • ベンダーロックインの排除。たとえば仕様書に、データ移行の費用を積んでおくこと、データ形式は汎用的なものにすることを定めて置くだけでも違う。
      • 必要ならば外部の目を導入すべき。地方であれば、システム監査のできる地元企業を育成しておくことがその地域におけるIT産業育成の核にもなるだろう。
    • 図書館の自由の話。
      • Webのログを簡単に警察に提出してしまったのは問題。これは入退館記録を渡したようなもので、個人の読書傾向に関わっているデータかもしれない。
      • 報道等では「岡崎市の情報が流出した」としているが、本当は「岡崎市の情報」ではなく、図書館の督促リスト等の機微情報。単に住所や名前が漏れたというのでなく、読書という個人の信条に直接かかわるデリケートな情報であることが問題なのに、ニュースではそこがあまり触れられない。
      • 高木先生が、情報流出の恐れのあるとある図書館の館長に問い合わせをした。その時には「督促リストは個人情報ではない」という答えだった。図書館として、何が洩れたらまずいのかという感覚がない。
    • ITを魔法扱いしない。
      • 技術者たちは、今回の事件を「魔女狩り」だと思っている。プログラムを作るというのは普通の人がしないことをする、変なこと、迷惑なことと思われている。中川氏の警察での取り調べの際にも「プロなら(サーバが停まっていることに)気付くでしょう」と言われたという。プロだから何でも分かるわけではない。
      • これから電子書籍の重要性も増してくる。アメリカでは昨年、書籍の売り上げの10%を電子書籍が占めるようになった。これまで公共図書館に求められてきた「本を貸すだけ」の役割はなくなる。
    • 図書館は何をすればいいか。リファレンスこそが図書館の役割となる。情報探索はネット検索でできると考えがちだが、正しいキーワードを使って検索するのはそれなりに難しいこと。Yahoo!知恵袋人力検索はてななどのボランティアの再度もあるが、質が必ずしも良いとは限らない。そのリファレンスをコントロールできるのが司書。

…続いてパネル討論、だが、もう眠さの限界なので本日はここまで。