KU-ORCAS講演会「(東)アジア研究×図書館×デジタルヒューマニティーズ」に行ってきた。〜その2

 その1の続き。以下はxiao-2の聞きとれた/理解できた/メモできた/覚えていた範囲でのメモ。項目立ては適当。敬称は「氏」に統一。誤記・誤解ご容赦。

  • 東京大学附属図書館U-PARL 永井正勝氏「東京大学附属図書館U-PARLの活動と研究図書館としての漢籍デジタル化の試み」前半
    • ホームページに4つ参考文献を挙げている。今日の話についての詳細は、こちらも参考に*1
    • 東京大学の新図書館計画
      • 2012年から始まった。大きな柱は下記の3つ。
        • 総合図書館別館にライブラリープラザを作る
        • 自動書庫を作る
        • アジア研究図書館を新設する
      • 本館の噴水の下に当たる地下にライブラリープラザ。ここはアクティブラーニングを支援するところ。その下に書庫。
    • アジア研究図書館
      • 本館4F。開架5万冊、自動書庫300万冊。
      • 東京大学の図書館は、自分が就職した頃は35館あったが、現在は30館。今作っているアジア研究図書館が31館目となる。
      • このアジア研究図書館のためにU-PARLができた。附属図書館に設置されたものとしては初の研究部門。2014〜2018年度の5か年計画で、今年が最後。2期もある予定。
      • 現在特任教員、司書等10名体制。兼務教員も入れると14名。
      • 5か年のうち、3年はアジア研究図書館の構築支援を行ってきた。
      • フロア設計、分類(独自のものを使用)、蔵書構築等について、研究者が考えている。
      • 日本の学問風土として、研究に必要な本は研究者個人が自ら集めるという傾向がある。これに対し、欧米では図書館に集約するという考え方。アジア研究図書館では後者で、東大の30の図書館に分散している資料を、アジア研究に関するものは集約したい。
      • いわゆるサブジェクト・ライブラリアン*2を設置したい。制度的に難しいところもあるが、2020年の開館に向けて色々やっている。
      • 図書館の準備中。
        • フロア構築、配架プラン。資料は地域別で、アジアを東から西へ縦断するような配置。
        • フロア中央にガラス張りの防音スペース。
        • 絨毯や、スタッフ用の部屋の給湯器まで我々が選んでいる。
        • 現在、本館に一部の本を集めつつある。
    • 資料デジタル化*3
      • 図書館準備の傍ら、研究図書館の調査研究も行う。サブジェクトライブラリアン、研究支援と並んで、所蔵資料の資料デジタル化も使命。
      • デジタル化と言ってもいきなりプログラムを書くという訳にはいかない。まずは出すのが肝心、ということで、Flickr*4で公開することにした*5アメリカ議会図書館等でもFlickrを使っている*6
      • 気をつけるべき点もある。その一つは情報の粒度。
        • Flickrに資料見開きの画像を載せると、画像1つがPictureという単位になる。複数の画像を本1冊分にまとめたものをAlbum。漢籍は複数冊で一つの書誌が構成されているものが多いので、それをCollectionとする。そういう階層構造。
        • ファイル名もこれを反映して、「資料番号-冊-画像番号」という構成になっている。
      • ひとつのAlbumをクリックすると、アノテーションが表示される。アノテーションの最初と最後は識別子になっているが、その間には著作や版に関する説明。これは研究者が書いている。
      • 特に法帖については、責任表示に重層性がある。撰(もとの文章を作った人)→書(筆で書いた人)→刻(彫った人)→拓(それを拓本にとった人)等*7。個別資料→資料化→版→著作といった構造。
      • このあたりのことは中を読まないと分からない。中を読むのは研究者が関与。
      • 実際のテキストを見ると、一枚の紙に複数の帖が貼り付けられているケースもある。読み込むと複数帖だと分かる。書誌情報だけでは分からない。読み込んでアノテーションを書く。
      • 図書館と研究者の関係でいうと、図書館が作った書誌情報に冊のデータが紐づき、デジタル画像が紐づくというのが従来の形。自館の場合は研究者が書誌の部分から関わる。
      • メタデータは公開。情報基盤センター教員にも関わってもらい、IIIF*8可能化もいま同時に動かしている。こちらは承認待ち。
      • 従来は著作、版などの管理が個別に行われていたが、これからは作品メタデータ、資料メタデータ、テキストアノテーション有機的に提供される。
      • ライセンスは、当初厳しめにCC BY-NC-SA*9にしていた。今はCCBY*10にしている。
  • 東京大学東洋文化研究所 上原究一氏「東京大学附属図書館U-PARLの活動と研究図書館としての漢籍デジタル化の試み」後半
    • 東京大学でのデジタル化の話と合わせ、これまでの一般的な漢籍DBの傾向について話す。
    • 白話小説研究におけるデジタル画像の使われ方
      • 自分は中国の明・清時代の白話小説*16を研究していた。
      • 漢籍における版本の問題として、同じ本について版がたくさんあり、本文が微妙に違うという点がある。
        • たとえば「三国志演義」中の、黄蓋が戦う場面。ある版は黄蓋の使う武器を鞭としており、別の版では槍から鞭に変えたとしている。また別のものを見ると、武器については触れず、結果しか書いていない。
        • エディションごとの正確な本文が必要。比較のため各地のテキストを見なければならない。
        • こうした比較のため、中国古典小説のデジタル化された本文を比較するプログラムも公開されている。技術的にはコピペ発見ソフトのようなもの。
      • もう一つの問題。木版本の、同じ系統の本でも違いがある。
        • 国立公文書館所蔵本と、イェール大学所蔵本のデジタル画像で比べてみる。前者がオリジナルで、後者が復刻。本文に細かい違いがある。
        • 他の例でも、復刻の際に読めなかった字は黒四角になっているなど。
        • 刷りの早い遅いによっても違う。枠外に書かれた批評が削られていたり、板木がすり減って部分的に変えるケース。責任表示を後で入れ替えるケース。
        • 影印本でも原本のままとは限らない。見栄えをよくするために枠の欠けを埋めたり、蔵書印を消す等の修正がされていることがある。処理の入っていない画像があることが大事。
        • 白黒だと分からないケースもある。「西遊記」での例。沙悟浄の顔や足の形が、版によって大きく違うものがあった。原本を見に行ってみると、破れたところに紙を継ぎ足して手描きしていた。
      • 東大図書館所蔵資料のデジタル化
        • 水滸伝の珍しい版本がある。ベルリン国立図書館の所蔵資料に同じ板木で刷った本があるが、本屋が違う。
        • まずはこれをやってみようということで、年内公開の予定。テキストも載せたいが量が多い。
        • 今後の工夫としては、たとえば見開きだけでなく本の小口も載せたい。漢籍は化粧断ちが多く、折り目側の小口が塗ってあるかどうか、線があるかどうか等が情報になる。

 2つめのメモはここまで。続きはそのうち。

*1:とあったが、どのページだったのかメモし損ねてしまった。とりあえず下記を参照。U-PARLとは|U-PARL

*2:辞書的な定義は下記参照。サブジェクトライブラリアン|コトバンク。もっと知るにはこの本オススメ。

*3:以後、上原氏のお話も含めた東京大学U-PARLでのデジタル化については、2017年に行われたイベントの報告記事が参考になる。U-PARLホームページ【報告】アジアンライブラリーカフェno.002 古典籍 on flickr!〜漢籍・法帖を写真サイトでオープンしてみると〜 各報告の配布資料も見られる。

*4:Flickr

*5:U-PARL, UTokyo Library System

*6:The Library of Congress|Flickr

*7:説明ではもっと階層があったが、メモがついていけなかった。

*8:IIIFって何?という方はこちらを参照。2016年4月28日 digitalnagasakiのブログ|今、まさに広まりつつある国際的なデジタルアーカイブの規格、IIIFのご紹介

*9:Creative Commons — 表示 - 非営利 - 継承 4.0 国際 — CC BY-NC-SA

*10:Creative Commons — 表示 4.0 国際 — CC BY 4.0

*11:東京大学東洋文化研究所データベース

*12:具体的なDB名はメモできなかったが、これかな。早稲田大学図書館 古典籍総合データベース

*13:国立公文書館デジタルアーカイブ

*14:宮内庁書陵部収蔵漢籍集覧

*15:雙紅堂文庫全文影像資料庫

*16:白話小説 - Wikipedia