1 of 49

大学学部図書館のための�図書選定補助ツールの�紹介と考察

Code4lib japan 2013 conference

国立情報学研究所 前田朗

maeda@nii.ac.jp

2 of 49

はじめに

  • ねらいとコンセプト
  • 開発ツール紹介
    • ブラウジング
    • 専門用語の解釈
    • 蔵書評価
    • 選書成果の学術利用
    • さらなるツール
  • 選書補助システムの考察
  • おわりに

3 of 49

ねらいとコンセプト

図書館員は何を指標に図書を選べばよいのだろうか。

図書の選定は、機械的に処理できるのだろうか…

4 of 49

ねらい

  • 図書選定の理由の明確化
    • 図書選定の質の向上
    • 予算活用の説明
  • 図書館業務システムの補完
    • 図書館業務システムでは、あまり手がつけられていない → ツールを自作・手法を検討する意味がある

大学の総合(中央)図書館や研究所図書室での活用も

5 of 49

コンセプト

  • 職員の補助のためのツール
    • 図書の内容理解なしで理由のある選書はできない
    • 現状の人工知能では、テキストから内容を理解できない
  • 使えそうな手法を必要に応じて作成
    • 図書館の現場で必要に即し作成
    • 十分な要件が整理できたら、統合システム化も

6 of 49

開発ツールの紹介

東京大学柏図書館に在籍した3年間で、実務上に即して作成したツール類を一部紹介

7 of 49

ブラウジング

図書の選定を人間が行うという観点で考えれば、人間が選定候補の図書を読みやすく一覧できるインターフェイスは必要である

8 of 49

Be-ビブリオ

開発ツール1

9 of 49

入力ISBNリスト順で�図書を1タイトルづつブラウジング

図書リストからの書籍内容チェックに使えます!

Be-ビブリオ

10 of 49

Be-ビブリオが�提示する情報

書籍タイトルについての

Web上のキーワードを集計

(現在は休止)

書籍タイトルについての

Googleブログ検索結果

書誌情報

(国会図書館 or

楽天ブックス)

内容紹介

(楽天ブックス)

書影

(楽天ブックス)

11 of 49

Be-ビブリオの情報あ源

楽天の「内容紹介」と「書影」 → 楽天に直に問い合わせて問題ないことを確認

Yahoo! 検索結果(抜粋)からのキーワード抽出

(有料化に伴い現在は休止)

Web上の書評 → Googleブログ検索がよさそう

著作権と網羅性、経費を考えると、

使える情報は限られる!

12 of 49

ランチャー

開発ツール2

13 of 49

図書館職員はOPACのハードユーザー!

使いどころを選べば、重複購入調査など業務が楽できます。

東京大学OPACランチャー(学内限定

「次を表示」ボタンをクリックするとリストのキーワードを順にOPAC検索

東京大学OPAC検索結果画面

14 of 49

ランチャーとその応用

  • Javascriptのみで作成
  • URLで検索結果HTMLを表示するDBなら簡単対応
  • CiNii Booksランチャーも公開中

15 of 49

専門用語の解釈

サブジェクトライブラリアンにはなれなくとも、図書のタイトルや内容紹介を表面上だけでも解釈して図書選定できるのではないか。

16 of 49

Wikipediaタガー

開発ツール3

17 of 49

Wikipediaタガー

テキストを入力

(例は「近刊検索βの[マルチンゲール理論による統計解析]内容紹介)

Wikipedia注釈すみ

テキスト

Wikipedia記事へのリンク

18 of 49

用途

  • 文章を自動注釈してくれると初学者には便利かもしれない
  • 図書館でも職員による図書の選定に使えないか(アプリそのままではなく、機能の組み込み)
  • ホームページ作成者向けに注釈結果をHTMLで保存する機能付き

19 of 49

東京大学内専門用語�利用状況サーチ

開発ツール4

20 of 49

  • 学部・研究所の図書室における図書の選定に非常に有用と思います
    • 図書タイトルや図書の内容紹介中の専門用語を入れます
    • 図書館室の所属する学部・研究所を選択します
    • 実行をすると、図書館室が所属する学部・研究所のWebサイトでどの程度(どのように)その専門用語が使えるかがわかります。
    • 学習・研究に頻出する語なら「買い」だとおもいます。

東京大学内専門用語利用状況サーチ(学内限定)

21 of 49

蔵書評価

図書の選定は、PDCAサイクルに則り行われるべきものではないか。そのためには、現状の把握や選書結果の評価が重要なポイントとなろう。

22 of 49

難語レポーター

開発ツール5

23 of 49

画面の入力例は「近刊検索β」にあった

「昭和前期の科学思想史」(勁草書房)の内容紹介

難語レポーター

24 of 49

レポート1�    学術度判定(独自手法)

学術(ac.jpドメイン)限定のWeb検索と、

限定なしのWeb検索の

ヒット件数の比率で学術度を判定

25 of 49

レポート2�    レア語をチェック(独自手法)

IPADICの[形態素生起コスト]をもとにした

独自の用語生起コストと、

Yahoo!検索件数をもとにレポート

26 of 49

レポート3�    テキスト中の使用文字種

テキスト中の常用漢字(学年別)、�ひらがなの比率などをレポート

27 of 49

従来の「難読度」とは別の視点で考える

個々の用語の難易度に着目する

→ 短いフレーズでも有効に働くはず

上位概念と下位概念

学術度

レア度

日本語WordNetを見てみたが、

下位(より専門化されたもの)が

難易度として高いわけではない

国内学術サイト(ac.jp)中でへだたって使われる用語に着目

IPADIC(日本語辞書)の単語コストをもとにした用語の出現しにくさ、+ Webヒット件数

この2つの手法を採用

28 of 49

学術度判定

  • 学術度 = 国内学術サイトのヒット件数 ÷ 日本語Webサイトのヒット件数
  • レア語と同様に用語生起コストの上位3件のみ判定
  • 判定基準

学術度

判定

0.5より上

学術度が非常に高い

0.1~0.5

学術度が高い

0.05~0.1

学術度あり

0.01~0.05

学術度判定不可

0~0.01

学術度が低い

29 of 49

Libオススメ

開発ツール6

New Tool !

30 of 49

libオススメ

判定のためのしきい値をセット

判定対象図書のISBN(リスト)を入力

31 of 49

CiNii Booksの

タイトル情報

大学図書館と公共図書館の所蔵館数とそれによる評価

32 of 49

ポイント

  • 図書館が所蔵すること → 図書館のオススメと解釈する
  • 性格の異なる2館種の結果を組み合わせる
    • 大学図書館(CiNii Books)
    • 公共図書館(NDL Search)

公共図書館所蔵

大学図書館所蔵

公共図書館

オススメ

大学図書館

オススメ

一般教養本

判定不可

33 of 49

R言語を使った蔵書評価

実験

34 of 49

東京大学新領域Webサイトと�東京大学柏図書館蔵書(開架一般書)相関

科学

入門

心理学

物質

電気

産業

学生リクエスト多のため

不足テーマ?

これ以外に学内図書館室間の位置づけ調査も実施

35 of 49

選書成果の学術利用

図書館の蔵書構成は図書館が長年にわたり価値判断を繰り返して末の結果といえる。これは有益なコーパスとなりえないだろうか。

36 of 49

専門用語コレ・モカモ

開発ツール7

37 of 49

学術分野に応じた関連語提示

CiNii Booksにリンク

フレーズ入

学術文分野

(図書館)

セレクト

クリック

専門用語コレ・モカモ

38 of 49

専門用語コレ・モカモの3つのねらい

サービス

    • 研究・学習者向けの検索補助

研究

    • 関連語提示手法のひとつの提案

図書館業界

    • 図書館の蔵書構築をフォーカス

39 of 49

さらなるツール

図書の選定において、考慮すべき要件は多い。

40 of 49

個別紹介しきれなかった選書ツール・手法

  • あいまい重複調査
  • 東京大学内図書室の位置づけ
  • 学位論文タイトルマイニング
  • xISBNを使った最新版調査
  • 洋図書の納品期間の推定
  • 東京大学新領域教員の著書チェック
  • NCIDから和書価格を得る
  • シリーズものの所蔵漏れをチェック
  • 評価表現辞書タガー

41 of 49

選書補助システムの考察

いままでの開発ツールをまとめ、図書の選定のための統合システムとして、どのようなものが考えられるかを考察する。

42 of 49

ポイント1� ブラウジングを中心に置く

  • 書籍に関連情報をまとめて提示
  • 用語の注釈機能も取り込む
  • 雑多な形式のリストを取り込み可に

43 of 49

ポイント2� ターゲットとする研究・学習データの活用

    • 学部Webサイト
    • シラバス
    • 学位論文タイトル
    • など

44 of 49

ポイント3� 蔵書評価を業務サイクルに

    • ターゲットに合っているか
    • 入門書と専門書のバランスは適当か
    • 学術性は十分か
    • など

45 of 49

ブラウジング

ネット情報

書籍DBなど

ターゲットとする

研究・学習内容の

情報

評価済み受入

候補一覧

発注・受入

選定結果の評価

選書補助システム案

専門用語の解釈

学術度

専門・教養のバランス

研究・学修

内容との整合

グループに

よるチェック

予算・重複受入

チェック

数段階の

評価

コメント

書籍リスト

46 of 49

おわりに

47 of 49

ツール開発で関わったコミュニティ

  • 図書系職員のためのアプリケーション開発講習会
  • 東京大学柏図書館
  • 言選Web
  • マイニング探検会

Special Thanks

48 of 49

紹介ツールの利用及びさらなる情報

「図書系職員のためのアプリケーション開発講習会」成果一覧

紹介のツールのうち一般公開のものは、以下のサイトからお試しいただけます。

https://mbc.dl.itc.u-tokyo.ac.jp/products.html

49 of 49

ご清聴ありがとうございました