1 of 19

生成AIによる学術情報Web API案内ツールの試作

2025年9月6日 Code4Lib Japanカンファレンス2025

東京大学工学系・情報理工学系等事務部 前田朗

2 of 19

世には数多の学術情報資源

どう使ったものだか…

3 of 19

生成AIベースの学術情報検索コンセプト案

生成AI

学術情報Web APIカタログ

各Web API連携プラグイン(MCP)

Web API

Web API

Web API

Web API

各Web API連携プラグイン(MCP)

各Web API連携プラグイン(MCP)

各Web API連携プラグイン(MCP)

RAG

Agent

会話

多くの学術情報Web APIをサポート

学術情報Web APIを推奨

学術情報Web API呼び出し

OpenAlexやWeb of Science、CiNii Researchなど学術分野のカバーが高いAPIさえ使えばたいがい十分かもしれませんし、安易に実用になるとも考えませんが、コンセプト案として面白いかと。

4 of 19

まずは生成AIでWeb API案内機能(RAG)を!

  • 事前にWeb APIのカタログを用意し、それを生成AIに参考情報として渡します(いわゆるRAG)
  • 機密情報を扱うわけではなく自身のお試しなので、今回はGemini API (Google AI Studio)を使うことにしました
  • Agentの話は次回にします

オフの(帰宅後の)自由研究なので、面白いと思ったことにはチャレンジです

5 of 19

まず対象とするWeb APIを60件適当に選んでみた

AgriKnowledge

EBSCOhost API

Google Books

Legal Data API

Springer API

リサーチ・ナビ

arXiv.org

EDINET

ICPSR

Library of Congress

The CAS Common Chemistry API

レファレンス協同データベース

BLAST URL API

Elsevier Research Products APIs

IEEE Xplore

nihuBridge

The New York Times

医中誌Web

BMC

Engineering Village

InCites Benchmarking

NII-REO

The World Bank Documents & Report API

国会会議録検索システム

Cambridge Core

Entrez Programming Utilities

International Trade Administration

OECD data via API

UN data

国立国会図書館サーチ

Cambridge Dictionary

EPO

Internet Archive

Oxford Dictionaries API

USPTO

特許情報取得API

CiNii Research

ERIC

J-GLOBAL

PLOS

Web of Science

法令API

Data.gov

Europeana

JSTOR

PMC

WIPO PEARL API

OpenAthens

DBpia

Gale Academic OneFile

Juris Online

Power User Gateway

WorldCat

JDreamⅢ

Dialog

Gallica

KAKEN

Project Gutenberg

zbMATH Open

openBD

参考: 東京大学附属図書館 データベース一覧�    https://www.lib.u-tokyo.ac.jp/ja/library/contents/database

6 of 19

Web APIのカタログをDeep Research

あなたは優秀な大学図書館司書です。Web APIのドキュメントが記載されているURLをリストアップしてください。

対象のWeb APIは次のとおりです。

~~~

Name: AgriKnowledge ウェブサービス(WebAPI)

Sample_URL: https://www.agropedia.affrc.go.jp/agriknowledge/api/

~~~

次いで調査したドキュメントのURLの情報をもとに、以下のとおりレポートにまとめてください。

回答フォーマットは次のMarkdown記法です。日本語での回答をお願いします。

# 収録

## 対象分野

## 外部情報源からの収録

# 利用条件

## 利用対象者

## 有償と無償の別

## ユーザー登録の有無

# 検索項目における特色

# 取得データにおける特色

# 利用できるプロトコル(opensearch, OAI-PMHなど)

# その他、特記事項

# 調査に使った情報源(URL)

Gensparkの「深層研究」(Deep Research)のプロンプトサンプル

いくつもの生成AI で提供されているWeb情報を深く探索する調査手法

1回の回答に数分以上かかる上にどの生成AIサービスも無料枠では利用上限がきついが… → 事前準備なので、日数がかかっても高品質を

7 of 19

カタログサンプル(CiNii Research一部抜粋)

左記カタログの情報源

  • CiNii全般 - メタデータ・API (https://support.nii.ac.jp/ja/cinii/api/api_outline)
  • CiNii ResearchのRDF (https://support.nii.ac.jp/ja/cir/r_rdf)
  • CiNiiウェブAPI 利用登録 (https://support.nii.ac.jp/ja/cinii/api/developer)
  • 収録データベース一覧 (https://support.nii.ac.jp/ja/cir/cir_db)
  • Open Search 仕様書 1.1 ドラフト6版 (https://github.com/dewitt/opensearch/blob/master/opensearch-1-1-draft-6.md)
  • Japan Link Center (https://japanlinkcenter.org/top/)

以下略

生成AIによるレポートのため、ハルシネーションがおきている(事実と異なる)可能性があります

8 of 19

無課金で軽量RAGのシステム構成を組んでみた

※無課金とはいえ自宅マシンの初期投資あってではあります

ベクトルストア(内部DB)【Web APIカタログ60件(Markdown)】

Gemini API (Google AI Studio)

無料枠(機密情報は扱えない)

Pythonスクリプト

質問(Start)

ミニワークステーション(私物)

回答(End)

内部知識を得てから

②生成AIに質問を投げかける

事前に用意したWeb APIカタログはここで使う

(生成AIの無料枠での質問に使うので、公知の情報にとどめている)

マシンスペックが重要な生成AIは外部サービスで

9 of 19

どうなったか試してみた

10 of 19

【テスト1】

生成AIによるレポートのため、ハルシネーションがおきている(事実と異なる)可能性があります

回答に使用したカタログ情報

カタログをもとに、2件の該当について、比較説明

11 of 19

【テスト1】の回答に使われたカタログの情報源

  • Google Books API
    1. Google Books APIs - 使用API : https://developers.google.com/books/docs/v1/using?hl=ja
    2. Google Books Terms of Service : https://developers.google.com/books/terms?hl=ja
    3. Google Books APIs - Getting Started : https://developers.google.com/books/docs/v1/getting_started?hl=ja
    4. Google Books APIs - Volume Reference BBVA API Market : https://developers.google.com/books/docs/v1/reference/volumes?hl=ja#resource
    5. APIと書籍:AmazonやGoogleや各種オープンAPI : https://www.bbvaapimarket.com/en/api-world/apis-books-amazon-google-books-isbn-and-their-open-apis/
    6. Codementor - How I bypassed Google books API rate limits or quota : https://www.codementor.io/@srvkataria/how-i-bypassed-google-books-api-rate-limits-or-quota-vpmra29q0
    7. Rachel Emmer - How to use the Google Books API in your Application : https://rachelaemmer.medium.com/how-to-use-the-google-books-api-in-your-application-17a0ed7fa857
    8. 国立国会図書館とGoogle Books APIの比較 : https://toranoana-lab.hatenablog.com/entry/2023/12/15/120000
    9. Google Books API Overview : https://developers.google.com/books/docs/overview?hl=ja
    10. Open Archives Initiative - OAI-PMH : https://www.openarchives.org/pmh/
  • openBD
    • プロジェクト概要・API導線 : https://openbd.jp/
    • データ仕様(V1, ONIX/版元ドットコム拡張: https://openbd.jp/spec/
    • 利用規約(データの「利用権」等) : https://openbd.jp/terms/
    • API v1 技術資料(エンドポイント・上限・実装指針) : https://openbd.jp/pdf/api20170123.pdf
    • API v1 提供終了のお知らせ(代替APIの方針) : https://openbd.jp/news/20230725.html
    • 稼働状況ダッシュボード : https://status.openbd.jp/
    • 利用ガイドライン解説ページ : https://openbdjp.github.io/openbd-web/

12 of 19

生成AIによるレポートのため、ハルシネーションがおきている(事実と異なる)可能性があります

回答に使用したカタログ情報

【テスト2】

該当が1件だけのためか、カタログの情報をそのまま使用

13 of 19

【テスト2】の回答に使われたカタログの情報源

  • EPO
    1. EPO Open Patent Services (OPS) : https://www.epo.org/en/searching-for-patents/data/web-services/ops
    2. EPO Developer Portal : https://developers.epo.org/
    3. OPS RESTful Web Services Reference Guide v 1.3.20 : https://link.epo.org/web/searching-for-patents/data/en-ops-v3.2-documentation-version-1.3.20.pdf
    4. EPOのAPIを使ってみる ~OPS~ : https://note.com/sasiapi_/n/n21cd7b23998a
    5. Patent Client Documentation : Getting Started https://patent-client.readthedocs.io/en/latest/getting_started.html
    6. Coverage, codes and statistics : https://www.epo.org/en/searching-for-patents/data/coverage
    7. 主要国・地域の特許関連APIの現状とその利用方法 : Japio https://japio.or.jp/00yearbook/files/2023book/23_4_03.pdf
    8. OPS v3.2 – FAQ : https://www.epo.org/en/service-support/faq/searching-patents/open-patent-services/ops-v32
    9. Search queries - tips and tricks : https://www.epo.org/en/service-support/faq/searching-patents/open-patent-services/search-queries-tips-and-tricks
    10. Member states of the European Patent Organisation : https://www.jpo.go.jp/system/laws/sesaku/data/keikajoho/index.html
  • WIPO Pearl API
    • WIPO Pearl API 日本語ドキュメント : https://wipopearl.wipo.int/ja/api
    • WIPO Pearl API 英語ドキュメント : https://wipopearl.wipo.int/en/api
    • WIPO Pearl Database 利用規約 : https://www.wipo.int/en/web/wipo-pearl/terms-wipopearl
    • WIPO Pearl サービス概要(英語) : https://www.wipo.int/en/web/wipo-pearl
    • WIPO Pearl API 提供開始ニュース : https://www.wipo.int/en/web/wipo-pearl/w/news/2021/news_0004
    • API申請フォーム : https://www3.wipo.int/contact/ja/area.jsp?area=wipopearl-api
    • 主要国・地域の特許関連APIの現状と利用方法(JAPIO資料): https://japio.or.jp/00yearbook/files/2023book/23_4_03.pdf

14 of 19

生成AIによるレポートのため、ハルシネーションがおきている(事実と異なる)可能性があります

カタログは回答に使われなかった…

(該当のカタログがうまくヒットしなかった)

それでも生成AIが回答してはくれる

【テスト3】

15 of 19

ひとまずのまとめ

  • きちんと作りこめばそれなりに実用になりそう
  • カタログ単体でも有用かもしれない
  • 質問文からカタログにうまくヒットしない問題…
    • 検索(今回はベクトルストア)の精度が重要
    • とはいえ、生成AIできちんと答えを出してはくれる
  • 無課金で軽量RAGの構成はシンプルながら使い勝手がよかった
  • 生成AIの進化しだいで状況がかわるはず

16 of 19

付録�という名の試行錯誤の記録

17 of 19

Web APIカタログ生成のためのDeep Research選択

  • Genspark

 → 今回はこれを採用

  • ChatGPT

→ 無料枠の回数制限がきつい

  • Gemini

→ 無料枠の回数制限がきつい

  • Perprexity

→ 無料枠回数制限はゆるいが、(プロンプトしだいかもしれないが)レポートの内容が期待ほど詳細でなかったので見合わせ

採用のGensparkは一日1回程度使えたので2か月かけてこつこつと…、

また出力をきれいにMarkdownにするのも手作業で。

18 of 19

Gemini (Google AI Studio)以外に試した生成AI

  • Google Notebook LM

→ 無料枠だと文書が最大50までなのであきらめ

  • Gemini-cli

→ Web APIレポートをすべて読もうとしたら動かなかった… (無茶か)

  • ChatGPT oss (実行環境はOllama)

→ ミニワークステーション上で動かすことはできたが、レスポンスがいまいち(いまいちなのはマシン性能かも…)

19 of 19

「生成AIからCiNii Research APIを呼び出してみた」

次回Agent編