《書言字考節用集索引編のデータベースについて》

                                            1996.1  河邊岸三

 1)この索引は、享保2年版書言字考節用集(『古辞書大系』)の索引編を個人的使

   用を目的にデータベース化したものです。

   (金沢大学木越治氏の許で打ち込まれたデータを基に、データの誤りと索引編の

    幾つかの誤りを訂正した上、データの仕様を一定した)

 2)1データを4項目に分かち、

    (1)仮名項目(歴史的仮名遣い)

    (2)第1項目と異なる底本の仮名表記など

       (反復記号は該当文字に引き直す。反復記号のみの異同は省略)

    (3)漢字項目

    (4)所在

       (自筆稿本を示す*印を出処の冒頭に、疑問のメモを末尾に)

   を示します。

    各項目の区切りは半角カンマ「,」

 3)漢字項目は「索引編」の漢字表記を忠実に引写すことを第一にしましたが、検索

   の便宜のため次の処置を施しました。

    a)ルビなし漢字を示す( )は省いて漢字を裸にする

    b)JIS漢字外の漢字の表記方法

            後出の《JIS外漢字の表記方法について》をご覧ください

    c)JIS漢字外の異体字のうちJISの通行字体に引きなおせるものは、通行字体

      によって表記した単語を( )に入れて添えました

            例  滯→澑(滞留)

    d)JIS漢字に含まれる異体字には、通行字体を添えていません。複数の字体

      を持つ漢字の検索は、それぞれの字体に従って行ってください。

            (YOT氏作成の検索ソフト YGREP を添付します。文字テーブルを改定して、JIS漢字のどの字体からでも検索可能にしました)

 4)「索引」の参照項目は原則として削除しました。

    (さまざまな検索方法によって目的は達せられるので)

《JIS外漢字の表記方法に付いて》

Ⅰ 漢字の単語や成句をキーとして、その訓みを探すために、次のような方法をとりま

  した。

    ①漢字を第2水準までの文字に相当する構成要素に分解し、その構成要素の繋

     がり方を上下左右を指す矢印で示す。

     (この矢印は表現された文字の形を示す手掛りにすぎません。検索は、複数

      の構成要素をキーとする複合検索によるのが良いと思います)

    ②構成要素への分解は、左から右へ、上から下へ、順を追って機械的に行う。

     (例:「サ↓扈」でなく「芦↓邑」)

    ③構成要素に相当する文字が第2水準に存在しない場合には、他の漢字の構成

     要素で表現する。その場合、漢字に添えた矢印によって使用する部位を示す。

      (別表参照)

    ④1つの漢字は原則として6つ以上の要素に分解しない。

    ⑤このデータベースでは「索引編」の字体を忠実になぞったが、表記の煩雑を

     避けるため、一、二の例外を設けた。

      1) 2点の雨冠は通常の雨冠とした。

      2) 「しんにゅう」の表現は一律に「↓辺」(別表参照)を用いた。新旧

        の字体で「しんにゅう」のみが違い、しかも JIS漢字に新字体しかな

        い時は新字体に従った

      3) 下記の 10例 の異体・旧体はJIS 漢字にある字体とした

             「祓」「抜」「跋」「既」「遂」「黄」「褐」「通」「姉」「畫」

      4) ( )に入れて説明しただけの文字

            (刀部 0画のチョウ)

Ⅱ (別表)利用した文字等の一覧

    ①構成要素を形の似た仮名で表記したもの

     イ(にんべん) サ(くさかんむり) シ(さんずい)

     ク ケ コ ナ ネ メ ヨ ヰ

     く

            (「宀丿厶冖冫工夕」は漢字を使う)

    ②偏・冠などを部首の文字で代用したもの

     人(やね・いりがしら) 八(はち・はちがしら) 心(りっしんべん)

     手(てへん)    月(つき・にくづき) 牛(うしへん)

     犬(けものへん)  爪(つめかんむり)  目(冠として)

     衣(ころもへん)  羊(ひつじへん)   邑(おおざと)

     阜(こざとへん)  食(しょくへん)

    ③漢字の旁を使用したもの(左側に→印を付す)

     淵 汚 假 環 陷 卿 仰 均 僅 巧 溝 讒 捷 將 檣 嬢

     掾 總 挿 沈 栃 八 派 跋 犯 備 峰 僕 満 滿 乱 流

     澑 龍 僚 列 臘 録 祿

    ④漢字の偏を利用したもの(左側に←印を付す)

     頤 敵 髟 離

    ⑤漢字の上部を使用したもの(左側に↑印を付す)

     寒 巻 其 危 急 業 繋 蘖 虍 后 乞 裁 齋 鳥 追 遞

     嚢 馬 病 黎 老

    ⑥漢字の下部を使用したもの(左側に↓印を付す)

     衣 恭 然 足 泰 辺(しんにゅう・新旧併用) 庸

    ⑦漢字を天地ひっくり返したもの(左側に↓↑印を付す)

    ⑧重ね打ちにする場合は ↓印で繋ぐ(例:「比」の間に「矢」)

《漢字表記と検索》

 JIS文字を使ってJIS漢字外の漢字を表現するには、幾つかの方法が試みられているよ

うですが、いずれにも一長一短があるように思います。

 上に記した漢字表記の方法は、便利さと煩わしさのバランスから自然と定まった私的

な規則にすぎませんが、規則は一律に適用していますから、使い勝手の良いようにデー

タを作り替えることは比較的簡単です。使い勝手の良いように作り変えてお使いくださ

い。

 こういう方法を使ったのはパソコン上で求める漢字の形をある程度掴みたいという程

度の理由によることで、検索のためには、要素となる漢字が間違いなく収めてあれば、

繋ぎ方がどうであれまったく問題はない筈です。そしてどういう方法を使うにせよ、底

本の字体は底本そのものを当らなければ本当のところは分からないはずです。すべての

データ・ベースは底本に辿りつくための便宜にすぎない、と考えたほうが間違いないで

はないでしょうか。

 もともと「索引編」は漢字で引くように作られていませんし、漢字の翻刻方針に乱れがありますから、「索引編」の字体を忠実に復元すること自体に本質的な意味があるとも考えられません(「索引編」の漢字翻刻例の幾つかを「索引メモ.doc」として添付しました)。

 さらに言えば、我々が本を読んでいて実際にぶつかる言葉は、さまざまの字体で書か

れていることが多いはずなのに、それをその通りの字体でないと検索できないというの

では、データベースは実際の役には立ちにくいでしょう。調べたい漢字と「書言字考」

に登録されている漢字の字体が違うということも多いはずです。

 こういう問題は、JIS の第2水準から第3・第4水準と漢字を増やしても解決がつき

ません。むしろ使用者が使う漢字は少ないほうがよい。少ない漢字を使って出来るだけ

多くの漢字にアクセスできるようにすべきだと思います。大事なのは、そのための或る

一定の規則を皆が共有することではないでしょうか。道路交通は右側通行でも左側通行

でもどちらでも良いのですが、皆がどちらか一つの規則を守らないと安全な運転も歩行

も出来ないのと似ています。

 その意味で、検索ユーティリティー YGREP (1990年、YOT氏作成)は、この問題をク

リヤーする一つの方向を示唆しているように思えます。今回添付した YGREP は、読替

えテーブルに多少手を加えましたが、大勢の人の知恵を集めてこのテーブルを改良し、

しかもパソコンを初めて使う人でも手軽に使えるような対話型のソフトが出来て來るこ

とを願っています。

 しかしどう改良したところで、「索引編」も「データベース」も便宜のものにすぎ

ず、「底本の字遣い」は、最終的には底本そのものを自分自身の目で確かめる以外に方

法はない訳です。

《JIS漢字について》

 幾つかの漢字は、パソコンやプリンターの機種により、新旧の字体が逆転して画面に

現れたり印刷されたりすることがあります。

 JIS78 と JIS83 の相違等については、別添の伊藤隆幸氏が、インターネットのニュースグループ(fj.kanj)に流した一覧(jis78_83.dif)を参照してください。

てください。