ディジタル媒体を使用して、仏教学データの調査と普及:

 仏教学のディジタル辞書

 

 

(Using the Digital Medium for Research and the Dissemination of Buddhist Studies Data: The Digital Dictionary of Buddhism)

 

日本印度学仏教学大会・東京大学・7/1/2001

 

 

チャールズ・ミュラー

東洋学園大学

 

 

 

I. 歴史

 

1986年当時、大学院生として漢訳仏典の研究を始めたとき、私は欧米の研究者にとって利用可能な参考書の不足を痛感し、大学院での勉強をしながら、東アジア仏教語辞典 (Digital Dictionary of Buddhism [DDB])の作成を始めました。同時に 密接に関係づけられたプロジェクトである東アジア漢文語彙辞典 (CJK-English--仏教専門語以外の漢文英語の辞書) にも着手しました。 私は 、広範囲な東アジアの仏教、儒教および道教テキストの研究を続ける中でこの二種の辞典編集作業に従事して現在まで取り組み続けています。そして博士課程の修了から現在までの8年間で、私が研究していたテキストからの専門用語をほとんど入力しましました。

このプロセスを開始した時には、インターネットのような存在はもちろん考えられませんでした。また、當初これらの語彙をディジタルデータベースとして利用する可能性も考えていませんでした。 私は単により新しく、大規模でより有効な印字された辞書の公表を思い描いていただけなのです。 しかし、コンピュータが普及してその利用法が広がるに連れて、私はディジタル辞書と百科事典が印刷物の辞書よりも調査にははるかに強力なツールであることを理解するようになりました。従って、私は世界中の研究者がこれらの辞書を利用可能にするためのインターネット上の使用の可能性を認識し、またインターネットがプロジェクトへの研究者の関心を引き付ける可能性を認識したので、1995年に、自分のウェブサイトを作成し、両辞典をそこに掲載しました。 当時、私は一番容易なhtmlドキュメントの作成方法しか解からなかったので、辞典の構成は非常に平凡なものでした。 その時点では、DDB は約3,000語彙が含まれていました。

            両辞典をインターネットに掲載した後、直ちに私と面識のない世界中の研究者から沢山の連絡が入りました。ウェブ公開の方法、データ−の構成と処理そして内容についての様々なアドバイスを受けました。その時点から現在まで辞典内容が次第に広範囲になり、内部構造が着実に洗練されてきています。 内容的には、DDB は最初は自分の研究の為に作成したので、含まれている語彙は大部分、自分の比較的狭い研究範囲から選択されました(韓国仏教、唯識学、起信論、圓覺經、元曉学等)。 しかし、インターネットに掲載されて以來、法華經、天台、三階教、眞言、聖�コ太子、禅学、日本の寺院等を研究している人々からデータを提供されるようになったので、範囲は急速に広域化しており、現在のところでは、含まれている語彙は約9500に到達しています。含まれている語彙の種類は術語だけではなく、人名、寺名、地名、宗派名、書名等が含まれています。DDB の基本的対象となる言語は漢文ですが、仏教経典の研究においては、勿論、チベット語、梵語、パーリ語彙も入力されています。[1]

 

II. 構成と内容

基本的なデータ形式に関して、DDBは様々な特徴があります。 の一つの特徴は漢文語彙について複数の読み方を提供していることです:

 

(1) 中国語:

a. ピンイン(Pinyin) ローマナイゼイション・システム

b. ウェイド・ジャイルズ (Wade-Giles) ローマナイゼイション・システム

(2) 韓国語:

a. ハングルの読み方、

b. マッキューン・ライシャワー (McCune-Reischauer) ローマナイゼイションシステム

c. 韓国文化省 (Ministry of Culture) の新しいローマナイゼイションシステムシステム

(3) 日本語:

a. 仮名

b. ヘップバーン (Hepburn) ローマナイゼイションシステム

現在、オーストラリアの西シドニー大学 (Western Sydney University) のベトナム仏教研究グループはDDBに既に含まれている漢文語彙のベトナム語の読み方、及びベトナム仏教のデータを寄稿する予定で、私はそれを楽しみにしています。

DDBのその他の構成について、代表的なエントリーは以下のように表示されています。 (○でんである番号は今日の説明の為だけです。もとのデータに入っていません):

 

----------------------------------

有覆無記

Readings

Chinese    Pinyin: yǒufù wújì    Wade-Giles: yu-fu wu-chi
Korean    Hangul: 유복무기    MoC: yubok mugi    McCune-R: yubok mugi
Japanese    Kana:
ウフクムキ    Hepburn: ufuku muki                           [日本語]   [한국]

Basic meaning: impedimentary moral indeterminacy (or "neutrality")

Dictionary References:
Japanese-English Buddhist Dictionary (Daitō shuppansha) 323b/359

Pulgyo sajŏn (Unhŏ) 669a
Bukkyōgo daijiten (Nakamura) 86d
Fo Kuang Shan Dictionary 2460
Ding FuBao (Digital)
Buddhist Chinese-Sanskrit Dictionary (Hirakawa) 634
Bukkyō daijiten (Mochizuki) (v.1-6) 230c,2946a
Bukkyō daijiten (Oda) 117-3*, 1693-3-18

 

                           ---------------------------------------------------------

 

上記のように、一つのエントリーは5つの部分に分かれています。

語彙 (headword)

読み方 (readings)

一番基本的な意味で、特に翻訳者の為に明確な形で示しています (translation)

意味の詳細な説明(勿論、異説は出来るだけ広く含まれている)(sense = explanation)

はこの語彙について情報を有する辞典の名前とページ番号。この情報は数箇所の研究グループが協力して作成した大規模な電子索引(現在約300,000語彙含有)から提供されています(dictionary references)[2]

上記のような情報が英語で編集されているのは、言うまでもなく、西洋の学者にとって非常な便利なものです。しかし、このDDBのメリットはそれだけではありません。この辞典の最も重要な特徴はその内容だけではなく、ディジタル性という点にあります。その理由は以下の通りです。

 

A. ユーザの立場に於けるのディジタル化の基本的な利点。

 

l        検索機能 (search functionality)    印刷出版の辞典で語彙を検索するにはどうしても時間がかかります。そして検索語彙が結局辞典に掲載されていない場合も多いです。電子辞典は、一瞬で検索が可能です。また、その語彙が辞典内に掲載されているかどうかの有無が即座に認識できます。

l        瞬間的な他箇所への参照 (instantaneous cross-referencing)電子辞典の場合は一瞬に(ハイパーリンキングを利用) 辞典の他の箇所に移動することが可能です。従来の印刷出版辞典では瞬間的に他所へ移動することは不可能であり、かつ、ほとんどの他所参照にはページ番号も記載されておらず、不便です。

 

B. 辞書製作者の立場におけるディジタル化の基本的な利益。

 

1) 無限追加・訂正 印刷出版辞典と異なり、限られた出版締め切り期限がありません。毎日新しいデータを追加することが可能であり、また、古いデータの誤りや不足している点を訂正できます。

2) 他の種類のデータ(画像、音楽等)をいつでも容易に結びつけることが可能です。各エントリー部分の記載スペースが長くなっても問題ありません。

3) 他の外国語の情報も追加できます。例えば、前記の例を用いて、以下のように変化できます。

 

---------------------------------------------------------

有覆無記

 Readings

Japanese    Kana: ウフクムキ    Hepburn: ufuku muki                           [English]   [한국]

辭典参照:
日英佛教辭典 (大東出版社 ) 323b/359

佛教辭典 (耘虚 編) 669b
佛教語大辞典 (中村元 ) 86d
佛光山辭典 2460
丁福保 (電子版)
佛教漢梵大辭典 (平川彰 ) 634
佛教大辭典 (望月信亨 ) (v.1-6)230c,2946a
佛教大辭典 (織田得能 ) 117-3*, 1693-3-18

 

---------------------------------------------------------

 

そして、韓国語では

 

------------------------------------------------------

 

Korean    Hangul: 유복무기    MoC: yubok mugi    McCune-R: yubok mugi   [English]   [日本語]

사전삼조:
일영불교사전 (대동출판사 편) 323b/359

불교사전 (운허 ) 669b
불교어대사전 (중촌원 ) 86d
불광산사전 2460
정복보 (전자)
불교한범대사전 (평천창 ) 634
불교대사전 (망월신형 ) (v.1-6) 230c,2946a
불교대사전 (직전득능 ) 117-3*, 1693-3-18

 

---------------------------------------------------

 

C. インターネットの辞書

 

ディジタル化の最も大きい利点は辞書をインターネット上で公開することが可能であるということです。インターネット上に公開されているものは、誰でも、何時でも、無料で使用できます。[3]   従来の印刷出版された辞典は比較的高額な値段です。また辞典を一度出版すると、そのデータはほぼ永久的状態で残ります。改訂版を製作できますが、出版社は編集者とそのチームを再度収集しなければなりません。 そして、その作業は経済的に大変な負担なので、改訂点が少ないと、改訂の価値もありません。逆に、インターネット上の辞典は世界中の研究者から改訂点を何時でも受けられ、必要であれば毎日改訂して出版することが可能です。

            しかしながら、インターネットは単に改正することだけに有効ではなく、作業を共同開始できる媒介になります。以前、辞典を作るプロジェクトでデータ収集するのは大変な労力が必要でした。インターネットを利用すると、沢山の研究者がE-mailを利用して、迅速にかつ、大規模なデータを中央サーバーに送る事が可能です。 したがって、仏教学は非常に広い分野ですが、多くの異なったサブ分野の研究者たちが共同のプロジェクトに協力することが容易になりました。

            これらの視点から、現代の人文科学研究者 (哲学者、歴史学者など) には、これまでは考えられなかった研究ツールとしての電子辞書を作成する機会があります。しかしながら、仏教分野の研究者が本当にすぐれた、包括的参照ツールとしての辞書作成を望むのであれば、各研究者達が小規模のグループ内だけでデータを共有するという習慣を捨てなければなりません。

 

III. 技術的な様相: XMLの役割

            以上に述べたように、情報技術の改良はもちろん重要ですが、現代において、より大きな進展の可能性があるのは、ネット上で多くの研究者が参加して行う協力的プロジェクトです。これは各研究者の地理的な位置がかけ離れていても容易に共同作業を扱うことが可能になったからです。しかしながら インターネットを協力道具として利用する可能性は数年前からありましたが、 辞書編集のような実践的な共同プロジェクトはそれぞれの研究者が利用しているコンピュータシステムとソフトウェアの違いにより妨げられてきました。また市販のソフトウェアの基本的な構造は学問的な情報共有と共同のためにはあまり向いていません。例えば、データベースプログラムは情報を格納するには有効ですが、共同制作者が異なったデータベースプログラムを使っているとき情報を共有することは難しいです。これに対し、プレーンテキストやhtmlなどのファイル形式は様々なパソコン環境で利用でき、やりとりできますが、それらはデータを分類する構造を欠きます。また一般に、一つの会社によって販売され利用法について様々な制約を受けるソフトウェアは、協力的なプロジェクトには有効でない傾向があります。データを格納し、より柔軟にまた効率よくデータを扱い、伝えることの出来る開かれたシステムが求められた結果、XMLは開発されました。

            XML (eXtensible Markup Language) htmlのようなタグ(<tag>)を使用するシステムです。しかし、htmlのタグはテキストの外観について説明するのにだけ使用されます。これに対して、XMLのタグはタグによって囲まれた部分の性質を示します。タグが内容について説明するので、コンピュータはデータベースプログラムがする同じ方法でタグを読み、それらを理解することができます。 したがって、XMLによって関連あるデータを分類したり、必要に応じて情報を分析したり、あるいはインデックスなどを作成するために選択的に抜粋することが可能です。また、いわゆる「スタイルシート」を使用すれば、XMLタグはテキストを見やすい形で表示する為にも利用できます。最も重要な点としては、同様のプロジェクトに取り組んでいる研究者が、同様のタグ付けシステムを使用することに同意するならば、容易にそれらのデータを共有することが可能である点です。そして、相互にそれらのデータを連結することさえ可能です。これはただXMLの一般的な概念への序論にすぎません。 更なる研究に興味を持つ方々は書店で容易にXMLに関する本を入手することが可能です。 また、石井公成氏、師茂樹氏、クリスチャンウィッタン氏、および私自身は、興味を持っている皆さんに喜んで詳細な説明を行うでしょう。上記の例を使用して、XMLタグ付けに関する1つの例をご招待します。

 

-----------------------------------------------------------------

 

<entry ID="b6709-8986-7121-8a18" added_by="cmuller">

<hdwd>有覆無記</hdwd>

<pron_list>

<pron lang="zh" system="py" resp="cwittern">yǒufù wújì</pron>

<pron lang="zh" system="wg" resp="cmuller">yu-fu wu-chi</pron>

<pron lang="ko" system="hg" resp="cmuller">유복무기</pron>

<pron lang="ko" system="mc" resp="cmuller">yubok mugi</pron>

<pron lang="ko" system="mr" resp="cmuller">yubok mugi</pron>

<pron lang="ja" system="kk" resp="cmuller">ウフクムキ</pron>

<pron lang="ja" system="hb" resp="cmuller">ufuku muki</pron>

</pron_list>

<sense_area><trans resp="cmuller"><term lang="en">impedimentary moral indeterminacy (or "neutrality")</term></trans>

<sense resp="cmuller">One of the subdivisions of the class of moral indeterminacy (or "neutrality") <xref idref="b7121-8a18">無記</xref> among the hindrances <xref idref="b969c">障</xref> to enlightenment, and the complement of non-impedimentary moral indeterminacy (or "neutrality") <xref idref="b7121-8986-7121-8a18">無覆無記</xref>. Something that although not determinable as good or evil, has the contaminated aspect of impeding pure perception of reality, for example, the four manifestations of the view of self <xref idref="b56db-898b">四見</xref> that are associated with the <foreign lang="sa">manas</foreign> consciousness <xref idref="b672b-90a3-8b58">末那識</xref>. (Skt.  <term lang="sa">nivṛta-avyākṛta</term>, Tib.  <term lang="bo" system="wyl">bsgribs la lung du ma bstan pa</term>) 〔<xref idref="b745c-4f3d-8ad6">瑜伽論</xref> <biblScope source="T" div="num.vol.pg-col-line">T 1579.30.293a9</biblScope>; <cit><title><xref idref="b4e8c-969c-7fa9">二障義</xref></title><biblScope source="HPC" div="vol.pg-col">HPC 1.790c</biblScope></cit>〕</sense>

</sense_area>

<dictref>

<dict name="JE">323b/359</dict>

<dict name="Naka">86d</dict>

<dict name="FKS">2460</dict>

<dict name="DFB"/>

<dict name="BCS">0634</dict>

<dict name="MZ">(v.1-6)230c,2946a</dict>

<dict name="Oda">117-3*1693-3-18</dict>

</dictref>

</entry>

-------------------------------------------------

 

            上の例を見ると、タグのうちのある部分は見れば意味は明白ですが、ある部分は少し解かり難いかも知れません。ここで私が一番示したいところは resp="" の部分です。"resp" は英語の "responsible"の略で、「責任者」の意味です。要するに、一つの語彙の説明のうち、どれほど小さい部分についても、だれの責任なのか、つまり、誰がその情報を提供したかを示しているのです。上の例では、ウィッタンさんのピンイン読み方の提供以外、全部の責任は私ですが、DDBの中には様々の人がその言葉の読み方を提供し、そして様々な人が別な意味を提供した場合が多いのです。辞典をインターネット上、あるいは印刷出版する時、各情報の責任者は詳細に、または適當に決められますが、とにかく、これらの情報はいつも文章の裏に埋め込まれています。これこそ研究協力の本当の意味だと思います。

 

 

DDB のインターネット参照

 

ミュラー総合ホーム・ページ:http://www.human.toyogakuen-u.ac.jp/~acmuller

DDB 紹介 (英語): http://www.human.toyogakuen-u.ac.jp/~acmuller/dicts/ddb-intro.htm

DDB XML バージョン:http://www.acmuller.net

DDB digitalization についての論文: http://www.human.toyogakuen-u.ac.jp/~acmuller/publications-etc.htm#dictpapers

 



[1] DDB5,000語彙以上の梵語の術語索引は、現在、インターネットで利用できるものの中で最大です。

[2] このデータは"Composite Index of Buddhist Lexical Sources"と名づけられているが、協力のグループは花園大学の国際禅学研究所(主にUrs App, Christian Wittern, Michel Mohr), 台湾の中華佛教研究院(Christian Wittern), 東洋学園大学(Charles Muller), ソウルの高麗大藏經研究所(Hur In-Sub). このデータについて詳細な説明は http://www.human.toyogakuen-u.ac.jp/~acmuller/articles/ddb-ebti2001.htm に記載されています。ファイル・ダウンロードはhttp://www.human.toyogakuen-u.ac.jp/~acmuller/download/allindex.zip

[3] 私の両辞典は毎月、1,000,000アクセスを受けています。