インタビュー

Vol.11

文字文献とコンピュータの橋渡し(後編)

高田智和

“アメリカに渡った『源氏物語』”の研究


――先生ご自身の研究についてお伺いしたいのですが、一番好きなのはいつの時代のどんな研究なんでしょうか。

最近は古典籍の調査をしているときが楽しいです。昔から本は好きでしたけど、最近は写本や版本を開くのが好きですね。訓点資料とか、源氏物語とか。殺伐とした文字関係の委員会に参加している反動で、古典籍を開いていると「いいなぁ」と思えるんでしょうね。ですから調査の機会があればできるだけ参加するようにしています。国語研究所にも和本があるので、その書誌を取るのは楽しくていいですね。

国語研究所では、アメリカ議会図書館所蔵の『源氏物語』の調査をしています。これは今まで日本では知られていなかった新しい資料で、古書市場に出ていたものをアメリカ議会図書館が買ったものです。日本では所蔵者の財産権が重視されるので、原本の画像を手に入れるのは難しいのですが、アメリカ議会図書館は「アメリカ合衆国が買ったものなのだから、全人類の財産である」と公開してくれました。著作権法の保護から外れていれば、公開するのがアメリカ流です。この本は54冊全部揃っていますが、公開をお願いしたのはその中の桐壺・須磨・柏木です。これは文字だけの資料なのでアメリカ議会図書館の中で画像化の優先度が高くありませんでしたが、研究に必要と要望したところ公開の優先度が上がりました。それで画像をもらってきました。アメリカ議会図書館でも画像を公開していますが、国語研究所では付加価値をつけて、原本の画像と翻字を左右に並べて表示できるようにしました。研究者が研究のために使うデータではなく、古典を写本で読みたい人、変体仮名や崩し字を学びたい人が使うツールとして作ってみました。

米国議会図書館蔵『源氏物語』画像(桐壺・須磨・柏木) (国立国語研究所)

これは岡山の「コンテンツ」という会社のビューワを使っています。原本の画像と翻字が並んでいるので、変体仮名や崩し字に慣れていない人やこれから学習したい人が自分で勉強できるようになります。答えがあるので読む練習に使えますし、大学の授業でも使えると思います。原本と翻字がただ並ぶツールは、意外と今まであまりなかったんです。紙の冊子だとありますが、デジタル的に左右連動して動くというのはなかったので、アメリカ議会図書館からも、「自分たちだけでは読めないので、翻字が並べてあるだけでもありがたい」と言われました。ただ並べて読むだけで、原本も翻字も両方とも画像なので、検索もできません。ページは選べますけれど、「頭から読んでください」「辞書は自分で調べてください」と、何も与えていません。こういうタイプのデジタルコンテンツもあっていいんじゃないかと思います。今は桐壺だけを試験公開していますが、須磨と柏木も今年中には公開する予定です。

また、こちらでは翻字本文の全文を公開しています。

米国議会図書館蔵『源氏物語』翻字本文 (国立国語研究所)

最初S-JIS版だけで公開していたら、アメリカ議会図書館から「文字化けして見られません」と言われて……当たり前ですよね(笑)。それでUTF-8版と英語版ページも用意して公開しました。アメリカ議会図書館に調査に行ったとき、恐る恐る「ネットで翻字を公開してもいいですか?」とお願いしました。そうしたら「どうぞやってください」と。日本では本で出版ならいいけどネットはだめということもありますので、驚きました。これは3年間くらいやっている仕事で、全巻の翻字ができたので、こんどは画像と繋ぐ作業をしています。

――日本で普及している源氏物語との異同もありましたか。

源氏物語の本文の系統には、青表紙本と河内本、どちらでもない別本という分け方があって、青表紙本や河内本とは違う、いわゆる別本という判定になろうかと思います。

景観文字の研究


看板の文字の調査もしていますが、まだ試行錯誤です。景観文字には、たぶん社会の何かが反映されていると思いますが、いかんせん測り方から試行錯誤の段階です。ある通りの中でばっと見たときに、文字量がどのくらいなのかを調べてみたいです。人間は歩いている目の高さのところに目がいくのか、ちょっと上なのか、でもビルの屋上は見ないだろうとか、車で走っていれば見える範囲も違うだろうとか、そこにあるものの文字量と、通っている人が目にする文字量がたぶんずれています。文字の大きさなども考慮しないといけないだろうし、いろいろと変数があるので、まずそこを考えないといけないですね。そもそも全部を記述する方法がない。写真には撮れる、映像にもできる、ではそれをどう記述すればよいか、というのも課題です。通りの文字は、今まで計量的にあまり扱われていません。でも、人間の言語生活には大きな影響があるはずです。たとえば通学路に文字があったら子供が覚えるかもしれませんよね。文字の伝承や学習という面できわめて大事なものだと思うので、基礎研究をしたいんですが、まだ考えがまとまりません。

――外国の方が日本に来ると身近にある文字から学ばれるということなので、看板やマンションにある文字というのは優先順位が高くなりますね。

あとはテレビのテロップでしょうか。国語研究所は今まで新聞や雑誌を調べていましたけれど、現代の文字表記を素材とするならば、これからはそれ以外のメディアも調査していったほうがいいです。文字の頻度調査というのは、コンピュータが登場してやりやすくなったとはいえ、実際にやる人はほとんどいません。コーパスができれば簡単に数えられますが、コーパスでまだ扱わないところでも基礎調査が必要なものがあって、それが景観やテレビのテロップだと思います。

――新聞や雑誌を自宅で読む人が減ってくると、それ以外に活字と接する機会は画面上のものがメインになってきます。

画面か屋外になってきますね。画面上のもの、インターネットのウェブページだったら言語処理の方が調べているでしょうから、簡単に調べられないものを調べるのが国語屋なのかなと思います。ほかに研究される方がいらっしゃらないものを調べないと面白くないでしょう、ということで、景観文字の方法論を今考えているところです。

▲PAGE TOP