インタビュー

Vol.10

文字文献とコンピュータの橋渡し(前編)

高田智和

2013.10.22

超漢字マガジンインタビュー第5弾(Vol.10)は、国立国語研究所で日本語の文字表記や漢字の情報処理について研究されている、新進気鋭の日本語学者、高田智和先生です。
前半は、日本語の文献研究の道に進むきっかけとなった、北海道大学でのエピソードを中心にお話をお伺いしました。

読書好きだった少年時代


――国立国語研究所は何を研究しているところなのでしょうか。

ひとつは、国語、日本語の研究です。われわれが話したり、聞いたり、読んだり、書いたりする、その言葉そのものの研究と、言葉と言葉を使う人との関わりの研究になります。昔からやっているのが方言の研究ですね。一口に「日本語」と言っても、地域によってバリエーションがたくさんありますから、そういった地域の言葉の研究です。それから、新聞や雑誌の言葉の研究です。皆さんが共通して読んだり書いたりする言葉がどう変わってくるのか、今どうなっていて、かつてどうなっていたか、についての研究ですね。具体的には、新聞や雑誌の語彙調査です。語彙調査をやると、文字も数えられるようになるので、文字頻度調査もやります。かつてはコンピュータがあまり発達していなかったので、手作業で頻度表を作っていました。どういう単語や文字がたくさん使われているのかを出して、それが別なところで利用されます。たとえば、常用漢字や教育漢字を選ぶ、あるいは日本語を母語としない外国人に対する日本語教育のときの基本語彙を選ぶ、基本度の高いものから教授していったほうがいいだろうという考え方がありますから、外国人にどういう言葉から教えていくか、という研究に役立てたりしています。最近は、危機言語の調査研究、現代日本語と日本語の歴史のコーパス開発、対照研究・類型論的研究に力を入れています。

もうひとつは日本語教育です。日本語教育と言っても、ここで外国人に授業をするのではなくて、教育のための基礎研究です。どういうふうに指導したらよいか、シラバスはどうするか、といった教師教育ですね。そうしたことをやってきたのが国立国語研究所です。

――研究所のウェブサイトを拝見すると、過去の言葉よりも、現代の生きている日本語を扱うことが多いということですが。

そうですね。方言も含めて、現代の日本語が中心ですね。昔は歴史的な研究をやっていたこともあるんですが、日本語の歴史をやっている研究者は、今はほとんどおりません。

――その中でも、先生は文献や文字をメインに研究されていますね。

私は「現代の日本語表記をやれるでしょう?」と言われて採用されたはずなんです(笑)。現代語もやりますけれど、もともとはそちらではなくて、古い本の文字とか表記を勉強していましたから。あまり時代を特定して研究をしているわけではないんですね。

――書いてあるものならなんでも。

そうそう。変遷をたどるわけですから。場合によっては木簡も見るし、対象が立川にある中世の板碑だったり、商店街にある看板の文字だったりとか。とにかく、読めれば扱います。でも文献を扱っているときが一番楽しいですね。古い文献を見ているときが楽しいんです。本が好きなんですね。

――昔から読書がお好きだったんですか。

本を読むのは好きでした。小説を読んでいましたね。推理小説とかをよく読んでいました。

――好きな作家とかは。

好きな作家は……新田次郎とか好きでしたよ。遭難する話(『八甲田山死の彷徨』)とか。あとは歴史小説が好きでしたね。

――今も息抜きに小説を読まれたりするんですか。

それがなかなかできなくて。ときどき電車や飛行機に乗って長時間移動するときには読みますけれど、普段は……活字離れですね。読まなくなりました。

――オンとオフで切り分けていらっしゃる。

仕事で文字ばかりみているので、オフでは見たくないんです(笑)。テレビもあまり見ません。

――では、情報とは隔絶されたオフをすごされているんですね。パソコンは見られますか。

パソコンでメールは見ますけれど、ほかはあまり見ないですね。天気予報くらいで。

文字研究のスタートは『三国志』


――最初に日本語や漢字に興味を持ったきっかけはなんでしょうか。

うーん……そもそも、大学に入るまで「国語学」という学問があるということを知りませんでした。漢字を研究しようなんて思いもよらなかったですね。まず、大学の授業で漢字が研究素材になるということを知ったということが大きかったんではないでしょうか。中学生や高校生のときに「これがやりたかった!」というわけではなくて、大学の演習で、漢字の形が時代で変わっていくのを実際の資料で見て、こういうのは面白いなと思って、じゃあもうちょっと勉強しようかなと、そのまま大学院に行って現在に至るということですね。

――ご出身の新潟から北海道大学に進まれた理由は。

特にないんです。行ってみたかったんですね、北海道に。北大の学生は、道外から来る人が半分くらいいるんですけれど、「行ってみたかった」という人はけっこういると思いますよ。

――ずっと新潟にはお戻りにならずに?

はじめは4年で帰るつもりだったんです。両親にも「4年でちゃんと戻ります」と言っていたんですが、戻りもせずに10年いて、そのあとは国語研究所に来て8年目です。

――居心地が良かったんですね。

居心地は悪くはなかったですね。だめな人はだめみたいですけど。寒さが厳しいですから。

――新潟の寒さと北海道の寒さは違いますよね。

全然質が違いますね。本当に寒かったですね。でも住んで大丈夫な寒さです。

――大学では池田(証寿)先生の指導を受けられていたのですか。

そうですね。池田先生と石塚(晴通)先生です。

――ではそのお二人の指導で文献研究の道に進まれたと。

石塚先生は文献学と漢文訓読、池田先生は古辞書が専門です。それから当時は、池田先生がコンピュータの漢字の文字コード規格の拡張開発に携わっていたころで、とにかく漢字コードに足りない漢字を見つけて追加するんだと熱心に活動していました。池田先生は当時40代前半でしたから、国語学者として社会的な使命を果たそうとされていたわけですね。私の受けていた池田先生の授業は「当時のJIS漢字であらわせない漢字の中で必要そうなものを探してくる」というのがテーマだったんです。今の大学の授業だったら考えられませんが、どこから探してこいという指示もないんですね。私が学生のころの先生というのは、細かな説明をされないんですね。自分で感じ取れということなんです。今はそういう教育はあまり喜ばれないのでしょうけれど。

レポートは「JIS漢字にない漢字で必要そうなものを探してきて、JISの委員会に追加提案するための提案書を書く」というもので、それが実際に採用されるかどうかは別の話ですが、大学の3年か4年のときに実際に書きました。私は三国志の登場人物、武将の名前を調べました。調べたのは吉川英治の『三国志』と、岩波書店の『三国志演義』。それからコーエーというゲームソフトの会社がありますよね。私のころはファミコンの時代ですが、コーエーの「三国志」の最初のころですね。そこに武将の名前が出てきます。最初はカタカナだったのが、いつの間にか漢字が使われるようになって、そこで子供は三国志の武将の名前を漢字で覚えるんですね。三国志の武将は中国人の名前ですから、JIS漢字であらわせない漢字が出てくるので、吉川『三国志』、岩波『三国志演義』、コーエーの「三国志」から漢字を拾って三つ並べて、「字形が安定している」とか「共通して出てくる」とかという基準で測って、その中でも特に重要そうなものを出して、提案するというようなことをやりました。

――そのころの成果がもとになって、JISの第3水準や第4水準ができたのですね。

もちろん三国志だけじゃないですけどね。岩波書店から出ている『国書総目録』という、明治時代より前に刊行されたり書写されたりした日本の本の一覧があるんですが、先生の授業では、その中からJIS漢字であらわせない漢字を全部拾ってくるということもされていて、そのうちのいくつかが採用されました。私の修士論文は、『国書総目録』の書名を全部調べて、その中で諸橋大漢和辞典にない漢字がどういう性格のものなのか、というのを書きました。だから、北海道にいた最初のころはコンピュータにない漢字と格闘していましたね。


* TRON は "The Real-time Operating System Nucleus" の略称です。BTRON は "Business TRON" の略称です。
* TRON、BTRON、は、コンピュータの仕様に対する名称であり、特定の商品を示すものではありません。
* 超漢字はパーソナルメディアの商標です。「超漢字」については、「超漢字ウェブサイト」をご覧ください。
* 本文中のExcelはMicrosoft Excel、WordはMicrosoft Wordを示します。
* Microsoft、Microsoft Excel、Microsoft Wordは、米国 Microsoft Corporation の、米国およびその他の国における登録商標または商標です。
* その他ハードウェア名、ソフトウェア名などは各メーカーの商品、商標または登録商標です。
* なお、本文中では、®、™、© の表示を明記しておりません。

▲PAGE TOP