詳細編:収録している文字の種類
超漢字検索で検索できる文字セットについて説明します。
- (1)JIS第1水準・第2水準(JIS X 0208)相当の6,879文字
-
JIS(Japanese Industrial Standards:日本工業規格)で制定している、漢字6,355文字(第1水準2,965文字、第2水準3,390文字)、非漢字524文字です(JIS X 0208:1997)。これらは通常のコンピュータで利用できる文字です。
†本ソフトウェアは、JIS第1水準・第2水準の文字は「日本基本」の第1面に、黒色で表示されます。
- (2)JIS第3水準・第4水準(JIS X 0213)相当の4,344文字
-
JIS第1水準・第2水準(JIS X 0208)を拡張して、現代日本語をコンピュータで扱うために十分な文字集合を提供することを目的に設計された規格です(JIS X 0213:2000)。漢字3,685文字(第3水準1,249文字、第4水準2,436文字)、非漢字659文字からなります。丸付き数字やローマ数字、およびユーロ記号をはじめとする単位記号なども含まれています。
†本ソフトウェアでは、JIS第3水準の文字は「日本基本」の第1面に水色で表示されます。JIS第4水準の文字は「日本基本」の第2面に表示されます。
†本ソフトウェアでは、JIS X 0213:2004には対応していません。
- (3)JIS補助漢字(JIS X 0212)相当の6,067文字
-
社会の中で広くコンピュータが使われるように従って、JIS第1水準・第2水準の6,355文字の漢字だけでは、漢字が不足してきました。そこで1990年に、JIS X 0208 とは別に、漢字5,801文字と追加アルファベットなどの非漢字266文字が、JIS補助漢字(JIS X 0212-1990)として制定されました。英語以外のラテン系各言語で利用される文字も含まれ、これらの文字を用いると、 ヨーロッパ系のかなり多くの言語を表記できます。
†本ソフトウェアでは、JIS補助漢字を「日本補助」と表現します。
- (4)韓国語(KS X 1001)相当の8,224文字
-
KS X 1001(以前の呼称では KS C 5601)とは韓国国内の文字セットの規格であり、ハングルと韓国語の漢字が含まれます。日本語のひらがなやカタカナも含まれています。JIS X 0208と同様に94区94点で構成されていますが、効率よくコードを割り当てるため、94個の文字を126個単位になるよう詰めて配置しています。元のコードで文字が定義されていない空き領域もそのまま移行しています。
†本ソフトウェアでは、韓国語を「韓国」と表現します。
- (5)中国語簡体字(GB 2312)相当の7,445文字
-
GB 2312 とは中国国内の文字セットの規格であり、簡体字(simplified Chinese)を中心に、中国本土で常用的に用いられている文字を集めたものです。漢字が主体ですが、日本語のひらがなやカタカナも含まれています。JIS X 0208と同様に94区94点で構成されていますが、効率よくコードを割り当てるため、94個の文字を126個単位になるよう詰めて配置しています。元のコードで文字が定義されていない空き領域もそのまま移行しています。
†本ソフトウェアでは、GB 2312部分を「中国基本」と表現します。
- (6)中国語簡体字(GB 18030)相当の634字
-
GB 18030 とは中国国内の文字セットの規格であり、その一部に対応しています。
†本ソフトウェアでは、GB 18030部分を「中国拡張」と表現します。
- (7)中国語伝統字(CNS 11643, Big5)相当の13,491文字
-
CNS(あるいはBIG5)とは、中国語のうち、主に香港や台湾で用いられている文字セットの規格です。伝統字あるいは繁体字(Traditional Chinese)と呼ばれ、日本の旧字体に近い字形です。
†本ソフトウェアでは、中国伝統字を「台湾」と表現します。
- (8)点字の320文字
-
六点点字の64文字と八点点字の256文字が含まれます。
†本ソフトウェアでは、それぞれ「六点点字」および「八点点字」と表現します。
- (9)iモード絵文字の271文字
-
NTTドコモのiモードメールやiモードサイトで使われる、iモード絵文字です。
†本ソフトウェアでは、iモード絵文字を「iモード」と表現します。
- (10)GT書体フォントの78,675文字
-
GTプロジェクトによって蒐集された19万文字の中から精選した78,675文字の文字セットです。GTプロジェクトとは、正式には日本学術振興会の未来開拓学術研究推進事業による「マルチメディア通信システムにおける多国語処理の研究」プロジェクトという名称であり、GT書体フォントはその中心的な成果です。またGT書体フォントはコンピュータ上にテキストを蓄積することを目的として設計され、特に筆画がわかるようにデザインされています。
†本ソフトウェアでは、「GT」と表現します。
- (11)大漢和辞典収録の51,053文字
-
諸橋轍次著 大漢和辞典 修訂第二版(大修館書店刊)に収録されている文字です。
†本ソフトウェアでは、「大漢和」と表現します。
- (12)トンパ文字の1,362文字
-
トンパ文字は、中国雲南省のナシ(納西)族の間で使われている、世界で最後の生きている象形文字と言われている文字です。
†本ソフトウェアでは、トンパ文字を「トンパ」と表現します。
- (13)濁点付きひらがな・カタカナ(略称:濁点仮名)の204文字
-
マンガなどに見られる「あ゜」「め゛」などの文字です。
†本ソフトウェアでは、濁点付きひらがな・カタカナを「濁点仮名」と表現します。
- (14)住民基本台帳収録変体仮名(略称:住基仮名)の168文字
-
変体仮名は、現在使われているひらがなの前身にあたるものです。住基仮名は、住民基本台帳に収録されている変体仮名です。現在でも人名や地名に使われています。
†本ソフトウェアでは、住民基本台帳収録変体仮名を「住基仮名」と表現します。
- (15)変体仮名の545文字
-
平安時代から使われてきたひらがなの種類です。明治維新後に現在のひらがなの五十音図が作成されてからは利用される機会が少なくなりましたが、老舗旅館やそば屋の看板などに見ることができます。
†本ソフトウェアでは、変体仮名を「変体仮名」と表現します。
- (16)Unicode基本多言語面の漢字以外の6,475文字
-
Unicodeの基本多言語面(BMP - Basic Multilanguage Plane)で定義された文字セットのうち、漢字やハングル等を除く部分です。漢字圏以外の各国の言語(アラビア語、タイ語など)で使用される文字や、漢字以外の記号類が多数含まれます。なお、漢字の部分(CJK統合漢字、Hangul Syllables、CJK互換漢字)に関しては、TRONコードでは、除いてあります。
†本ソフトウェアでは、「各国」と表現します。
- (17)序数記号の90文字
-
見出しや箇条書きの連番に利用できる記号類です。
†本ソフトウェアでは、「序数」と表現します。
- (18)陰陽五行文字の86文字
-
陰陽道で利用されていた文字や記号です。
†本ソフトウェアでは、「陰陽五行」と表現します。
- (19)ホツマ文字の154文字
-
ホツマ文字は、「秀真伝」の表記に使われている文字です。神代文字の1つとされています。
†本ソフトウェアでは、「ホツマ」と表現します。