Windows 8のUnicode IVSに対応した
「超漢字検索 IVS強化版」を新発売
- 検索した異体字をWordやExcelに貼り込み可能 -
2012年12月11日
パーソナルメディア株式会社
〒141-0031 東京都品川区西五反田1-29-1 コイズミビル
TEL: 03-5759-8305 FAX: 03-5759-8306
E-mail: sales@personal-media.co.jp
http://www.chokanji.com/ckk/
ソフトウェアメーカーのパーソナルメディア株式会社(代表取締役:松為彰、本社:東京、電話:03-5759-8303、資本金 1,000万円)は、約18万字(*1)の漢字や文字から目的の文字をすばやく検索できる「超漢字検索」に、Unicode IVS(*2)への対応機能などを追加した「超漢字検索 IVS強化版」の開発に成功し、2013年2月1日より自治体、官公庁、行政機関および一般企業などの法人向けにご提供を開始します。また、12月12日(水)~14日(金)に東京ミッドタウンで開催される「TRONSHOW2013」の当社ブース(ブース番号:B-3)にて、本製品のデモンストレーションを行います。
「超漢字検索」は、トロンのOS「超漢字」の技術を活かしたWindows用の総合文字検索ツールです。漢字の読みや画数はもちろん、漢字の一部(*3)や異体字、それらの組み合わせなど、漢字を見て直感的に得られる情報を検索キーとして、186,487字(*1)の漢字、文字、記号などの中から、目的の文字を簡単に見つけ出すことができます(*4)。しかしながら、従来はWindows側で利用可能な文字種の制限により、Unicodeで表現できない異体字については、Wordなどの文書に文字として入力できないという制約がありました(*5)。
このような状況に対して、Unicodeにおいても漢字の異体字をコード化して扱うためのIVS(*2)という機能が導入され、2012年10月に発売されたWindows 8をはじめとして、最初からこの機能に対応済みのOSやアプリケーションが増えてきました(*6)。さらに、IVSに対応した多数の異体字を含む多漢字の文字フォントとして、2011年10月より独立行政法人情報処理推進機構(IPA)が「IPAmj明朝フォント」(*7)の無償公開を始めています。こういった経緯により、Windows上においても、外字の利用や文字の画像化を行うことなく多数の異体字を系統的に扱える環境が整ってきました。
このたび発売する「超漢字検索 IVS強化版」は、好評発売中の総合文字検索ツール「超漢字検索」をUnicodeの異体字シーケンス(IVS)に対応させ、検索した異体字の貼り込みを可能とした機能強化版の文字入力ツールです。「IPAmj明朝フォント」がインストールされたパソコンにおいて、超漢字検索により検索した5万字以上(*8)の漢字や異体字を、メモ帳、Word、ExcelなどのWindowsアプリケーションに文字として貼り込んでご利用いただけます。「超漢字検索 IVS強化版」と「IPAmj明朝フォント」により、異体字の検索や入力の操作が大幅に効率化できるのに加えて、これまで人名用異体字などを扱うために必須だった外字の多くが不要となり、外字の作成や維持にかかるコストも削減できます。
このほかパーソナルメディアでは、お客様が既に利用されている外字と「IPAmj明朝フォント」のどちらも検索可能なカスタマイズ版の超漢字検索や、お客様の外字を使った既存データからUnicode IVSを使った互換性の高いデータへの外字変換システムなど、お客様のご要望に応じて、異体字や外字、多漢字に関わる多様なソリューションを提供して参ります。
- (*1)
- 「超漢字検索」で扱える文字は、大漢和辞典に収録されている約5万字のほか、住基ネット用の文字を含む多数の人名用異体字、変体仮名、中国簡体字や中国伝統字、ハングル、Unicodeに含まれる世界各国の文字や記号などを含み、その総数は186,487字になります(表1参照)。ただし、この文字数は、複数の文字コード規格に含まれる同一字形の文字を重複して数えています。同一字形の文字の重複を除いた場合の総文字数は、約10万字です(同一字形の解釈によりこの数は変動します)。
- (*2)
- Unicode IVS(Ideographic Variation Sequence: 異体字シーケンス)とは、Unicodeにおいて、漢字の異体字をコード化して扱うための規格です。
- (*3)
- 「超漢字検索」では、部首はもちろんのこと、部首以外の漢字の構成部品や、それらの組み合わせを検索キーとして指定できます。そのため、漢字や部首に関する知識を持たない方でも容易に使いこなすことができます。たとえば、紙の辞書で「嶋」という字を探す場合、部首の知識がないと、「山」「鳥」のどちらの部首に掲載されているか迷いますが、「超漢字検索」では単純に「山 鳥」の両方を検索キーとして指定できます。
- (*4)
- 「超漢字検索」を開発するにあたり、その操作効率を高めるため、パーソナルメディアでは被験者12名を対象とした文字入力の実験を行ないました。実験では、知らない漢字を検索して入力する際のユーザの操作を観察、記録してその行動を解析し、効率の高い文字検索方法について検討いたしました。この実験により、たとえば、漢字の部品や異体字をキーとした検索の効率が高いのに対して、画数による検索は効率が悪く、補助的な利用に留まることが分かりました。こういった成果とノウハウが「超漢字検索」に反映されています。
- (*5)
- Windows側のアプリケーションによっては、超漢字検索で検索した文字を画像化して貼り込むことが可能であり、この場合は利用可能な文字種の制限はありません。しかし、他の通常の文字と比較して書式や大きさが揃わなかったり、検索やデータベースへの入力ができないといった問題があります。メモ帳など、画像の貼り込みができないアプリケーションもあります。このほか外字として貼り込む方法もありますが、外字の場合は他のPC環境やクラウド上で扱えず、利用可能な外字の総数に制限があります。
- (*6)
- Windows 7、Microsoft Office 2007、Office 2010などにおいては、IVS対応のための追加プログラムである "Unicode IVS Add-in for Microsoft Office" をダウンロードしてインストールすることにより、IVSの機能が利用可能となります。
IVS Add-inのダウンロード http://ivsaddin.codeplex.com/ - (*7)
- 「IPAmj明朝フォント」とは、経済産業省の委託事業である「文字情報基盤構築に関する研究開発事業」の成果として公開された多漢字の文字フォントであり、「戸籍統一文字」の55,270字や「住民基本台帳ネットワークシステム統一文字」の19,563字など約6万字の漢字を含んでいます。「IPAmj明朝フォント」の利用により、従来は外字を利用していた人名、地名などの異体字に対して共通のコードを与えることができ、異体字を含むテキストデータの互換性や流通性の向上、これまで自治体などが個別に行っていた外字の作成や管理などの維持コストの削減が期待されています。
IPAmj明朝フォント http://ossipedia.ipa.go.jp/ipamjfont/download.html - (*8)
- このうち、Unicode IVSの機能を使って貼り込める文字は約3,000字です。この文字数は、今後のデータウェアの整備により増やしていく予定です。このほか、UnicodeのExtension AおよびExtension Bとして貼り込める漢字と、Unicode 2.0のCJK漢字として貼り込める漢字が含まれます(Unicode 2.0のCJK漢字は、従来から販売している「超漢字検索」でも貼り込み可能です)。
「超漢字検索 IVS強化版」の特長
- メモ帳、Word、ExcelなどのWindowsアプリケーションで扱う文書の中に、超漢字検索で検索した多漢字や異体字を文字として貼り込めます。5万字以上の漢字に対応済であるほか、今後のデータウェアの整備により、対応可能な漢字を増やしていきます。
- Windowsの文書中に貼り込まれる多漢字や異体字は、Unicode IVSの機能を用いてコード化されます。外字ではないので、環境が変わっても文字化けせず共通に利用でき、多漢字や異体字を含むデータの互換性や流通性の向上が期待できます。
- 「IPAmj明朝フォント」に対応しており、このフォントがインストールされたWindows 8などの環境で利用可能です。
- 漢字の読みや画数はもちろん、漢字の一部(*3)や異体字、それらの組み合わせなどを用いた、直感的で分かりやすい操作による漢字の検索が可能です。文字検索機能の使いやすさについては、好評発売中の「超漢字検索」や10年以上の販売実績をもつ「超漢字」シリーズの文字検索機能を踏襲したものであり、多くのお客様からご好評をいただいております。
- 自治体、官公庁、行政機関や、人名用異体字を多く扱う一般企業、法人のお客様におけるご利用を想定したカスタマイズ版の開発やご提供も可能です。たとえば、お客様が既にお持ちの外字などを検索対象文字として追加することにより、お客様の文字環境に最適な多漢字、異体字の入力ツールをご提供いたします。Linuxなど他のOSへの移植も承ります。
図表
- 図1.
- 「超漢字検索 IVS強化版」の漢字検索画面
- 図2.
- 文字情報画面で異体字のコードを表示(1)
- 図3.
- 文字情報画面で異体字のコードを表示(2)
- 図4.
- Word文書に異体字を貼り込んだ例
- 図5.
- Excelのシートに異体字を貼り込んだ例
- 図6.
- Word文書内の異体字の文字情報や異体字のコードを表示した例
表1 超漢字検索IVS強化版で扱える文字数
文字種および規格名 | 文字数 | 備考 |
---|---|---|
JIS第1水準・第2水準(JIS X 0208) | 6,879 | |
JIS第3・第4水準(JIS X 0213:2000) | 4,344 | |
JIS補助漢字(JIS X 0212) | 6,067 | |
韓国漢字・ハングル(KS X 1001) | 8,224 | |
中国基本(簡体字 GB 2312) | 7,445 | |
中国拡張(簡体字 GB 18030) | 634 | GB 18030の一部対応 |
中国伝統字(CNS 11643) | 13,491 | |
六点点字および八点点字 | 320 | |
iモード絵文字 | 271 | |
GT書体フォント | 78,675 | 日本学術振興会の未来開拓学術研究推進事業「マルチメディア通信システムにおける多国語処理の研究」プロジェクト。東京大学多国語処理研究会。http://charcenter.t-engine.org/tfont/about_gt.html |
大漢和辞典収録文字 | 51,053 | 大漢和辞典 諸橋轍次著 大修館書店刊。超漢字検索には大漢和辞典の修訂第二版の親字として掲載された文字をすべて収録しています。 |
トンパ文字 | 1,362 | |
変体仮名 | 545 | |
住基仮名 | 168 | |
濁点仮名 | 204 | |
Unicode 2.0の非漢字の一部 | 6,475 | ラテン、アラビア、ギリシア、キリール、アルメニア、デーヴァナーガリー、ベンガル、グルムキー、グジャラーティ、オリヤー、タミル、テルグ、カンナダ、マラヤーラム、タイ、ラオス、チベット、グルジア、IPA発音記号、記号・マーク、他。 |
その他の記号・文字 | 330 | 陰陽五行文字、序数記号、ホツマ文字 |
合計 | 186,487 |
※ このうち、Windowsアプリケーションに文字として貼り込み可能な文字数については、(*8) をご覧ください。
超漢字シリーズと超漢字検索
「超漢字」(http://www.chokanji.com/)は、トロンプロジェクトの成果の一つとして開発された、パソコン用のBTRON仕様OSです。18万の漢字や文字をどこでも自由に使える多漢字機能などの特長があります。「超漢字」は1999年に発売された後、「超漢字2」「超漢字3」「超漢字4」とバージョンアップを重ねながら、多くのお客様にご利用いただき、高い評価をいただいてきました。最新版の「超漢字V」はWindows上の仮想マシンで動くTRONとして、従来の多漢字機能だけでなくWindows上のアプリケーションとの連携を強化した機能を追加しています。
この「超漢字」上で永年蓄積した多文字の技術とノウハウを活かした、他OS用の文字検索ソフトウェアが「超漢字検索」です。Windows版およびLinux版のほか、2012年にはAndroid版をリリースしており、ご利用環境にあわせてお使いいただけます。
参考情報、リンク集
- 超漢字ウェブサイト
- http://www.chokanji.com/
- 超漢字検索 Windows版、Linux版
- http://www.chokanji.com/ckk/
- 超漢字検索 Android版 (超漢字検索Pro、無料アプリ版)
- http://www.chokanji.com/ckk/android/
- 超漢字マガジン
- http://www.chokanji.com/magazine/
- パーソナルメディア株式会社
- http://www.personal-media.co.jp/
- TRON は "The Real-time Operating system Nucleus" の略称です。
- 超漢字はパーソナルメディア株式会社の商標です。
- Windows, Word, Excel は米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です。その他の商品名などは、各社の商標または登録商標です。
- 本資料に記載された製品の仕様、画面イメージなどは、発表日現在のものです。最終的に販売される製品では、製品改良などのために変更されることがありますので、あらかじめご了承ください。ご購入の際は、最新情報をご確認ください。