GB 18030-2022が来た!概要編—表紙から読み取る情報〈エリックの多言語文字散歩〉
時は2023年、夏。中国の文字界隈でもっともホットな話題は、新しいGB 18030-2022の施行でしょう。
みなさんも、いよいよGB 18030-2022が2023年8月1日より施行されるという話を聞いたことがあるかもしれませんが、実際にどのような内容で私たちにどのような影響があるか、ご存知ない方もいらっしゃることでしょう。
そこで、GB 18030-2022について概要編と詳細編の2回に分けて解説していきます。
今回はGB 18030-2022の概要編として、中国から入手した本物のGB 18030-2022の規格書の表紙をじっくり見るところから、解説を始めたいと思います。
そもそもGBってなに?
GB 18030の話題を始める前に、そもそも「GB」とはなにかについて簡単に解説しておきましょう。GBとはズバリ、中国の国家標準[※1]のことです。日本の規格である「日本産業規格」では、英語のJapanese Industrial Standardsの頭文字を取って「JIS」と呼びます。一方、中国の「国家標準」は英語ではなく中国語発音のピンイン表記であるGuójiā Biāozhǔnの頭文字から取ってGBと呼びます。なじみのない発音に最初は戸惑うかもしれませんが、由来を知ればしっくりときますね。
GBのロゴデザインは昔ながらの彫刻風で、精密さが感じられます
[※1] 本記事中では「標準」と「規格」を明確に区別していませんが、「標準」は「規格」より広義の概念になります。
参考:標準とは(日本規格協会)
番号に潜む情報
国家標準についてまず押さえておきたいのは、強制力の有無によって「強制標準」「任意標準」に分類できる、ということです。
GBの場合は、強制力の有無をはっきりさせるため、番号表記を用いて強制力を判別できるようになっています。強制標準は単なるGBと表記するのに対し、任意標準はGB/Tと表記します。これは「推奨」を意味する中国語「推荐」(tuījiàn)の頭文字Tから取られています。
この基本的な知識をもとに、もう一度今回のトピックであるGB 18030-2022を見てみましょう。このGB番号にはTが付いていないので、強制標準であることがわかりますね。
そして、GB 18030という番号の後ろに2022という数字があります。表紙の下部にも記載されていますが、公布されたのは2022年7月19日で、施行されたのは2023年8月1日で、1年間の猶予期間がありました。
このGB 18030-2022は、今回で第3次規格となります。これまでのGB18030の歴史を少しおさらいしましょう。
やはり一番目立つのは、更新するたびに増加した漢字の数でしょう。漢字の国でもあり、漢字の国際規格「CJK統合漢字」に収録されているすべての漢字に対して、GBの文字コード(文字をコンピュータ上で取り扱うための識別番号)を割り当てています。つまり、世界中すべての漢字を表示できるようにする方針です。
ちなみにCJK統合漢字の「CJK」はChinese、Japanese、Koreanの頭文字から来ています。
表紙に記載された「代替 GB18030-2005」の通り、2023年8月からは第2次規格のGB18030-2005は廃止され、代わりに第3次規格、つまりこの最新のGB18030-2022への準拠が必須となります。
デジタル化で浮き彫りになった文字の問題
中国語の利用者からすると、GB18030-2022の施行を待ち望んでいた人は多いかもしれません。というのも、上記の表を見ると気づくかと思いますが、第2次規格と第3次規格の間は17年もの期間が空いていたのです。
この17年間に、中国社会ではキャシュレスを初めとした生活のデジタル化が一気に進み、文字を必要とする社会活動は目まぐるしく変化してきました。人名や地名をコンピュータで入力する機会が増える一方で、文字コードに存在しない文字「外字」を多用することにより、情報のやり取りに不具合が生じる「外字問題」などは深刻な社会問題になり、人々の関心を集めていました。
特に中国は2013年に、現代の社会生活に通用する漢字の一覧として、8105字の漢字表『通用規範漢字表』を発表しました。しかし、文字コードとしてはGB18030の第2次規格では対応し切れていませんでした。今回の第3次規格で文字コードとしても、通用規範漢字表に完全対応できるようになったのです。
例えば、日本にも話題になった原子番号113の元素、その名前がニホニウム(Nh)に決まったのは2016年でした。翌年の2017年、中国語の正式名称が
決まりました。
この文字は2018年になって初めてUnicodeに収録されますが、GB18030は未更新のままでした。新しい元素が発見される一方で、それを表記する漢字は既存の漢字ではなく、新しい漢字を作る必要があります。そのため、中国語で完全な元素周期表を表示させることは簡単ではないのです。
このように、日々変わる生活や技術に対応するため、GB 18030という文字セットを更新し、さらに強制力を持たせて普及させることが中国にとって急務だったのです。
あれも中文、これも中文
GB 18030-2022の正式な規格名は『GB 18030-2022 信息技术 中文编码字符集』となります。あえて日本語に翻訳するとすれば「情報技術 中国語符号化文字集合」でしょうか。
翻訳すると、中文は中国語と訳されますが、多民族かつ多言語国家である中国では「中国语」という言葉はありません。日本で「中国語」と呼ばれる言語は、中国では「汉语(漢語)」と呼ばれ区別されています。
GB 18030の規格名にある「中文」とは広義的に「中国で使う文字」であり、中国語の漢字だけではなく、日本で使われる漢字やハングル、モンゴル文字、中国の少数民族が使う文字なども含まれています[※2]。
ニュースやWebサイトで、GB 18030の解説文に「GB 18030は中国が制定した、簡体字中国語の文字コードである」と見かけますが、これは厳密には誤りになり、簡体字中国語だけではありません。現代中国における、情報交換に必要なあらゆる文字を網羅しているのです。
[※2] 国家标准GB 18030-2022《信息技术 中文编码字符集》理解与使用(NITS): http://www.nits.org.cn/index/article/4046
使用が義務づけられている製品
GB18030は文字コードの標準ですから、パソコンから電子書籍リーダーなどのハードウェアにも必要となりますし、文字を扱うソフトウェアまで、あらゆる場面で必要になります。中国国内で流通する製品が対象となりますが、日本から輸入されるものでも例外なく準拠していることが義務づけられています。
ここでよく見落とすのは、表紙の一番下に記載されたGB18030の公布機関です。「国家市場監督管理総局」と「中国国家標準化管理委員会」のふたつの機関の連名となっています。標準ですので中国国家標準化管理委員会が入っているのは当たり前ですが、もう一つ、国家市場監督管理総局があります。
国家市場監督管理総局には、行政側として不定期に市場に流通している商品に対して抜き打ち検査を行い、適合性をチェックしたり、行政指導したりする、といった役割があります。規格がきちんと施行され守られているかを確認するのです。こうした面からも規格への遵守が重要であることがわかるでしょう。
中国語フォントにおいてGB18030に準拠することは必要となりますが、一方で「適合検査に合格すること」については推奨であり義務づけられているわけではありません。もちろん適合検査に合格すれば、それはGB18030へ適合した証となり、検査していない製品と差別化ができるでしょう。そのような意味から考えても「ヒラギノ角ゴ 簡体中文」の2書体(W3/W6)は、中国电子技术标准化研究院(CESI)が実施する適合検査に合格したため、中国国内で組込み用フォントとして安心して使用できるといえます。
なんと、表紙を読むだけでこんなに長文になってしまいました。次回の詳細編では、いよいよ表紙をめくって気になるGB 18030-2022の内容へ入っていきます!
著者プロフィール
エリック・リュウ
中国生まれ、東京在住。The Type編集者、W3CのInvited Expertとして「中国語組版要件」議長担当。ニューヨークTDC顧問理事。日中韓を始めファンドリー数社の多言語書体プロジェクトでコンサルタントを務める。著書に『孔雀プロジェクト:中国語組版考え方の再建』、訳書に小林章氏の『欧文書体』『欧文書体2』など多数。