中国国家標準(GB)漢字の出現頻率
- 下記、出現頻率は一般出版物を対象としたものです。汎用的用途の場合には、GB規格等に準拠したフォントセットをご利用ください。
- ハードやシステムの都合で、わずかなコード範囲しか使用出来ない場合も、「セレクト多言語基本セット」システムなら、 余裕をもってご採用いただけます。
中国現代漢字出現頻率大致如下:高頻1,000字,占一般出版物的複盖率為90%;毎増加1,400字,増加複盖率十分之一:
字数 | 出現頻率(%) | コード規格(出現文字のみ) |
---|---|---|
1000 | 90 | |
2400 | 99 | |
3800 | 99.9 | 接近(GB1級)セレクト中国語基本セット |
5200 | 99.99 | 接近(Big5 1級)常用字 |
6600 | 99.999 | 接近(GB1・2級)次常用字 |
7000 | 99.9999 | CXCode 標準セット |
漢字有明顕的效用遞減率
注:GB⇒中国国家標準コードで、日本語のJISコード規格に相当するものです。
アジアの文字セット規格
規格 | 第1級 | 第2級 | 記号 | 合計 |
---|---|---|---|---|
中国GB2312簡体字 | 3,755字 | 3,008字 | 682字 | 7,445字 |
中国GB12345繁体字 | 3,755字 | 3,111字 | 682字 | 7,548字 |
台湾Big5 | 5,401字 | 7,652字 | 470字 | 13,523字 |
韓国KS C 5601 | 2,350字 | 4,888字 | 986字 | 8,224字 |
日本JIS X 0208 | 2,965字 | 3,388字 | 524字 | 6,877字 |
日本JIS X 0213 | 1・2(6,355字) 3・4(1,249・2,436字) |
1,183字 | 11,233字 | |
GB13000 | CJK漢字 | 20,902字 | ||
GB18030 | CJK漢字+6582字 | 27,484字 |
CJK漢字(ISO/IEC 10646)
G-Hanzi | G0(6,763字) | G1(2,352字) | G3-8(8,009字) | 17,124字 |
TCA-CNC | T1(5,410字) | T2(7,650字) | TE(4,198字) | 17,258字 |
JIS X 0221 | J0(6,356字 | J1(5,801字) | 12,157字 | |
KS C 5657 | K0(4,620字) | K1(2,856字) | 7,476字 |
(basic multilingual plane, BMP)文字数