CJK Ideographs Comparison

字形对比-字形异同统计及诸子集频率权重

1. J-J’、K-K’、T-T’、H-H’的字形异同统计及其在中国大陆现代语料中的频率权重(数据表)

  同形同码
子集
微差同码
子集
简化异码
子集
总 计
台湾
国小用字
T-T’
子集汉字记录数量 2396 792 1836 5024
子集汉字排重后 2389 792 1759 4759
子集所占比例 47.69% 15.76% 36.54% 100%
频率权重  %% 5966.20 966.46 3628.67 9989.55
平均权重  %% 2.50 1.22 2.06  
权重贡献率 59.72% 9.67% 36.32% 100%
权重贡献相对指数 125.23% 61.37% 99.40%  
香港
小学用字
H-H’
子集汉字记录数量 1713 423 1327 3463
子集汉字排重后 1712 409 1165 3096
子集所占比例 49.47% 12.21% 38.32%  
频率权重  %% 6300.03 779.81 3444.34 9899.01
平均权重  %% 3.68 1.91 2.96  
权重贡献率 63.64% 7.88% 34.79% 100%
权重贡献相对指数 128.66% 64.49% 90.80%  
日本
常用汉字
J-J’
子集汉字记录数量 866 424 657 1947
子集汉字排重后 865 424 647 1920
子集所占比例 44.48% 21.78% 33.74% 100%
频率权重  %% 5226.03 1404.68 2522.23 8988.33
平均权重  %% 6.04 3.31 3.90  
权重贡献率 58.14% 15.63% 28.06% 100%
权重贡献相对指数 130.72% 71.76% 83.16%  
韩国
常用汉字
K-K’
子集汉字记录数量 614 518 669 1801
子集汉字排重后 613 517 662 1779
子集所占比例 34.09% 28.76% 37.15% 100%
频率权重  %% 4261.73 1990.90 2996.60 9143.40
平均权重  %% 6.95 3.85 4.53  
权重贡献率 46.61% 21.77% 32.77% 100%
权重贡献相对指数 136.72% 75.71% 88.23%  

此文档为收费文档,如需查看全部请付费购买。

具体收费方式详见:收费标准