字形输入法特性表和关系表
一般而言,表现汉字输入法的关系,用的是树状图,主要展示输入法的衍化和传承。如纤夫张会制的中文输入法树状关系图。
这个方法的优点在于源流清楚、阶段分明。缺点在于,输入法的发展未必是线性的「继承 inheritance」关系,它可能同时吸收了多个输入法的特性,即「组合 composition」关系。这在树状图中无法被表现出来。
本文故采取另一种方式来表现输入法的联系。每一种输入法都是若干特性的组合。一个输入法会(有意或无意地)继承前辈输入法的若干特性,并引入了新的特性。特性表对于输入法之间的关系,表达上更加精确。
特性表
输入法按时间排序,首度开创的特性也能从表中展示出来。
- ✓ 表示(几乎)完全符合该特性
- ? 表示部分符合该特性,或该特性优先级较高
- - 表示不适用该特性
- 空白表示(几乎)不符合该特性
输入法特性 · 输入法名称 | 四角号码 | 仓颉 | 王码五笔 | 表形码 | 郑码 | 山人全息 | 徐码 | 真码 | 蓝宝石2 | 矧码 | 虎码 | 宇浩光华 | 宇浩星陈 | 云码 | 蓝宝石3 | 天码 | 卿云 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
作者 | 王云五 | 朱邦复 | 王永民 | 陈爱文 | 郑胧 | 谢振斌 | 徐国银 | 命 | 秋风 | PeaceB | 朱宇浩 | 朱宇浩 | 为云 | 秋风 | 宋天 | ||
年份 | 1926 | 1976 | 1986 | 1987 | 1989 | 2011 | 2013 | 2018 | 2020 | 2020 | 2021 | 2023 | 2023 | 2023 | 2023 | 2024 | 2024 |
编码用键 | |||||||||||||||||
数字作编码 | ✓ | ||||||||||||||||
A-Y字母作编码 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
Z字母作字根编码 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
Z字母作补码编码 | - | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
符号作编码 | ✓ | ||||||||||||||||
拆字理念 | |||||||||||||||||
主取形态·切分笔画 | ✓ | ✓ | |||||||||||||||
主取部首·笔画完整 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
直观优先 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||
规则优先 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
取码方法 | |||||||||||||||||
取全部字根 | ✓ | ||||||||||||||||
取次末根而非第三根 | ✓ | ✓ | ✓ | ||||||||||||||
所有字编码长度一致 | |||||||||||||||||
字根单编码 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||||
字根双编码 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||
汉字结构参与补码 | ✓ | ✓ | |||||||||||||||
末根笔划参与补码 | ✓ | ✓ | ✓ | ||||||||||||||
首根笔画作补码 | ✓ | ||||||||||||||||
最长编码确定 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
最长编码不确定 | ✓ | ||||||||||||||||
最高四码 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||
最高五码 | ✓ | ||||||||||||||||
小码情况 | |||||||||||||||||
字根分主根副根 | ✓ | ✓ | ✓ | ||||||||||||||
首根有小码则必取 | - | - | - | - | ✓ | ✓ | ✓ | ✓ | - | - | |||||||
首根有小码则顺取 | - | - | - | - | ✓ | - | - | ||||||||||
首根有小码则后置 | - | - | - | - | ✓ | ✓ | - | - | |||||||||
首根小码作补码 | - | - | - | - | ✓ | - | ✓ | ✓ | ✓ | - | ✓ | ✓ | |||||
小码主取形态·形托 | - | - | - | - | ✓ | ✓ | - | - | ✓ | ||||||||
小码主取声母·强音托 | - | - | - | - | ✓ | ✓ | - | ✓ | ✓ | - | ✓ | ✓ | |||||
小码主取声韵·弱音托 | - | - | - | - | - | ✓ | - | ||||||||||
小码完全乱序 | - | - | - | - | - | ✓ | ✓ | - | |||||||||
字根分区和聚类 | |||||||||||||||||
字根按首笔分区 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
字根按次笔分区 | ✓ | ||||||||||||||||
字根按形态特征聚类 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
字根依字母相似度聚类 | ✓ | ✓ | |||||||||||||||
字根按意义或源流聚类 | ✓ | ||||||||||||||||
字根完全乱序 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
字根不分区 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
字根分区按键盘排布 | ✓ | ✓ | ✓ | ||||||||||||||
字根分区按字典顺序 | ✓ | ✓ | |||||||||||||||
设计理念 | |||||||||||||||||
只打全码设计 | ✓ | ✓ | ✓ | ||||||||||||||
全简取码不一致 | - | - | ✓ | - | |||||||||||||
只打单字设计 | ✓ | ✓ | ✓ | ✓ | |||||||||||||
主字副词设计 | - | - | ✓ | - | ✓ | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||
字词混合设计 | - | - | - | - | ✓ | ✓ | ✓ | ✓ | |||||||||
字词取码不一致 | - | - | ✓ | - | - | ||||||||||||
繁简字和生僻字处理 | |||||||||||||||||
繁简字根刻意同键 | ✓ | ✓ | |||||||||||||||
繁简字根刻意分离 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||
繁简字根自然分离 | ✓ | ✓ | ✓ | ✓ | |||||||||||||
官方提供GB2312码表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
官方提供至CJK码表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
官方提供至扩B区码表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||
官方提供至扩I区码表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||||
超集字延用常用字字根 | - | - | - | - | - | - | ✓ | - | - | ✓ | ✓ | ✓ | ✓ | - | ✓ | ✓ | |
为超集字设置额外字根 | ✓ |
关系表
这里展示的是输入法之间的相似指数,使用了(未加权)余弦相似度。
表格按输入法发布时间排序,可以更加有效地看出新输入法借鉴老输入法的情况。每行的最大值,基本和纤夫张会制的中文输入法树状关系图中显示的继承关系一致。
注意,由于特性未加权,故而只能反映输入法之间的相对关系,真实情况会因使用者的主观偏好而产生差异。
输入法名称 | 四角 | 仓颉 | 王码 | 表形 | 郑码 | 山人 | 徐码 | 真码 | 蓝2 | 矧码 | 虎码 | 宇光 | 宇星 | 云码 | 蓝3 | 天码 | 卿云 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
四角号码 | - | ||||||||||||||||
仓颉 | 75% | - | |||||||||||||||
王码五笔 | 38% | 42% | - | ||||||||||||||
表形码 | 52% | 57% | 60% | - | |||||||||||||
郑码 | 17% | 13% | 27% | 39% | - | ||||||||||||
山人全息 | 9% | 22% | 17% | 34% | 23% | - | |||||||||||
徐码 | 9% | 4% | 30% | 34% | 62% | 31% | - | ||||||||||
真码 | 32% | 27% | 40% | 23% | 61% | 14% | 41% | - | |||||||||
蓝宝石2 | 33% | 38% | 73% | 51% | 10% | 21% | 22% | 19% | - | ||||||||
矧码 | 30% | 43% | 43% | 63% | 32% | 38% | 33% | 25% | 51% | - | |||||||
虎码 | 13% | 17% | 30% | 43% | 21% | 46% | 33% | 17% | 47% | 48% | - | ||||||
宇浩光华 | 13% | 17% | 55% | 34% | 32% | 8% | 56% | 49% | 39% | 41% | 41% | - | |||||
宇浩星陈 | 22% | 17% | 34% | 39% | 36% | 27% | 67% | 37% | 43% | 44% | 59% | 74% | - | ||||
云码 | 9% | 13% | 30% | 43% | 32% | 23% | 56% | 25% | 47% | 56% | 63% | 70% | 81% | - | |||
蓝宝石3 | 33% | 38% | 60% | 56% | 14% | 21% | 10% | 19% | 78% | 47% | 43% | 26% | 30% | 34% | - | ||
天码 | 17% | 22% | 30% | 59% | 36% | 27% | 52% | 29% | 30% | 37% | 59% | 59% | 78% | 74% | 26% | - | |
卿云 | 13% | 17% | 34% | 39% | 28% | 27% | 59% | 29% | 51% | 44% | 67% | 74% | 93% | 89% | 39% | 78% | - |