字形輸入法特性表和關係表
一般而言,表現漢字輸入法的關係,用的是樹狀圖,主要展示輸入法的衍化和傳承。如縴夫張會製的中文輸入法樹狀關係圖。
這個方法的優點在於源流清楚、階段分明。缺點在於,輸入法的發展未必是線性的「繼承 inheritance」關係,它可能同時吸收了多個輸入法的特性,即「組合 composition」關係。這在樹狀圖中無法被表現出來。
本文故採取另一種方式來表現輸入法的聯繫。每一種輸入法都是若干特性的組合。一個輸入法會(有意或無意地)繼承前輩輸入法的若干特性,並引入了新的特性。特性表對於輸入法之間的關係,表達上更加精確。
特性表
輸入法按時間排序,首度開創的特性也能從表中展示出來。
- ✓ 表示(幾乎)完全符合該特性
- ? 表示部分符合該特性,或該特性優先級較高
- - 表示不適用該特性
- 空白表示(幾乎)不符合該特性
輸入法特性 · 輸入法名稱 | 四角號碼 | 倉頡 | 王碼五筆 | 表形碼 | 鄭碼 | 山人全息 | 徐碼 | 真碼 | 藍寶石2 | 矧碼 | 虎碼 | 宇浩光華 | 宇浩星陳 | 雲碼 | 藍寶石3 | 天碼 | 卿雲 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
作者 | 王雲五 | 朱邦復 | 王永民 | 陳愛文 | 鄭朧 | 謝振斌 | 徐國銀 | 命 | 秋風 | PeaceB | 朱宇浩 | 朱宇浩 | 爲雲 | 秋風 | 宋天 | ||
年份 | 1926 | 1976 | 1986 | 1987 | 1989 | 2011 | 2013 | 2018 | 2020 | 2020 | 2021 | 2023 | 2023 | 2023 | 2023 | 2024 | 2024 |
編碼用鍵 | |||||||||||||||||
數字作編碼 | ✓ | ||||||||||||||||
A-Y字母作編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
Z字母作字根編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
Z字母作補碼編碼 | - | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
符號作編碼 | ✓ | ||||||||||||||||
拆字理念 | |||||||||||||||||
主取形態·切分筆畫 | ✓ | ✓ | |||||||||||||||
主取部首·筆畫完整 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
直觀優先 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||
規則優先 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
取碼方法 | |||||||||||||||||
取全部字根 | ✓ | ||||||||||||||||
取次末根而非第三根 | ✓ | ✓ | ✓ | ||||||||||||||
所有字編碼長度一致 | |||||||||||||||||
字根單編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||||
字根雙編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||
漢字結構參與補碼 | ✓ | ✓ | |||||||||||||||
末根筆劃參與補碼 | ✓ | ✓ | ✓ | ||||||||||||||
首根筆畫作補碼 | ✓ | ||||||||||||||||
最長編碼確定 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
最長編碼不確定 | ✓ | ||||||||||||||||
最高四碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||
最高五碼 | ✓ | ||||||||||||||||
小碼情況 | |||||||||||||||||
字根分主根副根 | ✓ | ✓ | ✓ | ||||||||||||||
首根有小碼則必取 | - | - | - | - | ✓ | ✓ | ✓ | ✓ | - | - | |||||||
首根有小碼則順取 | - | - | - | - | ✓ | - | - | ||||||||||
首根有小碼則後置 | - | - | - | - | ✓ | ✓ | - | - | |||||||||
首根小碼作補碼 | - | - | - | - | ✓ | - | ✓ | ✓ | ✓ | - | ✓ | ✓ | |||||
小碼主取形態·形托 | - | - | - | - | ✓ | ✓ | - | - | ✓ | ||||||||
小碼主取聲母·強音托 | - | - | - | - | ✓ | ✓ | - | ✓ | ✓ | - | ✓ | ✓ | |||||
小碼主取聲韻·弱音托 | - | - | - | - | - | ✓ | - | ||||||||||
小碼完全亂序 | - | - | - | - | - | ✓ | ✓ | - | |||||||||
字根分區和聚類 | |||||||||||||||||
字根按首筆分區 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
字根按次筆分區 | ✓ | ||||||||||||||||
字根按形態特徵聚類 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
字根依字母相似度聚類 | ✓ | ✓ | |||||||||||||||
字根按意義或源流聚類 | ✓ | ||||||||||||||||
字根完全亂序 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
字根不分區 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
字根分區按鍵盤排佈 | ✓ | ✓ | ✓ | ||||||||||||||
字根分區按字典順序 | ✓ | ✓ | |||||||||||||||
設計理念 | |||||||||||||||||
只打全碼設計 | ✓ | ✓ | ✓ | ||||||||||||||
全簡取碼不一致 | - | - | ✓ | - | |||||||||||||
只打單字設計 | ✓ | ✓ | ✓ | ✓ | |||||||||||||
主字副詞設計 | - | - | ✓ | - | ✓ | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||
字詞混合設計 | - | - | - | - | ✓ | ✓ | ✓ | ✓ | |||||||||
字詞取碼不一致 | - | - | ✓ | - | - | ||||||||||||
繁簡字和生僻字處理 | |||||||||||||||||
繁簡字根刻意同鍵 | ✓ | ✓ | |||||||||||||||
繁簡字根刻意分離 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||
繁簡字根自然分離 | ✓ | ✓ | ✓ | ✓ | |||||||||||||
官方提供GB2312碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
官方提供至CJK碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
官方提供至擴B區碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||
官方提供至擴I區碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||||
超集字延用常用字字根 | - | - | - | - | - | - | ✓ | - | - | ✓ | ✓ | ✓ | ✓ | - | ✓ | ✓ | |
爲超集字設置額外字根 | ✓ |
關係表
這裏展示的是輸入法之間的相似指數,使用了(未加權)餘弦相似度。
表格按輸入法發佈時間排序,可以更加有效地看出新輸入法借鑒老輸入法的情況。每行的最大值,基本和縴夫張會製的中文輸入法樹狀關係圖中顯示的繼承關係一致。
注意,由於特性未加權,故而只能反映輸入法之間的相對關係,真實情況會因使用者的主觀偏好而産生差異。
輸入法名稱 | 四角 | 倉頡 | 王碼 | 表形 | 鄭碼 | 山人 | 徐碼 | 真碼 | 藍2 | 矧碼 | 虎碼 | 宇光 | 宇星 | 雲碼 | 藍3 | 天碼 | 卿雲 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
四角號碼 | - | ||||||||||||||||
倉頡 | 75% | - | |||||||||||||||
王碼五筆 | 38% | 42% | - | ||||||||||||||
表形碼 | 52% | 57% | 60% | - | |||||||||||||
鄭碼 | 17% | 13% | 27% | 39% | - | ||||||||||||
山人全息 | 9% | 22% | 17% | 34% | 23% | - | |||||||||||
徐碼 | 9% | 4% | 30% | 34% | 62% | 31% | - | ||||||||||
真碼 | 32% | 27% | 40% | 23% | 61% | 14% | 41% | - | |||||||||
藍寶石2 | 33% | 38% | 73% | 51% | 10% | 21% | 22% | 19% | - | ||||||||
矧碼 | 30% | 43% | 43% | 63% | 32% | 38% | 33% | 25% | 51% | - | |||||||
虎碼 | 13% | 17% | 30% | 43% | 21% | 46% | 33% | 17% | 47% | 48% | - | ||||||
宇浩光華 | 13% | 17% | 55% | 34% | 32% | 8% | 56% | 49% | 39% | 41% | 41% | - | |||||
宇浩星陳 | 22% | 17% | 34% | 39% | 36% | 27% | 67% | 37% | 43% | 44% | 59% | 74% | - | ||||
雲碼 | 9% | 13% | 30% | 43% | 32% | 23% | 56% | 25% | 47% | 56% | 63% | 70% | 81% | - | |||
藍寶石3 | 33% | 38% | 60% | 56% | 14% | 21% | 10% | 19% | 78% | 47% | 43% | 26% | 30% | 34% | - | ||
天碼 | 17% | 22% | 30% | 59% | 36% | 27% | 52% | 29% | 30% | 37% | 59% | 59% | 78% | 74% | 26% | - | |
卿雲 | 13% | 17% | 34% | 39% | 28% | 27% | 59% | 29% | 51% | 44% | 67% | 74% | 93% | 89% | 39% | 78% | - |