Skip to content

易碼

簡介

易碼是一個三碼定長、純字形、簡體專精、出簡不出全的輸入方案。本頁面討論本輸入方案,部分定義不同於官網,算是從另一個角度來探討。

規則

易碼共約 400 字根,歸類後約 250,在 26 鍵上亂序排布。

每個字根又有兩個固定屬性:

  • 字根前兩筆。固定由一個字母代替。
  • 字根末筆。固定由一個字母代替。

因此,字根可以認定爲單編或者三編:

  • 單編碼 + 規則補碼。
  • 或,直接認定爲三編碼:第一小碼爲字根前兩筆對應的字母,第二小碼爲字根末筆對應的字母。

以上兩者等價。

理解爲單編

假設我們理解易碼是單編+規則補碼,則規則爲:

  • 依次取首、次、末根
  • 不足三碼補末根前兩筆對應編碼
  • 不足三碼補末根末筆對應編碼

理解爲三編

假設我們理解易碼爲三編。單字拆分成若干字根後,最多取三根。假設首次末編碼爲 A B Z,由設末根前兩筆對應字母爲 x,末根最後一筆對應字母爲 y。則單字編碼規則爲:

  • 單字根字 Zxy
  • 兩字根字 AZx
  • 三字根及以上字 ABZ

我們可以進行單行定義:

  • 如果是單字根字,則認定首、次根爲空值。
  • 如果是雙字根字,則認定次根爲空置。
  • 如果是三字根以上字,則認定爲首、次、末根非空值。

則,易碼的編碼規則爲:

ABZxy[:3]

簡碼

易碼全碼爲三碼,未設置一級簡碼(爲了兼容四二頂),因此二簡的設置在正常情況下不具有碼長優勢,它的作用主要是:

  1. 在四二頂狀態下節省碼長。
  2. 避重。因爲全碼狀態下重碼較多,因此在優化的時候,就對簡碼設置進行了優化。部分高頻字出簡,同時全碼後置,讓出三碼碼位給次頻字。

易碼未設置一級簡碼(爲了兼容四二頂),同時設置了676個二級簡碼。不是所有的二級簡碼都是避重簡碼。觀察到,字頻前3000的漢字,佔了日常使用頻率的 99.18%。因此,對於新手來説,我們只需要記憶「避重簡碼」。

避重問題的起源是:部分高頻二簡字 A 的全碼對應了另外一個次高頻字 B。在打全碼的狀態下,A 因爲後置,反而需要選重。因此,爲了流暢輸入,必須要對 A 的簡碼進行記憶。舉例:

「這」、「近」兩個字的全碼都是 oap,我們對「這」設置二級簡碼 oa,則全碼的排序爲 「近」「這」。如果想打「這」卻打了全碼 oap,我們反而要選重。

那麽,哪部分簡碼尤其需要注意呢?也就是滿足以下三個條件:

  • 該全碼位設置了簡碼。
  • 該全碼位讓簡碼字後,首選是前3000的漢字。

這樣的避重二簡字一共是 125 個,其二簡矩陣見文末。

排序

這裡給出一個碼表排序的思路:

  • 二級簡碼字,及其簡碼
  • 125 個避重二簡字對應的全碼次選字,及其全碼
  • 125 個避重二級簡碼字,及其全碼(出簡的字全碼後置)
  • 剩下的漢字按字頻排序

注意到,不是所有的二簡字都是在碼表中默認全碼後置的。原因在於這部分二簡字對應的全碼字字頻太低,記憶二簡的耗費太大,可以交給時間。到以後,等用戶對於二簡字都熟悉了,可以交由輸入平臺的全碼後置功能實現後置。

二簡矩陣

abcdefghijklmnopqrstuvwxyz
a
b穿
c
d
e
f
g
h
i
j便
k
l
m退
n
o
p
q
r
s
t
u
v
w
x
y
z

宇浩输入法官网