字根的内在屬性
上面我們提到了宇浩輸入法拆字規則的優先級。其實,在「字根最少」之上,還有一個隱藏的原則,也就是:字根的内在屬性。
何爲字根的内在屬性?其實就是指某一個字根區別於另一個字根的内在特點。
例
吉
拆成士口
而不是土口
,周
拆成⺆土口
而不是⺆士口
,這是因爲土
的下面一筆更長,而士
的下面一筆更短。這是區別兩個字根的本質原因和内在屬性。
「内在屬性」可以解釋爲什麽有些字這樣拆而不是那樣拆,有些字爲什麽看上去違反了「字根最少」的原則。
例
敝
拆爲丷巾八攵
而非氺巾攵
,這看似違反了「字根最少」原則,但其實沒有。注意到,敝
字左下的筆畫是撇不是提;在氺
中,左下角的筆畫是提不是撇。故而,敝
字裡並不存在氺
字根。正因爲如此,我們取四根丷巾八攵
而非三根氺巾攵
。
在這個章節,我們就詳細討論字根的内在屬性,討論某些字根在宇浩拆分中被分離或者被合併的原因,從而讓某些字的拆分原因更加明確。
日曰之辨
不少輸入法對與日
曰
兩字的區分,比較複雜。大概有兩種情況:
- 有些是基於形狀的,凡是長大於高的都爲
曰
,凡是長短於高的都爲日
。但這個方法會跟隨着字體的不同而不同,有時候不合字源,也不統一。例如:書
字源於聿者
,曹
古字爲东东口
。 - 另外一種區分方法是基於字源。也就是説:凡是在古文中作
口
形,之後隸變爲曰
形或甘
形的字,都作曰
。但這個方法對方一般的使用者難度太大,且分析字源會有疏漏之處,不應用於輸入法。
我們必須注意到,在漢字中,存在日曰
對立的字形,只有三組,分別爲:日曰
、汨汩
、曶㫚
。在其他的情況下,不存在對立,也就不存在混淆問題。
因此,我基於實用主義原則,對這兩個字根不多加以區分,而採取更簡單的方法。即:除了上述三組對立情況外,全部取日
根。換句話説,曰
根只需要在對立情況下才會使用,即:曰
汩
㫚
三個字。
這樣一來,可以顯著降低使用者的記憶和學習負擔。
勹之辨
旬
的外框勹
,同敖
左下的勹
都是撇加橫折鉤。宇浩輸入法不做區分。
點之辨
這裡對含點字根的識別和歸併作出解釋。
含點字根
- 單點
丶
和捺乀
視爲同一個字根。 - 相重疊的兩點,即
头
冬
中的部分,和二
同碼位。 - 左對點
冫
和右對點飞右
,和二
同碼位。 - 下對點
八
爲一個字根。 - 上對點
丷
䒑
リ
同大碼。 - 左
⺦
爲一個字根。 - 左三點
氵
都在一個大碼。 - 上三點
ッ𠁼
都在一個大碼。 - 所有四點
灬
都在一個大碼。
为
卵
等字的兩點和冬
下的兩點不同,非連續筆畫,且被半包圍或全包圍分割,故而不認定爲「兩點」。詳「散件不分隔」禁手。
人八入之辨
人
八
入
三字易混,這裡做出區分。
左撇右捺
凡左撇不低於右捺,視作
人
根。凡左撇低於右捺,視作
入
根。凡左撇右捺分離,視作
八
根。凡左撇右捺的中間被其他筆畫隔開,視作
<丿乀>
根。宇碼中,它和八
同大小碼。
口中無整畫
口(音kǒu
),囗(音wéi
)。這兩個根如何區分?
答案是,如果方框裡有完整的筆畫,用囗
wéi
。否則一律用口
kǒu
。
例
国
字中,有完整的筆畫,故而必須用囗
wéi
。 中
字中,雖然⼁
穿口
而過,但並未被完全包含在口
中。由於口
中沒有完整的筆畫,故而用口
kǒu
。
此規定也適用於另外幾個包含口
的字根。
例
古
下的口
中如果包含完整的筆畫,應該拆如十囗
。例如:鄙
左下方的口
中有口
,故而應該拆成口十囗口阝
。✅ ❌合
下的口
中如果包含完整的筆畫,應該拆如人一囗
。例如:會
中間的口
中有小
,故而應該拆成人一日。✅ ❌