Skip to content

字根的内在屬性

上面我們提到了宇浩輸入法拆字規則的優先級。其實,在「字根最少」之上,還有一個隱藏的原則,也就是:字根的内在屬性

何爲字根的内在屬性?其實就是指某一個字根區別於另一個字根的内在特點。

拆成士口而不是土口拆成⺆土口而不是⺆士口,這是因爲的下面一筆更長,而的下面一筆更短。這是區別兩個字根的本質原因和内在屬性。

「内在屬性」可以解釋爲什麽有些字這樣拆而不是那樣拆,有些字爲什麽看上去違反了「字根最少」的原則。

拆爲丷巾八攵而非氺巾攵,這看似違反了「字根最少」原則,但其實沒有。注意到,字左下的筆畫是撇不是提;在中,左下角的筆畫是提不是撇。故而,字裡並不存在字根。正因爲如此,我們取四根丷巾八攵而非三根氺巾攵

在這個章節,我們就詳細討論字根的内在屬性,討論某些字根在宇浩拆分中被分離或者被合併的原因,從而讓某些字的拆分原因更加明確。

日曰之辨

不少輸入法對與 兩字的區分,比較複雜。大概有兩種情況:

  • 有些是基於形狀的,凡是長大於高的都爲,凡是長短於高的都爲。但這個方法會跟隨着字體的不同而不同,有時候不合字源,也不統一。例如:字源於聿者古字爲东东口
  • 另外一種區分方法是基於字源。也就是説:凡是在古文中作形,之後隸變爲形或形的字,都作。但這個方法對方一般的使用者難度太大,且分析字源會有疏漏之處,不應用於輸入法。

我們必須注意到,在漢字中,存在日曰對立的字形,只有三組,分別爲:日曰汨汩曶㫚。在其他的情況下,不存在對立,也就不存在混淆問題。

因此,我基於實用主義原則,對這兩個字根不多加以區分,而採取更簡單的方法。即:除了上述三組對立情況外,全部取根。換句話説,根只需要在對立情況下才會使用,即: 三個字。

這樣一來,可以顯著降低使用者的記憶和學習負擔。

勹之辨

的外框,同左下的都是撇加橫折鉤。宇浩輸入法不做區分。

點之辨

這裡對含點字根的識別和歸併作出解釋。

含點字根

  • 單點和捺視爲同一個字根。
  • 相重疊的兩點,即 中的部分,和同碼位。
  • 左對點和右對點飞右,和同碼位。
  • 下對點爲一個字根。
  • 上對點 同大碼。
  • 爲一個字根。
  • 左三點都在一個大碼。
  • 上三點ッ𠁼都在一個大碼。
  • 所有四點都在一個大碼。

等字的兩點和下的兩點不同,非連續筆畫,且被半包圍或全包圍分割,故而不認定爲「兩點」。詳「散件不分隔」禁手

人八入之辨

三字易混,這裡做出區分。

左撇右捺

  1. 凡左撇不低於右捺,視作根。

  2. 凡左撇低於右捺,視作根。

  3. 凡左撇右捺分離,視作根。

  4. 凡左撇右捺的中間被其他筆畫隔開,視作<丿乀>根。宇碼中,它和同大小碼。

口中無整畫

口(音kǒu),囗(音wéi)。這兩個根如何區分?

答案是,如果方框裡有完整的筆畫,用 wéi。否則一律用 kǒu

字中,有完整的筆畫,故而必須用 wéi字中,雖然穿而過,但並未被完全包含在中。由於中沒有完整的筆畫,故而用 kǒu

此規定也適用於另外幾個包含的字根。

  • 下的中如果包含完整的筆畫,應該拆如十囗。例如:左下方的中有,故而應該拆成口十囗口阝
  • 下的中如果包含完整的筆畫,應該拆如人一囗。例如:中間的中有,故而應該拆成人一日

宇浩输入法官网