宇浩拆分禁手
拆分之「禁手」,指的是无论任何时候都不应当出现一些拆分情形。它高于一切拆分规则。一旦某一个拆分候选中出现了「禁手」,则直接淘汰。禁手包括:散件不分割、竖向不包夹、横间不穿心。
散件不分割
有一部分字根,本身存在离散的部件,比如戈
字右上的点、犬
字的右上的点、三
字的三个横等等。为了保证拆字的直观,保证检字(尤其是大字集下)的便捷性,我们需要对字根的连续性做出要求,并将它认定为字根的内在属性。
字根的连续性定义如下:
非连续写成、且被全包围结构或半包围结构分割的部件,不视为一个字根。
例
为
字的两点不可以被视为字根两点
,因为它们非连续写成、且被半包围结构分割。
✅ ❌
卵
字不拆卯⺀
而拆成卯丶丶
,因为卯
字的两点非连续写成、且被半包围结构分割。
✅ ❌
竖向不包夹
不少字根中存在若干分散的部件。
例
二
和三
中的横画是分离的。
合
分为了人
一
口
三个部分。
儿
分为了丿
乚
两个部分。
这给了它们包夹其他字根的可能。如亘
可看成二
包夹日
。
为了防止拆分不直观,我们做出规定,一个字根可以横向包夹,但不能纵向包夹。
例
卿
= 卯彐厶
✅ ❌
胤
= 儿幺月
✅ ❌
亘
= 一日一
✅ ❌
僵
= 亻一田一田一
✅ ❌
这是因为,汉字的左右对称多于上下对称。左右包夹是可预测的,但上下包夹往往不可预测,必须要观察到最下方。
如果设置了衣字根
某些输入法设置了衣下
字根,但亠
和𧘇
的出现并不总是成对的,必须看到最下方才能正确判断。
横间不穿心
为了使拆分更加直观,符合笔顺,防止字根交叉粘连,我们规定:
工土士干千禾キ王壬龶丰末未生古矢缶早羊虫
等字根不允许在一一
间穿插其他字根。
这个规定在常用字中比较少用。
例
再
不拆王冂
,而拆一冂土
✅ ❌
垂
不拆壬龷
,而拆千龷一
✅ ❌
禹
不拆丿虫冂
,而拆丿口冂<丄丶>
✅ ❌
妻
不拆 キコ女
或龶乛女
,而拆十彐女
。
✅ ❌ ❌