Skip to content

宇浩输入法

基本特点

宇浩输入法是纯字形输入法,通过输入汉字的部首和笔画来输入汉字,而不依赖汉字的具体读音。也就是「会写就会打」「看到即输入」。这是如何做到的呢?答案是三个步骤:

  • 第一步,也是宇浩输入法的核心:将每一个汉字拆成不超过四个部件(字根)。
  • 第二步,是将这些部件转换成对应的英文字母。
  • 第三步,将编码输入到电脑中,对应的汉字就会自动弹出来。

举个例子,这个字用宇浩输入法怎么输入呢?

  • 第一步:将直观地拆成四个部件:
  • 第二步:找到这四个部件对应的字母,分别是:K J W I。
  • 第三步:将这四个字母输入到电脑中,这个字就会显示出来。

宇浩输入法具有以下的优点:

  • 字频加权后的选重率极低,基本上一字一码,码到字出,极其适合盲打。
  • 繁简字码位分离,比如 不同编码,繁体简体混在一起打也极少选重。
  • 字形兼容大陆通规、大陆古籍通规[1]、台湾正体、香港繁体四套标准,方便检字。
  • 设有简体、繁体两套词库,字形涵盖两岸三地三套标准 [2]
  • 全面覆盖 CJK 全字集 99000 多个汉字(更新至 CJK 扩 I 区),生僻字一网打尽。
  • 检字方便,翻页少。总共 99000 多个汉字,候选项最多的码位上只有 18 个候选字。
  • 采用大字根、拆法直观,不会将汉字拆得零碎。
  • 字根为双编码,不分主副根,没有结构码。
  • 拆分时取一、二、三、末字根。全简编码一致、字词编码一致。
  • 拆字规范,规则优先级明确,兼顾「逻辑性」和「直观性」。追求一字一拆、无歧义。
  • 兼顾手感,大码只使用 25 键。星陈方案双手互击率超过 60%。

四大特点

繁简通打 动静低重 字根聚类 兼顾手感

assess

简体和繁体

绝大多数输入法,简体字和对应的繁体字都占用相同的码位,导致输入繁体时需要选重。比如五笔字型中, 两个字的编码都是TUJf。如果我想打繁体的「简」,需要按一下选重键。因此,大多数输入法在繁体文本下,不具备盲打的优势,除非重新对码表进行排序。

宇浩输入法繁简汉字分离,不存在共用码位现象,故而使用一张码表即可既打简又打繁,不用担心选重问题。你可以按照自己掌握每一个字的繁简状态,不需要软件转换,更不需要准备两套码表。可以像写字一样随心所欲。

比如, 这两个繁简汉字,在宇浩输入法中对应了不同的编码。这是因为宇浩输入法的 字根繁简分离。在很多输入法中,由于繁简字根位于同一个按键,你需要从候选栏中选择繁体字还是简体字。

以下视频展示了使用宇浩单字全码输入繁简混合版本的《洛神赋》的片段节选。可以看到,全文都没有进行过选重。因此,宇浩输入法特别适合任意文本空间下的盲打,以及古汉语输入。

静重和动重

宇浩输入法支持繁简通打,并不代表它牺牲了只打简体只打繁体的性能。我们不妨看一看下面的数据:

  • 简体文本:常用 1500 字全码无重 [3]。常用 3000 字,全码 10 组重码,出简后无重码。常用 4500 字,全码 55 组重码,出简后 2 组重码。常用 6000 字,全码 117 组重码,出简后 14 组重码。字频加权后,全码下每万字选重 5 次。

  • 繁体文本:常用 1500 字,全码 1 组重码,出简后无重。常用 3000 字,全码 24 组重码,出简后 4 组重码。常用 4500 字,全码 92 组重码,出简后 13 组重码。常用 5700 字,全码 152 组重码,出简后 36 组重码。字频加权后,全码下每万字选重 15 次。

  • 繁简混合文本 [4]:前 1500 字,全码 3 组重码,出简后无重。前 3000 字,全码 13 组重码,出简后 3 组重码。前 6000 字,全码 131 组重码,出简后 16 组重码。前 9000 字,全码 365 组重码,出简后 92 组重码。字频加权后,全码下每万字选重 17 次。

要知道,宇浩输入法只使用了 25 个按键,也就是说四码的编码空间只有其他 26 键输入法的 85.5%。但是宇浩输入法在常用繁简汉字下选重率却是同类输入法中最低的。

打单和打词

宇浩输入法可以输入单字也可以输入词语,各有优缺点。

单字输入相比词语输入

词语输入缺点:

  • 单字输入学习成本较低,学完单字就等于毕业。词语输入还要学习词语编码规则。
  • 单字输入思维负担小,不需要进行人工分词,熟练后打字比较连贯。
  • 输入单字和输入词语时,每个字的编码是不同的,比如一简字打单时只要输入一码,打词时需要输入两码。
  • 很多生僻词、新词、长词可能不在词库中,过度依赖词语输入会造成「踩空」的问题,必须回改。
  • 词语输入的重码率高於单字输入1个数量级,确定性较差,失去了形码的根本优势。

词语输入优点:

  • 词语输入时,每四码可以上屏至少两字,即使存在选重的几率,平均每个字的码长不到2.0。相比之下,单字输入的平均码长上升到了3.1左右,且对空格的依赖很大。
  • 词语输入时,最多取每个字的前两个字根,思维负担小。相比之下,单字取码常取到第三根,深入字的中央部分,思维负担较大。

宇浩输入法,单字输入模式下(只考虑二简)选重率约为0.06%,词语输入模式下选重率约为1.27%。一个比较好的状态,应该是主要打单字,辅助打词语,根据个人偏好,找到一个平衡点,让综合选重率达到0.30% 到 0.50% 左右。

因此,宇浩输入法的最佳输入体验,是以字为主,以词为辅,激进打字,谨慎打词,从而达到较佳的确定性,做到完全关闭候选框输入。

!-- ## 适合人群

评价一款输入法,不能只看重码率,因为每一款输入法都有自己的设计哲学目标用户。有优点就必然有缺点,反之亦然。评价一款输入法的维度,除却重码率,还有规则简易度、字根复杂度、按键舒适度、平台通用性等。这就是为什么拼音重码高,但大多数人还是会使用拼音,因为它的学习成本基本为零。选择学习输入法,一定要符合自己的需求,要综合考虑多方面因素,例如,是否愿意背较多的字根,是否有打古文、繁体字需求等。

宇浩输入法的最佳输入体验,是采用精简词库(80000 词左右,同时包括简体、台湾繁体、香港繁体、大陆繁体)并配合单字输入,从而达到极致的确定性,做到完全关闭候选框输入。以下为宇浩输入法最适合的人群:

  • 对繁体字和简化字都有输入需求,希望做到繁简无缝切换,不依赖程序进行转换的人(中文系学生、经常同两岸三地人士打交道者、方言爱好者、汉字爱好者等);或
  • 日常主要输入繁体文本的人(港澳台用户);或
  • 日常需要输入简体文本,偶尔需要输入繁体文本和生僻字的人;或
  • 热爱汉字,喜欢一笔一画写字的感觉,想要学习传统汉字的人。 --

聚类和分区

宇浩输入法的核心是对于汉字的拆分,其次是对于字根排布的设计。字根一共有 200 多个,但字母只有 26 个,因此,每个按键上都会有大约 10 个左右的字根。字根如何排布,直接决定了它的学习难度、维护难度、手感、连贯度等等。大体上:

  • 对相似字形进行聚类和分区的方案,比乱序排布的方案,学习更加便捷,维护成本更低。比如:「目且贝见」这些都有「目」形的字根,如果安排在一个按键上,那么我们只要记住了其中的一个,就能立刻记住剩下的字根。
  • 乱序排布的方案,比对相似字形进行聚类和分区的方案,手感更优。这是因为字根排布的设计中,最大的限制条件就是聚类。解除了这个限制,排布就更加自由,就能在手感上做到更好。
  • 三码的方案,比四码的方案,思维负担更小。这是因为四码方案需要取到字的第三根,这个字根往往深入字的中部,思考起来需要更多时间。
  • 四码的方案,比三码的方案,重码更低。这一点不言而喻。

每个人都有自己的偏好。为了照顾不同人群的需求。宇浩输入法有两套官方字根排布设计。大家可根据自己的偏好和以前的输入习惯,选择其中一个学习。由于这些设计都基于「宇浩拆分」,因此就算后面想试试其他的设计,也只用几天就能适应。

宇浩·星陈

宇浩·星陈是官方字根排布设计,采用了字根聚类同键排布模式(类似郑码、徐码)。字形相似的字根会被聚拢在一道,排布在 25 个键位上。方案名取自《尚书大传》之「明明上天,烂然星陈」。

由于大量字形相近的字根被放在了一个按键上,它对于初学者极为友好,可以通过联想记忆法,以「组」为单位来记忆。比如:

  • 目且貝見日曰早都在 J 上。
  • 亦文(夂)亥(豕)亡方都在 T 上。

yustar

宇浩·光华

宇浩·光华是官方字根排布设计,采用了字根首笔分区排布模式(类似五笔、真码)。依据字根第一笔的笔画,分布在横竖撇捺折五区中。其中横区 6 键,竖区 5 键,撇区 6 键,捺区 4 键,折区 4 键。方案名取自《尚书大传》之「日月光华,旦复旦兮」。

由于字根按照首笔笔画进行分区,适合有五笔经验的用户。

宇浩输入法宋体字根图

两个方案的区别,可参见以下表格。

特点宇浩·光华宇浩·星陈
使用最新版本宇浩拆分
支持到 CJK ext-I
兼容台湾字形拆分
繁简通打低极选重率 (0.2%)
字根双编码
附属根比代表根多补一码
大码使用 Z 键
小码使用 Z 键
相似字形字根同分区聚类
相似字形字根同大码聚类
小码使用拼音中的字母
小码 85% 使用拼音首字母
双手互击率 60%
严格优化键位分布
Z 键反查

第三方衍生

基于宇浩输入法的拆分,部分用户还创制了其他的衍生方案

吉旦饼

吉旦饼,是阿吉、王牌饼干发起的一项衍生方案。它采用乱序字根设计、三码定长、延迟顶字。「吉旦饼」这个名字,来自三名主要开发人:阿吉,forFudan,王牌饼干。取义于 华夫饼 (wafel),其汉语翻译应有「鸡蛋饼」之义。

输入三码后,对应的三码单字不会上屏,而是将此汉字暂留在预选区,等到第七码的时候,才顶出第一字。每输入四码时,进入临时四码模式,可以选择 Tab 上屏对应的四码单字。因此可看作加强版的「五三顶」输入法。

鸡蛋饼不取第三字根,故而拆分起来更加简单,思维压力较小。三码一字,也使得输入的节奏非常舒服。

特点宇浩·星陈吉旦饼
使用最新版本宇浩拆分
支持到 CJK ext-I(四码模式下)
兼容台湾字形拆分
字根双编码
三码方案
四码方案(支持四码加 Tab 键输入)
单字派码长~3.15~2.65
一简二简个数~600~50
繁简通打低极选重率 (0.2%)(四码模式下)
大码使用 Z 键
小码使用 Z 键
相似字形字根同大码聚类
小码使用拼音中的字母
小码 85% 使用拼音首字母
双手互击率 60%
严格优化键位分布
Z 键反查

卿云烂兮

卿云烂兮,是钱多多发起的一项衍生方案,特点是乱序、单编、消灭小码。方案名取自《尚书大传》之「卿云烂兮,𫄙缦缦兮」。取码规则共两条:

  1. 依次取第一、二、三、末字根对应的编码;
  2. 不足四码时,输入一个补码,即末根读音。

所以,根据字根数量,有以下几种形式。设首根为 A,次根为 B,三根为 C,末根为 Z,读音为 p。

  1. 单根字:Zp
  2. 双根字:AZp
  3. 三根字:ABZp
  4. 多根字:ABCZ

卿云取码歌诀

一二三末取字根 单根成字即自身
双根便作首和末 三根首二同末存
字根表中找编码 二十五键莫看岔
依次填入根字母 不足四码加补码
补码就是末根音 以下法则心里记
鱼化v来衣作i 口补v外无特例

末根补码规则举例
v频率最高的字根,补码为 v
v读音为 ㄩ 的,补码为 v鱼鱼雨禺予 月曰
i读音为 ㄧ 的,补码为 i一乙已乂弋亦衤 言羊用夭

字根是有限的,因此本方案依旧是纯形方案,不是形音方案。

由于字根采用乱序设计,卿云同时兼顾了极低的选重率、优秀的手感、和简单的规则。其关键数据如下:

  • 简体动态选重率 0.08%
  • 繁体动态选重率 0.08%
  • 繁简混合动态选重率 0.135%
  • 全码速度当量 1.27,简码速度当量 1.28
  • 单字平均双手互击率 65%,连续文本双手互击率 45%

鸣谢

本输入法的设计制作主要借鉴了三个前辈输入法的优点,在这里向他们的作者表示极大的敬意和感谢。它们包括:

  • 郑码的大字根、双编码设计。通过「位码」而非「结构码」来挖掘首根的信息。
  • 徐码对于繁简通打的支持,以及小码从拼音字母中选取的特点。使用音托不仅方便记忆,也可以达到更佳的离散。
  • 五笔字型字根分区排布、不使用 Z 键的特征。分区排布方便对于字根的记忆,Z 键空出后利于手感,还能用于其他功能,方便各平台通用。

在输入法的制作过程中,不少伙伴提出了大量宝贵的意见和建议,帮助它不断优化进步。特此致以极大的谢意。

  • 钱多多为输入法的推广作出大量的努力。还绘制了黑体的字根图、设计了输入法的 Logo 和 Android 上的定制方案。可谓「首席艺术委员」。
  • 阿吉始终鼓励作者开发一款新的输入法,他的很多观点和设计哲学同作者不谋而合,也坚定了宇浩输入法讲客观、讲实用的理念。他为输入法的字根规律性和易学性提出了大量建议,使折区字根的排布上了一个台阶。可谓「首席哲学委员」。
  • 宋天为输入法的规则的完善提出了大量意见和建议,找出了很多拆分上的不合理之处,尤其是在大字集的拆分上,他的建议至关重要,也使宇浩输入法在常用字集内拆分无二义、规则无矛盾。可谓「首席拆分委员」。
  • 王牌饼干不仅设计了非常好用的「宇浩三码顶」方案,还为 RIME 方案编写了优秀的 Lua 代码。可谓「首席技术委员」。

还有不少朋友为输入法的优化提出了宝贵的意见和建议,此处不一一致谢。

有联为证:

汉字十万,岂宇浩独收八九?
字根两百,因诸君而改二三。

脚注


  1. 中华人民共和国国家标准《古籍印刷通用字规范字形表》(GB/Z 40637-2021):https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B ↩︎

  2. 两岸三地三套标准包括:大陆简体、大陆繁体、台湾正体。另外,宇浩输入法还兼容符合 OpenCC 用字标准的词语。 ↩︎

  3. 「最常用汉字」的定义依赖于文本空间。关于本测评中所用的字频数据的来源,请参阅此页面↩︎

  4. 这里的繁简混合字频来源于简体字频和繁体字频。假设一个人一半时间打简体,一半时间打繁体,那么便适用于此数据。 ↩︎

宇浩输入法官网