宇浩極簡詞庫
宇浩輸入法可以輸入單字也可以輸入詞語,各有優缺點。
單字輸入相比詞語輸入
詞語輸入缺點:
- 單字輸入學習成本較低,學完單字就等於畢業。詞語輸入還要學習詞語編碼規則。
- 單字輸入思維負擔小,不需要進行人工分詞,熟練後打字比較連貫。
- 輸入單字和輸入詞語時,每個字的編碼是不同的,比如一簡字打單時只要輸入一碼,打詞時需要輸入兩碼。
- 很多生僻詞、新詞、長詞可能不在詞庫中,過度依賴詞語輸入會造成「踩空」的問題,必須回改。
- 詞語輸入的重碼率高於單字輸入1個數量級,確定性較差,失去了形碼的根本優勢。
詞語輸入優點:
- 詞語輸入時,每四碼可以上屏至少兩字,即使存在選重的幾率,平均每個字的碼長不到2.0。相比之下,單字輸入的平均碼長上升到了3.1左右,且對空格的依賴很大。
- 詞語輸入時,最多取每個字的前兩個字根,思維負擔小。相比之下,單字取碼常取到第三根,深入字的中央部分,思維負擔較大。
宇浩輸入法,全碼單字輸入模式下,選重率約爲萬分之六,詞語輸入模式下選重率約爲1.27%。一個比較好的輸入狀態,是根據個人偏好,找到一個字詞平衡點,使綜合選重率位於千分之三到千分之五之間。
我根據綱絡社區八億字頻語料製作了宇浩極簡詞庫。其中共有高頻詞語千餘個,約覆蓋 20% 到 30% 的文字。極簡詞庫主要反映的是日常書面用語,較能反映民間用語習慣。它同行政部門和官方刊物所用的書面語存在一定差異。
宇浩輸入法的最佳輸入體驗,是以字爲主,以詞爲輔,激進打字,謹慎打詞。輸入時,只打:
- 極簡詞庫
- 單字簡碼或全碼
- 用户自定詞語
長時間後,用户會熟悉常用詞。在輸入時做到較佳的確定性,實現完全關閉候選框輸入。