输入法界,俗称码圈,在 2024 年的今天,毫无疑问是个小众圈子,三年前因难忍全拼输入法的错别字而浅尝码圈,选定了「哲豆音形」,奈何天资愚钝,没能用起来,今年三月份再次因难忍全拼输入法的错别字而进码圈,花了一个月调研、浅试,从小鹤双拼到声笔小鹤、声笔鹤整、声笔简拼再到声笔飞码,用了四个月的声笔飞码,于 8 月 4 日全面切换到宇浩星陈,回顾五个月的经历,不禁想记录点随笔。

百度贴吧已经没落,如今的码圈根据地都在 QQ 群里,各个群人数加起来大概在几千人,活跃的人几十上百,其中十几人还在积极的开发、维护公开的输入方案,例如声笔输入法作者戴石麟,宇浩输入法作者朱宇浩,蓝宝石输入法作者秋风,冰雪四拼以及汉字自动拆分系统作者谭淞宸,都是抠得代码搞得研究的大佬。

既然是圈子,必然有争端,人群可约摸分为三类人:(1) 做码人,或称算码人、字圈,喜欢研究汉字拆分和字根的键盘布局,(2) 跟打人,或称赛文人、赛圈,喜欢竞速跟打,以手快为荣,可谓武玩,(3) 其它人,菜鸟龙套捧哏普通用户,可谓文玩。三个小圈子之间以及内部少不了日常逗乐拌嘴,反正有人的地方就有江湖,很感慨的是,八九十年代的万「码」奔腾到如今的万「码」齐喑、十「码」互踢(🐶🐶🐶),多少人的青春汗水心血埋入故纸堆,多少人起朱楼宴宾客楼塌了,有的人心灰意冷退出,有的人二十年如一日默默坚持,有的人信心满满斗志昂扬誓要重振码圈。


  1. 智能拼音和语音输入如此发达好用了,形码(泛指纯形、音形、形音) 有什么用为什么还折腾形码?这是个灵魂拷问,答案是:不必要。 但是,没人完全按是否必要来行事,你就买个菜,学微积分有什么用?你一天就扯不上一句文,学古文有什么用?你就 XXX,活着有什么用?所以另一个答案是:高兴就好。

  2. 《通用规范汉字表》共收字 8105 个,一级字表为常用字集,收字 3500 个,学个支持十万汉字的形码输入法有什么用?我可以不用,但不能没有!费老牛劲背字根记规则,你也不想被人知道只能打八千字吧?

  3. 形码可以杜绝错别字吗?不能,连减少都够呛。没了智能拼音帮你选字,加上长年打拼音少写字,再加上十万汉字里有很多稀奇古怪的形近字,类似拼音有多音字,形码也有多形字(因讹传或字体差异产生的异体字),你打出错别字的概率其实变大了!智能拼音就像自动档汽车,形码就像手动档汽车,形码需要更多练习。

  4. 形码有助于避免提笔忘字吗?否。大部分形码拆字取字根序列时会跳着取,打词时更会跳过中间字根,而且一个形码字根一般代表了多个形近字根,再加上打形码熟练后不会细想字形,因此你该忘还是得忘。

  5. 形码会比拼音打字快吗?因人而定,不练习就提速很慢,一般人流畅手速在每分钟 40 ~ 80 字,刻意练习可以到每分钟 100 ~ 250 字,而打字界的天花板速录机用的是拼音却可以达到每分钟 300 ~ 600 字。

  6. 字根少的形码是不是更易学?一般是的,但往往很难一致的统计字根数量,比如折笔有几十种,字根图上用一种折笔代表,算几种字根?「日(rì)」 和「曰(yuē)」 、「讠」和「言」有的输入方案放在同一个按键上,有的输入方案放在不同按键上,哪个难?有的输入方案的字根用一个字母表示,有的用两个甚至多个字母表示;有的输入方案在键盘上乱序排布字根,有的按字根首笔分区排布,有的按字根形近聚类排布;有的输入方案增加了很多大字根,让拆字时少思索字形细节;大部分形码是平面视图取根,小部分形码是轮廓视图取根;有的输入方案引入了笔画对,看起来不难,但拆字时就会发现去想笔画好难!

  7. 重码低的形码是不是更优?肯定是的,但是计算重码的猫腻很多:用的什么字频、词频?按频率加权吗?是重码字词个数、组数还是选重数?是仅全码还是也包含了简码?全码是完全按照编码规则来,还是为了避重而人为加了额外前缀或后缀?输入方案的优化目标是全码单字低重,还是出简后单字低重,还是词组低重?输入方案是否故意设置了多重字词以缩短码长?是常用字集低重还是大字集低重?

  8. 形码可以打整句吗?习惯了拼音整句后,突然发现形码要人肉分词,可真是「一夜回到解放前」,搞不好就碰到打词打空了,非常恶心,因此码圈大佬们的建议是要么记住小词库谨慎打词,要么索性只打单字,极端点就是不要简码只打全码单字。但全码单字的码长太长,而且一至三码字得补空格,很耗费大拇指,因此码圈有人在研究形码整句,一种比较保守,依然全码单字,只节约空格,以词定字,消减单字重码,推断单字编码的边界,例如宇浩输入法的卿云输入方案的整句模式,一种比较激进,类双拼的体验,只打全码单字的前两码或前三码(可临时打四码),不打空格,也是以词定字,消减单字重码,推断单字编码的边界,例如墨奇整句,文心两仪的整句模式,以及码圈著名孤勇者赵小锋老师的「小锋顶」。目前第二种方式的争议很大。

  9. 简繁通打重要吗?不重要,但是,「我可以不用,但不能没有!」,简繁通打是个优良品质,并且不会显著增加学习负担,也不会丝毫增加只打简体的麻烦,宇浩输入法天码输入法都是如此,何乐而不为?

  10. 形码输入法难学吗?音形很简单,典型如声笔系列,别被文档长度吓住了😄,小时级别学会,形音次之,纯形最难,但两三个礼拜是没问题的,背完两三百字根就可以打字了,速度慢慢练习提升。


如果你还坚持看到这里,恭喜,你就是万中无一的练码奇才!我们继续进入群众喜闻乐见的作大死环节:荐码!

码圈文字资料散落,大多藏在 QQ 群的文件区,不便公众所知,幸运的是码圈大佬写了一些中文输入法历史、设计方面或综述或感想的文章:戴石麟的《汉字编码输入法综述》()()()(),朱宇浩的宇浩输入法介绍,谭淞宸的《顶功 · 集萃》,我也狗尾续貂挂一漏万地收集了部分中文输入法列表致敬大佬并供新人按图索骥小马过河请君入瓮!😂

什么样的形码(泛指带形的码)是适合普通人的好码呢?个人认为得符合这些条件,大伙不服的尽管放马过来!

  1. 🥇 出简也出全,不强制要求记忆简码;

  2. 🥇 简全一致,字词一致,简码是全码的前缀,词编码是单字编码前缀;

  3. 🥇 字根少,使用音托、形托或义托, 字根的键盘布局有序或者半乱序,没有主、副根,拆分规则、取码规则简单;

  4. 🥇 没有或者尽可能少的无理码,没有不自洽和文档无法解释的拆分;

  5. 🥇 动态低重(宇浩、天码、虎码可为标杆);

  6. 🥇 公开码表,能公开平铺拆分表甚至递进拆分表更佳;

  7. 🥇 有官网、网盘,文档齐备(没这些就好比没穿鞋的刀客,你敢请?),有公开的 Git 版本管理更佳;

  8. 🥈 覆盖 Unicode 十万大字符集;

  9. 🥈 支持简繁通打;

  10. 🥉 被 https://chaifen.app 收录到示例里,可以根据拆分规则自动生成拆分表和码表;

最后,你可能追问,哪个是最好的形码?应该选择哪一个呢?对不起,我只能帮到这了,请接下来自行入圈“作死”!

—— 2024.08.12,全文使用「宇浩繁简通用字形输入法」之「星陈·陆标简码」输入方案。