在标准键盘广泛使用之前,中文键盘曾有过各种巧妙而奇特的设计。
在华盛顿与李大学,一名来自中国台湾的年轻学子坐在台下全神贯注地听着讲座,著名历史学家阿诺德•J.汤因比(Arnold J. Toynbee)正在演讲,题为《从历史的角度看不断变化的世界》(A Changing World in Light of History)。这场讲座涉及了汤因比教授最喜欢的研究领域:人类文明的起源、成长、衰亡和崩解,他的巨著《历史研究》(A Study of History)也深入探讨了这些问题。今晚的讲座把焦点投向了中国。中国是汤因比研究的一个特例,她与埃及一样古老,其文明历经时间的洗礼流传下来。他认为,中国文明之所以能够延续下来,秘诀在于以汉字为基础的中国文字。作为一种统一手段,它为中华文明设置了“防护栏”,阻止了各种“离心力”撕裂这个伟大而多样化的文明。
这位听取汤因比讲座的学子名叫叶晨晖(Chan-hui Yeh,音 ),是附近弗吉尼亚军事学院电气工程专业的学生。听汤因比讲座的那个晚上永远地改变了他的人生轨迹,也改变了中文计算的发展轨迹,引发了后续一系列事件,推动了中文IT公司Ideographix的成立。在汤因比讲座结束14年后,叶晨晖创办了Ideographix,它可以说是历史上第一家成功的中文IT 公司。
20世纪60年代末和70年代初,中文计算经历了多次巨变。勇于接受中文计算挑战的挑战者也不再局限于小规模实验室和个人发明家,而是扩展至亚洲、美国和欧洲的工程师、语言学家和企业家,也席卷了叶晨晖的第二故乡硅谷。
中文计算机的设计也发生了巨大变化。那个年代涌现的各种竞争性设计都没有采用标准键盘。相反,最成功和最著名的系统之一(由叶晨晖设计的IPX)使用了一个拥有120级“切换”的界面,把近2万个汉字和其他符号塞进了一个仅比标准键盘界面略大的空间中。其他系统的键盘有256到2000个键。还有一些人完全放弃了键盘,使用了手写笔和触摸板,或者在旋转的圆柱形界面上缠绕了一个汉字网格。好像除了标准键盘,所有能想到的界面都被探索过了。1960年,叶晨晖从弗吉尼亚军事学院毕业,获得了电气工程学士学位。之后,他去康奈尔大学继续深造,于1963年获得核工程硕士学位,1965年获得电子工程博士学位。然后,他加入了IBM,但并未从事中文文本技术的开发,而是利用他在自动化控制方面的背景,帮助造纸厂、石化炼油厂、钢铁厂和糖厂等大型制造厂进行计算仿真开发。他被派驻到了IBM在加州圣何塞相对较新的办公室。不过,汤因比的讲座在叶晨晖脑中挥之不去。在IBM工作期间,他利用业余时间研究了汉字的电子处理。他确信中文的数字化一定是可实现的,中文书写可以进入计算机时代。他的这份信念非常强大,因而他最终辞去了在IBM的高薪工作,试图通过计算的力量维护汉字的影响力。
叶晨晖从最复杂的汉字开始,并在此基础上反向研究。他特别关注鹰的繁体字“鷹”,这个复杂的汉字有24笔。他推断,如果能为这么复杂的汉字确定一个合适的数据结构,那就离成功不远了。通过仔细分析,他确定,由24个垂直点和20个水平点组成的位图可以达到这一效果,该位图占用60字节的内存(不包括元数据)。1968年,叶晨晖信心满满地迈出了一大步,为他的项目申请了专利,绰号“铁鹰”。4年后,叶晨晖在加州森尼韦尔成立了Ideographix公司。
IPX是Ideographix的旗舰产品,这是一种基于多个子系统的复杂编排而搭建的中文计算打字和传输系统。
IPX系统的惊人之处在于它的键盘子系统,虽然键盘尺寸不大,仅宽59厘米、深37厘米、高11厘米,但理论上操作员最多可以输入1.92万个汉字。为了实现这一非凡的壮举,叶晨晖和他的同事们决定不仅仅将键盘视为电子外设,而是将其视为一台完全独立的计算机,一台与传统的标准键盘式设备完全不同、由微处理器控制的“智能终端”。
操作员坐在IPX界面前可俯视以16×10网格排列的160个按键。每个按键包含的不是一个汉字,而是一组以3×5微型阵列排列的15个汉字。这160个按键和每个按键上的15个汉字共计可以组合打出2400个汉字。
与印有字母和数字的标准键盘不同,IPX键盘上并没有印汉字。这160个按键本身是空白的。相反,这2400个汉字印在了层压纸上,并制成了一本螺旋装订的小册子,操作员可将它平放在IPX界面上。IPX按键不是标准键盘设备上的那种按钮,而是压敏垫。操作员通过按压螺旋装订的小册子来按下其正下方的键盘。
要找到第2401至第19200个汉字,操作员只需将螺旋装订的小册子翻到包含所需字符的那一页。每本小册子最多有8页,每页有2400个汉字,因此符号总数可能接近2万个。
在其问世后的前7年里,IPX的使用仅限于军方。随着时间的推移,其使用的排他性有所放松,叶晨晖开始在私营和公共部门寻找客户。他的第一批重要的非军方客户包括电信管理局和税务局。IPX帮助前者处理和传输了数百万份电话账单,并以前所未有的速度和规模帮后者制作了纳税申报文件。但是,IPX并不是唯一的选择。
20世纪70年代中期,中国在大型计算机领域的发展远比外界了解的要先进。1972年7月,时任美国总统理查德•尼克松访华几个月后,一支由美国著名计算机科学家组成的代表团访问了中国。他们参观了中国当时主要的计算机科学中心,了解了中国计算机科学家在中美关系疏远多年期间取得的进展后,代表团大为惊讶。不过,代表团未能亲眼见到汉字的计算处理这一关键的计算领域。直到1974年10月,中国的工程师才开始认真研究这个问题。随后在1975年,新成立的北京大学汉字信息处理技术研究室开始着手打造“汉字信息处理和输入系统”以及“汉字键盘”。
该团队评估了10多个中文键盘设计提案。这些设计可分为三大类:大键盘法,每个常用字符对应一个按键;小键盘法,如标准键盘式;以及试图在这两极之间开辟一条道路的中型键盘法。
该团队对标准键盘式的小键盘提出了两大批评意见。首先,其按键太少,这意味着许多汉字被分配了相同的输入序列。其次,标准键盘在充分利用按键潜力方面表现不佳。大多数情况下,标准键盘上的每个键都只分配了两个符号,其中一个需要操作员按住“shift”键才能访问。他们认为,更好的方法是“一键多用”,即为每个按键分配更多的符号以便充分利用界面空间。
该团队还研究了大键盘法,将2000个甚至更多常用汉字分配到桌面大小的界面上。中国各地有多个团队致力于研究各种版本的大键盘。然而,北京大学团队认为大键盘过于庞大和笨重。他们的目标是发挥每个按键的最大潜能,同时保持最少的按键数量。
经过多年研究,北京大学团队最终确定了一个256键键盘,其中29个键用于实现换行和空格等各种功能,其余227个键用于文本输入。每次击键会产生一个8位代码,存储在穿孔纸带上(因此才选择了256个键,即28个键)。然后,这些8位代码会被翻译成14位内部代码,计算机会用它来检索所需的字符。
为单个按键分配多个字符的设计让人想起了Ideographix的IPX机器。但是二者有一点不同。北京大学团队为每个键分配的不只是独立完整的汉字,而是既有汉字也有汉字的构字部件。具体来说,每个键最多可以与4个符号相关联,这些符号可分为3类:
完整的汉字(每键不超过两个);
部分汉字构字部件(每键不超过3个);
大写符号,用于切换其他语言(每键1个)。
该键盘总共包含423个完整汉字和264个构字部件。在键盘上排列这264个汉字部件时,该团队发现了一种优雅而巧妙的方法来帮助操作员记住每个字符的位置,即将键盘视为一个汉字。该团队将这264个汉字部件按照它们通常在汉字中出现的位置分别放置在了键盘上的对应区域。
最终,北京大学设计的键盘能够输入7282个汉字,该团队估计可涵盖日常生活中遇到的90%以上的汉字。在这个字符集中,423个最常见的汉字可以通过1次击键完成;2930个汉字可以通过2次击键完成;另外3106个汉字可以通过3次击键完成;剩下的823个汉字需要4到5次击键。
北京大学团队的键盘只是那个时代众多中等尺寸设计中的一种。IBM开发了用于中文和日文的256键键盘。这款20世纪70年代的键盘设计让人想起了IPX系统,它包括一个12位小键盘,每个按键配备了12个完整汉字,操作员可以在这些汉字之间“切换”(合计3072个汉字)。1980年,香港中文大学教授乐秀章发明了“乐氏键盘”,这款键盘也有256个键。不过,英国设计的中文键盘也许是那个时代最奇怪的。
1976年的一个冬日,英国剑桥的一个小男孩在寻找他心爱的麦卡诺玩具套装。作为美国建筑玩具套装的前身,这款广受欢迎的英国玩具可让有抱负的工程师进行数小时的模块搭建。安德鲁最近玩过齿轮、车轴和金属板,但是今天到处都找不到它们。他走进厨房,当场抓住了“小偷”——他的父亲,剑桥大学研究员罗伯特•斯洛斯(Robert Sloss)。连续三天三夜,斯洛斯霸占着儿子的玩具,全神贯注于创造一个奇特的圆柱形旋转装置。这个装置吸引了小男孩的注意,后来还吸引了《电讯先驱报》的注意,报社派了一名记者前去报道。最终,它吸引了英国电信巨头大东电报公司的注意并获得了资金支持。
斯洛斯正在制造一台中文计算机。
1927年,斯洛斯在苏格兰出生。他加入了英国海军,并接受了一系列智力测试,测试结果显示他有学习外语的天赋。1946年和1947年,他被派驻中国香港。斯洛斯加入了公务员队伍,成为了一名教师,后来又加入英国空军成为了一名士官。凭借教学经验、语言天赋和亚洲工作背景,斯洛斯受邀到剑桥大学教授中文,并于1972年被任命为讲师。
在剑桥,斯洛斯遇到了彼得•南卡罗(Peter Nancarrow)。南卡罗比斯洛斯小12岁,曾接受物理专业的学习,但后来找了一份专利代理的工作。在与斯洛斯合作打造一台汉英自动翻译机之前,作为“业余爱好”,这位留着大胡子的38岁男子自学了挪威语和俄语。
他们很快发现,汉字输入的问题阻碍了他们的翻译机设计,要如何将手写的汉字、定义和句法数据输入计算机?
在接下来的两年里,斯洛斯和南卡罗投入到了中文计算机界面的设计工作中。正是这项工作促使了斯洛斯去“偷”儿子的麦卡诺玩具。斯洛斯很快取得了成果,他打造了一个工作原型,两人称之为“将汉字编码成机器兼容形式的二进制信号发生器”,它也被称为Ideo-Matic编码器和Ideo-Matic 66(以机器的66×66字符网格命名)。
该机器网格中的每个单元格都被分配了一个与X列和Y行值相对应的二进制代码。在总空间中,每个单元格为7平方毫米,在这4356个单元格中有3500个专用于汉字,其余的被分配给了日语音节或留白。
不过,网格并不是斯洛斯和南卡罗界面的显著特征。二人没有将4356个单元格排列在一个矩形界面上,而是决定将网格缠绕在一个旋转的圆柱形结构上。打字员可一只手旋转圆柱形网格,另一只手左右移动光标来指示4356个单元格中的一个。按下按钮会产生一个与所选汉字或其他符号相对应的二进制信号。
20世纪70年代末,Ideo-Matic编码器制造完成并交付给了大东电报公司。这台重7公斤、宽68厘米、深57厘米、高23厘米的机器引起了业界和媒体的关注。大东电报公司购买了这台机器的版权,希望能面向东亚市场大规模生产。
无论是IPX、Ideo-Matic 66、北京大学的中型键盘,还是本文讨论的所有其他定制设备,很快都走向了被遗忘这一完全相同的命运。那是剧变的时代。定制设计中文文本处理系统的时代即将结束。一个各大公司、企业家和发明家都没有准备好的新时代正在形成。这个新时代有许多名字:软件革命、个人计算机革命,以及不太乐观的称呼——硬件的消亡。从20世纪70年代末开始,中文定制界面逐渐从市场上和实验室中消失,被一波又一波冲击着中文市场、由西方制造的个人计算机取代。随着这些计算机的出现,标准键盘在中文输入领域重新流行,就像今天中文计算机用户使用的系统一样,它通过软件层将拉丁字母转换成汉字。这种由输入法编辑器或输入法编辑器促成的打字转换并没有像历史学家汤因比预测的那样导致中华文明的衰落。不过,它确实从根本上改变了中文使用者与数字世界以及自己语言的互动方式。
来源:悦智网
编辑:余荫铠
转载内容仅代表作者观点
不代表中科院物理所立场
如需转载请联系原公众号