本书是《中文打字机:一个世纪的汉字突围史》的续作。
目前有十数亿人在计算机上使用汉字,这是如何做到的?我们如今所熟知的种种输入法是如何诞生的?它们运用了怎样的技术逻辑?背后又有怎样波澜诡谲的历史故事?
本书追溯了诞生于二战后的汉字数字化技术,及其发展至今的历程。借助作者提供的技术语言学视角,我们得以重新审视汉字,这种中国人似乎再熟悉不过的古老文字的顽强生命力与尚未被完全发掘的魅力。这是一部数字时代的汉字史,也是中文计算机发展史的重要侧面。
作者:
墨磊宁(Thomas S. Mullaney),美国哥伦比亚大学历史学博士,现任美国斯坦福大学历史系教授,研究领域为中国历史。著有《中文打字机:一个世纪的汉字突围史》等。
译者:
张朋亮,西南政法大学外国语学院翻译硕士,译有《天气预报》《全球化与澳门》《驯服时间》等。
致谢
引言 数字时代的中文
中文计算机技术的六大原理
底层书写时代
第一章 输入法女士:IBM 公司、刘淑莲和电子化中文的黎明
代码意识:从中文电报到电动中文打字机
举重若轻:第一位中文输入者
代码人生:刘淑莲在中国
0275:你/0178:他/0314:我
第二章 打破魔咒:华文排字机与自动补全
中文怎么拼写?
争取和平:华文排字机的武器化
分割屏幕:反馈回路、歧义消除和“弹出菜单”的起源
冗余的中文:“最少拼写”和自动补全
华文排字机之死
第三章 告别 QWERTY:探索中文键盘
叶晨晖、IPX系统和120层超切换键盘
一键多用:中国大陆及其他地区的中型键盘
表意文字自动编码机66型
输入的回归
第四章 输入战争:支秉彝与底层书写的回归
QWERTY键盘的回归:支秉彝——从汉字检索到汉字输入
底层书写的符号学:不用来拼写的字母表是什么?
底层书写市场
一台电脑,多个系统
美梦成真
第五章 改装中国之路:打印机、屏幕和外设政治
存储绝技
自适应存储
汉字芯片
点阵打印与字母秩序的冶金学奥义
弹出式现代性:汉字显示器
中断的现代性
无法退出
第六章 联想:预测文本时代的中文
拼音问题
从汉语拼音到拼音输入法:挖掘语音输入法的底层书写潜力
拼音与新输入法的技术官僚
拼音输入法不等于汉语拼音
拼音输入法改变了什么?
结语 欢迎来到底层书写的世界
底层书写的局限性是什么?
英文当如何?
访谈和通信
注释
参考文献
附录 钻进中文的“兔子洞”
引言 数字时代的中文
(节选)
一种离奇的新型认知障碍让十多亿讲中文的人凌乱了。
他们开始忘记怎么写汉字了。
至少,传言中是这样说的。
当世界刚刚迈入 21 世纪,类似的报道就流传起来,每篇报道的叙事线索都诡异地相同。最初,报道对象是一些有能力、有成就的人,而且往往是高级知识分子,比如某位科学家、某位企业家,或是某位作家。接着,这些对象又换成了小学生,他们努力地回想着一些极为简单的汉字的写法。
就像常言说的,他们经常提笔忘字。
有人把这种现象称为失语症,是一种使人丧失说话能力的机能衰退。也有人称之为书写障碍,它是失语症的近亲,主要是指书写能力而非说话能力的丧失。更有人称其为一种“奇特的新型文盲现象”。然而,没人解释得清楚,这种流行病的病理学与现有的医学知识格格不入,它骤然发作,似乎是从科幻小说中直接截取的情节。
“汉字健忘症”——这是人们最终给它贴上的标签。
传言让位于冷静的统计数据:在 2013 年的一项调查中,98.8%的调查对象表示经历过提笔忘字,其中很多人每天都会遇到这种情况。看起来,整个中国都笼罩在一场古怪的“汉字危机”当中。
更加令人不安的是,这种大范围的“汉字健忘症”还具有令人费解的表现。它不像许多公共危机那样影响的是社会的边缘群体——那些弱势的贫困阶层。相反,这种症状顽固地盯上了中国的精英人士。越富有、越文雅的人,越容易遭受攻击。可支配收入越多的人,越容易丧失书写能力。
罪魁祸首终于浮出了水面:数字化书写。“汉字健忘症”在使用电脑、智能手机和平板电脑等电子设备,并在 QWERTY 键盘或触控板的辅助下书写中文的人群中最为普遍。这些人原本还在笔记本电脑或移动设备上稳定流畅地输入着一串串的汉字,然而,一旦这些设备关机之后,他们的大脑仿佛也就随之“停机”了。
我们该如何看待这些耸人听闻的报道?它会不会是数字时代下的又一场道德恐慌——不论是关于“网络缩略语”(Textspeak)、表情符号、手写没落等问题,还是关于“语言卫生”(language hygiene)之类的问题?或者说,21 世纪的中国是否会成为一个拥有数亿新型失语症文盲或存在书写障碍的健忘症患者的国度?果真如此的话,为什么我们在自己周围找不到有关这一危机的证据呢?它是某种系统性崩溃的预兆吗?比如说,高等教育的崩溃?那么,中国为何得以成为世界上最具活力、资源最丰富的数字经济体之一呢?中文互联网又为何呈现出一派活跃景象?中国的互联网用户数量预计已达到了九亿人之众,在这里,每时每刻,海量的中文内容被高强度地传输着。如果连中国那些参与网络交互最多、最懂技术的个体都“不会写字”(这是对书写障碍的基本界定)了,那么究竟是谁还在从事这些汉字的书写活动?
《中文计算机》是所有语种当中首本关于数字时代中文的历史书。本书以超过十五年的研究为基础,追溯了电子化中文从“二战”结束之初的兴起,直至当今实现全面发展的历史。它基于口述史料、人工制品,以及从散布在亚洲、欧洲和北美洲的数十所藏馆中收集的档案资料,讲述了一系列古怪而聪颖的人物的故事,他们来自 IBM 公司(即国际商业机器公司)、美国无线电公司(RCA)、麻省理工学院(MIT)、美国中央情报局(CIA)、美国空军、美国陆军、五角大楼、兰德公司(RAND Corporation)、英国电信巨头大东电报局(Cable and Wireless)、硅谷、日本业界,以及中国的知识界、工业界和军事领域的高层。
不过,本书并非仅限于呈现一群形形色色的处于不利条件的人物,它也试图对有关中文计算机技术的六大核心维度进行解读——这六大技术原理是我们理解数字时代中文的关键。
我们对这些原理的探索之旅始于中国河南省的一间透着寒气的礼堂,在 2013 年 12 月的冬日,正值“汉字健忘症”危机愈演愈烈之时,55 名信息技术能手汇聚于此。他们此次不是来抱怨“提笔忘字”之苦的,而是力争在激烈的竞技中拔得头筹:取得打字大赛的第一名,赢得作为中国(或许也是世界)最快电脑键盘录入者的殊荣。
本书揭示了一段关于中文输入法发明的历史,这些连人机交互领域的专家都未必知晓的往事,如今首次得以精彩呈现。
——翟树民(谷歌首席科学家)
墨磊宁提出了一个大胆的论断:中文计算机的发展,已然改变了书写的本质。
——泽夫·汉德尔(《汉字学》作者)
1.榜单收割机《中文打字机》的续作
深圳读书月“年度十大好书”、《出版人杂志》书业年度致敬图书、《新京报》年度阅读推荐……收割多个榜单的《中文打字机》续作推出
比前作更贴合当下的技术语境,更波谲云诡的时局变幻,更完整的理论建构,接着打字机把中文的故事讲下去……
2.一书解读中文输入法诞生的曲折历程
电报代码?按笔画输入?汉字罗马化?直接打出汉字的定制键盘,还是QWERTY键盘?拼音输入法如何从上百种中文输入法中脱颖而出?
现代中国的重大事件如何影响了中文输入的历史?
3.透视中文输入的技术逻辑,罢演西方计算机的数字东方主义戏码
挑战人们对计算机的固有想象:一台在语言上中立、一视同仁、开放包容的机器。
事实上,它具有根深蒂固的“西方性”,而计算机的普遍适用正是由中文输入法发明家、中文计算机改装者推动的。
从打字机时代“所打非所得”的特例到“底层书写”概念,墨磊宁逐渐完善了自己的中文技术语言学体系
4.从苦苦追赶到引领未来,中文输入技术可能才是人工智能时代的答案?
在现代信息技术领域中,中文一直是世界上最慢的书写系统之一,长期被打上笨重、极端复杂的标签。但为何在计算机时代,中文突然赶上甚至超越了世界其他文字的输入速度?
“不是西方设计的计算机拯救了中国和非西方世界,而是中国和非西方世界拯救了西方设计的计算机”
语料库、云输入、智能输入……“书写已经变了。我们关于它的理解框架也必须随之改变”
5.特别收录“明快打字机”重见天日的动人故事
2025年,早先被认为佚失了的“明快打字机”原型机在纽约的一处地下室被发现,本书特别收录《纽约时报》专题报道,讲述作者与这个机械传奇的第一次“久别重逢”,以及如何被中文的魔力吸引,钻进“兔子洞”的故事。
第一章 输入法女士:IBM 公司、刘淑莲和电子化中文的黎明
(节选1)
感谢您提供的回忆记录。
我就是演示中文打字机的那位女士。
当我读到这条评论时,我的心跳开始加速。
在 2010 年 6 月,我发了一篇博客,内容是关于我发现的一段旧时期的黑白影片。影片展示了一台 IBM 公司的电动中文打字机,这是一台于 1947 年首次亮相的令人着迷的原型机。
机器旁坐着一位年轻女子,她的身旁站着记者和一位中年华人男子——机器的发明者高仲芹。她从设备中抽出一张纸,对着镜头微笑。高仲芹咬着嘴唇,目光在打字员和人群之间来回穿梭。他显得很紧张,我是知道原因的,那时我已经花了数年时间去研究这个人:从他的职业声誉到他的家庭储蓄,一切都将取决于这位年轻女士的表现。但这位女士又是谁呢?对于她,我仍然几乎一无所知。
唯一可以确定的是,我曾见过她。我开始翻阅我的文档资料:成千上万的历史照片、技术手册、专利文件、档案文件、口述历史、古董机器等等,这些都是从世界各地拼凑起来的。中文计算机的历史没有现成的档案,所以一切都要从头开始整理。不知不觉间,我在我位于旧金山的办公室、车库以及不久后的储藏室里搭建起了一个世界上最大的中国现代信息技术资料库。
果然,我在 IBM 公司 1947 年的一本精美手册中找到了她。接着又在一本中文杂志的封面上看到了她。然后又接二连三地在很多资料中找到了她。为什么她在中国电气自动化的早期历史中如此突出?对于这台被 IBM 公司认为复杂得无可救药而最终放弃的机器,她当时又是如何驾驭的呢?
高仲芹的打字机与历史上的任何打字机都不一样。在大多数机器上,我们在键盘上输入的内容就是我们在页面上看到的内容。当按下标有“L”或“?”或“Д”的按键时,我们就会看到“L”或“?”或“Д”字符被印在页面上。一字一键。按键与压印一一对应。这是一目了然的。
而这台 IBM 公司的设备则不然。虽然它在页面上输出了汉字,但是键盘上并没有汉字。实际上,键盘上连字母都没有。奇怪的是,上面只有阿拉伯数字——总共 36 个数字键,被分为四组:0 至 5,0至 9,0 至 9,以及 0 至 9。就像变魔术一样,这位年轻女士只需通过这 36 个按键,就能输出 5400 个不同的汉字。
她的所打非所得。
这台机器也不像我们输入单词“cat”(猫),即“c-a-t”那样,一部分一部分地“拼写”汉字。相反,这些神秘的数字起到了一种电子“地址”的作用,打字员将它们输入机器,然后机器据以从存储器中检索想要的汉字:一个类似于硬盘的滚筒,在机器笨重的铜灰色底盘中不停地旋转。例如,如果你想打“田”字,你可以输入对应的四位数地址“0-2-1-6”——同时按下这四个按钮,就像钢琴师弹奏和弦一样。如果想输入汉字“大”、“果”或“聽”(听),则需要以和弦(组合键)的方式同时按下“0-1-2-1”、“0-4-1-2”或“1-0-8-9”。然后,这台机器就会输出完整的汉字:用一个小锤敲击旋转的滚筒,将刻印在其表面的汉字转印出来。
当然,IBM 公司的这台中文打字机并不属于“计算机”,它既不能运行预置的应用程序,也不提供任何形式的内存。然而,它却是随之而来的中文计算机时代的一个重要先驱,它体现了我们为了理解数字时代的中文,以及更广泛意义上的底层书写而必须面对的第一个关键问题:
人类操作实时代码的能力极限在哪里?
或者更直接地说:一个普通人到底能驾驭多少个代码?
如果说,在 21 世纪,数以亿计的中文计算机用户可以通过长串字母数字编码——甚至是看似无意义的字符串——生成汉字,如我们在引言中提到的黄振宇的“ymiw2klt4pwyy1wdy6”,那么,在这段摄于 1947 年的影片中,这位打字员所做的事情与七十年后是极为相似的。她完全是在用代码操作,而且面带微笑。
实际上,她在 1947 年的工作要比今天的中文计算机用户更加困难。毕竟,在如今的计算机时代,“弹出菜单”已成为所有中文输入法编辑器的一个重要组成部分,而她在当时是无法享受这一便利的,需要在没有提示的情况下完成这一艰巨的记忆力壮举。这台IBM 公司打字机上没有反馈回路——在将墨水压印到纸面之前,用户是无法进行“预览”的。该机器也不包含任何类型的输入法。或者说,输入法就是她本人,如果不能准确地记住代码,等待她的只有失败。
当然,许多职业都需要用到代码。密码分析师和安全专业人员就是典型的例子。然而,他们的代码不是“实时的”:这些代码的创建和破解有时需要耗费相当长的时间。就实时的代码运用而言,更有代表性的例子包括电报员、应急响应人员、法庭速记员、受过专业训练的音乐家、警察,甚至杂货店店员。这些工作要求人们记住一些代码并即时运用它们,就像分毫不差地视奏音乐一样。
不过,这位女士的工作在复杂度上超过了上述所有案例。熟练的电报员和业余无线电操作者可以泰然自若地接收和发送摩尔斯电码,但是如果摩尔斯电码包含的点划组合达到了数千个而非几十个,他们的表现又会如何呢?如果杂货店的店员需要记住 10000 个商品代码,那么在收银台等候结账的队伍又要花费多长时间呢?一定存在某个临界点,超过这个临界点,人脑就无法再以代码的方式实时运作了。但这个极限在哪里呢?这位女士——不管她是谁——似乎就站在那个悬崖边上。
正如我们将看到的,高仲芹的四位数代码的问题(即普通打字员是否真的能够使用它的问题)多年来一直困扰着 IBM 公司的工程师和高管。他们曾在私人通讯中对此进行了争论。他们甚至聘请了一位中文研究领域的领军人物来帮助他们解答这个问题。他们迫切地希望打入中国市场,但又无法抑制心中的疑虑:这是一种可行的人机交互模式吗?
这让我想起了自己在 2010 年 8 月的某天收到的神秘信息。
“感谢您提供的回忆记录,”上面写道,“我就是在近期得到修复的影片中演示中文打字机的那位女士。如果您想了解更多信息,请与我联系。”
难道真的是她?一位现年 90 多岁的女士真的看到了我的博客?还是某个闲得无聊的网友编造了一个离谱的恶作剧?我必须做出回应,但要保持警惕:
亲爱的刘女士:
我是墨磊宁,此番致信是为了回应您近期在我的一篇关于中文打字机的博客下的留言。收到您的留言,我非常激动,只是想确认一下:您真的是与高仲芹联合演示IBM公司中文打字机的那个人?
非常感谢您的联系,我热切期待您的回复。
墨磊宁
附言:请问您用汉字书写的中文名字是什么?
我的这则附言相当于某种识别口令:因为从我多年的档案研究来看,这个问题,除了刘女士本人或认识她的人,一般人是答不上来的。
她给出了准确的答复。
疑虑消除了,我立即做出回应,心头萦绕着一大堆问题。她是如何参与 IBM 公司项目的?她的背景是什么?使用这台机器的感觉如何?她是如何记住所有那些四位数代码的?我迫不及待地想和她当面谈谈。
但随后便是一段时间的沉默。我给刘女士发送的电子邮件一连几周都没有得到回复,后来又过了几个月。我礼貌地发送了一封跟进邮件。又是沉默。最后,这条线索完全中断了,我也不清楚是怎么回事。
又过了八年,在刘淑莲女士的一位朋友兼前雇员的帮助下,我才与她重新取得联系。这位友人看到了我的另一篇博客文章,于是决定联系我,就像刘女士当初一样。我们通过电子邮件聊了几句,他同意帮我牵线,看看刘女士是否有兴趣再聊。或许是有了熟人的引荐,我得以如愿同她通话。
所有的等待都是值得的。
“你找了我十年呐。”电话一接通,她就惊呼道。通过电话,我能听出她的微笑,这让我的思绪也回到了 1947 年的那段影像。
她说得没错。当我第一次看到刘淑莲的照片时,我才 29 岁。而在和她通电话时,我已经 40 岁了。
而她跨越了更为长久的时空。在 1947 年的 IBM 公司宣传片中,她只有 22 岁。
而在和我通话时,她已 95 岁高龄了。
我简直不敢相信,我终于和她通上话了。
|
|
|
| 会员家 | 书天堂 | 天猫旗舰店 |
| ![]() |
| 微信公众号 | 官方微博 |
版权所有:广西师范大学出版社集团 GUANGXI NORMAL UNIVERSITY PRESS(GROUP) | 纪委举/报投诉邮箱 :cbsjw@bbtpress.com 纪委举报电话:0773-2288699
网络出版服务许可证: (署) | 网出证 (桂) 字第008号 | 备案号:桂ICP备12003475号 | 新出网证(桂)字002号 | 公安机关备案号:45030202000033号