揭秘霍金的“小秘书”
霍金于1985年丧失说话能力。当时,在前往日内瓦CERN(欧洲粒子物理研究所)的途中,霍金得了肺炎。在医院中,医生为其配备了呼吸机,他的情况相当严重。医生向霍金当时的妻子珍(Jane)询问,他们能否关闭生命支持系统。珍断然拒绝。霍金随后被转到位于剑桥的阿登布鲁克医院,那里的医生控制住了感染。为了帮助他呼吸,医生实施了气管切开术,这是一种在颈部打一个洞,然后向气管插入导管的一种手法。手术导致霍金从此无法说话。 其后,霍金通过拼写版来交流,他通过眼球的转动,费力地逐个选择字母,然后拼成完整的单词。马丁·金(Martin King)是一位物理学家,他为霍金寻找了一种全新沟通系统,他联系了加利福尼亚一家称之为Words Plus的公司,其开发的计算机程序Equalizer能够让用户通过手指点击来选择词汇和命令。金询问Words Plus的CEO沃尔特·沃拓茨(Walter Woltosz),该产品是否能帮助一位罹患肌萎缩侧索硬化症的英格兰物理教授。沃拓茨创建Equalizer的目的是为了帮助其岳母,后者罹患同样疾病,因而丧失了说话和书写能力。在得知该产品将被用在霍金身上时,沃拓茨表示愿意捐献一套。 起初,Equalizer运行于苹果II型计算机上,配合一家名为Speech Plus的公司开发的语音合成器工作。随后,戴维·梅森(David Mason)改进了该系统。梅森是一位工程师,同时也是照看霍金的护士之一的丈夫。改进后的系统能够安装在轮椅一侧的扶手上。通过该系统,霍金的沟通速度达到每分钟15个单词。 然而,让霍金可以移动拇指的神经也日渐退化。2008年,霍金的手已经虚弱到无法使用点击器。他的研究生助理当时设计了一个称之为“面部开关”的设备,安装在眼镜上,通过红外光束对霍金面部表情进行识别。自那时起,霍金通过唯一可控的肌肉写电邮、上网、著书和说话。然而,他的沟通能力持续退化。到了2011年,他每分钟只能传达1至2个单词,因此,他写了一封信给摩尔,信中说道:“我的说话速度越来越慢,英特尔有什么方法可以帮助我吗?” 摩尔让时任英特尔CTO的贾斯廷·拉特纳(Justin Rattner)跟进这个事情。拉特纳从英特尔实验室召集了由人机交互专家组成的团队,一起出席了在剑桥举办的霍金70周岁生日会。在会上,拉特纳表示将会应用尖端科技来帮助霍金提高沟通速度。他说道:“我们希望团队能够获得突破性进展,找到一种技术来帮助霍金恢复到几年前的沟通水平。” 霍金过于虚弱,以至于无法出席自己的生日派对。因此,他与英特尔专家团队的会面是数星期之后的事了,会面地点位于他在剑桥大学应用数学与理论物理部门的办公室中。由5位专家组成的团队包括了体验技术实验室的主管霍斯特·豪瑟克(Horst Haussecker)、预期计算实验室主管拉马·拉克曼(Lama Nachman)以及交互设计师彼得·邓曼(Pete Denman)。“霍金一直给予我启发,”邓曼说道,他同样也坐在轮椅上。“在我摔断脖子导致截瘫后,我母亲给了我一本《时间简史》。她告诉我,坐在轮椅上的人仍旧可以取得举世瞩目的成就。回首往事,我认为那本书对我来说是一个预言。” 团队成员随后与霍金就面对的问题展开了沟通。在20分钟时间里,霍金勉强写完30个单词,这让团队成员感到问题比原先预计的要严重得多。 霍金的计算机界面是一个称之为EZ Keys的程序,从原先的程序升级而来,仍然出自Words Plus之手。该程序提供了一个软键盘以及基本的单词预测算法。光标逐行扫过每个字母,只需移动脖子就可以停下光标,选择对应字母。EZ Keys也可以让霍金控制Windows中的鼠标及操作其他程序。霍金通过火狐浏览网页,用记事本写字,他也有一个摄像头配合Skype使用。 英特尔团队打算彻底改进这一套老旧的系统,而这需要使用全新的硬件。“贾斯廷认为面部表情识别、眼球追踪及脑机接口技术可以一试,”拉克曼说道。这些尝试中的大多数都以失败告终。因为眼脸的下垂,眼球追踪无法锁定。霍金之前也尝试通过EEG(脑电图描记器)进行脑波读取,进而将命令传送至计算机。不知为何,该技术无法获得足够的脑电波信号。“我们通过在屏幕上显示闪烁的字母让霍金选择,进而对脑部活动进行识别和注册,”伍德表示。“该技术能够很好的用在我身上,但是在霍金那儿没法工作,无法获取足够强大的信噪比。” “随着我们与霍金的交流日益增多,我们也感受到霍金急于提高交流效率的迫切心情,”拉克曼说道。在返回英特尔实验室进行了数月的研究之后,邓曼将一段时长10分钟的视频发给了霍金。视频描绘了全新交互系统的原型,小组等待霍金的反馈。系统没有发生本质上的改变,但是改动也不小,包括可以删除字符或返回到上一个步骤的“返回”按钮、单词预测算法以及下一单词导航。 该原型解决了原先存在的最大问题——霍金无法击键,导致他经常选取了错误的字母,然后不得不等待光标的下一轮扫描。该步骤非常耗时,会让霍金感到很挫败。为了解决这一问题,小组成员使用了类似智能手机输入的方法。iPhone最初面市时,人们非常不习惯其文字预测功能,但是经过一段时间的使用后,用户却感到非常得心应手。问题的关键在于该功能需要系统花费一点时间去学习,一旦系统完成了自己的工作,用户便能持续便捷地使用下去。 同年6月,霍金参观了英特尔实验室,并对改进后的系统感到非常满意。“相对于先前的版本有了大幅提高,”霍金表示。“我真的很喜欢。” 他们随后将该界面整合进霍金的计算机。同年9月,霍金的回馈指出他不太适应这一新系统,太过于复杂,新加入的功能也让他感到困惑。“霍金是世界上最聪明的人之一,但是我们不能忘记,他并没有接触太多现代科技,”邓曼说道。“他从来没有用过iPhone。” 邓曼和其他成员意识到,他们不得不另辟蹊径。 2012年末,英特尔团队设置了一个系统用来记录霍金与计算机交互的方式。他们记录了数十个小时的视频,包含了各种不同情况:打字、感到疲劳时的打字、使用鼠标、尝试打开窗口并调整合适的尺寸。“我反复观看着视频,”邓曼说道。“有时,我用4倍速快进视频,然后发现了一些新的东西。” 2013年9月,在霍金的研究生助理乔纳森·伍德(Jonathan Wood)的协助下,团队成员对霍金的计算机进行了更新。这次,他们自信满满。然而,在接下来的一个月,事情很快变得明朗,霍金仍然不能适应。霍金的助手之一表示,该系统是对霍金的折磨。 英特尔团队在尝试解决霍金的问题上花费了太多的时间。霍金目前在使用来自伦敦初创公司SwiftKey提供的词汇预测器。该工具能够在输入一个字母后给出完整单词的预测结果,而先前的系统要求霍金在界面底部的单词列表中选择。英特尔团队与SwiftKey展开合作,将许多霍金撰写的文档输入系统,这样在基于上下文的预测中,霍金无需每次都输入一个字母。“词组‘the black hole’就无需任何输入,”拉克曼说道。“选择‘the’就能预测‘black’,而选择‘black’就自动预测‘hole’。” 霍金的用户界面的全新版本包括了上下文菜单,并提供了指向文字、搜索或电邮的多种快捷键。全新的演讲管理器让他可以控制演讲的语速。还有一个静音按钮,霍金可以用来关闭语音合成器。“因为他通过面部操作系统,这样在吃东西或旅行途中可能产生随机输入,”伍德表示。 伍德的办公室就在霍金的隔壁,那里更像一个作坊,四处堆放着各种电路板和试验用原型。桌面安装了摄像头,这是英特尔正在进行中的项目的一部分,该项目试图对霍金的面部进行更加复杂的识别。“他可以移动他的下巴,向上或向下,这样他甚至可以在移动轮椅时操作鼠标。这些都是很酷的想法,但是需要花费时间来完善。”伍德说道。 另一个试验项目是霍金所用轮椅的制造商于去年早些时候提出的。该项目通过将一个操纵杆放置在下巴附近,让霍金能够独自操作轮椅移动。 伍德展示了霍金的语音合成器的唯一复制品,它称之为CallText 5010,是1988年霍金参观它的制造商Speech Plus时,该公司给他的。该产品内置一个能够将文本转换成语音的处理器,该技术于20世纪80年代广泛应用于自动答录设备中。 霍金非常迷恋他自己喜欢的声音。1988年,当Speech Plus交给霍金一个全新的语音合成器时,提供了不同的声音,霍金让他们替换回了原先的声音。他的声音在20世纪80年代由麻省理工学院的工程师丹尼斯·克拉特(Dennis Klatt)创建。克拉特是将文本转换为语音算法方面的先驱,其发明的DECtalk是世界上首个能够将文本转换成语音的设备。他最初使用了3种声音,分别来自他本人、妻子和女儿。女性的声音被称为“美丽的贝蒂”,儿童的声音则是“姬特”,而男性声音来自他自己——“完美的保罗”。“完美的保罗”就是霍金使用的声音。 该文章在 2015/1/16 17:15:10 编辑过 |
相关文章
正在查询... |