它是一个综合各学科的研究机构,主要为美国政府,尤其是国防部,以及工商企业从事范围广泛的研究,在美国国防、外交、经济、科研等方面都起着重要作用。Adam Cheyer认为,SRI在当时拥有了计算机研究的最高水平——“当时,它能让我做任何和计算机有关的互动,从语音识别、手写识别到各种的人工智能以及虚拟现实。”
1993年,Adam Cheyer在Phil Cohen 手下做第一个项目,Adam Cheyer将其称为“开放式代理人架构(OAA)”。彼时,真正的网页浏览器还未诞生。
Adam Cheyer设想一个靠不断增长的任务分配式的网页服务(当时我们将这种设想称之为 「代理」 ),通过不同的网页服务之间的竞争和合作,最后能完成用户对其分配的任务。
由于OAA实际上是一个整合型的技术,使得Adam Cheyer能和当时很多SRI的优秀人才一起共事。
接下来的六年时间,Adam Cheyer和几位同事David Martin、 Luc Julia、Didier Guzzon一起开发了五十多项应用,每一项都或多或少集成了OAA 里分制的集成技术。比如,智能冰箱能为你找寻新的菜谱,并在线采购缺少的材料;比如你能通过电视应用来控制你的家居家电,整理工作空间等等。你很难想象,这些如今看起来不过是某种物联网应用的东西其实早就存在于SRI的实验室了。
时间来到1999年,Adam Cheyer离开了他熟悉的实验室,进入一家名为Verticalnet上市公司担任工程部副总裁。对于这次跳槽,Adam Cheyer毫无掩饰地说:
“我那时候刚刚结婚,并希望能有钱买一所房子和养育自己的孩子。我认为SRI的工资可能负担不起这些。当时,一个在硅谷的破旧小房子就要卖一百万,这对于我来说是个无法负担的数字。”
重回实验室
Adam Cheyer再回到SRI时,开始主导一个名叫CALO的项目。从SRI到上市公司再到SRI,Adam Cheyer不断寻找真正的创新动力。在他看来,在AI实验室,大部分好的idea从没能被研发和应用到真实世界里,但是在商业领域,迫于股东压力,一个产品的立项和研发都有着精心的考量,然而这些都无法给技术带来创新驱动。
而CALO看起来却与众不同——它是一个DARPA出资2亿美元赞助的项目。在5年时间里,有差不多400名来自全国各地的最聪明的人投入到这个项目中,它的目标很远大:把所有人工智能方面的人机互动接口整合成一个完整的类人的系统,还可以随着环境自我学习和完善。即使不作代码上的改动,系统也可以通过观察用户、人机交流和对所查所感进行自我反馈而变得更智能。
(CALO的愿景)
不过当时,很多人并不看好 CALO 项目。斯坦福大学副教授,科技预言家 Paul Saffo 称:“人工智能的研究屡屡失败,困难重重,正当绝大多数人都认为研究它纯粹是在浪费时间之时,CALO 出现了。”
面对质疑声,CALO用科技的力量证明了自己的价值。人工智能领域有很多独立的分支,把它们整合到一起是一项无比艰巨的任务,但 CALO做到了。它们同时也证明了机器可以像人类一样从自身经历中不断学习。
过去,人工智能软件的训练方式是 「in vitro」 型,即将机器学习算法用于一组固定的数据上,进而判断它处理信息的能力如何。而 CALO 则采用 「in vivo」 型,即通过让其处理一系列不受控制的信息来达到训练的目的。
CALO 的负责人之一David Israel说:“从任何角度看,这个人工智能项目都是史无前例的。”而Adam Cheyer将其称之为人工智能领域的“曼哈顿计划”。
Adam Cheyer的任务是将CALO项目下27支团队建造出的不同组件组合成一个完整的助理。每年,这个虚拟助理都要接受一次测试,来检验它在这一年的时间中都学到了什么。Adam Cheyer打造的这款虚拟助理(名字也是CALO)十分简陋,离消费者的电脑与手机还有很远的距离。但CALO已经可以完成许多原来只能由人类完成的任务了。
正是在CALO项目进程中,Adam Cheyer的Siri正在孕育。
冥冥之中的注定Siri
语音助手背后的大部分想法和技术已经以搜索形式存在好几十年了,但对于它来说,突破的时刻是如何更进一步整合现有的产品。换句话说,如何让语音助手不再是AI实验室博士们的小众产品,要简单到每个程序员都能快速整合到自己软件中,随后进一步大规模地为全世界成千上万的人提供精确的服务。
“在我看来,Siri是世界上第一个多领域,大规模应用的对话性的助手。我觉得我们实现了这个领域里一个不可企及的梦。”Adam Cheyer这样评价Siri的开创性创新。
其实,Adam Cheyer一直在探索各种版本的Siri,最初的版本或许可以追溯到1993年的(OAA)系统,这是一个在类似iPad平板电脑上运行的系统,给一组可扩展的网页服务和应用程序提供多模式(书写笔和声音)的界面,当时整合的很多功能都能在十几年后的iPhone 4S上找到“继承者”,比如电子邮件、日历、通讯录、电话、地图、提醒等等。Adam Cheyer正不断优化他的“孩子”——加入神奇功能的同时剔除不需要的无聊服务。
Adam Cheyer对于Siri的技术前景很有信心,但他并不清楚投资人怎么看。当他和几个公司合伙人前往有“西海岸华尔街”之称的Sand Hill Road拜访VC时,VC们给予了极高的评价,Adam Cheyer回忆说:“当时我一直等着VC们把我们赶出来,但他们一致表示‘如果你能克服技术上的困难,在商业方面就没有问题。’“
(Siri的三位创始人:Adam Cheyer、Dag Kittlaus、Tom Gruber)
VC的支持让Adam Cheyer坚定了创业的决心。Adam Cheyer开始攻克Siri处理人类语言模棱两可的难题。
当人类语音输入”在波士顿预订一家四星级的餐馆(book 4-star restaurant in Boston)“时?Siri怎么想?
(Siri背后的人工智能)
在美国,Book(预定)是一座城市的名字,Star(星级)也是。美国有八个叫做Boston的地方,我们说的到底是哪一个?Star Restaurant是一家餐馆的名字,可是这个例子中我不是在找一家叫做Star Restaurant的餐馆。我还记得第一次我们把这么多的数据源上传到Siri,我在系统里输入「重新开始(start over)」,Siri的回复是,「正在搜索路易斯安那州的Start城的Over公司」。
「下嫁」苹果