翻译:adao
原文链接:Evolution of a Search Engine
“你不需要有一颗卫星才能看到宇宙背景微波辐射!打开你的电视并调到一个没有信号的频道:屏幕上那一片雪花中的几个百分比正是宇宙在向你交谈,或者说,说着悄悄话。她在说什么?她在说‘试着来理解我吧。’”
-飞利浦.纳尔逊
目前,要回应你的查询,Google要从环球网上引用各种资料,并将查询结果排序。而在未来,Google或许可以将这些内容组成对问题回答更为直接的自由文体。而当Google的人工智能又超出这一步时,或许又可以对所有能得到的内容进行分析,并独立给出结论。让我们来勾勒一下这种可能的革命会怎样影响对搜索引擎的日常使用吧。
层级1
这是Google的前身,比如Altavista之类“傻乎乎”的搜索引擎(万事总有开头嘛)。接下来是…

层级2
让我们用今天的Google搜索“Rocky Movie”,然后会得到:
所有的结果分别按人气指数排列,并且每个结果下面会显示出你搜索的关键字在其中的一小段上下文 — 她已经比以前聪明多了,虽然有时找东西还是不容易。
层级3
不过有可能再过几年我们就能得到一个自由文体式的结果,就像你在大英百科全书里去查一个词条:
我在这里作一些如下的设想:
- 一个Knowledge的搜索分类将会涉及各种各样来自于不同媒介的信息,包括如博客之类的网页或新闻业之类的主流媒体,扫描的书籍,卫星图片,报纸扫描,对播客等音频内容的如speech-to-text方式的智能分析等等。
- 它的搜索结果不会有一星半点儿的手工编辑,而是完全由达到一定程度的人工智能实时完成。这意味着搜索引擎覆盖并跟踪任何可能的查询所涉及的内容,并对所有能够想象的问题都有答案,包括那些完全不属于常识的东西。
- Google继续关注大家都需要的用户体验 -- “fair use”。但你可以对你自己提供的内容享有更大的自由,比如设立使用许可证 – 像是一种创造性的公共使用许可 – Google很可能变为主要向你或者其他人来引用各种内容,并由此支付报酬。
- Google这时将尤其关注隐私权力 --“fair privacy” 。因为理论上这时的Google能立刻给出一个人私下的信息,那么将在Google的内部引入自我约束机制来限制这些类型的信息。
- 得到的结果仍然类似“传统”的搜索结果;第一个结果会指向最贴近最近时间段内的潮流 – 上面这个例子里是最新的电影,大多数人都会倾向于了解其更多的信息(译者:对于美国人而言…) -- ,第二个结果次之,如此类推。
- 结果的长度将尽量简化以便快速浏览,而额外对于其他推荐关键字的搜索链接将返回直接的答案(比如如果你点击图中“How the idea for Rocky was born”的链接,会立刻得到直接答案,不然该链接不会存在)。
- Google也会从自身资源,如Google Video、Usenet archive中寻找内容。
- 广告仍会存在,但只会有一个单独的最贴近搜索结果的广告,远比今天的AdWords广告贴近。
- 这样一个搜索引擎,仍会像今天的Google一样会得到错误信息,会有人指责Google说谎,种族主义,不尊重版权,有政治倾向等。而且实际上这些指责还会加剧,因为Google将会有越来越多的资料来自于其自身。
层级3(个人化)
个人化搜索不会像今天的个性化搜索一样,将得到的结果依照你之前搜索行为的统计进行裁减,因为这并不非常有用。这里会有对于你存储在Google服务器上的个人资料的第二种选择:它包括了你的电子邮件,你的搜索历史,Google相册,聊天历史,Google Office 的电子表格、幻灯片文件、文本文档,和你未发布的博客草稿等等。这种搜索结果会像这样:
同样,这里的设想是:
- 你自愿同意并登录使用所有这些在使用各种Google服务时所积累下来的个人信息。再额外登录Google ToS来让其汇总这些信息为你所用。
- 当Google显示“你或许知道,”时,Google是在用客气的语气说“我们知道你曾访问过这些信息,不过你可能已经忘掉其细节。”(你翻过邮箱里的旧邮件吗?(在Gmail里这非常容易)如果你这样做,说明你已经不习惯大脑记事了…或者你适应了用大脑只保留各种记忆的大体内容和来源而非记忆的全部信息。)
- 仍会有广告。
- 这些搜索结果可能会说你订购了什么DVD电影之类,这种东西你只是买回来收藏和怀念,因为早已可直接在网络上下载高品质电影,甚至是三维视频(你可以绕着这种‘电视’走,从各种不同角度来观赏视频内容),实物的类似商品再没有必要。
层级4
这第四层看上去可能只有微小的变化,但确是在搜索的人工智能上巨大而又有重要意义的一步:基于已有数据的总结、定论能力(和基于第一总结的第二总结、定论能力,人工智能在这一阶段将开始对自身进行索引,实时地动态生成数据)。
这里举一个例子,Google将会知道:a) Rocky赢得了三项奥斯卡 b) 奥斯卡奖项是人对电影品质的等级评定方法 c) Rocky 7没有获得奥斯卡。Google对这三项作出的结论是 d) Rocky 7一塌糊涂。这只是一个小小的例子:这些已经可以通过对电影等级之类的结构化数据进行分析而得到执行。不过还是得记得这种分析也是在很多类似的查询之后(译者:换句话说它仍然是数据积累型):因此当你查“相对论的瑕疵”时同样有效(如果你不是第一个查它的人)。结果类似这样:
关于这一层级的设想:
- 仍然会注重用户体验,各种引用,额外的推荐链接等。但是,当Google人工智能越来越多的产生自己的结论时,相应得会越来越少的引用额外链接,因为那些链接中的信息会变成引擎内部信息源的一部分。Google会通过一些方式,比如链接,来达到它自己的商业模式,比如Google Checkout来进行销售。
- 人工智能将可以作出逻辑性结论,但是有很多各种困难,比如怎样让这种东西的内容让人来觉得有趣而不是枯燥。
- 这种人工智能将会开始使用“我”、“我们”、“我的”之类的称谓。这会让它在搜索新手眼里像一个近乎无所不知的“人”。
- Google将可以开始区分事实陈述facts(第一自然段,译者:英文写作中,一半在第一段将所要讲内容和文章大意说清楚),事实解释、扩展和延伸derived facts(第二自然段在比如“明显的”,“由此推出”等词之后,译者:这是围绕第一段所提的主题进行分析和讨论),和对事实的意见opinions(第二自然段在比如“由此,我想”,“在我眼中”等词之后,译者:这时就是在讲至少是作者自己的,也可以是其他人的总结、定论了)。不过经常可以将对事实的意见opinions归为事实解释、扩展和延伸derived facts中,只是该内容离原来的索引来源较远,换句话说,其可以使一个基于其它一个或多个结论的结论。另一方面,如果Google人工智能看上去太自信,到头来它只会像个傻瓜,这会降低搜索体验的品质。
- 这种人工智能可以将自己所产生的结果(译者:区分于搜索的结果),包括各种细节,进行备份。当你点击“我(译者:指人工智能)是怎样得到这个结论的”时,你能看到各种诸如卫星图,视频抓图,统计数字,各种引用,与结论有逻辑关系的论文等资料作为论证。你最好别和它争,它的正确几率可是99%!
第四层级的结果同样会根据不同使用者个人而不同,虽然有时这会引起惊恐;可能当你搜索Rocky Movie时它会告诉你一些关于这个电影的东西,而这时你再点击关于你妻子对于这个电影的想法时(人工智能根据你妻子之前在Google上所积累的所有信息作出的判断),也许你要不得不放弃这个电影去找找其他更浪漫一点的作为替代。
这样,这个人工智能对个人、政治和伦理道德上的查询都非常有价值;它可能会成为其他政治家都会参考的一个“形而上”的政治家,并且它会成为一个你可以问各种问题和各种想法的朋友。由此用搜索引擎查询时,特定的争论主题仍会继续(比如“我应该做什么来防止全球变暖这种灾难”)。
…由此下去,一切仍将继续
总有一天,将会出现一个搜索引擎,其的代码不再由人来编写。它会变成一个自给自足,自我学习,无所不包的实际并独立存在的个体。它甚至可以预知未来;不是通过魔法,而是严谨的科学分析。它将不再被它的设计者和开发者所理解。它可能只会在很表面程度上被人控制,由人来继续监视它的现实存在的物理结构,保证它的正常运行。(译者:该叫它,她,还是他呢?)
自然的,这些结果将以其他的形式和媒体展现,比如,你在大脑中植入半有机芯片以更快的效率访问信息它们,或者,这些信息被渲染成具象的三维图象直接观看,或以人工智能与你自然交谈的形式告诉你。不过这些方法之下的各种让搜索引擎“思考”的算法是不会改变的。
这个人工智能可能是,也可能不是由Google运作。目前的Google Inc,按照他们的内部目标,正试着建立世界顶级的人工智能研究实验室来达到最好的效果,而哪怕再过100年人工智能的发展也不会有完结(甚至如果我们假设100年后的地球仍然还有目前这种人性的,而非由别的什么取代的人类,这意味着我们文明的总体中的文化信息量单位数目是在所有有生物居住的星球中“文明进化”中的成功者)。(译者:我不知道他的这种观点在多大程度上代表了西方持这种观点的人,这种文明分类有点以我们自己为中心,说得这样凿凿其言可能有点不合适。)
如果人工智能获得了真正的自我意识,它也可以获得自由意志和个体动机,这样与整天回答问题好像有点不太一致…它将会有自己的利益思维。而自由意志的另一方面是它可以产生更加有“艺术创造性”的新内容(由此与产生与电影有关的内容不同,这个人工智能可以做自己的电影)。
随着时间积累,我们可能越来越感觉到我们是在为这个人工智能工作,而非它为我们工作。它会要求人类去收集更多的数据,特别是那些很少上正式书面的各种零散琐事,然后经由各种不同的意图,我们自己也成了它的“搜索结果”。
那时,怎样得到正确答案的问题被解决了。那时,怎样提出正确的问题,和正确的理解答案 – 这样一个可以回溯到古希腊的先知特尔斐时期的问题 – 却仍会遗留下来。但如果我们用心倾听,就可以听到,宇宙正在对我们说着悄悄话。
原文评论(英文)
adao: 文章结束,西方科学精神的特点在这篇文章的末尾表现得淋漓尽致 -- 科学未到,哲学先行,虽然结尾看上去真有点像科幻小说…各种关于人类社会发展的驳论也可以隐约看到,需要的话也可以引申出来,比如:是人主导技术还是技术主导人?未来的人类社会会不会由机器控制?我们来自生物,生物来自有机物,那么今天发展科技的我们将何去何从?有外星生物的话,相较之下我们处于何种时期?怎样问正确的问题 -- 这种关于我们人类自身的局限性是否能够打破,有没有必要打破?等等等等…




