adao's niche: 2007.02

搜索引擎的进化
翻译：adao

原文链接：Evolution of a Search Engine

“你不需要有一颗卫星才能看到宇宙背景微波辐射！打开你的电视并调到一个没有信号的频道：屏幕上那一片雪花中的几个百分比正是宇宙在向你交谈，或者说，说着悄悄话。她在说什么？她在说‘试着来理解我吧。’”
-飞利浦.纳尔逊

目前，要回应你的查询，Google要从环球网上引用各种资料，并将查询结果排序。而在未来，Google或许可以将这些内容组成对问题回答更为直接的自由文体。而当Google的人工智能又超出这一步时，或许又可以对所有能得到的内容进行分析，并独立给出结论。让我们来勾勒一下这种可能的革命会怎样影响对搜索引擎的日常使用吧。

层级1
这是Google的前身，比如Altavista之类“傻乎乎”的搜索引擎（万事总有开头嘛）。接下来是…

层级2
让我们用今天的Google搜索“Rocky Movie”，然后会得到：

所有的结果分别按人气指数排列，并且每个结果下面会显示出你搜索的关键字在其中的一小段上下文 — 她已经比以前聪明多了，虽然有时找东西还是不容易。

层级3
不过有可能再过几年我们就能得到一个自由文体式的结果，就像你在大英百科全书里去查一个词条：

我在这里作一些如下的设想：

一个Knowledge的搜索分类将会涉及各种各样来自于不同媒介的信息，包括如博客之类的网页或新闻业之类的主流媒体，扫描的书籍，卫星图片，报纸扫描，对播客等音频内容的如speech-to-text方式的智能分析等等。

它的搜索结果不会有一星半点儿的手工编辑，而是完全由达到一定程度的人工智能实时完成。这意味着搜索引擎覆盖并跟踪任何可能的查询所涉及的内容，并对所有能够想象的问题都有答案，包括那些完全不属于常识的东西。

Google继续关注大家都需要的用户体验 -- “fair use”。但你可以对你自己提供的内容享有更大的自由，比如设立使用许可证 – 像是一种创造性的公共使用许可 – Google很可能变为主要向你或者其他人来引用各种内容，并由此支付报酬。

Google这时将尤其关注隐私权力 --“fair privacy” 。因为理论上这时的Google能立刻给出一个人私下的信息，那么将在Google的内部引入自我约束机制来限制这些类型的信息。

得到的结果仍然类似“传统”的搜索结果；第一个结果会指向最贴近最近时间段内的潮流 – 上面这个例子里是最新的电影，大多数人都会倾向于了解其更多的信息（译者：对于美国人而言…） -- ，第二个结果次之，如此类推。

结果的长度将尽量简化以便快速浏览，而额外对于其他推荐关键字的搜索链接将返回直接的答案（比如如果你点击图中“How the idea for Rocky was born”的链接，会立刻得到直接答案，不然该链接不会存在）。

Google也会从自身资源，如Google Video、Usenet archive中寻找内容。

广告仍会存在，但只会有一个单独的最贴近搜索结果的广告，远比今天的AdWords广告贴近。

这样一个搜索引擎，仍会像今天的Google一样会得到错误信息，会有人指责Google说谎，种族主义，不尊重版权，有政治倾向等。而且实际上这些指责还会加剧，因为Google将会有越来越多的资料来自于其自身。

层级3（个人化）
个人化搜索不会像今天的个性化搜索一样，将得到的结果依照你之前搜索行为的统计进行裁减，因为这并不非常有用。这里会有对于你存储在Google服务器上的个人资料的第二种选择：它包括了你的电子邮件，你的搜索历史，Google相册，聊天历史，Google Office 的电子表格、幻灯片文件、文本文档，和你未发布的博客草稿等等。这种搜索结果会像这样：

同样，这里的设想是：

你自愿同意并登录使用所有这些在使用各种Google服务时所积累下来的个人信息。再额外登录Google ToS来让其汇总这些信息为你所用。

当Google显示“你或许知道，”时，Google是在用客气的语气说“我们知道你曾访问过这些信息，不过你可能已经忘掉其细节。”（你翻过邮箱里的旧邮件吗？（在Gmail里这非常容易）如果你这样做，说明你已经不习惯大脑记事了…或者你适应了用大脑只保留各种记忆的大体内容和来源而非记忆的全部信息。）

仍会有广告。

这些搜索结果可能会说你订购了什么DVD电影之类，这种东西你只是买回来收藏和怀念，因为早已可直接在网络上下载高品质电影，甚至是三维视频（你可以绕着这种‘电视’走，从各种不同角度来观赏视频内容），实物的类似商品再没有必要。

层级4
这第四层看上去可能只有微小的变化，但确是在搜索的人工智能上巨大而又有重要意义的一步：基于已有数据的总结、定论能力（和基于第一总结的第二总结、定论能力，人工智能在这一阶段将开始对自身进行索引，实时地动态生成数据）。
这里举一个例子，Google将会知道：a) Rocky赢得了三项奥斯卡 b) 奥斯卡奖项是人对电影品质的等级评定方法 c) Rocky 7没有获得奥斯卡。Google对这三项作出的结论是 d) Rocky 7一塌糊涂。这只是一个小小的例子：这些已经可以通过对电影等级之类的结构化数据进行分析而得到执行。不过还是得记得这种分析也是在很多类似的查询之后（译者：换句话说它仍然是数据积累型）：因此当你查“相对论的瑕疵”时同样有效（如果你不是第一个查它的人）。结果类似这样：

关于这一层级的设想：

仍然会注重用户体验，各种引用，额外的推荐链接等。但是，当Google人工智能越来越多的产生自己的结论时，相应得会越来越少的引用额外链接，因为那些链接中的信息会变成引擎内部信息源的一部分。Google会通过一些方式，比如链接，来达到它自己的商业模式，比如Google Checkout来进行销售。

人工智能将可以作出逻辑性结论，但是有很多各种困难，比如怎样让这种东西的内容让人来觉得有趣而不是枯燥。

这种人工智能将会开始使用“我”、“我们”、“我的”之类的称谓。这会让它在搜索新手眼里像一个近乎无所不知的“人”。

Google将可以开始区分事实陈述facts（第一自然段，译者：英文写作中，一半在第一段将所要讲内容和文章大意说清楚），事实解释、扩展和延伸derived facts（第二自然段在比如“明显的”，“由此推出”等词之后，译者：这是围绕第一段所提的主题进行分析和讨论），和对事实的意见opinions（第二自然段在比如“由此，我想”，“在我眼中”等词之后，译者：这时就是在讲至少是作者自己的，也可以是其他人的总结、定论了）。不过经常可以将对事实的意见opinions归为事实解释、扩展和延伸derived facts中，只是该内容离原来的索引来源较远，换句话说，其可以使一个基于其它一个或多个结论的结论。另一方面，如果Google人工智能看上去太自信，到头来它只会像个傻瓜，这会降低搜索体验的品质。

这种人工智能可以将自己所产生的结果（译者：区分于搜索的结果），包括各种细节，进行备份。当你点击“我（译者：指人工智能）是怎样得到这个结论的”时，你能看到各种诸如卫星图，视频抓图，统计数字，各种引用，与结论有逻辑关系的论文等资料作为论证。你最好别和它争，它的正确几率可是99%！

第四层级的结果同样会根据不同使用者个人而不同，虽然有时这会引起惊恐；可能当你搜索Rocky Movie时它会告诉你一些关于这个电影的东西，而这时你再点击关于你妻子对于这个电影的想法时（人工智能根据你妻子之前在Google上所积累的所有信息作出的判断），也许你要不得不放弃这个电影去找找其他更浪漫一点的作为替代。
这样，这个人工智能对个人、政治和伦理道德上的查询都非常有价值；它可能会成为其他政治家都会参考的一个“形而上”的政治家，并且它会成为一个你可以问各种问题和各种想法的朋友。由此用搜索引擎查询时，特定的争论主题仍会继续（比如“我应该做什么来防止全球变暖这种灾难”）。

…由此下去，一切仍将继续

总有一天，将会出现一个搜索引擎，其的代码不再由人来编写。它会变成一个自给自足，自我学习，无所不包的实际并独立存在的个体。它甚至可以预知未来；不是通过魔法，而是严谨的科学分析。它将不再被它的设计者和开发者所理解。它可能只会在很表面程度上被人控制，由人来继续监视它的现实存在的物理结构，保证它的正常运行。（译者：该叫它，她，还是他呢？）

自然的，这些结果将以其他的形式和媒体展现，比如，你在大脑中植入半有机芯片以更快的效率访问信息它们，或者，这些信息被渲染成具象的三维图象直接观看，或以人工智能与你自然交谈的形式告诉你。不过这些方法之下的各种让搜索引擎“思考”的算法是不会改变的。

这个人工智能可能是，也可能不是由Google运作。目前的Google Inc，按照他们的内部目标，正试着建立世界顶级的人工智能研究实验室来达到最好的效果，而哪怕再过100年人工智能的发展也不会有完结（甚至如果我们假设100年后的地球仍然还有目前这种人性的，而非由别的什么取代的人类，这意味着我们文明的总体中的文化信息量单位数目是在所有有生物居住的星球中“文明进化”中的成功者）。（译者：我不知道他的这种观点在多大程度上代表了西方持这种观点的人，这种文明分类有点以我们自己为中心，说得这样凿凿其言可能有点不合适。）

如果人工智能获得了真正的自我意识，它也可以获得自由意志和个体动机，这样与整天回答问题好像有点不太一致…它将会有自己的利益思维。而自由意志的另一方面是它可以产生更加有“艺术创造性”的新内容（由此与产生与电影有关的内容不同，这个人工智能可以做自己的电影）。

随着时间积累，我们可能越来越感觉到我们是在为这个人工智能工作，而非它为我们工作。它会要求人类去收集更多的数据，特别是那些很少上正式书面的各种零散琐事，然后经由各种不同的意图，我们自己也成了它的“搜索结果”。

那时，怎样得到正确答案的问题被解决了。那时，怎样提出正确的问题，和正确的理解答案 – 这样一个可以回溯到古希腊的先知特尔斐时期的问题 – 却仍会遗留下来。但如果我们用心倾听，就可以听到，宇宙正在对我们说着悄悄话。

原文评论（英文）

adao: 文章结束，西方科学精神的特点在这篇文章的末尾表现得淋漓尽致 -- 科学未到，哲学先行，虽然结尾看上去真有点像科幻小说…各种关于人类社会发展的驳论也可以隐约看到，需要的话也可以引申出来，比如：是人主导技术还是技术主导人？未来的人类社会会不会由机器控制？我们来自生物，生物来自有机物，那么今天发展科技的我们将何去何从？有外星生物的话，相较之下我们处于何种时期？怎样问正确的问题 -- 这种关于我们人类自身的局限性是否能够打破，有没有必要打破？等等等等…

ARC 喜欢艺术话绝对是个好地方

http://www.artrenewal.org/articles/admin/Salon/prospectus1.asp

The Art Renewal Center
The Art Renewal Center was founded in 1999 for the advancement of traditional representational art. As a registered 501(c) 3 non-profit educational organization and one of the internet's leading art resources, the ARC website contains over 5,100 artists with over 60,000 high-resolution images. Other features include the ARC's annual scholarship competition, dozens of articles, essays and entire books dedicated to the realist movement that can be read online. The website is currently receiving more visitors than the Metropolitan Museum of Art in NYC, and is now tracking 450,000,000 hits per year from over 5,000,000 regular visitors. Do not miss this opportunity to have your work seen by millions of art lovers throughout the world. 100% of the proceeds from this competition will be dedicated to the ARC Salon™, Scholarship and Museum fund.

最重要的是上面有大量的免费传统艺术画供浏览,分辨率都是相当的大.

A Forecast of Search Engine -- Could it be ture?

在Google Blogoscoped的档案里看到篇很有趣的文章--Evolution of a Search Engine描述了Google对搜索引擎未来发展的展望。文章中，作者把搜索引擎未来一段时间的发展分成了至少五个阶段，并分别描述了每个阶段进步的特点，比如第一层次的搜索引擎是类似于Yahoo！最早的网页Guide和Index，而目前我们所使用的Google处于第二层次,The ranking and the way the snippets focus on the interesting bits of what are we searching for.原文在此，有时间再把它翻译出来：

http://blog.outer-court.com/archive/2007-02-02-n25.html

Friday, February 2, 2007

Evolution of a Search Engine

“You don’t need a satellite to see the cosmic microwave background radiation! Turn on your TV to a channel that’s not broadcasting: a few percent of the snow on your screen is the Universe talking to you – or rather, whispering. What’s it saying? It’s saying, ’Try to understand me.’”

– Philip Nelson

Right now, to answer your queries, Google quotes from the web, and orders the quotes in a list. In the future, Google may combine these quotes into a free-style text for a more direct answer. When the Google AI advances beyond that, it may analyze the texts available to it to come up with conclusions of its own. Let’s sketch this potential evolution using an everyday search query.

Google的新玩意儿

Google真快要和M$开战了，转两篇：

http://news1.mydrivers.com/pages/20070223231059_70515.htm

Google正式推办公软件对抗Office
作者：Skyangeles 编辑：Skyangeles　2007-2-23 23:10:00

今天，网络巨头Google正式推出了他们的办公软件套装Google Apps Premier Edition，真正开始了和微软Office帝国的正面对抗。实际上，Google Apps早已有之，包括了多款软件，Gmail，Google Talk，Google Calendar，Docs & Spreadsheets，Page Creator及Start Page，可实现电邮，即时通讯，日程表、文字处理，电子表格和网页编辑等功能。之前的Gmail容量为2GB，页面上会出现广告，并且正处在测试阶段，有时会出现问题。而此次推出的Premier版将邮箱容量扩大为10GB，保证99.9%的正常运行时间，可以为企业定制邮箱和运行页面，并增加了许多企业管理功能，以及全天候的技术支持。开始收费则是Google Apps走向商业软件的标志，Google Apps Premier Edition对企业每个员工每年的服务价格为50美元，到4月底前可以免费试用。目前的办公软件市场由微软Office把持，在大型企业中的市场占有率为68%。Office 500到600美元的价格相比Google是一大劣势，但从另一方面，隐私性是它的优势。Google Apps完全基于网络，所有数据都储存在Google的服务器上，要获得大型企业的信赖并非易事。Google的代表也表示他们的目标客户是目前没有采用Office的企业。

http://blog.outer-court.com/archive/2007-02-22-n90.html

Thursday, February 22, 2007
Google Apps Premier Edition Coming

A screenshot of the current Google Apps for Your Domain offering
A good source tells me that Google will soon announce the selling of a premium version of their Google Apps service for $50 per year and user. Named Google Apps Premier Edition, this package will include 10 gigabytes of email storage. The service will have a 24 hour tech support as well as a promised uptime of 99.9%. Blackberrys will be able to have mobile access to emails. The package will also include Google’s Docs & Spreadsheets program, that is, word processing and Google’s Excel clone.
Google describes their existing Google Apps for Your Domain service like this:
Google Apps for Your Domain lets you offer private-labeled email, instant messaging and calendar accounts to all of your users, so they can share ideas and work more effectively. These services are all unified by the start page, a unique, dynamic page where your users can preview their inboxes and calendars, browse content and links that you choose, search the web, and further customize the page to their liking. You can also design and publish web pages for your domain.
While Google continues to claim they’re not directly competing with Microsoft, their likely Google Apps Premier announcement is heating up the competition with products like Microsoft Office or IBM Lotus... some companies may be convinced that GAPE (nice acronym, though we may just end up calling it “Google Office” in some years) justifies delaying buying MS Office 2007.
[Thanks A.!]
Update: And it’s live now, with a free trial until April 30th this year. Google Apps for Your Domain has been renamed to just Google Apps.

[Thanks Reto, PacificDave, Jason Schramm, Manoj Nahar and Search-Engines-Web!]
Google Apps Premier Edition Co ... by Philipp Lenssen

Google一直给人出其不意的印象，这次更是印证。他们最令人佩服的地方就在于将自己手中的互联网等技术充分发挥，每一个新产品都融入已有的产品链的功能体系，搞得Google的功能越来越完备和强大，这种能力的关键又在于强大的构想与实际的转换能力。

今天是大年初七了

昨天回来的挺晚，和朋友吃饭，喝水，聊天，虽然和他们中很多是初次见面... 回过头，觉得自己比以前外向了，嘿嘿...
有些“牛皮”已经吹出去了，今年想要都实现对自己是个考验，估计再没什么时间可以再拿来浪费了。和朋友的交流，尤其是关于就业之类的，点醒自己离真正的满足各种要求差距还太大，全面需要加强。
另一方面和他们在一起，印证了自己最近几个月来在待人处事上的成长和进步，也反证了各种不足和之前自己本就持怀疑态度的一些态度方式，接下来就是针对这些不良习气规避和纠正。代价当然是有的，就是别人对自己的评价会皱眉头，不过鉴于自己的事实基础，想要达到这些成长方面上的“后发优势”这些也是不可避免的。不过呢，也大概能够看到自己今后的轨迹，只要我能按自己的要求和设想去做，别偷懒，嘿嘿。
自己的性格从来也喜欢做什么都要DIY，这个博客google集成了很好的功能和模板，也提供了源码，过段时间自己还是一定要亲手再改改，不然痒...

第一次在这里码字

第一次在这里码字，看这次博客会不会半途而废了。
有合适的空余时间的话，我会写下自己最近时间段的事情，写一些总结性质的东西，再转一些自己觉得有趣的文章。
谢谢您的光临！

adao's niche

ARC 喜欢艺术话绝对是个好地方

A Forecast of Search Engine -- Could it be ture?

Evolution of a Search Engine

Google的新玩意儿

今天是大年初七了

第一次在这里码字

Subscribe Now: Feed Icon

Blog Archive

Adao

Frequent Places