搜索引擎八年后的机会

来源:百度文库 编辑:神马文学网 时间:2024/04/29 13:10:27
搜索引擎八年后的机会(上)
互联网周刊  2005-08-22 01:21   姜奇平
搜索引擎经过八年的漫长发展,今天才终于被人们认识。它的价值被认识到多少?我认为大约是10%。这10%的价值,已体现在Google、百度、阿里巴巴(加雅虎中国)加在一起的市值中。剩下的90%,将在未来八年中,被潜在的年轻未婚的国家首富们,陆陆续续认识和把握。
进步很小的搜索引擎
很久以前—故事的开头总是这样—1997年5月4日,雅虎中国的“前身”雅虎中文搜索网站,敲开了中国网络门户。我在当天实时写成的《雅虎中文敲开中国网络门户》(又叫《web之门启示录》)中,分析搜索引擎的规律说:“国内也有许多网站,上面流动着大量信息。但由于缺乏信息资产的意识,网站办成了信息流水站,信息进来是资源,出去还是资源,没有变成财富。关键就是没有用信息资产的规律来办。同雅虎比较起来,差距表现为:只在信息产品层次上认识信息,而没有在信息资产层次上认识信息。”
具有讽刺意味的是,这段话指责的相当于互联网1.0时代的门户网站。(当时还没有三大门户,我也是在这篇文章中,才第一次敲定了“门户”这个译法)。而原指望成为相当于互联网2.0概念的雅虎(雅虎中文、雅虎中国),却被阿里巴巴并购了。
那时还没有Google,更没有后来被我们《互联网周刊》的Enet喂了第一口奶才长大的百度,所以这里所说的雅虎,只能视为八年前的搜索引擎的一个代名词。不过就是现在最好的Google和我们看着长大的百度,从我的未来学眼光看来,仍然不太配“搜索引擎”这个概念。黑格尔总是强调,概念是对一事物的完满内涵的体现。现在的“搜索引擎”是如此不完满,以致我要是现在把Google和百度当作“搜索引擎”,八年后还要象现在这样后悔一次。
八年以来,搜索引擎进步很小。在这八年中,我们当年的软盘已被U盘取代;当年的黑白DOS已被丰富多彩的XP窗口取代。可搜索引擎这不争气的东西,怎么说它呢?对Google,我只能说比较失望;对百度,要说失望;对雅虎,得说特别失望。作为搜索引擎的八年鼓吹者,我当然乐观其成;但作为一个最终消费者,我认为它远没有像八年前想像的那样,可以为我们提供理想的服务。
要说进步,这八年来最大的进步,是从第一代的雅虎这样的语形搜索引擎,发展为Google和百度这样的(准)语义搜索引擎。但搜索引擎本可以做得更好而没有做到的,第一是从应用发展为平台,第二是走向第三代语用搜索引擎。这两步没有做到,十六年以后才能实现的自然语言和机器推理,对他们就更遥远了。
所以我们恐怕要寄希望于下一代人了,只有他们才能具有改变世界的战略想像力。
第一位机会:从应用发展为平台
搜索引擎如果在未来八年中,不能从应用发展为平台,整个技术市场就会泡沫化。能否把握这一机会,不仅关系到这一领域企业的命运,而且关系到整个技术应用的命运。性格决定命运,电子邮件的路径锁定就是前车之鉴。电子邮件本来有望成为平台型技术,但由于领导者普遍的指导思想错误,仅仅发育成众多应用中的一种,泯然众人矣。技术人员有一种天生的自大,以为技术无所不能。但无论是搜索引擎还是电子邮件,都是技术与市场结合的结果。华尔街对于搜索引擎的资本寄托,在很大程度上,不是因为看好技术本身,而是因为看好技术与市场结合的前景。如果忽视后一半,资本市场就会用泡沫化来“报复”。泡沫化作为一个经济现象,是对技术人员自高自大的一种否定。
八年来,这一领域缺乏雄才大略的帅才。我是指象盖茨这样的具有产业规划能力的天才。我担忧地看到,Google和百度的领导者,多年来还是在王安的水平上思考问题。王安,包括乔布斯,作为风云一时的IT领导者,最致命的弱点,就是把系统技术当作应用技术看待,把开放的系统搞成了封闭的应用。这种商业失败的思想根源,就是对信息革命的本质认识有误。
搜索引擎与电子邮件,本来从技术本身来说,都既可以发展为平台技术,也可以发展为应用技术。所谓平台技术,就是在上面可以嫁接应用的技术。如果说应用技术是果实,平台技术就是果树;应用技术是门店,平台技术就好比王府井大街。王安和乔布斯的失败在于,他们把“王府井大街”对外封闭了,最后就成了没有产业链应用支持的孤家寡人。
我们反过来看盖茨的战略。Windows 上为什么要提供API?Windows不光是一种应用,同时也是一个服务平台,调用这个服务平台的各种服务(每一种服务就是一个函数),可以帮应用程序达到开启视窗、描绘图形、使用周边设备等目的。由于这些函数服务的对象是应用程式(Application), 所以便称之为 Application Programming Interface,简称 API 函数。Win32 API也就是Microsoft Windows 32位平台的应用程序编程接口。API就相当于在果树上提供开放嫁接的接口,相当于王府井上的招商制度设计。盖茨之所以能战胜王安和乔布斯,就是因为他采用了平台战略,结交天下应用,尽在其中,靠“打群架”战胜了单打独斗的对手。在搜索引擎上利用排名赚钱,实际就是一种将平台应用化的封闭策略。如果是作为平台经营,就应该从别人的应用中赚钱,而不是自己直接做应用,与上下家争利。如果搜索引擎企业认定只做应用,不做平台,那这一行整个就完蛋了,就会像邮件服务那样,作为应用被整合进未来的某个平台中,不可能达到华尔街目前期待的那种产业规模。而在目前市值趋势下,不进则退,最后还得以泡沫化了事。
对于今天年满12岁的少年儿童来说,他们需要大致知道他们的前辈在这方面有难以克服的局限,而他们在这方面还有机会。他们必须思考这样的问题,来打开自己的战略想像力:
首先,为什么搜索引擎不能像操作系统那样,开放接口标准,让别人在自己的平台上赚钱?比如,为什么365Agent这样优秀的搜索应用,目前无法开放地嫁接在百度之上?Google为什么不能海纳百川,将类似的搜索增值服务商,利用API容纳在自己的体系中,使自己专注于搜索平台本身,而不分心于具体应用,结果博而不专?为什么现在的产业链中,骨干的搜索引擎与细分市场的应用搜索服务,分别闭门开发与自己雷同的搜索技术,而不互通有无、分出层次,进行产业分工合作?
其次,为什么搜索以外的企业软件应用,没有类似API的平台接口,可以往搜索引擎平台上嫁接?例如,知识管理软件本质上是以搜索技术为基础的,但不能公用搜索,非私下搜索?为什么打开最先进的手机,上边只有百度为你搜出的五条信息,而不是百度介绍的一万个应用服务商,为你提供从找街头餐馆到厕所的细分市场服务?
第三,为什么电子邮件应用、存储技术应用、文档应用、XML应用、RosettaNet应用、IDC应用……,不能建立在统一的网络搜索“操作系统”上?为什么iPod、电冰箱、汽车……不能依托搜索引擎遥控器操作?
如果这样一圈想下来,就会发现百度现在还活着,实在是一种幸运。幸运在于他的竞争对手Google也是一只战略糊涂虫。从微观上说,技术在进步,商业在退步。从宏观上说,搜索引擎正在进入信息革命的资本时代,搜索引擎本身将不仅是信息革命的蒸汽机,而且是信息的工厂发动机。公共部门在这个问题上严重缺位。没有关于统一搜索技术的规划和标准,没有产业聚集的行业指导,没有围绕降低决策成本的企业制度的前沿设计。公共部门缺乏英国工业革命关于工厂制度的战略想像力,将造成搜索产业的前景不明。
我们可以把上面的机会、现状和问题,总结在一个理论性的结论中:实质上,应用是产品,平台是资本。将应用平台化的本质,是资本化运作、产业化经营。先进生产力的发展要求我们,从1.0时代的产品应用,推进到2.0时代的资本运营。
工业化时期,对工业资源的控制,从重商阶段进入到资本阶段,商人主导被资本家主导取代。今天,这一切在信息资源上重演。一切不按资本逻辑,而只按产品逻辑进行思维的“商人”型企业家,必将被华尔街变成泡沫;如果他是CEO,他将发现资本的意志永远与他背离。

【责任编辑 邸巧云】
搜索引擎八年后的机会(下)
2005-08-29 18:33 来源:互联网周刊 作者:姜奇平 [打印] [关闭]

我们退一步说,如果搜索引擎失去通过平台化形成产业的机会,而只作为单一技术应用继续发展,它的下一步,仍然有许多机会。这种机会—也就是就技术应用谈技术应用的机会—并不依赖平台化和产业化,是搜索引擎自身发展的机会。
以用户为中心看搜索引擎
在具体谈及这些机会前,我们还是从普通最终用户的角度,看看对搜索引擎的不满在何处。这些不满,实际就是未来引擎填补空白的机会。
用户需求
从最终用户的立场看,花费最小成本准确找到所要信息,是根本的需求。对搜索引擎的其它需求,都是由此派生出的二手、三手的需求。
所谓准确找到所要信息,又包含两个基本的方面,一个方面是不遗漏有用的信息,另一个方面是不出现没用的信息。
所谓花费最小成本,包括时间成本和心智成本。在最小成本状态,最终用户以最短时间、最傻瓜化的付出,就可以获得想知道的事情。举例来说,皇帝一个眼神,大臣就知道是什么意思,就能马上提供上中下最佳方案,供皇帝决策选择。这里的大臣就相当搜索引擎。今天搜索引擎的服务水平,只相当于一两个饭筒级的大臣在为比皇帝行政级别还高一级的上帝服务。这就是差距。
需求的意义
搜索引擎需求的根本意义,在于节省用户的决策成本。
节省决策成本就是指:以最小的注意力代价,获得最大程度的有用信息。解决海量信息与有限注意力之间的矛盾,这个问题是信息经济的核心问题。它首先是由诺贝尔奖获得者西蒙提出来的,这个问题曾被无知媒体妖魔化为“注意力经济即炒作”这个伪命题。
“天下熙熙皆为利来,天下攘攘皆为利往”。这个普遍真理,到了第三波人类的具体实践中,这个“利”的核心,就是解决最稀缺的信息选择资源(注意力)与最消耗这种资源的信息不确定性之间的矛盾。或者说,是有序化信息的能力,与信息无序化耗散之间的矛盾。搜索引擎就正坐在信息时代财富的十环靶心上。
基本原理虽然简单,但Google、百度们,也就只能理解七八成(只歪歪地射在七八环上,就可以在纳斯达克冒充冠军,可见现在的小孩子们,一旦稍稍提高准星,未来还有多大赚钱机会)。
直接满足用户需求是根本的需求,而通过满足客户需求间接满足最终用户需求,如竞价排名,则是派生的需求。如果说,派生的需求应由平台基础上的增值开发决定,那么根本的需求,就只能通过搜索引擎的自身完善来做到了。现在这两方面都不到位。而二者又有联系,之所以让派生的需求反客为主,正是因为根本需求满足在平台上的不到位。如果基础电信运营商或微软回过味来,大规模开发开放性的搜索引擎平台,任增值商在手机和电脑上嫁接搜索增值业务,Google、百度们的弱点就会暴露无遗。那时如果不开放的话,恐怕连拥有阿里巴巴那样的平台可遁的雅虎都不如。
那么,像Google、百度们这样的王安式的孤军作战型商业模式,如何自保呢?我认为唯有一途,就是要在引擎本身技术的开发上,跑得比基础运营商和微软快,发挥专的特长。而主攻方向,恰恰在与竞价排名商业模式相反的技术方向上。眼下,解决商业模式与技术方向相反的矛盾,就是Google、百度们在平台战略外要考虑的主要问题。
搜索引擎如何节省决策成本
决策成本是由必要搜索范围、信息量、有用程度、有用信息量这几个要素构成的。这种决策成本是由必要搜索范围内所需处理信息量比上有用信息量构成的。有用信息量越大,同等信息量越有用,决策成本就越低。
从这里可以看出,搜索引擎技术的主要矛盾,就是解决搜索范围与信息有用性之间的矛盾。搜索范围越大,成本越高,有用性概率越高;搜索范围越小,成本越低,但有用性信息概率也越小。如何让搜索范围既不过大,又不过小呢?这就跟有用联系在一起了。否则,或者扩大,或者缩小,都不能使用户满意度最大化。
“有用”,从根本上说,是针对用户语用的。语用是指用户表达意义的上下文环境。这是第三代搜索引擎的理念。所谓智能化、个性化,都要建立在这个基础之上。
我们首先看看现在进行时的技术发展到了什么阶段和水平:
第一代搜索引擎的“有用”,指向的是用户语形。语形也就是用户需求表达在语言上的表面上的意思。只要见到关键词就统统搜出来,不必要地扩大了搜索范围,出现过量无用信息的情况,提高了决策成本。第二代搜索引擎的“有用”,指向的是用户语义。通过本体论挖掘,在元数据结构层面上,解决对“模拟”的语言编码解码的问题;同时通过分词技术和语料库积累,解决关键词与文本的匹配问题。主题词技术和智能文档技术,因此成为这一代引擎的关键引导技术。我所看到的最好的技术,已经可以做到在搜索结果中,不包含关键词。举例来说,花朵,可能只是一个比喻,说的是儿童,而与花卉养殖无关。如果一篇文章全是比喻,不提儿童二字或相关字眼,第一代引擎就无能为力了。但如果利用“用代属分族参”这六性进行元数据结构分析,就可能突破语形。这就是第二代技术。至于通过各种没有基础理论和技术支持的捷径突破语形障碍,那是等而下之的商业作法,不在讨论之列。
但我认为搜索技术还在初级阶段,远没有到头。
未来学的两个命题
几乎所有第一二代的搜索引擎,好像都还没有从决策成本这个角度考虑下一步的发展问题。我抛砖引玉提出两个未来学命题。
命题一:下一代搜索引擎技术,应具有支持感性决策的能力
未来搜索引擎有两种并行的趋势,一种是强化理性决策、逻辑运算的能力;一种是转向感性决策,强化以人为本的能力。后者是代表最终方向的。
对于信息经济这样一种人与技术高度结合的经济形态来说,必须从技术人性化角度反向思考问题。如果以人为本,就必须考虑感性决策,或傻瓜化决策的问题。
技术界有一种非常不好的歪风邪气,就是蔑视经济学、蔑视社会科学的优秀人类文化成果。殊不知,从西蒙到卡尼曼,20多年来诺贝尔经济学奖一直在探索Google和百度们想破了脑子也突破不了的理性局限性问题。现在基本已经有了一个方向,就是感性选择是对于理性选择的简化。调查表明,大多数经理人都是根据直觉来进行决策的。原因在于,根据完全信息进行理性选择的决策条件,实际不是真实世界所能具备的。人们的思维经常要走捷径。思维走捷径,这是下一代经济的典型问题。也就是降低决策成本的问题。
根据行为经济学的研究,感性选择是由当下感觉和框架(FRAME)综合作用的结果。正是由于有框架的校正作用,才能保证直觉高于感觉,克服当下感觉的种种偏差。降低决策成本,是个贯穿整个信息经济的核心问题。搜索引擎服从和服务于这个任务,就必须高度重视通过感性选择方式简化决策的问题。谁反应得快,谁就活下来。
命题二:争夺“框架”,将成为下一代搜索引擎的战略制高点
文科类世界已经看出,感性决策质量的关键在于框架(FRAME)的好坏。
第一,框架的节点性是框架的生命力所在。互联网革命的本质,就是把权力一步一步移交到分布式的节点上,落到实处,就是把权力交给框架。以往搜索引擎还没有从根本上被互联网化;第二,框架的本质是最终用户语用环境。搜索引擎蔑视社会科学直接导致了第三代技术的难产。其中表现在他们对语用问题的陌生上。框架在第三代搜索引擎中的作用,就是在语形与语义技术的基础上,完整准确地把握个性化思想;第三,框架可能有多种存在和表现形式:第一种可能的方式是存在于硬盘,通过Cookie来联接,所以Cookie问题将成为未来经济的第一制高点;第二种可能的方式是托管,也就是变本地存储为网络存储。智能存储技术就会成为制高点;第三种可能的方式是桌面。这是微软和Google的想法。控制桌面,就等于控制了用户的个性化框架数据库;第四种可能是交易平台;第五种可能是移动平台等新兴技术平台。
控制以上这些要点,是成为未来搜索引擎技术新星的必由之路。经过这样一个很不完全的评估,至少可以看到,搜索引擎市场不是饱合了,而是一个洪荒未开的处女地,Google和百度只不过相当于呼伦贝尔大草原上搭的两个蒙古包而已。未来有待于下一代来创造,而首当其冲的,就是要解放战略想像力。