人工辅助搜索 进步还是退步?

来源:百度文库 编辑:神马文学网 时间:2024/04/29 04:22:00
人工辅助搜索 进步还是退步?出处:网易 | 2007-5-25 10:21:01 | 阅读18571 次许多研究员一直梦想取得谷歌在文本网页搜索上取得的那种成就,为所有的数字化信息建立索引、组织起来和算法化。

对于所有参与了“人工辅助搜索(human-assisted search)”网站建设的网民来说,他们作出的贡献都是伟大的。
1月28日,加利福尼亚海岸风平浪静,计算机科学家吉姆?格雷驾着自己的40英尺长的“Tenacious”号游艇离开旧金山前往距离金门大桥43公里外的费拉隆岛,他打算将刚刚过世的母亲的骨灰撒在费拉隆岛上。他没能在当天晚上回来。
在随后的4天里,美国海岸警卫队搜索了费拉隆岛周围的洋面,但是没有发现他的踪迹。但是格雷的朋友和同事们都不愿意放弃。 格雷现年63岁,是微软公司的一名技术研究员,他是数据库系统和事务流程的开发领域的先驱,在计算机科学社区广受爱戴。 亚马逊、Sun、甲骨文、谷歌、微软和其他许多公司的高管组织了一次私人的搜索,甚至从美国国家航空航天局借来了一架飞机协助搜索,还从测绘公司DigitalGlobe借来了一颗卫星以收集Tenacious号游艇可能处于的地区的影像资料。
尽管搜索的力量相当强大,但是格雷的朋友们知道他们必须寻求外界的更多帮助力量来分析他们收集到的影像资料。因此亚马逊公司的工程师们将那些影像分成很多小块,每一块影像显示300米乘300米的洋面,他们在2月2日将那些图像小块上传到了Amazon Mechanical Turk网站。这个网站是一家有偿人工搜索网站,人们可以通过完成网站上的任务来赚取回报,比如在图片上找寻某些特定目标。对于计算机来说,在图片上找寻目标是很难的,但是对人来说并不难。 大约1.2万名志愿者花了5天的时间翻阅了56万幅图片,搜寻任何可能是Tenacious号游艇的白色像素点。他们找到了一个可能的对象,但是派遣到那个地区的飞机并没有找到格雷和他的Tenacious号游艇。
格雷的家人在2月16日放弃了搜索,他的消失仍是一个谜。但是利用互联网展开的大规模人工搜索Tenacious号游艇的做法可能是一项空前的活动,它是对营救格雷作出的举措,也是彰显“人工辅助搜索”新兴技术的典型案例。技术应用很少关乎人的生死。但是这件事让我相信技术应用很快就会与人的生死普遍联系起来,它将显著改变我们对搜索过程的设想和期望以及使用互联网所能做到的事情的期望。与网络在贸易中所起的著名“简化层级”(disintermediating)效应相反,人工辅助搜索是一种“重建中介”(reintermediation)效应。这个效应说明了软件不是万能的,有时必须借助于中介。
许多研究员一直梦想取得谷歌在文本网页搜索上取得的那种成就,为所有的数字化信息建立索引、组织起来和算法化。即将所有的工作都交给软件去完成。即便这个梦想可以实现,估计也是在非常遥远的未来。 同时,亚马逊等网络公司的业主们已经开始展示如何利用无数网民的智能来完成某些软件无法完成的特殊任务。
Mechanical Turk是以18世纪的一台自动机械的名称来命名的,它是人工辅助搜索技术的前沿阵地。概念很简单:如果某人需要做某件事,比如转录一段podcast或者校对一份合同,那么他只要将细节输入亚马逊网站的一个网页就可以了。(然后要想做到这一点,需要人们具有很高的技术天赋或者在网络开发员的帮助下完成。) Mechanical Turk将这些所谓的人工智能任务外包给愿意通过互联网完成任务的人,那些人每完成一个任务就可以获得一定的报酬。
那些人工智能任务可能是枯燥无聊的,也可能是耐人寻味的。 然而搜索吉姆?格雷说明那项技术在未来将发挥出非常重要的作用。比如将全国机场保安录像发布到网络上,让网民们去帮助寻找逃犯或者在天文望远镜拍摄到的图片中寻找危险的近地小行星等。 网络提供了各种必要的交流工具,人们查找特定图案的技能因此而成了一种有价值的商品。
“人工搜索”(people-powered search)公司ChaCha是另一个典型案例。从去年秋季开始,ChaCha公司招募了3万名活向导,他们大部分是退休人员、大学生或者只在闲暇时从事兼职工作的家庭主妇,他们只需花费愿意花费的时间,在网络资源网络上将自己的专长知识分享给大家就可以了。 (一般人只能由ChaCha公司的向导邀请才能加入ChaCha公司,他们每小时可以赚到5美元到10美元。) 在ChaCha公司的传统网站索引中,有一个免费搜索服务。如果常规搜索不能让用户满意,用户就可以点击“与向导实时聊天”的标签链接,然后这个请求指令就会被传递给合适的向导。 一旦用户与向导配对,双方就可以开始进行实时聊天。用户就可以向向导打招呼并咨询某些问题。然后向导可以选择5个或者10个可能有关的链接将它们发给用户。与关键字有关的广告也会出现在用户的屏幕上,相关的广告收入是公司的主要收入来源。 搜索的结果也会列入ChaCha网站索引之中以备将来其他人使用。
以前,一些在网络时代创办的公司比如Webhelp.com也曾经试过推销人工辅助搜索服务,但是最终未能取得成功。但是在现在社群网、网络电话、即时通讯越来越流行的时代,人们已经准备好接受与其他人在线协作的观念;实际上,他们是很渴望与其他人进行互动并且在网络上看见人类的智慧的。至少ChaCha公司的总裁兼首席执行官布莱德?博斯蒂奇是这样认为的。 博斯蒂奇说:“技术和文化都发生了变化。就在几年之前,电子邮件还是网络互动的标准系统。 现在,人们已经普遍开始使用即时通讯和其他手段进行交流和沟通了。”
我发现ChaCha的向导们一贯都比较愉快和直率,即便他们不能给我找到所需信息时也是如此。我曾经提过一个沙漠栽培灌溉的问题,一位名叫拉文德拉的向导很直率地对我说:“嗯,首先我想告诉你的是,你想查找的信息似乎有点难找到。”不用担心,拉文德拉很快将我传给了法布里斯,法布里斯告诉我了两个滴注灌溉系统的厂商链接,整个交流过程只花了22分钟。 如果我自己用google去搜索,可能还能更快找到所需信息,但是那肯定不会让我感受到热情的友善。
我想,随着向导们的经验越来越多,以及ChaCha公司提供给他们的工具越来越完备,ChaCha搜索服务将发展得越来越快,搜索的结果也会越来越好。
Amazon Mechanical Turk、ChaCha、图像标记初创公司Polar Rose、合作搜索引擎PreFound.com和其他许多基于人工的网络搜索都是很有意义的,因为它们率先开创了一个全新的经济现象:网络计件工作。它说明在完成某些海量信息工作如编制网络索引或者搜索卫星图片查找失踪船只等时,人类的能力甚至比计算机还要强一些。这些海量工作被细分为成千上万个小部分然后分配给愿意做的人去完成。 这就是高效率的新型在线工具的作用。企业们已经发现不需要招募太多的工人,只要偶尔找一些想赚点外快的人就可以了。在搜索吉姆?格雷的案例中,只要付出一定的ChaCha币或者以人道主义名义请求人们去做就可以了。
但是现在还不知道这种网络计件工作是否能够成为一项符合华尔街金融界和风险投资资本家预期的业务。就目前来说,开发人工辅助搜索的企业与那些网络企业家一样,都对互联网集合数百万用户的能力寄予了厚望,而且他们坚信网络软件和硬件可以迅速而低成本地促成大批交易。 亚马逊公司Mechanical Turk项目主管彼得?科恩说:“你如何将许多细小的事务集合起来组成一件大事?让你的系统去处理那无数的小事。除非我们认为它可以发展成一项新业务,否则我们是不会去做的。”
因此而造成的计算机化和生产力的提高也带来了很多不期然的副作用,比如增加失业人口,打电话到银行或者有线电视公司却总是无人接听等等。 但是下次你在网上寻求帮助时,可能会遇到人。(三张)