老冒时间文字直播室:信息聚合技术在线讨论摘录

来源:百度文库 编辑:神马文学网 时间:2024/05/16 22:57:17
老冒时间文字直播室关于mashup的讨论  -[]
时间:2006/11/16
Tag:cnbloggercon中文网志年会MashUp
vovo.net.cn
04:15 ooof: 试着做了一个年会各类内容的聚合页面:http://vovo.net.cn/biz/html/c52/ ,算不算mash ?
06:50 number5: 不一样
06:56 ooof: shizhao,还有什么适合的rss可以被放到里面吗?
07:01 Shizhao_: ping!
mashup
07:25 Leon:http://www-128.ibm.com/developerworks/cn/xml/x-mashups.html
07:25 Leon: Mashup 是一种令人兴奋的交互式 Web 应用程序,它利用了从外部数据源检索到的内容来创建全新的创新服务。它们具有第二代 Web 应用程序的特点,也称为 Web 2.0。
07:26 Leon: 我觉得feedsky提供了api,不能认为就是mashup
07:26 Leon: 如果提供接口就是mashup的话,那计算机基本上就全是mashup 了
07:28 cnsns: 内容与服务的聚合
07:30 ooof: api是mahup的一种,但不是全部,可以这样理解吗?
07:31 Leon: 我觉得api是mashup的组件 ,必要条件
堆砌与融合
07:32 Leon: 其实门户网站只是信息的堆砌,而mashup是信息的融合
07:33 cnsns: LEON,我同意你这看法,但堆砌与融合这两个概念不是一个标准概念
07:34 Leon: 额。标准概念是什么?
07:34 cnsns: 我们很难在堆砌与融合找到共同的标准
07:34 cnsns: 我们很难在堆砌与融合二间中到共同的标准
07:35 ooof: 堆砌 和 融合 应该是有差异
07:35 Leon: 这样说吧,sina的专题其实应该说不仅仅是堆砌,他有信息加工的动作,但是这种加工是在信息之上的,也就是说做了一些索引的事情
从体验角度看mashup
07:36 cnsns: 我觉得只能这么说,任何的对外来信息或服务的整合都可以称为MASHUP,只是好坏不同而矣
07:37 cnsns: 而这个好坏衡量的标准,就是是否给用户带来一站式的便利
07:37 Leon: 但我认为mashup需要是把信息来源加以组合
07:37 ooof: 其实简单也不一定就是不好的体验吧。
07:37 cnsns: OOOF,没有说简单不好,简单与复杂不是好与不好的标准
07:38 cnsns: 只能说能用简单的方式达到对用户的满意,那是个好的,高效率的方式。大多数用户的满意度是衡量标准 ,如果同意这个观点,其实是不是MASHUP,或者什么是“真正的”的MASHUP真的无所谓
mashup源
07:38 ooof: cnsns,你看见过什么好的mashup应用吗。
07:39 cnsns: OOOF,我觉得VOVO挺好,只是VOVO的MASHUP源,实在不咋地。我很想你能推荐一个你喜欢的MASHUP应用
07:41 Leon: 现成的就有啊,基于google earth的很多应用就是mashup啊
07:43 cnsns: Leon,是的
tag的rss输出
07:42 ooof: 你知道,有没有办法,把tag一样的不同blog提供商提供的blog的rss找到。
07:42 cnsns: OOOF,你这个需求非常有意义,但现在我没看到有特别好的,还有一个问题是:TAG本身是个性化的
07:43 Leon: 我插一句,这个是不是可以通过blog search来实现?,我说ooof的需求
07:43 ooof: 但是,我找过几个blog服务商的tag,但不可以被rss。其次blog search可以输出rss吗?
07:45 Leon: 现在应该还不行吧 ,但是我相信是可以做到的
07:45 cnsns: BLOG SEARCH的RSS输出,技术不是问题
07:45 Leon: 或者是第三方提供这样的服务
07:46 cnsns: 去年以前就有人做到了
07:47 cnsns: 你问一个TANGOS,他应该非常清楚,http://in.comengo.net/archives/blog-searchengine-comparision/ ,YAHOO和GOOGLE都有BLOGSEARCH ,http://blogsearch.google.com ,支持搜索结果RSS输入,但TAG方面好象还要摸
07:48 Tangos: 什么问题? 我刚才不在
07:49 ooof: 支持rss输出的blog的tag的搜索。
07:50 Tangos: 要tag方面的blog搜索的rss输出? 那好像只有technorati才有 ,能搜tag的就没几个
07:51 Leon: 关键是需要这样一个网站,可以定制自己需要的rss
07:51 cnsns: 看这个:http://blogsearch.google.com/blogsearch?hl=en&num=10&c2coff=1&lr=&safe=off&ie=UTF-8&q=cnbloggercon
07:51 cnsns: LEON,GOOGLE基本上是可以这样的
07:52 Tangos:http://blogs.icerocket.com/search?q=tag%3Acnbloggercon
07:52 Leon: 这样的话,再提供api,然后就是mashup。。。
07:53 cnsns: 但tangos,icerocket 对中文的搜索数据不多
07:53 Tangos: 要搜tag的话就没办法了
实现聚合的两个方案
07:55 cnsns: LEON,其实MASHUP的概念还可以再细,我可能要举个例子
07:55 Leon: 嗯,洗眼恭视。。。
07:56 cnsns: 比如要整合cnbloggercon的内容
07:56 cnsns: 我可能会找如下的信息源:
07:56 cnsns: 1.各BLOGSEARCH
07:56 cnsns: 2.各网摘站
07:57 cnsns: 2.各网摘站的TAG或全文搜索
07:57 cnsns: 3.大的图片站的TAG
07:57 cnsns: 4.百度的新闻搜索RSS
07:58 cnsns: 5.通过以上的数据采集后,可能要分析出所有内容中最多出现的关键词20个
07:58 cnsns: 6.然后就这20个词,走回刚才的1-4步
07:59 cnsns: 到此结束,这样给用户提供的信息量是最完全的,表达结束
cnsns对以上的解析:1-3不复杂 ,4步可以人工,没必要想到机器,6回1-4,也可以用机器,辛苦就在第5步。1-4时,你只要确定关键语为:中文网志年会以及CNBLOGGERCON,就以这个为起点,就可以了。走到5时,就看你的技术能力和人工能力了。如果5定为20个关键词,那工作不难不用太多,有时候我们总想让机器做,其实人就可以办的,不必太着意机器。
Leon意思的完整表达:这样非常复杂,如果有这样2个网站,一个是搜索引擎,一个是RSS生成引擎,如果这个搜索引擎非常牛,可以搜索到你的1-4 的所有的信息,再辅佐RSS生成引擎就ok了,搜索引擎搜索出来的结果虽然格式有点难看,但是也可以认为是聚合。
08:07 Leon: 好的搜索引擎和好的rss生成引擎都是可以做很多事情的,其实不用智能分析
08:08 cnsns: 是,同意你的说法
ooof总结:这是实现内容聚合上的两个技术路线,cnsns:从各处找信息源,然后通过规则去做聚合;Leon:搜索,然后通过rss聚合。
“找本质心理”的问题
08:17 cnsns: 所有想找到本质的心理,必然会有这样或那样的漏洞
08:17 cnsns: 其实我们只能去找到相似性
08:18 cnsns: 特别是同样或类信环境下的相似性,而不可能找到所有环境下的绝对性
从聊天频道谈到cnbloggercon品牌
08:19 Leon: 不知道以后这个频道会不会一直开着
08:19 cnsns: 事件诱导,这是SN的常用方式,如果没有事件,这个频道是没有存在的基础的
08:20 Leon: 不过cnbloggercon应该已经可以称为是一个品牌了 ,作为品牌就有存在的基础了
08:20 cnsns: 希望如此 ,但也存在着一定的问题 ,CNBLOGGERCON去年和今年是一个自然品牌
08:21 Leon: 其实应该有一个半官方的组织
08:21 cnsns: 以后要有更大的品牌发挥,至少应该有一个秘书处
08:21 Leon: 对的
08:21 cnsns: 但这就涉及投入 1.投入的资 金 ;2.投入的角色
08:21 Leon: 有个组织的话,就可以除了会议以外再搞点其它的活动了
08:22 cnsns: 两点上后一点更为敏感
08:22 Leon: 资金嘛,2个来源 ,首先是会员交费 ,可以在每年的cnbloggercon的时候适当多收一点
08:22 cnsns: 那后一点呢
08:23 Leon: 其次那些资助的企业可以作为顾问单位嘛
08:23 Leon: 什么投入的角色?
08:23 cnsns: 其实就是由谁来“主控”这个品牌,那怕是民主集中式的,我觉得还是自由式发展为好
08:24 Leon: 绝大部分的blogger都不介意别人来主控这个品牌的
08:24 cnsns: LEON,错了,会介意的,比如方兴东来主控会咋样,比如刘韧主控 ,比如周鸿一主控
08:25 Leon: 呵呵,这些人都不行,我觉得isaac和zheng可以
08:25 cnsns: 所以说,你还是有介意的地方
08:26 Leon: 额,我收回我说的话。其实我说的意思是,我认为cnbloggercon是cnblog发起的,因此应该属于cnblog
08:27 cnsns: 如果这样定位,那在广纳BLOOGER方面,还需要大量的工作
08:28 Leon: 嗯
08:28 cnsns: 不聊这个,有点八卦了
diggdot.us
08:52 cnsns: LEON,看这个http://diggdot.us/ 也算是个MASHUP
08:52 calon: 有没有统计过参加年会的职业分部?
08:53 cnsns: 估计有数据,好统计,没人做分析
08:54 cnsns: 我觉得这是个非常好的MASHUP的例子
08:58 cnsns: MASHUP的某一个重要点是:通过整合,让用户方便且一站式完成需求,其实我不在意叫不叫MASHUP
09:02 Leon: mashup需要有语义学的支持的
15:07 keso: 中国的DIGG的路还长,http://www.banerzhuan.com 还可以看看