对网站推荐引擎机制的一些看法-成成 - 新浪BLOG

来源:百度文库 编辑:神马文学网 时间:2024/04/29 00:37:56
在WEB1.0的时代,似乎大家都没有把推荐机制当成多么高深的东西研究过。无非是一些同僚受到Amazon推荐系统“购买此书的用户还购买了以下产品”的震撼并有所感悟,学着做了些相关的工作。到了WEB2.0的时代,大家都强调用户黏度、用户体验、用户贡献度......推荐机制在网站信息组织中的作用慢慢受到人们的重视。
需要说明的是,在我的思维里,推荐机制和推荐系统不仅仅起到多卖出去两本书的作用,而更加倾向于“网站信息组织机制”。当推荐机制成为网站信息组织机制的核心部分的时候,个性化页面才会变得比较有趣!
《网站推荐机制中的艺术、科学与商务问题》一文中总结到四种推荐机制:
1、个性化的推荐--根据用户过去在网站的行为进行推荐
我们看到很多推荐系统根据用户的历史访问行为、购买行为,推理用户的目前的需求,以此来组织信息。这种方式,主要就是基于个性化的推荐机制。
2、社会化推荐--根据类似用户过去在网站的行为进行推荐
早期“购买此书的用户还购买了以下产品”的推荐系统,主要就是基于社会化的推荐机制。根据访问/购买此产品的用户前后行为的数据,进行简单的统计分析,即给出几率最高的行为信息进行推荐。
3、基于产品的推荐--基于产品本身的特性进行推荐
基于产品本身的特性进行推荐,往往就是产品基因推荐机制。
很多网站的推荐机制对于产品基因推荐机制的认识是较浅的。一般来说,认为仅仅是Keyword、Tag技术下的信息组织方式,就是产品基因推荐机制。这没有错,但不完全。Keyword、Tag是比较表层的关联,而深层次的关联,挖掘的还不够深刻。
其实,在我看来,Tag技术不应该是那么简单的!Tag不应该是线性的组织结构,而应该是立体的、多维的(对于这点,我还没有完全想明白,也许想的不对)!——这才是我理解的产品基因。这个想法是比较抽象的,我们尝试着用一个例子来探讨一下。
在dig来的两篇文章中都提到了“Pandora”——基于遗传学的推荐系统——“音乐染色体组项目的推出,目的在于把音乐解析成为最基本的基因组成”。
音乐是比较有趣的例子。音乐是一个不断进化的过程。就说现代欧美音乐来说,Jazz、Funky、Reggae、Bossa Nova、R&B、Blues、Hard Rock、Heavy Metal、Death Metal、Punk....这些音乐形式很多外在的联系似乎很难用一个线性的Tag进行关联,而其中内在的许多音乐元素的联系,又使得很多表面不相关联的音乐形式有了关联。
或者通俗些说,线性的Tag应该是一本族谱,有一个点出发,开枝散叶。而多维的Tag里,往往发生的是“乱伦”的现象,由此而带来的推荐结果会有所不同。
那么,回归到音乐上来,由于音乐元素的立体的“乱伦”现象的存在,因此,用户们往往会喜欢一种音乐的同时,又喜欢另一种表面上完全不相关的因素。比如在现实生活中,我们发现喜欢Jazz的人,往往也喜欢Bossa Nova。
也许这个例子举的不太合适,因为,很多东西我也没有想得太明白!呵呵....
4、以上三者的混合
三者的混合,似乎是目前推荐机制的主流思路。然而,我一直认为,这种基于静态因素的推荐机制,准确度应该是高的有限的。因此,我希望提出结合“用户历史行为+社会历史行为+产品基因+用户动态行为+外界扰动项”的“个性化动态推荐系统”。
文章引用自: