RSS feed 不输出全文?一样搞定你 | 老肥博客 ? 非唠不可

来源:百度文库 编辑:神马文学网 时间:2024/04/27 22:59:16

RSS feed 不输出全文?一样搞定你

  • 作者 fisio
  • 08年6月14日
  • CSS, Firefox, Google, Greasemonkey, 扩展, 阅读器

流量就是金钱,所以有些网站很吝啬,RSS feed 只给你看几行字,要看全文?对不起,流量送俾我先。本文教你如何在 Google Reader 里面搞定这些铁公鸡,不是用 iframe 预览页面,而是只有正文,全文,图文。

更新:感谢 鲜果 Plus 脚本的作者 CIH 的推荐,这样鲜果用户也可以实现自动全文了

您需要使用 Firefox 的用户脚本管理器 Greasemonkey, 它近日更新的 0.8 版已支持最新版本的 Firefox 3. 让 Google Reader 获取全文 feed 的脚本是 google reader full feed changer, 或者 直接安装它。装好之后,离完成就只剩最后一点点设置了:

以 新浪体育新闻 为例,打开一篇新浪上的原文,按 ctrl+u 查看页面源代码,发现正文部分是用

标注的,那么修改一下刚才的脚本,该脚本通常位于 Firefox 配置文件夹下:

%appdata%\Mozilla\Firefox\Profiles\****
\gm_scripts\googlereaderfullfeedchan.user.js

编辑它,在第九行以下,添加一个 SITE_INFO:

{
  url: 'http://(sports|rss).sina.com.cn',
  xpath: '//div[@class="artibody"]',
  charset: 'gb2312' //非必需
},

保存脚本文件,F5 刷新 Google Reader, 看看新浪的 feed 吧,已经是文首截图的样子了 现在您知道了如何添加一个 SITE_INFO, 添加一下您需要看全文的 feed 信息,以后就省事喽。注意事项:

  • 如果网站域名和 feed 域名不一样,需要把两个域名都写进去,比如:

    url: 'http://(site.com|feed.feedsky.com)',

  • class 和 id 都可以识别
  • 如果出现乱码,在该网站页面源代码中搜索 charset, 设定进 SITE_INFO 中
  • 目前该脚本还不能对付 cnBeta, 因为 cnBeta 的文章地址设置了一个跳转重定向。没关系,订阅 feeds.feedburner.com/cnbeta_full 就好了

喜欢这篇文章? 订阅老肥博客,就可以自动获取最新内容了!帮助
订到 Google 鲜果 有道

相关文章

  • 所属分类
  • 网络 服务
  • 订阅老肥博客
  • 订阅本文评论
  • 125 条评论

最新文章

  • 打造完美的 ajax 版 Google 自定义搜索 (71)
  • 全新的评论区体验 (154)
  • WordPress 插件 img.ly gallery (35)
  • Google Reader 的分享和效率 (37)
  • CSS 文字阴影在网页设计中的应用 (47)
更多 »

热门标签

147 Firefox Google WordPress 博客 手机 扩展 斯诺克 美化 黑莓

随机文章

  • 惊闻维基复活(nnd 这么快又死了) (16)
  • 点名桌面秀 (35)
  • 春节快乐 (32)
  • 更简单的 Google favicon 查询 (35)
  • 来自微软的智能触控桌面: Microsoft Surface™ Computing (8)

最新评论

  • forging 不错,学习了... 打造完美的 ajax 版 Google 自定义搜索
  • OK Just for a test! 打造完美的 ajax 版 Google 自定义搜索
  • Mark 管那么多,抄袭你的代码再说 CSS 文字阴影在网页设计中的应用
  • 波 太强大了 学习学习! 学习笔记: CSS3 鼠标悬停动画
  • 阿东 这个评论效果好炫。。 :D WordPress 插件 img.ly gallery

本月嘉宾

  • BB (3)
  • CYL (2)
  • forging (2)
  • xu (2)
  • meters (1)
  • 卢松松 (1)
  • runbing (1)
  • qzqz (1)
  • Mort (1)
  • jakeson (1)

发表您的评论

您的评论将回复给 原评论者

目前有 125 条评论

  

好东西,收益了

恩恩 收了

好东东~
非常不错诶

很强,非常强,收了。

好样的,就这样搞定那些吝啬的人

这个太好了,尤其是针对CB的,哈哈!

老肥,很喜欢你的博客,能否交换个链接?呵呵,你的链接我已经做好。


fisio 回复: Done

 

老肥对Greasemonkey的研究真是令人佩服。

呵呵。

使用鲜果的同学也有“鲜果Plus”可以用哦,也是一个Greasemonkey脚本,并且还可以配置关键字,只显示包含这些关键字的文章的全文。
支持cnbeta,而且可以显示cnbeta的热门评论。
也可以通过配置xpath来支持其他不提供全文的Feed。


fisio 回复: 感谢您的好脚本!已加入正文

 

论坛里的RSS如何输出全文?


fisio 回复: 按照文中的办法,看页面源码找找吧。。。没有一个通用的 xpath 啦

 

真的很不错呢,感谢博主:)

好东西啊

订阅了cnbeta的全文,感谢

这不就是原始的采集原理么- -
不过用了高级点的XPath


fisio 回复: 不一样的,原始的 RSS 获取只是去读一个现成的 xml, 不会访问原文内容。这个方法是尝试访问原文,寻找 xpath 所规定的字段

 

老肥懂粤语?~


fisio 回复: 一点点。。恺恺 参考一下我录的粤语歌吧,我也就会唱歌,不会讲 -_-

 

http://news.163.com/topnews/
这个是网易头条
我怎么弄不成啊
不至于这么笨吧
大肥可以帮忙做下吗?


fisio 回复: 我看了一下页面源码,应该是 id="endText" 你试试看

 

很棒,不过不懂 xpath 怎么办呢?简单的可以照葫芦画瓢,复杂的就麻烦了。谁可以帮忙写看凯迪论坛的 xpath ?比如 http://club.cat898.com/newbbs/dispbbs.asp?boardid=8&id=2292721,我只要楼主的全文。
url: 'http://(club|rss).cat898.com',
xpath: ???,
charset: 'GB2312'


fisio 回复: 晕,这个论坛我根本就没找到 feed 在哪里,header 里也没有

 

貌似不错,看貌似太麻烦了,诶。。。。。

fisio,我用了这个脚本。这样设置,失败。

{
url: 'http://www.infzm.com/rss/home/rss2.0.xml',
xpath: '//div[@id="content-context"]',
charset: 'utf-8'
}
url 部分我还测试过 http://www.infzm.com/ http://www.infzm.com/content/
都不行。我这样写对吗?


fisio 回复: 嗯,我试了一下,照你这么写是可以全文的,我 url 写的是 http://www.imfzm.com,只是部分文章不行,我打开这些文章,是要求登录的,所以不能获取全文。是不是你没有在 Google Reader 里选中文章?光刷新不会去加载的