RSS feed 不输出全文?一样搞定你 | 老肥博客 ? 非唠不可
来源:百度文库 编辑:神马文学网 时间:2024/04/27 22:59:16
RSS feed 不输出全文?一样搞定你
流量就是金钱,所以有些网站很吝啬,RSS feed 只给你看几行字,要看全文?对不起,流量送俾我先。本文教你如何在 Google Reader 里面搞定这些铁公鸡,不是用 iframe 预览页面,而是只有正文,全文,图文。
更新:感谢 鲜果 Plus 脚本的作者 CIH 的推荐,这样鲜果用户也可以实现自动全文了
您需要使用 Firefox 的用户脚本管理器 Greasemonkey, 它近日更新的 0.8 版已支持最新版本的 Firefox 3. 让 Google Reader 获取全文 feed 的脚本是 google reader full feed changer, 或者 直接安装它。装好之后,离完成就只剩最后一点点设置了:
以 新浪体育新闻 为例,打开一篇新浪上的原文,按 ctrl+u 查看页面源代码,发现正文部分是用
%appdata%\Mozilla\Firefox\Profiles\****
\gm_scripts\googlereaderfullfeedchan.user.js
编辑它,在第九行以下,添加一个 SITE_INFO:
{
url: 'http://(sports|rss).sina.com.cn',
xpath: '//div[@class="artibody"]',
charset: 'gb2312' //非必需
},
保存脚本文件,F5 刷新 Google Reader, 看看新浪的 feed 吧,已经是文首截图的样子了 现在您知道了如何添加一个 SITE_INFO, 添加一下您需要看全文的 feed 信息,以后就省事喽。注意事项:
- 如果网站域名和 feed 域名不一样,需要把两个域名都写进去,比如:
url: 'http://(site.com|feed.feedsky.com)',
- class 和 id 都可以识别
- 如果出现乱码,在该网站页面源代码中搜索 charset, 设定进 SITE_INFO 中
- 目前该脚本还不能对付 cnBeta, 因为 cnBeta 的文章地址设置了一个跳转重定向。没关系,订阅 feeds.feedburner.com/cnbeta_full 就好了
喜欢这篇文章? 订阅老肥博客,就可以自动获取最新内容了!帮助
订到 Google 鲜果 有道
相关文章
- 网络 服务
- 订阅老肥博客
- 订阅本文评论
- 125 条评论
最新文章
- 打造完美的 ajax 版 Google 自定义搜索 (71)
- 全新的评论区体验 (154)
- WordPress 插件 img.ly gallery (35)
- Google Reader 的分享和效率 (37)
- CSS 文字阴影在网页设计中的应用 (47)
热门标签
147 Firefox Google WordPress 博客 手机 扩展 斯诺克 美化 黑莓随机文章
- 惊闻维基复活(nnd 这么快又死了) (16)
- 点名桌面秀 (35)
- 春节快乐 (32)
- 更简单的 Google favicon 查询 (35)
- 来自微软的智能触控桌面: Microsoft Surface™ Computing (8)
最新评论
- forging 不错,学习了... 打造完美的 ajax 版 Google 自定义搜索
- OK Just for a test! 打造完美的 ajax 版 Google 自定义搜索
- Mark 管那么多,抄袭你的代码再说 CSS 文字阴影在网页设计中的应用
- 波 太强大了 学习学习! 学习笔记: CSS3 鼠标悬停动画
- 阿东 这个评论效果好炫。。 :D WordPress 插件 img.ly gallery
本月嘉宾
- BB (3)
- CYL (2)
- forging (2)
- xu (2)
- meters (1)
- 卢松松 (1)
- runbing (1)
- qzqz (1)
- Mort (1)
- jakeson (1)
目前有 125 条评论
好东西,收益了
恩恩 收了
好东东~
非常不错诶
很强,非常强,收了。
好样的,就这样搞定那些吝啬的人
这个太好了,尤其是针对CB的,哈哈!
老肥,很喜欢你的博客,能否交换个链接?呵呵,你的链接我已经做好。
fisio 回复: Done
老肥对Greasemonkey的研究真是令人佩服。
呵呵。
使用鲜果的同学也有“鲜果Plus”可以用哦,也是一个Greasemonkey脚本,并且还可以配置关键字,只显示包含这些关键字的文章的全文。
支持cnbeta,而且可以显示cnbeta的热门评论。
也可以通过配置xpath来支持其他不提供全文的Feed。
fisio 回复: 感谢您的好脚本!已加入正文
论坛里的RSS如何输出全文?
fisio 回复: 按照文中的办法,看页面源码找找吧。。。没有一个通用的 xpath 啦
真的很不错呢,感谢博主:)
好东西啊
订阅了cnbeta的全文,感谢
这不就是原始的采集原理么- -
不过用了高级点的XPath
fisio 回复: 不一样的,原始的 RSS 获取只是去读一个现成的 xml, 不会访问原文内容。这个方法是尝试访问原文,寻找 xpath 所规定的字段
老肥懂粤语?~
fisio 回复: 一点点。。恺恺 参考一下我录的粤语歌吧,我也就会唱歌,不会讲 -_-
http://news.163.com/topnews/
这个是网易头条
我怎么弄不成啊
不至于这么笨吧
大肥可以帮忙做下吗?
fisio 回复: 我看了一下页面源码,应该是 id="endText" 你试试看
很棒,不过不懂 xpath 怎么办呢?简单的可以照葫芦画瓢,复杂的就麻烦了。谁可以帮忙写看凯迪论坛的 xpath ?比如 http://club.cat898.com/newbbs/dispbbs.asp?boardid=8&id=2292721,我只要楼主的全文。
url: 'http://(club|rss).cat898.com',
xpath: ???,
charset: 'GB2312'
fisio 回复: 晕,这个论坛我根本就没找到 feed 在哪里,header 里也没有
貌似不错,看貌似太麻烦了,诶。。。。。
fisio,我用了这个脚本。这样设置,失败。
{
url: 'http://www.infzm.com/rss/home/rss2.0.xml',
xpath: '//div[@id="content-context"]',
charset: 'utf-8'
}
url 部分我还测试过 http://www.infzm.com/ http://www.infzm.com/content/
都不行。我这样写对吗?
fisio 回复: 嗯,我试了一下,照你这么写是可以全文的,我 url 写的是 http://www.imfzm.com,只是部分文章不行,我打开这些文章,是要求登录的,所以不能获取全文。是不是你没有在 Google Reader 里选中文章?光刷新不会去加载的