帝国cms采集常用技巧

来源:百度文库 编辑:神马文学网 时间:2024/04/28 01:29:58
1、过滤文章内容的链接:
广告正则:“”;调换“”为空。
2、同上班得出,过滤font之类的标签:
广告正则:“”;调换“”为空。其他依此类推。
3、扫除采集时的空白内容的数据:
“在统设置”-》“履行SQL语句”运行下面SQL语句即可:
delete from phome_ecms_news where newstext='';
4、同一链接的页面如何二次采集:
到“管理采集节点”那清空节点即可。
采集的一些特别字段阐明:
1、“下载地址正则”、“在线观看地址正则”、“图片集正则”。
阐明:下面的两个正则是离开的,并且是用“[!empirecms!]”格开。
下载地址正则 格式:地址正则([!--ecmsdownpathurl--])[!empirecms!]名称正则([!--ecmsdownpathname--])
阐明:名称正则可以不设置,由在统本人命名。
在线观看地址正则 格式:地址正则([!--ecmsonlinepathurl--])[!empirecms!]名称正则([!--ecmsonlinepathname--])
阐明:名称正则可以不设置,由在统本人命名。
图片集正则 格式:缩略图([!--ecmsspicurl--])[!empirecms!]大图([!--ecmsbpicurl--])[!empirecms!]名称([!--ecmspicname--])
阐明:大图与名称正则可以不设置。
2、只要字段“输入表单显示元素”是“图片(img)”、“FLASH文件”、“文件(file)”均支撑远程保存文件到本地。