如何解决采集时出现“标题与作者完全一样不采集”的问题
2010-05-23 站长 站长日志
很多情况下我们自己费老大劲写好采集规则时,预览的时候老是提示“标题与作者完全一样不采集”,这个问题,感觉很郁闷。
笔者在开始采集时也是老碰到这个问题,有时为了达到必须采集完的目的,一度去找代码研究。其实这个问题很简单,
出现的原因就是当前采集的文章标题和你数据库中已经采集的文章标题重复了,就是说已经采集过了。
这个是正常的,因为你勾选了“不采集标题完全相同的信息(与入库信息比较) ”这个选项。解决方法就是,
如果你想采集就把这个勾去掉,如果不 想重复采集,这个就是正常现象。
下一篇:如何防止你的网站数据被采集