问题简写一:网站每天都被蜘蛛爬N遍,收录的网页为何只有一两篇?
问:黄老师你好,我的企业网站上线有一段时间了,原创文章每天也都在坚持更新,但就是不怎么收录,后来我分析了一下网站日志,发现百度爬虫每天都来爬N遍。我就郁闷了,为什么蜘蛛每天都来爬行,我的内容页收录的这么少呢?是不是进沙盒了?还是内容质量不行?
答:一般来说新站都会遇到这样的问题,而且很多SEO人员都遇到过,那种焦急的状态我也是很理解的。通常我都会让他们去观察,如果观察一段时间且很长一段时间内都是这样的话,那可能是你的网站内容存在问题。无论蜘蛛抓你千百遍都不怎么收录,这就说明你网站的内容不值得被索引。其实很多权重高的网站被降权了也会出现这样的情况。所以,建议你从内容上做检查。
问题简写二:网页被robots了,为什么还会被百度收录?
问:黄忠老师,这个问题困惑我很久了,为什么我网站的网页被robots屏蔽了之后,我从网站日志分析后还会能看到被百度抓取和收录呢?不是说屏蔽了以后就不会被抓取和收录了吗?这些页面都是我们老板千叮万嘱不让展现在百度的,现在都不知道怎么交差了,求解释。
答:我经常遇到这样的情况,很多人都来问我:“为啥屏蔽了的页面还被抓取?”这里我简单的说下吧,一般有两种情况:
第一种是:对已经收录的网页使用robots屏蔽,老网页按照robots规则的删除时间会很长,这个时候可能会造成百度没有遵守robots规则。
第二种情况是:如果你屏蔽的页面或栏目存在大量的外链,那么这个网页或栏目的URL会被百度收录,但内容不会被百度索引,一般这样的多见于首页域名。当然,如果你连URL都不想被收录,可以针对蜘蛛返回404即可。