重点导读:关于蜘蛛抓取的问题,SEO社区解释了抓取的大致原理和注意事项,不同网站的蜘蛛抓取有不同的特点,大家需要根据具体情况分析和处理。总之要记住,蜘蛛不是胡乱抓取的,它会根据既定的策略去抓取。我们需要了解它的策略,并且通过合理的优化方式,引导蜘蛛抓取目标页面。
这个问题是搜外问答上有朋友提到的,大意是:SEO优化中如何解决蜘蛛的问题,就是蜘蛛反复爬取页面,多数都是重复的,这样抓取没有什么作用,有什么好的办法可以引导蜘蛛,让蜘蛛正常抓取页面?
SEO社区认为这里存在着两个问题,大家想要正确理解:
1、为什么蜘蛛要重复抓取这些页面
相对而言,蜘蛛更喜欢去抓取那些权重高的、更新频率大的页面。蜘蛛重复抓取某个页面,这肯定有它的原因,我们要做的不是去看,还是应该去想,为什么蜘蛛不断重复的抓取这些页面!找到这个问题的内在原因,不仅可以帮助我们解决问题,同时也能以此为依据,去优化其他页面的抓取问题。
2、如何引导蜘蛛去抓取其他目标页面
我们要知道蜘蛛抓取的过程,它会提取sitemap及页面上的链接,然后根据具体的策略去抓取。
所以,想要让蜘蛛去抓取目标页面,首先得把目标页面的地址提交到搜索引擎。另外要注意,搜索引擎对于每个网站都有额定的抓取上限,为了更好的节省蜘蛛抓取份额,对于那些已经被收录的页面,以及蜘蛛重复抓取的页面,可以适当的设置nofollow标签。
3、蜘蛛抓取页面重复率太高怎么处理
通过上面两个方面的讲解,大家应该知道怎么处理了!这里SEO社区也简单说下:
首先,如果你觉得这些被重复抓取的页面没有用,可以设置nofollow;
其次,及时提交想要被抓取的目标页面(写进sitemap,主动提交等等都行);
最后,注意目标页面的链接入口,通过内链和外链等优化,来促进搜索引擎蜘蛛抓取。
关于蜘蛛抓取的问题,SEO社区解释了抓取的大致原理和注意事项,不同网站的蜘蛛抓取有不同的特点,大家需要根据具体情况分析和处理。总之要记住,蜘蛛不是胡乱抓取的,它会根据既定的策略去抓取。我们需要了解它的策略,并且通过合理的优化方式,引导蜘蛛抓取目标页面。