资讯内容页面不收录,究竟是谁惹的祸?

2020-10-15 20:58| Autor: | Check: |

里约奥运会完毕了,资讯站点的小编们终于可以松口气了,可有些SEOer却快乐不起来:修改辛苦抢先制造的原创稿件,百度却不!收!录!院长奥运会期直接到了四五起这样的反馈,经追查,本来是站点的抢发行为不行友爱,导致spider抓取失败。结论:
1,页面制造完成后再放到spider可以发现的当地,这样才干达到最好的抓取效果。
2,页面未对外公开之前,千万不要通过东西推送给百度呀。
接到站长反馈后,院长联络了spider工程师,工程师在后台查询了这些未收录的链接,发现均显示为“死链”,然而这些所谓的死链现在拜访都是好好的。依据后台显示的抓取时间,院长重复和站点进行交流,终于找到了根源:本来,站点为了抢新闻,提前制造了新闻稿并制造成链接并且发布,虽然没有在官网等重要页面推送给用户,但却被BaiduSpider发现,更重要的是,这些链接向BaiduSpider返回的状态码是404。
举个例子,中国女排进入决赛后,某网站做了A和B两个页面,分别为夺冠和摘银,为了防止用户在比赛完毕之前阅读到页面内容,站点将两个链接都设置为404!404!(等到比赛完毕后,再将其间一个页面的html返回码改为200)。虽然页面并没有向用户推送,但仍是被聪明的BaiduSpider发现。然而这里的问题是,BaiduSpider发现页面是404,又无法判断出这是一个重要页面,于是直接打入冷宫不再答理。
所以,学院重复强调,确认页面真的不需要被查找引擎保留时能够使用404(暂时闭站可使用百度站长平台的闭站保护东西),假如还期望和查找引擎坚持友爱关系的话,请使用503,防止页面被删除。虽然Baidu有对高价值内容的“删除保护”功用,但毕竟不是每个站点都可以享用到这个特权的。
<
>
 
QQ
Tel
18720358503
Tel
18720358503
Top