记忆盒子

把记忆装进灰色的盒子,封装起来,那年那月,重新拾起。

首页搜索目录
search
当前主题: 互联网络

百度抓取异常响应代码522怎么办

作者:Kaka    时间:2021-8-24 17:35:35    浏览:    评论:0

今天登陆百度资源平台看看,发现在“抓取异常”那里有一些错误,显示是“响应代码”522。

“响应代码”522
“响应代码”522

522是什么意思?看解释,这是“服务器错误”的响应代码。

我试试点击链接,都能正常打开。

我想,这是某一时刻,百度爬虫抓取网页时,失败了,可能原因是当时服务器资源耗尽,到了瓶颈的地步,这个时候,任何外部访问,都会返回“服务器错误”,响应代码常见的是500。而百度的解释是,5XX都代表是“服务器错误”。

5XX都代表是“服务器错误”
5XX都代表是“服务器错误”

抓取异常对网站有哪些影响

百度认为:

对于大量内容无法正常抓取的网站,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、权重上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

如果,对于有几千几万张网页的网站来说,百度一天抓几千次,一天只有几条抓取异常,我想那应该不受影响的,毕竟比例太低。

但是,如果正如百度说的若有“大量内容”无法正常抓取,则很大原因是服务器或机房网络线路真的出问题了,那种情况就要及时处理了,不然持续下去,很快网站就被百度降低权重,没有排名了。

知识扩展

什么是抓取异常

Baiduspider无法正常抓取,就是抓取异常。

抓取异常的原因有哪些

一、网站异常

1、dns异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

2、连接超时

抓取请求连接超时,可能原因服务器过载,网络不稳定

3、抓取超时

抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足

4、连接错误

无法连接或者连接建立后对方服务器拒绝

二、链接异常

1、访问被拒绝

爬虫发起抓取,httpcode返回码是403

2、找不到页面

爬虫发起抓取,httpcode返回码是404

3、服务器错误

爬虫发起抓取,httpcode返回码是5XX

4、其他错误

爬虫发起抓取,httpcode返回码是4XX,不包括403和404

x

标签: 主机  522  

※ 网站速度慢?试试网站自动优化工具 ※

上一篇: CSS 技巧:加速CSS渲染的5个建议
下一篇: Font Awesome V5 1000个图标及对应编码【含库文件下载】

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客                   QQ交流群(312716741)

  • 通过Google订阅本站 通过鲜果订阅本站 通过抓虾订阅本站
  • 通过QQ邮箱订阅本站 通过Yahoo订阅本站 通过有道订阅本站

Search

最新评论及回复

最近留言

网站分类

Powered By Z-Blog 1.8 Walle Build 91204 Designed by Han'space

Copyright @2009-2024 All Rights Reserved. 粤ICP备14028160号-1

Powered By Z-Blog 1.8 Walle Build 91204
Copyright @2009-2024 All Rights Reserved.