找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 150|回复: 0

那些因素会造成百度抓取问题

[复制链接]

该用户从未签到

发表于 2017-11-25 10:37:18 | 显示全部楼层 |阅读模式

您需要 登录 才可以下载或查看,没有账号?立即注册

×
  1.站点安全
          对于中小型站点,在安全技术上比较薄弱,被黑被篡改的现象非常常见,一般被黑有常见几种情况,一种是主域被黑,一种是标题被篡改,还有一种是在页面里面加 了很多的外链。一般主域被黑就是被劫持,就是主域被进行301的跳转到指定的网站,而如果在百度那边发现跳转后的是一些垃圾站,那么你这个模板王站点抓取量会里 面降低。
         
          2.内容质量
          如果抓取了10万条,而只有100条建库了,那么抓取量还会降下来,因为百度会认为抓取的网页比例很低,那么就没必要去抓取更多,所以要"宁缺毋滥",特别要注意在建站的时候一定要注意质量,不要采集一些内容,这是一种潜在的隐患。
         
          3.站点响应速度
          ①网页的大小会影响抓取,百度建议网页的大小在1M以内,当然类似大的门户网站,如新浪另说。
          ②代码质量、机器的性能及带宽,这个不多说,后续笔者会单独拿出一篇文章讲解,请实时关注“营销小能手”。
         
          4.同ip上面主域的数量
          百度抓取都是按照ip进行去抓取的,比如在一个ip上一天抓取了1000w个页面,而在这个站点上有40W的站点,那么平均下来抓取每个站点的数量会分的 很少,所以在选择服务商的时候,要看一看同ip上面有没有大站,如果有大站的话,可能会被分得的抓取量会很少因为流量都跑大站上面去了。
回复

使用道具 举报

网站地图|页面地图|文字地图|Archiver|手机版|小黑屋|找资源 |网站地图

GMT+8, 2024-11-2 04:37

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表