网站收录怪象

  SEO之路上难免会碰到一些奇葩的工作,比如网站改版了还录入旧的URL地址、测验网址平白无故就被录入了导致正式网址不被录入、换了IP成果导致百度录入不更新了等等,大多数的时分咱们都把问题的原因归结于百度,百度真实有些委屈,SEO小知在工程师的点拨下为咱们揭开这奥秘。

  

  在开端前先简略的给咱们讲解一点小常识:

  

  域名和IP相当于站点的名字和身份证,IP相当于现如今的身份证,可是身份证IP地址很难记,所以就发作了域名。这儿不是给咱们遍及历史常识,仅仅现在大多数状况下都选用域名来拜访所以导致咱们疏忽了一个现实:终究寻址的是身份证号码也就是IP,不是域名!来看个域名解析的简化进程图

  

  经过这儿咱们应该理解一些了吧?域名仅仅便利咱们回忆,而真实的寻址的应该是IP!咱们都知道域名DNS服务器在全球有N个节点,咱们新域名刚解析的时分常会碰到某些区域由于DNS数据同步慢而导致拜访不了的状况,而老域名换IP的时分也会碰到用户拜访的仍是老IP的幻想。这你都知道?别急你还有不知道的!

  

  然而咱们的搜索引擎蜘蛛大多数分布式抓取,本身都建有DNS,一来处理抓取的时分的功率,不用每次都要解析IP后抓取,二来咱们站点的主体表现形式都是域名,而不是IP,所以带着咱们的域名host头去拜访咱们的老IP仍是会拜访的到,因而就会导致咱们最初提到的一些奇葩怪象。说完基本概念,咱们再来详细分析一下这几个怪象的详细成因!

  

  一、网站改版了还录入旧的URL地址

  

  这个问题其实跟上面的根底没啥太大联系,但每天在百度站长社区问的人真实是太多了,也算是录入的一大奇葩现象,所以在这儿仍是拿出来叨一下。

  

  许多站长网站改版了启用了新的URL结构,也在站长渠道进行了改版提交,可是仍是呈现录入旧的URL,遇到这个问题首先咱们仍是从站点本身的问题找起:

  

  1.是否现已去除一切旧地址进口?

  

  这是个严厉的问题,许多朋友由于站点大、结构杂乱、改版不完全导致并没有去除一切进口页面,导致新内容发作的一起在一些角落里仍是发作了老的进口,只要链接地址仍是老的就有可能被录入。所以要改版要换URL有必要彻里彻外的把一切链接替换为新的URL。为了加快收效新的链接除了站点本身链接外尽可能修正一下外部的链接,例如友情链接。

  

  2.老的URL是否做了301到新的URL上?

  

  老的URL是否真的是301到新的URL上面?我也遇到一些奇葩的朋友运用js之类的技能,看起来如同也是跳转,也像那么回事,但其实底子不是一回事!

  

  3. 关于百度方面

  

  在做好1和2的根底上,即使百度录入了旧的链接,也不用忧虑,由于百度对跳转特点的站点和链接辨认和承认需求必定的时刻,并且只要是安稳的跳转,终究都会转换成新链接的流量,当然记得经过网站改版东西及时提交改版规矩。

  

  二、测验网址平白无故就被录入了导致了正式网址不被录入

  

  这儿我主张咱们今后测验的时分尽量环境确保本地或许在特定测验环境下才能拜访,否则现在的各种浏览器可能会把地址透露出去,也有不小心把地址拿去搜索等渠道导致被搜索引擎录入那么对你的站点上线影响仍是蛮大的。

  

  1.没有封闭测验服务器

  

  上面遍及常识有提到过,咱们换IP或许换URL地址的时分由于老的服务器没有封闭,而搜索引擎缓存了IP,导致搜索引擎仍是能够拜访到这些页面;

  

  2.没有删去IIS绑定

  

  还有一些朋友换了IP地址,可是并没有在老的IP上的网页服务器上删去网站绑定,导致搜索引擎带HOST头拜访该IP的时分能够拜访到旧的内容;

  

  一般状况下搜索引擎缓存的时分较长,或许因cdn等因素导致IP同步失利的都会导致上述状况发作,替换ip今后,能够经过抓取确诊东西测验一下百度是否能够正确抓取,假如解析到的ip有误,可点击抓取确诊概况中的“报错”,通知百度更新您站点的ip。

  

  三、换IP后导致百度不录入

  

  上面提到搜索引擎会缓存IP,百度在换IP的时分也说过尽量确保老服务器一段时刻内能够拜访,为什么要这样?由于服务器真的需求时刻去同步内容同步IP,并且直接断了老的服务器很简单导致短时刻突发404,因而会给站点形成不行预估的问题;

  

  换IP后不录入原因也是这样,由于换了新服务器数据迁移后导致老服务器的内容并没有更新,所以这个时分其实是百度底子抓取不到你的更新。因而需求经过上面的方法尽快通知百度,您站点ip的变化,削减站点流量丢失。


回到

顶部