今天我查看百度天级收录结果的时候,发现昨天的果不其然又是未能抓取成功,请检查网站服务器是否正常.。但是这就很不科学了,我已经再三于抓取诊断里确认过主页和最新的文章是可以抓取的。一定是哪里出问题了,抱着这种心态我从下载的详情里复制了一条抓取失败的url,复制到浏览器里访问,然后EXCUSE ME??????? 为什么是404???
因为前几天手欠误删过MySQL,我以为是文章丢失了,还好打开文章编辑页面时发现文章还在。我试着点了编辑器上面的永久链接,然后跳到了404页面,此时我心中一万匹草泥马飘过。
天才的我在主页检查了一下文章链接,10秒后发现所有404的文章全都在链接里包含中文字符,而不包含中文字符的文章没有任何问题。那么问题就可以解决了,将404的文章链接中的中文字符换掉即可。
还好我的文章只有五篇使用了中文字符做链接,外链也不多,改起来还算容易,顺便搜索引擎那边有个死链提交也要提交。
不过我确信最开始用XAMPP的时候中文链接是没问题的,后来换成IIS也是没问题的,可能是这次自动更新到5.2.4–en_US才出的问题吧,而且继续更新到5.2.4-zh-CN也没有解决。
但是之前也有人建议过不要用中文字符做链接,还好我看见之后也这样做了,不然所有文章可能都要炸。


2019年10月30日更新

今天检查Google search console的时候又发现了几个链接失效。检查链接之后果然还是中文字符问题,不过这次是分类目录和标签出问题了。之前写博客的时候加了很多中文分类和标签,这些分类和页面也是有单独页面的。Google从sitemap上获得了这些链接,抓取的时候就404了。
在WP后台为每个中文分类目录和标签添加一个英文别名即可解决。
话说刚刚我处理链接的时候发现幽闭星光的网站不支持https,https页面是服务器商的广告233333。


挂科一时爽,一直挂科一直爽。
🀇🀇🀇🀈🀉🀊🀋🀌🀍🀎🀏🀏🀏 🀋