Hexo 使用 Zeit 托管网页实现百度抓取

接上篇Hexo + Github 网站添加谷歌跟百度收录,说到将个人网站可以是使用 Github 托管的静态网页,因为 Github 屏蔽了百度的爬虫,因此收录有问题,最近看到一篇帖子,可以使用 Zeit 免费托管网页,对于免费用户,每个月流量限额是20G,这点对我来说已经远够用了 1,便尝试了下,结果成功了,现在记录一下。

注册 Zeit

首先打开 zeit.co 网站,现在好像改名叫 Vercel,注册账号,这里可以直接使用 Github 账号登陆,然后选择你博客的仓库导入:

选择你的 Github.io 仓库

最后你选择仓库点击 Import 导入:

等待几分钟导入成功后,点击可以访问你的博客主页,这时候静态资源已经部署到 zeit 的边缘 CDN 节点上了,下次你 GitHub 项目的任何更新会触发 zeit 项目更新。

重定向域名

接下来的就是切换域名,通过智能 DNS 将国内流量切过去。通过 zeit 提供的 DNS 解析服务配置自己的域名,然后在百度站长里配置信息。

在 Domains 下为项目添加你的个人域名。

在输入框输入你的域名,然后在弹出的框中,选择推荐项,也就是第一个:

zeit 会自动创建两个域名解析,但是这个时候因为还没设置域名解析信息,此时解析是失败的。

使用 A Record

这个方法其实就是使用 zeit 提供的域名,替换掉之前 Github 给的域名信息,打开你的域名解析服务,将之前设置好的 Github 的域名停用,然后增加两条 zeit 给的域名信息:

替换为:

回到 zeit 等待一会后,就会发现域名定向成功,而且自动给你生成 https 证书,完美,重新打开你的网站地址也能正常访问。

nameserver 方式

使用第一种方式需要替换掉之前的 Github 域名,相当于博客不在使用 Github了,对此 zeit 还提供了另外一种方式,就是通过修改 nameserver,我是使用腾讯云来设置域名解析的,因此打开腾讯云,找到你的域名,点击右侧的 管理按钮。

找到 DNS 服务器:

改成 zeit 给你的 DNS 服务器,也就是左边的 DNS 服务器:

等待一些时间,就OK了

最后测试抓取

回到百度站长管理网站,找到 抓取诊断,手动提交一下你的 Sitemap,重新试一下就能成功啦。

参考

1.解决百度爬虫无法爬取 Github Pages 个人博客的问题

2.如何让百度收录 GitHub Pages 个人博客