让更多人看到你的博客

通过一些简单的配置,让你的博客被更多人看到。

SEO:Search Engine Optimization即搜索引擎优化。通过一些方法可以加速搜索引擎的收录或者提高权重,同样的关键词搜索时,更容易排名靠前。
本文会介绍一些基础的搜索引擎优化方法应用在自己的博客中,但是需要注意,做一些基础的操作,明白原理即可。独立博客还是内容为王,不要执着于其他的方法,背离初心。

基本原理

要想增加收录,要让搜索引擎先认识你,知道你的网站的具体情况。约定俗成的做法是新建一个文件,让搜索引擎知道你同意搜索哪些内容的文件。网站地图(Sitemap)告诉爬虫你的网站结构。关于搜索引擎的收录情况,就需要到各自搜索引擎的站长平台去检查了。一般来说被Google、百度收录就大功告成了,考虑到微信的流行程度,也可以新增搜狗的收录作为关注。

实际操作

制作robots.txt

在源码的Source目录下新建robots.txt文件后,录入以下内容。

1
2
3
4
5
6
7
8
9
10
# hexo robots.txt
User-agent: *
Allow: /
Allow: /archives/

Disallow: /js/
Disallow: /css/

Sitemap: http://blog.junyu.pro/sitemap.xml
Sitemap: http://blog.junyu.pro/baidusitemap.xml

生成的实际网站的信息效果。其中allow和disallow根据站点的目录设置。大家可以看一下Baidu Robots.txtSogou Robots.txtGoogle Robots.txt感受一下。

制作网站地图

利用hexo插件:generator-sitemap,一步生成地图。

1
npm install hexo-generator-sitemap --save

安装完插件后,在Hexo部署时会自动生成对应的文件部署到静态网页中。

其他优化

在这两篇博客中有详细说明,不再赘述:

平台操作

百度站长平台Google Webmaster平台上传robots.txt和网站地图。

  • 百度站长平台
    • 提交站点地图:网页抓取 -> 链接提交 baidusitemap.xml。在博客的地址后面加上/baidusitemap.xml即可。
    • 提交robots.txt:网页抓取 -> robots
    • 强烈建议执行“抓取诊断”确认自己的页面是否可以正常被百度爬虫抓取。
  • Google Webmaster
    • 提交站点地图:Crawl -> Sitemaps。在博客的地址后面加上/sitemap.xml即可。
    • 提交robots.txt:Crawl -> robots.txt Tester。
    • 查看 Crawl -> Crawl Errors 确认抓取的情况,解决错误问题。

检查收录

在对应的搜索引擎下搜索自己的关键字,或者搜索“site:你的域名”,查看收录的情况,从站长后台查看搜索情况等都是检查收录的好办法。

百度爬虫无法爬取搭建在Github上的个人博客

该问题在知乎的讨论已经非常成熟:如何解决百度爬虫无法爬取搭建在Github上的个人博客的问题?。一共有三种可选的办法:

  • 在Coding Net搭建博客,或者和github同时搭建,采用不同的域名解析策略。
  • 利用CDN分发,需要注意CDN是否会自动链接到源头。
  • 自己搭建服务器
  • 忽略该问题

总的来说都是绕开github,根据bblove给出github的官方邮件回复来看,短时间内是不能指望Github解禁百度了。

Hi Jackroyal,
We are currently blocking the Baidu user agent from crawling GitHub Pages sites in response to this user agent being responsible for an excessive amount of requests, which was causing availability issues for other GitHub customers.
This is unlikely to change any time soon, so if you need the Baidu user agent to be able to crawl your site you will need to host it elsewhere.
Cheers,
Scott

我选择了在Coding Net新建帐号,每一次的代码在两个地方部署的方式来实现。同时域名解析针对国内线路和国外线路分开解析。关于具体的做法就赘述了,重建Hexo的教训中有说明,需要具体步骤的小伙伴可以直接搜索,能找到很多的答案。

其他

百度主动提交网页

NexT主题已经做好了主动推送的接口,在Next主题配置文件说明有具体的配置说明。

注册统计网站

注册统计分析网站和站长工具平台,通过数据了解自己的网站变化。右侧的侧边栏有对应的链接。

声明: 本文转载需标明出处,禁止用于商业目的。

ChangeLog

161121 新建