搜索引擎优化、SEO诊断、内容建设欢迎联系QQ:1082484
网站日志分析是SEO中非常重要的一个操作。新网站上线可以通过网站日志分析进行查看是否被蜘蛛抓取,网站是否存在404错误进行及时纠错,是否被整站扫描下载等,这只是一些常见的日志用途。
通过网站日志分析还可以得到很多其他的信息。正是因为网站日志分析如此的重要,CRAZYSEO工程师建议大家在选择服务器的时候一定要询问服务器提供商是否支持日志记录。
日志记录的内容分类主要有两大类型,分别是访客访问信息和蜘蛛抓取信息,下面CRAZYSEO工程师就这两种类型信息进行讲解。
1.访客访问信息的内容:
2014-07-01 00:23:04 W3SVC50722105 61.155.150.92 GET /hello/seo.html – 80 – 222.88.71.11 Mozilla/5.0+(Windows+NT+6.1;+WOW64;+rv:30.0)+Gecko/20100101+Firefox/30.0 200 0 0
这是一段用户访问记录,内容是7月1日凌晨12点23分的时候,IP地址为222.88.71.11的用户使用火狐浏览器正常访问了网站的/hello/seo.html这篇文章。这条记录信息需要注意的几个点:访问网页地址、访问时间、IP地址以及返回状态码。前面几条比较明晰,状态码可能是站长们比较头疼的。
2014-06-30 16:52:52 W3SVC50722105 61.155.150.92 GET /html/success.html – 80 – 202.108.4.123 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1) 404 0 64
这是一条用户访问404错误信息,由于网站改版造成的目录及网页文件更改后遗症。这些信息也有可能被蜘蛛抓取,所以需要提交百度改版信息或robots屏蔽或提交死链接来屏蔽蜘蛛的抓取。从而减少页面404错误抓取信息。
2014-06-20 17:35:10 W3SVC50722105 61.155.150.92 HEAD /www.abc.com.rar – 80 – 27.150.236.228 Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+6.1;+Trident/4.0) 404 0 2
这是用户用软件批量扫描网站备份文件所造成的404错误信息其中的一条,很多黑客用这种方法下载网站备份信息从而爆破网站达到网站入侵的方法,可以把网站备份信息单独存放到web目录外的其他目录中预防这种情况发生以及通过屏蔽IP地址等方法解决。
网站日志分析
2、蜘蛛抓取信息:
2014-06-30 16:00:46 W3SVC50722105 61.155.150.92 GET /hello/seo.html – 80 – 66.249.64.36 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0
这是谷歌机器人对网站中/hello/seo.html网页文件的正常抓取信息。
2014-07-01 02:47:09 W3SVC50722105 61.155.150.92 GET /sitemap.xml – 80 – 123.125.71.106 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 304 0 0
这是百度蜘蛛对网站/sitemap.xml网站地图的304抓取信息,304代表着文件无修改,百度服务器已经存放了相同信息,缓存信息无修改,无需更新。
网站日志分析贯穿于SEO过程的始终,从分析搜索引擎蜘蛛爬行到观测用户访问网页情况,再到遇到攻击后分析攻击这信息和程序BUG,因此CRAZYSEO工程师建议大家一定要认真阅读这篇内容,务必掌握网站日志分析的技巧和方法。
这里CRAZYSEO工程师推荐给大家一款非常好用的网站日志分析软件“光年日志分析工具”,搜索引擎搜索下载即可,界面如图1,使用非常简单,相对于其他网站日志分析软件“光年日志分析工具”有很多优点。
图1 光年SEO日志分析系统
首先这是第一个专门为SEO设计的网站日志分析软件。以前的很多网站日志分析软件,都是顺带分析一下SEO方面的数据,而这个软件里面分析的每一个指标都是为SEO设计的。而且很多的分析维度,都是其他网站日志分析软件没有的。这能让你看到很多非常有用、但是以前获取不了的数据。
其次“光年SEO日志分析系统”能分析无限大的日志,而且速度很快。很多的网站日志分析软件,在日志大于2G以后,都会越来越慢或者程序无响应。而这个软件能分析无限大的日志,并且每小时能分析完40G的日志。这对于那种需要分析几个月内的日志、以及要分析几十G的大型网站的日志都非常有帮助。
最后是“光年SEO日志分析系统”能自动判断日志格式。现在很多的网站日志分析软件,对Nginx或者CDN日志都不支持,而且对日志记录的顺序都要格式要求。而这个软件就没有这么多的限制,它能从日志中自动检测到哪个是时间、哪个是URL、哪个是IP地址等等。