什么是IIS日志
IIS日志是每个服务器管理者都必须学会查看的,服务器的一些状况和访问IP的来源都会记录在IIS日志中,所以IIS日志对每个服务器管理者非常的重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。
为什么要了解IIS日志
对SEO优化者来说,研究蜘蛛原理,做好搜索引擎的收录是我们SEO最核心的思想。那么分析IIS日志就是我们必须要了解的基本知识,不仅需要了解IIS日志状态码含义,而且还需要了解各大搜索引擎爬虫(蜘蛛Robot)名称。通过IIS日志我们可以了解到蜘蛛爬取情况及网站流量访问情况。
IIS日志在什么位置
1) 虚拟空间 (一般都在FTP中的一个叫LOG文件夹中、如果没有可以联系空间商索要)。用FTP连到空间后,根目录下通常会有log的文件夹,下载到本地就可以去读日志,或者借助IIS日志分析工具给自己的网站把把脉。

2)服务器及VPS (服务器及VPS基本上都会有控制WEB服务器的权限、无论是IIS还是APCHE都是可以设置的、具体方法领袖儿在就这不说了)
如何分析IIS日志
例:2009-11-26 16:00:01 GET /index.asp - - 66.249.67.41 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) - 200 71879 .
分析 ..
date(日期)===========2008-10-14
time(时间)===========16:00:01
cs-method(方法)=======GET .
cs-uri-stem(URI资源)==== /index.asp //代表访问的资源是当前这个文件 !
cs-uri-query(URI查询)==== - //
cs-username========== - .
c-ip(客户端IP)==========66.249.67.41 ...
cs-version ============HTTP/1.1 //协议版本 .
cs(User-Agent)=========Mozilla/5.0+ (compatible;+Googlebot/2.1;++http://www.google.com/bot.html) //谷歌在收录 ..
cs(Referer) (引用站点) ===== - //搜索的站点 .
sc-status(协议状态)======= 200 //200表示OK 特别注意:
sc-bytes(发送的字节数)===== 71879 //表示当前文件的大小
IIS日志常见的状态代码为:
200 - 服务器成功返回网页
404 - 请求的网页不存在
301 - 请求的数据具有新的位置且更改是永久的
503 - 服务器暂时不可用
网页状态码含义:
2xx 成功
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受用于处理,但处理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx 重定向
301 已移动 — 请求的数据具有新的位置且更改是永久的。
302 已找到 — 请求的数据临时具有不同 URI。
303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机首先必须使用代理
IIS日志分析软件:
1、网站iis日志分析软件(超强)
2、网站蜘蛛爬取分析工具
3、光年SEO日志分析系统 2.0 (推荐)
有很多SEOer经常会问,为什么百度不收录我的网页,那么大家就要学会经常分析IIS日志,这是理解蜘蛛原理的必不可少的一个方法。 |