域名预约/竞价,不错过好东西
自从从事SEO网站优化以来,我慢慢关注网站日志。网站日志分析已经成为我每天工作的第一件事。每天到公司第一件事就是分析昨天的网站日志。也许有些站长不知道如何分析网站日志。为此,可以参考皇冠网小编之前发表的文章《懂一点网站日志分析,网站更安全》。不过,也有少部分人认为分析网站日志是浪费时间。每天查看数据的作用。在此,皇冠网小编认为至少有四点值得我们学习。
首先判断是否有蜘蛛爬过来
如何判断蜘蛛是否在爬行:
1.通过观看网站日志代码来观看。这是针对分析专家的。
2.通过网站日志分析工具查看,比较适合新手使用
通过网站日志分析工具,您可以直接查看网站的哪些页面被蜘蛛抓取过。
其次,客户端IP会告诉你蜘蛛类型。
1、220.181.108.*ip段的百度蜘蛛(提权蜘蛛)
2、123.125.71.*IP段的百度蜘蛛(抓劣质文章的蜘蛛)
3、123.125.68.*ip段的百度蜘蛛(排查蜘蛛)
4、117.28.255.*ip段的百度蜘蛛(假蜘蛛)
5.. 。 。 。 。
三、检查页面状态是否正常
通过URL日志,我们可以直接使用服务器响应码来查看我们的哪些页面有问题,哪些是正常的。一般情况下,如果返回的状态码为200,则表示正常。如果出现404,则说明该页面有问题。
四、网站搜索引擎友好度
从网站日志中,我们可以直接看到蜘蛛抓取我们网站的次数。蜘蛛爬行的次数越多,蜘蛛对我们的网站就越友好。
从上图我们可以直接看到蜘蛛爬行我们网站的次数,但是爬行次数中也有假蜘蛛,所以我们还需要通过客户IP来确认哪些是真蜘蛛,哪些是假蜘蛛。 。这一点可以参考《了解一点网站日志分析,网站更安全》,里面有如何区分真假蜘蛛的图文教程,这里就不介绍了。
通过对以上三点的了解,皇冠网小编对以上四点进行了进一步探讨:
对于上面的第一个,我们可以直接查看哪些页面被抓取了,哪些页面没有被抓取。随着算法的不断更新,新站的审核周期越来越长,以至于很多新站长更新的文章即使通过站:域名索引也显示不出来。这主要是因为搜索引擎卡住了,没有及时释放。
关于上面的第二点,我们可以通过客户IP来识别网站安全信息和文章内容质量。
根据不同的IP,我们可以分析网站的状态。常见的百度蜘蛛IP如下:
1、如果123.125.68.*经常来,其他很少来,那么该网站进入沙箱或被降级的可能性就很大。
2、如果220.181.68.*每天只增不减,则是进入沙箱或被降级的标志。
3. 220.181.7.*、123.125.66.* 搜索引擎开始抓取内容。
4、121.14.89.*已超出新站检测周期。
5. 203.208.60.*站点开始出现异常。
6. 210.72.225.* 该IP段连续巡查每个站。
7. 220.181.108.* 捕获高质量的文章内容页面或主页。
一般爬取成功的返回码是200 0 0。如果返回状态显示304 0 0,则说明网站尚未更新。蜘蛛来过,但还没有被爬过。如果是200 0 64,那么不用担心,这只是一些动态页面的捕获。
关于上面的第三点,如果服务器返回一个状态,比如200,则表示可以正常访问。 404表示页面不存在。 304表示网页尚未更新。这些可以通过网站日志中的代码直接看到。如果大量出现404,针对这些404页面采取措施是非常有必要的。我们可以使用.txt协议来屏蔽这些页面,阻止搜索引擎抓取这个页面。
关于上面的第四点,真正的蜘蛛来的次数越多越好!
好啦,介绍一下网站日志。网站日志可以通过以下两种方式获取:
1.FTP空间日志文件夹
2.登录您网站的服务器,通常网站登录位置为C:--