來(lái)源: 作者: 發(fā)布:2020/2/1 瀏覽次數(shù):2260
網(wǎng)站日志分析的作用大致包括:記錄你的網(wǎng)站在什么時(shí)間更新過(guò)什么東西,有沒(méi)有被黑客攻擊你的網(wǎng)站,記錄誰(shuí)來(lái)點(diǎn)擊進(jìn)過(guò)你的網(wǎng)站,記錄蜘蛛什么時(shí)間來(lái)抓取的,抓取的深度是多深,抓到那個(gè)頁(yè)面下不抓了.這樣當(dāng)你的網(wǎng)站,發(fā)現(xiàn)蜘蛛長(zhǎng)時(shí)間不來(lái)抓取后就可以找到問(wèn)題根源,找到根源就能找到解決的辦法,而不會(huì)像一個(gè)無(wú)頭的蒼蠅到處亂轉(zhuǎn),或者干等奇跡的發(fā)生,首先蜘蛛不來(lái)抓取,我們首先要看百度的抓取頻次,是從那天開(kāi)始不抓的?不抓取之前自己是否做過(guò)什么違反搜索引擎規(guī)則的事...等等這一系列跟網(wǎng)站日志有關(guān)的。
1、使用日志分析工具-金花站長(zhǎng)工具
百度金花站長(zhǎng)工具去下載
打開(kāi)金花站長(zhǎng)工具->數(shù)據(jù)分析->網(wǎng)站日志分析,選擇日志文件目錄
2、分析是否收錄
舉例1月31日發(fā)布文章網(wǎng)站優(yōu)化一-寫(xiě)好title很重要,2月1日我查看網(wǎng)站日志看這篇文章是否被百度收錄了
找到1月31日日志文件
查看百度抓取記錄,如果查找很麻煩也可以導(dǎo)出到excel中查找
查看是否收錄
3、404錯(cuò)誤
404錯(cuò)誤就是網(wǎng)頁(yè)打不開(kāi),可以檢查下網(wǎng)頁(yè)的地址是否改變了,及時(shí)修復(fù)404錯(cuò)誤避免搜索引擎經(jīng)常抓取錯(cuò)誤網(wǎng)頁(yè)給搜索引擎留下不好的印象。
狀態(tài)碼200、304都是成功的
4、日志文件大小
日志文件大小反應(yīng)了網(wǎng)站的受歡迎程度,訪問(wèn)量越大日志文件就越大。通常關(guān)注下日志文件大小變化趨勢(shì),如果突然增加很多或減少很多就用看是什么原因引起的。
5、日志文件包含的信息
經(jīng)過(guò)上面的講解大家應(yīng)該對(duì)日志文件有了初步的了解,接著我們講點(diǎn)更專業(yè)的,一條標(biāo)準(zhǔn)的日志記錄應(yīng)該包含哪些信息
遠(yuǎn)程主機(jī)(Remote Host)的IP地址/名字
登錄名(Log Name)
登錄全名(Full Name)
請(qǐng)求發(fā)生的日期(Date)
請(qǐng)求發(fā)生的時(shí)間(Time)
和標(biāo)準(zhǔn)格林威治時(shí)間的差值(GMT Offset)
請(qǐng)求的方法(Request Method)
請(qǐng)求的文件的地址(File)
請(qǐng)求遵守的協(xié)議(Protocol)
請(qǐng)求的狀態(tài)(Status)
被請(qǐng)求文檔的長(zhǎng)度(Length)
下面是一條標(biāo)準(zhǔn)的日志文件記錄:
2020-01-31 13:01:17 192.168.0.5 GET /news_view3.asp id=1381 80 - 220.181.108.186 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - 200 0 0 132
由于服務(wù)器的設(shè)置問(wèn)題,格式會(huì)有所不同,但是包含的內(nèi)容是一樣的。
6、分析來(lái)訪者身份
在某些特殊情況下我們需要確認(rèn)某個(gè)訪問(wèn)IP,下面舉例說(shuō)明。
比如我使用了百度商橋,看到每天都有一個(gè)來(lái)自北京的IP訪問(wèn)我網(wǎng)站,而且每次都只訪問(wèn)一個(gè)頁(yè)面就退出
記錄下這個(gè)IP:111.206.36.135,然后直接在日志文件里查詢
2020-01-31 13:01:05 192.168.0.5 GET /uploadfile/20191020153017659.jpeg - 80 - 111.206.36.135 Mozilla/5.0+(Linux;+Android+6.0;+Redmi+Note+4+Build/MRA58K;+wv)+AppleWebKit/537.36+(KHTML,+like+Gecko)+Version/4.0+Chrome/76.0.3809.89+Mobile+Safari/537.36+T7/11.19+SP-engine/2.15.0+baiduboxapp/11.19.0.11+(Baidu;+P1+6.0) http://www.ipgeni.com/products_view.asp?id=42&tid=42 200 0 0 460
分析發(fā)現(xiàn)baiduboxapp是百度手百UA程序,這個(gè)訪問(wèn)者對(duì)我網(wǎng)站是有用的,果斷打個(gè)標(biāo)記
來(lái)源:巨靈鳥(niǎo) 歡迎分享本文
上一個(gè)文章:網(wǎng)站優(yōu)化五-H1標(biāo)簽
下一個(gè)文章:網(wǎng)站優(yōu)化一-寫(xiě)好title很重要