|
-
2025-04-20 09:51
-
引用
1 楼
所以,要说百度不是“套路王”,你能信? 晓枫说,游走在科技与人文之间,新浪创事记、虎嗅、百度百家、砍柴网、搜狐、艾瑞、品途等专栏作者,联系请加个人微信angaoeng。
|
|
-
2025-04-20 09:45
-
引用
2 楼
在过去一年,我们看到,知乎的这种影响力得到了进一步的彰显,乃至是促进了诸多社会疑难、痼疾的解决落地。
|
|
-
2025-04-20 09:04
-
引用
3 楼
第四步:一张完美整洁的日志就导入进来了,这样再看是不是很舒服很清晰呢 第五步:把一些不需要的删除,只需保留cs-uri-stemURI资源、c-ip客户端IP地址、cs(User-Agent)用户代理、sc-status协议状态这4项就可以了 如下图所示,一目了然! 网站日志英文注释: date日期 time时间 s-sitename服务名 s-ip服务器IP地址 cs-method方法 cs-uri-stemURI资源 cs-uri-queryURI查询 s-port服务器端口 cs-username用户名 c-ip客户端IP地址 cs(User-Agent)用户代理sc-status协议状态 200表示成功 301永久重定向 403表示没有权限 404表示找不到该页面 500内部服务器错误 503服务器超时 sc-substatus协议子状态 sc-win32-statusWin32状态 sc-bytes发送的字节数 cs-bytes接收的字节数 time-taken所用时间 网站日志分析 以下图为例 通过分析:一款俄罗斯的蜘蛛通过IP为141.8.142.145地址爬取了robots.txt这个文件,抓取成功,返回200正常。
|