#实现的功能
访问最多的IP
访问最多的页面
访问页面状态码数量
根据时间段来访问最多的IP
#!/bin/bash
# 日志格式: $remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for"
#表示位置参数
LOG_FILE=$1
echo "统计访问最多的10个IP"
#sort表示降序;-k2表示对第二列数字,-nr表示从大到小进行降序;head -10表示打印前10行,length表示统计数量
#解释:打印日志中访问的IP以及每个IP访问对应的次数,(并统计IP的个数,也就是UV)
awk '{a[$1]++}END{print "UV:",length(a);for(v in a)print v,a[v]}' $LOG_FILE |sort -k2 -nr |head -10
echo "----------------------"

echo "统计时间段访问最多的IP"
#打印日志中一个时间段内访问的IP以及每个IP访问对应的次数
awk '$4>="[17/Jan/2021:15:11:22 " && $4<="[18/Jan/2021:18:11:22 "{a[$1]++}END{for(v in a)print v,a[v]}' $LOG_FILE |sort -k2 -nr|head -10
echo "----------------------"

echo "统计访问最多的10个页面"
#打印日志中访问pv次数大于10次的页面的url以及每个页面对应的访问次数,并统计PV的次数,否则不打印。
awk '{a[$7]++}END{print "PV:",length(a);for(v in a){if(a[v]>10)print v,a[v]}}' $LOG_FILE |sort -k2 -nr
echo "----------------------"

echo "统计访问页面状态码数量"
#打印日志中访问状态码超过5次的url和对应的状态码,以及对应访问url的次数
awk '{a[$7" "$9]++}END{for(v in a){if(a[v]>5)print v,a[v]}}' $LOG_FILE |sort -k3 -nr