Nginx日志访问统计分析命令

说明

  • PV(访问量):
  • 即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。
  • UV(独立访客):
  • 即Unique Visitor,访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。
  • IP(独立IP)
  • 即Internet Protocol,指独立IP数。00:00-24:00内相同IP地址之被计算一次。

IP相关统计

根据访问IP统计UV

awk '{print $1}' access.log|sort | uniq -c |wc -l
查看某一时间段的IP访问量(4-5点)

grep "07/Apr/2017:0[4-5]" access.log | awk '{print $1}' | sort | uniq -c| sort -nr | wc -l
查看访问最频繁的前10个IP

awk '{print $1}' access.log | sort -n |uniq -c | sort -rn | head -n 10
统计访问量前10的ip

awk '{a[$1]++}END{for (j in a) print a[j],j}' /var/log/nginx/access.log|sort -nr|head -10
查看访问100次以上的IP

awk '{print $1}' access.log | sort -n |uniq -c |awk '{if($1 >100) print $0}'|sort -rn
查询某个IP的详细访问情况并按访问频率排序。

grep '104.217.108.66' access.log |awk '{print $7}'|sort |uniq -c |sort -rn |head -n 100

页面访问统计

统计访问URL统计PV

awk '{print $7}' access.log|wc -l
查看访问最频的页面的前10个IP

awk '{print $7}' access.log | sort |uniq -c | sort -rn | head -n 10
查看访问最频不包含php页面的前100个IP

grep -v ".php" access.log | awk '{print $7}' | sort |uniq -c | sort -rn | head -n 100
查看页面访问次数超过100次的页面

cat access.log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less
查看最近1000条访问量最高的页面的记录

tail -1000 access.log |awk '{print $7}'|sort|uniq -c|sort -nr|less
获取每分钟的请求数量并输出成csv文件

cat access.log | awk '{print substr($4,14,5)}' | uniq -c | awk '{print $2","$1}' > access.csv
获取最耗时的请求时间、url、耗时的前10名,可以修改后面的数字获取更多,不加则获取全部。

cat access.log | awk '{print $4,$7,$NF}' | awk -F '"' '{print $1,$2,$3}' | sort -k3 -rn | head -10
每秒请求量统计
统计每秒的请求数,前100个时间点。

awk '{print $4}' access.log |cut -c 14-21|sort|uniq -c|sort -nr|head -n 100
每分钟请求量统计
统计每分钟的请求数,top100的时间点(精确到分钟)

awk '{print $4}' access.log |cut -c 14-18|sort|uniq -c|sort -nr|head -n 100
每小时请求量统计
统计每小时的请求数,top100的时间点(精确到小时)

awk '{print $4}' access.log |cut -c 14-15|sort|uniq -c|sort -nr|head -n 100

性能分析

在nginx log中最后一个字段加入$request_time

列出传输时间超过 3 秒的前20条的页面

cat access.log|awk '($NF > 3){print $7}'|sort -n|uniq -c|sort -nr|head -20
罗列php页面请求时间超过3秒的页面并统计前100个出现的次数

cat access.log|awk '($NF > 1 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

搜索引擎抓取统计

统计百度抓取次数

grep 'Baiduspider' access.log |wc -l
统计百度抓取404的次数

grep 'Baiduspider' access.log |grep '404' | wc -l

TCP连接统计

查看当前TCP连接数

netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l
用tcpdump嗅探80端口统计访问最高

tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr

发表评论