
1. 准备一台位于香港的测试服务器(有 root 权限),并确认该服务器走的是 CN2 专线出口;准备一台或多台位于目标区域(国内机房、海外节点)的测试端作为对端。
1. 安装常用工具:iperf3、mtr、traceroute、tcpdump、speedtest-cli(或官方 CLI)、netperf。示例命令:apt-get install -y iperf3 mtr-traceroute traceroute tcpdump speedtest-cli。
2. 在香港服务器上用 traceroute/traceroute -T 或 mtr 检查出网路径:mtr -r -c 100 -w 目标IP。记录经过的 ASN 与跳点延迟变化,若第一跳即波动说明本地出口问题。
2. 使用 Looking Glass 和 bgp 工具确认前缀走向:在 he.net、各大运营商 LG 上查询你的 IP 是否通过 China Telecom CN2(查看 AS 路径包含 AS4134/ASN4812 等)。若路径不符需联系带宽供应商。
3. Ping 长时统计:ping -c 200 -i 0.2 目标IP,重点看丢包率和平均/最大 RTT。理想:同城 <5ms、区域联网 <20-40ms;丢包<0.1% 为佳,>1% 需重视。
3. TCP 层探测:使用 hping3 或 tcptraceroute 测试 80/443 等端口,确认防火墙、PPS 限制或 TCP 中间件不会影响真实连通性。
4. 启动服务端:iperf3 -s -p 5201;客户端并发测试:iperf3 -c SERVER_IP -P 8 -t 60 -R(双向测试时分别做正向与反向)。记录带宽峰值、平均、抖动。
4. 逐步增并发:先 P=1 再 2、4、8,直到达到链路容量或出现丢包/重传激增。若 TCP 无法接近标称带宽,检查窗口大小(-w)、并发与 MSS、存在 QoS 或流控。
5. iperf3 UDP 测试示例:iperf3 -c SERVER_IP -u -b 500M -t 60 -l 1400,记录丢包率与 jitter(iperf3 会给出)。实时音视频服务对 jitter 敏感,抖动 <5ms 比较理想。
5. 如果丢包或 jitter 高,结合 tcpdump 在双方抓包分析:tcpdump -i eth0 host 对端IP and udp port PORT -w test.pcap,使用 Wireshark 查看丢包与延迟分布。
6. 按 SLA 制定定时检测策略:每 1 分钟 ping/MTR 检测、每 1 小时 iperf3 吞吐检测、每 5 分钟 speedtest-cli 测试并记录到日志/监控系统(Prometheus+Grafana 或 Zabbix)。
6. 统计可用性(Uptime):按照丢包/ RTT 阈值判断异常窗口,计算故障时间占比。可用性 = (总时间 - 故障时间)/总时间。记录并存证用于追 SLA。
7. 若出现性能退化,依次排查:本机CPU/中断/网卡(ethtool)→ 本地链路/交换机端口错误统计(ifconfig / ethtool -S)→ 路由跳点丢包(mtr)→ 运营商侧拥塞或策略(联系带宽提供商并提交路由及时间窗口日志)。
7. 提交故障工单时附上:mtr 报告(包含时间戳)、iperf3 原始输出、tcpdump pcap、BGP 路由快照与 speedtest 结果,便于运营商快速定位 CN2 专线问题。
8. 建议搭建监控:Prometheus node_exporter + blackbox_exporter(HTTP/ICMP/ TCP)+ Grafana 仪表盘;采集指标包括:延迟(p50/p95/p99)、丢包率、抖动、吞吐、BGP 路由变更次数。
8. 每日/每周生成报告并包含波动时间线与异常截图,作为评估 CN2 专线是否满足业务 SLA 的依据,并作为与供应商谈判的证据。
9. 问:如何快速判断香港 CN2 专线是否存在拥塞?
9. 答:用 mtr -r -c 100 目标IP 看某些跳点 RTT 与丢包是否集中在运营商边界;同时用 iperf3 并发测试观察吞吐随并发增加是否突然下降并伴随重传/丢包,若是则很可能为拥塞。
10. 问:丢包在中间某跳与目标主机如何区分责任?
10. 答:若 mtr 显示某中间跳点开始持续丢包且后续跳点丢包相同,通常为该跳点或其后链路问题;若中间跳点丢包但后续到目标恢复,可能是该跳点对 ICMP 限制,需要结合 tcp 层 iperf3 和最终业务流量判断。
11. 问:评估结果哪些阈值需要报警和升级工单?
11. 答:建议丢包>1% 或连续 5 分钟 RTT 异常(超出基线 3 倍)、抖动>10ms、带宽利用率却无法达到标称值时触发工单;同时包含测试日志与抓包便于供应商定位。