1. 概览:明确目标与指标
步骤1:确定目标(延迟/带宽/抖动/丢包/95th计费等)。
步骤2:记录SLA、带宽计费方式(Burst、95th、按峰值)。
步骤3:列出测试节点(国内、香港、亚太、欧美)和测试时间窗口(高峰/非高峰)。
2. 带宽选型与供应商对比
步骤1:询问是否为专属带宽(Dedicated)或共享(Shared)。
步骤2:确认承诺带宽(CIR)、峰值处理、是否支持弹性升降及计费周期。
步骤3:要求提供延迟/丢包历史、Peering信息与DDoS策略;优先选择本地骨干或与中国大陆有良好互联的提供商。
3. 物理链路与交换配置检查
步骤1:与机房确认光纤类型、链路速率(1/10/25/40/100G)、SFP型号。
步骤2:请求交换机端口配置(LACP/Trunk、MTU、flow-control)并记录。
步骤3:如果使用LACP,要求机房配置匹配的端口组,测试后记录端口状态。
4. 基础链路测试的实际命令
步骤1:安装工具:apt-get update && apt-get install -y iperf3 mtr ethtool iproute2;
步骤2:带宽测试:在一端启动 iperf3 -s,另一端运行 iperf3 -c SERVER_IP -P 10 -t 60;记录吞吐与并发。
步骤3:路径与丢包:mtr -r -c 100 TARGET;延迟抖动:ping -c 100 TARGET;跟踪路由:traceroute -n TARGET。
5. 网卡、MTU与卸载特性调优
步骤1:查看卸载特性 ethtool -k eth0;建议先保留默认,再根据测试调整。
步骤2:开启大MTU(如9000):ip link set dev eth0 mtu 9000;验证交换机支持并测试。
步骤3:如出现高CPU或分包异常,可临时关闭GRO/GSO/TSO:ethtool -K eth0 tso off gso off gro off,然后观察性能。
6. 聚合(Bonding)与多链路策略
步骤1:在Linux加载模块并配置(示例Debian):modprobe bonding;编辑 /etc/network/interfaces,配置 bond0 mode 4 (802.3ad) miimon 100 xmit_hash_policy layer3+4。
步骤2:在交换机侧配置LACP(与机房协调),确认聚合组编号与链路数。
步骤3:测试:将流量并行到多个目的端口,使用iperf3多连接验证吞吐线性增长。
7. Linux内核与TCP栈优化(实操命令)
步骤1:修改 sysctl,示例(执行为root或sudo tee):
echo "net.core.rmem_max=67108864" >> /etc/sysctl.conf
echo "net.core.wmem_max=67108864" >> /etc/sysctl.conf
echo "net.core.netdev_max_backlog=250000" >> /etc/sysctl.conf
echo "net.ipv4.tcp_rmem=4096 87380 67108864" >> /etc/sysctl.conf
echo "net.ipv4.tcp_wmem=4096 65536 67108864" >> /etc/sysctl.conf
sysctl -p
步骤2:启用BBR(内核>=4.9):sysctl net.ipv4.tcp_congestion_control=bbr;验证:lsmod | grep bbr 或 sysctl net.ipv4.tcp_available_congestion_control。
步骤3:调整连接追踪、SYN队列:net.ipv4.tcp_max_syn_backlog=4096。
8. 流量整形与QoS(tc实操示例)
步骤1:安装 iproute2(通常已安装)。
步骤2:快速启用现代队列:tc qdisc add dev eth0 root fq_codel(可降低缓冲爆炸)。
步骤3:基本带宽限制示例(HTB):
tc qdisc add dev eth0 root handle 1: htb default 10
tc class add dev eth0 parent 1: classid 1:1 htb rate 500mbit ceil 500mbit
(按需细化分类、端口或IP基于策略)。
9. 监控、告警与DDoS防护实践
步骤1:部署Prometheus Node Exporter + Grafana监控网口流量、CPU、queue长度与丢包。
步骤2:配置主动合规告警(带宽接近阈值、丢包>1%等)。
步骤3:如遇DDoS,第一时间联系机房启动清洗或BGP黑洞;长期建议购买机房或云端DDoS清洗服务并配置BGP Flowspec(需与机房协商)。
Q1:如何在香港机房测试到中国大陆的稳定性?
A1:使用多点测试:在香港服务器上用mtr -r -c 200 中国目标IP,记录每跳延迟与丢包;用iperf3并发连接测试带宽。重复在不同时间(高峰/非高峰)运行,比较丢包率与延迟,必要时向提供商申请优化或走专线。
Q2:开启MTU 9000会带来哪些注意点?
A2:需端到端支持:交换机、路由器与对端都必须支持9000,否则会造成分片或丢包。先在小流量环境测试,监控TCP重传与CPU占用,若发现问题可回退至1500或仅对特定内网链路启用。
Q3:遇到间歇性丢包如何定位?
A3:按顺序:1) mtr长跑并记录丢包跳点;2) ethtool 查看网卡错误(RX/TX errors);3) 检查交换机端口、链路波特与光模块型号;4) 临时关闭卸载特性或调整MTU验证是否改善;5) 如果问题出在机房侧,提供完整日志给机房请求链路抓包与排查。
来源:带宽与网络优化在香港金属服务器租赁中的注意点