
1) 明确业务类型:静态资源(图片/JS/CSS)、动态页面或视频流。
2) 设定关键指标:P95延迟 ≤ 200ms、缓存命中率 ≥ 85%、并发请求支持 ≥ 2000 RPS、丢包率 < 0.1%。
3) 确定测试环境:真实域名解析到 CDN、源站(VPS/主机)的访问策略、是否启用阿里云盾/Cloudflare 等 DDoS 防护。
4) 列出测试工具:ping/traceroute、wrk/ab/siege、iperf3、dig、mtr、WebPageTest、GTmetrix、curl。
5) 规划测试时间窗:峰值时段和非峰值各至少 2 小时,考虑不同节点和不同地理位置的并发测试。
6) 准备监控:Prometheus + Grafana 或 CDN 控制台的实时带宽、QPS、错误率、缓存命中率面板。
1) 验证 DNS:使用 dig +short yourdomain.com 和 dig +trace 检查 CNAME 是否指向 CDN 提供商。
2) 检查 TTL:确保 DNS TTL 符合发布策略(一般 300s 到 3600s)。
3) 连通性测试:从多地执行 ping/traceroute,测量平均延迟与跳数,排查回源路径问题。
4) TLS/证书:curl -I https://yourdomain.com 检查证书链、协议(TLS1.2/1.3)和 OCSP 状态。
5) HTTP 头验证:确认缓存相关头(Cache-Control, ETag, Expires)配置正确,避免误配置导致缓存失效。
1) 并发压测:使用 wrk 或 ab 执行 1k/2k/5k 并发场景,记录请求成功率、平均延迟和 P95、P99。
2) 带宽测量:通过 iperf3 在源站和 CDN 节点或边缘服务器间测带宽峰值。
3) 页面加载测试:用 WebPageTest/GTmetrix 获取首字节时间(TTFB)、完全加载时间和关键资源加载顺序。
4) 缓存命中率:在 CDN 控制台或日志中统计 GET 请求的 hit/miss,比对目标命中率(如 85%)。
5) 错误率与重试:统计 4xx/5xx 比例,观察在高并发下错误是否急剧上升,并检查源站压力。
1) 延迟类:P50=40ms、P95=120ms、P99=260ms(目标 P95 ≤ 200ms)。
2) 吞吐与并发:稳定支持 2000 RPS,峰值吞吐 400 Mbps。
3) 缓存命中率:整体命中率 92%,静态资源命中 98%。
4) 错误率:总请求错误率 < 0.2%,5xx 错误率 < 0.05%。
5) 回源压力:回源 RPS < 150(说明 offload 效果良好)。
6) 上述数据示例在下表展示:
| 指标 | 示例数值 | 验收阈值 |
|---|---|---|
| P95 延迟 | 120 ms | ≤ 200 ms |
| 并发支持 | 2000 RPS | ≥ 2000 RPS |
| 缓存命中率 | 92% | ≥ 85% |
| 5xx 错误率 | 0.03% | <0.1% |
| 回源 RPS | 120 RPS | ≤ 200 RPS |
1) 背景:某电商在双十一前部署 CDN,加速静态资源与热点商品页,源站为阿里云 ECS(4 vCPU, 8GB RAM, 1 Gbps)。
2) 测试配置:使用 10 台分布式压测机,wrk 并发 2500,持续 30 分钟;监控 Prometheus 指标。
3) 结果摘要:总请求 4.5M,缓存命中率 94%,P95=135ms,5xx=0.02%,回源 RPS 峰值 180。
4) 问题与优化:发现某 CDN 节点 P95 波动较大,定位为边缘节点软件线程池不足,升级边缘实例内核参数并重启后稳定。
5) 最终验收:满足并发和命中率目标,建议继续启用 DDoS 防护策略并设置更短的 DNS TTL 以便快速流量切换。
1) DDoS 防护校验:验证 CDN 或云盾是否能自动清洗大流量(模拟 SYN flood / HTTP flood),观察清洗后正常请求恢复时间。
2) 黑白名单测试:设置 IP 黑名单与 WAF 规则,确认恶意请求被拦截且正常用户不受影响。
3) 回源熔断策略:测试当源站不可达时,CDN 是否返回缓存旧版本或自定义维护页,检查 TTL 和 stale-if-error 设置。
4) 流量切换演练:模拟主 CDN 节点故障,验证 DNS 切换或流量切换到备用节点的时间与影响。
5) 日志与告警:配置异常请求阈值告警(QPS 突增、错误率上升),并测试告警到达与响应流程。
1) 报告内容应含:测试场景、工具、原始数据、图表、问题清单与解决建议。
2) 交付项:域名解析记录截图、证书链截图、缓存配置清单、WAF/DDoS 策略配置。
3) 配置示例:源站配置示例:阿里云 ECS 4 vCPU/8GB/500GB SSD/1Gbps;Nginx 1.18 + gzip + cache-control 设置。
4) 验收结论:是否通过、需整改项、复测时间窗与责任人。
5) 最后建议:定期(每周/每月)复测并把监控数据做长期保存,用于容量规划与故障回放。