1.
评估业务场景与基础环境
- 识别业务类型(电商/内容/管理后台/API 网关等)。
- 确定部署环境(VPS / 云主机 / 物理主机)。例如:4 vCPU、8GB RAM、200Mbps 带宽的 ECS 实例。
- 确认域名与证书管理:独立域名与泛域名需求影响 WAF 证书绑定。
- 明确峰值流量与正常 RPS:如正常 1,200 RPS,促销峰值 12,000 RPS。
- 定义风险优先级:SQL 注入、XSS、文件上传、接口滥用、CC 攻击等。
2.
WAF 功能对照与选择维度
- 基础防护:WAF 基本规则集(OWASP Top10)是否覆盖。
- 规则粒度:是否支持自定义策略、正则与白名单/黑名单。
- 性能指标:吞吐量与延迟,要求例如 2 Gbps 处理能力与 <20ms 额外延迟。
- 与 CDN/Anti-DDoS 产品的联动能力(流量清洗阈值例如 10 Gbps)。
- 日志与告警:是否支持实时日志导出(SLS)、报警阈值与溯源能力。
3.
结合服务器/VPS与CDN的部署策略
- 前端放置 CDN,开启缓存可减少 WAF/源站压力。示例:CDN 缓存率 60% 时源站压力下降 40%。
- WAF 放置在 CDN 之后或作为独立边缘防护,依赖业务是否需要回源安全检查。
- 源站(ECS)配置示例:nginx + PHP-FPM,conn_limit 2000,keepalive 75。
- DDoS 配合:阿里云 Anti-DDoS Pro 设定清洗阈值 5–10 Gbps。
- 域名与证书:使用 SNI 与托管证书减少 HTTPS 握手失败概率。
4.
具体规则与阈值设置示例
- CC 防护:单 IP 限速 100 req/10s,触发后 429 或验证码,持续 60s。
- SQL 注入规则:启用 120 条深度防护规则,误报率控制在 <1.5%。
- Bot 管理:启用 JS 验证与机器学习风控,白名单 API Token 单独放行。
- 日志采样:开启 1% 全量样本导出到 SLS,异常时提升到 100%。
- 联合告警:攻击量 >100k 次/小时 或清洗流量 >1 Gbps 时触发短信与工单。
5.
真实案例与效果数据
- 案例概述:某电商在大促期间遭遇 Layer7 DDoS 与 SQLi,源站 4 vCPU/8GB,带宽 200Mbps。
- 处理流程:上线阿里云 WAF(企业版)+ CDN + Anti-DDoS Pro,启用自定义规则与速率限制。
- 防护结果:阻断恶意请求 1,200,000 次/天,峰值清洗流量达 6.4 Gbps,源站错误率从 18% 降到 0.8%。
- 性能影响:页面平均响应延迟增加 12ms,CPU 利用率峰值从 85% 降到 48%。
- 经验总结:配合缓存策略与白名单,误报率控制在 1.2%,促销期稳定运行。
6.
WAF 版本对比与成本估算
- 选择维度:功能需求、并发/吞吐、日志存储与 SLA。
- 成本考量:按流量计费或按实例/策略计费对比。
- 升级建议:流量>1 Gbps 或业务敏感(金融/医药)优先企业版。
- 运维投入:规则维护、日志分析需要 1-2 名安全工程师(兼职)。
- 合规需求:若涉及个人信息/支付需配置审计与长时日志保存。
7.
落地建议与巡检清单
- 部署前:压力测试(ab/jmeter),模拟 2x 峰值流量。
- 配置时:开启分阶段放行策略,先 monitor 再 active。
- 运行中:每日查看 top 10 源 IP、URI、规则命中率。
- 应急预案:开启紧急白名单、扩容带宽、联系阿里云支持工单。
- 定期复核:每月更新规则库与证书,每季度演练一次 DDOS 应急。