步骤:确认服务器提供商(ISP)与高防等级;准备账号与紧急联系人;记录公网IP、BGP信息与端口列表。小分段:1) 保存控制台、工单、电话;2) 准备SSH私钥、Console访问;3) 建立故障时间轴模板。
步骤:先判断是业务故障还是网络攻击。执行:从本地与第三方节点ping/traceroute到目标IP;使用mtr观测丢包与延迟;curl或telnet检测应用端口联通。小分段:1) 网络不可达——联系机房或查看BGP公告;2) 单端口大量连接——可能为DDoS;3) CPU/内存骤增——检查进程。
步骤:SSH登录(或通过控制台),先查看top/htop、ss -tuna、netstat -anp,确认异常进程与连接。执行:ps aux | sort -nrk 3 | head,检查进程占用;systemctl status 服务;tail -n 200 /var/log/messages、/var/log/nginx/error.log。小分段:1) 若某服务崩溃,重启并观察日志;2) 若被入侵,立即切断外网与快照;3) 保存内存/进程快照用于取证。
步骤:在主机执行tcpdump -nn -s 0 -w capture.pcap 'port 80 or port 443'(或针对异常端口),本地下载并用Wireshark分析。执行:使用iftop/nethogs查看实时带宽,使用conntrack -L 或 ss 查看连接状态。小分段:1) 识别源IP/ASN高频流量;2) 判断是SYN、UDP泛洪还是HTTP慢连接;3) 将样本发给上游做流量清洗。

步骤:若为大流量DDoS,立即联系高防厂商提交工单并提供pcap、时间窗口、流量特征。执行:在主机层临时策略——启用iptables/nftables限速与DROP规则;启动fail2ban阻断暴力IP;配置nginx limit_conn/limit_req。小分段:1) BGP黑洞或流量清洗由ISP启动;2) 本地规则慎重以免误伤正常流量;3) 记录变更并在清理后回滚。
步骤:调整sysctl防止SYN泛洪与连接耗尽:net.ipv4.tcp_syncookies=1;tcp_fin_timeout=30;tcp_max_syn_backlog适当增大;调整conntrack_max。执行:echo persist写入 /etc/sysctl.conf 并 sysctl -p。小分段:1) 开启TCP SYN Cookie;2) 调整文件描述符ulimit -n并持久化;3) 定期升级内核与关键组件。
步骤:部署监控(Prometheus+Grafana或Zabbix),采集流量、连接数、CPU、错误率;配置阈值告警与自动化脚本(自动拉取清洗工单模板)。演练:定期进行小流量压测与应急演练。小分段:1) 建立Runbook:发现->判断->隔离->通知->恢复->复盘;2) 自动化脚本保存到私有git;3) 复盘记录并更新SOP。
问:如何快速判断是DDoS还是正常流量激增?
答:看流量特征:短时间内大量同源或同ASN小包/大连接且通常伴随大量SYN/UDP为DDoS;若流量来自多样化用户并伴随业务指标提升(转化/请求分布正常)则为真实增长。用tcpdump抓包、mtr看路由、provider流量图(NetFlow/ sFlow)对比即可确认。
问:当清洗厂商响应慢时,主机能做哪些临时保护?
答:优先在主机层限制连接:使用iptables/nftables添加DROP规则、tcp-reject、limit_conn、limit_req;启用SYN Cookie、增大backlog、降低timeouts;对异常IP批量封禁并通过cron定期清理黑名单;必要时进行地理或端口白名单临时策略。
问:如何长期降低在新加坡部署的高防服务器风险?
答:多层防护:选择有本地清洗能力与全球Anycast节点的供应商;前端使用WAF+CDN做规则拦截;主机做内核与服务硬化;建立监控与演练,定期审计规则与演练SOP,保持补丁与备份策略,并与提供商签订SLA与DR流程。