当前位置：首页 > 云谷精选

服务器CPU突然飙升100%怎么快速定位原因

admin2026年03月18日云谷精选28.31万

摘要：# 服务器CPU突然飙到100%？别慌，老司机带你5步“破案” 昨天半夜，手机又收到一条告警短信——服务器CPU使用率100%，持续5分钟。我揉着惺忪睡眼从床上弹起来，心里就一个念头：又来了。这种感觉你应该不陌生吧？大半夜的，业务可能还在跑，用户可能…

服务器CPU突然飙到100%？别慌，老司机带你5步“破案”

昨天半夜，手机又收到一条告警短信——服务器CPU使用率100%，持续5分钟。我揉着惺忪睡眼从床上弹起来，心里就一个念头：又来了。

这种感觉你应该不陌生吧？大半夜的，业务可能还在跑，用户可能还在用，但CPU已经顶不住了。更让人头疼的是，你根本不知道是哪个“内鬼”在作祟。

说真的，很多运维文档会告诉你一堆命令，但真到了这种紧急时刻，你需要的不是百科全书，而是一条清晰的、能立刻上手操作的“破案”路线图。

我自己处理过太多次这种突发状况了，今天就把这套实战中总结出来的排查思路，用最直白的话跟你捋清楚。咱们不搞理论堆砌，就讲怎么在5分钟内，把那个吃光CPU的“元凶”揪出来。

第一步：先别急着重启！看一眼“全景地图”

CPU突然100%，很多人的第一反应是“重启大法好”。千万别！

重启确实能暂时解决问题，但它就像把犯罪现场打扫干净了——你永远不知道是谁干的，下次它还会再来。咱们得先当一回“侦探”，收集现场证据。

首先，快速登录服务器，打开你的“全景地图”——系统监控面板。如果你用了云服务（比如阿里云、腾讯云），控制台里通常有实时监控。看一眼：

是单个核心100%，还是所有核心都爆了？ 这能初步判断是单线程程序发疯，还是系统整体压力过大。
内存和磁盘I/O怎么样？ 有时候，内存不足导致疯狂swap（交换），或者磁盘写满了，也会让CPU“累死累活”，表现就是使用率飙升。
网络流量有没有异常？ 突然的巨量请求（比如被CC攻击）也会让CPU不堪重负。

（私货：我见过最冤的一次，是日志文件把磁盘写满了，某个服务拼命想写日志，CPU就卡在那了，看起来跟被攻击一模一样。）

花30秒看完这些，你心里大概就有个谱了：是内部程序问题，还是外部攻击？是计算型负载，还是被其他资源拖累的？

第二步：揪出“耗电大户”——TOP命令是王牌

有了全景，接下来就要抓“现行犯”。这时候，终端就是你的主战场。打开它，输入这个最经典、也最强大的命令：

top

按一下 1（数字1），显示所有CPU核心的详情。然后，盯着看几秒钟。

重点看哪几列？

%CPU：不用说了，谁最高谁就是嫌疑犯。超过100%很正常，因为这是按单核计算的，如果一个程序用了2个核心各50%，这里就显示100%。
COMMAND：进程名。看看是哪个熟悉的“家伙”在搞鬼。是 java？ php-fpm？ nginx？还是某个你自己写的脚本？
PID：进程号。记下它，这是“罪犯”的身份证。

如果top里进程太多看花眼？ 直接按 Shift + P，让进程按CPU使用率从高到低排，排名第一的那个，基本就是“真凶”。

第三步：给“真凶”拍个X光——深挖进程细节

找到了高CPU进程（比如PID是12345的Java进程），但这还不够。你得知道它为什么这么疯。是在执行什么逻辑？卡在哪个循环里了？

这里就需要更专业的“诊断工具”：

1. 对于Java程序（最常见的高CPU嫌疑人之一）： 用 jstack 这个神器。它能把Java进程里所有线程在干嘛，像拍X光片一样打印出来。

   jstack -l 12345 > /tmp/jstack_dump.log

然后，重点来了：在这个日志文件里，搜索 RUNNABLE 状态的线程。看看这些正在运行的线程，堆栈信息里反复出现的是哪个类、哪个方法。那个方法，十有八九就是问题的源头——可能是死循环，可能是低效算法。

2. 对于其他通用程序（C/C++、Python等）： 用 strace 或 perf 来跟踪。

strace -cp 12345：快速统计进程调用了哪些系统调用，看看是不是在疯狂地进行某些IO操作。
perf top -p 12345：实时查看进程内部哪些函数最消耗CPU周期，非常直观。

（说个大实话：90%的CPU突然飙升，到这一步基本就真相大白了。要么是代码bug，比如死循环；要么是配置问题，比如线程池开太大了。）

第四步：检查“案发现场”周边——日志与最近变更

如果上面几步还没锁定绝对原因，或者你想知道“作案动机”，那就得查查“案发现场”的记录了。

看日志：立刻去查看嫌疑进程的应用日志和系统日志（/var/log/messages 或 journalctl -xe）。在CPU飙升的时间点附近，有没有大量错误信息？有没有异常的访问记录？
想变更：灵魂三问：
- “最近有没有上线新代码？”——新bug引入。
- “有没有改过配置？”——比如数据库连接池调大了。
- “有没有做过定时任务调整？”——比如一个本该跑1分钟的脚本，现在要跑1小时。

很多问题不是凭空出现的，它总有个导火索。结合日志和变更记录，往往能一击即中。

第五步：紧急止血与长期“健身”

找到原因后，分两步走：

紧急止血：

如果是无关紧要的进程：直接用 kill -9 PID 干掉它。
如果是核心业务进程：这就要谨慎了。可能需要联系开发，根据上面抓到的堆栈信息，进行热点代码优化，或者先重启单个服务实例。（心里话：这时候就体现出微服务化和容器化的优势了，至少可以单点重启，不影响全局。）

长期“健身”（防止复发）：

限流与降级：给重要的接口加上限流，超出承受范围就优雅地返回“稍后再试”，别把CPU拖垮。
监控与告警升级：别只监控CPU均值，要监控突增。设置更灵敏的告警规则，比如“1分钟内CPU使用率超过85%”。
压测与复盘：对这次出问题的服务或接口，做一次压力测试，看看它的真实瓶颈在哪里。然后和团队一起复盘，这次是代码问题、配置问题还是架构问题？（避免下次再在凌晨两点“见面”。）

行了，流程就是这么个流程。说白了，CPU100%不可怕，可怕的是两眼一抹黑。按照上面这五步走，从宏观到微观，从现象到本质，大部分问题都能快速定位。

最后说一句，真正的功夫在平时。把监控做好，把日志规范打好，把应急预案演练熟，比学会一百个命令都管用。

如果你的服务器现在正嗷嗷叫，别愣着了，赶紧打开终端，从 top 开始吧。祝你好运！

扫描二维码推送至手机访问。

本文链接：http://www.ysyg.cn:80/?id=493

返回列表

上一篇：数据库连接数被打满怎么紧急扩容

下一篇：网站偶尔卡顿几秒钟又恢复是不是被打了

“服务器CPU突然飙升100%怎么快速定位原因” 的相关文章

2017年，那场差点让我改行的CC攻击

# 2017年，那场差点让我改行的CC攻击说起来你可能不信，2017年那会儿，我差点就因为这破事转行去卖茶叶蛋了。不是开玩笑。那年的CC攻击，跟现在的完全不是一个路数。现在大家聊防护，动不动就是“智能”、“AI”、“弹性”，听着挺唬人。但回到201…

分析高防系统中的黑洞路由自动触发算法与解除恢复机制

# 当攻击来袭时，你的服务器真的被“黑洞”吸走了吗？我自己接触过不少刚遭遇DDoS攻击的站长，发现一个挺有意思的现象：很多人一听说服务器进了“黑洞”，第一反应是懵的——“啥玩意儿？我数据呢？网站是不是没了？” 紧接着就是对着服务商一顿催：“赶紧给我放出…

分析高防系统中的节点失效检测算法与秒级流量平滑迁移逻辑

# 高防“后厨”的秘密：当节点挂了，流量怎么做到“丝滑”换桌？前阵子帮一个做电商的朋友看他们家的高防配置，聊到一半，他突发奇想问了个挺有意思的问题：“你说，你们整天讲高防IP、高防CDN防护多牛，万一你们自己的防护节点突然宕机了，我的业务是不是直接就‘…

探究针对UDP反射攻击的报文荷载深度匹配（DPI）过滤算法

# 当UDP洪水“借刀杀人”，我们怎么把真凶揪出来？我得先跟你讲个真事儿。上个月，有个做游戏联运的朋友半夜给我打电话，声音都是抖的。他们服务器突然就瘫了，流量监控上那条线直接顶到天花板。客服电话被打爆，玩家群里骂声一片。最要命的是——他们明明买了“…

详解如何通过高防 CDN 日志定位攻击源 IP 及其所属僵尸网络特征

# 高防CDN日志里，藏着攻击者的“身份证” 前两天，一个做电商的朋友半夜给我打电话，语气都快急哭了：“流量又炸了，后台卡得一笔，高防CDN那边显示是‘已防护’，可我这业务还是半瘫。钱没少花，可攻击到底从哪来的？我总不能一直蒙在鼓里吧？” 这话我听着太…

详解高防 CDN 应对大规模静态资源盗刷的流量保护与计费对策

# 静态资源被盗刷？高防CDN的“守财”实战手册做网站运营的，最怕什么？不是黑客正面硬刚，而是那种悄无声息、温水煮青蛙式的**静态资源盗刷**。我自己就见过一个挺惨的案例。一个做在线教育的朋友，某天早上起来发现云存储的账单直接爆了，费用是平时月费的…

服务器CPU突然飙升100%怎么快速定位原因

服务器CPU突然飙到100%？别慌，老司机带你5步“破案”

第一步：先别急着重启！看一眼“全景地图”

第二步：揪出“耗电大户”——TOP命令是王牌

第三步：给“真凶”拍个X光——深挖进程细节

第四步：检查“案发现场”周边——日志与最近变更

第五步：紧急止血与长期“健身”

“服务器CPU突然飙升100%怎么快速定位原因” 的相关文章

2017年，那场差点让我改行的CC攻击

分析高防系统中的黑洞路由自动触发算法与解除恢复机制

分析高防系统中的节点失效检测算法与秒级流量平滑迁移逻辑

探究针对UDP反射攻击的报文荷载深度匹配（DPI）过滤算法

详解如何通过高防 CDN 日志定位攻击源 IP 及其所属僵尸网络特征

详解高防 CDN 应对大规模静态资源盗刷的流量保护与计费对策

鄂ICP备2025123191号-1