当前位置:首页
> admin 第53页
admin 管理员
暂无介绍
5 篇文章 0 次评论Pinpoint和Zipkin在调用链分析上哪个好用
# Pinpoint vs Zipkin:当你的系统“生病”时,哪个“诊断医生”更靠谱? 我自己折腾微服务监控有些年头了,说实话,每次线上出点幺蛾子——比如用户突然投诉支付失败,但数据库、网关、订单服务各自都说自己“健康”——那种抓瞎的感觉,真绝了。这时…
Chaos Engineering在测试系统稳定性时怎么用
# 别等崩了再甩锅!聊聊Chaos Engineering怎么给系统“上强度” 搞安全的、做运维的,最怕听到哪句话?我猜是“**我们测过了,没问题**”。然后一上线,流量一冲,整个系统像多米诺骨牌一样哗啦啦全倒。事后复盘会开得跟批斗会似的,开发怪运维资源…
混沌工程实验怎么做才能不影响线上业务
# 线上业务稳如泰山?聊聊混沌工程实验的“温柔一刀” 我见过不少运维和架构师,一聊到混沌工程,眼睛就亮了——能主动发现系统弱点,这多酷啊!但紧接着下一句准是:“可我们不敢动啊,万一搞挂了线上业务,谁担得起这责任?” 说实话,这种担忧太正常了。我去年在深…
容量规划怎么做才能既不浪费资源又不扛不住高峰
# 网站容量规划:钱花在刀刃上,流量来了不慌张 我前两天帮一个做电商的朋友看后台,真是哭笑不得。他花大价钱上了顶配的服务器集群,平时CPU利用率不到10%,跟养老似的。结果大促前夜,他问我:“哥,要不要再加两台机器?我怕扛不住。” 我一看监控数据,直接给…
全链路压测在电商大促前怎么落地
# 电商大促前,全链路压测到底怎么搞才不“翻车”? 去年双十一前,我一个朋友的公司搞压测,结果把线上数据库给压崩了,挂了俩小时。老板在群里直接发飙:“这要是大促当天,咱们集体卷铺盖回家吧!” 这事儿听着离谱,但在我们这行,其实一点都不新鲜。 很多技术团…
性能瓶颈分析怎么从CPU、内存、IO、网络入手
# 服务器卡成狗?别急着加钱,先看看这四样东西 我前两天帮一个朋友看他的游戏服务器,好家伙,那延迟高得,玩家都快把客服电话打爆了。他第一反应就是:“是不是得升级套餐了?加钱上更高配置吧?” 我拦住了他。**很多时候,服务器慢真不是配置不够,而是“堵”了…
代码级性能优化从哪些方面着手最有效
# 代码性能优化,别在边角料上瞎使劲 前两天跟一个做后端的朋友吃饭,他愁眉苦脸地说,最近在重构一个核心接口,吭哧吭哧优化了半天SQL,把循环拆了,缓存也加了,压测一看——性能提升不到5%。他当时那个表情,我印象特别深,就是那种“我这一礼拜加班加了个寂寞”…
JVM调优在实际生产环境中有哪些经验
# JVM调优:别等服务器挂了才想起这回事 我前两天刚处理完一个线上事故,凌晨三点被电话吵醒,一看监控——Full GC停不下来,服务响应时间直接飙到十几秒。折腾了半宿,最后发现就是个新生代大小配错了。这种场景你应该不陌生吧?很多团队都是这样,平时没人管…
Go程泄漏怎么通过pprof定位
# Go协程泄漏,别慌!用pprof“抓鬼”实录 那天下午,我正喝着咖啡,突然收到告警——服务内存占用像坐了火箭,半小时涨了2个G。心里咯噔一下:坏了,八成是协程泄漏了。 这种场景你应该不陌生吧?Go程序跑着跑着,内存越来越高,CPU也不正常,但业务量…
Node.js内存暴涨怎么排查原因
# Node.js内存暴涨?别慌,老司机带你一步步“破案” 不知道你有没有过这种心惊肉跳的经历——服务器监控告警突然狂响,一看图表,Node.js应用的内存占用像坐上了火箭,一条直线往上冲,眼瞅着就要触发OOM(内存溢出)被系统“杀掉”了。 我前两天刚…

