云谷精选 第49页
多活架构下怎么保证数据最终一致性
# 多活架构下,数据一致性这个“老大难”,到底该怎么破? 说实话,第一次听到“多活架构”这个词儿,很多人的第一反应是:牛啊!一个机房挂了,另一个立马顶上,业务永不停机,听着就踏实。 但真搞起来,你很快就会发现,最让人头疼的不是怎么把流量切过去,而是**…
异地多活怎么解决跨地域访问延迟问题
# 异地多活:跨地域延迟这个“硬骨头”,到底该怎么啃? 说真的,第一次听到“异地多活”这个词儿的时候,很多人心里想的可能是:这不就是多建几个机房嘛,数据同步一下不就完了? 直到你真正把业务铺开——比如上海的用户访问北京的数据中心,延迟直接飙到80ms以…
同城双活和异地灾备哪个更适合业务
# 同城双活和异地灾备,哪个才是你业务的“救命稻草”? 前两天,一个做电商的朋友半夜给我打电话,语气快急疯了:“我们机房空调故障,服务器集体过热宕机,整个平台挂了三个小时,单子全飞了!”他问我,是不是该赶紧上个“异地灾备”? 我反问他:“你上次业务中断…
数据库读写分离怎么避免主从延迟导致的数据不一致
# 数据库读写分离的坑:主从延迟那点事儿,真不是配完就能高枕无忧 我前两天刚翻过几个项目的数据库架构,发现一个挺有意思的现象:很多团队兴冲冲地上了读写分离,把主库压力降下来了,性能监控一片飘绿,结果业务高峰期,用户投诉“我刚改的资料怎么没保存?”——得,…
分库分表后怎么做跨库查询和统计
# 分库分表后,跨库查询统计的“土办法”和“新思路” 我前两天跟一个做电商的朋友吃饭,他愁得不行。他们业务量起来了,订单表早就分库分表了,按用户ID哈希,分得明明白白。平时查单个用户订单,快得飞起。但一到月底,财务要出个全平台的销售统计报表,或者运营想分…
ES集群频繁FullGC怎么优化GC参数
# ES集群频繁Full GC?别急着调参数,先看看是不是这个“坑” 我前两天帮一个朋友看他们的ES集群,那家伙急得不行,说线上集群一天Full GC好几次,监控图上的“悬崖”看得人心惊肉跳。他第一反应就是:“快,帮我调调JVM参数,堆是不是给小了?GC…
ClickHouse查询慢怎么从表引擎和索引上优化
# 当ClickHouse慢到让人想砸键盘,先别急着加内存 我前两天刚处理完一个客户的紧急求助,电话那头声音都快冒烟了:“老师,我们那个ClickHouse报表,昨天还好好的,今天突然慢成狗了,一个简单查询都要半分钟!” 我让他先别慌,远程连上去一看—…
Kafka消息重复消费怎么从业务层面做幂等
# Kafka消息重复消费,别慌!业务层幂等设计,我教你几招“土办法” 做消息队列的,谁没被重复消费坑过?我前两天刚处理一个线上问题,用户投诉说“优惠券怎么领了两次”,一查日志,好家伙,同一个订单ID,Kafka消费者重启那会儿,消息被老老实实处理了两遍…
Spark流处理作业出现反压怎么优化
# Spark流处理作业出现反压,别急着调参数,先看看是不是掉进这三个坑里了 前几天和一个做实时风控的朋友聊天,他愁得不行:“我们那个Spark Streaming作业,一到业务高峰期就反压(Backpressure),延迟飙升。我照着官方文档把`spa…
Flink作业状态后端怎么选型
# Flink作业状态后端选型:别让“状态”拖垮你的实时计算 我最近帮朋友看一个Flink作业,性能时好时坏,排查到最后发现,问题出在一个最容易被忽略的地方——**状态后端**。他当时一脸懵:“这玩意儿不是默认的吗?还要选?” 说实话,这种心态我见过太…

