当前位置：首页 > 云谷精选

Protobuf在序列化和反序列化上有什么优势

admin2026年03月18日云谷精选5.32万

摘要：## Protobuf这玩意儿，到底好在哪儿？我拆开给你看做开发的，尤其是搞微服务、分布式系统或者网络通信的哥们儿，估计没少跟JSON和XML打交道。它们就像空气和水，无处不在，用起来也顺手。但最近几年，我瞅着身边越来越多的项目和团队，开始悄咪咪地把一…

Protobuf这玩意儿，到底好在哪儿？我拆开给你看

做开发的，尤其是搞微服务、分布式系统或者网络通信的哥们儿，估计没少跟JSON和XML打交道。它们就像空气和水，无处不在，用起来也顺手。但最近几年，我瞅着身边越来越多的项目和团队，开始悄咪咪地把一些核心接口的数据交换，从JSON换成了Protobuf。

一开始我也纳闷，JSON不是挺好的吗？人见人爱，花见花开，浏览器都原生支持。但等你自己真正上手，在几个高并发、对性能有点“洁癖”的模块里用上Protobuf之后，可能就会一拍大腿：“嘿，是有点东西。”

今天咱不聊空泛的“高性能”、“跨语言”这些大词儿，就掰开了揉碎了，单说它序列化和反序列化这一块，到底凭啥能让人另眼相看。

一、快，是真的快，但为啥快？

Protobuf序列化速度快，这几乎是共识。但很多文章说到这儿就停了，或者甩给你一堆benchmark数字。咱得知道，这速度不是凭空变出来的。

首先，它“瘦”。 你打开一个JSON文件，里面是不是充满了大括号、引号、冒号，还有各种字段名？这些对人类友好的“格式”，对机器来说全是冗余的负担。Protobuf生成的二进制数据流，把这些“装饰品”全扔了。它用字段编号（field number）代替了字段名，用特定的编码方式（比如Varint）紧凑地存储数字，用起来那叫一个干净利落。

举个例子，你要传一个用户ID 12345 和用户名 "foo"。在JSON里，你得写成 {"id": 12345, "name": "foo"}，至少20多个字节。在Protobuf里，可能就是 08 91 9c 06 12 03 66 6f 6f 这么一串十六进制，10个字节搞定。数据量一大，这差距就非常可观了。网络传输省带宽，内存里占地方小，速度自然就上来了。

其次，它“直”。 Protobuf的反序列化，很多时候可以直接把二进制流映射到内存中的对象结构，少了JSON那种需要先分词（tokenize）、再构建语法树（parse）的繁琐步骤。你可以把它理解成“直达电梯”，而JSON可能还得在“语法安检门”前面排会儿队。

我自己在做一个实时数据采集服务时就深有体会。原来用JSON，单机QPS卡在2万左右，CPU都快烧了。换成Protobuf，没改业务逻辑，只是换了序列化方式，QPS直接飙到8万+，CPU使用率还降了一半。那种感觉，就像给老爷车换了个涡轮增压——PPT上吹的方案很多，真到扛压力的时候，谁露馅谁知道。

二、省心，也是真的省心

除了快，Protobuf在“省心”这事儿上，也做得挺绝。

1. 向后兼容，玩得转“灰度” 这是Protobuf设计上最精妙的地方之一。你的 .proto 文件定义了数据结构，比如1.0版本有个 User 消息，带 id 和 name 字段。后来业务需要，你要加个 email 字段，升级到1.1版本。

用JSON的话，你可能得战战兢兢：老客户端收到带新字段的数据会不会崩？新客户端收到老数据缺字段怎么办？各种 if...else 判空写到头晕。

Protobuf通过那条简单的规则——“未知字段会被忽略，缺失字段会用默认值”——优雅地解决了这个问题。老客户端（1.0）收到1.1的数据，它会淡定地忽略不认识的 email 字段，只处理它认识的 id 和 name。新客户端（1.1）收到1.0的老数据，发现没有 email，就给它赋个空字符串（默认值）。升级、回滚、灰度发布，心里有底多了。说白了，这就是为长期演化的复杂系统设计的。

2. 强类型和自动代码生成，告别手写解析器 在 .proto 文件里，你得明确定义每个字段的类型：int32, string, bool，或者另一个自定义消息类型。这种强类型约束，本身就是一种最好的文档，也能在编译阶段就帮你避免很多低级错误，比如把数字当字符串发出去。

然后，protoc 编译器一出马，Java、Go、Python、C++……各种语言的客户端和服务端代码就自动生成了。这些生成的代码，已经把繁琐的序列化/反序列化逻辑封装好了，你直接调用 user.toByteArray() 或者 User.parseFrom(data) 就行。这意味着，团队里不同语言的服务之间对话，再也不用为数据格式对齐扯皮，也不用吭哧吭哧手写容易出错的解析代码了。

这种感觉，就像你拿到了一个精心设计、严丝合缝的乐高组件，而不是一堆需要自己切割打磨的木头块。

三、当然，它也不是“万能神油”

看到这儿，你可能觉得Protobuf完美了。别急，咱也得聊聊它的“另一面”。

首先，它“瞎”。 二进制格式，对人类极度不友好。你抓个包，看到一串十六进制，没有对应的 .proto 文件，你根本不知道它是个啥。调试的时候，没法像JSON那样直接 console.log 出来看一眼，得先反序列化。这对于开发调试的便捷性，是个不小的牺牲。

其次，它“僵”。 数据结构必须预先严格定义。如果你想传输一些非常灵活、结构不固定的数据（比如任意深度的嵌套JSON），Protobuf会显得有点笨重。虽然它提供了 Any 和 Map 类型来增加灵活性，但用起来总没有JSON那么“随心所欲”。

所以，我的经验是：别搞一刀切。

对内，服务间通讯，尤其是性能敏感、接口稳定的核心链路，强烈推荐Protobuf。 它能给你带来实实在在的性能收益和长期的维护便利。
对外，提供API给前端、移动端或者第三方，JSON可能还是更友好的选择。 毕竟通用性、可读性摆在那儿。
需要动态配置、存储结构多变的数据，JSON或其它格式可能更合适。

说白了，技术选型，一看场景，二看团队。如果你的团队已经为JSON的解析性能头疼，或者微服务之间整天因为字段增减闹矛盾，那真的可以认真考虑把Protobuf引入你的工具箱。它不是什么炫技的新玩意儿，而是一个能踏实解决老问题的“实力派”。

最后说句大实话：工具嘛，用得顺手、解决了问题才是关键。Protobuf的优势，你得在合适的坑里，才能真切体会到它“真香”的那一面。

扫描二维码推送至手机访问。

本文链接：http://www.ysyg.cn:80/?id=361

返回列表

上一篇：Thrift在跨语言RPC调用中的表现如何

下一篇：gRPC在服务间通信效率上比HTTP高多少

Protobuf在序列化和反序列化上有什么优势

Protobuf这玩意儿，到底好在哪儿？我拆开给你看

一、快，是真的快，但为啥快？

二、省心，也是真的省心

三、当然，它也不是“万能神油”

“Protobuf在序列化和反序列化上有什么优势” 的相关文章

网站没挂，但比挂了更难受

基于行为分析的智能WAF算法：过滤SQL注入与命令执行的技术细节

分析高防CDN的边缘侧SSL握手加速算法对算力消耗的优化

分析高防CDN中的重传校验算法如何破解TCP半连接攻击

详解HTTP请求头解析算法在过滤变种应用层攻击中的作用

解析高防 CDN 接入后图片出现 403 错误的防盗链规则排查

鄂ICP备2025123191号-1