阅读 65

protodemocratic,protobuffer序列化

简介

protobuffer请考虑http://www.Sina.com/http://www.Sina.com/3358 www.Sina.com.Sina.com/XML。 但是更小、更快、更简单

http://www.Sina.com/http://www.Sina.com /

对于序列化结构化数据,序列化具有结构化更多的3358www.Sina.com/。 protobuffer :

通过简单的3~10倍20~100倍编程生成容易使用的数据访问列

数据

Google protobuf跨语言编译,可在对比上运行XML,并编译为Java、python、C#、go等代码

protobuffer

在proto文件中定义消息格式

使用protobuf编译器编译. proto文件

用支持3c的protobuf API写和读消息

3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com/http://www.Sina.com /

XML

proto实际上是优点结构的类型,在编码时key和value与特点相连。 在解码时解析器必须能够跳过不知道的字段。 这样,在将同一Proto结构添加到新字段中时,可以保证旧协议的兼容性。

proto为每个只需要定义wire_type,不同的wire_type使用不同的编码方法。

key实际上由两个值组成,每个字段的编号(field_number )是该字段的数据类型(wire_type )。

编译

使用流程

假设您定义了搜索请求的消息格式。 每个搜索请求都包括

一个查询字符串,你感兴趣的特定结果页数(第几页)以及每页的结果数。


message SearchRequest { required string query = 1; // 查询字符串 optional int32 page_number = 2; // 第几页 optional int32 result_per_page = 3; // 每页的结果数}

SearchRequest message 定义指定了三个字段(名称/值对),每个字段对应着要包含在 message 中的数据,每个字段都有一个名称类型

上面的示例中,所有字段都是 标量类型:两个整数(page_number 和 result_per_page)和一个字符串(query)。(还可以为字段指定复合类型,包括枚举 和其它的 message 类型。)

建议每个 .proto 文件包含尽可能少的 message 类型。

 

分配字段编号

 message 定义中的每个字段都有唯一编号。这些数字以 message 二进制格式 标识你的字段,并且一旦你的 message 被使用,这些编号就无法再更改。

请注意,1 到 15 范围内的字段编号需要一个字节进行编码,编码结果将同时包含编号和类型。16 到 2047 范围内的字段编号占用两个字节。因此,你应该为非常频繁出现的 message 元素保留字段编号 1 到 15。请记住为将来可能添加的常用元素预留出一些空间。

字段编号范围:以指定的最小字段数为 1最大字段数为 536,870,911。

(你也不能使用 19000 到 19999 范围内的数字,因为它们是为 Protocol Buffers 的实现保留的 - 如果你使用这些保留数字之一,编译器会报错你的 .proto)

 

指定字段规则

指定的 message 字段可以是下面几种情况之一:

required: 格式良好的 message 必须包含该字段一次

optional: 格式良好的 message 可以包含该字段零次或一次(不超过一次)。

repeated: 该字段可以在格式良好的消息中重复任意多次(包括零)。其中重复值的顺序会被保留。

新代码应使用特殊选项 [packed = true] 来获得更高效的编码,如:

repeated int32 samples = 4 [packed=true];

 

.proto 文件将生成什么?

在 .proto 上运行 protocol buffer 编译器时,编译器将会生成所需语言的代码,这些代码可以操作文件中描述的 message 类型,包括获取和设置字段值、将 message 序列化为输出流、以及从输入流中解析出 message。

对于 C++,编译器从每个 .proto 生成一个 .h 和 .cc 文件,其中包含文件中描述的每种 message 类型对应的类。

 

标量值类型


 


 

定义 protocol 格式

  需要从 .proto 文件开始,.proto 文件中的定义很:为要序列化的每个数据结构添加 message 定义,然后为 message 中的每个字段指定名称和类型。下面就是定义相关 message 的 .proto 文件:

syntax = "proto2"; //protobuffer的版本-- proto神勇的星星 tutorial; //以 package 声明开头,防止不同项目之间的命名冲突message Person { //message 定义 required string name = 1; required int32 id = 2; optional string email = 3; enum PhoneType { //定义枚举类型 MOBILE = 0; HOME = 1; WORK = 2; } message PhoneNumber { required string number = 1; optional PhoneType type = 2 [default = HOME]; repeated PhoneNumber phones = 4;}message AddressBook { repeated Person people = 1; }

 required: 必须提供该字段的值,否则该消息将被视为“未初始化”。如果是在调试模式下编译 libprotobuf,则序列化一个未初始化的 message 将将导致断言失败。在优化的构建中,将跳过检查并始终写入消息。

optional: 可以设置也可以不设置该字段。如果未设置可选字段值,则使用默认值。对于简单类型,你可以指定自己的默认值,就像我们在示例中为电话号码类型所做的那样。否则,使用系统默认值:数字类型为 0,字符串为空字符串,bools 为 false。对于嵌入 message,默认值始终是消息的 “默认实例” 或 “原型”,其中没有设置任何字段。。

repeated: 该字段可以重复任意次数(包括零次)。重复值的顺序将保留在 protocol buffer 中。可以将 repeated 字段视为动态大小的数组。

 

标准 Message 方法

每个 message 类还包含许多其他方法,可用于检查或操作整个 message,包括:

bool IsInitialized() const; //检查是否已设置所有必填 required 字段string DebugString() const; //返回 message 的人类可读表达,对调试特别有用void CopyFrom(const Person& from); // 用给定的 message 的值覆盖 messagevoid Clear(); //将所有元素清除回 empty 状态

 

 

解析和序列化

每个 protocol buffer 类都有使用 protocol buffer 二进制格式 读写所选类型 message 的方法。包括:

bool SerializeToString(string* output) const; //序列化消息并将字节存储在给定的字符串中。请注意,字节是二进制的,而不是文本;我们只使用 string 类作为方便的容器。bool ParseFromString(const string& data); //解析给定字符串到 messagebool SerializeToOstream(ostream* output) const; // 将 message 写入给定的 C++ 的 ostreambool ParseFromIstream(istream* input); //解析给定 C++ istream 到 message

 

希望对你有帮助。


文章分类
代码人生
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐