python - 无法将重复的 protobuf 对象保存到文件（Python）

Question

我是 protobuf 的新手，所以我不知道如何正确地提出问题。

无论如何，我正在使用这个模型配置原型文件。protoc -I=. --python_out=. ./model_server_config.proto我使用Protocol Buffer page中的此命令将其转换为 python 。现在我有一些可以导入和处理的 python 文件。我的目标是创建一个文件（用于运行具有多个模型的 TensorFlow 模型服务器），该文件应如下所示：

model_config_list: {
 config: {
    name: "name1",
    base_path: "path1",
    model_platform: "tensorflow"
  },
  config: {
    name: "name2",
    base_path: "path2",
    model_platform: "tensorflow"
  },
  config: {
    name: "name3",
    base_path: "path3",
    model_platform: "tensorflow"
  },
}

现在使用编译的python包，我制作了一个protobuf对象，当我打印出来时它看起来像这样：

model_config_list {
  config {
    name: "name1"
    base_path: "path1"
    model_platform: "tensorflow"
  }
  config {
    name: "name2"
    base_path: "path2"
    model_platform: "tensorflow"
  }
  config {
    name: "name3"
    base_path: "path3"
    model_platform: "tensorflow"
  }
}

但是在使用序列化对象时objectname.SerializeToString()，我得到一个奇怪的输出：

b'\n\x94\x01\n \n\x04name1\x12\x0cpath1"\ntensorflow\n7\n\x08name2\x12\x1fpath2"\ntensorflow\n7\n\x08name3\x12\x1fpath3"\ntensorflow'

我也尝试使用 python 的 protobuf 将其转换为 Json，如下所示：

from google.protobuf.json_format import MessageToJson
MessageToJson(objectname)

这给了我这样的结果：

{
  "modelConfigList": {
    "config": [
      {
        "name": "name1",
        "basePath": "path1",
        "modelPlatform": "tensorflow"
      },
      {
        "name": "name2",
        "basePath": "path2",
        "modelPlatform": "tensorflow"
      },
      {
        "name": "name3",
        "basePath": "path3",
        "modelPlatform": "tensorflow"
      }
    ]
  }
}

将列表中的所有对象和每个对象作为字符串，这对于 TensorFlow 模型服务器配置是不可接受的。

关于如何正确将其写入文件的任何想法？还是我错误地创建了整个对象？欢迎任何帮助，在此先感谢。

score 4 · Accepted Answer

我不知道什么系统将读取你的文件，所以我不能说你应该如何将它写入文件。这实际上取决于模型服务器希望如何读取它。

也就是说，我认为您创建消息的方式或您展示的任何序列化方法没有任何问题。

该print方法显示了一个“文本格式”的原型，有利于调试，有时用于存储配置文件。它不是很紧凑（文件中存在字段名称），并且没有二进制表示的所有向后和向前兼容的特性。它实际上在功能上与您所说的“应该看起来像”相同：冒号和逗号实际上是可选的。
该SerializeToString()方法使用二进制序列化格式。这可以说是构建协议缓冲区的目的。它是一种紧凑的表示形式，并提供了向后和向前的兼容性，但它的可读性不是很强。
顾名思义，该json_format模块提供消息的 JSON 表示。如果您与之交互的系统需要 JSON，那就太好了，但这并不常见。

附录：print()该模块没有 using ，而是google.protobuf.text_format具有更适合以编程方式使用文本格式的实用程序。要写入文件，您可以使用：

from google.protobuf import text_format
(...)
with open(file_path, 'w') as output:
  text_format.PrintMessage(my_message, output)

python - 无法将重复的 protobuf 对象保存到文件（Python）

1 回答 1

Related

Reference