我最近发现了协议缓冲区,并想知道它们是否可以应用于我的特定问题。
基本上我有一些 CSV 数据需要转换为更紧凑的格式进行存储,因为其中一些文件是几个 gig。
CSV 中的每个字段都有一个标题,并且只有两种类型,字符串和小数(因为有时有很多有效数字,我需要以相同的方式处理所有数字)。但是每个文件的每个字段都有不同的列名。
除了捕获原始 CSV 数据外,我还需要能够在保存之前向文件添加额外信息。我希望通过处理不同的文件版本来证明这一点。
那么,是否可以使用协议缓冲区来捕获随机数量的随机命名的数据列,例如 CSV 文件?