问题标签 [avro]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
9784 浏览

json - 您可以在 Avro JSON 模式文件中添加注释吗?

我正在编写我的第一个 Avro 模式,它使用 JSON 作为模式语言。我知道您不能将评论放入纯 JSON,但我想知道 Avro 工具是否允许评论。例如,也许它会在解析 JSON 之前剥离它们(如预处理器)。

编辑:我正在使用 C++ Avro 工具链

0 投票
0 回答
412 浏览

python - 使用 Python 生成的模糊类型的 Avro 记录

我正在使用 Python Avro 实现。我用 3 个可能的实例声明了现场人员- 空、男人和女人:

然后我假设它是一个男人写记录:

结果是可以预见的:

然后我将 NULL 添加到男人的“gym”字段和女人的“beautySalon”字段:

运行相同的代码并获得:

糟糕,有了可为空的字段,我们的男人变成了女人。伤心。

有人知道如何解决吗?

0 投票
0 回答
408 浏览

avro - 从 DataFileReader 读取特定记录以获取 avro 文件

我的 avro 文件中有许多记录,但我想读取特定记录,阅读器只有一个遍历整个文件的接口,我想直接跳转到特定记录。有没有办法做到这一点?

0 投票
2 回答
4845 浏览

xml - 有没有办法将目录中的一些 XML 文件转换为 AVRO 文件?

有没有办法将目录中的一些 XML 文件转换为 AVRO 文件?

因此,将读取 XML 文件中的数据,并在一端制作和序列化相应的类似 AVRO 文件……并在另一端反序列化以获取数据。

是否有一些解析器或可以提供帮助的东西

0 投票
1 回答
1673 浏览

hadoop - Control the split size with Avro Input Format in Hadoop

I must read Avro record serialized in avro files in HDFS. To do that, I use the AvroKeyInputFormat, so my mapper is able to work with the read records as keys.

My question is, how can I control the split size? With the text input format it consists on define the size in bytes. Here I need to define how many records every split will consist of.

I would like to manage every file in my input directory like a one big file. Have I to use CombineFileInputFormat? Is it possible to use it with Avro?

0 投票
1 回答
8583 浏览

java - avro 模式中的问题 .. 字符串,null

在这个 avro 模式中

当我尝试为多个记录分配多个值时...

它总是为架构中的 NAME 字段分配 Null ...除了我放置的第一条记录...有没有办法可以将默认值用作 STRING ...如果没有字符串,则仅使用提到的 null在架构中

如上所述,联合使用 JSON 数组表示。例如,["string", "null"] 声明一个模式,它可以是字符串或 null。

联合不能包含多个具有相同类型的模式,命名类型记录、固定和枚举除外。例如,不允许包含两种数组类型或两种映射类型的联合,但允许使用不同名称的两种类型。(在读取和写入联合时,名称允许有效的解析。)

所以它总是取 NULL 即使除了第一条记录之外存在字符串值

0 投票
1 回答
118 浏览

mapreduce - AVRO 中 Iterable 的奇怪行为(在 MapReduce 内)

在 MapReduce 作业中使用 Avro 时,我看到了一种安静的奇怪行为。事实上,使用的 Iterable 非常奇怪:iterator.next 不指向对象,而是指向在每次调用函数“next”时改变其值的东西!

例子 :

标准输出说:

FOO:酒吧

酒吧:酒吧

这里的 Iterable 是如何编码的?为什么?或者也许我做错了什么?

0 投票
1 回答
2817 浏览

java - 在 Java 中从 HBase 中读取 Avro 记录

我有一个复杂的 Avro 记录(嵌套记录、联合类型),我将其作为值存储在 HBase 中。我使用当前与文件的编写器模式和 HBase 中的记录匹配的模式读取 Avro 数据文件:

然后我检查 HBase 以查看是否已经存在具有相同 rowkey 的记录。我的 get 返回的 val 是 Avro 记录的字节数组表示:

如果 HBase 中没有具有相同 rowkey 的记录,我将记录放入:

如果 HBase 中有一条记录具有相同的行键,我想将 HBase 结果的字节数组转换回 Avro 模式,然后比较几个字段以查看哪个记录“更好”。我想将“更好”的记录放入 HBase,但我被卡住了。如何将字节数组从 HBase 转换为 GenericRecord,以便比较文件记录和 HBase 之间的字段?

0 投票
1 回答
1070 浏览

java - Mac 上的 Snappy 问题在 Hadoop 上执行 Avro 工作

我在 Mac OSX 中工作。我在尝试运行在 hadoop 集群上使用 Avro 文件的 hadoop 作业时遇到以下异常。我使用 Java 1.6,我使用的 Snappy 版本是 1.0.4.1,这不是最后一个,但我无法更改它,因为其他部分可能会发生其他问题。

堆栈跟踪如下:

0 投票
1 回答
3392 浏览

protocol-buffers - 将 protobuf 转换为 avro

我有以 protobuff 格式序列化的数据,我想将其转换为 Avro 序列化。

我使用读取原始数据没有问题

结果o又是一个 protobuf 对象。现在我想用相同的模式把o写成 avro

但是运行上面的代码会在write方法处引发下一个异常

如何将 proto 对象转换为 avro 对象?

问候,罗南。