3

在尝试使用 Kafka Streams 流式传输 Avro 数据时,我遇到了这个错误:

Exception in thread "StreamThread-1" org.apache.kafka.common.errors.SerializationException: Error deserializing Avro message for id -1 Caused by: org.apache.kafka.common.errors.SerializationException: Unknown magic byte!

尽管我在邮件列表中找到了几个关于它的旧线程,但没有一个解决方案说明了该问题。所以希望我能在这里找到解决方案。

我的设置如下所示:

StreamsConfig.KEY_SERDE_CLASS_CONFIG, Serdes.String.getClass.getName
StreamsConfig.VALUE_SERDE_CLASS_CONFIG, classOf[GenericAvroSerde]   
AbstractKafkaAvroSerDeConfig.SCHEMA_REGISTRY_URL_CONFIG, localhost:8081)  

我已经尝试将 设置KEY_SERDE为与 相同VALUE_SERDE,但即使这在邮件列表中被“标记”为解决方案,它在我的情况下也不起作用。

我正在GenericData.Record使用我的 Schema 生成如下:

val record = new GenericData.Record(schema)
...
record.put(field, value)

当我启动调试模式并检查生成的记录时,一切看起来都很好,记录中有数据并且映射正确。

我像这样流式传输 KStream(我之前使用过分支):

splitTopics.get(0).to(s"${destTopic}_Testing")

我是GenericData.Record用来记录的。这可能是与 结合使用的问题GenericAvroSerde吗?

4

1 回答 1

1

我的问题的解决方案是VALUE_SERDE在反序列化我从输入主题中获得的字符串值之后进行交换。

由于Serde是序列化和反序列化的组合“元素”,因此我不能简单地使用StreamsConfig.VALUE_SERDE_CLASS_CONFIG, classOf[GenericAvroSerde]而是必须使用 aStringSerde来反序列化输入记录,然后才使用 anAvroSerde将其写入输出主题。
现在看起来像这样:

// default streams configuration serdes are different from the actual output configurations
val streamsConfiguration: Properties = {
  val p = new Properties()
  p.put(StreamsConfig.APPLICATION_ID_CONFIG, kStreamsConf.getString("APPLICATION_ID"))
  p.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG, kStreamsConf.getString("BOOTSTRAP_SERVERS_CONFIG"))
  p.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, kStreamsConf.getString("AUTO_OFFSET_RESET_CONFIG"))
  p.put(StreamsConfig.KEY_SERDE_CLASS_CONFIG, Serdes.String.getClass.getName)
  p.put(StreamsConfig.VALUE_SERDE_CLASS_CONFIG, Serdes.String.getClass.getName)
  p.put(AbstractKafkaAvroSerDeConfig.SCHEMA_REGISTRY_URL_CONFIG, kStreamsConf.getString("SCHEMA_REGISTRY_URL_CONFIG"))
  p
}

// adjusted output serdes for avro records
val keySerde: Serde[String] = Serdes.String
val valSerde: Serde[GenericData.Record] = new GenericAvroSerde()
valSerde.configure(
  Collections.singletonMap(
    AbstractKafkaAvroSerDeConfig.SCHEMA_REGISTRY_URL_CONFIG,
    streamsConfiguration.get(AbstractKafkaAvroSerDeConfig.SCHEMA_REGISTRY_URL_CONFIG)
  ),
  /* isKeySerde = */ false
)

// Now using the adjusted serdes to write to output like this
stream.to(keySerde, valSerde, "destTopic")

这样,它就像魅力一样。
谢谢

于 2017-12-27T16:15:28.297 回答