我有 Scala 2.12 并按照我的要求的链接导入了库 avro4s 。
基本上,我的 avro 架构如下: 仅示例:
Schema: {"name": "person","type": "record","fields": [{"name": "address","type": {"type" : "record","name" : "AddressUSRecord","fields" : [{"name": "streetaddress", "type": "string"},{"name": "city", "type":"string"}]}}]}
所以我创建了 3 个案例类。
我基于这些类测试了架构,看起来还不错。
所以,模式生成是好的。
现在,我正在根据案例类创建所需的对象。
当我尝试编写 avro 文件时,出现空指针异常。
错误:
Exception in thread "main" java.lang.NullPointerException
at org.apache.avro.util.Utf8$2.toUtf8(Utf8.java:123)
at org.apache.avro.util.Utf8.getBytesFor(Utf8.java:172)
at org.apache.avro.util.Utf8.<init>(Utf8.java:39)
at com.sksamuel.avro4s.Encoder$StringEncoder$.encode(Encoder.scala:73)
at com.sksamuel.avro4s.Encoder$StringEncoder$.encode(Encoder.scala:68)
at com.sksamuel.avro4s.Encoder$.encodeField(Encoder.scala:401)
at com.sksamuel.avro4s.Encoder$.encodeFieldLazy(Encoder.scala:379)
at MyClass$$anon$4$$anon$5.encode(MyClass.scala:90)
at MyClass$$anon$4$$anon$5.encode(MyClass.scala:90)
at com.sksamuel.avro4s.Encoder$.encodeField(Encoder.scala:401)
at com.sksamuel.avro4s.Encoder$.encodeFieldNotLazy(Encoder.scala:373)
at MyClass$$anon$4.encode(MyClass.scala:90)
at MyClass$$anon$4.encode(MyClass.scala:90)
at com.sksamuel.avro4s.AvroDataOutputStream.$anonfun$x$1$2(AvroDataOutputStream.scala:35)
at com.sksamuel.avro4s.AvroDataOutputStream.$anonfun$x$1$2$adapted(AvroDataOutputStream.scala:34)
at com.sksamuel.avro4s.AvroDataOutputStream.write(AvroDataOutputStream.scala:46)
at MyClass$.delayedEndpoint$MyClass$1(MyClass.scala:91)
at MyClass$delayedInit$body.apply(MyClass.scala:42)
at scala.Function0.apply$mcV$sp(Function0.scala:34)
at scala.Function0.apply$mcV$sp$(Function0.scala:34)
at scala.runtime.AbstractFunction0.apply$mcV$sp(AbstractFunction0.scala:12)
at scala.App.$anonfun$main$1$adapted(App.scala:76)
at scala.collection.immutable.List.foreach(List.scala:388)
at scala.App.main(App.scala:76)
at scala.App.main$(App.scala:74)
at MyClass$.main(MyClass.scala:42)
at MyClass.main(MyClass.scala)
代码:
//import java.io.File
import com.sksamuel.avro4s.{AvroOutputStream, AvroSchema}
import java.io.File
//case class Person(name: String, age: Int)
//case class Book(title: String, year: Int, owner: Person, authors: Seq[Person])
// case class as per schema
object MyClass extends App {
val outFile = "/path/TestScala.avro"
// val schema = AvroSchema[Book]
println("Hello, World!")
// println(schema)
val head = header(
prop1="val1"
prop2=null
)
val pnlBody = pnlData(
<corresponsing property vlaues, some with null>
)
val record = MyClass(header = head, body = pnlBody)
val schema = AvroSchema[MyClass]
println(schema)
println(record)
val os = AvroOutputStream.data[MyClass].to(new File(outFile)).build(schema)
os.write(record)
os.flush()
os.close()
}
基本上,根据我拥有的架构,我想了解我的最终记录对象应该如何?
更新:
根据@Antot 和@Daniel 的以下建议,我将标题和正文类更改为对所有预期为空的值使用 Option[String]。但仍然是同样的问题。
对标头和数据的案例类的更改,产生以下模式和记录。以下记录是否正确创建?
请指教?
更新 2:
我认为 Null 的问题。预计记录的属性很少为 NULL。由于我更改为 Option[String],它的值应该是 None 而不是 null。我是 Scala 的新手,所以仍然了解它的数据类型。
因此,现在可以将值从 null 更改为 None。
但是,我还有一个问题。如果我的属性是 Option[String],它如何转换为 Avro?如果我的值为 None,它是否会转换为 Avro null?