0

情况

我使用 beanIO 2.1.0 将 csv 文件读入不同类型的对象。

这是我的 csv 文件。动物列表(颜色、类型、腿数)。在我的列表中还有没有类型的动物(最后一行)。

brown;cat;4
white;dog;4
brown;dog;4
black;;8

我想将 csv 文件读入不同的动物对象。如果类型是“猫”,它应该是一个猫对象。狗也是一样。如果类型不是猫或狗,例如空或未知的动物类型,那么它应该是动物对象。

这里属于beanIO-mapping:

<beanio xmlns="http://www.beanio.org/2012/03" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"  xsi:schemaLocation="http://www.beanio.org/2012/03 http://www.beanio.org/2012/03/mapping.xsd">

  <stream name="animalFile" format="csv" >
    <parser>
      <property name="delimiter" value=";"/>
    </parser>
    <record name="animal" class="zoo.Cat">
      <field name="color" />
      <field name="type" rid="true" literal="cat"/>
      <field name="legs"/>
    </record>
    <record name="animal" class="zoo.Dog">
      <field name="color" />
      <field name="type"  rid="true" literal="dog"/>
      <field name="legs"/>
    </record>
    <record name="animal" class="zoo.Animal" >
      <field name="color" />
      <field name="type"/>
      <field name="legs"/>
    </record>
  </stream>
  </beanio>

我的程序读取 csv 文件,用 beanIO 解析它并调用解析对象的 toString 方法。

这是输出。看起来不错:

CAT: brown;cat;4
DOG: white;dog;4
DOG: brown;dog;4
ANIMAL: black;;8

问题:

现在我只需更改 csv 文件中动物的顺序。第二行是未知的动物类型:

brown;cat;4
black;;8
white;dog;4
brown;dog;4

这是新的输出!当找到第一个未知动物时,接下来的所有行也是未知动物。

CAT: brown;cat;4
ANIMAL: black;;8
ANIMAL: white;dog;4
ANIMAL: brown;dog;4

问题:

它是 beanIO 中的错误还是我可以在 beanIO-mapping 中配置它?

4

1 回答 1

3

编辑:在 OP 发表评论后更新了答案。

这不是 BeanIO 中的错误。您有两个选项来识别记录。首先,您拥有literal到目前为止使用的属性。其次,您还可以使用正则表达式 ( regex) 来识别记录。

Animaltype字段不是猫或狗时,或者当它是空字符串/对象时,您想要匹配对象。

您的type字段定义可能是Animal记录中的两个之一。

<field name="type" rid="true" regex="\s*" />

在这里,只要 type 字段包含 java 正则表达式定义的空格,它就会匹配。

或者

<field name="type" rid="true" regex=""^(?:(?!\b(cat|dog)\b).)*$" />

这将匹配type字段不包含单词cat或的任何记录dog

试试这个动物记录:

<record name="animal" class="zoo.Animal" >
  <field name="color" />
  <field name="type" rid="true" regex=""^(?:(?!\b(cat|dog)\b).)*$" />
  <field name="legs"/>
</record>

题外话。从技术上讲,您不是在读取CSV文件,因为您的分隔符必须是逗号。相反,您有一个使用分号 (;) 作为分隔符的分隔格式。

我还建议您在 xml 映射文件中使记录定义的名称唯一。记录名称用于报告问题位置的错误消息中。如果所有记录的记录名称相同,您将不知道到哪里查找问题。

于 2018-12-16T22:12:23.127 回答