1

我目前正在为系统中使用的遗留(自定义)二进制文件格式开发 DFDL 模式,以转换为 XML 或 JSON。

我有一些枚举值的二进制数据,即 C-struct 数据类型看起来像这样(并存储为一个字节):

typedef enum _SomeEnum
{
  ENUM_1 = 0x00,
  ENUM_2 = 0x01,
  ENUM_3 = 0x02
} SomeEnum;

我可以使用这个 DFDL 模式代码(包括检查)将枚举解码为一个数值:

<xs:element name="SomeEnum" type="xs:unsignedByte>
  <xs:annotation>
    <xs:appinfo source="http://www.ogf.org/dfdl/">
        <dfdl:assert><![CDATA[{ . lt 3 }]]></dfdl:assert>
    </xs:appinfo>
   </xs:annotation>
</xs:element>

在这种情况下,它会转换为枚举字段等于 1 的 XML:

<SomeEnum>1</SomeEnum>

我想要的是能够将解码的枚举值转换为字符串,以便 XML 结果如下所示:

<SomeEnum>ENUM_1</SomeEnum>

但我不确定如何使用 DFDL 做到这一点。

我使用 Daffodil 作为我的 DFDL 解析器/处理器(尽管我怀疑 IBM-integration-bus DFDL 解析器也可以做到这一点)

4

1 回答 1

1

免责声明,我是实现以下选项 2 的 Daffodil 开发人员。

我不相信 IBM DFDL 对这个问题有很好的解决方案。

Daffodil 提供两种解决方案:

1) 使用 inputValueCalc/outputValueCalc。这里的理论是您首先将枚举解析为整数(可能在隐藏组中),然后使用 DFDL 表达式在大 if-else 语句中计算友好字符串:

<xs:group name="enum">
  <xs:sequence>
    <xs:element name="enum_int" type="xs:int" dfdl:length="1" dfdl:outputValueCalc="{if (../SomeEnum eq 'ENUM_1') then 0 else if (../SomeEnum eq 'ENUM_2') then 1 else if (../SomeEnum eq 'ENUM_3') then 2 else fn:error()}"/>
  </xs:sequence>
</xs:group>

<xs:sequence>
  <xs:sequence dfdl:hiddenGroupRef="tns:enum"/>
  <xs:element name="SomeEnum" dfdl:inputValueCalc="if(../enum eq 0) then 'ENUM_1' else if(../enum eq 1) then 'ENUM_2' else if(../enum eq 2) then 'ENUM_3' else fn:error()" />
<xs:sequence>

这种方法的好处是它完全符合 DFDL。缺点是对于大型枚举(维护和运行)它很快变得笨拙。另外,据我所知,Daffodil 是目前唯一支持 inputValueCalc 和 outputValueCalc 的 DFDL 处理器,因此符合规范在这里并不特别值得。

2) 最新版本的 Daffodil (2.4.0) 包含一个专门针对这个问题设计的 DFDL 扩展。Daffodil wiki上提供了一些文档。

这里的理论是,您可以定义一个简单类型,它是对 xs:string 的限制,作为 xsd 枚举;然后提供相应的二进制值作为 DFDL 注释:

<xs:simpleType name="uint8" dfdl:length="1">
  <xs:restriction base="xs:unsignedInt"/>
</xs:simpleType>

<xs:simpleType name="SomeEnumType" dfdlx:repType="tns:uint8">
  <xs:restriction base="xs:string">
    <xs:enumeration value="ENUM_1" dfdlx:repValues="0" />
    <xs:enumeration value="ENUM_2" dfdlx:repValues="1" />
    <xs:enumeration value="ENUM_3" dfdlx:repValues="2" />
  </xs:restriction>
</xs:simpleType>

<xs:element name="SomeEnum" type="tns:SomeEnumType" />

这里的好处是模式更易于维护,并且 Daffodil 将使用直接哈希表查找来执行查找,而不需要遍历 if-else 树。

于 2019-09-30T14:44:47.777 回答