我正在在这里集思广益我的问题,不确定这是否会触发大量关闭!
简化:我有一个读取 XML 文件并将其加载到数据库中的系统。
XML 具有以下架构:
<?XML version="1.0" encoding="UTF-8"?>
罪魁祸首字段具有以下架构摘录:
<xsd:simpleType name="title">
.....
<xsd:restriction base="xsd:string">
<xsd:minLength value="1"/>
<xsd:maxLength value="2000"/>
</xsd:restriction>
该模式与 UTF-8 兼容,因此应支持 2000 个 UTF-8 字符,无论它们是单字节、双字节还是多字节。
XML 模式已经进行了字符长度检查,如上面的摘录中所定义。
问题是有时 XSD 验证成功,但数据库插入失败,当“标题”XML 字段中出现一些多字节 UTF-8 字符时,服务器崩溃并出现 DB 错误。
The database 'title' column is defined as `varchar(2000)`
当数据库插入操作失败时,ops 需要手动减少 XML 字段的长度,并重新处理 XML 文件来修复它。
我一直在研究:
- 字节与字符长度检查
- 模式验证
- ETC
解决方案是否可以进行与字符计数匹配的字符串字节计数检查?
我可以在 Java 中执行 string.getBytes("UTF-8").length ,但是如何匹配<xsd:maxLength value="2000"/>
XSD 和varchar(2000)
?
您认为确保标题字段的 XML 数据不超过 XSD 中定义的指定长度的最佳方法是什么。并且只要符合 XSD,XML 数据是否成功插入 DB?
我是否正确假设<xsd:maxLength value="2000"/>
XSD 中的a 与varchar(2000)
列定义匹配?