我正在创建我的第一个 XSD,因为我有一个 4MB 的 XML 文件,我需要将其解析为 SQL,并且使用无类型的 XML 处理一些大的东西需要很长时间(我放弃并在一小时后取消了查询)。
我拥有的 XML 文件采用以下格式(每个产品都有更多元素,但我缩短了它并创建了一个测试 XML 文件,直到我做对了):
<ITEMS>
<CREATED value="Wed May 2 9:40:38 BST 2012">
<PRODUCT ITEM="0001">
<MODEL>MODELNO1</MODEL>
<BARCODE>5550204425</BARCODE>
<TITLE>Item 1 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0002">
<MODEL>MODELNO2</MODEL>
<BARCODE>52614343433</BARCODE>
<TITLE>Item 2 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0003">
<MODEL>MODELNO3</MODEL>
<BARCODE>32563533</BARCODE>
<TITLE>Item 3 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0004">
<MODEL>MODELNO4</MODEL>
<BARCODE>65135647582</BARCODE>
<TITLE>Item 4 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0005">
<MODEL>MODELNO5</MODEL>
<BARCODE>65874112</BARCODE>
<TITLE>Item 4 Title</TITLE>
</PRODUCT>
</CREATED>
</ITEMS>
这个 XML 文件是由外部供应商系统自动生成的,我别无选择,只能以当前格式使用它。
我为它创建了这个模式:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="ITEMS">
<xs:complexType>
<xs:sequence>
<xs:element name="CREATED">
<xs:complexType>
<xs:sequence>
<xs:element name="PRODUCT" maxOccurs="unbounded">
<xs:complexType>
<xs:sequence>
<xs:element name="MODEL" type="xs:string" maxOccurs="unbounded" />
<xs:element name="BARCODE" type="xs:string" maxOccurs="unbounded" />
<xs:element name="TITLE" type="xs:string" maxOccurs="unbounded" />
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
在 SQL 中,我首先创建了一个模式集合,如下所示:
IF EXISTS ( SELECT * FROM sys.xml_schema_collections where [name] = 'MyXmlSchema')
DROP XML SCHEMA COLLECTION [MyXmlSchema]
GO
DECLARE @MySchema XML
SET @MySchema =
(
SELECT * FROM OPENROWSET
(
BULK 'C:\test\schema2.xsd', SINGLE_CLOB
) AS xmlData
)
CREATE XML SCHEMA COLLECTION [MyXmlSchema] AS @MySchema
GO
然后我根据模式创建了一个表:
CREATE TABLE [dbo].[XMLProds] (
[MODEL] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL,
[EAN] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL,
[NAME] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL
)
最后,验证 XML:
DECLARE @x2 XML ([MyXmlSchema])
SELECT @x2 = '<copied the code from the test XML file and pasted here>'
验证不喜欢“创建”字段中的日期值,我可以不用它,因为它只声明一次并且可以轻松删除。但它也不喜欢每个产品字段中的“ITEM”值,这是没有问题的。2. 这一点不容忽视,因为它出现在每一个项目中(全部 2-3 千个)。有没有办法解决这个问题?
只是为了破解,我从测试 XML 中删除了不需要的值,并且验证通过了。然后我执行了这个语句以尝试填充表:
INSERT INTO XMLProds (MODEL, BARCODE, TITLE)
SELECT X.product.query('MODEL').value('.', 'VARCHAR(20)'),
X.product.query('BARCODE').value('.', 'VARCHAR(50)'),
X.product.query('TITLE').value('.', 'VARCHAR(150)')
FROM (
SELECT CAST(x AS XML)
FROM OPENROWSET(BULK 'C:\test\Products2test.xml', SINGLE_BLOB) AS T(x)) AS T(x)
CROSS APPLY x.nodes('/ITEMS/CREATED/PRODUCT') AS X(product);
..但遇到以下错误:
消息 6909,级别 16,状态 1,第 21 行 XML 验证:此位置不允许使用文本节点,类型是使用仅元素内容或简单内容定义的。地点: /
任何有关我在这里出错的地方的帮助将不胜感激!提前致谢。