2

我正在创建我的第一个 XSD,因为我有一个 4MB 的 XML 文件,我需要将其解析为 SQL,并且使用无类型的 XML 处理一些大的东西需要很长时间(我放弃并在一小时后取消了查询)。

我拥有的 XML 文件采用以下格式(每个产品都有更多元素,但我缩短了它并创建了一个测试 XML 文件,直到我做对了):

 <ITEMS>
    <CREATED value="Wed May 2 9:40:38 BST 2012">
        <PRODUCT ITEM="0001">
            <MODEL>MODELNO1</MODEL>
            <BARCODE>5550204425</BARCODE>
            <TITLE>Item 1 Title</TITLE>
        </PRODUCT>
        <PRODUCT ITEM="0002">
            <MODEL>MODELNO2</MODEL>
            <BARCODE>52614343433</BARCODE>
            <TITLE>Item 2 Title</TITLE>         
        </PRODUCT>
        <PRODUCT ITEM="0003">
            <MODEL>MODELNO3</MODEL>
            <BARCODE>32563533</BARCODE>
            <TITLE>Item 3 Title</TITLE>         
        </PRODUCT>
        <PRODUCT ITEM="0004">
            <MODEL>MODELNO4</MODEL>
            <BARCODE>65135647582</BARCODE>
            <TITLE>Item 4 Title</TITLE>         
        </PRODUCT>
        <PRODUCT ITEM="0005">
            <MODEL>MODELNO5</MODEL>
            <BARCODE>65874112</BARCODE>
            <TITLE>Item 4 Title</TITLE>         
        </PRODUCT>
    </CREATED>
   </ITEMS>

这个 XML 文件是由外部供应商系统自动生成的,我别无选择,只能以当前格式使用它。

我为它创建了这个模式:

<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
    <xs:element name="ITEMS">
        <xs:complexType>
            <xs:sequence>
                <xs:element name="CREATED">
                    <xs:complexType>
                        <xs:sequence>
                            <xs:element name="PRODUCT" maxOccurs="unbounded">
                                <xs:complexType>
                                    <xs:sequence>
                                        <xs:element name="MODEL" type="xs:string" maxOccurs="unbounded" />
                                        <xs:element name="BARCODE" type="xs:string" maxOccurs="unbounded" />
                                        <xs:element name="TITLE" type="xs:string" maxOccurs="unbounded" />
                                    </xs:sequence>
                                </xs:complexType>
                            </xs:element>
                        </xs:sequence>
                    </xs:complexType>
                </xs:element>
            </xs:sequence>
        </xs:complexType>
    </xs:element>
</xs:schema>

在 SQL 中,我首先创建了一个模式集合,如下所示:

IF EXISTS ( SELECT * FROM sys.xml_schema_collections where [name] = 'MyXmlSchema')
DROP XML SCHEMA COLLECTION [MyXmlSchema]
GO

DECLARE @MySchema XML
SET @MySchema = 
(
    SELECT * FROM OPENROWSET
    (
        BULK 'C:\test\schema2.xsd', SINGLE_CLOB 
    ) AS xmlData
)

CREATE XML SCHEMA COLLECTION [MyXmlSchema] AS @MySchema 
GO

然后我根据模式创建了一个表:

CREATE TABLE [dbo].[XMLProds] (
    [MODEL] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL,
    [EAN] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL,
    [NAME] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL
)

最后,验证 XML:

DECLARE @x2 XML ([MyXmlSchema])
SELECT @x2 = '<copied the code from the test XML file and pasted here>'

验证不喜欢“创建”字段中的日期值,我可以不用它,因为它只声明一次并且可以轻松删除。但它也不喜欢每个产品字段中的“ITEM”值,这是没有问题的。2. 这一点不容忽视,因为它出现在每一个项目中(全部 2-3 千个)。有没有办法解决这个问题?

只是为了破解,我从测试 XML 中删除了不需要的值,并且验证通过了。然后我执行了这个语句以尝试填充表:

INSERT INTO XMLProds (MODEL, BARCODE, TITLE)

    SELECT X.product.query('MODEL').value('.', 'VARCHAR(20)'),
           X.product.query('BARCODE').value('.', 'VARCHAR(50)'),
           X.product.query('TITLE').value('.', 'VARCHAR(150)')

FROM (
    SELECT CAST(x AS XML)
    FROM OPENROWSET(BULK 'C:\test\Products2test.xml', SINGLE_BLOB) AS T(x)) AS T(x)
    CROSS APPLY x.nodes('/ITEMS/CREATED/PRODUCT') AS X(product);

..但遇到以下错误:

消息 6909,级别 16,状态 1,第 21 行 XML 验证:此位置不允许使用文本节点,类型是使用仅元素内容或简单内容定义的。地点: /

任何有关我在这里出错的地方的帮助将不胜感激!提前致谢。

4

1 回答 1

2

我将从一个有效的 XSD 开始。您缺少属性,这就是您在处理不需要的内容时遇到问题的原因。

<?xml version="1.0" encoding="utf-8"?>
<!--XML Schema generated by QTAssistant/XML Schema Refactoring (XSR) Module (http://www.paschidev.com)-->
<xsd:schema attributeFormDefault="unqualified" elementFormDefault="qualified" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
  <xsd:element name="ITEMS">
    <xsd:complexType>
      <xsd:sequence>
        <xsd:element name="CREATED">
          <xsd:complexType>
            <xsd:sequence>
              <xsd:element maxOccurs="unbounded" name="PRODUCT">
                <xsd:complexType>
                  <xsd:sequence>
                    <xsd:element name="MODEL" type="xsd:string" />
                    <xsd:element name="BARCODE" type="xsd:unsignedLong" />
                    <xsd:element name="TITLE" type="xsd:string" />
                  </xsd:sequence>
                  <xsd:attribute name="ITEM" type="xsd:unsignedByte" use="required" />
                </xsd:complexType>
              </xsd:element>
            </xsd:sequence>
            <xsd:attribute name="value" type="xsd:string" use="required" />
          </xsd:complexType>
        </xsd:element>
      </xsd:sequence>
    </xsd:complexType>
  </xsd:element>
</xsd:schema>

如果它仍然不起作用,请告诉我。

于 2012-05-26T01:44:47.187 回答