我有一个非常大的 xml 数据集,其结构如下:
<root>
<person>
<personid>HH3269732</personid>
<firstname>John</firstname>
<lastname>Smith</lastname>
<entertime>01/02/2008 10:15</entertime>
<leavetime>01/02/2008 11:45</leavetime>
<entertime>03/01/2008 08:00</entertime>
<leavetime>03/01/2008 10:00</leavetime>
...
// number of enter times and leave times vary from person to person
// there may not be a final leave time (ie, they haven't left yet)
</person>
...
</root>
数据的结构不在我的控制之下。此数据当前位于 MS SQL Server 2005 中单行中的单个 xml 列中。我正在尝试构建一个查询,该查询会产生以下输出:
HH3269732 John Smith 01/02/2008 10:15 01/02/2008 11:45
HH3269732 John Smith 03/01/2008 08:00 01/02/2008 10:00
HH3269735 Mark Pines 02/01/2008 09:00 NULL
HH3263562 James Frank NULL NULL
HH3264237 Harold White 04/18/2008 03:00 04/18/2008 05:00
...
我的查询目前如下所示:
DECLARE @xml xml
SELECT @xml = XmlCol FROM Data
SELECT
[PersonId] = Persons.PersonCollection.value('(personid)[1]', 'NVARCHAR(50)')
,[First Name] = Persons.PersonCollection.value('(firstname)[1]', 'NVARCHAR(50)')
,[Last Name] = Persons.PersonCollection.value('(lastname)[1]', 'NVARCHAR(50)')
??????
FROM @xml.nodes('root\person') Persons(PersonCollection)
该查询可能不是 100% 正确,因为我正在从内存中提取它,但我遇到的问题是我不知道如何包含 entertime leavetime 序列元素以获得所需的行集我在上面指出。
谢谢。
更新:我想补充一点,给定的人员记录可能根本没有entertime/leavetime 序列元素,但仍需要在行集中返回。我已经更新了所需输出的示例以反映这一点。