目前我正在使用一个提供程序构建的 SQL Server DB。该数据库具有来自通过其系统进行的调用的数据。存储数据的主表有 7 个字段。1 个字段是主键,然后是 2 个外键,几个数据时间戳,最后是一个名为“SergmentLog”的大量字段
在该字段中,数据是非结构化的。以下是数据的示例:
/20160219T154710.554-07/0?S=50&E=3512&CUTC=20160219T155235.662-07&1=100187177120160219&2=0&3=18823&4=user%20queue:icadmin&5=&6=Interact&7=|/20160219T154729.377-07/0?S=50&E=3504&CUTC=20160219T155235.663-07&1=100187177120160219&2=0&3=81592&4=user%20queue:icadmin&5=&6=LocalTransfer&7=%3cDetails%20TransferringUser%3d%22ICadmin%20-%22%20TransferringInteractionId%3d%22100187177120160219%22%20TransferredInteractionId%3d%22100187177120160219%22%20/%3e%0a&8=&9=2|/20160219T154850.970-07/0?S=50&E=3502&CUTC=20160219T155235.663-07&1=100187177120160219&2=0&3=55&4=&5=workgroup%20queue:Central%20Ops%202&6=LocalTransfer&7=%3cDetails%20TransferringUser%3d%22ICadmin%20-%22%20TransferringInteractionId%3d%22100187177120160219%22%20TransferredInteractionId%3d%22100187177120160219%22%20TransferredUser%3d%22Phoenix%20AZ%22%20/%3e%0a|/20160219T154851.025-07/0?S=50&E=3500&CUTC=20160219T155235.664-07&1=100187177120160219&2=0&3=1048&4=&5=&6=Queue&7=%3cDetails%20IVRAppName%3d%22Central%20Ops%202%22%20/%3e%0a|/20160219T154852.073-07/0?S=50&E=3502&CUTC=20160219T155235.664-07&1=100187177120160219&2=0&3=13344&4=&5=workgroup%20queue:Central%20Ops%202&6=Interact&7=|/20160219T154905.417-07/0?S=50&E=3504&CUTC=20160219T155235.664-07&1=100187177120160219&2=0&3=26202&4=user%20queue:icadmin&5=workgroup%20queue:Central%20Ops%202&6=LocalDisconnect&7=&8=&9=5
我被告知的是,每个“SegmentLog”可以有多个“事件”,在 SegmentLog 字段中称为“E=”。每个事件都由“|”分隔 管道符号。但在每个偶数之前,有一个来自服务器的数据时间戳,然后是 SourceID(称为“S=”),最后是 EventID(称为“E=”)
在每个 EventID(编号从 3500 - 3512)之后会有编号从 1 到 9 的属性(称为“1=”、“2=”等)。
请记住,每个 SegmentLog 可能有多个具有相同 EventID 的事件,并且并非所有属性都会显示在每个 EventID 中(IE E=3502 可能仅显示属性 1-6,而 E=3503 可能显示属性 1-9)将这些数据结构化为表结构的最佳方式。我可用的工具是在视图或中间 SSIS 知识中构建复杂的搜索查询。
编辑
我希望看到数据变成这样。但包括所有属性:
DateTime Sequence EventID Attr1 Attr3
-------- -------- ------- ----- -----
/20160219T154710.554-07/0? s=50 &E=3512 &1=100187177120160219 &3=18823
/20160219T154729.377-07/0? S=50 &E=3504 &1=100187177120160219 &3=81592
/20160219T154850.970-07/0? S=50 &E=3502 &1=100187177120160219 &3=55
/20160219T154851.025-07/0? S=50 &E=3500 &1=100187177120160219 &3=1048