1

我是大数据文件世界的新手,我想知道我的数据格式可能是什么。数据位于一个非常大的文本文件中,其中包含一些匿名医疗记录。我在下面粘贴了一个示例。

我了解每一列是什么,除了第四列,它似乎是与相似行相关的代码。这种类型的数据是否来自关系数据库?如果是这样,这种格式有名称吗?

任何帮助都感激不尽。

649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1169|Blood Pressure (Diastolic)|80
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1170|Blood Pressure (Systolic)|140
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1174|Vital Signs Delta|0
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1175|Pulse|64
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1176|Respiratory Rate|14
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1178|Weight|73.7
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1180|Weight Units|Kilograms
649|183|Vital Signs|ACEFCC5F-C6FA-426F-AC26-7A23D7E6B26E|1169|Blood Pressure (Diastolic)|
649|183|Vital Signs|ACEFCC5F-C6FA-426F-AC26-7A23D7E6B26E|1170|Blood Pressure (Systolic)|
4

1 回答 1

1

看起来像一个普通的分隔样式文本文件,|用作分隔符。

它不是一个特定的标准,但许多不同的程序可以生成和使用此类文件。无法判断是什么特定的软件产生了这个。

根据平台和语言,您将能够相当容易地解析此文件 - 它看起来每行一条记录,每个字段由|.

第四列是GUID。GUID 在许多应用程序中非常常见,并且在非常大的数据库和断开连接的数据库场景中多次用作标识符(因为它们的性质意味着不太可能创建重复项)。

于 2012-09-28T19:12:05.983 回答