4

问题:

存储各种测量值的时间序列数据的关系数据库 (Postgres)。每个测量值可以具有特定的“测量类型”(例如温度、溶解氧等)并且可以具有特定的“测量单位”(例如华氏度/摄氏度/开尔文、百分比/毫克/升等)。

问题:

有没有人建立了一个类似的数据库来保存维度完整性?有什么建议吗?

我正在考虑构建一个measurement_type 和一个measurement_unit 表,这两个表都有文本两列,ID 和文本。然后我会在measured_value 表中为这些表创建外键。文本让我有些担心,因为可能存在非唯一重复项(例如,“ug/l”与“µg/l”代表每升微克)。

这样做的目的是让我可以在查询中或通过外部编程转换和验证单位。理想情况下,我以后有能力进行严格的尺寸分析(例如,将 µg/l 与值“M/V”(质量除以体积)联系起来)。

有没有更优雅的方法来实现这一点?

4

3 回答 3

4

很久以前,我制作了一个用于处理单元的数据库子模式(好吧,我稍微夸大了一点;不过那是大约 20 年前的事了)。幸运的是,它只需要处理简单的质量、长度、时间维度——而不是温度、电流或光度等。游戏的货币方面并不那么简单——一种货币之间有无数种不同的转换方式另一个取决于转换率有效的日期、货币和期间。这是与物理单元分开处理的。

从根本上说,我创建了一个“度量”表,其中包含“id”列、单位名称、缩写和一组维度指数——质量、长度和时间各一个。这将填充诸如“体积”(长度 = 3、质量 = 0、时间 = 0)、“密度”(长度 = 3、质量 = -1、时间 = 0)等名称。

还有第二个单位表,它确定了一个度量,然后是特定度量使用的实际单位。例如,有桶、立方米,以及各种其他相关单位。

第三个表格定义了特定单位之间的转换系数。这包括两个单元和将单元 1 转换为单元 2 的乘法转换因子。这里最大的问题是转换因子的动态范围。如果从 U1 到 U2 的转换是 1.234E+10,那么倒数是一个相当小的数字(8.103727714749e-11)。

S.Lott 关于温度的评论很有趣——我们不必处理这些。存储过程可以解决这个问题——尽管将一个存储过程集成到系统中可能会很棘手。

我描述的方案允许描述一次大多数转换(包括假设单位,例如每两周弗隆,或者假设较少但同样模糊的单位 - 在美国以外 - 如英亩 - 英尺),并且可以验证转换(例如,转换系数表中的单位必须具有相同的度量)。它可以扩展到处理大多数其他单位——尽管角度(或立体角)等无量纲单位存在一些有趣的问题。有支持代码可以处理任意转换 - 或在无法支持转换时生成错误。这个系统的一个原因是各个国际附属公司会在当地方便的单位报告他们的数据,

于 2009-08-03T22:11:46.537 回答
0

“文本让我有些担心,因为可能存在非唯一重复项”

对。所以不要使用文本作为键。使用 ID 作为密钥。

“有没有更优雅的方法来完成这个?”

并不真地。这个很难(硬。温度是它自己的问题,因为温度本身就是一个平均值,不像距离那样求和;加 F 到 C 的转换不是乘法(与其他所有单位转换一样。)

于 2009-08-03T21:51:30.603 回答
0

关于转换的说明:很多单位是线性相关的,可以使用“y = A + Bx”之类的公式进行转换,其中 A 和 B 是常数,可以为您需要的每对单位存储在数据库中之间进行转换。例如,摄氏到华氏的常数为 A=32,B=1.8。

但是,也有极少数例外。例如,在对数和非对数单位之间进行转换。或者在每体积质量和每体积摩尔质量之间进行转换(在这种情况下,您需要知道被测量化合物的摩尔质量)。

当然,如果你确定系统所需的所有转换都是线性的,那么就不需要过度工程,只需存储两个常数即可。然后,您可以使用带有计算字段的直接 SQL 连接从数据库中提取标准化结果。

于 2009-09-20T01:12:58.867 回答