我想使用 RDF 注释存储在 hdf5 中的大型多维数据集,并且我认为数据立方体词汇表将是正确的选择。我通读了 w3c 的介绍:https ://www.w3.org/TR/vocab-data-cube/ 在他们的示例中,他们展示了一个用例,其中注释了一个小数据集:
eg:dataset-le1 a qb:DataSet;
rdfs:label "Life expectancy"@en;
rdfs:comment "Life expectancy within Welsh Unitary authorities - extracted from Stats Wales"@en;
qb:structure eg:dsd-le ;
.
eg:o1 a qb:Observation;
qb:dataSet eg:dataset-le1 ;
eg:refArea ex-geo:newport_00pr ;
eg:refPeriod <http://reference.data.gov.uk/id/gregorian-interval/2004-01-01T00:00:00/P3Y> ;
sdmx-dimension:sex sdmx-code:sex-M ;
sdmx-attribute:unitMeasure <http://dbpedia.org/resource/Year> ;
eg:lifeExpectancy 76.7 ;
.
eg:o2 a qb:Observation;
qb:dataSet eg:dataset-le1 ;
eg:refArea ex-geo:cardiff_00pt ;
eg:refPeriod <http://reference.data.gov.uk/id/gregorian-interval/2004-01-01T00:00:00/P3Y> ;
sdmx-dimension:sex sdmx-code:sex-M ;
sdmx-attribute:unitMeasure <http://dbpedia.org/resource/Year> ;
eg:lifeExpectancy 78.7 ;
.
eg:o3 a qb:Observation;
qb:dataSet eg:dataset-le1 ;
eg:refArea ex-geo:monmouthshire_00pp ;
eg:refPeriod <http://reference.data.gov.uk/id/gregorian-interval/2004-01-01T00:00:00/P3Y> ;
sdmx-dimension:sex sdmx-code:sex-M ;
sdmx-attribute:unitMeasure <http://dbpedia.org/resource/Year> ;
eg:lifeExpectancy 76.6 ;
.
...
在此示例中,带注释的数据集的所有值都使用数据立方体词汇表存储在 RDF 中。我认为这不是在 RDF 中存储大量数据的合适方式,例如我的 hdf5 数据集。我的一些数据集具有包含数千个值的多维数组。有没有办法在没有完全转换成 RDF 的情况下注释这些数据集?
我想我可以使用 hdf5 结构的组路径和节点名称来引用数据集。用伪 RDF 编写:
hdf-ex: http://www.semanticweb.org/hdf5-example
eg:dataset-le1 a qb:DataSet .
eg:o1 a qb:Observation;
qb:dataSet eg:dataset-le1 ;
hdf-ex:group-path /path/to/data/;
hdf-ex:node /node1;
.
我没有找到任何类似的例子。我想我错过了一些东西。RDF 中是否有任何标准或词汇表允许在不将数据完全转换为 RDF 的情况下对 hdf5 数据进行注释?