我们公司一直在研究一种文件格式来保存大量实验室传感器数据。每次他们运行仪器时,它都会生成一个文件,我们使用该文件并将其存储在数据库中以进行趋势分析等。分层格式是首选,因为它允许我们“分组”数据。这是我们将数据放入数据库之前的中间文件格式。由于我们的开发环境,这是我们的优先级列表:
1) .Net 兼容。该 API 将用于 Web 服务和客户端应用程序。我们无法控制客户的环境,因此最好使用 pure.Net 解决方案。
2) 读取速度。我们的读取是随机的,而不是顺序的。越快越好。如果我们不是 C# 开发商店,我会说速度是第一。
3) 文件大小。如果文件本身很大,则需要良好的压缩率(86% 或更高)。
4) 读取的内存占用。由于数据量大,我们不能简单地读取它。每个传感器都有一个时间/值对。这可以生成超过 400 万对。这为我们消除了 XML。
我们目前查看了HDF5,发现 .NET 领域非常缺乏 API,无法提供 Web 服务,但具有我们正在寻找的大小/速度。我也研究了JSON,它看起来很有希望,但我还没有尝试读回一段数据。我在网上搜索并没有找到很多满足我们需要的文件格式。任何帮助表示赞赏。