我正在尝试构建一个开源项目以提供对机器学习数据集的轻松访问,该数据集以易于访问的方式捆绑数据。基本上,我有代码,它将原始数据转换为HSQLDB
file
数据库,生成*.data
、*.properties
和*.script
文件。然后我将这 3 个文件放入src/main/resources
我的Maven
项目中并构建一个 jar。依赖于此 jar 的应用程序可以将HSQLDB
数据库作为res
数据库进行访问。
从技术上讲,我可以毫无问题地完成所有工作。但是,访问数据非常慢。奇怪的是,如果我有一个数据集项目和一个依赖于数据集的项目,它们都在 Eclipse 中打开并从那里运行,那么它会像预期的那样快。这意味着问题与HSQLDB
被震动的文件有关。另一个线索是,数据库越大,访问数据所需的时间(看似)成倍增长。
我试过碰撞作为 JVM args 给出的内存和 perm 空间。我也尝试HSQLDB
在*.properties
文件中设置各种标志。
有任何想法吗??
<compress>false</compress>
编辑:我还使用maven-jar-plugin 定义中的元素关闭了 jar 压缩。