我目前正在开发处理数十万个字符串(每个约 4000 个字符)的算法,并根据应用于这些字符串的函数的结果执行简单的操作。目前我使用 Java 和一个带有一个表的 Mysql 数据库:
ID | String | attribute a | attribute b | ....
| | | | ....
基本上,该算法从一个 ID 开始,读取存储的字符串,对其执行功能(为当前活动的列设置和读取属性)。例如,一个函数从字符串中提取一个 ID(简单的字符串解析),将该 ID 存储在“属性 a”列中。解析条目后,算法读取“属性 a”,跳转到具有此 ID 的行,然后重新开始该过程。
也许我有点想多了;但是当前设置的开销太大,几乎不可能进行一些快速更改或快速测试查询。是否有更好的工具或编程语言被设计用于直接操作像这样的大型数据集并为字符串操作提供有效的函数?
我绝对不介意花时间学习一门全新的语言,因为我相信使用正确的工具来完成工作可以节省时间并防止长期的挫败感。