我的 python 项目涉及一个外部提供的数据库:大约 100K 行的文本文件。
该文件将每天更新。
我应该将它加载到 SQL 数据库中,并diff
每天处理吗?或者有没有一种有效的方法来“查询”这个文本文件?
附加信息:
- 每个“条目”或行包含三个字段 - 其中任何一个都可以用作索引。
- 更新是整个数据库的形式 - 我必须手动生成一个差异
- 查询只是查找记录并显示文本。
- 查询数据库将是应用程序的一项基本任务。
多久查询一次数据?在一个极端情况下,如果每天一次,您可能会比维护数据库或索引更有效地使用顺序搜索。
对于更多查询和每日更新,您可以构建和维护自己的索引以实现更高效的查询。最有可能的是,使用 SQL 数据库(或其他数据库,取决于您的需要)以换取更简单和更可维护的代码,在速度上的牺牲可以忽略不计(如果有的话)。
我之前所做的是从数据库提取创建的 txt 文件创建 SQLite 数据库,每天一个 SQLite 数据库。
可以跨 SQLite db 查询以检查值等并创建其他数据表。
我添加了一个额外的数据列,即文本行的 SHA1,以便我可以轻松识别不同的行。
它在我的情况下有效,希望可以为您提供最简单的想法。