0

我正在建立一个包含文章、政策和法律以及文本内容的网站。我将所有数据(在某些情况下是超过 8000 个字符的文章)存储在 MSSql 2008 数据库中。我读了一些文章,他们说文本数据不应该存储在数据库中。它们应该存放在哪里?在 .txt 文件中还是什么?我也想搜索数据。如果它们存储在数据库中,我可以使用存储过程等。如果存储在文档中,我需要使用像 Lucene 这样的工具。我对吗?我对这个项目使用 DB 的方法是否错误?请赐教。

4

1 回答 1

0

无论您如何看待它,您都将为此项目使用一些描述的数据库,无论是:1)老式的平面文件数据库(txt 文档,不推荐用于大型项目恕我直言)2)传统的文本存储数据库 3) 文档数据库

使用文本数据库还是文档数据库的争论取决于您拥有或可能获得(或获得帮助)的技能/知识。在我看来,您对文本数据库更满意,在我看来,这并没有什么问题 - 最坏的情况是,如果最终真正需要长期使用文档而不是直接存储文本您应该能够从文本数据库自动生成文档 - 我怀疑反向操作会更加棘手(将大量专有文档转换为文本以进行存储和插入)。从文本数据库生成纯文本文件很简单,大多数供应商文档格式都支持导入纯文本文档以进行后续格式化。

对于像这样的大型项目,您确实需要花一些时间考虑您的文档可能用于什么、由谁使用,以及哪些方法最适合它们。如果您要为大量使用 MS Word 并希望下载数据的人提供数据库,您可能需要考虑使用文档数据库。如果只是您想要提供的信息(和基于 Web 的工具),您需要考虑如何操作自己的数据。

显然,这都是意见,但我的最后一个建议是,如果你走文本路线(痛苦的经历),请确保从一开始就使用 utf-8 文本。

于 2012-02-22T12:04:38.540 回答