-3

我必须创建可以比较数千个大文本(彼此)的脚本。我想知道 MySQL 是否是最好的解决方案。有没有其他免费的数据库系统可以用来做简单但耗时的计算?

请把我扔进你的知识池!

编辑:文档的性质 - 500-7000 个字符的文档,-> 如果文本与其他文档匹配(抄袭)和统计数据,则比较文档 -> 找到具有类似设置的任何句子的百分比匹配我想设置多少个字符另一个字符串可能不同,仍被视为匹配项..

技术应该是基于服务器的,我对 DB 更感兴趣,然后我会选择合适的语言来编写脚本。

更多规范:数据库的大小必须是无限的。

4

6 回答 6

2

您应该考虑使用 Lucene。它允许您存储大量文本并快速查询它们。具有良好的相关性匹配。

于 2008-10-14T21:12:18.583 回答
1

你没有提到你将使用的技术;文本条目的大小或比较的性质。但是,我建立的h2 数据库非常出色。它是本机 Java,可用作内存数据库,使设置变得简单。

于 2008-10-14T20:50:45.867 回答
1

PostgreSql 是一个免费的数据库引擎,除了 MySQL 之外,它具有良好的可扩展性和广泛使用。

于 2008-10-14T20:52:31.213 回答
0

Sql 服务器快递

于 2008-10-14T20:45:10.900 回答
0

我会推荐MySQL。它有很多内置的字符串处理函数。

于 2008-10-14T21:10:28.650 回答
0

因为你没有指定,为什么不SQL Server 2008 Express Edition

大哥 SQL Server 2008 的所有搜索功能,唯一的问题是不能超过 4Gb 的数据库。

于 2008-10-14T21:19:49.117 回答