postgresql - 集群数据库中的文本文档

Question

我确实在 PostgreSQL 数据库中加载了 20.000 个文本文件，一行中的一个文件，全部存储在以docs列doc_id和doc_content.

我知道大约有 8 种类型的文档。以下是我的问题：

我可能可以使用 some like '%%'or SIMILAR TO，但可能有更好的方法。

score 1 · Accepted Answer

您应该使用全文搜索，它是 PostgreSQL 9.x 核心（又名 Tsearch2）的一部分。

对于某种最长公共子串的度量（或相似性，如果你愿意的话），你也许可以使用levenshtein()函数 -fuzzystrmatch扩展的一部分。

score 0 · Accepted Answer

2 回答 2