0

我在 SQL Server 表中存储了许多二进制文件。我在该表上创建了一个全文索引,该索引还索引包含文档的二进制字段。我安装了适当的 iFilter,以便 SQL Server 也可以读取 .doc、.docx 和 .pdf 文件。

使用函数 DATALENGTH 我可以检索完整文档的长度/大小,但这也包括布局和其他无用信息。我想知道文件文本的长度。

使用 iFilters SQL Server 只能检索此类“复杂”文档的文本,但它也可以用于确定文本的长度吗?

4

1 回答 1

0

据我所知(不多),没有办法通过 FTS 查询文档属性。我会在将文档插入数据库之前获取字数,然后将字数连同它一起插入表中的另一列。对于 Word 文档,可以使用 Document.Words.Count 属性;我不知道 PDF 文档的等效机制是什么。

于 2011-08-01T09:13:23.537 回答