-3

我想建立一个基于现有材料(PDF、PPT、Word文档...等)的动态课程内容系统

我的基本要求是semantic search在这些文件中提取内容。

我询问要在我的系统中使用的 .net 库或 API。

Kngine , WordNet , Terrier , jatetoolkit

4

3 回答 3

2

SQL Server 2012 具有语义搜索和全文搜索的新功能,全文搜索也进行了相应改进。它可能会或可能不会满足您的要求,但绝对值得一看。
这是您可以从以下示例开始的示例: http: //svenaelterman.wordpress.com/2012/04/14/step-by-step-enabling-semantic-search-on-sql-server-2012/

于 2013-06-16T14:14:54.240 回答
1

我知道商业 dtSearch的界面可以让您使用“语义搜索”或“同义词搜索”进行索引和搜索,也可以使用拼音等。dtSearch 使用 WordNet 库。

dtSearch 功能非常强大,在一个 dll 中提供完整的引擎,可以搜索模糊、同义词/概念/词库、布尔、短语、通配符、邻近、词干、数字范围、自然语言等...

可以直接索引 PDF、Word 和大多数已知文档。

现在,如果您创建自定义索引器,您可以下载 WordNet数据库并使用它。
对于您的用户搜索的每个词,您可以使用 WordNet 数据库和词库找到相关词。

于 2013-06-16T18:43:51.660 回答
1

看看 Lucene.Net...有点学习曲线,但应该做得很好。我目前正在迁移到这个平台并远离 SQL 2012。

于 2013-06-18T20:41:05.520 回答