2

我有一个非常大的数据库,有数十亿字。我需要在这些词中进行搜索,我知道的最快方法是使用 SQL SERVER 2008 附带的 iFTS。

数据是土耳其语。我的意思是数据的语言是土耳其语。SQL SERVER 2008 可以毫无问题地处理全文搜索,即使在土耳其语中也是如此。

但是,当我尝试按此处所述列出全文单词时,就会出现问题:http ://technet.microsoft.com/en-us/library/cc280900.aspx

sys.dm_fts_index_keywords返回的单词列是keyworddisplay_term。但是这些列的字符集不正确。例如,土耳其字符集中同时存在 ı 和 i。类似地 o 和 ö、g 和 ğ。但是返回的单词是 ascii 编码的。像körkor形式返回,而 için 以icin形式返回

但是当我进行 CONTAINS 搜索时,SQL Server 匹配搜索词正确返回真实结果。我的意思是用körkor搜索会返回不同的结果,这是真正的行为。

所以我需要获取存储在 SQL 中的单词,而不是它们的 ascii 表示形式。

我希望我能解释我的问题。

4

1 回答 1

2

似乎这已在 SQL 2012 中修复...在 SQL 2012 中,查询 sys.dm_fts_index_keywords 返回的列、关键字和显示项;现在正在返回正确的土耳其语单词...

于 2012-11-20T14:54:28.457 回答