我有一个非常大的数据库,有数十亿字。我需要在这些词中进行搜索,我知道的最快方法是使用 SQL SERVER 2008 附带的 iFTS。
数据是土耳其语。我的意思是数据的语言是土耳其语。SQL SERVER 2008 可以毫无问题地处理全文搜索,即使在土耳其语中也是如此。
但是,当我尝试按此处所述列出全文单词时,就会出现问题:http ://technet.microsoft.com/en-us/library/cc280900.aspx
从sys.dm_fts_index_keywords返回的单词列是keyword和display_term。但是这些列的字符集不正确。例如,土耳其字符集中同时存在 ı 和 i。类似地 o 和 ö、g 和 ğ。但是返回的单词是 ascii 编码的。像kör以kor形式返回,而 için 以icin形式返回。
但是当我进行 CONTAINS 搜索时,SQL Server 匹配搜索词正确返回真实结果。我的意思是用kör和kor搜索会返回不同的结果,这是真正的行为。
所以我需要获取存储在 SQL 中的单词,而不是它们的 ascii 表示形式。
我希望我能解释我的问题。