1

我有一个处理英文和中文内容的搜索索引。所有文档都由 Solr.NET 导入 SOLR

当我从浏览器(localhost:8389/solr/...)搜索中文内容时,一切正常,但是当我使用 Solr.NET 执行搜索时,我得到 0 hit :(

我试图设置一个记录器来查看浏览器搜索和 Solr.NET 搜索之间的区别,但我得到的是问号 (??????) 而不是中文字符。

任何帮助将不胜感激!

4

1 回答 1

0

使用您的浏览器而不是 Notepad++ 打开 solr0.log,以确保这是一个真正的问题,并找出文件保存为哪种编码 - 如果它不是 Unicode,则 Solr.NET 可能无法搜索它。

众所周知,Notepad++ 会出现中文问题,这可能是因为编码(Notepad++ 不支持典型的中文编码,如 gb 或 big5),也可能是因为默认字体可能支持也可能不支持中文字符。浏览器更宽容,为了正确显示文件会做任何事情。实际上,要将非unicode亚洲编码转换为unicode,我经常在浏览器中打开一个文件,它会检测到正确的编码并显示原始内容,然后CTRL+A CTRL+C CTRL+V 一切进入编辑器,保存作为UTF-8,完成。

于 2012-09-26T14:53:26.957 回答