我想让 MySQL 全文搜索与日文和中文文本以及任何其他语言一起工作。问题是这些语言以及可能的其他语言通常在单词之间没有空格。当您必须键入与文本中相同的句子时,搜索就没有用了。
我不能只在每个字符之间留一个空格,因为英语也必须工作。我想用 PHP 或 MySQL 解决这个问题。
我可以配置 MySQL 来识别应该是它们自己的索引单元的字符吗?是否有可以识别这些字符的 PHP 模块,所以我可以在它们周围放置空格作为索引?
更新
部分解决方案:
$string_with_spaces =
preg_replace( "/[".json_decode('"\u4e00"')."-".json_decode('"\uface"')."]/",
" $0 ", $string_without_spaces );
这使得至少有一些我需要特别对待的字符组成了一个字符类。我可能应该提一下,对索引文本进行调整是可以接受的。
有谁知道我需要在周围插入空格的所有字符范围?
此外,必须有更好的、可移植的方式来表示 PHP 中的这些字符吗?Literal Unicode 中的源代码并不理想;我不会认出所有的字符;它们可能无法在我必须使用的所有机器上渲染。