嗨,我正在向 zend_lucene_search 提供上下文,它可以搜索到特殊字符的单词,之后就无法搜索了。
例如:
very well to the other job boards � one of the main things that has impressed is the variety of the applications, especially with regards to the background of the candidates" manoj � Head
如果我搜索“板”,我可以得到它,但如果我在不可读的字符之后搜索一个或任何字符串,我就无法搜索它。
如何删除这些,我想得到纯文本。
我在将 .docx/pdf 文件转换为文本时得到了这些字符。
或者
让我知道如何只向 zend_search_lucene 提供文本。
请帮忙。