0

有没有办法从 PHP 中的 microsoft onenote 文档中提取文本?我尝试使用正则表达式来匹配超过 3 个字符的单词,但我仍然得到垃圾字符串(即 yaKmUrD)。有没有办法只提取有意义的文本?

谢谢,克里斯

编辑:我找到了一种提取大部分文本的方法。(我只是使用正则表达式删除所有非 ascii 字符并过滤掉少于 4 个字符的数字或单词。它并不完美,但它适用于创建关键字字符串。)现在我有一个包含文件名列和文本列的表包含文档的文本。在存储到文本列之前,对数据进行了重复过滤,并且“关键字”已用逗号分隔。我现在正在寻找一种简单的方法来比较每个文件的这些文本字段并输出 % 匹配。在 mysql 中是否有执行此操作的函数/方法,或者我必须通过脚本以编程方式执行此操作?谢谢您的帮助。

4

0 回答 0