现在这是一个棘手的问题,我无法找到一个好的解决方案。假设我们在 Java 中有一个字符串:- “他今天吃了 3 个苹果。” 现在可以使用 isNumeric 函数或使用正则表达式在 Java 中轻松识别数字 3。但是如果我有一个像这样的字符串:“他今天吃了三个苹果。”怎么办?我怎样才能确定这三个实际上是一个数字?我使用了 OpenNlp 并使用了它的 POS 标记器,但它所花费的时间真的太多了!谁能为此提出更好的解决方案?同样在OpenNlp的“.bin”中,有一个文件——“num.bin”,但我不知道如何使用这个文件。OpenNlp 文档对此也只字未提。谁能告诉我这是否正是我一直在寻找的,如果是,那么如何使用它。
/ * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * *** ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * **/我这里的时间其实很短,所以我在这里解决了一个临时解决方案。制作一个文件/字典并获取哈希表中的所有条目。然后我将标记我的句子并逐字检查数字,类似于你们建议的。我会在需要时继续更新文件。感谢您的宝贵建议,如果您有比这更好的东西,我会很高兴。OpenNlp 以一种非常好的方式实现了这一点,唯一的问题是时间复杂性,我希望在尽可能短的时间内完成此操作。