在不久的将来的某个时候,我将需要实现跨语言字数统计,或者如果这不可能,跨语言字符数统计。
字数是指对给定文本中包含的单词的准确计数,采用文本的语言。文本的语言由用户设置,并将被假定为正确的。
字符计数是指给定文本中包含的“可能在一个单词中”字符的计数,具有上述相同的语言信息。
我更喜欢前者,但我知道所涉及的困难。我也知道后者的计数要容易得多,但如果可能的话,我更喜欢前者。
如果我只需要看英语,我会很高兴,但我需要考虑这里的每一种语言,中文、韩语、英语、阿拉伯语、印地语等等。
我想知道 Stack Overflow 是否有关于从哪里开始寻找现有产品/方法以在 PHP 中执行此操作的任何线索,因为我是一个优秀的懒惰程序员*
一个简单的测试显示 str_word_count 与 set_locale 如何不起作用,以及 php.net 的 str_word_count 页面中的一个函数。