我需要这样的 utf-8 文本:
“Bára, ta která má hezké oči. To je, ale nepříčetně nehorázné!”
拆分为单词和标点数组,如下所示:
Array (
[0] => Bára
[1] => ,
[2] => ta
[3] => která
[4] => má
[5] => hezké
[6] => oči
[7] => .
[8] => To
[9] => je
[10] => ,
[11] => ale
...
)
我在这里尝试了一些示例,但都不适用于 utf8 文本(á 或 ě 上的拆分文本)。