我正在构建一个下载句子并解析它们以进行文字游戏的应用程序。我事先不知道文本将包含哪些标点符号。
我希望能够拆分句子,检查它们的词性标签,如果找到正确的标签,将其替换为" "
,然后按顺序重新加入它们。
text = "some string, with punctuation- for example: things I don't know about, that may or may not have whitespaces and random characters % !!"
如何将它拆分为一个数组,以便我可以将解析器传递给每个单词,然后按顺序重新加入它们,记住string.split(//)
似乎需要知道我在寻找什么标点符号?