我想将文本分成句子。我的文字包含\n介于两者之间的字符。我希望在\n和.(点)处进行拆分。我不能将BreakIterator其用作拆分条件,因为它是一个空格,后跟一个句点(在我要拆分的文本中,这不是必需的)。
示例:
i am a java programmer.i like coding in java. pi is 3.14\n regex not working
应该输出:
['i am a java programmer', 'i like coding in java', 'pi is 3.14', 'regex not working']
我尝试了一个简单的正则表达式,它在\nor上拆分.:
[\\\\n\\.]
虽然这不起作用,但单独指定有效。
\\\\n
\\.
那么任何人都可以给出一个将分裂的正则表达式\n吗.?
另一个问题是我不想在像5.6这样的小数的情况下进行拆分。