我想将文本分成句子。我的文字包含\n
介于两者之间的字符。我希望在\n
和.
(点)处进行拆分。我不能将BreakIterator
其用作拆分条件,因为它是一个空格,后跟一个句点(在我要拆分的文本中,这不是必需的)。
示例:
i am a java programmer.i like coding in java. pi is 3.14\n regex not working
应该输出:
['i am a java programmer', 'i like coding in java', 'pi is 3.14', 'regex not working']
我尝试了一个简单的正则表达式,它在\n
or上拆分.
:
[\\\\n\\.]
虽然这不起作用,但单独指定有效。
\\\\n
\\.
那么任何人都可以给出一个将分裂的正则表达式\n
吗.
?
另一个问题是我不想在像5.6这样的小数的情况下进行拆分。