如何在很长的文本中只保留前 1000 次出现的单词并丢弃后面的所有内容。
例如:
Sentence 1[ss]Sentence 2[ss]Sentence 3[ss]Sentence 4[ss]...Sentence 999[ss]Sentence 1000[ss]Sentence 1001[ss]Sentence 1002[ss]
注意:[ss] 是我自定义的分隔符。
我想保留Sentence 1[ss]Sentence 2[ss]...Sentence 1000[ss]
。换句话说,我想保留一切(包括 [ss])直到Sentence 1000[ss]
并丢弃后面的所有内容Sentence 1000[ss]
。