0

任务是根据对每个部分设置的各种限制将给定的文本字符串分组为部分。假设我们有一个字符串 S,它是“Lorem ipsum dolorem”。我们也有 3 个部分。每个部分都有限制,可以限制该部分中的文本数量。这些限制可以根据字符数或字数来指定。例如,第一部分最少可以有 5 个字符,最多可以有 10 个字符。第二部分最少可以包含一个单词,最多可以包含五个单词,每个单词的长度在 2 到 10 个字符之间。第三部分可以具有与第一部分相同的限制。

我们需要使用所有可用的文本,否则没有分组解决方案。单词不能分开(所以我们不能在分组时将一个单词分成多个部分。)如果我们在分组中将句子放在一起,所有其他条件都相同,则解决方案会更好。

对文本进行分组的最有效方法是什么?

4

1 回答 1

0

If you only count characters/numbers and words, it is a case for regular expressions: http://en.wikipedia.org/wiki/Regular_expressions

EDIT

E.g., consider the following:

 sed -E -e 's/([a-z]{2,10}) (([a-z]{2,4} ){1,2})([a-z]{2,10})/G:\1 G:\2
 G:\4/'

If one applies this to "aaa bb bbbb ccccc", one gets:

 G:aaa G:bb bbbb  G:ccccc
于 2012-04-05T06:04:29.187 回答