5

我正在尝试根据每个字符串中的单词数过滤字符串列表。我假设您将修剪字符串末尾的任何空格,然后计算字符串中剩余的空格数,这样 WordCount = NumberOfSpaces + 1。这是最有效的方法吗?我知道对于基于字符数的过滤,以下工作正常......只是无法弄清楚如何使用 C#/LINQ 简洁地编写它。

if (checkBox_MinMaxChars.Checked)
{
    int minChar = int.Parse(numeric_MinChars.Text);
    int maxChar = int.Parse(numeric_MaxChars.Text);

    myList = myList.Where(x => 
                              x.Length >= minChar && 
                              x.Length <= maxChar).ToList();
}

计算单词的任何想法?

更新:这就像一个魅力......谢谢马修:

int minWords = int.Parse(numeric_MinWords.Text);
int maxWords = int.Parse(numeric_MaxWords.Text);

sortBox1 = sortBox1.Where(x => x.Trim().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries).Count() >= minWords &&
                               x.Trim().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries).Count() <= maxWords).ToList();
4

4 回答 4

8

我会以更简化的方式处理它,因为您已经指出可以可靠地使用空格作为分隔符,如下所示:

var str = "     the string to split and count        ";
var wordCount = str.Trim().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries).Count();

编辑:

如果需要最佳性能并且内存使用是一个问题,您可以编写自己的方法和利用IndexOf()(尽管有很多途径可以解决这样的问题,但我更喜欢重用而不是从头开始代码设计):

    public int WordCount(string s) {
        const int DONE = -1;
        var wordCount = 0;
        var index = 0;
        var str = s.Trim();
        while (index != DONE) {
            wordCount++;
            index = str.IndexOf(" ", index + 1);
        }
        return wordCount;
    }
于 2012-12-19T07:45:10.497 回答
3

你计算单词的方法是可以的。String.Split将为更多的内存使用提供类似的结果。

不仅仅是实现您的int WordCount(string text)功能并将其传递给 Where:

myList.Where(s => WordCount(s) > minWordCount)
于 2012-12-19T07:45:41.310 回答
1

如何使用空间将字符串拆分为数组并计算它?

s.Split().Count()

删除了空间:)

于 2012-12-19T07:45:23.590 回答
1

您想要在给定范围内具有字数的所有字符串吗?

int minCount = 10;
int maxCount = 15;
IEnumerable<string> result = list
    .Select(String => new { String, Words = String.Split() })
    .Where(x => x.Words.Length >= minCount
             && x.Words.Length <= maxCount)
    .Select(x => x.String);
于 2012-12-19T08:01:57.040 回答