0

我有以下要搜索的字符串集:

1Dept Neurosci,大学。新墨西哥州,阿尔伯克基,NM;2摩尔。和人类基因,贝勒上校医学,休斯敦,德克萨斯;3精神病学,大学。德克萨斯西南医学中心。Ctr.,达拉斯,德克萨斯;4临床。热内特,伊拉斯谟大学。医学。Ctr.,鹿特丹,荷兰;5人类基因,埃默里大学,佐治亚州亚特兰大

上面是一组地址,以数字开头(用于将其链接到人)。需要搜索所有地址为:

1Dept Neurosci,大学。新墨西哥州,阿尔伯克基,NM
2Mol。和 Human Genet., Baylor Col. of Med., Houston,, TX
3Psychiatry, Univ. 德克萨斯西南医学中心。Ctr.,达拉斯,TX
4Clin。热内特,伊拉斯谟大学。医学。Ctr., 鹿特丹, 荷兰
5Human Genet., Emory Univ.Atlanta, GA

我写了下面的正则表达式:

\d\w+,*

它只匹配一个数字后跟一个单词。我该如何修改它。请建议有没有更好的方法。

我怎样才能用(最后一个数字)做同样的事情:

*X。ZHAO1, W. GUO1, AM ALLAN1, R. ZONG2, L. ZHANG1, EB JOHNSON1, EG SCHALLER1, AC MURTHY1, SL GOGGIN1,2, A. EISCH3,4, BA OOSTRA4,5, DL NELSON2,3, P. JIN5 ;

4

2 回答 2

3

根据需要简单regex(以数字开头):

\d+[^\d]+

解释:

\d+                      digits (0-9) 
                         (1 or more times, matching the most amount possible)

[^\d]+                   any character except: digits (0-9) 
                         (1 or more times, matching the most amount possible)

和示例代码:

var strInput = "1Dept Neurosci, The Univ. of New Mexico, ALBUQUERQUE, NM; 2Mol. and Human Genet., Baylor Col. of Med., Houston,, TX; 3Psychiatry, Univ. of Texas Southwestern Med. Ctr., Dallas, TX; 4Clin. Genet., Erasmus Univ. Med. Ctr., Rotterdam, Netherlands; 5Human Genet., Emory Univ., Atlanta, GA";

var adresses = new List<string>();

foreach (Match match in Regex.Matches(strInput, @"\d+[^\d]+"))
{
    adresses.Add(match.Value);
}
于 2012-09-23T09:29:14.483 回答
1

搜索似乎很复杂。我从上面的理解中了解到,字符串会被搜索并返回结果

我是根据以下字符串做的

1Dept Neurosci,大学。新墨西哥州,阿尔伯克基,NM

这是代码片段。

using System;
using System.Text.RegularExpressions;

namespace ConsoleApplication1
{
  class Program
  {
    static void Main(string[] args)
    {
      string txt="1Dept Neurosci, The Univ. of New Mexico, ALBUQUERQUE, NM ";

      string re1="(\\d+)";  // Integer Number 1
      string re2="((?:[a-z][a-z]+))";   // Word 1
      string re3=".*?"; // Non-greedy match on filler
      string re4="((?:[a-z][a-z]+))";   // Word 2
      string re5="(,)"; // Any Single Character 1
      string re6="(.*?),";  // Command Seperated Values 1

      Regex r = new Regex(re1+re2+re3+re4+re5+re6,RegexOptions.IgnoreCase|RegexOptions.Singleline);
      Match m = r.Match(txt);
      if (m.Success)
      {
            String int1=m.Groups[1].ToString();
            String word1=m.Groups[2].ToString();
            String word2=m.Groups[3].ToString();
            String c1=m.Groups[4].ToString();
            String csv1=m.Groups[5].ToString();
            Console.Write("("+int1.ToString()+")"+"("+word1.ToString()+")"+"("+word2.ToString()+")"+"("+c1.ToString()+")"+"("+csv1.ToString()+")"+"\n");
      }
      Console.ReadLine();
    }
  }
}

还有一件事。如果您需要生成正则表达式并搜索它,您可能需要查看这个

请让我知道这可不可以帮你。

编辑

using System;
using System.Text.RegularExpressions;

namespace ConsoleApplication1
{
  class Program
  {
    static void Main(string[] args)
    {
      string txt="X. ZHAO1,";

      string re1="((?:[a-z][a-z0-9_]*))";   // Variable Name 1
      string re2="(\\.)";   // Any Single Character 1
      string re3="(\\s+)";  // White Space 1
      string re4="((?:[a-z][a-z0-9_]*))";   // Variable Name 2
      string re5="(,)"; // Any Single Character 2

      Regex r = new Regex(re1+re2+re3+re4+re5,RegexOptions.IgnoreCase|RegexOptions.Singleline);
      Match m = r.Match(txt);
      if (m.Success)
      {
            String var1=m.Groups[1].ToString();
            String c1=m.Groups[2].ToString();
            String ws1=m.Groups[3].ToString();
            String var2=m.Groups[4].ToString();
            String c2=m.Groups[5].ToString();
            Console.Write("("+var1.ToString()+")"+"("+c1.ToString()+")"+"("+ws1.ToString()+")"+"("+var2.ToString()+")"+"("+c2.ToString()+")"+"\n");
      }
      Console.ReadLine();
    }
  }
}
于 2012-09-23T10:07:38.433 回答