1

我有一个 PDF 文件,我使用在线工具将其转换为 .txt。现在我想解析其中的数据并使用正则表达式对其进行拆分。我快完成了,但停留在 1 点。

数据示例如下:

00 41 53 Bid Form – Design/Build (Single-Prime Contract)

27 05 13.23 T1 Services

我想像这样拆分它:00 41 53 Bid Form – Design/Build (Single-Prime Contract)而其他的是27 05 13.23 T1 Services

我正在使用的正则表达式是[0-9](\d|\ |\.)*(\D)*

它可以有带空格和/或点的数字,然后是可以是(字母、点、逗号、、、、和(数字)的文本。)-

如果字符串中有数字(如上面的“T1 服务”),我无法匹配该字符串。

4

2 回答 2

2

如果我理解正确,您正在尝试按换行符拆分。这是在 C# 中。

string[] Result = Regex.Split(inputText, "[\r\n]+");
于 2013-04-12T04:16:51.163 回答
0

你也可以不使用正则表达式来做到这一点:

string phrase = ".......\n,,,,.ll..\r\n....";
string[] words;

words = phrase.Split(new string []{"\n","\r"}), StringSplitOptions.RemoveEmptyEntries);

如果您只想要正则表达式,请使用@mhasan 解决方案。

于 2013-04-12T05:29:23.813 回答