2

嘿伙计。我正在寻找一些正则表达式来帮助从自由格式文本(a la Gmail)中获取街道地址和电话号码。

给定一些文字:"John, I went to the store today, and it was awesome! Did you hear that they moved to 500 Green St.? ... Give me a call at +14252425424 when you get a chance."

我希望能够退出:

500 Green St.(识别为街道地址)

+14252425424(识别为电话号码)

使这个问题更容易的是我不关心解析被拉出的文本。也就是说,我不在乎那Green是道路的名称还是425区号。我只想获取“看起来像”地址或电话号码的字符串。

不幸的是,这需要尽可能在国际上发挥作用。

有人有线索吗?谢谢!

4

3 回答 3

1

电话号码只要你有所有国家代码和数字格式的列表很容易,街道地址我不知道,我能给你的唯一建议是验证每组单词@addressdoctor.com

于 2009-08-13T11:04:56.213 回答
1

您可以尝试一下 RecogniContact (-> address-parser.com ),它可以识别邮政地址和电话号码。

于 2010-06-09T09:12:11.573 回答
0

看看Dive Into Python 的第 7 章。它涉及电话号码和街道地址。我相信你可以以此为起点。国际部分似乎很难。我建议你建立一个初稿,在几个地方尝试,迭代和改进。

于 2009-05-22T21:34:40.850 回答