8

给定一个正则表达式,我想生成随机数据 x 次数来测试某些东西。

例如

>>> print generate_date('\d{2,3}')
13
>>> print generate_date('\d{2,3}')
422

当然,目标是做一些比电话号码和电子邮件地址更复杂的事情。

这样的事情存在吗?如果有,它是否存在于 Python 中?如果没有,我可以用什么线索/理论来做到这一点?

4

3 回答 3

8

Pyparsing 包括这个正则表达式反转器,它返回简单正则表达式的所有排列的生成器。以下是该模块的一些测试用例:

[A-C]{2}\d{2}
@|TH[12]
@(@|TH[12])?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))?
(([ECMP]|HA|AK)[SD]|HS)T
[A-CV]{2}
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr]
(a|b)|(x|y)

编辑:

要进行随机选择,请创建一个排列列表(一次!),然后random.choice每次需要与正则表达式匹配的随机字符串时调用该列表,如下所示(未经测试):

class RandomString(object):
    def __init__(self, regex):
        self.possible_strings = list(invRegex.invert(regex))
    def random_string(self):
        return random.choice(self.possible_strings)
于 2010-08-13T13:59:47.637 回答
2

Python 邮件列表上有一篇关于生成正则表达式所有排列的模块的帖子。不过,我不太确定您将如何进行随机化。我会继续检查。

于 2010-08-13T13:43:43.477 回答
1

我可能会因为提出这个建议而受到鞭笞,但是 perl 有一个模块可以做到这一点。您可能想看一下如何在 python 中实现它的代码:

http://p3rl.org/String::随机

于 2010-08-13T13:44:19.157 回答