1

我知道已经有一些关于正则表达式和长字符串的堆栈溢出错误的帖子,但它们没有帮助我,也从不关心我的解析问题类型。

我只是尝试从数学函数中找到括号中的字符串,例如

 funktionsstring  
  =SIN(3.141592653589793238462643383279502884197169399375105820974944592307816406
   286208998628034825342117067982148086513282306647093844609550582231725359408
   12848111745028410270193852110555964462294895493038196);

使用以下带有模式的代码来查找括号中的字符串 x,例如。( X ) :

Pattern pattern = Pattern.compile("\\([^(]*?\\)");
Matcher matcher = pattern.matcher(funktionsstring);

我收到以下错误

    Exception in thread "AWT-EventQueue-0" java.lang.StackOverflowError
at java.util.regex.Pattern.bitsOrSingle(Pattern.java:2553)
at java.util.regex.Pattern.range(Pattern.java:2601)
at java.util.regex.Pattern.clazz(Pattern.java:2507)
at java.util.regex.Pattern.sequence(Pattern.java:2030)
at java.util.regex.Pattern.expr(Pattern.java:1964)
at java.util.regex.Pattern.compile(Pattern.java:1665)
at java.util.regex.Pattern.<init>(Pattern.java:1337)
at java.util.regex.Pattern.compile(Pattern.java:1022)
at classes.Parser.Klammerauswertung(Parser.java:104)
at classes.Parser.Klammerauswertung(Parser.java:119)
at classes.Parser.Klammerauswertung(Parser.java:119)

我不知道是否可以以某种方式改进模式以防止似乎导致堆栈溢出的迭代。显然 split 函数在这里不起作用。

另外 - 由于字符串很长 - 我想允许 n\ 作为字符。出于科学原因,我想通常使用大十进制数(使用 apfloat)来获得至少大约 100 到 1000 个精确的小数,是否可以保持正则表达式改变模式?

如果没有,我该如何重写正则表达式?

有没有更好的工具?

4

1 回答 1

2
 SIN\((\d+\.?\d*)\)

正则表达式可视化

在 Debuggex 上实时编辑

我进行了编辑以允许带小数的数字。而不是随机.数和数字。

(?:SIN|COS|TAN)\(([-]?\d+\.?\d*\^?\d*)\)

正则表达式可视化

在 Debuggex 上实时编辑

这允许函数 sin、cos 或 tan 用于添加更多函数,只需|{functionname}在开头添加 a。此外,它可以是带有指数的负值。

或者你可以有

.+\(([-]?\d+\.?\d*\^?\d*)\)

正则表达式可视化

在 Debuggex 上实时编辑

这将允许任何东西在前面()

我不太明白你想要* - /什么,我建议你为每个函数制作单独的正则表达式,这样你就可以以不同的方式处理它们。

于 2013-09-11T19:53:24.807 回答