5

我遇到了麻烦pexpect。我正在尝试获取tralics读取乳胶方程的输出并发出 MathML 表示,如下所示:

1 ~/ % tralics --interactivemath
This is tralics 2.14.5, a LaTeX to XML translator, running on tlocal
Copyright INRIA/MIAOU/APICS/MARELLE 2002-2012, Jos\'e Grimm
Licensed under the CeCILL Free Software Licensing Agreement
Starting translation of file texput.tex.
No configuration file.
> $x+y=z$
<formula type='inline'><math xmlns='http://www.w3.org/1998/Math/MathML'><mrow><mi>x</mi>   <mo>+</mo><mi>y</mi><mo>=</mo><mi>z</mi></mrow></math></formula>
> 

所以我尝试使用 pexpect 得到公式:

import pexpect
c = pexpect.spawn('tralics --interactivemath')
c.expect('>')
c.sendline('$x+y=z$')
s = c.read_nonblocking(size=2000)
print s

输出有公式,但开头是原始输入,最后是一些控制字符:

"x+y=z$\r\n<formula type='inline'><math xmlns='http://www.w3.org/1998/Math/MathML'><mrow><mi>x</mi><mo>+</mo><mi>y</mi><mo>=</mo><mi>z</mi></mrow></math></formula>\r\n\r> \x1b[K"

我可以清理输出字符串,但我必须缺少一些基本的东西。有没有更简洁的方法来获取 MathML?

4

1 回答 1

5

据我了解,您正试图从 pexpect 获得此信息:

<formula type='inline'><math xmlns='http://www.w3.org/1998/Math/MathML'><mrow><mi>x</mi>   <mo>+</mo><mi>y</mi><mo>=</mo><mi>z</mi></mrow></math></formula>

您可以使用正则表达式而不是“>”进行匹配,以获得预期的结果。这是最简单的例子:

c.expect("<formula.*formula>");

之后,您可以通过调用 pexpect 的 match 属性来访问匹配的字符串:

print c.match

您也可以尝试不同的正则表达式,因为我发布的那个是一个贪婪的,如果公式很大,它可能会阻碍您的执行时间。

于 2012-10-10T18:50:39.357 回答