0

我正在尝试使用 Google API 翻译页面。您一次可以向 Google 发送的数据有 5000 个字符的限制。所以我试图将页面分成 5000 个字符。但是正如您所知道的那样,在执行此操作时,我们必须牢记 HTML 格式不应受到干扰,否则您将无法获得所需的结果。

例如你必须发送这个:

<a href="#" class="myclass">Link</a>

而不是这个:

<a href="#" class="myclas

我可以通过检查“<”这个标志是否出现在“>”这个标志之后,以某种方式解决它(虽然我猜不完美)。如果“<”这个符号出现在“>”之后,那么我会回到我找到“>”的地方并从那里剪断字符串。

无论如何,关键是我仍然有一些关于 HTML 格式的问题,并且想知道如何有效地做到这一点。有没有可用的解析器可以解决这个问题!?

谢谢

4

1 回答 1

0

我有一个非常相似的问题,我必须做一个小的自动翻译,我通过用小东西替换所有 html 表达式来解决它:

<a href="#" class="myclass">Link</a>

将变为 [0]link[0] 并且我将存储 [0] 代表 href.... 要查找 HTML 表达式,您应该使用正则表达式。那次对我有帮助,希望对你也有帮助。

大卫

于 2011-01-28T08:03:36.297 回答