我正在尝试使用 Google API 翻译页面。您一次可以向 Google 发送的数据有 5000 个字符的限制。所以我试图将页面分成 5000 个字符。但是正如您所知道的那样,在执行此操作时,我们必须牢记 HTML 格式不应受到干扰,否则您将无法获得所需的结果。
例如你必须发送这个:
<a href="#" class="myclass">Link</a>
而不是这个:
<a href="#" class="myclas
我可以通过检查“<”这个标志是否出现在“>”这个标志之后,以某种方式解决它(虽然我猜不完美)。如果“<”这个符号出现在“>”之后,那么我会回到我找到“>”的地方并从那里剪断字符串。
无论如何,关键是我仍然有一些关于 HTML 格式的问题,并且想知道如何有效地做到这一点。有没有可用的解析器可以解决这个问题!?
谢谢