javascript - 如何使用 javascript 处理大型 html 文本页面？

Question

我有一个巨大的（大约 20mB）html 页面，它只是纯文本。它是在服务器上运行的某些代码的日志文件。现在，我正在尝试编写一个 chrome 插件，当有人打开它时自动解析这个页面，并根据我在某些地方的需要添加适当的链接。

页面看起来像这样

<html><head></head><body><pre> 20mB of pure text </pre></body></html>

所以，有两个问题，第二个取决于第一个，这对我有帮助。（到目前为止，我一直在使用纯 JavaScript。还没有库。）

1）如何解析页面？2）前3-4行有一些信息。如何轻松获取前几行并从中获取数据（如果解析整个页面并不容易）？

score 0 · Accepted Answer

您要解析页面的目的是什么，您是在创建摘要吗？

对于初学者，您可以通过将 id 添加到 pre 标记并执行以下操作来获取前 4 行：

var first4Lines = document.getElementById("theIdTagOfThePre").innerHTML.split("\n",4); 如果这不起作用，您必须将 '\n' 切换为 '\r\n'。

1 回答 1