0

我有一个巨大的(大约 20mB)html 页面,它只是纯文本。它是在服务器上运行的某些代码的日志文件。现在,我正在尝试编写一个 chrome 插件,当有人打开它时自动解析这个页面,并根据我在某些地方的需要添加适当的链接。

页面看起来像这样

<html><head></head><body><pre> 20mB of pure text </pre></body></html>

所以,有两个问题,第二个取决于第一个,这对我有帮助。(到目前为止,我一直在使用纯 JavaScript。还没有库。)

1)如何解析页面?2)前3-4行有一些信息。如何轻松获取前几行并从中获取数据(如果解析整个页面并不容易)?

4

1 回答 1

0

您要解析页面的目的是什么,您是在创建摘要吗?

对于初学者,您可以通过将 id 添加到 pre 标记并执行以下操作来获取前 4 行:

var first4Lines = document.getElementById("theIdTagOfThePre").innerHTML.split("\n",4); 如果这不起作用,您必须将 '\n' 切换为 '\r\n'。

于 2012-06-27T18:13:20.093 回答