我有一个巨大的(大约 20mB)html 页面,它只是纯文本。它是在服务器上运行的某些代码的日志文件。现在,我正在尝试编写一个 chrome 插件,当有人打开它时自动解析这个页面,并根据我在某些地方的需要添加适当的链接。
页面看起来像这样
<html><head></head><body><pre> 20mB of pure text </pre></body></html>
所以,有两个问题,第二个取决于第一个,这对我有帮助。(到目前为止,我一直在使用纯 JavaScript。还没有库。)
1)如何解析页面?2)前3-4行有一些信息。如何轻松获取前几行并从中获取数据(如果解析整个页面并不容易)?