我需要实现一个VIPS算法,它是基于视觉的网页分割。所以,我需要一个工具来呈现一个 html 页面。以下是我的要求:
我想知道 html 页面中任何字符的颜色。
对于html中的任何标签,如果它有可以在浏览器上显示的内容,我想知道内容的位置,即浏览器上的起始坐标和结束坐标。
因为所有页面都是通过我的爬虫下载的。Webkit 是否能够处理存储为本地文件的页面?
我的项目是用 Java 开发的。webkit的哪个端口合适?
http://weblogs.java.net/blog/ixmal/archive/2008/05/introducing_jwe.html 在这个链接上说:“WebKit 架构由两个相当的部分组成。第一个是跨平台的,它负责解析文档,生成 DOM,支持 JavaScript。另一部分,平台相关,所谓的“端口”,用于与网络通信,在屏幕和其他设备上渲染图形内容,事件处理和其他功能。是一个 Java 端口,其中所有跨平台调用都是用 Java 实现的。” 基于此,看起来第二部分对我来说毫无用处,第一部分可以满足我的所有要求,我可以只使用第一部分吗?
谁能帮我?如果可能的话,请给我一些示例代码,因为我找不到任何关于如何使用 webkit 的文档。谢谢!
为我糟糕的英语道歉!</p>