我想实现一个可以执行“基于视觉的页面分割”的程序。我需要一些指导和线索。(我需要实用信息,而不仅仅是学术信息)
我的首选语言是 JS (jQuery) 和 PHP。
我阅读了以下文章(VIPS:一种基于视觉的页面分割算法),我认为它可以成为一个很好的框架:
ftp://ftp.research.microsoft.com/pub/tr/tr-2003-79.pdf
“基于视觉的页面分割”是否有任何开源实现?
我想实现一个可以执行“基于视觉的页面分割”的程序。我需要一些指导和线索。(我需要实用信息,而不仅仅是学术信息)
我的首选语言是 JS (jQuery) 和 PHP。
我阅读了以下文章(VIPS:一种基于视觉的页面分割算法),我认为它可以成为一个很好的框架:
ftp://ftp.research.microsoft.com/pub/tr/tr-2003-79.pdf
“基于视觉的页面分割”是否有任何开源实现?
否。Microsoft 已授予基于视觉的文档分割 (VIPS) 的专利。2023 年再试一次。我真的很抱歉。
我不是专利律师,但美国专利 7,428,700的权利要求非常简单:
- 一种至少部分地由计算设备实施的识别由具有多个节点的树结构描述的文档的一个或多个部分的方法,该方法包括: 至少基于,识别文档中的多个可视块:文件的文件模型;与多个视觉块不同,至少基于多个视觉块中的至少一个的一个或多个特征来检测文档的一个或多个分隔符;为一个或多个分隔符中的每一个分配一个权重,该权重基于分隔符任一侧的视觉块的特征;以及至少部分地基于多个视觉块和一个或多个分隔符来构造文档的内容结构,
现在,由具有多个节点的树结构描述的文档是我们的老朋友网页的 DOM 模型。
另请注意,这四位发明人也是所引用论文的四位共同作者。如果这纯粹是巧合,我该死。