0

在 webspiders/crawlers 中,如何获取用户在 HTML 文档中看到的字体的实际初始渲染大小,同时牢记 CSS。

4

2 回答 2

3

渲染文本大小?用户可以使用他/她的浏览器设置随意更改文本大小。更不用说不同的浏览器呈现相同的内容略有不同。

于 2009-06-19T20:59:45.867 回答
0

如果您对“默认”的答案感到满意,没有为此目的的用户自定义视图(这似乎很可能),我相信您正在寻找一个相当痛苦的场景:

  • 在你的蜘蛛中嵌入一个支持 CSS 的渲染引擎。更喜欢使用与大多数用户匹配的引擎,或者使用所有三个常见引擎并为所有用户存储信息。嵌入的难易程度因您的消费技术而异。

  • 在渲染引擎中加载被爬取的 URI。

  • 使用引擎的 API,查询包含您认为具有代表性的文本的元素的字体度量(选择这是一个练习,我什至不会开始预测策略)。您如何访问它将完全取决于您的引擎的嵌入方案。

我希望这是“艰难的方式”,但我不确定是否有“简单”的方式。

于 2009-06-19T21:30:58.627 回答