0

谷歌通过抓取下载整个页面,然后抓取一些数据来创建索引,如标题、元标记?

谷歌从页面中提取的其他数据点是什么?

4

1 回答 1

0

从谷歌创始人的这篇古老而经典的论文中:

系统功能包括:

  • 超链接(用于计算 pagerank)
  • 锚文本
  • 视觉呈现细节,例如单词的字体大小
  • 存储库中提供了页面的完整原始 HTML

有关信息检索目的处理的更多信息,另请参阅此内容。

于 2012-11-03T01:40:16.953 回答