1

任何人都可以帮助我从谷歌网页读取数据。例如:我想使用 Java 阅读链接、链接下方的作者姓名以及右侧的 PDF 或 HTML 链接到我的数据库。

请在此处找到链接:

http://scholar.google.com/scholar?hl=en&q=visualization&btnG=&as_sdt=1%2C4&as_sdtp=

4

1 回答 1

0

你问的是所谓的数据提取。您需要加载 HTML 页面,然后从 HTML 中逻辑地选择信息片段。

首先使用 HTML 解析器读取 HTML 页面,然后寻找 Google 如何布置其学术链接的模式。您可能会发现事物列在无序列表中,或者某些元素可能具有可用于提取所需数据的标识标签或类。

于 2013-10-30T06:43:21.807 回答