我有一个 URL 列表,正在尝试收集它们的“描述”。通过描述,我的意思是出现了什么,例如,如果你用谷歌搜索了链接。例如,http://stackoverflow.com">Google: http://stackoverflow.com 显示描述为
面向程序员的独立于语言的协作编辑问答网站。用户投票和标签显示的问题和答案。
这是我试图为我拥有的 URL 积累的数据。
我尝试解析 URL 的元描述,但是它们中的大多数都缺少元描述(但谷歌和其他搜索引擎设法以某种方式获得描述)。
有任何想法吗?我应该只是“谷歌”每个链接并抓取数据吗?我有一种感觉,谷歌不会喜欢这样的......
多谢你们。