1

我正在使用tureng在线词典进行土耳其语-英语/英语-土耳其语翻译,这个网页记录了单词搜索历史,我想用这个代码检索这些单词

import urllib.request
f = urllib.request.urlopen("http://tureng.com/history/details")
text=f.read().decode('utf-8')
#print(text)

start = text.find("<span class=\"historyTerm\"><a href=\"/search/")

我知道如何解析搜索到的词后缀,但是问题是在使用 urllib 检索页面源时,我看不到搜索到的词。它说“这一天没有历史记录”。那么我该如何解决这个问题呢?

如果你搜索几个词后查看页面源,你可以看到 tureng 历史词

在我的浏览器中,我可以看到搜索到的单词:

图灵浏览器

在python中:

图灵蟒

4

2 回答 2

1

当您查找单词和翻译时,我想您正在使用您的网络浏览器。您使用的网站应将查找历史记录存储在 cookie 中或浏览器的缓存中。当您使用 python 脚本调用 URL 时,它与打开一个带有干净会话的新 Web 浏览器相同。

于 2013-01-28T13:36:49.103 回答
0

问题实际上包含了答案。您可以简单地单击“导出到 Excel”按钮,它会将您需要的所有数据作为一个简单的 excel 文件提供:-)

于 2015-10-21T19:31:31.597 回答