0

我可以从带有 disqus 框的网页获取 disqus_identifier。在页面上:http : //help.disqus.com/customer/portal/articles/472099-what-is-a-disqus-identifier-您可以使用 disqus 发表评论。我想编写脚本(也许 beautifulsoup 会很有用),它将获取页面 url 作为参数并返回此页面上讨论的 disqus_identifier。可能吗?

4

1 回答 1

0

如果您阅读他们的文档,thread_id 和 disqus_identifier 不是一回事。但要获得 disqus 标识符,我将从以下内容开始:

def get_disqus(soup):
    for script in soup.find_all('script',{'type':'text/javascript'}):
        if 'disqusIidentifier' in script.get_text():
            print script.attrs
            print script.get_text()

url= 'http://lifeandcode.tumblr.com/post/35377038799/talking-to-strangers-a-linked-ballot-how-news'

get_disqus(url)

这为您提供了实际包含单词“disqus_identifier”的 javascript 行——对我来说,这揭示了该值是可选的事实。如果你能更具体一点,很高兴扩展它。

于 2012-11-15T15:44:42.750 回答