在进行一些网络抓取时,我在从字符串中删除逗号时遇到问题。我的代码如下。
import urllib
import re
htmlfile = urllib.urlopen ("http://example.com")
htmltext = htmlfile.read ()
regex = 'Posts: (.+?)\n'
value = re.compile(regex)
posts = re.findall(value,htmltext)
print posts[0]
现在我得到的数据没问题,但问题是帖子计数随着逗号的值下降,例如 1,092,391,我想去掉逗号以留下一个数字,例如 1092391。
我已经安装了 Python 2.7.1,但我在这里没有找到任何东西,或者 Google 似乎可以正常工作。虽然我有点新手,所以我无疑在这里错过了一些如此愚蠢的东西,但我确实喜欢学习并亲自动手。所以任何帮助将不胜感激。