(免责声明:对 Python 和编程来说还是新手)
我使用 Python 2.7 和 Beautiful Soup 来实现从网站中提取数据的函数……</p>
date = soup.find('div', class_="attention-box").p.string
... 运行正则表达式,因为我只需要年份,而不是Date:而不是日 + 月 ...</p>
date = re.findall(r'(\d{4})\s+', date)
… 将其添加到字典中…</p>
collection['date']=date
......并返回字典。
当我尝试使用字典中的字符串打印以下内容(我正在为 wiki 创建模板)时
print "|" + collection['URL'] + "|" + collection['title'] + "|" + collection['name']+"|"
有效。
当我添加日期
print "|" + collection['URL'] + "|" + collection['title'] + "|" + collection['name']+"|" + collection['date'] + "|"
我收到以下错误:TypeError: coercing to Unicode: need string or buffer, list found
在我的函数中,我添加date = str(date)
并得到了一个工作输出,但我在日期部分得到了例如[u'2001']。如何在此特定设置中的此视觉 unicode 表示(?)中删除它?
非常感谢。