0

嗨,我正在使用 IRC 机器人命令从 twitter 获取帖子

我正在使用 api.twitter.com 列出 xml 格式的页面。推文的时间被列为

<created_at>Tue Jun 04 01:12:59 +0000 2013</created_at>

我只想获取标签之间的前 10 个字符。

我试过了

time = soup.findAll('created_at')[:10]

但这会返回错误。

4

1 回答 1

3

查找所有将返回created_at文档中的标签列表。当你切片它时,你切片的是这个标签列表,而不是标签中的文本(我怀疑切片本身会给你一个错误。另外,当你提到错误时,一定要说出那个错误是什么!)。

您可以通过以下方式验证这一点:

time = soup.findAll('created_at')
type(time[0]) # returns <class 'bs4.element.Tag'>

一种可能的方式来做你想做的事:

time = soup.created_at.string[:10]
于 2013-06-04T06:03:35.843 回答