python - python beautifulsoup截断代码标签之间的文本

Question

嗨，我正在使用 IRC 机器人命令从 twitter 获取帖子

我正在使用 api.twitter.com 列出 xml 格式的页面。推文的时间被列为

<created_at>Tue Jun 04 01:12:59 +0000 2013</created_at>

我只想获取标签之间的前 10 个字符。

我试过了

time = soup.findAll('created_at')[:10]

但这会返回错误。

score 3 · Accepted Answer

查找所有将返回created_at文档中的标签列表。当你切片它时，你切片的是这个标签列表，而不是标签中的文本（我怀疑切片本身会给你一个错误。另外，当你提到错误时，一定要说出那个错误是什么！）。

您可以通过以下方式验证这一点：

time = soup.findAll('created_at')
type(time[0]) # returns <class 'bs4.element.Tag'>

一种可能的方式来做你想做的事：

time = soup.created_at.string[:10]

1 回答 1