我正在使用 Python,并且我有一个 HTML 代码,一旦它到达“toc”这个词,我想将其砍掉,但我不知道该怎么做,有人有什么好主意吗?
问问题
120 次
2 回答
1
您可以使用split
:
>>> s="""<html lang="en" dir="ltr" class="client-nojs"> <head> <meta charset="UTF-8" /> <title>IBM - Wikipedia, the free encyclopedia</title> <meta name="generator" content="MediaWiki 1.25wmf19" />"""
>>> s.split('UTF')[0]
'<html lang="en" dir="ltr" class="client-nojs"> <head> <meta charset="'
于 2015-03-09T22:28:17.850 回答
0
没有更多信息,类似以下的作品
s = "some string toc remainder of string"
s = s[:s.find('toc')]
print s # some string
但请注意,这会捕捉到“股票”之类的词——因此,根据您的具体情况,可能会有更好的方法。
于 2015-03-09T22:21:48.667 回答