0

我正在使用 Python,并且我有一个 HTML 代码,一旦它到达“toc”这个词,我想将其砍掉,但我不知道该怎么做,有人有什么好主意吗?

4

2 回答 2

1

您可以使用split

>>> s="""<html lang="en" dir="ltr" class="client-nojs"> <head> <meta charset="UTF-8" /> <title>IBM - Wikipedia, the free encyclopedia</title> <meta name="generator" content="MediaWiki 1.25wmf19" />"""
>>> s.split('UTF')[0]
'<html lang="en" dir="ltr" class="client-nojs"> <head> <meta charset="'
于 2015-03-09T22:28:17.850 回答
0

没有更多信息,类似以下的作品

s = "some string toc remainder of string"

s = s[:s.find('toc')]

print s  # some string

但请注意,这会捕捉到“股票”之类的词——因此,根据您的具体情况,可能会有更好的方法。

于 2015-03-09T22:21:48.667 回答