我对Python很陌生...
我正在编写一个使用该urllib2
库搜索某个网页的代码。我正在使用该命令re.findall
在此网页上搜索特定字符串。但是,我不想提取这些特定的字符串,而是要提取这些字符串出现的整行。
例如,假设我在一个如下所示的网页上搜索单词“hello”:
你好,我的名字是鲍勃。我是鲍勃。
我的朋友是简。
我的名字是简...你好!
我想提取其中包含“你好”的行。(这意味着我想提取第一行和第三行。)这是我在下面使用的,这显然是错误的,因为它只提取单词,而不是单词出现的整行:
Page_Content = urllib2.urlopen(My_URL).read()
Matches = re.findall("hello", Page_Content)
我将如何修改此代码以提取整行?我是否必须使用某种 for 循环并逐行搜索?如果是这样,我将如何去做?
for line in Page_Content
[code here]
?