我正在尝试使用 regex 模块编写一小段代码,该模块将从 .csv 文件中删除部分 url 并将选定的块作为输出返回。如果该部分以 .com/go/ 结尾,我希望它在“go”之后返回内容。这是代码:
import csv
import re
with open('rtdata.csv', 'rb') as fhand:
reader = csv.reader(fhand)
for row in reader:
url=row[6].strip()
section=re.findall("^http://www.xxxxxxxxx.com/(.*/)", url)
if section==re.findall("^go.*", url):
section=re.findall("^http://www.xxxxxxxxx.com/go/(.*/)", url)
print url
print section
这是一些示例输入输出:
- 示例 1
- 输入:
http://www.xxxxxxxxx.com/go/news/videos/
- 输出:
news/videos
- 输入:
- 示例 2
- 输入:
http://www.xxxxxxxxx.com/new-cars/
- 输出:
new-cars
- 输入:
我在这里想念什么?