我正在尝试将 RSS 2.0 提要中的标题标签解析为该提要中每个条目的三个不同变量。使用 ElementTree 我已经解析了 RSS,以便我可以)
使用以下代码打印每个标题 [减去尾随 ]:
feed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date") for item in feed: print repr(item.title[0:-1])
我将其包括在内,因为如您所见, item.title 是一种 repr() 数据类型,我对此不太了解。
交互式窗口中的特定repr(item.title[0:-1])
print
ed 如下所示:
'randy travis (Billy Bobs 3/21' 'Michael Schenker Group (House of Blues Dallas 3/26'
用户选择一个乐队,我希望在将每个变量解析item.title
为 3 个变量(乐队、场地和日期各一个......或者可能是一个数组,或者我不知道......)之后,只选择与乐队相关的那些选择。然后将它们发送到 Google 进行地理编码,但这是另一回事。
我看过一些例子,regex
我正在阅读它们,但它似乎非常复杂。是吗?我想也许这里有人会对如何以一种智能的方式做到这一点有一些见解。我应该使用该re
模块吗?输出当前是repr()
s 是否重要?有没有更好的办法?我在想我会使用这样的循环(这是我的伪Python,只是我正在写的一种笔记):
列表 = bandRaw、地点、日期、latLong 对于提要中的项目: 为 bandRaw、地点、日期解析 item.title 如果 bandRaw == str(band) 将场地名称+“,达拉斯,德克萨斯”发送到谷歌进行地理编码 返回纬度,经度 list = list + return character + bandRaw + "," + place + "," + date + "," + lat + "," + long 别的
最后,我需要在 .csv(逗号分隔)文件中选择如下所示的条目:
band,venue,date,lat,long randy travis,Billy Bobs,3/21,1234.5678,1234.5678 Michael Schenker Group,House of Blues Dallas,3/26,4321.8765,4321.8765
我希望这不是太多的要求。我会自己研究它,只是想我应该在这里发帖以确保它得到答复。
所以,问题是,我如何最好repr(item.title[0:-1])
地将每个值解析feed
为 3 个单独的值,然后我可以将它们连接成一个 .csv 文件?