我有几个 Google 日历,我想使用Samurize合并并放置在我的 Windows 桌面上。我试过使用 Samurize 的 Page Scraper 插件,但它似乎不能胜任这项任务。
我可以让 Samurize 运行脚本并将其输出放在桌面上,但我不确定执行此操作的最佳工具是什么。
我拥有的所有网址都是以下形式:
http://www.google.com/calendar/feeds/example%40gmail.com/private-REMOVED/basic?futureevents=true&orderby=starttime&sortorder=ascending&singleevents=true
所以我可以使用 curl 获取它们,但是我需要过滤它们。
我想要的东西看起来像:
2009 12 02 Event from calendar 1's description
2009 12 03 Event from calendar 2's description
2009 12 04 Event from calendar 1's description
2009 12 05 Event from calendar 3's description
2009 12 06 Event from calendar 1's description
但是,日历提要中的日期格式如下:
<title type='html'>Event from calendar 1's description</title><summary type='html'>When: Fri 5 Dec 2008<br>
那么如何过滤掉日期和描述,并转换日期呢?
(我已经安装了 cygwin,所以使用 perl 或 sed/awk 的东西会很完美,因为我对它们足够熟悉,所以我有信心在未来改变它们,但我愿意接受建议。)