1

我一直在尝试提取和抓取有关为 joda-time 软件提交的错误的信息。但是,我没有找到使用自动脚本或其他工具将此信息导出到文件的好方法。我确实在网上找到了一些 python 脚本,但它们主要是关于将 sourceforge 票证转换为 git 或过时的。

对此问题的任何帮助将不胜感激。

谢谢, 希瓦尼

4

3 回答 3

0

您可以使用BeautifulSoup编写抓取脚本。您可以通过使用 BeautifulSoup 编写一些 Python 代码,从 joda-time 软件的每个 bug 票页的 HTML 中提取必要的信息。这并不难,然后您可以使用提取的信息来做您想要的事情。

于 2012-07-08T19:25:23.070 回答
0

对不起,我无法理解你的问题。如果您的问题是如何将文件提取为 HTML 并另存为 HTML

您可以使用urllibhttp ://docs.python.org/library/urllib.html

于 2012-07-08T19:26:30.140 回答
0

如果您是项目管理员,您可以选择导出到 xml

您还可能会发现将 sourceforge 票证迁移到 GitHub 问题很有用。

于 2012-07-08T20:03:01.183 回答