2

有人用过维基百科数据提取吗?我需要用它来工作。

您能否提供其他用于提取网页信息的工具?

谢谢!

4

1 回答 1

4

当您说 Wikipedia Data Extraction 时,我假设您指的是DBpedia 用于将 Wikipedia XML 转储转换为DBpedia 数据转储的软件?您是否考虑过自己使用 DBpedia 转储?

从网页中提取信息的工具是一个非常广阔的空间。你想提取什么样的信息?它来自半结构化(例如表格)还是非结构化文本(例如散文)。您是否对页面标题和作者等元数据或命名实体等较低级别的概念感兴趣?

(我会在这个问题上留下这些澄清问题,但我的帐户级别不允许这样做)

于 2011-01-09T21:55:45.593 回答