1

总体任务是在维基百科页面上进行 NLP。

首先是从 GATE 以一种好的方式访问下载的 Wikipedia 数据库转储(40GB XML 文件)?实际上,我只需要医疗类别。

有一些图书馆吗?

任何提示表示赞赏!

体重

4

1 回答 1

0

就我搜索而言,似乎我必须: 1. 在本地安装 Mediawiki 2. 使用 mwdump 将 xml 转储导入 Mediawiki 数据库(MySQL) 3. 使用 JDBC 连接器访问 MySQL 数据库

不知道我是不是绕道

于 2012-10-13T07:59:21.247 回答