Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
总体任务是在维基百科页面上进行 NLP。
首先是从 GATE 以一种好的方式访问下载的 Wikipedia 数据库转储(40GB XML 文件)?实际上,我只需要医疗类别。
有一些图书馆吗?
任何提示表示赞赏!
体重
就我搜索而言,似乎我必须: 1. 在本地安装 Mediawiki 2. 使用 mwdump 将 xml 转储导入 Mediawiki 数据库(MySQL) 3. 使用 JDBC 连接器访问 MySQL 数据库
不知道我是不是绕道