我从http://spotlight.dbpedia.org/download/release-0.5/dbpedia-spotlight-quickstart.zip安装了 DBpedia Spotlight,并希望通过从https://github.com/dbpedia-spotlight/下载来改进其数据集dbpedia-spotlight/wiki/下载。
有人可以告诉我如何将来自观察者词典和消歧索引的数据与 jar 文件一起使用。
我从http://spotlight.dbpedia.org/download/release-0.5/dbpedia-spotlight-quickstart.zip安装了 DBpedia Spotlight,并希望通过从https://github.com/dbpedia-spotlight/下载来改进其数据集dbpedia-spotlight/wiki/下载。
有人可以告诉我如何将来自观察者词典和消歧索引的数据与 jar 文件一起使用。
假设您已经下载并解压了以下文件:
wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz
tar zxvf context-index-compact.tgz
wget http://spotlight.dbpedia.org/download/release-0.4/surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
gunzip surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
现在您只需更改 server.properties 文件以指向新提取的文件:
org.dbpedia.spotlight.index.dir = index-withSF-withTypes-compressed
org.dbpedia.spotlight.spot.dictionary = surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary
如果您使用最大的spotter dict,您可能需要增加java 堆空间——例如命令行中的-Xmx10G。