我正在尝试编写一个小程序,它将读取 txt 文件的上下文并将其发送到 Spotlight Web 服务,以获取语义注释(以 text\html 输出格式)。不幸的是,与 Spotlight Demo 相比,只有一小部分实体被“识别”。例如,使用我的程序,对于像“Ridley Scott 导演了包括外星人、终结者和银翼杀手在内的许多电影”这样的文本,我得到的回应是“电影”和“外星人”在演示中的位置没有注释。较大的文本也会发生同样的情况。我在使用 OpenCalais WebService 时遇到了类似的问题,但这是因为我试图使用命令对输入文本进行编码
input = URLEncoder.encode(input, "UTF-8");
一旦我将其注释掉,问题就解决了。不幸的是,这里不是这种情况。