我正在为日语句子做词性和形态分析项目。每个句子都有自己的网页。为了使这个页面更直观,我想展示一张与句子相关的图片。例如,对于句子“私は学生です”(“我是学生”),相关图片将是学校图片、日语课本、学生等。我有:词性标注每个单词。我现在的方法:在每个句子中使用 2-3 个名词,并使用 Bing Images API 从搜索结果中检索第一张图片。注意:到目前为止,所有的句子处理都是在 Java 中完成的。
不过有几个问题:1) 什么更好(更丰富的语料库和强大的搜索)、Google 图片 API、Bing 图片 API、Flickr API 等用于搜索日语名词?2)如何从句子中选择最重要的名词进行图像搜索引擎中的查询,而不进行复杂的主题建模等?谢谢!