我正在开发一个应用程序,该应用程序试图根据推文的文本作为输入来查找类似的推文。推文的相似性将基于匹配文本的数量。我想使用公共 twitter 搜索 api 来完成此操作。
twitter API 提供的最接近的功能是使用 OR 运算符进行搜索。然而,这会返回一个看似随机排序的推文列表,其中包含查询的任何单词,通常匹配常见的单词,如“with”或“we”(这是 OR 运算符的预期行为)。然而,我对具有尽可能多的匹配文本的结果以及具有输入推文特征的文本的结果感兴趣(匹配常用词与匹配不常用词的相关性较低)。
有什么方法可以使用 twitter API 找到尽可能多的匹配词的结果?