我的 iPhone 应用程序正在使用具有以下架构的 SQLite 数据库:
- items(id, name, ...) -> 此表包含 50 条记录
- tags(id, name) -> 这个表包含 50 条记录
- item_tags(id, item_id, tag_id, user_id)
- 相似性(id,item1_id,item2_id,分数)
项目、标签、item_tags 和相似度表填充了预定义的记录,因此不同项目之间的相似度也已经离线计算(使用基于项目标签的余弦相似度算法)。
用户可以为项目添加额外的标签,并在以后删除他们的自定义标签。每当发生这种情况时,项目之间的相似性分数应该在本地更新,即无需联系服务器应用程序。
我现在的问题是:最有效的方法是什么?到目前为止,在 iPhone 应用程序启动时,我为所有项目和标签计算了一个术语文档矩阵(它反映了每个项目的标签频率),并在应用程序运行时将该矩阵保存在内存中。每当添加或删除标签时,我都会使用此矩阵来更新数据库中的相似性。然而,这是相当低效的。你有什么建议吗?
谢谢!