我正在尝试编写一个查询,该查询将为用户配置文件找到最匹配的讨论。
这里有两个表:
线程表 - 每个线程都用数字 tagid 标记(在单独的列 tagid1、tagid2...tagid10 中)。每个 tagid 基本上是线程中出现的关键字。我们也有突出(在单独的列中 - prominence1、prominence2...prominence10) - 这是关键字在线程中出现的次数。
For example:
threadid 123
tagids 1234, 12345, 12234, 11232, 11232, 112343, 1123224
prominence 2, 3, 1, 4, 5, 6, 2
用户表 - 每个用户 ID 都标有数字 tagids(在单独的列 tagid1、tagid2...tagid10 中),这些数字 tagids 对用户来说是最突出的(在单独的列中 - prominence1、prominence2...prominence10)。这里的突出度是根据用户参与具有特定标签的线程的次数来计算的。
For example:
userid 12334
tagids 1234, 5654, 45476, 4553, 44653, 6456432, 645645
prominence 6, 3, 2, 5, 2, 6, 1
如果我们有这两组数据 - 如果我必须显示最佳匹配线程列表,我如何为每个用户配置文件找到最佳匹配线程?
请帮助,我需要一些方向来寻找最佳匹配所需的逻辑。