1

我正在尝试编写一个查询,该查询将为用户配置文件找到最匹配的讨论。

这里有两个表:

线程表 - 每个线程都用数字 tagid 标记(在单独的列 tagid1、tagid2...tagid10 中)。每个 tagid 基本上是线程中出现的关键字。我们也有突出(在单独的列中 - prominence1、prominence2...prominence10) - 这是关键字在线程中出现的次数。

For example: 
threadid 123
tagids 1234, 12345, 12234, 11232, 11232, 112343, 1123224
prominence 2, 3, 1, 4, 5, 6, 2

用户表 - 每个用户 ID 都标有数字 tagids(在单独的列 tagid1、tagid2...tagid10 中),这些数字 tagids 对用户来说是最突出的(在单独的列中 - prominence1、prominence2...prominence10)。这里的突出度是根据用户参与具有特定标签的线程的次数来计算的。

For example:
userid 12334
tagids 1234, 5654, 45476, 4553, 44653, 6456432, 645645
prominence 6, 3, 2, 5, 2, 6, 1

如果我们有这两组数据 - 如果我必须显示最佳匹配线程列表,我如何为每个用户配置文件找到最佳匹配线程?

请帮助,我需要一些方向来寻找最佳匹配所需的逻辑。

4

0 回答 0