如果我想计算两个表的行中的匹配词,有数百万行,示例:
表帖,示例:
+----+---------+-----------------------------+
| ID | ID_user | text |
+----+---------+-----------------------------+
| 1 | bruno | michael jackson is dead |
| 2 | thomasi | michael j. moonwalk is dead |
| 3 | userts | michael jackson lives |
+----+---------+-----------------------------+
我想查询表中重复次数最多的单词,限制前10,结果可能是这样的:
+-------+------------+
| count | word |
+-------+------------+
| 3 | michael |
| 2 | dead |
| 2 | jackson |
| 1 | j. |
| 1 | lives |
| 1 | moonwalk |
+-------+------------+
但我只想搜索重复超过 10 次的单词,在这种情况下没有出现任何单词,但如果重复单词的条件为 2,将只显示“michael”和“dead”,但忽略“is”,因为我不想要长度少于 2 个字符的单词,以及一个短语的单词,那么我需要出现这个:
+-------+-----------------+
| count | word |
+-------+-----------------+
| 2 | michael jackson |
| 2 | dead |
+-------+-----------------+
我需要 mysql 中的代码来回复 twitter 的“热门话题”以获取我网站的帖子。