所以,摆在我面前的是这个有趣的问题,我有两张表,一张是用户信息,其中包含网络上的主机配置文件和网站中提到的其他商店配置文件,例如:在 www.abc.com 上,我提到了 www.xyz。 com 所以 abc.com 将成为:
source table
+----------+--------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+----------+--------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| website | varchar(255) | YES | | NULL | |
| user_id | varchar(25) | YES | MUL | NULL | |
| web_name | varchar(255) | YES | | NULL | |
+----------+--------------+------+-----+---------+----------------+
提及表将有条目(如上面提到的 xyz.com)
+----------+--------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+----------+--------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| web_link | varchar(255) | YES | | NULL | |
| user_id | varchar(25) | YES | MUL | NULL | |
| web_name | varchar(255) | YES | | NULL | |
+----------+--------------+------+-----+---------+----------------+
user_id 是这些表的外键,现在我想生成一个基于节点的图,以便我选择 source.web_name 和mention.webname 并为它们分配 id,使它们都是唯一的,例如:0-> 1 因为有机会1->0
我想知道实现这一目标的最佳方法是什么,我应该更改架构以完成它还是使用 python 选择可以完成。当 source.web_name 和mention.webname 驻留在不同的表中时,我无法弄清楚它们的唯一ID。