我正在使用 Twitter 流 API 使用 PHP 和 MySQL 构建推文数据库。除了“推文”表之外,还有单独的表来跟踪提及、网址、主题标签和用户。
我让它定期检查并只保留我的每个关键字的最新 1000 条推文,从数据库中删除其余的推文。我想做的是清理关联表中的数据(通过关联表,我的意思是提及、url、主题标签和用户表)。
我想知道删除“tweets”表中没有匹配的 tweet_id 的所有提及、url、主题标签和用户的最有效方法是什么。
表结构:
--
-- Table structure for table `tweets`
--
CREATE TABLE IF NOT EXISTS `tweets` (
`tweet_id` bigint(20) unsigned NOT NULL,
`tweet_text` varchar(200) NOT NULL,
`entities` text NOT NULL,
`created_at` datetime NOT NULL,
`geo_lat` decimal(10,5) DEFAULT NULL,
`geo_long` decimal(10,5) DEFAULT NULL,
`user_id` int(10) unsigned NOT NULL,
`screen_name` char(20) NOT NULL,
`name` varchar(40) DEFAULT NULL,
`profile_image_url` varchar(200) DEFAULT NULL,
`tweet_keywords` varchar(128) NOT NULL,
PRIMARY KEY (`tweet_id`),
KEY `created_at` (`created_at`),
KEY `user_id` (`user_id`),
KEY `screen_name` (`screen_name`),
KEY `name` (`name`),
FULLTEXT KEY `tweet_text` (`tweet_text`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
-- --------------------------------------------------------
--
-- Table structure for table `tweet_mentions`
--
CREATE TABLE IF NOT EXISTS `tweet_mentions` (
`tweet_id` bigint(20) NOT NULL,
`source_user_id` bigint(20) NOT NULL,
`target_user_id` bigint(20) NOT NULL,
KEY `tweet_id` (`tweet_id`),
KEY `source` (`source_user_id`),
KEY `target` (`target_user_id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
-- --------------------------------------------------------
--
-- Table structure for table `tweet_tags`
--
CREATE TABLE IF NOT EXISTS `tweet_tags` (
`tweet_id` bigint(20) NOT NULL,
`tag` varchar(100) NOT NULL,
KEY `tweet_id` (`tweet_id`),
KEY `tag` (`tag`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
-- --------------------------------------------------------
--
-- Table structure for table `tweet_urls`
--
CREATE TABLE IF NOT EXISTS `tweet_urls` (
`tweet_id` bigint(20) NOT NULL,
`url` varchar(140) NOT NULL,
KEY `tweet_id` (`tweet_id`),
KEY `url` (`url`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
-- --------------------------------------------------------
--
-- Table structure for table `users`
--
CREATE TABLE IF NOT EXISTS `users` (
`user_id` bigint(20) unsigned NOT NULL,
`screen_name` varchar(20) NOT NULL,
`name` varchar(40) DEFAULT NULL,
`profile_image_url` varchar(200) DEFAULT NULL,
`location` varchar(30) DEFAULT NULL,
`url` varchar(200) DEFAULT NULL,
`description` varchar(200) DEFAULT NULL,
`created_at` datetime NOT NULL,
`followers_count` int(10) unsigned DEFAULT NULL,
`friends_count` int(10) unsigned DEFAULT NULL,
`statuses_count` int(10) unsigned DEFAULT NULL,
`time_zone` varchar(40) DEFAULT NULL,
`last_update` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`user_id`),
KEY `user_name` (`name`),
KEY `last_update` (`last_update`),
KEY `screen_name` (`screen_name`),
FULLTEXT KEY `description` (`description`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;