我的数据库中有一个未规范化的表,其名称details
结构和示例数据如下(为图像道歉,只是认为它会更容易理解):
我的挑战是拆分列 -assignee, inventor and ipcsubclass
使用分隔符|
到新表 {detail_inv
和inventors
}、{detail_asg
和assignees
} 和 {detail_ipc
和ipcsubclasses
}。
在所有三种情况下,表模式都是相似的。例如,发明者表和上的列以及detail_inv 表和上的id
列。每行必须只有一个名称,所有名称在发明者表中都是唯一的,并且 id 以保持 detail_inv 表中的关系。name
detail_id
inventor_id
我为发明者尝试了使用以下代码的存储过程-我为 3 列创建了 3 个过程:(
drop procedure if exists normalise_details;
delimiter #
create procedure normalise_details()
proc_main:begin
declare v_cursor_done int unsigned default 0;
declare v_post_id int unsigned;
declare v_tags varchar(2048);
declare v_keyword varchar(50);
declare v_keyword_id mediumint unsigned;
declare v_tags_done int unsigned;
declare v_tags_idx int unsigned;
declare v_cursor cursor for select id, inventor from details order by id;
declare continue handler for not found set v_cursor_done = 1;
set autocommit = 0;
open v_cursor;
repeat
fetch v_cursor into v_post_id, v_tags;
set v_tags_done = 0;
set v_tags_idx = 1;
while not v_tags_done do
set v_keyword = substring(v_tags, v_tags_idx,
if(locate('|', v_tags, v_tags_idx) > 0,
locate('|', v_tags, v_tags_idx) - v_tags_idx,
length(v_tags)));
if length(v_keyword) > 0 then
set v_tags_idx = v_tags_idx + length(v_keyword) + 1;
set v_keyword = trim(v_keyword);
insert into inventors (name) values (v_keyword);
select id into v_keyword_id from inventors where name = v_keyword;
insert into details_inv (inventor_id, detail_id) values (v_keyword_id, v_post_id);
else
set v_tags_done = 1;
end if;
end while;
until v_cursor_done end repeat;
close v_cursor;
commit;
end proc_main #
delimiter ;
当我在一些随机测试数据上尝试这个时,它工作正常。当我在实际桌子上执行此操作时,效果不佳。仅插入部分数据。SQL 不会抛出任何错误(除了某些情况:“#1172 - 结果包含多于一行”或“inventor_id 列不能为空”)
我尝试在 MySQL 上修改代码 - 通过存储过程将逗号分隔列表插入规范化表以满足我的需要,但我失败了。
请帮助我,我的数据库表已经变得一团糟,大约有 500,000 行,这让我很难在每个项目上展开和管理巨大的数组(最近的项目有 ~200,000 行)。