0

我有一个 sql nodata 转储,我需要通过它并替换每个创建表查询的引擎部分。我被卡住的地方是我需要在每个字符串中提到表名,我用相应的表替换

假设文件如下

CREATE TABLE `tablename1` (
  -- #columns and keys
) ENGINE=InnoDB AUTO_INCREMENT=5075 DEFAULT CHARSET=utf8;
CREATE TABLE `tablename2` (
  -- #columns and keys
) ENGINE=something AUTO_INCREMENT=55 DEFAULT CHARSET=latin1;

期望的结果是:

CREATE TABLE `tablename1` (
  -- #columns and keys
) ENGINE=-myreplacedstring/tablename1; -- #table name 1 is appended to this line
CREATE TABLE `tablename2` (
  -- #columns and keys
) ENGINE=myreplacedstring/tablename2; -- #table name 2 is appended to this line

我试过

fin = open('dump.sql','r')
filedata = fin.read()
fin.close()

newdata = re.sub('(?<=ENGINE).*;', '-myreplacedstring-', filedata)

fout = open('fed_dump.sql','w')
fout.write(newdata)
fout.close()

但这只会用固定字符串替换字符串,无论它是哪个表。

我还尝试逐行处理,以便每次通过时都能获取表名,但我不知道如何继续。

 with open('dump.sql') as infile, open('dump_fed.sql', 'w') as outfile:
     for line in infile:
         #tablename= if line contains create table, update tablename, else do nothing
         line = re.sub('(?<=ENGINE).*;', '-myreplacedstring-'+tablename, line)
         outfile.write(line)

我被困在如何将每个表的表名放入替换的字符串中。任何帮助表示赞赏。

4

2 回答 2

1

您的解决方案肯定会奏效,但您可以通过反向引用更快地做到这一点。我对此进行了测试并且它有效(您可以将其设为单线,但这样更具可读性):

pattern = r"CREATE TABLE `(.*?)`(.*?)ENGINE=.*?;"
replace_pattern = r"CREATE TABLE `\1`\2ENGINE=-myreplacedstring-\1;"
newdata = re.sub(pattern, replace_pattern, filedata, flags=re.DOTALL)

和 :

  • '.*?' 是 '.*' 的非贪婪版本
  • '\1' 是每次出现的第一个捕获组的反向引用,例如“tablename1”、“tablename2”等
  • 模式作为带有前缀“r”的原始字符串(这是一个好习惯)
  • 允许“。”的 re.DOTALL 标志 匹配换行符

我在以下解决方案之前提出了建议,这是错误的,因为由“(?<=...)”表示的后视必须包含固定长度的模式:

pattern = r"(?<=CREATE TABLE `(.*?)`.*?ENGINE=).*;"
newdata = re.sub(pattern, '-myreplacedstring-\1', filedata)
于 2015-11-25T14:15:46.163 回答
0

弄清楚了。不确定这是多么优雅或牢不可破,但它似乎适用于我的情况(采用 mysql nodata 转储,用联合连接字符串替换引擎,轻松创建从一个数据库到另一个数据库的完整联合数据库)。

import re

def gettablename(string, defaultstring):
    if 'CREATE TABLE' in string: 
        return re.search('`(.*)`', string).group(1)
    else: 
        return defaultstring

with open('dump.sql') as infile:
    tablename='def' # do i need this default?
    for line in infile:
        tablename=gettablename(line,tablename)
        line = re.sub('(?<=ENGINE).*;', '-myreplacedstring-'+tablename, line)
        print line
于 2015-11-25T14:05:57.047 回答