我正在尝试将一个大型 csv 文件导入 Mysql。不幸的是,文件中的数据由空格和制表符分隔。
结果,每当我将数据加载到我的表中时,我都会得到无数的空单元格(因为 Mysql 只识别一个字段分隔符)。在导入数据之前修改数据不是一种选择。
以下是数据示例:
# 1574 1 1 1
$ 1587 6 6 2
$115 1878 8 9 23
(每行的第二个和第三个值用制表符分隔)
有任何想法吗?
如果我的目标只是导入文件,我会使用 sed -i 's/,/ /g' *.txt
创建一个分隔符来担心。
我喜欢 CSV,但也许有一个用双引号括起来的字符串,其中包含一个逗号或空格,在这种情况下这并不完美。它仍然会导入,只是会修改这些字符串。
在这种情况下,我在生产中使用的另一种方法是 Stat/Transfer。有一种语法语言可以创建一个 shell 脚本来转换文件并指定多个分隔符。
假设你正在使用LOAD DATA INFILE
试试这个:
load data local infile 'c:/somefile.txt' into table tabspace
columns terminated by ' '
(col1, @col23, col4, col5)
set col2 = left(@col23, instr(@col23,char(9))-1),
col3 = substr(@col23,instr(@col23,char(9))+1);
请注意,分隔符是一个空格,因此第二列包含 col2/col3 数据。这分配给变量@col23,然后将其拆分并将部分分配给col2和col3。