有没有一种简单的方法可以从 Linux 命令行运行 MySQL 查询并以CSV格式输出结果?
这就是我现在正在做的事情:
mysql -u uid -ppwd -D dbname << EOQ | sed -e 's/ /,/g' | tee list.csv
select id, concat("\"",name,"\"") as name
from students
EOQ
当有很多列需要用引号括起来,或者结果中有引号需要转义时,它会变得混乱。
SELECT order_id,product_name,qty
FROM orders
WHERE foo = 'bar'
INTO OUTFILE '/var/lib/mysql-files/orders.csv'
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n';
注意:该语法可能需要重新排序为
SELECT order_id,product_name,qty
INTO OUTFILE '/var/lib/mysql-files/orders.csv'
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
FROM orders
WHERE foo = 'bar';
在最新版本的 MySQL 中。
使用此命令,列名将不会被导出。
另请注意,/var/lib/mysql-files/orders.csv
它将在运行 MySQL的服务器上。运行 MySQL 进程的用户必须具有写入所选目录的权限,否则命令将失败。
如果您想从远程服务器(尤其是托管或虚拟化机器,如Heroku或Amazon RDS )将输出写入本地机器,则此解决方案不适合。
mysql your_database --password=foo < my_requests.sql > out.csv
这是制表符分隔的。像这样通过管道获取真正的 CSV(感谢用户John Carter):
... .sql | sed 's/\t/,/g' > out.csv
mysql --批处理,-B
使用制表符作为列分隔符打印结果,每行换行。使用此选项,mysql 不使用历史文件。批处理模式导致非表格输出格式和特殊字符转义。使用 raw 模式可以禁用转义;请参阅 --raw 选项的说明。
这将为您提供一个制表符分隔的文件。由于逗号(或包含逗号的字符串)没有转义,因此将分隔符更改为逗号并不简单。
这是一种相当粗糙的方法[1]:
mysql --user=wibble --password wobble -B -e "select * from vehicle_categories;" | sed "s/'/\'/;s/\t/\",\"/g;s/^/\"/;s/$/\"/;s/\n//g" > vehicle_categories.csv
它工作得很好。不过,正则表达式再一次证明是只写的。
正则表达式解释:
所以,把它们放在一起:
s/'/\'/ Replace ' with \'
s/\t/\",\"/g Replace all \t (tab) with ","
s/^/\"/ at the beginning of the line place a "
s/$/\"/ At the end of the line, place a "
s/\n//g Replace all \n (newline) with nothing
[1] 我在某个地方找到了它,无法获得任何信任。
通过 'tr' 管道(仅限 Unix/ Cygwin):
mysql <database> -e "<query here>" | tr '\t' ',' > data.csv
注意:这既不处理嵌入的逗号,也不处理嵌入的选项卡。
这救了我几次。它速度快而且有效!
--batch 使用制表符作为列分隔符打印结果,每行换行。
--raw 禁用字符转义(\n、\t、\0 和 \)
例子:
mysql -udemo_user -p -h127.0.0.1 --port=3306 \
--default-character-set=utf8mb4 --database=demo_database \
--batch --raw < /tmp/demo_sql_query.sql > /tmp/demo_csv_export.tsv
为了完整起见,您可以转换为 CSV(但要小心,因为选项卡可能位于字段值内 - 例如,文本字段)
tr '\t' ',' < file.tsv > file.csv
Paul Tomblin 给出的 OUTFILE 解决方案导致将文件写入 MySQL 服务器本身,因此只有当您具有FILE访问权限以及登录访问权限或从该框中检索文件的其他方式时,这才有效。
如果您没有这样的访问权限,并且制表符分隔的输出是 CSV 的合理替代品(例如,如果您的最终目标是导入 Excel),那么serbaut 的解决方案(使用mysql --batch
和可选--raw
)是可行的方法。
MySQL Workbench可以将记录集导出为 CSV,而且它似乎很好地处理了字段中的逗号。CSV 可以在OpenOffice Calc中正常打开。
采用:
mysql your_database -p < my_requests.sql | awk '{print $1","$2}' > out.csv
迄今为止,这里的所有解决方案,除了MySQL Workbench 之一,对于 MySQL 数据库中的至少一些可能的内容都是不正确的并且很可能是不安全的(即安全问题)。
MySQL Workbench(和类似的phpMyAdmin)提供了形式上正确的解决方案,但它们旨在将输出下载到用户的位置。它们对于自动数据导出之类的事情不是那么有用。
无法从 的输出中生成可靠正确的 CSV 内容,mysql -B -e 'SELECT ...'
因为它无法对字段中的回车和空格进行编码。'-s' 标志mysql
确实会进行反斜杠转义,并可能导致正确的解决方案。但是,使用脚本语言(一种具有良好内部数据结构的语言,而不是 Bash)和已经仔细解决了编码问题的库要安全得多。
我曾想过为此编写一个脚本,但一想到我会如何称呼它,我就想到要搜索已存在的同名作品。虽然我还没有彻底了解它,但 mysql2csv看起来很有希望。根据您的应用程序,指定 SQL 命令的 YAML 方法可能会或可能不会有吸引力。我对 Ruby 的更新版本的要求也并不感到兴奋,而不是我的Ubuntu 12.04(Precise Pangolin)笔记本电脑或Debian 6.0(Squeeze)服务器的标准配置。是的,我知道我可以使用 RVM,但我不想为了这么简单的目的而维护它。
此页面上的许多答案都很薄弱,因为它们不处理 CSV 格式中可能发生的一般情况。例如,嵌入在字段中的逗号和引号以及最终总会出现的其他条件。我们需要一个适用于所有有效 CSV 输入数据的通用解决方案。
这是 Python 中一个简单而强大的解决方案:
#!/usr/bin/env python
import csv
import sys
tab_in = csv.reader(sys.stdin, dialect=csv.excel_tab)
comma_out = csv.writer(sys.stdout, dialect=csv.excel)
for row in tab_in:
comma_out.writerow(row)
命名那个文件tab2csv
,把它放在你的路径上,给它执行权限,然后像这样使用它:
mysql OTHER_OPTIONS --batch --execute='select * from whatever;' | tab2csv > outfile.csv
Python CSV 处理函数涵盖了 CSV 输入格式的极端情况。
这可以通过流式处理改进以处理非常大的文件。
在命令行中,您可以执行以下操作:
mysql -h *hostname* -P *port number* --database=*database_name* -u *username* -p -e *your SQL query* | sed 's/\t/","/g;s/^/"/;s/$/"/;s/\n//g' > *output_file_name.csv*
此答案使用 Python 和流行的第三方库PyMySQL。我添加它是因为 Python 的csv库足够强大,可以正确处理许多不同的风格,.csv
并且没有其他答案是使用 Python 代码与数据库进行交互。
import contextlib
import csv
import datetime
import os
# https://github.com/PyMySQL/PyMySQL
import pymysql
SQL_QUERY = """
SELECT * FROM my_table WHERE my_attribute = 'my_attribute';
"""
# embedding passwords in code gets nasty when you use version control
# the environment is not much better, but this is an example
# https://stackoverflow.com/questions/12461484
SQL_USER = os.environ['SQL_USER']
SQL_PASS = os.environ['SQL_PASS']
connection = pymysql.connect(host='localhost',
user=SQL_USER,
password=SQL_PASS,
db='dbname')
with contextlib.closing(connection):
with connection.cursor() as cursor:
cursor.execute(SQL_QUERY)
# Hope you have enough memory :)
results = cursor.fetchall()
output_file = 'my_query-{}.csv'.format(datetime.datetime.today().strftime('%Y-%m-%d'))
with open(output_file, 'w', newline='') as csvfile:
# http://stackoverflow.com/a/17725590/2958070 about lineterminator
csv_writer = csv.writer(csvfile, lineterminator='\n')
csv_writer.writerows(results)
我遇到了同样的问题,Paul's Answer不是一个选项,因为它是Amazon RDS。用逗号替换制表符不起作用,因为数据已嵌入逗号和制表符。我发现mycli是 mysql-client 的替代方案,它支持开箱即用的 CSV 输出,带有以下--csv
标志:
mycli db_name --csv -e "select * from flowers" > flowers.csv
这很简单,它适用于任何东西,而不需要批处理模式或输出文件:
select concat_ws(',',
concat('"', replace(field1, '"', '""'), '"'),
concat('"', replace(field2, '"', '""'), '"'),
concat('"', replace(field3, '"', '""'), '"'))
from your_table where etc;
解释:
"
为-->""
replace(field1, '"', '""')
concat('"', result1, '"')
concat_ws(',', quoted1, quoted2, ...)
就是这样!
此外,如果您在 Bash 命令行上执行查询,我相信该tr
命令可用于将默认制表符替换为任意分隔符。
$ echo "SELECT * FROM Table123" | mysql Database456 | tr "\t" ,
您可以拥有一个使用 CSV 引擎的 MySQL 表。
然后,您将在硬盘上拥有一个始终为 CSV 格式的文件,您可以直接复制它而无需处理它。
为了扩展先前的答案,以下单行将单个表导出为制表符分隔的文件。适用于自动化,每天左右导出数据库。
mysql -B -D mydatabase -e 'select * from mytable'
方便的是,我们可以使用相同的技术列出 MySQL 的表,并描述单个表上的字段:
mysql -B -D mydatabase -e 'show tables'
mysql -B -D mydatabase -e 'desc users'
Field Type Null Key Default Extra
id int(11) NO PRI NULL auto_increment
email varchar(128) NO UNI NULL
lastName varchar(100) YES NULL
title varchar(128) YES UNI NULL
userName varchar(128) YES UNI NULL
firstName varchar(100) YES NULL
这就是我所做的:
echo $QUERY | \
mysql -B $MYSQL_OPTS | \
perl -F"\t" -lane 'print join ",", map {s/"/""/g; /^[\d.]+$/ ? $_ : qq("$_")} @F ' | \
mail -s 'report' person@address
Perl 脚本(从别处截取)在将制表符间隔字段转换为 CSV 方面做得很好。
基于 user7610,这是最好的方法。有mysql outfile
60 分钟的文件所有权和覆盖问题。
这并不酷,但它在 5 分钟内工作。
php csvdump.php localhost root password database tablename > whatever-you-like.csv
<?php
$server = $argv[1];
$user = $argv[2];
$password = $argv[3];
$db = $argv[4];
$table = $argv[5];
mysql_connect($server, $user, $password) or die(mysql_error());
mysql_select_db($db) or die(mysql_error());
// fetch the data
$rows = mysql_query('SELECT * FROM ' . $table);
$rows || die(mysql_error());
// create a file pointer connected to the output stream
$output = fopen('php://output', 'w');
// output the column headings
$fields = [];
for($i = 0; $i < mysql_num_fields($rows); $i++) {
$field_info = mysql_fetch_field($rows, $i);
$fields[] = $field_info->name;
}
fputcsv($output, $fields);
// loop over the rows, outputting them
while ($row = mysql_fetch_assoc($rows)) fputcsv($output, $row);
?>
不完全是 CSV 格式,但MySQL客户端的tee
命令可用于将输出保存到本地文件中:
tee foobar.txt
SELECT foo FROM bar;
您可以使用禁用它notee
。
问题SELECT … INTO OUTFILE …;
在于它需要在服务器上写入文件的权限。
什么对我有用:
SELECT *
FROM students
WHERE foo = 'bar'
LIMIT 0,1200000
INTO OUTFILE './students-1200000.csv'
FIELDS TERMINATED BY ',' ESCAPED BY '"'
ENCLOSED BY '"'
LINES TERMINATED BY '\r\n';
这个线程上的解决方案都不适用于我的特殊情况。我在其中一列中有漂亮的 JSON 数据,这会在我的 CSV 输出中搞砸。对于那些有类似问题的人,请尝试以 \r\n 结尾的行。
对于那些试图用 Microsoft Excel 打开 CSV 的人来说,还有另一个问题,请记住,单个单元格可以容纳的字符数限制为 32,767 个,超过该字符数会溢出到下面的行。要确定列中的哪些记录存在问题,请使用以下查询。然后,您可以截断这些记录或根据需要处理它们。
SELECT id,name,CHAR_LENGTH(json_student_description) AS 'character length'
FROM students
WHERE CHAR_LENGTH(json_student_description)>32767;
在我的情况下from table_name .....
,之前INTO OUTFILE .....
给出了一个错误:
子句的意外排序。(靠近位置 10 的“FROM”)
什么对我有用:
SELECT *
INTO OUTFILE '/Volumes/Development/sql/sql/enabled_contacts.csv'
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
FROM table_name
WHERE column_name = 'value'
使用Tim Harding 发布的解决方案,我创建了这个 Bash 脚本来简化该过程(需要 root 密码,但您可以轻松修改脚本以询问任何其他用户):
#!/bin/bash
if [ "$1" == "" ];then
echo "Usage: $0 DATABASE TABLE [MYSQL EXTRA COMMANDS]"
exit
fi
DBNAME=$1
TABLE=$2
FNAME=$1.$2.csv
MCOMM=$3
echo "MySQL password: "
stty -echo
read PASS
stty echo
mysql -uroot -p$PASS $MCOMM $DBNAME -B -e "SELECT * FROM $TABLE;" | sed "s/'/\'/;s/\t/\",\"/g;s/^/\"/;s/$/\"/;s/\n//g" > $FNAME
它将创建一个名为:database.table.csv的文件
如果您在服务器上设置了 PHP,则可以使用mysql2csv为任意 MySQL 查询导出(实际有效的)CSV 文件。请参阅我在 MySQL - SELECT * INTO OUTFILE LOCAL 的回答?了解更多上下文/信息。
我试图维护选项名称,mysql
因此提供--file
and--query
选项就足够了:
./mysql2csv --file="/tmp/result.csv" --query='SELECT 1 as foo, 2 as bar;' --user="username" --password="password"
“安装”mysql2csv
通过
wget https://gist.githubusercontent.com/paslandau/37bf787eab1b84fc7ae679d1823cf401/raw/29a48bb0a43f6750858e1ddec054d3552f3cbc45/mysql2csv -O mysql2csv -q && (sha256sum mysql2csv | cmp <(echo "b109535b29733bd596ecc8608e008732e617e97906f119c66dd7cf6ab2865a65 mysql2csv") || (echo "ERROR comparing hash, Found:" ;sha256sum mysql2csv) ) && chmod +x mysql2csv
(下载 gist 的内容,检查校验和并使其可执行。)
以下生成制表符分隔且有效的CSV 输出。与大多数其他答案不同,此技术可以正确处理制表符、逗号、引号和换行符的转义,而无需任何流过滤器,例如sed、AWK或tr。
该示例展示了如何使用流将远程 MySQL 表直接通过管道传输到本地SQLite数据库。这无需 FILE 权限或 SELECT INTO OUTFILE 权限即可工作。为了便于阅读,我添加了新行。
mysql -B -C --raw -u 'username' --password='password' --host='hostname' 'databasename'
-e 'SELECT
CONCAT('\''"'\'',REPLACE(`id`,'\''"'\'', '\''""'\''),'\''"'\'') AS '\''id'\'',
CONCAT('\''"'\'',REPLACE(`value`,'\''"'\'', '\''""'\''),'\''"'\'') AS '\''value'\''
FROM sampledata'
2>/dev/null | sqlite3 -csv -separator $'\t' mydb.db '.import /dev/stdin mycsvtable'
需要在2>/dev/null
命令行上禁止有关密码的警告。
如果您的数据有 NULL,您可以在查询中使用 IFNULL() 函数。
Python 中的一个简单解决方案,它使用标头编写标准格式的 CSV 文件并将数据作为流写入(低内存使用):
import csv
def export_table(connection, table_name, output_filename):
cursor = connection.cursor()
cursor.execute("SELECT * FROM " + table_name)
# thanks to https://gist.github.com/madan712/f27ac3b703a541abbcd63871a4a56636 for this hint
header = [descriptor[0] for descriptor in cursor.description]
with open(output_filename, 'w') as csvfile:
csv_writer = csv.writer(csvfile, dialect='excel')
csv_writer.writerow(header)
for row in cursor:
csv_writer.writerow(row)
你可以像这样使用它:
import mysql.connector as mysql
# (or https://github.com/PyMySQL/PyMySQL should work but I haven't tested it)
db = mysql.connect(
host="localhost",
user="USERNAME",
db="DATABASE_NAME",
port=9999)
for table_name in ['table1', 'table2']:
export_table(db, table_name, table_name + '.csv')
db.close()
为简单起见,这故意不包括来自另一个答案的一些更花哨的东西,比如使用环境变量作为凭据,contextlib
等等。那里提到了一个关于我没有评估的行尾的微妙之处。
受Tim Harding 的回答启发,用于对 CSV 转储进行简单查询的 Tiny Bash 脚本。
#!/bin/bash
# $1 = query to execute
# $2 = outfile
# $3 = mysql database name
# $4 = mysql username
if [ -z "$1" ]; then
echo "Query not given"
exit 1
fi
if [ -z "$2" ]; then
echo "Outfile not given"
exit 1
fi
MYSQL_DB=""
MYSQL_USER="root"
if [ ! -z "$3" ]; then
MYSQL_DB=$3
fi
if [ ! -z "$4" ]; then
MYSQL_USER=$4
fi
if [ -z "$MYSQL_DB" ]; then
echo "Database name not given"
exit 1
fi
if [ -z "$MYSQL_USER" ]; then
echo "Database user not given"
exit 1
fi
mysql -u $MYSQL_USER -p -D $MYSQL_DB -B -s -e "$1" | sed "s/'/\'/;s/\t/\",\"/g;s/^/\"/;s/$/\"/;s/\n//g" > $2
echo "Written to $2"
如果您遇到错误,secure-file-priv
那么在将您的目标文件位置转移到内部C:\ProgramData\MySQL\MySQL Server 8.0\Uploads
之后以及在查询之后 -
SELECT * FROM attendance INTO OUTFILE 'C:\ProgramData\MySQL\MySQL Server 8.0\Uploads\FileName.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"' LINES TERMINATED BY '\n';
不起作用,您只需将\
(backsplash) 从查询更改为/
(forwardsplash)
那行得通!
例子:
SELECT * FROM Attendance INTO OUTFILE 'C:/ProgramData/MySQL/MySQL Server 8.0/Uploads/FileName.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"' LINES TERMINATED BY '\n';
每次运行成功查询时,每次都会生成新的 CSV 文件!很酷,对吧?
以下 Bash 脚本适用于我。它还可以选择获取所请求表的架构。
#!/bin/bash
#
# Export MySQL data to CSV
#https://stackoverflow.com/questions/356578/how-to-output-mysql-query-results-in-csv-format
#
# ANSI colors
#http://www.csc.uvic.ca/~sae/seng265/fall04/tips/s265s047-tips/bash-using-colors.html
blue='\033[0;34m'
red='\033[0;31m'
green='\033[0;32m' # '\e[1;32m' is too bright for white bg.
endColor='\033[0m'
#
# A colored message
# params:
# 1: l_color - the color of the message
# 2: l_msg - the message to display
#
color_msg() {
local l_color="$1"
local l_msg="$2"
echo -e "${l_color}$l_msg${endColor}"
}
#
# Error
#
# Show the given error message on standard error and exit
#
# Parameters:
# 1: l_msg - the error message to display
#
error() {
local l_msg="$1"
# Use ANSI red for error
color_msg $red "Error:" 1>&2
color_msg $red "\t$l_msg" 1>&2
usage
}
#
# Display usage
#
usage() {
echo "usage: $0 [-h|--help]" 1>&2
echo " -o | --output csvdirectory" 1>&2
echo " -d | --database database" 1>&2
echo " -t | --tables tables" 1>&2
echo " -p | --password password" 1>&2
echo " -u | --user user" 1>&2
echo " -hs | --host host" 1>&2
echo " -gs | --get-schema" 1>&2
echo "" 1>&2
echo " output: output CSV directory to export MySQL data into" 1>&2
echo "" 1>&2
echo " user: MySQL user" 1>&2
echo " password: MySQL password" 1>&2
echo "" 1>&2
echo " database: target database" 1>&2
echo " tables: tables to export" 1>&2
echo " host: host of target database" 1>&2
echo "" 1>&2
echo " -h|--help: show help" 1>&2
exit 1
}
#
# show help
#
help() {
echo "$0 Help" 1>&2
echo "===========" 1>&2
echo "$0 exports a CSV file from a MySQL database optionally limiting to a list of tables" 1>&2
echo " example: $0 --database=cms --user=scott --password=tiger --tables=person --output person.csv" 1>&2
echo "" 1>&2
usage
}
domysql() {
mysql --host $host -u$user --password=$password $database
}
getcolumns() {
local l_table="$1"
echo "describe $l_table" | domysql | cut -f1 | grep -v "Field" | grep -v "Warning" | paste -sd "," - 2>/dev/null
}
host="localhost"
mysqlfiles="/var/lib/mysql-files/"
# Parse command line options
while true; do
#echo "option $1"
case "$1" in
# Options without arguments
-h|--help) usage;;
-d|--database) database="$2" ; shift ;;
-t|--tables) tables="$2" ; shift ;;
-o|--output) csvoutput="$2" ; shift ;;
-u|--user) user="$2" ; shift ;;
-hs|--host) host="$2" ; shift ;;
-p|--password) password="$2" ; shift ;;
-gs|--get-schema) option="getschema";;
(--) shift; break;;
(-*) echo "$0: error - unrecognized option $1" 1>&2; usage;;
(*) break;;
esac
shift
done
# Checks
if [ "$csvoutput" == "" ]
then
error "output CSV directory is not set"
fi
if [ "$database" == "" ]
then
error "MySQL database is not set"
fi
if [ "$user" == "" ]
then
error "MySQL user is not set"
fi
if [ "$password" == "" ]
then
error "MySQL password is not set"
fi
color_msg $blue "exporting tables of database $database"
if [ "$tables" = "" ]
then
tables=$(echo "show tables" | domysql)
fi
case $option in
getschema)
rm $csvoutput$database.schema
for table in $tables
do
color_msg $blue "getting schema for $table"
echo -n "$table:" >> $csvoutput$database.schema
getcolumns $table >> $csvoutput$database.schema
done
;;
*)
for table in $tables
do
color_msg $blue "exporting table $table"
cols=$(grep "$table:" $csvoutput$database.schema | cut -f2 -d:)
if [ "$cols" = "" ]
then
cols=$(getcolumns $table)
fi
ssh $host rm $mysqlfiles/$table.csv
cat <<EOF | mysql --host $host -u$user --password=$password $database
SELECT $cols FROM $table INTO OUTFILE '$mysqlfiles$table.csv'
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n';
EOF
scp $host:$mysqlfiles/$table.csv $csvoutput$table.csv.raw
(echo "$cols"; cat $csvoutput$table.csv.raw) > $csvoutput$table.csv
rm $csvoutput$table.csv.raw
done
;;
esac
站在Chris Johnson 的肩膀上,我从 2016 年 2 月开始用一种习惯阅读的方言扩展了答案。
这个 shell 管道工具不需要连接到您的数据库,处理输入中的随机逗号和引号,并且在 Python 2和Python 3 中运行良好!
#!/usr/bin/env python
import csv
import sys
# fields are separated by tabs; double-quotes may occur anywhere
csv.register_dialect("mysql", delimiter="\t", quoting=csv.QUOTE_NONE)
tab_in = csv.reader(sys.stdin, dialect="mysql")
comma_out = csv.writer(sys.stdout, dialect=csv.excel)
for row in tab_in:
# print("row: {}".format(row))
comma_out.writerow(row)
使用该打印语句来说服自己它正在正确解析您的输入:)
一个主要的警告:在 Linux 术语中处理回车符,^M aka control-M,\r。尽管批处理模式的 MySQL 输出正确地转义了嵌入的换行符,所以每行确实有一行(由 Linux 换行符 \n 定义),MySQL 没有在列数据周围加上引号。如果数据项具有嵌入的回车符,则 csv.reader 会拒绝该输入,但会出现以下异常:
new-line character seen in unquoted field -
do you need to open the file in universal-newline mode?
请不要@我说我应该通过使用模式“rU”重新打开sys.stdin.fileno来使用通用文件模式。我试过了,它导致嵌入的 \r 字符被视为记录结束标记,因此单个输入记录被错误地转换为许多不完整的输出记录。
对于 Python 的 csv.reader 模块的这种限制,我还没有找到 Python 解决方案。我认为根本原因是他们的文档csv.reader中提到的csv.reader实施/限制:
The reader is hard-coded to recognise either '\r' or '\n' as end-of-line,
and ignores lineterminator.
我可以提供的弱且不令人满意的解决方案是在 Python 的 csv.reader 看到数据之前将每个 \r 字符更改为两个字符序列 '\n'。我使用了sed
命令。这是一个带有 MySQL 选择和上面的 Python 脚本的管道示例:
mysql -u user db --execute="select * from table where id=12345" \
| sed -e 's/\r/\\n/g' \
| mysqlTsvToCsv.py
经过一段时间的斗争,我认为 Python 不是正确的解决方案。如果你能忍受Perl,我认为artfulrobot 提供的单行脚本可能是最有效和最简单的解决方案。
如果您使用的机器上安装了 PHP,您可以编写一个 PHP 脚本来执行此操作。它要求 PHP 安装已安装 MySQL 扩展。
您可以像这样从命令行调用 PHP 解释器:
php --php-ini path/to/php.ini your-script.php
我将--php-ini
开关包括在内,因为您可能需要使用自己的 PHP 配置来启用 MySQL 扩展。在 PHP 5.3.0+ 上默认启用该扩展,因此不再需要使用配置来启用它。
然后你可以像任何普通的 PHP 脚本一样编写你的导出脚本:
<?php
#mysql_connect("localhost", "username", "password") or die(mysql_error());
mysql_select_db("mydb") or die(mysql_error());
$result = mysql_query("SELECT * FROM table_with_the_data p WHERE p.type = $typeiwant");
$result || die(mysql_error());
while($row = mysql_fetch_row($result)) {
$comma = false;
foreach ($row as $item) {
# Make it comma separated
if ($comma) {
echo ',';
} else {
$comma = true;
}
# Quote the quotes
$quoted = str_replace("\"", "\"\"", $item);
# Quote the string
echo "\"$quoted\"";
}
echo "\n";
}
?>
这种方法的优点是,它对包含换行符的文本的 varchar 和文本字段没有任何问题。这些字段被正确引用,其中的换行符将被 CSV 阅读器解释为文本的一部分,而不是记录分隔符。这是事后很难用sed左右纠正的东西。
试试这个代码:
SELECT 'Column1', 'Column2', 'Column3', 'Column4', 'Column5'
UNION ALL
SELECT column1, column2,
column3 , column4, column5 FROM demo
INTO OUTFILE '/tmp/demo.csv'
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n';
欲了解更多信息:http ://dev.mysql.com/doc/refman/5.1/en/select-into.html
此解决方案将 SQL 查询放在heredoc中,并通过过滤器管道输出:
#!/bin/bash
mysql --defaults-group-suffix=[DATABASE_NAME] --batch << EOF | python query.py
SELECT [FIELDS]
FROM [TABLE]
EOF
此版本的 Python 过滤器无需使用csv
模块即可工作:
import sys
for line in sys.stdin:
print(','.join(["\"" + str(element) + "\"" for element in line.rstrip('\n').split('\t')]))
这个版本的 Python 过滤器使用 CSV 模块,涉及的代码稍微多一些,但可以说更清楚一点:
import csv, sys
csv_reader = csv.reader(sys.stdin, delimiter='\t')
csv_writer = csv.writer(sys.stdout, quoting=csv.QUOTE_NONNUMERIC)
for line in csv_reader:
csv_writer.writerow(line)
或者你可以使用Pandas:
import csv, sys
import pandas as pd
df = pd.read_csv(sys.stdin, sep='\t')
df.to_csv(sys.stdout, index=False, quoting=csv.QUOTE_NONNUMERIC)
对于那些可能想要以 CSV 格式下载查询结果但无法访问服务器文件但无法访问数据库的人。
首先,它不是 Linux 命令。步骤如下:
Create VIEW v as (Select * from user where status = 0)
)view
您的数据库部分下创建。CSV
.Export method:
为Custom - display all possible options
并选中Put columns names in the first row
.如果您在尝试导出文件时遇到此错误
错误 1290 (HY000):MySQL 服务器正在使用 --secure-file-priv 选项运行,因此无法执行此语句
并且你无法解决这个错误,你可以通过简单地运行这个 Python 脚本来做一件事
import mysql.connector
import csv
con = mysql.connector.connect(
host="localhost",
user="root",
passwd="Your Password"
)
cur = con.cursor()
cur.execute("USE DbName")
cur.execute("""
select col1,col2 from table
where <cond>
""")
with open('Filename.csv',mode='w') as data:
fieldnames=["Field1","Field2"]
writer=csv.DictWriter(data,fieldnames=fieldnames)
writer.writeheader()
for i in cur:
writer.writerow({'Field1':i[0],'Field2':i[1]})
这避免了必须将输出写入文件,只需要expat
安装,正确转义值,并NULL
为空值输出空字符串(而不是文字)。
您告诉 MySQL 以 XML 格式输出结果(使用--xml
标志),然后通过下面的 C 程序通过管道传输结果。
这也应该非常接近执行此操作的最快方法。
// mysql-xml-to-csv.c
#include <assert.h>
#include <ctype.h>
#include <err.h>
#include <expat.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
/*
Example of MySQL XML output:
<?xml version="1.0"?>
<resultset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" statement="SELECT id as IdNum, lastName, firstName FROM User">
<row>
<field name="IdNum">100040</field>
<field name="lastName" xsi:nil="true"/>
<field name="firsttName">Cher</field>
</row>
</resultset>
*/
#define BUFFER_SIZE (1 << 16)
// These accumulate the first row column names and values until first row is entirely read (unless the "-N" flag is given)
static XML_Char **column_names;
static size_t num_column_names;
static XML_Char **first_row_values;
static size_t num_first_row_values;
// This accumulates one column's value
static XML_Char *elem_text; // note: not nul-terminated
static size_t elem_text_len;
// Flags
static int first_column;
static int reading_value;
// Expat callback functions
static void handle_elem_start(void *data, const XML_Char *el, const XML_Char **attr);
static void handle_elem_text(void *userData, const XML_Char *s, int len);
static void handle_elem_end(void *data, const XML_Char *el);
// Helper functions
static void output_csv_row(XML_Char **values, size_t num);
static void output_csv_text(const char *s, size_t len);
static void add_string(XML_Char ***arrayp, size_t *lengthp, const XML_Char *string, size_t len);
static void add_chars(XML_Char **strp, size_t *lenp, const XML_Char *string, size_t nchars);
static size_t xml_strlen(const XML_Char *string);
static void free_strings(XML_Char ***arrayp, size_t *lengthp);
static void usage(void);
int
main(int argc, char **argv)
{
char buf[BUFFER_SIZE];
int want_column_names = 1;
XML_Parser p;
FILE *fp;
size_t r;
int i;
// Parse command line
while ((i = getopt(argc, argv, "hN")) != -1) {
switch (i) {
case 'N':
want_column_names = 0;
break;
case 'h':
usage();
exit(0);
case '?':
default:
usage();
exit(1);
}
}
argv += optind;
argc -= optind;
switch (argc) {
case 0:
fp = stdin;
break;
case 1:
if ((fp = fopen(argv[0], "r")) == NULL)
err(1, "%s", argv[0]);
break;
default:
usage();
exit(1);
}
// Initialize arrays for column names and first row values
if (want_column_names) {
if ((column_names = malloc(10 * sizeof(*column_names))) == NULL)
err(1, "malloc");
if ((first_row_values = malloc(10 * sizeof(*first_row_values))) == NULL)
err(1, "malloc");
}
// Initialize parser
if ((p = XML_ParserCreate(NULL)) == NULL)
errx(1, "can't initialize parser");
XML_SetElementHandler(p, handle_elem_start, handle_elem_end);
XML_SetCharacterDataHandler(p, handle_elem_text);
// Process file
while (1) {
if ((r = fread(buf, 1, sizeof(buf), fp)) == 0 && ferror(fp))
errx(1, "error reading input");
if (XML_Parse(p, buf, r, r == 0) == XML_STATUS_ERROR)
errx(1, "line %u: %s", (unsigned int)XML_GetCurrentLineNumber(p), XML_ErrorString(XML_GetErrorCode(p)));
if (r == 0)
break;
}
// Clean up
XML_ParserFree(p);
fclose(fp);
// Done
return 0;
}
static void
handle_elem_start(void *data, const XML_Char *name, const XML_Char **attr)
{
if (strcmp(name, "row") == 0)
first_column = 1;
else if (strcmp(name, "field") == 0) {
if (column_names != NULL) {
while (*attr != NULL && strcmp(*attr, "name") != 0)
attr += 2;
if (*attr == NULL)
errx(1, "\"field\" element is missing \"name\" attribute");
add_string(&column_names, &num_column_names, attr[1], xml_strlen(attr[1]));
} else {
if (!first_column)
putchar(',');
putchar('"');
}
reading_value = 1;
}
}
static void
handle_elem_text(void *userData, const XML_Char *s, int len)
{
if (!reading_value)
return;
if (column_names != NULL)
add_chars(&elem_text, &elem_text_len, s, len);
else
output_csv_text(s, len);
}
static void
handle_elem_end(void *data, const XML_Char *name)
{
if (strcmp(name, "row") == 0) {
if (column_names != NULL) {
output_csv_row(column_names, num_column_names);
output_csv_row(first_row_values, num_first_row_values);
free_strings(&column_names, &num_column_names);
free_strings(&first_row_values, &num_first_row_values);
} else
putchar('\n');
} else if (strcmp(name, "field") == 0) {
if (column_names != NULL) {
add_string(&first_row_values, &num_first_row_values, elem_text, elem_text_len);
free(elem_text);
elem_text = NULL;
elem_text_len = 0;
} else
putchar('"');
first_column = 0;
reading_value = 0;
}
}
static void
output_csv_row(XML_Char **values, size_t num_columns)
{
int i;
for (i = 0; i < num_columns; i++) {
if (i > 0)
putchar(',');
putchar('"');
output_csv_text(values[i], xml_strlen(values[i]));
putchar('"');
}
putchar('\n');
}
static void
output_csv_text(const XML_Char *s, size_t len)
{
while (len-- > 0) {
if (*s == '"')
putchar('"');
putchar(*s);
s++;
}
}
static void
add_string(XML_Char ***arrayp, size_t *lengthp, const XML_Char *string, size_t nchars)
{
char **new_array;
if ((new_array = realloc(*arrayp, (*lengthp + 1) * sizeof(**arrayp))) == NULL)
err(1, "malloc");
*arrayp = new_array;
if (((*arrayp)[*lengthp] = malloc((nchars + 1) * sizeof(XML_Char))) == NULL)
err(1, "malloc");
memcpy((*arrayp)[*lengthp], string, nchars * sizeof(XML_Char));
(*arrayp)[*lengthp][nchars] = (XML_Char)0;
(*lengthp)++;
}
static void
add_chars(XML_Char **strp, size_t *lenp, const XML_Char *string, size_t nchars)
{
XML_Char *new_array;
if ((new_array = realloc(*strp, (*lenp + nchars) * sizeof(XML_Char))) == NULL)
err(1, "malloc");
*strp = new_array;
memcpy(*strp + *lenp, string, nchars * sizeof(XML_Char));
*lenp += nchars;
}
static size_t
xml_strlen(const XML_Char *string)
{
size_t len;
len = 0;
while (string[len] != (XML_Char)0)
len++;
return len;
}
static void
free_strings(char ***arrayp, size_t *lengthp)
{
while (*lengthp > 0)
free((*arrayp)[--*lengthp]);
free(*arrayp);
*arrayp = NULL;
}
static void
usage(void)
{
fprintf(stderr, "Usage: mysql-xml-to-csv [options] [file.xml]\n");
fprintf(stderr, "Options:\n");
fprintf(stderr, " -N\tDo not output column names as the first row\n");
fprintf(stderr, " -h\tShow this usage info\n");
}
对于那些不经常使用 C 的人,您可以通过运行以下命令来构建此代码(假设您已安装 expat 库):
gcc mysql-xml-to-csv.c -lexpat -o mysql-xml-to-csv
使用 openSUSE 15.2 和 gcc 7.5.0 测试。
Update:
现在作为github 上的开源项目提供。
这又脏又丑。它仅适用于您只有一个 PHP-*-admin 并且服务器正在使用该选项运行的特定情况--secure-file-priv
,因此您不能INTO OUTFILE '/path/to/export.csv'
在查询中使用该子句。
您可以做的是用 ... 等待它!, 解析 CSV 行CONCAT
,然后复制结果并将它们粘贴到文件中。
这是一个示例,我需要 SQL 格式(将其调整为 CSV 很简单):
SELECT CONCAT(
"('",
`username`, "', '",
`password`, "', '",
`first_name`, "', '",
`last_name`, "', '",
`gender`, "'),"
) AS `row`
FROM `users`
WHERE `role` != 'Not set'
AND `user_status` = 'Active'
ORDER BY `role`, `gender`, `user_id`
LIMIT 200
这提供了很好的、准备好导入的输出,类似于:
('jane', '3d7ff...', 'Jane', 'Doe', 'Female'),
('john', 'd2a33...', 'John', 'Doe', 'Male'),
...
您可以在 SQL 编辑器/终端中使用以下命令:
mysql -h(hostname/IP>) -u(username) -p(password) databasename <(query.sql) > outputFILE(.txt/.xls)
例如,
主机名-xxxx
unname - 用户名
密码 - 密码
DBName - 员工数据库
查询文件-employee.sql
输出文件 - 输出文件.xls
mysql -hx.xxx -uusername -ppassword employeeDB<employee.sql> outputFile.xls
确保从 SQL 查询所在的目录执行命令,或在上述命令中提及 SQL 查询位置的完整路径。
如果您在生产或任何其他无法访问文件系统的服务器上,您可以使用这个简单的技巧和一点点手动工作来获得您想要的东西。
第 1 步。只需将所有列包装在下面CONCAT
并使用as CSVFormat
MySQL 提供的选项来获得逗号分隔的结果(或使用您想要的任何分隔符)。这是一个例子:
SELECT
CONCAT(u.id,
',',
given,
',',
family,
',',
email,
',',
phone,
',',
ua.street_number,
',',
ua.route,
',',
ua.locality,
',',
ua.state,
',',
ua.country,
',',
ua.latitude,
',',
ua.longitude) AS CSVFormat
FROM
table1 u
LEFT JOIN
table2 ua ON u.address_id = ua.id
WHERE
role_policy = 31 and is_active = 1;
步骤 2. 将结果从终端复制到文件并使用任何文本编辑器清理所有管道字符(形成结果布局)。
第 3 步。另存为 .csv 文件,就是这样。