0

我正在将带有特殊字符(å、ä、ö)的 JSON 数据写入文件,然后将其读回。然后我在子进程命令中使用这些数据。使用读取数据时,我无法将特殊字符分别翻译回 å、ä 和 ö。

运行下面的 python 脚本时,列表“命令”打印为:

['cmd.exe', '-Name=M\xc3\xb6tley', '-Bike=H\xc3\xa4rley', '-Chef=B\xc3\xb6rk']

但我希望它像这样打印:

['cmd.exe', '-Name=Mötley', '-Bike=Härley', '-Chef=Börk']

Python脚本:

# -*- coding: utf-8 -*-

import os, json, codecs, subprocess, sys


def loadJson(filename):
    with open(filename, 'r') as input:
        data = json.load(input)
    print 'Read json from: ' + filename
    return data

def writeJson(filename, data):
    with open(filename, 'w') as output:
        json.dump(data, output, sort_keys=True, indent=4, separators=(',', ': '))
    print 'Wrote json to: ' + filename



# Write JSON file
filename = os.path.join( os.path.dirname(__file__) , 'test.json' )
data = { "Name" : "Mötley", "Bike" : "Härley", "Chef" : "Börk" }
writeJson(filename, data)


# Load JSON data
loadedData = loadJson(filename)


# Build command
command = [ 'cmd.exe' ]

# Append arguments to command
arguments = []
arguments.append('-Name=' + loadedData['Name'] )
arguments.append('-Bike=' + loadedData['Bike'] )
arguments.append('-Chef=' + loadedData['Chef'] )
for arg in arguments:
    command.append(arg.encode('utf-8'))

# Print command (my problem; these do not contain the special characters)
print command

# Execute command
p = subprocess.Popen( command , stdout=subprocess.PIPE, stderr=subprocess.STDOUT)

# Read stdout and print each new line
sys.stdout.flush()
for line in iter(p.stdout.readline, b''):
    sys.stdout.flush()
    print(">>> " + line.rstrip())
4

1 回答 1

3

这是 Python 中字符串常量的规范表示,旨在消除编码问题。实际上,这repr()是字符串返回的内容。List 的str()函数实现,当它被打印时调用repr()它的成员来表示它们。

输出具有非 ASCII 字符的字符串的唯一方法是将print其写入或以其他方式将其写入流。请参阅为什么 Python 在默认编码为 ASCII 时打印 unicode 字符?关于如何在打印时进行字符转换。另请注意,对于非 ASCII 8 位字符,为不同代码页设置的终端的输出将有所不同。

关于解决方案:

最简单的方法是创建一个替代str(list)实现来调用str()而不是repr()- 注意上面的警告。

def list_nativechars(l):
  assert isinstance(l,list)
  return "[" + ", ".join('"'+str(i)+'"' for i in l) + "]"

现在(在cp866控制台编码中):

>>> l=["йцукен"]
>>> print list_nativechars(l)
["йцукен"]

使用外部编码的数据:

# encoding: cp858
<...>
l= ['cmd.exe', '-Name=Mötley', '-Bike=Härley', '-Chef=Börk']
print list_nativechars(l)

c:\>python t.py
["cmd.exe", "-Name=MФtley", "-Bike=HДrley", "-Chef=BФrk"]
于 2013-10-02T14:02:19.333 回答