编码
np.array([100,200,300],dtype=str)
返回:
array(['1', '2', '3'],
dtype='|S1')
文档说:
dtype :数据类型,可选
数组所需的数据类型。如果没有给出,那么类型将被确定为在序列中保存对象所需的最小类型。
这是一个错误吗?
我仍然找不到问题,但要解决它:
>>> a=[100,200,300]
>>> np.char.mod('%d', a)
array(['100', '200', '300'],
dtype='|S3')
这绕过了你的问题:
>>> a=[100,200,3005]
>>> np.char.mod('%d', a)
array(['100', '200', '3005'],
dtype='|S4')
晦涩的文档,应该注意的是,这大约比选择慢 4 倍dtype="S.."
,但非线性快于使用np.array(map(str,a))
方法。
您还可以做一些巧妙的事情:
>>> a
[1234.5, 123.4, 12345]
>>> np.char.mod('%s',a)
array(['1234.5', '123.4', '12345.0'],
dtype='|S7')
>>> np.char.mod('%f',a)
array(['1234.500000', '123.400000', '12345.000000'],
dtype='|S12')
>>> np.char.mod('%d',a) #Note the truncation of decimals here.
array(['1234', '123', '12345'],
dtype='|S5')
>>> np.char.mod('%s.stuff',a)
array(['1234.5.stuff', '123.4.stuff', '12345.0.stuff'],
dtype='|S13')
可以在此处找到其他信息。
您看到此行为的原因是您必须指定每个字符串元素的大小,例如使用:
>>> np.array([100,200,300],dtype='S3')
array(['100', '200', '300'],
dtype='|S3')
否则每个元素字符串的大小将默认为 1。
更多信息: Numpy 将数组从浮点数转换为字符串