585

我正在使用 Python 3.2.1,但无法导入该StringIO模块。我使用 并且它可以工作,但我io.StringIO不能像这样使用它:numpygenfromtxt

x="1 3\n 4.5 8"        
numpy.genfromtxt(io.StringIO(x))

我收到以下错误:

TypeError: Can't convert 'bytes' object to str implicitly  

当我写import StringIO它时说

ImportError: No module named 'StringIO'
4

9 回答 9

989

当我写 import StringIO 它说没有这样的模块。

来自Python 3.0 的新增功能

和模块不见了StringIOcStringIO相反,导入io 模块并分别使用io.StringIOio.BytesIO用于文本和数据。

.


修复一些 Python 2 代码以在 Python 3 中也可以工作的一种可能有用的方法(警告购买者):

try:
    from StringIO import StringIO ## for Python 2
except ImportError:
    from io import StringIO ## for Python 3

注意:此示例可能与问题的主要问题无关,并且仅作为一般解决缺失StringIO模块时要考虑的内容而包含在内。 有关更直接的解决方案消息TypeError: Can't convert 'bytes' object to str implicitly,请参阅此答案

于 2013-08-17T03:43:30.490 回答
156

就我而言,我使用过:

from io import StringIO
于 2016-03-17T10:15:11.767 回答
78

在 Python 3 上numpy.genfromtxt需要一个字节流。使用以下内容:

numpy.genfromtxt(io.BytesIO(x.encode()))
于 2012-08-15T13:44:25.480 回答
26

感谢 OP 的提问,以及 Roman 的回答。我不得不搜索一下才能找到这个;我希望以下内容对其他人有所帮助。

蟒蛇 2.7

请参阅:https ://docs.scipy.org/doc/numpy/user/basics.io.genfromtxt.html

import numpy as np
from StringIO import StringIO

data = "1, abc , 2\n 3, xxx, 4"

print type(data)
"""
<type 'str'>
"""

print '\n', np.genfromtxt(StringIO(data), delimiter=",", dtype="|S3", autostrip=True)
"""
[['1' 'abc' '2']
 ['3' 'xxx' '4']]
"""

print '\n', type(data)
"""
<type 'str'>
"""

print '\n', np.genfromtxt(StringIO(data), delimiter=",", autostrip=True)
"""
[[  1.  nan   2.]
 [  3.  nan   4.]]
"""

蟒蛇 3.5:

import numpy as np
from io import StringIO
import io

data = "1, abc , 2\n 3, xxx, 4"
#print(data)
"""
1, abc , 2
 3, xxx, 4
"""

#print(type(data))
"""
<class 'str'>
"""

#np.genfromtxt(StringIO(data), delimiter=",", autostrip=True)
# TypeError: Can't convert 'bytes' object to str implicitly

print('\n')
print(np.genfromtxt(io.BytesIO(data.encode()), delimiter=",", dtype="|S3", autostrip=True))
"""
[[b'1' b'abc' b'2']
 [b'3' b'xxx' b'4']]
"""

print('\n')
print(np.genfromtxt(io.BytesIO(data.encode()), delimiter=",", autostrip=True))
"""
[[  1.  nan   2.]
 [  3.  nan   4.]]
"""

在旁边:

dtype="|Sx",其中 x = { 1, 2, 3, ...} 中的任何一个:

类型。Python中S1和S2的区别

“|S1 和 |S2 字符串是数据类型描述符;第一个表示数组保存长度为 1 的字符串,第二个表示长度为 2....”

于 2016-05-22T23:34:17.750 回答
24

Roman Shapovalov 的代码应该在 Python 3.x 和 Python 2.6/2.7 中工作。这里又是一个完整的例子:

import io
import numpy
x = "1 3\n 4.5 8"
numpy.genfromtxt(io.BytesIO(x.encode()))

输出:

array([[ 1. ,  3. ],
       [ 4.5,  8. ]])

Python 3.x 的说明:

  • numpy.genfromtxt接受一个字节流(一个类似文件的对象,被解释为字节而不是 Unicode)。
  • io.BytesIO接受一个字节串并返回一个字节流。io.StringIO另一方面,将采用 Unicode 字符串并返回 Unicode 流。
  • x被分配一个字符串文字,在 Python 3.x 中是一个 Unicode 字符串。
  • encode()获取 Unicode 字符串x并从中生成一个字节字符串,从而给出io.BytesIO一个有效的参数。

Python 2.6/2.7 的唯一区别是它x是一个字节字符串(假设from __future__ import unicode_literals未使用),然后encode()取出字节字符串x并仍然从中生成相同的字节字符串。所以结果是一样的。


由于这是 SO 最受欢迎的问题之一StringIO,这里有一些关于 import 语句和不同 Python 版本的更多解释。

以下是接受字符串并返回流的类:

  • io.BytesIO(Python 2.6、2.7 和 3.x)- 采用字节字符串。返回一个字节流。
  • io.StringIO(Python 2.6、2.7 和 3.x)- 采用 Unicode 字符串。返回一个 Unicode 流。
  • StringIO.StringIO(Python 2.x) - 采用字节字符串或 Unicode 字符串。如果是字节串,则返回一个字节流。如果是 Unicode 字符串,则返回一个 Unicode 流。
  • cStringIO.StringIO(Python 2.x) - 更快的版本StringIO.StringIO,但不能接受包含非 ASCII 字符的 Unicode 字符串。

请注意,StringIO.StringIO导入为from StringIO import StringIO,然后用作StringIO(...)。要么,要么你这样做import StringIO,然后使用StringIO.StringIO(...). 模块名和类名恰好是相同的。它类似于datetime这种方式。

使用什么,取决于您支持的 Python 版本:

  • 如果您只支持 Python 3.x:只需使用io.BytesIOio.StringIO取决于您正在使用的数据类型。

  • 如果您同时支持 Python 2.6/2.7 和 3.x,或者正在尝试将代码从 2.6/2.7 转换到 3.x:最简单的选择仍然是使用io.BytesIOor io.StringIO。尽管StringIO.StringIO它很灵活,因此似乎更适合 2.6/2.7,但这种灵活性可能会掩盖 3.x 中出现的错误。例如,我有一些使用StringIO.StringIOio.StringIO依赖于 Python 版本的代码,但我实际上传递的是一个字节字符串,所以当我开始在 Python 3.x 中对其进行测试时,它失败了,必须修复。

    使用的另一个优点io.StringIO是支持通用换行符。如果将关键字参数传递给newline=''io.StringIO它将能够在 、 或 中的任何一个上\n分割\r\n\r。我发现这尤其StringIO.StringIO会绊倒\r

    请注意,如果您 importBytesIOStringIOfrom six,您将获得Python 2.x 和Python 3.x 中StringIO.StringIO的相应类。io如果您同意我之前段落的评估,这实际上是您应该避免的一种情况,six而只是从中导入io

  • 如果您支持 Python 2.5 或更低版本和 3.x:您将需要StringIO.StringIO2.5 或更低版本,因此您不妨使用six. 但是要意识到同时支持 2.5 和 3.x 通常非常困难,因此您应该考虑尽可能将支持的最低版本提升到 2.6。

于 2018-12-11T22:15:41.297 回答
24

您可以使用来自六个模块的StringIO :

import six
import numpy

x = "1 3\n 4.5 8"
numpy.genfromtxt(six.StringIO(x))
于 2016-05-31T16:04:35.653 回答
7

为了使此处的示例 适用于 Python 3.5.2,您可以重写如下:

import io
data =io.BytesIO(b"1, 2, 3\n4, 5, 6") 
import numpy
numpy.genfromtxt(data, delimiter=",")

更改的原因可能是文件的内容在数据(字节)中,在以某种方式解码之前不会生成文本。genfrombytes可能是一个比 . 更好的名字genfromtxt

于 2016-12-19T16:05:23.300 回答
1

这是Python 3的另一个示例。它将使用两个函数将两个数字相加,然后使用 CProfile 保存.prof文件。然后它将使用pstats.Stats和```StringIO``加载保存文件以将数据转换为字符串以供进一步使用。

主文件

import cProfile
import time
import pstats
from io import StringIO

def add_slow(a, b):
    time.sleep(0.5)
    return a+b

def add_fast(a, b):
    return a+b

prof = cProfile.Profile()

def main_func():
    arr = []
    prof.enable()
    for i in range(10):
        if i%2==0:
            arr.append(add_slow(i,i))
        else:
            arr.append(add_fast(i,i))
    prof.disable()
    #prof.print_stats(sort='time')
    prof.dump_stats("main_funcs.prof")
    return arr

main_func()
stream = StringIO();
stats = pstats.Stats("main_funcs.prof", stream=stream); 
stats.print_stats()
stream.seek(0)
print(16*'=',"RESULTS",16*'=')
print (stream.read())

用法:

python3 main.py

输出:

================ RESULTS ================
Tue Jul  6 17:36:21 2021    main_funcs.prof

         26 function calls in 2.507 seconds

   Random listing order was used

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
       10    0.000    0.000    0.000    0.000 {method 'append' of 'list' objects}
        5    2.507    0.501    2.507    0.501 {built-in method time.sleep}
        5    0.000    0.000    2.507    0.501 profiler.py:39(add_slow)
        5    0.000    0.000    0.000    0.000 profiler.py:43(add_fast)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

评论:我们可以观察到,在上面的代码中,time.sleep 函数用了大约 2.507 秒。

于 2021-07-06T09:37:29.330 回答
-1

我希望这能满足你的要求

import PyPDF4
import io

pdfFile = open(r'test.pdf', 'rb')
pdfReader = PyPDF4.PdfFileReader(pdfFile)
pageObj = pdfReader.getPage(1)
pagetext = pageObj.extractText()

for line in io.StringIO(pagetext):
    print(line)
于 2020-12-06T10:28:04.690 回答