我试图显示两个单独列表之间的相关性。在安装 Numpy 之前,我解析了世界银行数据中的 GDP 值和互联网用户数量,并将它们存储在两个单独的列表中。这是代码片段。这仅适用于 gdp07。实际上,我有更多的清单和其他数据,例如失业。
import numpy as np
file = open('final_gdpnum.txt', 'r')
gdp07 = []
for line in file:
fields = line.strip().split()
gdp07.append(fields [0])
file2 = open('internetnum.txt', 'r')
netnum07 = []
for line in file2:
fields2 = line.strip().split()
nnetnum07.append(fields2 [0])
print np.correlate(gdp07,netnum07,"full")
我得到的错误是这样的:
Traceback (most recent call last):
File "Project3,py", line 83, in ,module.
print np.correlate(gdp07, netnum07, "full")
File "/usr/lib/python2.6/site-packages/numpy/core/numeric.py", line 645, in correlate
return multiarray.correlate2(a,v,mode))
ValueError: data type must provide an itemsize
仅作记录,我在 Windows 计算机上使用 Cygwin 和 Python 2.6。我只使用 Numpy 及其依赖项及其构建的其他部分(gcc 编译器)。任何帮助都会很棒。谢谢