我想在 python 中加载一个 ARFF 文件,然后更改它的一些值,然后将更改保存到文件中。我正在使用LIAC-ARFF
包(https://pypi.python.org/pypi/liac-arff)。我使用以下代码行加载了 ARFF 文件:
import arff
data = arff.load(open(FILE_NAME, 'rb'))
在内部操作了一些值之后data
,我想写入data
另一个 ARFF 文件。有什么解决办法吗?
我想在 python 中加载一个 ARFF 文件,然后更改它的一些值,然后将更改保存到文件中。我正在使用LIAC-ARFF
包(https://pypi.python.org/pypi/liac-arff)。我使用以下代码行加载了 ARFF 文件:
import arff
data = arff.load(open(FILE_NAME, 'rb'))
在内部操作了一些值之后data
,我想写入data
另一个 ARFF 文件。有什么解决办法吗?
使用以下代码:
import arff
data = arff.load(open(FILE_NAME, 'rb'))
f = open(outputfilename, 'wb')
arff.dump(data, f)
f.close()
在LICA-ARFF
描述中,您会看到dump
序列化为文件的方法,但这是错误的。它只是将对象写入文本文件。序列化意味着保存整个对象,因此输出文件是二进制文件而不是文本文件。
我们可以使用 scipy 将 arff 数据加载到 python 中。
from scipy.io import arff
import pandas as pd
data = arff.loadarff('dataset.arff')
df = pd.DataFrame(data[0])
df.head()