1

我正在尝试在 pandas 中读取这个.txt 文件,这是我的结果。我以为(天真地)昨晚我掌握了这些东西,但显然我错了。如果我只是跑

rebull = pd.read_table('rebull.txt',sep=' ')

它有效,但它给出了我从初始 .txt RESULT中的分隔中假设的无序 NaN 数组的结果

4

2 回答 2

2

尝试跳过初始空间

In [26]: pd.read_table('test.txt', sep=' ', skipinitialspace=True)
Out[26]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385 
Data columns (total 7 columns):
Mon          386  non-null values
id           386  non-null values
NA           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_K8     386  non-null values
class.1      0  non-null values
dtypes: float64(3), object(4)

编辑

很抱歉误解了您的问题。我认为您可以阅读@DSM 提到的表格并设置列名

In [55]: pd.read_table('test.txt', sep=r"\s\s+", header=None, skiprows=[0], names=['Mon id', 'Na', 'alpha_K24', 'class', 'alpha_8', 'class'])
Out[55]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385
Data columns (total 6 columns):
Mon id       386  non-null values
Na           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_8      386  non-null values
class        386  non-null values
dtypes: float64(2), object(4)

请注意,您可以将第二个设置class为另一个名称。或者你会得到两列df['class']

于 2013-05-17T02:35:10.670 回答
0

找出我的问题...如果需要,请始终确认您的索引用连字符连接。特别是我在第一列中的“Mon id”是我的问题……应该是“Mon-id”。

于 2013-05-16T20:04:42.373 回答