1

是否有将描述性版本附加到索引列?

例如,我使用 ISO3 CountryCode 从不同的数据源“AUS”-> 澳大利亚等进行合并。这对于合并不同的数据源非常方便,但是当我想打印数据时,我想要描述版本(即澳大利亚)。我正在想象一个附加到“CountryCode”的索引列的字典(其中 CountryCode 是键,CountryName 是值)和一个将打印值而不是用于数据操作的键的标志。

生成我自己的 Dictionary() 的最佳解决方案,然后在打印或绘制图表时合并国家名称?这没关系,除了在数据框对象中携带所有数据集信息会很好。

4

2 回答 2

1

我认为最简单的解决方案将其拆分为 DataFrame 中的两列,一列用于 country_code 和 country_name(您可以将它们命名为其他名称)。

当您打印或绘制图表时,您可以选择使用哪一列。

于 2013-02-22T03:42:37.093 回答
0

index 选项有一个 format 方法,可以让你以函数的形式应用格式化程序:

In [1]: df = DataFrame([1,2], index=['AUS','CAN']); df
Out[1]:
     0
AUS  1
CAN  2

In [2]: d = {'AUS':'Australia', 'CAN':'Canada'}

In [3]: df.index.format(formatter = lambda x: d.get(x, x))
Out[3]: ['Australia', 'Canada']

不过,我不确定您将如何实际使用它。

于 2013-02-22T03:43:41.123 回答