我是 pandas 的新手,这是我关于 stackoverflow 的第一个问题,我正在尝试对 pandas 进行一些分析。
我有一些文本文件,其中包含要处理的数据记录。文件的每一行都匹配一个记录,哪些字段位于固定位置并且具有固定字符数的长度。同一个文件有不同种类的记录,所有记录共享第一个字段,根据记录的类型,两个字符。举个例子:
Some file:
01Jhon Smith 555-1234
03Cow Bos primigenius taurus 00401
01Jannette Jhonson 00100000000
...
field start length
type 1 2 *common to all records, example: 01 = person, 03 = animal
name 3 10
surname 13 10
phone 23 8
credit 31 11
fill of spaces
我正在编写一些代码来将一条记录转换为字典:
person1 = {'type': 01, 'name': = 'Jhon', 'surname': = 'Smith', 'phone': '555-1234'}
person2 = {'type': 01, 'name': 'Jannette', 'surname': 'Jhonson', 'credit': 1000000.00}
animal1 = {'type': 03, 'cname': 'cow', 'sciname': 'Bos....', 'legs': 4, 'tails': 1 }
如果字段为空(用空格填充),则字典中不会出现)。
对于一种类型的所有记录,我想创建一个以 dicts 键作为列名的 pandas DataFrame,我尝试使用 pandas.DataFrame.from_dict() 没有成功。
我的问题来了:有什么方法可以用 pandas 做到这一点,所以 dict 键成为列名?还有其他标准方法来处理这种文件吗?