问题标签 [pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Pandas:导入熊猫时找不到 numpy.core.multiarray
我正在尝试让我的代码(在 eclipse 中运行)导入熊猫。
我收到以下错误:"ImportError: numpy.core.multiarray failed to import"
当我尝试导入熊猫时。我正在使用python2.7
,pandas 0.7.1
和numpy 1.5.1
python - 混合模式下的 Pandas 数据帧无法序列化为 hdf5?
在 Pandas 中,我似乎无法存储混合类型的数据框:
这给出了一个Exception: Cannot currently store mixed-type DataFrame objects in Table format
这是由于 Pandas 的某些固有限制,还是只是未来的好东西?这个限制似乎HDFStore
不是很有用,因为许多数据帧将是混合类型的。
python - 如何将 tsv 文件加载到 Pandas DataFrame 中?
我是 python 和 pandas 的新手。我正在尝试将tsv
文件加载到 pandasDataFrame
中。
这就是我正在尝试的,我得到的错误:
python - 使用 pandas.read_csv 从 csv 文件加载数据时如何指定 dtype?
我有一些具有以下格式的文本文件:
当我使用 read_csv 将它们加载到 DataFrame 中时,它不会为某些列生成正确的 dtype。比如第一列被解析为int,不是unicode str,第三列被解析为unicode str,不是int,因为缺少一个数据……有没有办法预设DataFrame的dtype,就像numpy.genfromtxt 呢?
更新:我read_csv
这样使用导致问题:
为了同时解决 dtype 和 encoding 问题,我需要先使用unicode()
and numpy.genfromtxt
:
如果read_csv
能添加dtype
和usecols
设置就好了。对不起我的贪婪。^_^
python - 如何在 pandas 中读取固定宽度格式的文本文件?
我刚刚接触了熊猫,正在研究如何读取文件。该文件来自 WRDS 数据库,是自 1960 年代以来的 SP500 成分列表。我检查了文件,无论我做什么来导入它read_csv
,我仍然无法正确显示数据。
上面的输出块是什么意思?任何事情都会有所帮助。
python - 如何告诉 pandas 将特定列解析为日期时间对象,但不使其成为索引?
我有一个 csv 文件,其中一列是日期/时间字符串。如何正确解析它pandas
?我不想将该列设为索引。谢谢!
乌里
python - Pandas 将数据帧转换为元组数组
我已经使用 pandas 操作了一些数据,现在我想执行批量保存回数据库。这需要我将数据帧转换为元组数组,每个元组对应于数据帧的“行”。
我的 DataFrame 看起来像:
我想将其转换为元组数组,例如:
关于如何有效地做到这一点的任何建议?
python - 重复时间序列数据的 Pandas 滚动中位数
我看到 Pandas 还不允许重复的时间序列索引(https://github.com/pydata/pandas/issues/643),但很快就会添加。我想知道是否有一种好方法可以通过多索引标签/列将滚动窗口均值应用于具有重复时间的数据集
基本上,我有一个由纪元时间、分层标签(tag1、tag2)和所用时间组成的无序事件的 csv。一个小样本:
我想要做的是通过事件和事件+标签构建和绘制具有不同 ms 窗口的滚动方式。这似乎应该在 Pandas 中完成,但不确定我是否需要先等到重复的时间序列索引。现在有什么想法可以解决这个问题吗?
python - 使用 pandas 将索引列添加到 DataFrame
我是 pandas 的初级用户,在研究了文档之后,我仍然找不到直接的方法来执行以下操作。
我有一个带有 pandas.DateRange 索引的 DataFrame,我想添加一个列,其中包含相同 DateRange 的一部分的值。
假设我有
和
我怎样才能获得这样的东西:
python - 在熊猫中加入或合并覆盖
我想对具有日期时间索引的数据框执行连接/合并/追加操作。
假设我有df1
并且我想添加df2
它。 df2
可以有更少或更多的列,以及重叠的索引。对于索引匹配的所有行,如果与df2
具有相同的列df1
,我希望 的值df1
被来自 的值覆盖df2
。
我怎样才能获得想要的结果?