问题标签 [pandas]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

235058 问题

0 投票

4 回答

5829 浏览

python - Python Pandas：导入熊猫时找不到 numpy.core.multiarray

我正在尝试让我的代码（在 eclipse 中运行）导入熊猫。

我收到以下错误："ImportError: numpy.core.multiarray failed to import"当我尝试导入熊猫时。我正在使用python2.7,pandas 0.7.1和numpy 1.5.1

2012-03-09T22:36:52.640

0 投票

1 回答

1262 浏览

python - 混合模式下的 Pandas 数据帧无法序列化为 hdf5？

在 Pandas 中，我似乎无法存储混合类型的数据框：

这给出了一个Exception: Cannot currently store mixed-type DataFrame objects in Table format

这是由于 Pandas 的某些固有限制，还是只是未来的好东西？这个限制似乎HDFStore不是很有用，因为许多数据帧将是混合类型的。

python hdf5 pandas

2012-03-10T15:35:26.590

0 投票

8 回答

262125 浏览

python - 如何将 tsv 文件加载到 Pandas DataFrame 中？

我是 python 和 pandas 的新手。我正在尝试将tsv文件加载到 pandasDataFrame中。

这就是我正在尝试的，我得到的错误：

python pandas csv

2012-03-11T06:00:56.347

0 投票

2 回答

5024 浏览

python - 使用 pandas.read_csv 从 csv 文件加载数据时如何指定 dtype？

我有一些具有以下格式的文本文件：

当我使用 read_csv 将它们加载到 DataFrame 中时，它不会为某些列生成正确的 dtype。比如第一列被解析为int，不是unicode str，第三列被解析为unicode str，不是int，因为缺少一个数据……有没有办法预设DataFrame的dtype，就像numpy.genfromtxt 呢？

更新：我read_csv这样使用导致问题：

为了同时解决 dtype 和 encoding 问题，我需要先使用unicode()and numpy.genfromtxt：

如果read_csv能添加dtype和usecols设置就好了。对不起我的贪婪。^_^

python pandas

2012-03-14T03:50:45.930

0 投票

4 回答

20066 浏览

python - 如何在 pandas 中读取固定宽度格式的文本文件？

我刚刚接触了熊猫，正在研究如何读取文件。该文件来自 WRDS 数据库，是自 1960 年代以来的 SP500 成分列表。我检查了文件，无论我做什么来导入它read_csv，我仍然无法正确显示数据。

上面的输出块是什么意思？任何事情都会有所帮助。

python pandas fixed-width

2012-03-15T14:08:31.067

0 投票

1 回答

1376 浏览

python - 如何告诉 pandas 将特定列解析为日期时间对象，但不使其成为索引？

我有一个 csv 文件，其中一列是日期/时间字符串。如何正确解析它pandas？我不想将该列设为索引。谢谢！

乌里

python parsing datetime pandas

2012-03-15T15:33:47.327

0 投票

10 回答

224712 浏览

python - Pandas 将数据帧转换为元组数组

我已经使用 pandas 操作了一些数据，现在我想执行批量保存回数据库。这需要我将数据帧转换为元组数组，每个元组对应于数据帧的“行”。

我的 DataFrame 看起来像：

我想将其转换为元组数组，例如：

关于如何有效地做到这一点的任何建议？

python pandas

2012-03-18T12:53:06.683

0 投票

1 回答

3296 浏览

python - 重复时间序列数据的 Pandas 滚动中位数

我看到 Pandas 还不允许重复的时间序列索引（https://github.com/pydata/pandas/issues/643），但很快就会添加。我想知道是否有一种好方法可以通过多索引标签/列将滚动窗口均值应用于具有重复时间的数据集

基本上，我有一个由纪元时间、分层标签（tag1、tag2）和所用时间组成的无序事件的 csv。一个小样本：

我想要做的是通过事件和事件+标签构建和绘制具有不同 ms 窗口的滚动方式。这似乎应该在 Pandas 中完成，但不确定我是否需要先等到重复的时间序列索引。现在有什么想法可以解决这个问题吗？

python matplotlib pandas

2012-03-18T20:51:48.260

0 投票

2 回答

11115 浏览

python - 使用 pandas 将索引列添加到 DataFrame

我是 pandas 的初级用户，在研究了文档之后，我仍然找不到直接的方法来执行以下操作。

我有一个带有 pandas.DateRange 索引的 DataFrame，我想添加一个列，其中包含相同 DateRange 的一部分的值。

假设我有

和

我怎样才能获得这样的东西：

python pandas

2012-03-18T22:34:26.183

0 投票

2 回答

43488 浏览

python - 在熊猫中加入或合并覆盖

我想对具有日期时间索引的数据框执行连接/合并/追加操作。

假设我有df1并且我想添加df2它。 df2可以有更少或更多的列，以及重叠的索引。对于索引匹配的所有行，如果与df2具有相同的列df1，我希望的值df1被来自的值覆盖df2。

我怎样才能获得想要的结果？

python pandas

2012-03-20T13:36:09.263

1 2 3 4 5 6 7 8 9 10

问题标签 [pandas]

Reference