问题标签 [pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matplotlib - 在 IPython 中使用 Pandas 绘制股票图表
我刚刚开始使用 Python/Pandas,并将以下代码放在一起绘制标准普尔 500 指数。
看起来这是在一张图表上绘制最高价、最低价、开盘价、收盘价、调整收盘价和成交量。有没有一种简单的方法可以像在雅虎和大多数其他金融网站上那样在一张图中仅绘制 adj 收盘价和其下方的成交量?我也对绘制 OHLC 烛台图的示例感兴趣。
python - Python:Pandas,Dataframe,将 1 列数据转换为 2D 数据格式
这是我想将一维数据转换为二维数组形式的 Pandas 数据框
我如何从
python - 初始化带和不带索引的熊猫数据帧,列产生不同的结果
如果我使用以下方法来构造 a pandas.DataFrame
,我会得到一个(我认为)很特殊的输出:
当我查看平滑值时,我得到:
这似乎是以下碎片调用的聚合,它们会产生不同的结果:
再次使用DataFrame.tail()
我得到的调用:
任何人都可以提供为什么这些 DataFrame 构造方法应该不同的理由吗?
pandas - nan,浮点数和整数
我是 pandas 的新手,我首先尝试读取一个完全由1
s 和0
s 组成的表,并且我正在使用该read_csv
函数来完成它。一切正常,我得到一个以 int64 作为列类型的 DataFrame。当我引入NaN
值时,问题就出现了。在这种情况下,我得到一个列类型为float64
. 这是预期的行为吗?值是否NaN
与类型不兼容int
?
我也尝试通过 do 将 DataFrame 与 float 列一起转换DataFrame(data, dtype=numpy.int64)
,但在这种情况下,我得到类似:
python - Python Pandas 数据透视表
我正在尝试使用 Pandas 做一个频率计数的数据透视表。
我有以下代码:
这是我的输出:
这是我想要的输出:
这就是我不断得到的:
有谁知道为什么?是不是输出太大了。我似乎找不到任何东西。
python - 开源 Enthought Python 替代方案
作为一名研究生,我使用 Enthought 的 python 发行版进行数据分析,非常喜欢它。但我最近接受了一份工作,这剥夺了我使用它的能力。
我更喜欢 Python 用于初始范围界定和清理数据,而 R 用于统计方面。不过,想要这个的部分动力是尝试熊猫。另一部分是我没有适当的许可证(或支付方式),这显然是一个问题。
那么是否还有其他一些易于安装的 Python 发行版,我可以获得numpy
、、、和所有其他优点?scipy
sci-kits
python - Pandas DataFrame - 所需索引具有重复值
这是我第一次尝试熊猫。我认为我有一个合理的用例,但我绊倒了。我想将制表符分隔的文件加载到 Pandas Dataframe 中,然后按 Symbol 分组,并使用 TimeStamp 列索引的 x.axis 绘制它。这是数据的子集:
请注意有关 TimeStamp 列的两件事;
- 它有重复的值和
- 间隔不规则。
我以为我可以做这样的事情......
但是 read_csv 方法会引发异常“尝试将 1-X 列作为索引但发现重复项”。是否有允许我指定具有重复值的索引列的选项?
我也有兴趣将我的不规则时间戳间隔与一秒分辨率对齐,我仍然希望在给定的秒内绘制多个事件,但也许我可以引入一个唯一索引,然后将我的价格与它对齐?
python - pandas 中的简单交叉表
我偶然发现了pandas,它看起来非常适合我想做的简单计算。我有 SAS 背景,并认为它会取代 proc freq - 看起来它会扩展到我将来可能想做的事情。但是,我似乎无法完成一项简单的任务(我不确定我是否应该看看pivot/crosstab/indexing
- 我是否应该有一个Panel
或DataFrames
等等......)。有人可以给我一些关于如何执行以下操作的指示:
我有两个 CSV 文件(一个用于 2010 年,一个用于 2011 年 - 简单的交易数据) - 列是类别和金额
2010年:
2011年:
这些被加载到单独的 DataFrame 对象中。
我想做的是获取类别、类别的总和以及类别的频率,例如:
2010年:
2011年:
我不知道我是否应该使用pivot/crosstab/groupby/an index
等...我可以得到总和或频率 - 我似乎无法同时得到两者......它变得有点复杂,因为我想这样做一个月一个月,但我想如果有人能这么好心地指出我正确的技术/方向,我就可以从那里开始。
csv - 未知列的 read_csv 转换器
我正在尝试读取在每个单元格中保存多个值的 csv 文件,并且我想将它们编码为单个 int 格式的字节以存储在 pandas 单元格中(例如 (1, 1) -> 771)。为此,我想使用该read_csv
函数的转换器参数。问题是我事先不知道列的名称,并且要传递给转换器的值应该是一个以列名作为键的字典。事实上,我想用相同的转换器函数转换所有列。为此,最好写:
比:
这样的事情可能吗?现在要解决我正在做的问题:
但我想这种方法可能效率较低。顺便说一句,我对 to_string 方法使用的格式化程序有类似的疑问。
python - 如何使用 pandas 计算加权移动平均值
使用熊猫我可以计算
- 简单移动平均 SMA 使用
pandas.stats.moments.rolling_mean
- 指数移动平均 EMA 使用
pandas.stats.moments.ewma
但是我如何计算加权移动平均线 (WMA),如维基百科http://en.wikipedia.org/wiki/Exponential_smoothing中所述......使用熊猫?
是否有用于计算 WMA 的 pandas 函数?