问题标签 [bins]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
9568 浏览

python - 扩展 seaborn 直方图中的 bin 范围

我正在尝试使用 seaborn 创建一个直方图,其中箱从 0 开始到 1。但是,只有 0.22 到 0.34 范围内的日期。我想要更多的空白空间以获得视觉效果,以更好地呈现数据。

我用

在这里,我为我的列表创建了一个变量,我认为应该定义直方图的 bin 范围。

直方图本身看起来像这样

直方图

它创建了一个图形位,x 的范围从 0 到 0.2050,y 的范围从 -0.04 到 0.04。和我想象的完全不同。我谷歌搜索了很长一段时间,但似乎无法找到我的具体问题的答案。

已经,谢谢你们的帮助。

0 投票
3 回答
10589 浏览

python - 在 seaborn distplot 中增加 bin 之间的空间

所以我有这个可能很简单的问题。我使用 seaborn 从 excel 文件中的数据创建了一个直方图。为了更好的可视化,我想在条/箱之间留一些空间。那可能吗?

我的代码如下所示

第二个问题虽然有点离题,但我如何让图表标题中的指数真正被提升?

谢谢!

0 投票
1 回答
3345 浏览

python - 熊猫:在箱内绘制平均值 - 需要格式化帮助

我正在做一些太阳系动力学模拟,并且一直以这个项目为借口自学一些 python/pandas。生成的数据集有超过 1000 条记录,其中包含每个涉及的天体的轨道倾角、偏心率等值。

我正在尝试使用 pandas 来研究结果数据中约 1000 个物体(“测试粒子”)的平均轨道倾角,作为半长轴的函数。

到目前为止,我一直在做的是:

1)将数据读入数据帧

2)将数据限制在半长轴值的范围内(粒子在模拟过程中“扩散”,但我想限制我的分析

3) 绘制给定箱数的倾斜度平均值

这会创建一个可接受的绘图,但在格式方面它有几个问题:除非它完全最大化以填满我的屏幕,否则沿 x 轴的数字会被挤压在一起并重叠。它们也不完全是我想看到的:它们显示了垃圾箱的最大值和最小值,我更喜欢直接按 5s 或类似的方式滴答作响。

上述命令的熊猫输出

我尝试将值传递(x=None, xticks=None)plot()上面的字符串部分,但这对结果图没有影响。我这样做的方式是否可以进行绘图/输出控制?

谢谢,

G

0 投票
0 回答
43 浏览

python - 直方图绘制 matplotlib

我有一个数字数组,我有一个数组,它的值是使用了多少时间元素的数字。我必须创建直方图,显示使用数字列表中的元素的次数。我知道直方图显示分布,但我没有得到分箱的逻辑。

此代码未显示正确的垃圾箱和数字。我该如何解决这个问题?

0 投票
1 回答
6625 浏览

python - 如何选择 numpy.histogram 中的 bin 数量?

如果我使用 matplotlib 的直方图,我可以选择 bin 的数量。但是如何在 numpy 的直方图中选择 bin 的数量?

在这种情况下,范围 = 箱数 = (12-1)+1 = 12

所以结果是 x = [ 1. 0. 1. 2. 0. 0. 0. 1. 1. 1. 0. 1.]

但是numpy的结果是

numpy = [1 1 2 0 0 0 1 1 1 1] numpy_bin = [ 1. 2.1 3.2 4.3 5.4 6.5 7.6 8.7 9.8 10.9 12. ]

使用 numpy 时,如何选择箱数(= int((max(array)) - min(array))+1)

我想要像 matplotlib 一样的结果

0 投票
2 回答
234 浏览

pandas - Python:检查两个时间点属于哪个箱

我有一个列表列表,其中包含两个值,分别代表一个开始时间点和一个结束时间点。我想计算两点之间的时间范围有多少落入垃圾箱。

垃圾箱介于 0-300,300-500 和 500-1200 之间。我还想将它们放在 0-50、50-100、100-150 等之间。

这个问题类似于Python: Checking to which bin a value belongs,但不同,因为它涉及一个两点时间范围,可以同时落入不同的 bin 中。

我在下面的代码中创建了一个 for 循环,它可以工作。但我想知道是否有更快、更 Python 的方法来计算这个,可能使用 pandas 或 numpy。

谢谢阅读

0 投票
2 回答
1884 浏览

matplotlib - pyplot x轴刻度线间距未以所有列居中

我正在努力解决我希望是对 pyplot histogram 函数的错误指定。正如您在图像中看到的,根据 align='mid' 参数,x 轴刻度线在列上的居中不一致。如有必要,我会将数据文件上传到 Dropbox。谢谢你的帮助!

pyplot 直方图

这是用于创建直方图的数据数组:1.4、1.4、1.4、1.5、1.5、1.6、1.7、1.7、1.7、1.9、1.9、1.9、1.9、2.0、2.0、2.0、2.1、2.1、2.1、2.1 , 2.2, 2.2, 2.3, 2.3, 2.3, 2.4, 2.5, 2.6, 2.7, 2.7, 2.8, 2.8, 2.8, 2.9, 2.9, 3.1, 3.1, 3.2, 3.2, 3.5, 3.6, 3.8

0 投票
1 回答
193 浏览

r - R中的事务时间

我有一份针对不同客户的银行交易清单,每笔交易都有交易时间。我需要将事务分组到 24 个 bin 中,其中每个 bin 代表一小时的间隔,例如:8-9 am、9-10 am、22-23pm 等 24 小时。所以首先我想为每笔交易的每个小时间隔分配一个 bin 编号,例如:8-9 am = "1",9-10am = "2",依此类推,直到 24。然后我会看看频率每个客户的每个箱子。例如,客户在下午 4 点到 5 点之间购买所有垃圾箱的次数等等。
我附上了我的数据的截图。

在此处输入图像描述

我用了

但它给我的输出看起来像这样 在此处输入图像描述

我正在寻找的代码应该是这样的:

等等。

0 投票
1 回答
68 浏览

python - 我怎样才能以一种聪明的方式将我的数据分类到不同的垃圾箱中

您好,我正在使用 pandas 从两个 excel 文件中导入数据,其中一个文件中包含的数据示例如下所示。基本上,我试图找到两个文件中相同的时间戳,然后将例如“电源”列中的数据排序,该列对应于两个文件中的相同时间戳到一些垃圾箱中。此示例中的 bin 从 0-50、50-100 等以 50 到例如 1000 的间隔

我想知道是否有比我到目前为止所制定的更智能的方法来做到这一点,因为箱的大小和最大值可能会改变。但这是我拥有的代码,它可以工作但不是很聪明。

0 投票
1 回答
79 浏览

r - R从关于空白的数据帧生成箱

我需要根据一列的值从 data.frame 生成箱。我已经尝试过“剪切”功能。

例如:我想在数据框中的“AirTDay”列中创建气温值箱:

我需要 bin 间隔包含与该初始值相差 2 摄氏度范围内的所有值(即 8-9.99、10-11.99、12-13.99 ...),并用该范围的平均值标记(即9.5、10.5、12.5...),并尊重空白单元格,在 bins 列中返回“NA”。

输出应如下所示:

我已经做到了:

输出表看起来是正确的,但由于某种原因,它显示了一个连续的附加列,改变了列名,并折叠了所有值以消除空白单元格。像这样的东西:

关于我在哪里失败以及如何解决它的任何想法?