问题标签 [bins]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
223 浏览

python - 创建包含计算的 bin 和数据框

在此处输入图像描述

我想创建一个新的数据框,其中“X”列将聚集在 10 个偶数箱中。然后每个集群每年需要计算一个总和:'R' * 'X',其中'R'是'h'。

编辑;

期望的最终结果示例:

垃圾箱/2012/2013/2014/Total_sum_years/Total_number_'h'

0 < 1.5 /15/8/5/28/7

0 投票
1 回答
256 浏览

histogram - tableau:为 0 到 1 之间的变量界限创建 bin

我刚开始使用 Tableau,但遇到了问题。我想创建尚未偿还的贷款百分比的直方图。我创建了一个名为“Delinquent num”的变量,将尚未偿还的贷款编码为 1,将所有其他贷款编码为 0。然后我计算了已偿还贷款的百分比(Delinquent pct)为(SUM([Delinquent num] )/COUNT([拖欠人数]))*100。

我在工作表上输入了这个变量作为 Rows 变量并得到

截屏

没事儿; 大约18%的贷款坏了。但现在我想做一个直方图。该选项未在“显示”菜单中突出显示。我试图从变量本身的下拉菜单中创建一个“bins”变量,但是我创建的变量没有提供创建 bin 的选项,我不知道为什么。提供创建垃圾箱作为 Delinquent num 的选择,但由于该变量中的所有内容都是 0 或 1,因此直方图不会非常有用。有什么建议么?

如果有用的话,这里是公共笔记本的链接。

Project3_working

0 投票
3 回答
5388 浏览

python - 使用用户定义的分类方案绘制等值线图(使用 geopandas)

我对python有点陌生,所以我希望我的问题的答案相对简单。

我正在尝试使用 geopandas 制作等值线图。但是,由于我正在制作多个需要相互比较的地图,因此使用自定义数据分类方案(而不是分位数或詹克斯)是必不可少的。因此,我一直在尝试使用 User_Defined 方案,并且我能够创建 bin,但我不知道如何将它们应用于地图本身。

这是我为创建分类方案所做的:

(其中“值”是我在地图中绘制的列)

然后当我尝试绘制等值线图时,我不知道该方案是什么意思

如果有人可以提供帮助,我将不胜感激!

谢谢 x

0 投票
1 回答
1399 浏览

matlab - MATLAB:组合和归一化具有不同样本大小的直方图

我有四组数据,我想在一张图中用 MATLAB 表示它们的分布。当前代码是:

我的问题是我对每个组有不同的采样大小,dataset1 的 n 为 69,dataset2 的 n 为 23,dataset3 和 dataset4 的 n 为 10。那么当将这三个组表示在一起时,如何对分布进行归一化?

有没有办法..例如..将每个箱中的实例除以该组的采样?

0 投票
1 回答
38 浏览

r - R、awk、sed:合并 bin 并输出中心重叠,然后中心 + 相邻重叠

我有两个文件,其中包含一些我想要重叠的范围,并根据完全匹配和部分匹配检索结果。举个例子就清楚了。

文件A:

文件B:

输出:

在这一步之前,我可以做一些事情,但下一步是我需要你的帮助。

在这里,我想首先对这些行进行子集化

  1. 仅具有 1 个匹配项(例如输出文件的第 1 行,与重叠大小无关)
  2. 如果有两个匹配项(例如输出的第 5 行和第 6 行),则重叠最多的“中心行”(将是第 6 行,因为重叠为 200,而第 5 行的重叠为 150)
  3. 如果有 3 个或超过 3 个匹配项(例如,输出的第 3 行完全重叠,但第 2 行和第 4 行是具有部分重叠的相邻行,分别为 150 和 50),那么我只想返回中心行,这将在这种情况下是第 3 行。

稍后,我想检索第一个邻居,然后是第二个邻居,依此类推,因为在实际数据集中,可能会发生文件 B 中的一个 bin 与文件 A 中最多 5 或 7 个 bin 重叠的情况。

所以,基本上我想要的是首先得到所有的中心重叠,然后是中心+第一个邻居,然后是中心+第二个邻居,依此类推。

按照这个原理,我的第一个结果将是:

结果1(中心重叠):

结果2(中心+第一个邻居):

如果可能的话,我想单独检索相邻行而不是中心行。

任何帮助都感激不尽。谢谢你。

0 投票
1 回答
2531 浏览

python - 无法使用 hist() 函数对齐日期时间对象直方图中的 bin

所以我试图绘制一些日期时间对象的直方图,但我永远无法让垃圾箱与条形对齐。我的代码如下:

我首先导入我的东西并声明开始、结束和一天对象:

然后我声明一个任意日期列表:

然后我遍历开始和结束之间的天数范围(在本例中为一周),将每个日期添加到列表中:

这样做的原因是一周中的某些日子没有出现在 date_list 中(我知道我可以在这种情况下跳过这个,但我希望它可以扩展到其他 date_lists)。

然后我用 hist() 绘图:

我已经尝试了各种 bin 格式与各种 +1 和范围和对齐方式的组合,但日期从来没有在酒吧的一致位置。

0 投票
2 回答
584 浏览

python - 关于python中值的分箱

我有一组值:-

现在,我如何将它们分组,以便十进制值将转到最接近的整数值并给出它的出现次数。即,如果值为 1.2,则应为 1.0,如果值为 8.6,则应为 9(其最接近的整数)。

我希望输出为: -

因此我可以将垃圾箱作为 x 轴及其在 y 轴上的出现次数,从而绘制图表。我怎样才能为此编写一个python程序..??

0 投票
1 回答
8044 浏览

python - Label histogram by bins matplotlib

I have a histogram in which I want to label the x-axis by bins. The histogram is plotted as a log log graph, but the bins are very specific. The graph:

The Graph

The bins:

Is there any way I can do this? I believe it would also require getting rid of the current x-axis labels.

0 投票
1 回答
29 浏览

python - 如何创建基于 bin 的矩阵?

我有一组 3-27 的值,有 20 个有限值:

我想学习如何创建一个包含 9 个 bin 的 numpy 数组,每个 bin 的范围为给定元组 [1] 的 -1 和 +1 整数,3-27 范围内的 3 的倍数(但这应该可以与整数和范围的任何其他组合互换)。最后,我希望能够创建一个看起来像这样的矩阵:

我正在阅读关于 numpy 的内容,(num, bins) = histogram(x, bins=None, range=None)但我不太确定如何去做。

我在想我必须遍历'A'以获得唯一值('a'),然后按(a-1,a + 1)进行范围,以获得我想要的箱数len(unique_values)。但后来我迷路了。谁能指导我?

0 投票
1 回答
3202 浏览

r - 如何更改 ggplot (geom_bin2d) 中 bin 的颜色以反映该区域的密度与整个数据集的平均密度之间的差异?

假设我有一些看起来有点像这样的数据

我正在使用一个看起来像这样的 geom_bin2d 图

<a href="https://i.stack.imgur.com/5p9n6.png" rel="nofollow noreferrer">情节

如何更改 bin 的颜色以反映“坏”的 x/y 点与整个数据集中该区域的总体平均值相比的百分比?即,如果左下角 bin 中“坏”点的平均值是 x 数,而 John 在该区域的平均值是 y 较低的数字,我怎样才能使 bin 颜色更深以表明他的计数较低?

我认为这可以创建平均值:

但后来我不知道如何绘制它。