问题标签 [bins]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
histogram - tableau:为 0 到 1 之间的变量界限创建 bin
我刚开始使用 Tableau,但遇到了问题。我想创建尚未偿还的贷款百分比的直方图。我创建了一个名为“Delinquent num”的变量,将尚未偿还的贷款编码为 1,将所有其他贷款编码为 0。然后我计算了已偿还贷款的百分比(Delinquent pct)为(SUM([Delinquent num] )/COUNT([拖欠人数]))*100。
我在工作表上输入了这个变量作为 Rows 变量并得到
没事儿; 大约18%的贷款坏了。但现在我想做一个直方图。该选项未在“显示”菜单中突出显示。我试图从变量本身的下拉菜单中创建一个“bins”变量,但是我创建的变量没有提供创建 bin 的选项,我不知道为什么。提供创建垃圾箱作为 Delinquent num 的选择,但由于该变量中的所有内容都是 0 或 1,因此直方图不会非常有用。有什么建议么?
如果有用的话,这里是公共笔记本的链接。
python - 使用用户定义的分类方案绘制等值线图(使用 geopandas)
我对python有点陌生,所以我希望我的问题的答案相对简单。
我正在尝试使用 geopandas 制作等值线图。但是,由于我正在制作多个需要相互比较的地图,因此使用自定义数据分类方案(而不是分位数或詹克斯)是必不可少的。因此,我一直在尝试使用 User_Defined 方案,并且我能够创建 bin,但我不知道如何将它们应用于地图本身。
这是我为创建分类方案所做的:
(其中“值”是我在地图中绘制的列)
然后当我尝试绘制等值线图时,我不知道该方案是什么意思
如果有人可以提供帮助,我将不胜感激!
谢谢 x
matlab - MATLAB:组合和归一化具有不同样本大小的直方图
我有四组数据,我想在一张图中用 MATLAB 表示它们的分布。当前代码是:
我的问题是我对每个组有不同的采样大小,dataset1 的 n 为 69,dataset2 的 n 为 23,dataset3 和 dataset4 的 n 为 10。那么当将这三个组表示在一起时,如何对分布进行归一化?
有没有办法..例如..将每个箱中的实例除以该组的采样?
r - R、awk、sed:合并 bin 并输出中心重叠,然后中心 + 相邻重叠
我有两个文件,其中包含一些我想要重叠的范围,并根据完全匹配和部分匹配检索结果。举个例子就清楚了。
文件A:
文件B:
输出:
在这一步之前,我可以做一些事情,但下一步是我需要你的帮助。
在这里,我想首先对这些行进行子集化
- 仅具有 1 个匹配项(例如输出文件的第 1 行,与重叠大小无关)
- 如果有两个匹配项(例如输出的第 5 行和第 6 行),则重叠最多的“中心行”(将是第 6 行,因为重叠为 200,而第 5 行的重叠为 150)
- 如果有 3 个或超过 3 个匹配项(例如,输出的第 3 行完全重叠,但第 2 行和第 4 行是具有部分重叠的相邻行,分别为 150 和 50),那么我只想返回中心行,这将在这种情况下是第 3 行。
稍后,我想检索第一个邻居,然后是第二个邻居,依此类推,因为在实际数据集中,可能会发生文件 B 中的一个 bin 与文件 A 中最多 5 或 7 个 bin 重叠的情况。
所以,基本上我想要的是首先得到所有的中心重叠,然后是中心+第一个邻居,然后是中心+第二个邻居,依此类推。
按照这个原理,我的第一个结果将是:
结果1(中心重叠):
结果2(中心+第一个邻居):
如果可能的话,我想单独检索相邻行而不是中心行。
任何帮助都感激不尽。谢谢你。
python - 无法使用 hist() 函数对齐日期时间对象直方图中的 bin
所以我试图绘制一些日期时间对象的直方图,但我永远无法让垃圾箱与条形对齐。我的代码如下:
我首先导入我的东西并声明开始、结束和一天对象:
然后我声明一个任意日期列表:
然后我遍历开始和结束之间的天数范围(在本例中为一周),将每个日期添加到列表中:
这样做的原因是一周中的某些日子没有出现在 date_list 中(我知道我可以在这种情况下跳过这个,但我希望它可以扩展到其他 date_lists)。
然后我用 hist() 绘图:
我已经尝试了各种 bin 格式与各种 +1 和范围和对齐方式的组合,但日期从来没有在酒吧的一致位置。
python - 关于python中值的分箱
我有一组值:-
现在,我如何将它们分组,以便十进制值将转到最接近的整数值并给出它的出现次数。即,如果值为 1.2,则应为 1.0,如果值为 8.6,则应为 9(其最接近的整数)。
我希望输出为: -
因此我可以将垃圾箱作为 x 轴及其在 y 轴上的出现次数,从而绘制图表。我怎样才能为此编写一个python程序..??
python - 如何创建基于 bin 的矩阵?
我有一组 3-27 的值,有 20 个有限值:
我想学习如何创建一个包含 9 个 bin 的 numpy 数组,每个 bin 的范围为给定元组 [1] 的 -1 和 +1 整数,3-27 范围内的 3 的倍数(但这应该可以与整数和范围的任何其他组合互换)。最后,我希望能够创建一个看起来像这样的矩阵:
我正在阅读关于 numpy 的内容,(num, bins) = histogram(x, bins=None, range=None)
但我不太确定如何去做。
我在想我必须遍历'A'以获得唯一值('a'),然后按(a-1,a + 1)进行范围,以获得我想要的箱数len(unique_values)
。但后来我迷路了。谁能指导我?
r - 如何更改 ggplot (geom_bin2d) 中 bin 的颜色以反映该区域的密度与整个数据集的平均密度之间的差异?
假设我有一些看起来有点像这样的数据
我正在使用一个看起来像这样的 geom_bin2d 图
<a href="https://i.stack.imgur.com/5p9n6.png" rel="nofollow noreferrer">情节
如何更改 bin 的颜色以反映“坏”的 x/y 点与整个数据集中该区域的总体平均值相比的百分比?即,如果左下角 bin 中“坏”点的平均值是 x 数,而 John 在该区域的平均值是 y 较低的数字,我怎样才能使 bin 颜色更深以表明他的计数较低?
我认为这可以创建平均值:
但后来我不知道如何绘制它。