“bins”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

223 浏览

python - 创建包含计算的 bin 和数据框

我想创建一个新的数据框，其中“X”列将聚集在 10 个偶数箱中。然后每个集群每年需要计算一个总和：'R' * 'X'，其中'R'是'h'。

编辑;

期望的最终结果示例：

垃圾箱/2012/2013/2014/Total_sum_years/Total_number_'h'

0 < 1.5 /15/8/5/28/7

2016-12-20T19:10:00.237

0 投票

1 回答

256 浏览

histogram - tableau：为 0 到 1 之间的变量界限创建 bin

我刚开始使用 Tableau，但遇到了问题。我想创建尚未偿还的贷款百分比的直方图。我创建了一个名为“Delinquent num”的变量，将尚未偿还的贷款编码为 1，将所有其他贷款编码为 0。然后我计算了已偿还贷款的百分比（Delinquent pct）为（SUM（[Delinquent num] )/COUNT([拖欠人数]))*100。

我在工作表上输入了这个变量作为 Rows 变量并得到

没事儿; 大约18%的贷款坏了。但现在我想做一个直方图。该选项未在“显示”菜单中突出显示。我试图从变量本身的下拉菜单中创建一个“bins”变量，但是我创建的变量没有提供创建 bin 的选项，我不知道为什么。提供创建垃圾箱作为 Delinquent num 的选择，但由于该变量中的所有内容都是 0 或 1，因此直方图不会非常有用。有什么建议么？

如果有用的话，这里是公共笔记本的链接。

Project3_working

histogram tableau-api dummy-variable bins

2017-01-02T17:10:18.553

0 投票

3 回答

5388 浏览

python - 使用用户定义的分类方案绘制等值线图（使用 geopandas）

我对python有点陌生，所以我希望我的问题的答案相对简单。

我正在尝试使用 geopandas 制作等值线图。但是，由于我正在制作多个需要相互比较的地图，因此使用自定义数据分类方案（而不是分位数或詹克斯）是必不可少的。因此，我一直在尝试使用 User_Defined 方案，并且我能够创建 bin，但我不知道如何将它们应用于地图本身。

这是我为创建分类方案所做的：

（其中“值”是我在地图中绘制的列）

然后当我尝试绘制等值线图时，我不知道该方案是什么意思

如果有人可以提供帮助，我将不胜感激！

谢谢 x

python user-defined choropleth geopandas bins

2017-01-21T18:44:23.763

0 投票

1 回答

1399 浏览

matlab - MATLAB：组合和归一化具有不同样本大小的直方图

我有四组数据，我想在一张图中用 MATLAB 表示它们的分布。当前代码是：

我的问题是我对每个组有不同的采样大小，dataset1 的 n 为 69，dataset2 的 n 为 23，dataset3 和 dataset4 的 n 为 10。那么当将这三个组表示在一起时，如何对分布进行归一化？

有没有办法..例如..将每个箱中的实例除以该组的采样？

matlab histogram distribution normalize bins

2017-02-14T17:03:47.753

0 投票

1 回答

38 浏览

r - R、awk、sed：合并 bin 并输出中心重叠，然后中心 + 相邻重叠

我有两个文件，其中包含一些我想要重叠的范围，并根据完全匹配和部分匹配检索结果。举个例子就清楚了。

文件A：

文件B：

输出：

在这一步之前，我可以做一些事情，但下一步是我需要你的帮助。

在这里，我想首先对这些行进行子集化

仅具有 1 个匹配项（例如输出文件的第 1 行，与重叠大小无关）
如果有两个匹配项（例如输出的第 5 行和第 6 行），则重叠最多的“中心行”（将是第 6 行，因为重叠为 200，而第 5 行的重叠为 150）
如果有 3 个或超过 3 个匹配项（例如，输出的第 3 行完全重叠，但第 2 行和第 4 行是具有部分重叠的相邻行，分别为 150 和 50），那么我只想返回中心行，这将在这种情况下是第 3 行。

稍后，我想检索第一个邻居，然后是第二个邻居，依此类推，因为在实际数据集中，可能会发生文件 B 中的一个 bin 与文件 A 中最多 5 或 7 个 bin 重叠的情况。

所以，基本上我想要的是首先得到所有的中心重叠，然后是中心+第一个邻居，然后是中心+第二个邻居，依此类推。

按照这个原理，我的第一个结果将是：

结果1（中心重叠）：

结果2（中心+第一个邻居）：

如果可能的话，我想单独检索相邻行而不是中心行。

任何帮助都感激不尽。谢谢你。

r awk sed merge bins

2017-05-11T17:05:36.543

0 投票

1 回答

2531 浏览

python - 无法使用 hist() 函数对齐日期时间对象直方图中的 bin

所以我试图绘制一些日期时间对象的直方图，但我永远无法让垃圾箱与条形对齐。我的代码如下：

我首先导入我的东西并声明开始、结束和一天对象：

然后我声明一个任意日期列表：

然后我遍历开始和结束之间的天数范围（在本例中为一周），将每个日期添加到列表中：

这样做的原因是一周中的某些日子没有出现在 date_list 中（我知道我可以在这种情况下跳过这个，但我希望它可以扩展到其他 date_lists）。

然后我用 hist() 绘图：

我已经尝试了各种 bin 格式与各种 +1 和范围和对齐方式的组合，但日期从来没有在酒吧的一致位置。

python datetime matplotlib histogram bins

2017-05-13T14:15:47.157

0 投票

2 回答

584 浏览

python - 关于python中值的分箱

我有一组值：-

现在，我如何将它们分组，以便十进制值将转到最接近的整数值并给出它的出现次数。即，如果值为 1.2，则应为 1.0，如果值为 8.6，则应为 9（其最接近的整数）。

我希望输出为： -

因此我可以将垃圾箱作为 x 轴及其在 y 轴上的出现次数，从而绘制图表。我怎样才能为此编写一个python程序..？？

python integer decimal bins

2017-05-25T17:14:23.547

0 投票

1 回答

8044 浏览

python - Label histogram by bins matplotlib

I have a histogram in which I want to label the x-axis by bins. The histogram is plotted as a log log graph, but the bins are very specific. The graph:

The bins:

Is there any way I can do this? I believe it would also require getting rid of the current x-axis labels.

python matplotlib histogram bins

2017-07-21T02:58:16.560

0 投票

1 回答

29 浏览

python - 如何创建基于 bin 的矩阵？

我有一组 3-27 的值，有 20 个有限值：

我想学习如何创建一个包含 9 个 bin 的 numpy 数组，每个 bin 的范围为给定元组 [1] 的 -1 和 +1 整数，3-27 范围内的 3 的倍数（但这应该可以与整数和范围的任何其他组合互换）。最后，我希望能够创建一个看起来像这样的矩阵：

我正在阅读关于 numpy 的内容，(num, bins) = histogram(x, bins=None, range=None)但我不太确定如何去做。

我在想我必须遍历'A'以获得唯一值（'a'），然后按（a-1，a + 1）进行范围，以获得我想要的箱数len(unique_values)。但后来我迷路了。谁能指导我？

python arrays numpy bins

2017-09-28T14:13:01.720

0 投票

1 回答

3202 浏览

r - 如何更改 ggplot (geom_bin2d) 中 bin 的颜色以反映该区域的密度与整个数据集的平均密度之间的差异？

假设我有一些看起来有点像这样的数据

我正在使用一个看起来像这样的 geom_bin2d 图

<a href="https://i.stack.imgur.com/5p9n6.png" rel="nofollow noreferrer">情节

如何更改 bin 的颜色以反映“坏”的 x/y 点与整个数据集中该区域的总体平均值相比的百分比？即，如果左下角 bin 中“坏”点的平均值是 x 数，而 John 在该区域的平均值是 y 较低的数字，我怎样才能使 bin 颜色更深以表明他的计数较低？

我认为这可以创建平均值：

但后来我不知道如何绘制它。

r ggplot2 dplyr bins

2017-10-04T15:59:33.927

问题标签 [bins]

Reference