问题标签 [discretization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2176 浏览

python - OpenAI Gym 自定义环境:具有真实值的离散观察空间

我想创建具有离散状态空间但具有浮点值的自定义 openai 健身房环境。更准确地说,它应该是一个步长为 0.25 的值范围:10.0、10.25、10.5、10.75、11.0、...、19.75、20.0

有没有办法在 openai 健身房自定义环境中使用 Discrete、Box、MultiDiscrete 或其他一些空间来做到这一点?Discrete 需要一个整数,而 Box 似乎没有某种 step 参数。

0 投票
1 回答
165 浏览

image - D3.JS:用于图像处理的离散滤波器

我有一个任意的光栅图案,其中蓝色为 -1.0,白色为 0.0,橙色为 1.0(左图)。需要开发一个 SVG 过滤器,类似于此参考Graying out an image in D3js),但用于离散化(右图)。

在此处输入图像描述

最终,所有三种颜色的值都是已知的。

可以肯定的是,基本上,我需要遍历每个像素并计算到蓝色和橙色的距离并设置最接近的。

但是,我不知道我应该从这些https://developer.mozilla.org/en-US/docs/Web/SVG/Element/filter中使用哪种过滤方法(另见下方)。

而且,也许还有另一种不基于距离计算的解决方案?

0 投票
0 回答
78 浏览

matlab - 2D 区域最优离散化(分割)

我在 XY 域中有许多有限长度曲线。这些曲线表示为点的集合。

例如,我需要通过矩形(或三角形)离散化我的区域,以便每个矩形(或三角形)与多于 2 条曲线和少于 5 条曲线相交。即使在任何矩形中都没有点,但插值曲线在那个矩形中,那么这条曲线也会穿过那个矩形。相邻矩形的边缘应该相互靠近(相互接触),并且这些矩形应该覆盖所有存在曲线的区域。

作为输出,我需要获取每个矩形(三角形)的 XY 坐标。我试图在下图中解释我的问题。所以也许有人知道如何解决这个问题或者问题已经解决了。我将不胜感激任何信息!我正在尝试在Matlab中实现这一点,我想知道是否可以使用 Matlab 中的linprog()函数来解决这个问题?

谢谢!

要绘制曲线,请使用:

图像:带有矩形的二维区域

带曲线的文件:.mat 文件

0 投票
1 回答
80 浏览

matlab - x 和 y 的离散域,点之间的间隔为 0.01

我正在寻找使用 x 和 y 变量从公式计算数组,x 的域是 (0,50) 和 y 是 (0,30) 。我被要求将 x 和 y 的域离散化,点之间的间隔为 0.01,然后计算 L(x,y) (我有一个公式)(这将是图的点,最终我正在寻找最小值点之间的长度)

我不确定我需要在脚本中定义什么,因为如果我将 x 和 y 定义为间距为 0.01 的数组,它们最终会变得不均匀并且无法计算,因为数组不均匀

我收到一个错误,告诉我这两个矩阵甚至都没有,这对不工作是有意义的,但我不确定如何定义一个矩阵,该矩阵将导致我所追求的最小 x 和 y 值。

任何帮助将不胜感激。

0 投票
1 回答
159 浏览

c# - 网状矩形结构

什么是最好的方法,如您在此处看到的那样对矩形结构进行网格划分: 网格结构 这里的特别之处在于,薄的灰色结构和大的白色间隙之间的尺寸差异很大。因此,常规recangle-grid可能不是最佳选择。

我尝试了一个Quadtree,我从一个 10x10 网格开始并将一个单元格分成四个,如果该单元格包含灰色和白色结构。但是我得到了不必要的大量细胞。

Voronoi也可能不是最好的选择,因为我的形状总是完美的矩形。

有没有办法从一开始就考虑到结构的形状?

0 投票
2 回答
8519 浏览

python - 将 pandas Interval 转换为字符串(然后再返回)

我对 Python 比较陌生,正在尝试准备一些数据来训练 RandomForest。由于各种原因,我们希望数据是离散的,所以有几个连续变量需要离散化。我qcut在 pandas 中发现,它似乎可以满足我的要求 - 我可以设置多个 bin,它会将变量离散化为多个 bin,试图保持每个 bin 中的计数均匀。

但是,输出的pandas.qcut是一个区间列表,而 scikit-learn 中的 RandomForest 分类器需要一个字符串。我发现我可以使用.astype(str). 这是我正在做的一个简单示例:

然后 str_cuts 是传入随机森林的变量之一。

但是,该系统的目的是训练一个 RandomForest,将其保存到一个文件中,然后允许有人在以后加载它并获得一个新测试实例的分类,这在训练时是不可用的。并且由于分类器是在离散数据上训练的,新的测试实例需要在使用之前进行离散化。所以我想要做的是在一个新实例中读取,将已经建立的离散化方案应用于它,将其转换为字符串,然后通过随机森林运行它。但是,我对“应用离散化方案”的最佳方式感到困惑。

有没有简单的方法来处理这个?我认为没有直接的方法可以将字符串转换回间隔。我可以从离散化中获取所有 Interval 值的列表(例如:)cuts.unique()并在测试时应用它,但这需要在随机森林旁边保存/加载离散化字典,这看起来很笨重,我担心会遇到问题试图重新创建一个分类变量(主要来自 R,它对分类变量的格式非常特别)。还是有另一种我没有看到的解决方法?

0 投票
0 回答
47 浏览

r - 根据数值范围从数据框中的因子列获取级别

我试图根据它在数据框中因子列的值范围内的位置来获取数字的级别。

我正在尝试根据新值获取因子标签。给定一个值 5.5,有没有办法获取标签?

所以我可以将它分配给一个变量?像这样的东西?

0 投票
1 回答
1157 浏览

python-3.x - Sklearn Binning Process - 可以返回一个间隔吗?

我正在尝试使用KBinsDiscretizerfrom sklearn.preprocessing,但它返回整数值 1,2,..,N (表示间隔)。是否可以将正确的间隔返回为(0.2, 0.5)或者尚未实现?

0 投票
2 回答
113 浏览

c# - 在以 100 为中心的区间内四舍五入到最接近的数字

我想在以 100 为中心的输入间隔中舍入一个数字(向上或向下)(不完全是内部长度的倍数)。这里有些例子:

例 1:长度 = 3,中心 = 100,输入 = 99.76,向下取整 = True => 离散区间为 [..., 97, 100, 103,...] 并且输出 = 97。

Ex 2: Length=4, Center=100, Input=95.5, Round Down=False => 离散区间为 [..., 96, 100, 104,...] 和 Output=96

Ex 3: Length=6, Center=100, Input=101.1, Round Down=False => 离散区间为 [..., 94, 100, 106,...] 和 Output=106

我有一个生成间隔的想法,然后使用循环滚动并找到第一个值。

我将如何在 C# 中执行此操作?

我试过的:

问题是这看起来是长度的倍数,但它并不以 100 为中心。

我想我需要这样的东西,但它需要处理所有的数字情况:

这似乎适用于大于 Center 的数字,但在其他情况下失败。


编辑:我认为这适用于所有情况:

0 投票
0 回答
182 浏览

r - 交叉验证中的 R 插入符号离散化

我正在使用 R caret 包,我想将离散化函数应用于交叉验证中的所有预测变量。

例如使用此代码:

我想仅使用训练折叠discretizeDF.supervised来学习正确的组,然后将其应用于测试折叠. 只要有监督,我不介意使用任何其他库/函数进行离散化。

AFAIK这是进行离散化的正确方法,因此它必须是一种方法。我一直在阅读有关“食谱”的信息,但我无法让它发挥作用。