问题标签 [pruning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 我们如何修剪 R 中的神经网络?
我的模型中有 30 个自变量。我想根据变量的重要性修剪神经网络。我曾尝试使用 RSNNS 包的 mlp 函数,但我不知道可以为 "pruneFunc" 和 "pruneFuncParams" 提供哪些参数?
是否存在其他修剪神经网络的方法?
search - 具有恒定尺寸或三角形形状的凸包
我知道 QuickHull 算法在 Theta(n) 中运行,如果凸包是三角形的或者它具有恒定的大小。
这是什么意思?
我不确定形状(如果它看起来是三角形),因为该算法使用 4 个极值点。
谢谢
validation - 这两棵树的交叉验证如何工作?
我在 weka 有 1 棵树(ID3 或 J48)。它只有 25 个训练集。它学习了 100% 的准确率。我认为这对于训练集的准确性来说太高了。我如何了解天气是否存在过度拟合问题?(我想使用这 25 个火车数据本身的测试集——因为我没有任何测试)并且我知道交叉验证有利于停止过度拟合,但我想在使用交叉验证之前证明它。实际上我修剪了这棵树并比较了修剪树和未修剪树之间的交叉验证准确性。但我无法解释和理解过度拟合树和修剪树之间的准确性应该如何变化?(在这种情况下,我知道我的树有过度拟合的问题——但我怎么能推断出来呢?)其他方式呢?你能建议我吗?请注意,测试数据不可用。
r - 计算修剪后的树状图叶中特定元素的数量
我正在做一个聚类分析,我想计算某个变量在修剪树的叶子中出现的次数。下面是一个简化的示例,其中修剪的树只有三个分支。我现在想知道三个不同分支/叶子中的 As 和 B 的数量。我怎样才能得到那些?
algorithm - 减少错误修剪算法
我对此算法有疑问:
我不明白“永久修剪可以最大程度提高验证集准确性的节点”部分。我们应该保留提高准确性的节点并修剪那些增加错误率的节点。我错了吗?
c++ - 将生成的用例列表修剪/减少为一组较小的可行用例的最佳方法是什么?
这是一个大学项目。我正在用 C++ 编写,但语言与问题无关。
一些上下文:我们需要设计一个应用程序来执行以下步骤:
读入一些代表用例的数据(在我的例子中是一个简单的文本文件);
.txt 文件中的用例示例:
/li>
将 STRIDE 矩阵应用于该数据以创建误用案例
- 如果您不熟悉 STRIDE 矩阵,请不要担心 - 它与问题无关
输出创建的误用案例列表(基本上只是替换了演员和动词);
生成的误用案例示例:
/li>
将某种列表缩减算法应用于列表;
- 这是我卡住的部分
输出精简列表。
到目前为止,我有一个指向 UseCase 对象的指针数组,其中包含实体(例如用户)、关系/动词(例如地点)和目标(例如订单)的字符串。
我已经到了生成 MisUseCase 对象列表的地步,现在我需要对这个列表应用某种减少/修剪算法。除了我不知道从哪里开始。
将这样的列表减少为一组较小的可行/相关对象的最佳方法是什么?
先感谢您。
r - 看不到我在 R 代码中限制/修剪/修剪数据集的错误
我从 codereview.stackexchange (https://codereview.stackexchange.com/questions/138189/cant-see-my-error-in-r-code-to-restrict-prune-trim-dataset?noredirect= 1#comment258197_138189)这个问题。
在过去的 30 分钟里,我一直盯着这行代码,试图弄清楚为什么我不能将数据框限制在所需的范围内。
所以我有这个包含 6 列的数据框:
我想将数据框限制在某个范围内的一列 MHW_diff 的值,但数据框列的长度保持不变。
有任何想法吗?这可能是一件小事。:/
r - 修剪data.tree R中的节点
我有一个存储如下的决策树(使用 data.tree)(在 R 中):
性别¦--
男
¦ °--等级 ¦ ¦--
第三级
¦ ¦ ° --年龄 ¦ ¦ ¦--
儿童
¦ ¦ ¦ ° --无 ¦ ¦ °--成人
¦ ¦ °--无 ¦ ¦-- 1st
¦ ¦ ° --年龄 ¦ ¦
¦--
成人 ¦ ¦ ¦ °--无 ¦ ¦ °--儿童 ¦ ¦ °--有
¦ ¦--2nd
¦ ¦ ° --年龄 ¦ ¦ ¦--
成人
¦ ¦ ¦ °--无 ¦ ¦ °--儿童
¦ ¦ °--有 ¦ °--船员
¦ °--年龄 ¦
°--成人
¦ °--无 °--女性
°--班级
¦--3rd
¦ ° --年龄 ¦
¦--
儿童¦ ¦ °--无 ¦ °--成人 ¦ °--无
¦--1st
¦ ° --年龄 ¦ ¦--
成人
¦ ¦ ° --有¦ °--儿童 ¦ °--是 ¦--
第二
¦ ° --年龄 ¦ ¦--
成人
¦ ¦ ° --是 ¦ °--儿童 ¦ °--是 °--船员 °--
年龄
°
- -成人
°--是的
这棵树存储在一个变量中:根
我想修剪树(计算所有节点的卡方值,级别 = 6,如果它们的卡方值小于阈值(示例 6),则删除该节点从树上)。
任何帮助将非常感激。
编辑:我正在使用以下数据集:
"","Class","Sex","Age","Survived"
"1","1st","Male","Child","No"
"2" ,"2nd","Male","Child","No"
"3","3rd","Male","Child","No"
.
.
.