问题标签 [pruning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:在不改变的情况下修剪 data.tree
在data.tree包中,当修剪一棵树时,它会永久改变这棵树。这是有问题的,因为我的 data.tree 需要很长时间才能生成,而且我不想每次必须进行新的修剪时都生成一个新的。
在这里我生成一个data.tree
在这里我修剪树。
我尝试以多种方式保存我的 data.tree 对象,但它们最终都会生成巨大的文件,或者花费的时间比从头开始生成新树的时间要长。
我的下一个直觉是看看我是否可以使用 Get 函数临时修剪树,因为 data.tree 文档指出这有两种变体:临时修剪,例如仅用于打印:这是 pruneFun 参数,例如在获得副作用或永久修剪,这意味着您要永久修改 data.tree 结构。这是通过 Prune 方法实现的。
由于没有示例,因此不清楚如何进行这项工作。
python - Tensorflow:如何保存具有修剪权重的图形
我已经对我的神经网络应用了迭代修剪,就像在这项工作中一样,将我的网络大小减少了大约 90%。这个想法是删除对我的网络不重要的边缘(权重接近于零)。我执行以下代码来保存模型和计算图(与 中的代码相同train.py
),其中sparse_w
是我们希望存储的变量名称的字典(即所有不在此字典中的变量都被修剪并可以丢弃):
当我尝试冻结我的图表进行推理时遇到了麻烦。或者一般来说,当我加载保存的图形 + 模型时。当我加载保存的图表以冻结它时:
我收到一个错误:Attempting to use uninitialized value Variable_2
。我想这是意料之中的,并且来自 tensorflow 试图使用我没有保存的权重。这很可能,因为我没有得到密集模型的这个错误(保存了所有权重变量)。
所以我想我需要一种方法来构建一个没有修剪权重的新图,然后将该图保存到pb
文件中。但是我该怎么做呢?
c# - 从 C# 代码中修剪 Mongodb 数据
我想编写一些从 sitecore 的工作中调用的 C# 代码,它基本上修剪了我们所有 1 岁以上的 mongodb 数据。执行此操作的确切C# 代码是什么?我只想删除数据,而不是删除任何“数据库”。我需要任何特定的程序集/包吗?我会为此只清理我们的 collection*.wt 和 index*.wt 文件吗?
此外,这有两个部分;一个是删除超过一年的数据,另一个是归档相同的数据。我想将 mongodb 中一年以上的所有数据导出到一些 .CSV 或 excel 备份文件中(在从 mongodb 中删除之前)。确切的 C# 代码是什么?只能使用http://www.fourthbottle.com/2015/08/mongoexport-in-mongodb.html以某种方式完成吗?如果是这样,将所有数据导出到 .CSV 文件的命令是什么,而不仅仅是特定的集合?
谢谢!
r - 在 R 中修剪决策树
所以我有一个具有 3 个不同 CP 值的决策树“c.tree1”。现在我想用精确的 CP 值修剪它,但结果与具有 3 个 CP 值的“c.tree1”相同。这很奇怪吗?
结果是:
然后我修剪它:
而c.tree2的结果和c.tree1完全一样:
我的意思是,我已经设置了一个 CP 值,但它仍然随机打印出 3。显然这不是一棵新树。有人可以帮我解决这个问题吗?谢谢!
alpha - 将 alpha beta 添加到 negamax
我正在为“连锁反应”游戏实施 Negamax 版本。这里有一个运行良好的算法版本:
现在,我想将 alpha-beta 修剪添加到我的代码中。所以我在网上看到了伪代码,我修改了这样的代码:
问题是 alpha-beta 版本返回给我一个错误的结果,我不知道为什么。有人可以帮我弄这个吗?
git - 修剪 git 分支
您可以使用以下命令修剪远程存储库中不再存在的存储库中的跟踪分支:
但是,这只会摆脱跟踪分支,而不是您另外设置的任何本地分支,例如:
有没有办法也可以修剪与修剪后的跟踪分支相关的本地非跟踪分支,或者你总是必须手动删除这些?
lda - 删除最常用的词槌
我从一个字符串列表中创建了一个由标记特征序列组成的实例列表。通过命令行,我可以根据计数、tf-idf 等(https://github.com/mimno/Mallet/blob/master/src/cc/mallet/classify/tui/Vectors2Vectors.java)修剪这些数据。但是如果我想用 Java 来做呢?如何扩展我的代码?
我的目标是删除 LDA 主题建模的最常用词。
预先感谢您的帮助!
machine-learning - 成本复杂性修剪:修剪错误
任何人都可以解释这两个陈述:
在成本复杂性修剪中,修剪后的树错误永远不会小于训练数据集上的原始树。
在成本复杂性修剪中,修剪后的树错误永远不会小于验证数据集上的原始树。
第一个陈述是正确的,而第二个陈述是错误的。
r - rpart - 查找修剪树的 cp 值将返回的叶子数
我有一个要求,我需要根据它们与我的连续变量的关联将我的分类变量(具有超过 5 个类别值)分成 5 个组。为此,我将rpart与“ annova ”方法一起使用。
因此,例如,我的分类变量是具有代码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15的类型,所以我想要 5 组这个变量。运行树后,为了只有 5 个组,我需要修剪树。我尝试的一种方法是使用cptable中的nsplit,但是 5 的 nsplit 可能会给我 7-8 片叶子,类似地4 的nsplit可能会给我 5-6 片叶子。
我一直在寻找一个选项,当我修剪时,我只得到 5 片叶子,作为我的 5 组。
有人可以建议我如何通过使用 rpart 来实现这一点。
谢谢 !!
machine-learning - RandomForestClassifier 中的 Scikit-Learn 后修剪
scikit-learn 中的 RandomForestClassifier() 是否支持后修剪?所以有诸如 max_depth 等参数,但它们更多的是在预修剪方面。
那么是否可以尽可能地构建树然后修剪树以避免过度拟合。
任何建议将不胜感激,谢谢。