问题标签 [subset]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 有界背包问题设置。想要:所有可能的包装清单
我不想优化任何东西,而是想列出所有可能的——包括“不完整的”——背包的包装。当然,我可以遍历对象集的所有子集并选择满足权重约束的对象(可以通过设置要查看的子集大小的上限来改进),但我真的想要更多高效的。
谢谢。
sorting - 根据另一个列表定义的顺序对列表进行排序
如何对列表A的元素进行排序,以便它们遵循另一个(超集)列表B的排序?假设没有重复。
例如A可能包含 [8 2 5 1] 而B可能包含 [5 6 9 8 7 4 1 2 3],所以我想将A排序为 [5 8 1 2]
我对有效且具有良好运行时复杂性的方法感兴趣。
c# - C# Hashtable 模板匹配
确定 Hashtable 是否包含另一个 Hashtable 的所有键/值的最佳方法是哪种?
这也可以理解为:如何判断一个Hashtable是否是另一个Hashtable的子集。
android - 检查android应用程序中的子集
所以我有一个字符串数组(我们称它为array1),然后我有另一个数组(比如array2),我想检查array2是否是array1的子集..有一个简单的命令吗?
编辑:
场景2
我有array1(这是用户通过带有字符串的编辑文本生成的人名),我有一个矩阵,我想检查每个单独的行是否是array1的子集..例如..array1 =“bob” ,“john”,“joe”,“frank”,我有一个 2x3 矩阵,其中 6 个项目中的每一个都有名称,我想检查每一行是否是 array1 的子集。所以如果矩阵的 row1 相等到 "jim" 、 "joe" 、 "frank" 和 row2 等于 "joe" 、 "bob" 、 "frank" 那么只有 row2 是 array1 的子集
r - 在 R 中,如何获取数据框的列子集,然后消除重复行?
想象一下,我有一个包含如下数据的数据框:
我只想取 A 列和 B 列,并且我想删除由于消除所有其他列(即 C 列)而成为重复的所有行。所以我对上表的期望结果是:
做这个的最好方式是什么?
linux - 找到最接近总和的数字子集
我正在寻找一种技术或算法,它会给我一个给定集合中的整数子集,当它们相加时,最接近给定的目标数。
我有一个音乐视频,我想要 248 帧的视频。我有一组不同长度的剪辑,都小于 248。我想要一个子集,当它们的长度相加时最接近 248。
linux命令行上有什么东西可以用来做这个吗?
algorithm - 查找具有属性的对象的最小子集。
我有算法问题。我不知道如何解决它。也许有人可以帮助我?
我有对象。每个对象都具有相同的特征。可以用表来说明:
现在我想找到对象的所有最小子集。对于每个特征,每个子集应至少具有一个值“1”。上表的结果有两个子集:{Object1, Object3} 和 {Object1, Object4}。我无法生成所有可能的子集,因为它可能需要太多时间。
python - Python中的子集数据
对于我正在编写的一些 Python 代码,我想在 R 中使用与子集命令等效的命令。
这是我的数据:
我想根据 和 的内容对数据进行子集col1
化col2
。(col1 中的唯一值是 100002 和 10002,col2 中的唯一值是 2006、2007 和 2008。)
这可以在 R 中使用子集命令来完成,在 Python 中是否有类似的东西?
matlab - 提取大型 Matlab 数据集子集
引用和分配 matlab 数据集的子集似乎效率极低,并且可能像 rows^2 一样缩放
例子:
alldata 是一个混合数据的大型数据集——比如 150,000 行乘 25 列(整数、布尔值和字符串)。
数据集的格式为:
然后我将 2 类型整数 cols 转换为布尔类型
以下子集分配:
对于 m = 10,000 需要 >7 秒,对于较大的 m 值需要花费大量时间。绘制时间与 m 显示了 am^2 类型的关系,这很奇怪,因为复制 alldata 几乎是瞬时的,就像使用 sortrows 和 find 之类的函数一样。事实上,读取原始 .csv 数据文件比上面对大 m 值的赋值要快。
使用分析器,似乎有一个函数 subref 包含一条非常慢的线,用于检查字符串比较以确定数据集中的唯一值。这与数据集类型的存储方式(即参考表)有关吗?数据集包含大量唯一字符串值。
他们有在matlab中提取数据集子集的任何解决方案吗?例如预分配(如何?),或复制数据集并删除行而不是分配提取/子集。
我正在使用具有 1.5Gb 内存的双核机器,但任务管理器报告使用的内存少于 1Gb。
r - 通过类范围列表对数据帧进行分类或剪切,并用 ddply 进行汇总
我对 ddply 和子集有疑问。
我有这样的数据框 df :
第一步 :
我有一个与 cut_interval 等间隔的列表,如下所示:
所以我在这里有两个级别:[0,10) 和 (10,20]
第二步 :
我希望每个组/类都由我在 v_cut 中的两个级别定义......就像这样:
第 3 步:
我想知道每个组 v_cut 的 x 轴的 v_rank 和 y 轴的时间的可变性,所以我需要用类似的东西计算 v_rank 值的 min、mean、max、sd
*想要的结果:*
我的问题
我不知道如何通过第 1 步 -> 第 2 步:/
如果可以像我在步骤 3 中的示例那样按 v_cut 分组?
是否有可能用 ddply 的“子集”选项做同样的事情?
再一次,非常感谢您的帮助伟大的 R 大师!
更新 1:
我有一个答案去 step1 到 step2 :
我正在使用 plyr,但在这种情况下可能有更好的答案?
回答到第 2 步到第 3 步?
更新 2:
Brandon Bertelsen 用 melt + cast 给了我一个很好的答案,但现在(要理解)我想用 plyr 和 ddply 进行相同的操作 .. 得到不同的结果:
我正在尝试这样的事情:
但我想在我的 sumData 数据框中有 v_cut ,我该如何处理 ddply ?有没有办法做到这一点?或者与初始 df 和 key = v_idn 合并以将列 v_cut 添加到 sumData 是唯一好的答案?