问题标签 [subset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3911 浏览

sql - 子集上的 SQL 选择

我需要检查数据库中是否存在一行;但是,我正在尝试找到提供最佳性能的方法。最好用一个例子来概括这一点。

假设我有下表:

假设该表有数百万行,但只有该列Company有索引。

我想知道FirstName,LastName和的特定组合是否Company存在。我知道我可以这样做:

但是,除非我弄错了,否则它将进行全表扫描。

我真正想做的是一个使用索引的查询。通过上面的表格,我知道下面的查询会有很好的性能,因为它使用了索引:

无论如何只对那个数据子集进行搜索?例如这样的:

这样,它只会对更窄的数据集合进行表扫描。

我知道上面的查询不起作用,但是有没有查询可以呢?

哦,我无法创建临时表,因为用户只有读取权限。

0 投票
3 回答
331 浏览

algorithm - 算法:从集合中删除尽可能少的元素以强制没有子集

我遇到了一个我不知道如何解决的问题:

我有一套A = {A_1, A_2, ..., A_n},我也有一套B

B现在的目标是从(创建)中删除尽可能少B'的元素,这样,在删除所有元素后1 <= i <= nA_i不是的子集B'

例如,如果我们有A_1 = {1,2}, A_2 = {1,3,4}, A_3={2,5}, 和B={1,2,3,4,5},我们可以例如从中删除 1 和 2 B(这将产生B'={3,4,5},这不是其中之一的超集A_i)。

是否有确定要删除的(最少)元素的算法?

0 投票
3 回答
155 浏览

algorithm - 查找给定集合是否是集合的完美子集的更好方法是什么 - 如果给定子集未排序?

找出给定集合(未排序)是否是主集合的完美子集的最佳方法是什么。我必须在我的程序中进行一些验证,在那里我必须将客户端请求集与注册的内部能力集进行比较。

我想通过对内部能力集进行排序(一旦注册就不会改变)并对客户端请求集中的每个元素进行二进制搜索。这是我能得到的最好的吗?我怀疑可能有更好的方法。

任何的想法?

问候,

微内核

0 投票
3 回答
17301 浏览

r - 对具有多个条件的 data.frame 进行子集化

假设我的数据如下所示:

我希望能够按分析物进行子集化,并在日期上进行部分匹配(即我只想要年份)。我一直在尝试这个,但我知道这不太正确。

有什么建议么?

0 投票
1 回答
3968 浏览

r - 在函数中使用子集但脚本中没有错误时,R 错误承诺已经在评估中

运行以下函数时出现一个奇怪的错误:

使用以下数据:

我得到的错误是:

此错误发生在mydata2我获取数据子集的行上。我似乎无法调试它,因为如果我改为在解释器中运行函数的每一行,我将不再收到错误。是什么赋予了?

0 投票
1 回答
987 浏览

ruby-on-rails - 如何在 Rails 中隔离/检索/计算返回记录的子集

我正在为 Rails 应用程序编写报告仪表板。仪表板用于用户数据,目前它正在运行多个计数和选择查询以在页面上构建四个或五个报告。我确信有一种更有效的方法可以做到这一点。我将如何构建控制器方法以使其仅运行一个查询,然后解析/细分各个报告所需的子集?

例如,用户具有性别、年龄和收入范围。而不是做

我可以只做一个吗

然后解析出我需要什么?

任何帮助表示赞赏。

谢谢你。

0 投票
1 回答
3204 浏览

r - 从单列数据框中删除行

当我尝试从单列数据框中删除最后一行时,我得到一个向量而不是数据框:

我正在寻找的行为是当我在两列数据框上使用此命令时会发生什么:

我的代码是通用的,我不知道数据框是否包含一列或多列。这个问题是否有一个简单的解决方法,无论存在多少列,我都可以删除最后一行?

0 投票
1 回答
1717 浏览

r - 如何使用随机选择的列索引向量从矩阵中选择多个变量?

希望这有一个我无法找到的简单答案:

我正在尝试编写一个模拟,该模拟将比较大型矩阵的不同行(主题)和列(变量)子集上的许多统计过程。

使用主题 ID 号的行子集相当容易sample(),但我在列方面遇到了更多麻烦。

本质上,我想做的是创建列索引号的随机样本,然后将其用于创建新矩阵。到目前为止,最接近我的是:

这给了我一个字符串,它对testmat[,column.ind]每个采样的索引号都有一个。有什么方法可以轻松地将它插入一个cbind()函数来制作一个新矩阵?还有其他我想念的明显方式吗?

我已经能够使用循环(即cbind(matrix,newcolumn)一遍又一遍)来做到这一点,但这相当慢,因为我使用的矩阵非常大,我会这样做很多次。我希望有一个更优雅和更快的双线解决方案。

0 投票
3 回答
2186 浏览

sorting - R - 对列中的最大值进行排序和子设置

我正在尝试对列中的数据进行迭代排序以提取 N 个最大值。

我的数据设置为包含职业名称和代码的第一列和第二列,其余所有列包含各个城市的这些职业的比较值(在这种情况下,必须预先为每个城市计算的位置商) :

对于我想按最大值排序的每个城市,选择与它们各自的职业头衔和头衔匹配的最大值的子集。我认为这将是相对微不足道的,但......

编辑澄清:我想以数据的排序子集结束以进行分析。

同时我希望能够按列重复排序(所以我通过直接调用列尝试了很多排序命令:data[,2]; 只是为了能够在整个过程中运行相同的分析函数数据集。

过去 3 天我一直在搞乱 plyr,我觉得我的数据集的设置不利于 plyer 的使用方式。

0 投票
2 回答
290934 浏览

r - 根据列中的条件对数据框中的行进行子集/过滤

给定一个数据框“foo”,我怎样才能从“foo”中只选择那些行,例如foo$location = "there"

期望的结果,“bar”: