问题标签 [frozenset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3837 浏览

python - 将冻结集的元素写入熊猫数据框

我有一个冻结的集合,其元素是这样的:

我想将冻结集中的元素写入熊猫数据框,如下所示:

最有效的方法是什么?

0 投票
3 回答
6453 浏览

python - 保持冻结集中元素的顺序

我有一个元组列表,每个元组包含一个字符串和两个整数。该列表如下所示:

该列表包含数千个这样的元组。现在,如果我想获得独特的组合,我可以frozenset在我的列表中执行以下操作:

这给了我以下结果:

我知道 set 是一个无序的数据结构,这是正常情况,但我想在这里保留元素的顺序,以便之后我可以将元素插入pandas数据框中。数据框将如下所示:

0 投票
0 回答
277 浏览

python - 需要对 pandas 数据框中的不可变冻结集进行进一步操作

我正在尝试对两个 pandas 数据帧进行连接,其中一个是从 mlxtend 包运行 Apriori 算法的结果。当我尝试加入两者时,它输出了一堆无。我认为至少其中一个原因是我加入的数据框之一在两列中包含“(”和“)”,我试图删除它们但没有运气,因为它们是不可变的冻结套。

我将在这里尝试从两个数据帧中复制一个最小样本:

这是一个数据框的示例:

这是另一个示例:

我希望看到的最终结果是:

当我进行连接时,它会显示列中所有行的 NaN,甚至知道我知道它们都应该有匹配项。我转换为字符串以尝试查看是否可以使用这种方式进行连接

所以我看到我有一个无法轻易分解的不可变 Frozenset。为了能够正确连接这两个表,我该怎么做?

0 投票
1 回答
2151 浏览

python - 在熊猫系列上成对应用函数

我有一个熊猫系列,其元素构成frozensets:

我想成对应用一个函数。例如,tokens.diff给我连续行之间的差异:

我想要同样的东西,但不是设置差异,我想要在连续行上设置联合。所以,我理想地喜欢:

如何使用 Pandas 实现这一目标?我知道我可以zip使用列表组合来做到这一点,但希望有更好的方法。

0 投票
0 回答
934 浏览

python - 从frozenset中提取元素

我一直在尝试使用这些数据开发一个先验算法。我能够获得对和三元组的关联和置信度,但是在格式化输出和提取正确元素时遇到了麻烦。

我在这个测试数据上运行了算法。它只是原始数据集的一个子集。当前输出如下所示:

正如你所看到的那样,它有点乱。该列表基于降序的置信度进行排序。我想将频繁对与频繁三元组分开并排列输出,使其看起来像这样:

以上是基于置信度的前 5 个频繁对和前 5 个频繁三元组。

我遇到的主要问题是区分频繁对和三元组,然后从冻结集中提取项目,使它们具有上述格式。

对此问题的任何建议表示赞赏。如果您对代码或思考过程有任何疑问,请告诉我。如果有任何粗心的错误,请提前道歉。

感谢您阅读

0 投票
1 回答
4588 浏览

python - 从 Frozenset/Alternatives 中检索元素到 Frozenset

我的 freezeset 输出如下所示:

下面的数据只是一个例子。总的来说,我希望数据采用这种格式:

对于双打:

项目项目置信度

对于三重奏:

项目项目项目信心

双打:

三重奏:

我只是想知道是否可以检索元素以使输出采用以下格式:

如果不是使用 freezeset 的任何替代方法都会有所帮助。

感谢您阅读

0 投票
1 回答
912 浏览

python - dataframe to frozenset

I want to translate a dataframe to frozensets and keep the dataframe columns within the frozenset.

Example

And I would like something as :

I tried x.apply(frozenset,1) but it gives me that :

Any help will be useful. Thank you

0 投票
2 回答
2421 浏览

python - 按值对python集合列表进行排序

freezeset 文档说:

freezeset 类型是不可变和可散列的——它的内容在创建后不能更改;因此,它可以用作字典键或另一个集合的元素。

但是,python 集的文档说:

由于集合仅定义部分排序(子集关系),因此 list.sort() 方法的输出对于集合列表是未定义的。

这让我不禁要问:为什么会这样?而且,如果我想按集合内容对集合列表进行排序,我该怎么做?我知道扩展 intbitset: https://pypi.python.org/pypi/intbitset/2.3.0具有返回表示设置内容的位序列的功能。python集有可比性吗?

0 投票
1 回答
1252 浏览

python - 将空集添加到python中的frozenset中的一组集合中

假设我生成一个frozenset

我有空集

现在我想要两个集合的联合:

这给了我

这假定包含空的frozenset 的frozenset 本身是空的。但是,我想拥有

所以,我想将空集显式添加到集合中。例如,在我看来,在构建电源组时这是必要的吗?

那么:只包含空集本身的集合族是空的吗?在 Python 中,有没有一种方法可以使用变量类型将一个空集显式包含到一组集合setfrozenset

0 投票
1 回答
376 浏览

python - 使用 Python,在返回匹配超过某个阈值的键(作为冻结集)时比较两个大字典的最快方法是什么?

假设我有两个非常大的字典:bigDictA 和 bigDictB,如下所示。

现在,我编写的需要帮助优化的算法如下所示:

因此,如果 THRESHOLD 为 0.3,则将 freezeset("a1","b2","c3") 添加到 setOfMatches,但如果 THRESHOLD 为 0.7,则不会添加。

我意识到这效率不高,但我绝对愿意接受任何建议,包括将关键数据类型转换为其他数据类型以加快速度。我也研究过使用 Numba 和 Cython 等工具(不过我更喜欢将它保存在纯 python 中)。它需要快速疯狂!

非常感谢任何帮助!谢谢!