问题标签 [python-zip]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
152 浏览

python - 大熊猫数据帧上的多处理突然变慢

我正在尝试使用 multiprocessing.Pool.starmap 根据其他几列的值,使用以下代码向我的熊猫数据框中添加一个新列:

使用具有 200.000 行的数据框运行此代码非常有效,并且只需不到 5 秒。用 2.000.000 行再次尝试它似乎被卡住并且永远不会完成。a & b 列是字符串,c、d、e 是浮点数,以防万一。

从 CPU 利用率来看,它们似乎也几乎没有工作。

谁能建议为什么会发生这种情况/如何改进解决方案运行时?

更新:使用 df.parallel_apply(lambda row: my_func(...), axis=1) 而不是 multiprocessing.Pool 切换到 pandarallel

0 投票
3 回答
110 浏览

python - 在 Python 中按函数输出压缩列表

众所周知,如果我们在 python 中有两个列表l1和,l2可以使用zip(l1, l2)它来创建一个元组列表。l1l2

现在,假设我们有两个函数f1f2. 我想创建一个元组列表,其中包含元素 froml1l2(如zip输出),这样元素 from的输出将等于f1元素 from的输出。以数学形式:l1f2l2

在此处输入图像描述

在我的用例中,可以假设f1f2都是单射函数。但是,不能保证 的每个元素l1都匹配,l2反之亦然。

这是执行此操作的代码:

我想知道是否有更好的方法(也许它已经以更快/更清洁的方式在内置库中实现)。

任何帮助将非常感激。

0 投票
2 回答
311 浏览

python - 在 python 中使用特殊字符解压缩时使用编码修复文件名

那里有很多关于编码我们的问题,但我仍然无法解决我的问题。

想象一下,我在一个压缩的 ZIP 文件中有三个文件:

Übersicht.pdf finalePräsentation münchen

我想解压缩这些文件,所以我这样做:

文件名看起来像废话:

在此处输入图像描述

我的研究表明,文件名基本上是字节串,操作系统不可能看到编码是什么。但我仍然想知道是否有任何方法可以纠正文件名的问题,以便正确显示德语“Umlaute”。

我试图改变这样的编码:

我尝试了这个latin-1iso其他一些编码和字节字符串实际上被不同地解释,但总是神秘的。因此,我问这个问题,看看是否有一种简单的方法来解决这个问题。

非常感谢提前,非常感谢帮助

编辑:locale给我以下输出:

hexdump第一个文件开头的内容如下:

回声*.pdf | xxd | 头给了我这个:

0 投票
0 回答
23 浏览

python - 从两个不同的列表创建新字典

我正在寻找一种以更优雅的方式编写此代码的方法

代码正在创建一个新字典,其中 K 来自 listA,V 是嵌套 json (j) 中所有布尔值的 OR 计算,而

len(listA) == len(j)