问题标签 [python-zip]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

24 问题

0 投票

0 回答

152 浏览

python - 大熊猫数据帧上的多处理突然变慢

我正在尝试使用 multiprocessing.Pool.starmap 根据其他几列的值，使用以下代码向我的熊猫数据框中添加一个新列：

使用具有 200.000 行的数据框运行此代码非常有效，并且只需不到 5 秒。用 2.000.000 行再次尝试它似乎被卡住并且永远不会完成。a & b 列是字符串，c、d、e 是浮点数，以防万一。

从 CPU 利用率来看，它们似乎也几乎没有工作。

谁能建议为什么会发生这种情况/如何改进解决方案运行时？

更新：使用 df.parallel_apply(lambda row: my_func(...), axis=1) 而不是 multiprocessing.Pool 切换到 pandarallel

2021-08-05T11:18:32.457

0 投票

3 回答

110 浏览

python - 在 Python 中按函数输出压缩列表

众所周知，如果我们在 python 中有两个列表l1和，l2可以使用zip(l1, l2)它来创建一个元组列表。l1l2

现在，假设我们有两个函数f1和f2. 我想创建一个元组列表，其中包含元素 froml1和l2（如zip输出），这样元素 from的输出将等于f1元素 from的输出。以数学形式：l1f2l2

在我的用例中，可以假设f1和f2都是单射函数。但是，不能保证的每个元素l1都匹配，l2反之亦然。

这是执行此操作的代码：

我想知道是否有更好的方法（也许它已经以更快/更清洁的方式在内置库中实现）。

任何帮助将非常感激。

python list itertools python-zip

2021-09-12T12:25:01.567

0 投票

2 回答

311 浏览

python - 在 python 中使用特殊字符解压缩时使用编码修复文件名

那里有很多关于编码我们的问题，但我仍然无法解决我的问题。

想象一下，我在一个压缩的 ZIP 文件中有三个文件：

Übersicht.pdf finalePräsentation münchen

我想解压缩这些文件，所以我这样做：

文件名看起来像废话：

我的研究表明，文件名基本上是字节串，操作系统不可能看到编码是什么。但我仍然想知道是否有任何方法可以纠正文件名的问题，以便正确显示德语“Umlaute”。

我试图改变这样的编码：

我尝试了这个latin-1，iso其他一些编码和字节字符串实际上被不同地解释，但总是神秘的。因此，我问这个问题，看看是否有一种简单的方法来解决这个问题。

非常感谢提前，非常感谢帮助

编辑：locale给我以下输出：

hexdump第一个文件开头的内容如下：

回声*.pdf | xxd | 头给了我这个：

python encoding filenames python-zip

2021-09-24T10:19:17.453

0 投票

0 回答

23 浏览

python - 从两个不同的列表创建新字典

我正在寻找一种以更优雅的方式编写此代码的方法

代码正在创建一个新字典，其中 K 来自 listA，V 是嵌套 json (j) 中所有布尔值的 OR 计算，而

len(listA) == len(j)

python dictionary python-zip

2022-02-16T15:44:52.133

1 2 3 4 5 6 7 8 9 10

问题标签 [python-zip]

python - 大熊猫数据帧上的多处理突然变慢

python - 在 Python 中按函数输出压缩列表

python - 在 python 中使用特殊字符解压缩时使用编码修复文件名

python - 从两个不同的列表创建新字典

Reference