python - functools partial 是如何做到的？

Question

我无法理解部分函数在 functools 中的工作原理。我从这里得到以下代码：

>>> sum = lambda x, y : x + y
>>> sum(1, 2)
3
>>> incr = lambda y : sum(1, y)
>>> incr(2)
3
>>> def sum2(x, y):
    return x + y

>>> incr2 = functools.partial(sum2, 1)
>>> incr2(4)
5

现在排队

incr = lambda y : sum(1, y)

我知道我传递给incr它的任何参数都将传递y给lambda哪个将返回sum(1, y)ie 1 + y。

我明白那个。但我不明白这一点incr2(4)。

get 如何像偏函数4一样传递？x对我来说，4应该替换sum2. x和之间有什么关系4？

score 323 · Accepted Answer

粗略地说，partial做这样的事情（除了关键字参数支持等）：

def partial(func, *part_args):
    def wrapper(*extra_args):
        args = list(part_args)
        args.extend(extra_args)
        return func(*args)

    return wrapper

因此，通过调用partial(sum2, 4)您创建一个新函数（准确地说是一个可调用函数），其行为类似于sum2，但少了一个位置参数。那个缺失的论点总是被代替4，所以partial(sum2, 4)(2) == sum2(4, 2)

至于为什么需要它，有多种情况。仅举一个例子，假设您必须在预期有 2 个参数的地方传递一个函数：

class EventNotifier(object):
    def __init__(self):
        self._listeners = []

    def add_listener(self, callback):
        ''' callback should accept two positional arguments, event and params '''
        self._listeners.append(callback)
        # ...

    def notify(self, event, *params):
        for f in self._listeners:
            f(event, params)

但是您已经拥有的功能需要访问第三个context对象才能完成其工作：

def log_event(context, event, params):
    context.log_event("Something happened %s, %s", event, params)

所以，有几种解决方案：

自定义对象：

class Listener(object):
   def __init__(self, context):
       self._context = context

   def __call__(self, event, params):
       self._context.log_event("Something happened %s, %s", event, params)


 notifier.add_listener(Listener(context))

拉姆达：

log_listener = lambda event, params: log_event(context, event, params)
notifier.add_listener(log_listener)

带部分：

context = get_context()  # whatever
notifier.add_listener(partial(log_event, context))

在这三个中，partial是最短和最快的。（对于更复杂的情况，您可能需要一个自定义对象）。

score 137 · Accepted Answer

partials非常有用。

例如，在函数调用的“流水线”序列中（其中一个函数的返回值是传递给下一个函数的参数）。

有时，此类管道中的函数需要一个参数，但紧接其上游的函数会返回两个值。

在这种情况下，functools.partial可能允许您保持此功能管道完好无损。

这是一个特定的孤立示例：假设您想按每个数据点与某个目标的距离对某些数据进行排序：

# create some data
import random as RND
fnx = lambda: RND.randint(0, 10)
data = [ (fnx(), fnx()) for c in range(10) ]
target = (2, 4)

import math
def euclid_dist(v1, v2):
    x1, y1 = v1
    x2, y2 = v2
    return math.sqrt((x2 - x1)**2 + (y2 - y1)**2)

要按与目标的距离对这些数据进行排序，您当然想做的是：

data.sort(key=euclid_dist)

但你不能—— sort方法的key参数只接受带有单个参数的函数。

所以重写euclid_dist为一个带单个参数的函数：

from functools import partial

p_euclid_dist = partial(euclid_dist, target)

p_euclid_dist现在接受一个参数，

>>> p_euclid_dist((3, 3))
  1.4142135623730951

所以现在你可以通过传入 sort 方法的 key 参数的偏函数来对数据进行排序：

data.sort(key=p_euclid_dist)

# verify that it works:
for p in data:
    print(round(p_euclid_dist(p), 3))

    1.0
    2.236
    2.236
    3.606
    4.243
    5.0
    5.831
    6.325
    7.071
    8.602

或者例如，函数的参数之一在外部循环中发生变化，但在内部循环中的迭代期间是固定的。通过使用部分，您不必在内部循环的迭代期间传递附加参数，因为修改后的（部分）函数不需要它。

>>> from functools import partial

>>> def fnx(a, b, c):
      return a + b + c

>>> fnx(3, 4, 5)
      12

创建一个偏函数（使用关键字 arg）

>>> pfnx = partial(fnx, a=12)

>>> pfnx(b=4, c=5)
     21

您还可以使用位置参数创建部分函数

>>> pfnx = partial(fnx, 12)

>>> pfnx(4, 5)
      21

但这会抛出（例如，使用关键字参数创建部分然后使用位置参数调用）

>>> pfnx = partial(fnx, a=12)

>>> pfnx(4, 5)
      Traceback (most recent call last):
      File "<pyshell#80>", line 1, in <module>
      pfnx(4, 5)
      TypeError: fnx() got multiple values for keyword argument 'a'

multiprocessing另一个用例：使用 python 的库编写分布式代码。使用 Pool 方法创建进程池：

>>> import multiprocessing as MP

>>> # create a process pool:
>>> ppool = MP.Pool()

Pool有一个 map 方法，但它只需要一个可迭代的，所以如果你需要传入一个具有更长参数列表的函数，请将函数重新定义为部分函数，以修复除一个之外的所有函数：

>>> ppool.map(pfnx, [4, 6, 7, 8])

score 56 · Accepted Answer

简短的回答，partial为函数的参数提供默认值，否则将没有默认值。

from functools import partial

def foo(a,b):
    return a+b

bar = partial(foo, a=1) # equivalent to: foo(a=1, b)
bar(b=10)
#11 = 1+10
bar(a=101, b=10)
#111=101+10

score 43 · Accepted Answer

部分可用于创建新的派生函数，这些函数具有一些预先分配的输入参数

要查看部分在现实世界中的使用情况，请在此处参考这篇非常好的博客文章

博客中的一个简单而简洁的初学者示例，涵盖了如何使用partialonre.search使代码更具可读性。 re.search方法的签名是：

search(pattern, string, flags=0)

通过应用partial，我们可以创建多个版本的正则表达式search来满足我们的要求，例如：

is_spaced_apart = partial(re.search, '[a-zA-Z]\s\=')
is_grouped_together = partial(re.search, '[a-zA-Z]\=')

现在is_spaced_apart和is_grouped_together是两个新函数派生自re.search它们pattern应用了参数（因为pattern是re.search方法签名中的第一个参数）。

这两个新函数（可调用）的签名是：

is_spaced_apart(string, flags=0)     # pattern '[a-zA-Z]\s\=' applied
is_grouped_together(string, flags=0) # pattern '[a-zA-Z]\=' applied

这就是您可以在某些文本上使用这些部分函数的方式：

for text in lines:
    if is_grouped_together(text):
        some_action(text)
    elif is_spaced_apart(text):
        some_other_action(text)
    else:
        some_default_action()

您可以参考上面的链接以更深入地了解该主题，因为它涵盖了这个特定示例等等。

score 16 · Accepted Answer

在我看来，这是在 python中实现柯里化的一种方式。

from functools import partial
def add(a,b):
    return a + b

def add2number(x,y,z):
    return x + y + z

if __name__ == "__main__":
    add2 = partial(add,2)
    print("result of add2 ",add2(1))
    add3 = partial(partial(add2number,1),2)
    print("result of add3",add3(1))

结果是 3 和 4。

score 2 · Accepted Answer

这个答案更像是一个示例代码。以上所有答案都很好地解释了为什么应该使用部分。我将给出关于部分的观察和用例。

from functools import partial
 def adder(a,b,c):
    print('a:{},b:{},c:{}'.format(a,b,c))
    ans = a+b+c
    print(ans)
partial_adder = partial(adder,1,2)
partial_adder(3)  ## now partial_adder is a callable that can take only one argument

上述代码的输出应该是：

a:1,b:2,c:3
6

请注意，在上面的示例中，返回了一个新的可调用对象，它将参数 (c) 作为其参数。请注意，它也是函数的最后一个参数。

args = [1,2]
partial_adder = partial(adder,*args)
partial_adder(3)

上述代码的输出也是：

a:1,b:2,c:3
6

请注意， * 用于解包非关键字参数，并且根据它可以采用的参数返回的可调用对象与上述相同。

另一个观察结果是： 下面的示例演示了 partial 返回一个可调用对象，它将未声明的参数 (a) 作为参数。

def adder(a,b=1,c=2,d=3,e=4):
    print('a:{},b:{},c:{},d:{},e:{}'.format(a,b,c,d,e))
    ans = a+b+c+d+e
    print(ans)
partial_adder = partial(adder,b=10,c=2)
partial_adder(20)

上述代码的输出应该是：

a:20,b:10,c:2,d:3,e:4
39

相似地，

kwargs = {'b':10,'c':2}
partial_adder = partial(adder,**kwargs)
partial_adder(20)

上面的代码打印

a:20,b:10,c:2,d:3,e:4
39

当我使用模块中的Pool.map_async方法时，我必须使用它。multiprocessing您只能将一个参数传递给工作函数，因此我不得不使用它partial来使我的工作函数看起来像一个只有一个输入参数的可调用函数，但实际上我的工作函数有多个输入参数。

score 1 · Accepted Answer

还值得一提的是，当部分函数传递另一个我们想要“硬编码”一些参数的函数时，那应该是最右边的参数

def func(a,b):
    return a*b
prt = partial(func, b=7)
    print(prt(4))
#return 28

但是如果我们做同样的事情，但是改变一个参数

def func(a,b):
    return a*b
 prt = partial(func, a=7)
    print(prt(4))

它会抛出错误，“TypeError: func() got multiple values for argument 'a'”

python - functools partial 是如何做到的？

7 回答 7

Related

Reference