3

多个 symfit 模型实例共享同名的参数对象。我想了解这种行为来自哪里,它的意图是什么以及是否可以停用。

为了说明我的意思,一个最小的例子:

import symfit as sf
# Create Parameters and Variables
a = sf.Parameter('a',value=0)
b = sf.Parameter('b',value=1,fixed=True)
x, y = sf.variables('x, y')

# Instanciate two models
model1=sf.Model({y:a*x+b})
model2=sf.Model({y:a*x+b})

# They are indeed not the same
id(model1) == id(model2)
>>False

# There are two parameters
print(model1.params)
>>[a,b]
print(model1.params[1].name, model1.params[1].value)
>>b 1
print(model2.params[1].name, model2.params[1].value)
>>b 1
#They are initially identical

# We want to manually modify the fixed one in only one model
model1.params[1].value = 3
# Both have changed
print(model1.params[1].name, model1.params[1].value)
>>b 3
print(model2.params[1].name, model2.params[1].value)
>>b 3
id(model1.params[1]) == id(model2.params[1])
>>True
# The parameter is the same object

我想用不同的模型拟合多个数据流,但不同的固定参数值取决于数据流。重命名模型的每个实例中的参数是可行的,但考虑到参数代表相同的数量,这很难看。按顺序处理它们并修改它们之间的参数是可能的,但我担心步骤之间的意外交互。

PS:有足够声誉的人可以创建symfit标签吗

4

1 回答 1

1

很好的问题。原则上这是因为Parameter对象是 的子类sympy.Symbol,并且来自其文档字符串:

Symbols are identified by name and assumptions:

>>> from sympy import Symbol
>>> Symbol("x") == Symbol("x")
True
>>> Symbol("x", real=True) == Symbol("x", real=False)
False

这是 . 内部工作的基础sympy,因此我们也使用symfit. 但是值和固定参数不被视为假设,因此它们不用于区分参数。

现在,关于这将如何影响拟合的问题。就像你说的,按顺序工作是一个很好的解决方案,而且不会有任何副作用:

model = sf.Model({y:a*x+b})
b.fixed = True
fit_results = []

for b_value, xdata, ydata in datastream:
    b.value = b_value
    fit = Fit(model, x=xdata, y=ydata)
    fit_results.append(fit.execute())

所以不需要Parameter每次迭代都定义一个新的,每个循环中的b.value属性都是相同的,所以这不可能出错。我能想象这会出错的唯一方法是如果你使用threading,那可能会产生一些竞争条件。但threading无论如何,对于 CPU 密集型任务来说都是不可取的,multiprocessing这是要走的路。在这种情况下,将产生单独的进程,创建单独的缩影,所以那里也应该没有问题。

我希望这能回答你的问题,如果不让我知道的话。

ps 我正在慢慢回答到 1500 来制作那个标签,但如果有人打败我,我当然会更高兴;)

于 2019-03-05T09:48:58.280 回答