1

我正在尝试使用 scipy.newton 方法在熊猫数据框中进行优化。

首先,我的数据框创建如下。其次,创建函数 Px。第三,创建另一个函数 YieldCalc,在其中我使用 scipy.newton 进行优化以找到 Rate 的值,使得 Px = 0。然后我尝试将该值添加到新列“Yield”,但出现以下错误。任何帮助将非常感激。提前致谢。

from pandas import *
import pandas as pd
from scipy import *
import scipy
import timeit   
#In:
#Creating Dataframe
df = DataFrame(list([100,2,34.1556,9,100]))
df = DataFrame.transpose(df)
df = df.rename(columns={0:'Face',1:'Freq',2:'N',3:'C',4:'Mkt_Price'})
df2= df
df = concat([df, df2])
df

#Out:
Face  Freq    N          C  Mkt_Price
100    2     34.1556     9    100
100    2     34.1556     9    100


#In:
Face = df['Face']
Freq = df['Freq']
N = df['N']
C = df['C']
Mkt_Price = df['Mkt_Price']


def Px(Rate):
    return Mkt_Price - (Face * ( 1 + Rate / Freq ) ** ( - N ) + ( C / Rate ) * ( 1 - (1 + ( Rate / Freq )) ** -N ) )

def YieldCalc():
    return scipy.optimize.newton(Px, .1, tol=.0001, maxiter=100)
df['Yield'] = YieldCalc()

错误/输出:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-89-f4961d3f817b> in <module>()
     12 def YieldCalc(Rate):
     13     return scipy.optimize.newton(Px, .1, tol=.0001, maxiter=100)
---> 14 df['Yield'] = YieldCalc(.05)

<ipython-input-89-f4961d3f817b> in YieldCalc(Rate)
     11 
     12 def YieldCalc(Rate):
---> 13     return scipy.optimize.newton(Px, .1, tol=.0001, maxiter=100)
     14 df['Yield'] = YieldCalc(.05)

C:\Users\rebortz\Anaconda\lib\site-packages\scipy\optimize\zeros.pyc in newton(func, x0, fprime, args, tol, maxiter, fprime2)
    145         q1 = func(*((p1,) + args))
    146         for iter in range(maxiter):
--> 147             if q1 == q0:
    148                 if p1 != p0:
    149                     msg = "Tolerance of %s reached" % (p1 - p0)

C:\Users\rebortz\Anaconda\lib\site-packages\pandas\core\generic.pyc in __nonzero__(self)
    674         raise ValueError("The truth value of a {0} is ambiguous. "
    675                          "Use a.empty, a.bool(), a.item(), a.any() or a.all()."
--> 676                          .format(self.__class__.__name__))
    677 
    678     __bool__ = __nonzero__

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
4

1 回答 1

1

这里的部分技巧是你得到df['Face']的不是一个单一的值,甚至不是一个数组。他们仍然与熊猫息息相关。

您可以按照建议开始访问原始数据.values并将其提供给函数。

或者,pandas 数据框有一种.apply方法,可以让您获取一个函数并在每一行或每一列上运行它。

我将以下内容放在您发布的代码的末尾(首先注释掉有问题的行)

def Foo(thing, Rate):
    return thing[0]*Rate

df['Yield'] = df.apply(Foo,axis=1,args=(0.1,))
df.head()

在这里,该.apply方法会将Foo给定行中的所有条目df作为一个系列传递给函数,以及参数0.1。轴规范是将其设置为按行完成(axis=0将执行 col)。

只需重新组织以接受“速率”和来自(按该顺序)Px的一系列值。df然后也YieldCalc接受该系列。此外,您需要args=在调用中使用一个条目newton来将该系列值传递给Px它寻找零时。

流程应该是:

.applything从 连续生成一个系列df并将其传递给YieldCalc. 在Rate` 上YieldCalc运行会返回 0。然后所有这些结果都会被放入新的 Yield col 中。newtonPx(Rate,thing)' to find

于 2014-07-19T19:00:30.393 回答