我正在尝试在 Python 中实现一个数学公式,我是这方面的初学者,所以请和我一起工作。
我有两个 3 列制表符分隔的文件:
例如:输入A:
abandonment-n about-bring-v 32.5890
abandonment-n about-complaint-n 5.5112
abandonment-n about-concern-n 10.6714
abandonment-n among-1-crowd-n 11.4496
输入B:
aardvark-n about-fact-n 7.4328
aardvark-n about-information-n 6.5145
aardvark-n about-know-v 6.4239
aardvark-n among-1-crowd-n 9.9085
输入B:
我试图实现的公式应将两个文件都视为输入。
在数学上,公式如下:
如本文所述
其中,f = 特征,Fx = 特征向量,w = 特征的权重。
到目前为止,这是我想出的:
将两个输入作为 dict 导入,其中 [feature:weight]。
假设 inputA = x 和 inputB = y。
然后,我为公式设计的语法如下:
score = sum(i for i in x if i in y) * w(i) / sum(i for i in x)* w(i)
在这种情况下,*w(i)
应该乘以相应特征的权重。
有人可以帮助我使用 Python 中的数学语法(根据我尝试转换的公式是否正确),因为这是我第一次尝试它?
先感谢您