我正在尝试计算每日损益,在 .csv 中有 10 分钟的价格(每个日期有 42 次)---其中一天的买入次数和卖出次数可能不相等。如果它们不相等,则程序应使用该唯一日期的收盘价 df["price"][t] 减去(从/减去),具体取决于它是买入还是卖出。
import pandas as pd
df=pd.read_csv("file.csv", names="date time price mag signal".split())
s=df["signal"]=="S"
b=df["signal"]=="B"
ns=df["signal"]!="S"
nb=df["signal"]!="B"
t=df["time"]=="1620"
a1=df["price"][buy|(nb & t)]
b1=df["date"][buy|(nb & t)]
h=df["price"][s|(ns & t)]
g=df["date"][s|(ns & t)]
c1=zip(b1,a1)
c=zip(g,h)
c1, c 是包含买卖数量及其各自日期的列表。这里的问题是 c1 & c 是字符串——一旦它们被压缩;因此不能减去。是否可以制作 a1, h 浮点数以便我可以区分它们?
我想匹配 c, c1 中的日期以减去 S_i-B_i 的价格,对于给定日期的所有 i,然后对所有日期求和并返回该值。我想在 h-a1 上区分价格,只有当日期匹配时。
一些样本数据:
日期时间价格磁信号
2007 年 1 月 3 日 930 1422.8
2007 年 1 月 3 日 940 1423.2 0 2007 年 1
月 3 日 950 1422.8 0 2007 年 1 月 3
日 1000 1420.5 0 2007 年 1 月 3
日 1010 1422.8 0
2007 年 1 月 3 日 1020 1
. . .
2007 年 1 月 3 日 1230 1424.2 -1 B
2007 年 1 月 3日 1240 1424.8 0
2007 年 1 月 3 日 1250 1425.8 1 秒
2007 年 1月 3 日 1300 1426 0 2007 年 1
月 3 日 1310 1425 0 2007 年 1 月
3 日 1320 1423.5 -1 B
2007 年1 月 3 日 1330 1421.8 0
2007 年 1 月 3 日 1340 1421.5 0
2007 年 1 月 3 日 1350 1420.5 0 2007 年 1
月 3 日 1400 1421 0 2007 年 1 月
3 日 1410 1417.2 -1 B
2007 年 1 月 3 日 1420 1412.8 -1 B
2007 年 1 月 3 日1430 1414.8 0
2007 年 1 月 3 日 1440 1413.5 0 2007 年 1 月 3
日 1450 1410 0 2007 年
1 月 3 日 1500 1407.2 -1 B
2007 年 1 月 3 日 1510 1410.2 1 秒
2007 年 1 月 3 日 1520 1409.5 -1 B
2007 年 1 月 3 日 1530 1410.5 1 秒
2007 年 1 月 3 日 1540 1412.5 0
...
2007 年 1 月 3 日 1610 1415.5 1 秒
2007 年 1 月 3 日 1620 1414 -1 B
2007 年 1 月 4 日930 1412.2 0 2007年 1 月 4
日 940 1411 0 2007 年 1 月 4 日
950 1413 0 2007 年 1
月 4 日 1000 1412.2 0 2007年 1 月 4 日
1010 1407.2 -1 B
zip 的结果,比如说,c1 应该是这样的:
[('1/3/2007', '1424.2'),
('1/3/2007', '1423.5'),
('1/3/2007', '1417.2'),
('1/3/2007', '1412.8'),
('1/3/2007', '1407.2'),
('1/3/2007', '1409.5'),
('1/3/2007', '1414'),
etc - all dates in between
('8/30/2012','1324')]
非常感谢。