2

我经常使用 R 来处理财务数据,例如 cds 点差、批次数据的相关性、时间序列......

现在我通过电子邮件从彭博社定期更新数据,所有数据都是电子邮件中的文本(不是附件),我想编写一个函数来从中读取数据(数百封电子邮件,扩展名为 .msg),并保存到excel中。

有人对如何读取数据有任何提示吗?我更喜欢 R,但如果 R​​ 做不到,C++ 也可以。

这是电子邮件的格式(部分):>>>>>

$$ JPM CDX OPTIONS: HY19 AUG Expiry  UPDATE - REF 102⅜[~354bp]
               BOND PUT          BOND CALL
 K [~Sprd]|SEP13>PAY   Dlt |SEP13>RCV   Dlt |MidVol [SprdVol]
108 [313] |  355 365   92% |    5 13     8% |  5.4% [ 40%]
107 [335] | 243½253½ 85% |   23 36    17% |  7.8% [ 33%]
106 [369] |  203 213   77% |  52½62½  28% |  7.1% [ 34%]
105 [387] |  147 167   59% |  99½116½ 41% |  9.3% [ 46%]
4

1 回答 1

2

这是一个好的开始:

email  <- "$$ JPM CDX OPTIONS: HY19 AUG Expiry  UPDATE - REF 102⅜[~354bp]
               BOND PUT          BOND CALL
 K [~Sprd]|SEP13>PAY   Dlt |SEP13>RCV   Dlt |MidVol [SprdVol]
108 [313] |  355 365   92% |    5 13     8% |  5.4% [ 40%]
107 [335] | 243½253½ 85% |   23 36    17% |  7.8% [ 33%]
106 [369] |  203 213   77% |  52½62½  28% |  7.1% [ 34%]
105 [387] |  147 167   59% |  99½116½ 41% |  9.3% [ 46%]"
email
ll <- readLines(textConnection(email))
mm <- read.table(text=ll[-c(1,2)],sep='|',header=TRUE)

  K...Sprd.  SEP13.PAY...Dlt  SEP13.RCV...Dlt MidVol..SprdVol.
1 108 [313]    355 365   92%      5 13     8%       5.4% [ 40%]
2 107 [335]     243½253½ 85%     23 36    17%       7.8% [ 33%]
3 106 [369]    203 213   77%      52½62½  28%       7.1% [ 34%]
4 105 [387]    147 167   59%      99½116½ 41%       9.3% [ 46%]
于 2013-07-18T17:05:25.950 回答