0

我在一个文件夹中有超过 8000 个 csv 文件,每个文件包含 2 列。文件标题也是股票代码。例如“AAPL.csv”显示了苹果股票的数据。

这是它包含的数据:

glimpse(AAPL)

*Columns: 2

$ timestamp     <chr> "2018-05-02 04:53:46", "2018-05-02 06:38:58", "2018-05-03 00:35:25",

$ users_holding <int> 150785, 150785, 145510*

编辑:这是 csv 文件中的原始数据 - 查看第一个日期和最后一个日期,这是与股票价格匹配的时间范围

timestamp,users_holding
2018-05-02 04:53:46,150785
2018-05-02 06:38:58,150785
2018-05-03 00:35:25,145510
2018-05-03 06:33:53,145510
2018-05-03 06:48:56,145510
2018-05-03 07:07:03,145510
2018-05-03 07:34:19,145510
2018-05-03 07:43:36,145510
2018-05-03 11:19:43,145511
2018-05-03 12:43:07,145511
2018-05-03 13:43:07,145512
2018-05-03 14:43:07,144974
2018-05-03 15:43:08,144543
2018-05-03 16:43:08,144389
2018-05-03 17:43:07,144264
2018-05-03 18:43:07,144060
2018-05-03 19:43:07,143941
2018-05-03 20:43:07,143789
2018-05-03 21:43:07,143754
2018-05-03 22:43:08,143747
2018-05-03 23:43:06,143747
2018-05-04 00:43:06,143747
2018-05-04 01:43:07,143747
2018-05-04 02:43:08,143747
2018-05-04 03:43:07,143747
2018-05-04 04:43:07,143747
2018-05-04 05:43:07,143747
2018-05-04 06:43:07,143747
2018-05-04 07:43:07,143747
2018-05-04 08:43:08,143747
2018-05-04 09:43:07,143749
2018-05-04 10:43:07,143749
.
.
.
2020-08-13 16:52:38,726024
2020-08-13 20:51:07,730106
2020-08-13 21:50:08,730448
2020-08-13 22:55:09,730774

这是文件包含的唯一信息。为了阅读所有文件,我使用了 Tidyverse 包

x  <- dir("popularity_export", full.names = T) %>% map_df(read_csv)

为了获取股票数据,我使用了 tidyquant 和 quantmod 包。问题是,我必须分别获取每个代码的数据。代码将在 csv 文件标题中。有没有办法我可以做到这一点?

mdate = "2018-05-02" #earliest date from which the stock data should be recieved
aaplPrices <- getSymbols('AAPL', from=mdate, auto.assign=F)[,4]
print(aaplPrices)

2021-03-02   125.1200
2021-03-03   122.0600
2021-03-04   120.1300
2021-03-05   121.4200
2021-03-08   116.3600
2021-03-09   121.0900
2021-03-10   119.9800

然后我必须将股票价格与其他数据合并,但我每天只需要一个价格。csv 文件包含每小时数据(并且具有不同的日期格式)。有谁知道如何做到这一点?

已经非常感谢了。

4

0 回答 0