r - 使用 R 下载索引组合

Question

我正在寻找一种可以让我从各种网站下载索引组合的包/方式。索引组成很少更改并且很容易获得，但我无法在线找到任何可用的 csv。

我如何加载CAC 40定义？

PS：我关心的是名称/isin/sicovam，而不是索引中的权重

score 3 · Accepted Answer

您可以在维基百科上找到CAC40的组成，并使用 package 下载和处理XML。

该函数readHTMLTable()特别有用，因为它会查找并解析页面上的所有表格。在这种情况下，相关表是第二个，因此是[[2]]代码中的索引。尝试：

library(XML)
url <- "http://en.wikipedia.org/wiki/CAC_40"
dat <- readHTMLTable(url)[[2]]

 head(dat[, 1:3])
        Company           ICB Sector Ticker symbol
1         Accor               hotels            AC
2   Air Liquide  commodity chemicals            AI
3        Alstom industrial machinery           ALO
4 ArcelorMittal                steel            MT
5           AXA  full line insurance            CS
6   BNP Paribas                banks           BNP

相同的代码也适用于 FTSE 100：

url <- "http://en.wikipedia.org/wiki/FTSE_100_Index"
dat <- readHTMLTable(url)[[2]]
head(dat[, 1:3])
                   Company          Sector Market cap (Ã‚Â£bn)
1        Royal Dutch Shell     Oil and gas                 135
2                     HSBC         Banking                 129
3                       BP     Oil and gas                  85
4           Vodafone Group       Telecomms                  83
5          GlaxoSmithKline Pharmaceuticals                  73
6 British American Tobacco         Tobacco                  69

r - 使用 R 下载索引组合

1 回答 1

Related

Reference