使用制表程序包提取季度损益表并将其转换为表格形式。
# 2017 Q3 Report
telia_url = "http://www.teliacompany.com/globalassets/telia-
company/documents/reports/2017/q3/telia-company-q3-2017-en"
telialists = extract_tables(telia_url)
teliatest1 = as.data.frame(telialists[22])
#2009 Q3#
telia_url2009 = "http://www.teliacompany.com/globalassets/telia-
company/documents/reports/2009/q3/teliasonera-q3-2009-report-en.pdf"
telialists2009 = extract_tables(telia_url2009)
teliatest2 = as.data.frame(telialists2009[9])
只对综合收益 表的简明综合报表感兴趣。对于所有历史报告,此字符串完全相同或非常相似。
上面,对于 2017 年的报告,列表 #22 是正确的表格。但是,由于 2009 年的报告有不同的布局,#9 是该特定报告的正确答案。
根据“简明综合综合收益表”字符串(或子字符串)的位置,使该函数动态化的聪明解决方案是什么?
也许使用 tm 包来查找相对位置?
谢谢