美国的上市公司按季度提交 (10-Q) 和按年提交 (10-K)。在大多数情况下,他们每年将提交三个 10Q 和一个 10K。
在大多数情况下,季度申报 (10Qs) 包含季度数据。例如,“截至 2005 年 3 月 31 日的三个月的收入”。
年度申报通常只有年终总和。例如:“截至 2005 年 12 月 31 日的十二个月的收入。”
为了获得 2005 年第四季度的值,我需要获取年度数据并减去每个季度(第一季度至第三季度)的值。
在某些情况下,每个季度数据都表示为年初至今。例如,第一个季度申报是“截至 2005 年 3 月 31 日的三个月的收入”。第二个是“截至 2005 年 6 月 30 日的六个月的收入”。第三个“截至 2005 年 9 月 30 日止九个月的收入”。年度如上,“截至 2005 年 12 月 31 日的十二个月的收入”。这代表了上述问题的概括,其中希望提取季度数据,这可以通过重复减去上一期数据来完成。
我的问题是熊猫完成这个季度数据提取的最佳方式是什么?
每个时期有大量的字段(收入、利润、曝光等)。
我就如何在熊猫中表达这一时期数据提出了一个相关问题:Creating Period for Multi Quarter Timespan in Pandas
这是第一个问题的一些示例数据(三个 10Q 和一个只有年终数据的 10K):
10问:
- http://www.sec.gov/Archives/edgar/data/1174922/000119312512225309/d326512d10q.htm#tx326512_4
- http://www.sec.gov/Archives/edgar/data/1174922/000119312512347659/d360762d10q.htm#tx360762_3
- http://www.sec.gov/Archives/edgar/data/1174922/000119312512463380/d411552d10q.htm#tx411552_3
10K:
Calcbench 提到了这个问题: http: //www.calcbench.com/Home/userGuide:“Q4 计算:公司通常不报告 Q4 数据,而是选择报告全年数据。我们会自动为您计算。计算蓝色数据。
将有多年的数据,并且每年我都想计算缺失的第四季度:
2012Q2 2012Q3 2012Y 2013Q1 2013Q2 2013Q3 2013Y
Revenue 1 1 1 1 1 1 1
Expense 10 10 10 10 10 10 10