我有一个大数组,其中包含 1926 年到 2012 年的每日数据。我想知道每年有多少观察值(每年都有所不同)。我有一个列向量,其日期格式为:
19290101 19290102。. .
这里的一年是七月到明年六月。
所以 19630701 到 19640630
我想用这个向量来查找每年的天数。我需要将观察的数量用作回归的输入。
我不知道日期是以数字形式存储还是以字符串形式存储;我假设它们是数字。我建议做的是将每个值转换为年份,然后hist
用于计算每年的日期数。所以尝试这样的事情:
year = floor(date/10000);
obs_per_year = hist(year,1926:2012);
这将为您提供一个向量,其中包含从 1926 年开始每年的观察次数。
从 7 月 1 日开始的年份系列:
bin = datenum(1926:2012,7,1);
用 bin(1) <= x < bin(2), bin(2) <= x < bin(3), ... 将每年的日期向量分箱
count = histc(dates,bin);