当前位置:首页 > 全国大学生数学建模竞赛国家一等奖论文1
势图。图3中红色线表示上证指数的走势图,绿色线表示成交量的走势图。从图中可以看出两条线上升和下降的时间相同,上升和下降的速率不同。表3为使用SPSS软件根据2003年的日开盘数据与成交量数据得到的短期的指数与成交量描述性统计。表4为得到的指数与成交量的相关性。从表中可以看出Pearson相关系数为r=0.311。当Pearson相关系数r的取值为在0.20-0.39之间时为低度相关。可以看出指数与成交量在短期内的相关性不是很好。 2003年上证指数和成交量走势图1800上证指数成交量x 1067160041400212000501001502000250
图3 2003年指数与成交量的走势图 表3 2003年指数和成交量的描述性统计量
开盘(x) 成交量(y) 均值 1467.0068 12998544.34 标准差 69.61830 7867543.997 N 241 241 表4 2003年指数和成交量的相关性 开盘(x) Pearson相关性 显著性(双侧) 平方与叉积的和 协方差 N Pearson相关性 显著性(双侧) 平方与叉积的和 协方差 N 开盘(x) 1 1163209.735 4846.707 241 .311** .000 4.094E10 1.706E8 241 成交量(y) .311** .000 4.094E10 1.706E8 241 1 1.486E16 6.190E13 241 成交量(y)
图5为使用MATLAB软件根据2009年日开盘与成交量数据得到的指数与成交
5
量的走势图。图中红色线代表上证指数的走势图,绿色线代表成交量的指数图。两条线的的整体趋势相近,可以看出线性相关性不是很好。表5为使用SPSS软件根据2009年日开盘与成交量的数据得到的短期的指数与成交量的描述性统计量,表6为得到的上证指数与成交量的相关性。从表中可以看出Pearson相关系数为r=0.291。当Pearson相关系数r的取值为在0.20-0.39之间时为低度相关。可以看出指数与成交量在短期内的相关性不是很好。
2009年上证指数和成交量走势图4000成交量上证指数x 10482000200501001502000250
图5 2009年上证指数与成交量的走势图 表5 2009年上证指数与成交量的描述性统计量
开盘(x) 成交量(y) 均值 2758.835205 1.53E8 标准差 432.5977768 3.905E7 N 244 244 表6 2009年上证指数与成交量的相关性 开盘(x) Pearson相关性 显著性(双侧) 平方与叉积的和 协方差 N Pearson相关性 显著性(双侧) 平方与叉积的和 协方差 N 开盘(x) 1 4.548E7 187140.837 244 .291** .000 1.194E12 4.915E9 244 成交量(y) .291** .000 1.194E12 4.915E9 244 1 3.705E17 1.525E15 244 成交量(y)
从上述所有图中可以看出,指数与成交量的长期相关性很好,具有一定的线
6
性相关性。但是在短期内,指数与成交量的相关性不是很好。只是走势大体相同。但是经过做取均值处理将曲线平滑之后,可以看出短期内的线性相关性得到很好的改善。 2. 问题2
2.1 X 在不同时期的生存函数S(r)的估计与比较
本文选取了从2000年-2011年的上证指数进行分析,我们采用相对收益率替代股市指数涨跌点数,即:
r?p(t)?p(t?1)
p(t?1)表7 时间 股指收盘价 每日收益率r (%) 连涨的收益率(%) xi 连跌的收益率 (%) yi 我们得到数据的方法如表7 :
p(t) p(t)?p(t?1) p(t?1)01/04/2000 01/05/2000 01/06/2000 01/07/2000 01/10/2000 01/11/2000 01/12/2000 01/13/2000 01/14/2000 01/17/2000 01/18/2000 1368.7 1407.8 1406 1477.2 1531.7 1547.7 1473.8 1437.5 1426.2 1409 1436.9 0 2.8589 -0.12715 5.0582 3.6936 1.042 -4.7756 -2.4638 -0.78124 -1.2088 1.9802 0 2.8589 0 9.7938 0 0 0 0 0 0 1.9802 0 0 -0.12715 0 0 0 -9.2294 0 0 0 0 连涨的收益率xi和连跌的收益率yi数学表达式如下: 令:k0=0
k2m?1?inf{t:t?k2m,p(t?1)?p(t)?0},m?0,1,2,3... (5)
k2m?2?inf{t:t?k2m?1,p(t?1)?p(t)?0},m?0,1,2,3... (6)
xm?1?k2m?1k2m?r(t),m?0,1,2,3... (7)
ym?1?
k2m?2k2m?1?r(t),m?0,1,2,3... (8)
7
X 的生存函数S(r)的定义是股指连续上涨的收益率X 大于r 的概率,即
S(r)?p(X?r) (9)
它可用连涨收益率大于r 者所占的比例来估计:
S(r)??x大于r的个数 (10)
总个数X 在不同成交量下的生存函数 S(r)的经验估计如图4:
图4 不同成交量下的生存函数S(r)的经验估计
从图4中可以看出,不同的成交量下连续上涨的收益率X的生存函数是不同的。成交量大的时期生存函数曲线较平缓,表示股指涨的较高;成交量小的时期生存函数曲线较陡,表示股指上涨的相对较小。这说明成交量对指数存在着影响。
2.2 . 模型的建立
本文把连涨或连跌时的成交量 V,即连涨或连跌的每日成交量之和,作为协变量来研究连涨连跌的股指与成交量之间的关系。我们把成交量划分为大成交量和小成交量两种情形,来分析在不同成交量下连涨的收益率X 的生存函数。 那么如何从数学上来表示它们之间的这种关系呢?可以利用位置尺度模型: 假如 X 的分布是:
f(r)??(?r)k?1e??r/?(k) (11)
那么
log(X)??log??log(?X) (12)
其中log(?X)称为标准对数伽玛分布,其密度函数为:
e?
1exp(kW?exp(W)),???W?? (13) ?(k)8
共分享92篇相关文档