
班级:数学131 学号: ********* 姓名:王倩倩
摘要
随着我国经济的快速发展,越来越多的家庭出现了数额较大的家庭资产,这些资产需要进行保值增值。同时也出现了越来越多的信托投资管理公司,一些大型金融机构也开发出了数量众多的集合理财产品,在募集了相当数量的资金以后,如何进行投资管理,成为一个非常重要的问题。
由于市场竞争非常激烈,国家经济管理日趋成熟,市场上的最有效资源已经不再为某些实力机构垄断,垄断利润逐渐减小,投资收益靠的是创造的实体财富的增加,靠的是市场需求的旺盛,以及对市场潜在机会的把握。
市场投资机会的寻找和发现成为重要的渠道,这将导致将资产配置到效率更高的市场领域,资产增值得到更大的保障。准确的市场预测能使得资产获得预先良好布局,成为新资源的资本拥有者,或者替代了前期的其它资本投入,获得了较低成本投入而收益最大化的机会,能够获得最大的资产增值。
在一个公开市场上,透明度高、管理者有较强的国家责任感、最大努力地消除垄断和市场操纵以及欺诈等。一个资产管理者能否保证资产的增值保值,取决于他对资产的投资组合的优化配置。在一定的时期内必然存在着最优或者较优的组合配置,包括不同资产类型以及不同的数量。投资效益效果的优劣,既有投资收益数额上的差异,也有获得投资收益时间长短上的差异。
长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题。随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性。而每一项投资在有其收益效果的同时也伴随着风险性,所以不同的投资组合方式将带来不同的效果。对于不同类型的投资者必然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。
本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函数关系,合理规划有限的资金进行投资,以获得最高的回报。
问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来模拟收益U与x,y之间的关系,在进一步对模型进行了改进后,拟合度为进行了残差分析和检验预测,这样预测出的结果更加准确、有效,希望能为投资者实践提供某种程度的科学依据。
问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函数,进行线性规划,用MATLAB软件来求得在资金固定的情况下,选择哪种投资方式能使达到利益最大化。
最后,对模型的优缺点进行评价,指出了总收益与购买A 类资产x份数和B类资产y份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和优化。
关键字:经济效益 回归模型 自相关 迭代法 线性规划 有效投资方法
一、问题重述
某金融机构选定了A,B两种投资品种,购买A类资产x份和B类资产y份的投资收益是U,经分析测算有如下收益表:
| U | A | B |
| 3.7 | 2 | 5 |
| 5.4 | 3 | 8 |
| 6.6 | 4 | 11 |
| 7.4 | 5 | 14 |
| 10.2 | 6 | 17 |
| 10.7 | 12 | 25 |
| 12.5 | 20 | 35 |
| 13.2 | 30 | 25 |
| 14.4 | 40 | 28 |
| 14.1 | 47 | 32 |
| 17.6 | 100 | 46 |
| 18 | 120 | 40 |
| 16.6 | 125 | 40 |
| 19.4 | 240 | 50 |
| 19.3 | 100 | 240 |
| 18.7 | 80 | 250 |
| 19.6 | 130 | 150 |
| 21 | 170 | 260 |
| 22 | 236 | 270 |
(1)确定U与x,y的关系;
(2)若A的价格是每份120元,B的价格是每份80元,现有资金960万元,选定有效的投资方案以使收益最大。
二、问题分析
对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无风险的条件下,购买A类资产和购买B资产各自都会带来收益,因此,一般先确定U与x、y之间的关系,有利于我们在决定投资时,如何分配对A,B两类资产的投入资金的比重,这也是我们建立模型首先要解决的难点。
观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最好的模型,再对结果分别进行预测和分析。
对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用有限的资金来得到最大的利益。可以运用线性规划的相关知识来解决,列出所有已知条件,即约束条件,并利用MATlAB软件来进行求解,得到最优解,最后进行检验。
三、模型假设
1.投资者总是追求较高的收益,即投资者都是符合经济学中的“理性人”的假设。
2. 在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的有效性。
3. 假设题设中给的参数是准确值没有偏差。
4. 存在无风险资产,即本文对A、B两类资产的投资都为无风险投资。
5. 每种投资是否收益是相互的。
6. 对收益率和风险的预测值是可信的
四、符号说明
U——收益
x——,购买A类资产的份数
y——,购买B类资产的份数
β0、β1、β2——分别为回归模型的常数项,自变量x、y前面的系数
εi——第i个样本回归模型的随机误差项
Ut——第t个收益的回归估计
xt——第t个购买A类资产的样本份数
yt——第t个购买B类资产的样本份数
五、理论背景
1.多元线性回归
一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。
设y为因变量X1,X2…Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:
Yi=β0+β1X1i+β2X2i+…+βkXki+μi i=1,2,…,n
其中 k为解释变量的数目,βj(j=1,2,…,k)称为回归系数(regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为
E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXki
βj也被称为偏回归系数(partial regression coefficient)
建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:
(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;
(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;
(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度;
(4)自变量应具有完整的统计数据,其预测值容易确定。
2、自相关的概念
如果模型的随机误差项违背了互相的基本假设的情况,称为自相关性。
对于模型
Yi =β0+β1X1i+β2X2i+……+βkXki+μi i=1,2,……,n
随机误差项互不相关的基本假设表现为:
Cov(μi,μj)=0 i≠j,i,j=1,2,……,n
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。
在其他假设仍旧成立的条件下,序列相关即意味着
E(μi,μj)!=0
3、自相关性的后果
(1)参数估计量非有效
(2)变量的显著性检验失去意义
(3)模型的预测失效
4、自相关性的检验
杜宾-瓦森(Durbin-Watson)检验法
该方法的假定条件是:
(1)解释变量 X非随机;
(2)随机误差项i为一阶自回归形式:
i=i-1+i
(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Yi=0+1X1i+kXki+Yi-1+i
(4)回归含有截距项;
(5)没有缺失数据。
D.W.统计量
六、模型建立
问题一:假定收益U与x、y之间存在线性关系,则可建立二元线性回归模型 U=β0+β1*x+β2*y+ε
式中,U表示总的收益;x表示购买A类资产的份数;y表示购买B类资产的份数;β0、β1、β2分别表示回归方程的常数项、x和y前面的系数;ε表示随机误差项。
问题二:由上一问得到的模型U=9.042+0.047x+0.19y后,求目标函数的最大值
建立约束条件:
120x+80y≤9600000
X≥0
Y≥0
式中,x、y表示的是整数。
七、模型求解及优化
1.问题一
(1)根据数据资料定义变量U(收益)、x(A类资产的份数)、y(B类资产的份数),再将全部数据输入Excel,建立数据文件。
(2)选择U为因变量,以x、y为自变量,进行逐步回归。
(3)结果及分析: 描述统计表如下
| Mean | Std. Deviation | N | |
| U | 14.231579 | 5.6033772 | 19 |
| x | 77.368421 | 77.1479175 | 19 |
| y | 81.368421 | 97.2106593 | 19 |
(4)相关系数矩阵如下:
| U | x | y | ||
| Pearson Correlation | U | 1.000 | .852 | .725 |
| x | .852 | 1.000 | .614 | |
| y | .725 | .614 | 1.000 | |
| Sig. (1-tailed) | U | . | .000 | .000 |
| x | .000 | . | .003 | |
| y | .000 | .003 | . | |
| N | U | 19 | 19 | 19 |
| x | 19 | 19 | 19 | |
| y | 19 | 19 | 19 |
(5)回归系数表如下:
| Model | Unstandardized Coefficients | Standardized Coefficients | t | Sig. | ||
| B | Std. Error | Beta | B | Std. Error | ||
| 1 | (Constant) | 9.445 | .995 | 9.492 | .000 | |
| x | .062 | .009 | .852 | 6.704 | .000 | |
| 2 | (Constant) | 9.042 | .912 | 9.911 | .000 | |
| x | .047 | .011 | .653 | 4.511 | .000 | |
| y | .019 | .008 | .325 | 2.244 | .039 | |
模型1:U=9.445+0.062*x
模型2:U=9.042+0.047*x+0.019*y
即β0=9.042, β1=0.047, β2=0.019
Std.Error(标准误)列显示的是各系数的估计标准误差。
从模型中可以看到,购买A类资产和购买B类资产对收益都起到正影响,因为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。
(6)回归模型概述表如下:
| Model | R | R Square | Adjusted R Square | Std. Error of the Estimate | Durbin-Watson |
| 1 | .852(a) | .726 | .709 | 3.0207048 | |
| 2 | .0(b) | .791 | .765 | 2.7154146 | .395 |
b Predictors: (Constant), x, y
c Dependent Variable: U
回归模型概述表中给出了第一个模型中因变量U与自变量x之间的相关系数R=0.852,说明变量U与x之间具有显著的线性关系。第二个模型中因变量U与x、之间的复相关系数R=0.0,反映了变量U与x、y之间具有高度线性关系。
对于第二个模型给出了杜宾-瓦特森检验DW=0.395,此时的dl=1.08,du=1.53,因为0 Ut=k0+k1xt+k2yt et=ρ*et-1+ut 令 U’t=Ut-ρ*Ut-1 x’t=xt-ρ*xt-1 y’t=yt-ρ*yt-1 其中,上式中的自相关系数p是未知的,可以由DW值做出估计p=1-1/2*DW,计算后得出p的估计值为0.8025。 于是原式变为 U’t=β0+β’1*xt+β’2*yt+ut (7)上式模型有随机误差项,它满足线性回归模型的基本假设,用Excel做出有变换后的数据,并录入spss界面进行检验 由变换后的数据得出的回归模型概述表如下: b Predictors: (Constant), xt, yt c Dependent Variable: Ut 概述表中给出了第二个模型给出了杜宾-瓦特森检验DW=2.572,此时的dl=1.08,du=1.53,因为dl Ut= k’0+ρ*Ut-1+k’1(xt-ρ*xt-1)+ k’2*(yt-ρ*yt-1) 在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为xt-1和yt-1,即 Ut= k’0+ρ*Ut-1+k’1(xt-ρ*xt-1)+ k’2*(yt-ρ*yt-1) =9.042+0.8025*22+0.047*(xt-0.8025*236)+0.019*(yt-0.8025*270) =13.678845+0.047*xt+0.019*yt t统计量值和t分布的双侧显著性概率Sig.皆远小于0.05,可以认为回归系数是显著的。 2.问题二: 根据问题一得到的模型和给出的已知条件,可以得到 目标函数: max U=13.678845+0.047*x+0.019*y 约束条件: 120x+80y<=960 x>=0 y>=0 用MATLAB软件来求解线性规划的命令如下: c=[-0.047 -0.019]; A=[120 80]; b=[9600000]; Aeq=[]; beq=[]; lb=[0;0]; vb=[]; [x,fval]=linprog(c,A,b,Aeq,beq,lb,vb) 结果: x = 1.0e+04 * 8.0000 0.0000 fval =-3.7600e+03 可得在A的价格是每份120元,B的价格是每份80元,资金960万元的条件下,使收益最大时,应该将所有的资金960万元都用来买A类资产80000份,这是预计的最大收益是3773.679。 八、模型检验 模型检验主要是针对问题一所提出的模型进行检验。 对回归系数的显著性检验,我们用的是t检验。 t检验: 在多元线性回归中,回归方程显著并不意味着美国自变量对U的影响显著,所以需要对每个变量进行显著性检验。 如果某个自变量xj对作用不显著,那么在回归模型中,它的系数βj就取值为零。因此,检验变量是否显著,等价于检验假设 H0j:βj=0, j=1,2,……,p 据此可以构造t统计量 tj=β/√cjjσ 其中σ是回归标准差。当∥tj∥≥tα/2 时,拒绝元假设H0j:βj=0,认为βj显著不为零,自变量xj对因变量y的线性效果显著;当∥tj∥<tα/2时,接受原假设H0j:βj=0,认为βj为零,自变量xj对因变量y的线性效果不显著。 基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,因此可以认为此次分布基本上是正态的。 对于问题二最优解的检验 由于x,y是正整数,且有约束条件120x+80y≤9600000,可知(x,y)的可行域为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数 U=13.678845+0.047*x+0.019*y, 经变化可得到 y=(-0.047/0.019)*x+(13.678845-U)/0.019 故当上式的截距取到最小值时,U为最大,此时的x与y值便是最优投资组合。 用MATLAB画出的图像如下 再者,由问题一建立的模型中,我们可以看到x前的回归系数为0.047,y前面的回归系数为0.019,再由A的价格是每份120元,B的价格是每份80元,在不考虑常数项的情况下,计算可得对于A的投资,每增加1元可得到的收益是0.0003917而对于B的投资,每增加1元可得到的收益是0.0002375,所以我认为在资金有限,不考虑风险的情况下,投资者应该先考虑投资A类资产,如果减去能购买A类最多份数后的剩余的资金J,满足80≤J<120,则此时应该再考虑买一份B类资产。 关于最优解的检验,由于此题所给的可行域小,所以可以列出所有的可能性,再代入目标函数进行检验,但是对于多元的线性规划最优解,还是要建立相关的矩阵,再来进行计算和检验。 九、模型评价及优化 模型的优点: (1)本模型根据已有数据较好的体现了总收益与购买A、B类资产的份数之间的关系,而且该模型简单易懂,使得求解有了很大的简化。 (2)准确利用了题目所提供的数据,并对数据进行了较为透彻的分析,抓住了分析的要点,较好的完成了数据的提取与应用。 (3)在本文中,我们分别用了Excel、MATLAB等软件来进行数据的分析和处理,这样有利于提高模型的准确度和预测的可信性。 模型的缺点: (1)由于模型是建立在假设 是确定值的基础上的而实际中β0、β1、β2常为随机变量因而模型在这个方面作的还不够,不能很好的抓住市场上的商机,缺乏动态性。 (2)该模型没有考虑到各类投资的风险性。 (3)实际中的各个项目之间往往是有相关性的其相关程度由相关系数来决定 模型的优化和推广: 将β0、β1、β2 作为随机变量来考虑,并进而考虑个投资项目之间的相关性将是模型的一个主要改进方向,并把投资风险和损失及交易费等因素考虑进模型。 十、参考文献 [1] 葛哲学,《精通MATLAB》,北京:电子工业出版社,2008,P126-P127。 [2] 何晓群 刘文卿,《应用回归分析》,北京:中国人民大学出版社,2011,P56-P58,P71-P72,P105-P115。 [3]韩中庚,《数学建模方法及其应用》,北京:高等教育出版社,2005.6,P16-P18。 [4]赵静 但琦,《数学建模与数学实验》,北京:高等教育出版社,2003.6,P52。
a Predictors: (Constant), xtModel R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .635(a) .403 .366 1.0569473 2 .772(b) .596 .542 .75783 2.572
