1、“.....将其转化为无量纲的纯数值,便于不同单位或量级的数据能够进行比较和加权,比较典型方法是标准化和标准化。本文中进行标准化的数据是申万级行业的日行情数据,这样做主要是考虑到不同行业的波动率存在很大的差距,些总市值较小的行业波动往往很大,经常日波动率达到,些大市值行业日波动率往往只有左右,两者差距较大,所以要进行数据的标准化。这里选用的标准化,标准化也称为标准差标准化,经过处理的数据符合标准正态分布,即均值为,标准差为,也是最常用的标准化方法,其转化函数为式其中为所有样本数据的均值,所以样本数据的标准差。由于金融数据往往呈现厚尾分布,所以这里对式做了定的修改式这里的标准化需要将训练集的数据和单组测试集的数据放在起进行标准化,不能讲所有数据进行次性的标准化。在模拟交易过程中,测试集数据是组的矩阵,记录当日申万级行业的日行情数据,而训练集数据是个的矩阵,为训练集的长度,即使用的多少个交易日的行情数据。在标准化的过程中......”。
2、“.....逐列输入按照式进行标准化。对于基础交易品种上证指数期货和中证指数期货的数据,采用以下公式进行处理式为上证指数期货的日收益率,为中证指数期货的日收益率,经处理后为个由和组成的向量。回归概述为了克服单个行业因子预测的不足,所以使用行业因子组合的形式来预测次日指数的相对强弱。出于模型泛化能力的考虑,使用了线性行业因子组合,而模型信号天生具有二值性,即不是预测上证指数期货强于中证指数期货,就是预测中证指数期货强于上证指数期货,所以使用回归模型较为合适。回归又称回归分析,是种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。它与多重线性回归实际上有很多相同之处,最大的区别就在于他们的因变量不同。它们的基本形式是相似的,正是因为如此,这两种回归可以归于同个家族,即广义线性模型。如果因变量是连续的,就是多重线性回归,如果是伯努利分布,就是回归。回归应用非线性变换将解释变量的线性组合变换为因变量取值的概率刻度......”。
3、“.....般地,贝努利事件的发生与否可以用二分变量来表示,二分变量回归是类形式最简单的回归模型考虑个有限的独立观察数据集的取值依赖于,若事件属于第类的概率,属于第类的概率为,的基本形式为式其中为类似于多元线性回归模型中的回归系数。对式进行对数变换得此处的日收益计算式中的收盘价数据为每个交易日下午点的价格。式至此,可以发现,只要对因变量按照的形式进行对数变化,就可以回归转化为多元线性回归。由于只去和两个值,这导致在数学上失去意义,无法利用多元线性回归的方法可以获得回归参数,所以这里要定义种单调连续的概率函数,令,式常用的单调连续的概率函数为式其中图通过对原始数据的合理的映射处理,就可以使用线性回归方法来得到回归系数。模型构建本文的股指期货跨品种套利量化模型,使用的日频率的行情数据,所以交易信号的也是每个交易日确定次。在年月日之前股指期货的连续竞价交易时间是每个交易日上午到......”。
4、“.....年月日后,中国金融期货交易所修改了交易规则,连续竞价交易时间变更为每个上午的到,下午到到。股票市场的连续竞价交易时间为每个交易日上午到,下午到。为了保证模型能够使用到最新的市场信息,同时考虑到交易模型的致性,交易时间选择在每日股票市场下午收盘时间,即每个交易日下午点。年月日与年月日之间共有个交易日,排除意外情况后,共个交易日可用。此外当上证指数期货或中证指数期货出现涨跌停导致无法进行交易时,则保留持仓到下个交易日。套利模型总体思想是通过行业因子的变化,利用回归模型,将行业因子组合起来,预测次日上证指数期货与中证指数期货的相对强弱关系。当预测上证指数期货强于中证指数期货时,以当日下午点时的价格做多上证指数期货,同时做空等市值的中证指数期货当预测上证指数期货弱于中证指数期货时,以当日下午点时的价格做空上证指数期货,同时做多等市值的中证指数期货。通过这种方式规避市场方向预测的难题,获取套利收益。假定今天为第日,如图所示......”。
5、“.....生成特征矩阵和指数强弱向量。这里的日行业因子矩阵有到日的申万级行业的日涨跌幅数据组成,日上证指数期货日收益率向量和日中证指数期货日收益率向量由到日的上证指数日收益率和中证指数日收益率组成。利用特征矩阵,通过回归模型对指数强弱向量进行拟合,估计参数向量,生成判别式。理论上在每个交易日下午点时的价格都是可以交易的,但也存在着意外情况。由于上海证券交易所深圳证券交易所和中国金融期货交易所在年月日到年月日之间短暂实施了熔断制度,即沪深指数涨跌幅达到时暂停交易分钟,涨跌幅达到时,暂停交易到收盘,不再进行集合竞价。该制度破坏了交易的连续性,使得在下午点,不能以当时价格交易上证指数期货和中证指数期货。在年月日和年月日沪深指数盘中跌幅达到,触发了熔断机制,导致该日下午点无法进行交易。针对这种现象,本文将该日交易数据与次日交易数据合并,组成组数据,不将该日看成独立交易日,这样年月日与年月日之间有数据的交易日个数变为个......”。
6、“.....使用当日申万级行业的行情数据,进行标准化后,由判别式生成和信号,代表模型预测次日上证指数期货走势强于中证指数期货,代表模型预测次日中证指数期货走势强于上证指数期货指数。将判别式信号和持仓信号进行比较。持仓信号为代表持仓为上证指数期货多单,中证指数期货空单持仓信号为代表持仓为上证指数期货空单,中证指数期货多单。如果判别式信号与持仓信号相同,则持仓不同,不进行交易如果持仓信号为与判别式信号为,则平上证指数期货多单中证指数期货空单开中证指数期货多单上证指数期货空单。如果持仓信号为与判别式信号为,则开上证指数期货多单中证指数期货空单平中证指数期货多单上证指数期货空单。日行业因子矩阵日上证指数日收益率向量日中证指数日收益率向量回归模型数据标准化当日行业因子向量数据标准化判别式训练判别式信号判断持仓数据与判别式处理持仓数据图基于回归的量化套利模型框架图模型结果与分析参数稳定性分析上文提出的回归股指期货跨品种套利量化模型框架中,存在个回测期长度需要确定......”。
7、“.....所以首先进行参数的稳定性分析。回测期长度的的选择,不能过短,长度太短,回归模型难以从过去市场信息中学习足够的知识,可能会陷入局部过拟合的困境同样不能过长,长度太长,夹杂陈旧的历史信息,不能反映市场现时博弈结构的变化,回归模型的结果不能适应市场的变化。所以选择的长度范围从到,步长为,观察模型结果,考察参数稳定性,选择参数。持仓不动交易信号生成持仓数据为判别式信号为平上证期货指数多单中证期货指数空单开中证期货指数多单上证期货指数空单。持仓不动持仓数据为判别式信号为持仓数据为判别式信号为开上证期货指数多单中证期货指数空单平中证期货指数多单上证期货指数空单。持仓数据为判别式信号为图模型年化收益与回测期长度的关系图如图所示,纵轴是模型年化收益单利年化收益,未考虑交易费用和冲击成本,横轴为回测期长度的。模型净值在是取得最大,次高点也分布在和,反映出在附近取值时,模型净值最高。除去,所以参数取值均取得了超过的年化收益率,表明参数具备定的稳定性。因为模型在附近形成年化收益率的峰值......”。
8、“.....模型结果分析个量化交易模型,为了尽量贴近市场实际,需要设置交易费用和冲击成本。本文中交易费用设置为单边万分之,冲击成本设置为两跳。收益计算方式为单利,保证金比例为。在这些假设条件之下,基于行业因子的股指期货跨品种套利量化模型的净值走势如图所示。国内期货公司的费率在交易所费率的倍左右。股指期货单跳为个指数点。图基于行业因子的股指期货跨品种套利量化模型净值走势图图基于行业因子的股指期货跨品种套利量化模型单日收益率分布图图反映了基于行业因子的股指期货跨品种套利量化模型日收益的分布情况,可以看到分布右偏,说明这是个胜率高于的交易模型,同时尾部部分收益为正的数量多相关研究成果的基础上,本文有以下些创新点。不同于传统期货跨品种套利的基于均值回复的套利策略和基于趋势的套利策略,创新性地从指数行业构成出发,构建股指期货跨品种套利模型,从证明了它的可行性。深入比较了沪深指数上证指数和中证指数构成上的区别,发现了它们在估值市值和行业构成上差异......”。
9、“.....为了贴近市场实际,适应市场需要,将量化投资的研究手段应用于股指期货跨品种套利模型的构建,以接近市场的实际环境来检验基于行业因子的股指期货跨品种套利量化模型的可行性,获得良好的效果,接近于实际应用。下步的工作方向尝试使用不同的行业分类标准构建行业因子。我国市场上存在着多样的行业分类标准,除了上文中提到的国家统计局行业标准证监会行业分类标准和申银万国行业分类外,还有资讯行业分类标准和中信证券行业分类标准等。行业分类标准的评价,市场莫衷是,有的从行业成份股市场走势致性出发,有的从上市公司营业收入出发。对于股指期货跨品种套利量化模型而言,可以尝试不同行业分类标准,通过建模的结果来评价行业分类标准的合理性,选择好的行业分类标准。强化行业因子的数据预处理。行业因子之间往往存在着数据冗余和较强的相关性,在以后的模型构建中,可以通过行业因子与目标变量的相关性检验,筛选去具有较强相关性的行业因子进入数据处理模型,也可以通过主成份分析法进行数据的降维......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。