1、“.....需要进行必要的数据处理,以获得主力合约的时间序列数据。本文中将同股指期货品种中,持仓量最高的合约定义为主力合约,即每日收盘后持仓量最大的合约为次日的主力合约。值得注意的是,当主力合约发生变化后,如果模型持仓没发生变化,使得模型持仓被动处在了非主力合约,进行套利收益计算应该使用持仓合约的行情数据,以符合实际情况,在该持仓平仓后,再在新的主力合约上开新仓。除了基础交易品种的数据,作为模型输入数据是申万级行业的日行情数据,作为特征值,输入后文构建的决策模型。数据标准化数据标准化是将数据按比例缩放,使之落入个小的特定区间。主要目的是去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的数据能够进行比较和加权,比较典型方法是标准化和标准化。本文中进行标准化的数据是申万级行业的日行情数据......”。
2、“.....些总市值较小的行业波动往往很大,经常日波动率达到,些大市值行业日波动率往往只有左右,两者差距较大,所以要进行数据的标准化。这里选用的标准化,标准化也称为标准差标准化,经过处理的数据符合标准正态分布,即均值为,标准差为,也是最常用的标准化方法,其转化函数为式其中为所有样本数据的均值,所以样本数据的标准差。由于金融数据往往呈现厚尾分布,所以这里对式做了定的修改式这里的标准化需要将训练集的数据和单组测试集的数据放在起进行标准化,不能讲所有数据进行次性的标准化。在模拟交易过程中,测试集数据是组的矩阵,记录当日申万级行业的日行情数据,而训练集数据是个的矩阵,为训练集的长度,即使用的多少个交易日的行情数据。在标准化的过程中,训练集和测试集的数据合并为个的矩阵,逐列输入按照式进行标准化......”。
3、“.....采用以下公式进行处理式为上证指数期货的日收益率,为中证指数期货的日收益率,经处理后为个由和组成的向量。回归概述为了克服单个行业因子预测的不足,所以使用行业因子组合的形式来预测次日指数的相对强弱。出于模型泛化能力的考虑,使用了线性行业因子组合,而模型信号天生具有二值性,即不是预测上证指数期货强于中证指数期货,就是预测中证指数期货强于上证指数期货,所以使用回归模型较为合适。回归又称回归分析,是种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。它与多重线性回归实际上有很多相同之处,最大的区别就在于他们的因变量不同。它们的基本形式是相似的,正是因为如此,这两种回归可以归于同个家族,即广义线性模型。如果因变量是连续的,就是多重线性回归,如果是伯努利分布,就是回归......”。
4、“.....从而可以用来建立分类规则。般地,贝努利事件的发生与否可以用二分变量来表示,二分变量回归是类形式最简单的回归模型考虑个有限的独立观察数据集的取值依赖于,若事件属于第类的概率,属于第类的概率为,的基本形式为式其中为类似于多元线性回归模型中的回归系数。对式进行对数变换得此处的日收益计算式中的收盘价数据为每个交易日下午点的价格。式至此,可以发现,只要对因变量按照的形式进行对数变化,就可以回归转化为多元线性回归。由于只去和两个值,这导致在数学上失去意义,无法利用多元线性回归的方法可以获得回归参数,所以这里要定义种单调连续的概率函数,令,式常用的单调连续的概率函数为式其中图通过对原始数据的合理的映射处理......”。
5、“.....模型构建本文的股指期货跨品种套利量化模型,使用的日频率的行情数据,所以交易信号的也是每个交易日确定次。在年月日之前股指期货的连续竞价交易时间是每个交易日上午到,下午到。年月日后,中国金融期货交易所修改了交易规则,连续竞价交易时间变更为每个上午的到,下午到到。股票市场的连续竞价交易时间为每个交易日上午到,下午到。为了保证模型能够使用到最新的市场信息,同时考虑到交易模型的致性,交易时间选择在每日股票市场下午收盘时间,即每个交易日下午点。年月日与年月日之间共有个交易日,排除意外情况后,共个交易日可用。此外当上证指数期货或中证指数期货出现涨跌停导致无法进行交易时,则保留持仓到下个交易日。套利模型总体思想是通过行业因子的变化,利用回归模型,将行业因子组合起来,预测次日上证指数期货与中证指数期货的相对强弱关系......”。
6、“.....以当日下午点时的价格做多上证指数期货,同时做空等市值的中证指数期货当预测上证指数期货弱于中证指数期货时,以当日下午点时的价格做空上证指数期货,同时做多等市值的中证指数期货。通过这种方式规避市场方向预测的难题,获取套利收益。假定今天为第日,如图所示,量化模型生成交易指令过程分为步将日行业因子矩阵日上证指数日收益率向量和日中证指数日收益率向量进行数据标准化处理,生成特征矩阵和指数强弱向量。这里的日行业因子矩阵有到日的申万级行业的日涨跌幅数据组成,日上证指数期货日收益率向量和日中证指数期货日收益率向量由到日的上证指数日收益率和中证指数日收益率组成。利用特征矩阵,通过回归模型对指数强弱向量进行拟合,估计参数向量,生成判别式。理论上在每个交易日下午点时的价格都是可以交易的,但也存在着意外情况......”。
7、“.....即沪深指数涨跌幅达到时暂停交易分钟,涨跌幅达到时,暂停交易到收盘,不再进行集合竞价。该制度破坏了交易的连续性,使得在下午点,不能以当时价格交易上证指数期货和中证指数期货。在年月日和年月日沪深指数盘中跌幅达到,触发了熔断机制,导致该日下午点无法进行交易。针对这种现象,本文将该日交易数据与次日交易数据合并,组成组数据,不将该日看成独立交易日,这样年月日与年月日之间有数据的交易日个数变为个。在的下午点,使用当日申万级行业的行情数据,进行标准化后,由判别式生成和信号,代表模型预测次日上证指数期货走势强于中证指数期货,代表模型预测次日中证指数期货走势强于上证指数期货指数。将判别式信号和持仓信号进行比较。持仓信号为代表持仓为上证指数期货多单,中证指数期货空单持仓信号为代表持仓为上证指数期货空单......”。
8、“.....如果判别式信号与持仓信号相同,则持仓不同,不进行交易如果持仓信号为与判别式信号为,则平上证指数期货多单中证指数期货空单开中证指数期货多单上证指数期货空单。如果持仓信号为与判别式信号为,则开上证指数期货多单中证指数期货空单平中证指数期货多单上证指数期货空单。日行业因子矩阵日上证指数日收益率向量日中证指数日收益率向量回归模型数据标准化当日行业因子向量数据标准化判别式训练判别式信号判断持仓数据与判别式处理持仓数据图基于回归的量化套利模型框架图模型结果与分析参数稳定性分析上文提出的回归股指期货跨品种套利量化模型框架中,存在个回测期长度需要确定,才能真正把模型确定下来,所以首先进行参数的稳定性分析。回测期长度的的选择,不能过短,长度太短,回归模型难以从过去市场信息中学习足够的知识,可能会陷入局部过拟合的困境同样不能过长,长度太长......”。
9、“.....不能反映市场现时博弈结构的变化,回归模型的结果不能适应市场的变化。所以选择的长度范围从到,步长为,观察模型结果,考察参数稳定性,选择参数。持仓不动交易信号生成持仓数据为判别式信号为平上证期货指数多单中证期货指数空单开中证期货指数多单上证期货指数空单。持仓不动持仓数据为判别式信号为持仓数据为判别式信号为开上证期货指数多单中证期货指数空单平中证期货指数多单上证期货指数空单。持仓数据为判别式信号为图模型年化收益与回测期长度的关系图如图所示,纵轴是模型年化收益单利年化收益,未考虑交易费用和冲击成本,横轴为回测期长度的。模型净值在是取得最大,次高点也分布在和,反映出在附近取值时,模型净值最高。除去,所以参数取值均取得了超过的年化收益率,表明参数具备定的稳定性。因为模型在附近形成年化收益率的峰值,所以量化套利模型的参数回测期长度确定为......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。