量化交易心法——如何建立自己的算法交易事业
量化交易,也称算法交易,是严格按照将计算机算法程序给出的买卖决策进行的证券交易。
量化交易,也称算法交易,是严格按照将计算机算法程序给出的买卖决策进行的证券交易。
一、 什么人适合成为量化交易员
做量化交易并不一定需要特别高的学历,只要具备一定的金融学以及统计学知识,有一定的经济基础,不需要用交易的收益来维持日常生活,因为并不是很快就能找到能够获得稳定收益率的策略。迅速获利并不是量化交易的目的,量化交易员需要拥有在贪婪和恐惧中寻找平衡的能力。我们需要从小规模/有限额的投资入手,在获得经验及有盈利之后再逐步增加交易额度。——我们的终级目标是为了取得能够长期持续增长的盈利。
二、寻找切实可行的策略
量化交易真正的难点并不是缺乏交易理念,而是缺乏甄别策略的能力。这种甄别能力需要我们判断一项策略是否适合自己的实际情况和交易目标,需要再花费大量时间进行回测之前就能判断出策略是否可行。
一项策略是否可行并不取决于策略本身,而是取决于使用策略的人。比如工作时间(如果量化投资是兼职工作,那或许只能考虑那些隔夜持仓的策略,而不是日内频繁交易的策略。)、编程水平(水平高的可以开发高频自动化交易策略)、交易资本等。
策略优劣的简单评价方法:
- (1)策略与基准相比如何?收益持续性如何?
常用的衡量指标:夏普比率/收益率/信息比率
夏普比率(Sharpe Ratio)是一种用于评估投资组合风险调整后收益表现的指标。夏普比率的计算公式为:夏普比率=[E(Rp)-Rf]/σp。其中,E(Rp)代表投资组合预期报酬率,Rf代表无风险利率,σp代表投资组合的标准差。
夏普比率目的是计算投资组合每承受一单位总风险,会产生多少的超额报酬。当投资组合内的资产皆为风险性资产时,适用夏普比率。夏普指数代表投资人每多承担一分风险,可以拿到几分超额报酬;若大于1,代表基金报酬率高过波动风险;若为小于1,代表基金操作风险大过于报酬率。这样一来,每个投资组合都可以计算Sharpe Ratio,即投资回报与多冒风险的比例,这个比例越高,投资组合越佳。
信息比率
衡量某一投资组合优于一个特定指数的风险调整超额报酬。
信息比率(Information Ratio):以马克维茨的均异模型为基础,用来衡量超额风险所带来的超额收益。它表示单位主动风险所带来的超额收益。R=α ∕ ω (α为组合的超额收益,ω为主动风险)分子α为真实预期收益率与定价模型所计算出的收益率的差,α可以由风险溢价暗示。分母为残差风险即残差项的标准差。
信息比率是从主动管理的角度描述风险调整后收益,它不同于夏普比率从绝对收益和总风险角度来描述。信息比率越大,说明基金经理单位跟踪误差所获得的超额收益越高,因此,信息比率较大的基金的表现要优于信息比率较低的基金。
将基金报酬率减去同类基金或者是大盘报酬率(剩下的值为超额报酬),再除以该超额报酬的标准差。信息比率越高,该基金表现持续优于大盘的程度越高。
根据经验规则,任何夏普比率低于1的策略都不适合单独使用,几乎每月都实现盈利的策略,其(年化)夏普比率通常大于2;几乎每天盈利的策略,其夏普比率通常大于3。
- (2)回撤多深,回撤多久?
一般来说,最大回撤和最长回撤通常不发生在同一时间段内。在开始策略之前,需要问问自己能承受多深和多久的回撤?是20%/3个月,还是10%/1个月,这也是选择策略的关键。 - (3)交易成本对策略的影响
交易越频繁,交易成本对策略的盈利影响越大。所以在判断策略是否有效的时候,需要考虑增加上交易成本后策略是否仍然有效。 - (4)数据有无存活偏差
股票价格的历史数据库往往不包含那些由于破产/退市/兼并或收购而消失的股票,因此存在所谓的存活偏差,因为数据库中只有幸存者。是使用有存活偏差的数据进行回测是很危险的,因为会夸大策略的历史业绩。这在策略有”价值“偏好时(倾向于买便宜的股票)尤为突出,因为有些股票便宜的原因时公司即将破产。如果你的策略值包含那些当时非常便宜但却存活下来的股票,而忽略那些退市的股票,回测结果当然会比交易员当时的实际经历好得多。
所以当遇到有着良好业绩的”便宜时买进“的策略时,有必要问问策略的作者,回测是否使用的时无存活偏差的数据。 - (5)策略的业绩如何随时间变化而变化
许多策略10年前的业绩要远远好于现在,因为那个时候买卖价差比现在大的多,有存活偏差的数据也会使业绩变好,而且宏观经济政策及股票买卖政策也有差异。因此,在判断一项策略的适用性时,要重点关注最近几年的数据,而不能被早年光鲜数字的总体业绩迷惑。 - (6)策略是否存在数据迁就偏差
如果参数太多,可能出现过度拟合的情况,回测数据非常量化,实际应用一塌糊涂。能经得住时间考验的往往是简单的模型。 - (7)策略是被机构资金管理人忽略的么
对于个人投资者而言,我们应当寻找那些被大多数机构投资者忽略的策略。例如由于交易频发而容量很低的策略,每天只交易极少数股票的策略,持仓时段稀少的策略。这样的特色策略才有利可图,因为他们还没有完全被巨型的对冲基金套利掉。
三、回测
传统投资和量化投资的一个重要区别在于:量化投资策略可以通过回测来判断其过去业绩。回测不但是检验模型和数据的准确性,更重要的是在回测中可以尝试修改原始策略,从而优化策略。
历史数据库的使用
历史数据的准确性是保证回测结果有效性的关键,在拿取历史数据的时候,我们需要着重关注以下几点:
(1)数据是否经拆分及股息调整
数据是否经过除权和除息,如果是不复权的数据,除权前后收益率会相差很大,数据是无效的。不过采用后复权的数据,就引入了未来的因素,因为他是根据目前的股票价格等比例的调整之前的股票价格,目前我暂时也没发现好的方法避免,使用的一般还是后复权的数据。
(2)数据有误存活偏差
一般无存活偏差的数据库价格往往不亲民,因此我们尽量采用近期数据对策略进行回测,这样便不会因为有太多消失的股票而影响结果。
(3)策略用最高、最低价么
最高价和最低价的成交量往往比较少,这意味着,即使你的限价买入指令低于最高价,也可能无法成交。所以使用最高/最低价做回测不如开盘价、收盘价可靠。
业绩度量
一般最重要的指标是夏普比率、最大回撤以及超额收益率。
常见的回测陷阱及规避方法
(1)前视偏差
使用未来的数据进行回测,比如使用全部数据回归得来的系数,来回测该数据其中一段的交易信号,就存在前视偏差。
规避方法:使用”滞后“的历史数据来计算策略信号,可以避免前视偏差。比如在计算移动平均值/最高价等,只使用”上一“交易期限的收盘数据。
(2)数据迁就偏差
因迁就历史数据的噪声而过度优化模型参数,造成策略的回测业绩高于未来业绩,称为数据迁就偏差。说白了就是过度拟合。可以通过将历史数据分为两段,一段作为训练集构建模型(优化参数),一段作为测试集回测数据。理论上,两者的业绩应该是差不多的,模型才比较准确。
策略优化的指导原则为:需要同时提高训练集和测试集的业绩。策略的优化最好基于经济学的基本原理,或者透彻研究过的市场现象,而不是依据一些主观的试错法则。否则就有可能造成数据的过度拟合。
四、量化投资常见策略
均值回归策略和惯性策略
只有当证券价格是均值回归的或趋势的,交易策略才能盈利。因此构建一个策略,实际上就是要判断,在特定条件和特定时间段,价格究竟是均值回归的还是趋势性的,以及任何给定时点的初始参考价格是多少。(当价格是趋势的,就称其具有”惯性“,因此,相应的策略常被称为”惯性策略“)
清仓策略
主要有以下几种:
(1)固定持有期
(2)目标价格或盈利上限
(3)最新的建仓信号
(4)止损价格
至此,量化交易所包含的基本内容就讲述完了,大家有问题可以留言一起探讨。
更多推荐


所有评论(0)