【交易技术前沿】人工智能在金融投资领域应用与发展 / 陈晨,王晓俊,徐轶人
本文选自《交易技术前沿》第二十六期 (2017年03月)。
陈晨,王晓俊,徐轶人
东吴在线(苏州)金融科技服务有限公司
Email:chenchen@idwzx
摘要:人工智能作为金融科技的一个重要分支,在金融投资领域能起到什么样的作用?本文将从金融投资的业务出发,结合国内外相关业务研究,来谈一谈人工智能在国内金融投资领域的应用和发展。
关键字: 金融科技;人工智能;智能投顾;神经网络;知识图谱
因技术变革而至的金融科技(Fintech)是当前的一个热门话题,在过去几年中呈现运动式发展,除了BAT(百度、阿里、腾讯)等互联网公司,其他新兴公司,银行、证券、保险、基金公司等传统金融机构都被卷入这场变革式洪流之中。
回顾中国证券市场20多年的发展,技术提升效率、降低成本是一条主线。在1990年中国证券市场建立之初,确定的市场组织基本特征就是典型金融科技的应用场景。比如上交所开业就选择了电子化交易系统撮合。从技术实力上来讲,这些年证券行业在云计算、大数据领域也开展了大量前沿探索和应用。比如,阿里、腾讯所强调的大型分布式系统,沪深交易所分别于2009年、2016年完成系统分布式架构迁徙;交易所、登记公司更是早在10多年前就构建了企业级数据仓库,技术挑战丝毫不亚于任何互联网公司。同时伴随着整个行业的发展,越来越多市场参与者的核心竞争能力将建立在其技术服务水平提升的基础上,从这个意义上来说,证券行业将会是金融科技的下一个主战场。
从证券行业属性来看,公众接受证券业服务的首要目的是财富管理,是希望获得投资收益,或者提高投资决策效率和收益。在直接的金融收益驱动下,对创新技术和科技手段的重大突破和应用首先也更容易集中在投资管理领域,这是证券行业独到的优势和魅力所在,也决定了证券行业金融科技的实践会成为下一个焦点。按照人工智能、区块链、大数据等不同新技术划分,金融科技在证券行业的应用将会出现很多条分支,而其中人工智能必然对金融投资领域的应用和发展带来较为深刻和明显的变化。
什么是人工智能?从字面理解,人工智能是对人的意识、思维的信息过程的模拟。它能够完成过去只有人的智能才能够完成的复杂事情。具备人工智能的软件系统,从最初的工具属性开始逐步具备分析等高级能力。随着AlphaGo在围棋领域大获全胜,越来越多的人开始相信人工智能将会在各个领域逐步取代人类。证券投资领域也不例外,国内外很多技术先进的金融和技术公司都在积极投入这一领域的研发,尝试打造投资界的AlphaGo,利用智能算法与大数据一同打造具备投资能力的AI系统。通常我们把利用人工智能技术辅助到投资领域的智能系统称之为智能投顾系统。一个理想中的完整的投顾流程大致可以分为用户分析、资产配置、投资分析、策略生成、交易执行、分析反馈这几个阶段。对应金融投资的不同业务阶段,所用到的智能系统的职责也大不相同。因此按照阶段出现了以下三种类型的智能系统:
应用于销售前端的大类资产配置型智能投顾,主要是通过用户分析为客户解决大类资产配置问题,如Wealthfront应用于投资分析阶段的投研型智能投顾,主要通过海量数据挖掘和逻辑链条解决投资研究的问题,如Kensho应用于策略、交易和分析的智能量化交易系统,主要通过人工智能手段取代交易员,应用于投资交易,如Water Bridge桥水基金的全天候人工智能交易。
不同的系统对应到投资整个流程的不同阶段,因其职责的不同,覆盖的功能可以通过下表来展示:
接下来本文将针对以上三种不同类型的智能投顾系统,从业务和技术特征来探讨一番。
近年来,智能投顾迅速崛起,作为新的投资模式尤其在美国深受欢迎。它为顾客提供动态的,基于算法的资产配置建议。所谓智能投顾,即“智能”+“投顾”,首先它是一个投顾,取代的是人工投顾的工作。根据投资者的实际状况,如收入状况、年龄、投资目的、心理风险承受能力等因素来评估用户实际风险偏好,并推荐相对合理的投资组合建议,其投资标的主要为各类ETF基金,属于资产配置型的被动投资。
相比于传统的投顾,智能投顾有着更低的成本,使得普通家庭也能够享受专业的投顾服务。其次,智能投顾发挥算法优势且由机器自动执行,因此配置和执行更为高效。而传统财富管理则有着覆盖面有限、资源配置效率低下、普通消费者缺乏财富管理意识以及刚性兑付未完全打破等短板。
这里我们列举两家美国智能投顾企业Wealthfront和Betterment做进一步分析:
Wealthfront利用现代投资组合理论(MPT,Modern Portfolio Theory)为用户推荐投资组合,该理论是诺贝尔经济学奖得主马克维茨和威廉夏普创造的理论,通过分散的投资组合在降低风险的同时不会降低预期收益率,投资者能够在同样的风险水平上获得更高的收益率 ,或者在同样收益率水平上承受更低的风险。平台选择的资产种类多达11类,一方面有利于提高分散化程度,降低风险;另一方面具有不同资产的特性能为用户提供更多的资产组合选择,满足更多风险偏好类型用户的需求。
平台特征:
a. 用户评估: 通过问卷形式了解用户风险偏好,评估用户承受风险能力。
b. 定制计划: 根据用户评估结果定制投资计划。
c. 实时监控: 实时监控投资动态。
d. 税收服务:独特的税收优化索引服务。
Betterment的投资策略以目标导向型为基础。这样的配置模式,从服务个人投资者的角度来理解,如客户的理财目标是什么,客户也许需要一个安全的计划,也许需要退休增值计划或者个人财富目标的增值计划,Betterment会根据他的理财目标和追求,推荐相应的配置组合,并且在过程当中,持续帮客户管理他的投资计划, 与Wealthfront类似,betterment的投资标地同样主要为ETF。
a. 目标导向:客户可针对个人投资目标定制投资策略;
b. 目标拆解:客户可将资产增值长期目标拆解成短期目标;
c. 收支预算:客户可设置一个月的花销预算;
d. 资金归集:每月将客户银行账户金额转入投资账户;
e. 费用门槛:相比Wealthfront,费率和投资门槛更低;
下表为美国主要职能投顾平台规模服务概况:
相比于美国市场,国内的大类资产配置型智能投顾仍处于萌芽阶段,发展模式也有不少差异。首先,是国内与国外的市场差,国外交易品种主要为ETF,证券市场相对稳定,被动投资往往能获得不错的正收益, 并且大部分智能投顾平台具备税收管理能力,能够帮助投资者合理避税,而国内证券市场个人投资着占据大部分,市场成熟度相对较低,波动性较大,同时ETF品种也较为匮乏,因此以ETF为标的不同组合有着较大的雷同性,个性化满足程度低,也没有税收管理的需求。其次,国内不允许全权委托下单,有着监管壁垒,这也直接导致了以ETF为标的智能投顾在国内发展难度较大。因此国内的智能投顾并非以ETF为主要标的,而是以不同类型的基金和理财产品为标的,以招商银行的摩羯智投为例,配置的投资标的主要为货币基金,固定收益类、股票型基金和债券,同样可以满足用户的需求。
资产配置型的智能投顾目前的主要投资标地是大类资产,目标客户是广大群众,并非是专业投资者,因此其实质还是在销售端。当投资到具体的如ETF、基金、债券等产品时,在产品端这一层实质是专业的资管产品。如ETF的建立,股票或商品标地的选择,择时的把控等等。这时就需要投研分析类的职能投顾来辅助进行投资研究。
投研分析首先是数据分析, 互联网时代的到来,获取数据已经不再是难事。在金融投资领域,数据正在变得越来越透明且及时,信息不对称的现象被网络逐步消除。然而,面对着海量的数据,从中提取能够提供于投资与决策的有价值的数据,却变得越来越困难。以基本面研究为例,研究员与分析师每天面对的各类研报,涉及大量上市公司信息和相关新闻,除此之外还要参考市场各类宏观信息,想要研究一个公司究竟是否值得投资,何时进行投资,是一个非常复杂的过程。利用人工智能技术,可以帮助从业人员更快的从海量数据中发现不同信息的逻辑关系,从而更加精准快速得作出决策。
从数据的角度来,大抵可分为结构化数据与非结构化数据。所谓结构化数据是指可被存在数据库二维表逻辑的数据,这类数据可被工程人员直接使用,如数字、符号等,而非结构化数据指的是如:文本、图片、视频、各类报表、pdf、网页等。而从业务角度,大抵可以归为以下几类:
1)公告类: 包含上市公司各类公告新闻以及央行,交易所、地方等发布的各类公告和数据。
2)资讯类: 包含各类新闻,行业与社会动态。
3)研究报告:包含各类专业研究类报告。
4)评论类:包含社交媒体等各类社会化信息。
无论是公告、资讯、报告还是评论,大部分的数据来源属于非结构化数据,而研究的过程中大量工作的在于从非结构化数据中提取有效信息,并从不同的数据中发现有价值的投资逻辑。如果将数据看成节点,用边来表示数据的逻辑推导关系,那么所有的数据关联就可以形成一个网络。知识图谱作为人工智能的一个技术分支,专门用于处理这一类的关联。
知识图谱是一种由知识点相连的语义网络。它的基本数据结构是图(graph),由边和节点组成,节点通常用于表示实体,如:公司、地区、产品等。而图的边则用于表示关系。与传统二维表结构化数据不同,二维表需要事先定义表结构(schema),而图不需要。因此它可以更为灵活地创建和管理不同的数据。同时,不仅可以像二维表一样遍历节点,还可以通过节点的路径,顺其关系链进行网络的深度搜索。例如: 美国加息和某矿业股票的推理链,可以建立这样的图谱结构: 美国加息正相关美元汇率,美元汇率负相关黄金价格,黄金价格正相关矿业股票。 在真实的场景中,可能除了通过汇率和价格影响最终股票之外,还有多种不同的路径。当建立了实体间的逻辑关联后,通过路径-节点间的深度搜索可以完成知识间的逻辑推导,从而具备普通信息搜索技术所不具备的智能。
要从海量数据中提取数据并建立知识图谱进而最终进行展示,一般而言需要通过数据获取、数据清洗、数据分析、建立关联、推导统计等多个步骤,如下图所示:
其中数据清洗和逻辑关联的建立是最为复杂的。在数据清洗与分析阶段,需要通过语义理解、正则库等各种技术手段去自然语言中提取实体信息。如果同时需要去建立实体间的逻辑关联,则还需要通过语义理解和神经网络等技术手段。目前,在中文语义理解层面,尚不能做到具备强语义理解和逻辑推理的人工智能。主要原因在于:人工智能的开发需要大量的有效数据进行训练,虽然大数据时代信息海量,然而被标记的数据太少,用于训练理解语义逻辑关系的样本则更少。一条可行的发展路径是通过人工辅助的手段去逐步完善,从行业的维度逐个建立行业图谱以及语义理解库,从工具的角度入手,完成信息梳理和基础关联为主。因此与其说使用人工智能完全取代分析师投研,不如以智能化工具的手段辅助和提升投研效率更为可行。
投资研究的最终目的是进入市场进行交易并获取投资收益。因此整条投顾业务链在交易这一层,量化投资领域,同样有着人工智能大量的用武之地。量化投资在国外已有大约30年的历史,随着资本市场越来越成熟,金融衍生工具不断涌现以及技术的不断发展,量化投资正迎来国内最好的发展机会。将程序化决策应用到金融投资领域越来越得到市场人士的认可。量化投资通过对历史数据进行分析,借助一系列的数学方法进行归类和判断,因此和纯粹的主动投资相比更具理性,其风险控制也显得更为严格。然而量化投资的策略本身依旧是人来制定的,是将人的投资经验和策略赋予程序,然后通过不断回测和改进最终形成的策略。因此,量化投资策略最终是人的策略,并非是机器的策略。
如同图片特征可以被识别一样,市场特征也可以被识别,将图片中的每一个像素理解成影响市场行情的因素,这些因素构成了可用于预测的特征图。那么接下来从技术的角度进行分析,这类技术同样可以应用于交易。人工智能技术领域有一个分支称为神经网络,也就是通常所说的深度学习。 图像识别通常是使用卷积神经网络从大量像素中提取特征,降低数据纬度。无论是图像识别、AlphaGo、还是自动驾驶等,都是通过大量数据对神经网络进行训练来得到模型。 在行情预测方面,同样可以构建一个多层次的异构学习系统,利用正向和反向激励机制寻找数据中的相关性和潜在规律。通常使用得最多的是多层感知和递归神经网络共同来完成特征的识别和数据的预测。
所谓多层感知神经网络(MPL),它拥有一个输入层,一个输出层,和多个隐藏层,每一个隐藏层的节点,都包含一系列的运算,通过结果反馈机制获得一个最大程度拟合的模型。在整个金融市场中有着大量的结构化数据,如行情能,通过这类模型,如应用于历史行情数据,则可以用来进行行情特征的智能识别,若应用基本面、财务数据,则可以进行价值投资领域的特征提取。
另一种常用模型称之为递归神经网络,跟多层感知网络不同的是,网络中的每一个节点是顺序链接的,举个应用的例子,语义理解,由于语言文字表达是有先后顺序的,因此语义的分析需要有一个顺序先后的概念。递归神经网络中有一种称为LSTM的模型,能够解决长期依赖问题的模型,具有时间和先后概念。它通过精心设计的称作为“门”的结构来去除或者增加信息到网络节点中。门是一种让信息选择式通过的方法,控制数据的记忆和遗忘。因为市场的变化是拥有先后顺序的,利用这类模型, 对历史数据进行训练,可以用于学习市场的历史规律,并利用其时间序列的特性进行市场数据的预测。
虽然目前技术还达不到具备完全投资的人工智能机器人,但是结合了机器学习、神经网络等人工智能技术的量化投资和策略交易,能够最大程度上将人的因素降到最低,把经验性的投资策略也赋予机器。
下图为应用于行情技术特征分类的多层感知神经网络示意图:
无论从模型的计算还是特征的提取,人工智能都离不开大数据的支持,国内证券市场建设至今近20年的历史,仅以行情数据为例,尚不足以达到大数据的级别。因此离直接产生从基础数据中利用神经网络、遗传算法等机器学习方式生成强人工智能尚有不少的距离,现阶段依旧离不开通过人工辅助的方式来完成策略的制定,而是在分析、交易等各个阶段加入机器学习、知识图谱等人工智能技术辅助量化交易策略本身。
我们可以大胆假设一下,在现有的量化交易基础之上,发展出具备基于机器学习的人工智能交易系统,大致需要切分成下述几个子系统进行发展。
1) 数据系统
获取外部交易相关数据, 如行情数据,基本面数据,以及其它各类宏观行业类结构化数据。加入了知识图谱等人工智能分析能力的数据系统,可以在更广的数据场景下支持风险识别,机会提示,事件分析等高级能力。
2)机器学习系统
包含应用在投资规划、组合选择、量化择时等模块的模型训练、因子选择、参数调优等算法,是交易的核心算法系统。
3)决策交易系统
包含具体策略的交易执行,利用机器学习系统产出的模型进行自动化交易指令的下达执行。同时需要承担交易监控、异常和风控的管理。
4)交易分析反馈系统
对每个交易和执行进行评价和分析,给予一定的评分并反馈至机器学习系统进行参数调校。
早在2015年,就有消息称桥水基金正在组建人工智能团队,该团队将设计交易演算法,通过历史资料和统计概率预测未来。其实,许多量化投资公司都在招聘工程师和编程人员来扩展人工智能团队,其中包括管理着240亿美元资产的Two Sigma Investments和管理着250亿美元的Renaissance Technologies。作为人工智能爆发的元年,随着大数据的海量化,更多的结构化数据被挖掘和提取,以及算法性能的提升,很多看似遥远在未来的黑科技已经在逐步出现了。虽然具备主动感知能力的超级人工智能在现阶段来看并不现实,但是在金融投资领域,人工智能的应用是在每一个小点上开花结果,并且会越来越深入到每一条业务线中去。