在现代金融史上,没有一项技术比人工智能这颗核弹辐射的范围更广,更能决定命运了。
它看准了金融行业数字化程度高、历史数据准确等特点,像熔浆一样无孔不入的流进金融的各个业务中,并给它们烫上了自己的烙印:智能投顾、智能风控、智能营销、智能客服......
但同时,很多人也在质问它是否名副其实。国内好的智能投顾产品几乎为0,智能风控的效果太过依赖样本,智能营销推荐的商品让人“摸不着头脑”,智能客服遇到不会的问题秒变“复读机”。
人工智能到底给金融带来了哪些改变?它是否真正产生了实实在在的经济价值?是雷声大、雨点小,还是真正解决了金融业务中的诸多痛点?每个人选择不同,答案不同。
AI金融“四处碰壁”
|1000亿美元投入“大海”,愣是没砸出一个花来。
AI这条路,真的不好走。
即使是曾经一度成为世界首富的孙正义,最近也在人工智能的投资上栽了跟头。
作为人工智能的头号粉丝,为了投资人工智能,过去的几年中,他筹集了1000亿美元的基金,其中大部分资金投资了以人工智能为中心的70多家公司,但战绩潦倒,仅2019年,软银便亏损了880亿元,相当于一年损失了两艘“伊丽莎白女王”级航母。
其实,在现阶段的大部分行业中,AI能颠覆的场景并不多。即使在数字化程度颇高的金融行业,AI也并非一帆风顺。
比如「AI风控」,因为事关财产安全,一直是银行等金融机构关注和投入的重点。
一直以来,银行对「信用卡套现」等产业诈骗团伙十分头疼。一些不法分子利用漏洞,通过有组织的活动,将信用卡的资金提现,用于投资、赌博。而「AI风控」可以通过对个体骗贷行为的分析,找到某种联系,识别出诈骗团伙,进而做出相应的封卡措施,减少损失。
但是,AI风控的效果的好坏十分依赖样本,如果样本的数量或者质量不达标,会严重影响风控的效果。
在欺诈等场景中,样本天然比较充足,效果也相对较好。
但是在信用卡盗刷、账户盗用等场景下,因为银行的防控力度比较强,发生的案件数量较少(能积累到的样本较少),使得AI风控的效果也是参差不齐。
邦盛科技副总裁王雷认为:“样本的质量高低,很大程度上依赖于专家的经验。”而目前,AI专家人才紧缺,有经验的科学家更是凤毛麟角,这也使得AI风控在行业整体效率上难以提升。
然而,相比智能投顾、智能营销、智能客服等AI在其他场景下的应用,「AI风控」取得的成果已殊为不易。
在“AI+投顾”的场景中,智能投顾企业迟迟未能解决获客成本高、大多数投资人未能实现盈利的问题。
虞爱是一家金融科技公司——悦保科技的CEO,他平时常常会接触到做智能机器人的客户,也喜欢体验新的产品和技术,在被问及AI在哪些场景中落地并不理想时,他首先就提到了智能投顾。
他认为NLP需要对语义有更精准的理解,现阶段NLP只能实现部分流程的替代,若不能实现进一步突破,智能投顾公司与客户之间始终会存在一条看不见的“天堑”,很难进行有效且顺畅的交流。
“此外,实现AI能力的基本要素在于数据的积累,而目前的情况是智能投顾公司积累的数据量普遍较少,这也阻碍了行业的进一步发展。”虞爱说道。
在非常火热的“AI+营销”的场景中,消费者多元化的需求和市场上产品的稀缺,形成了鲜明的对比,商品的推荐效果并不理想。
智能营销通过优化AI算法,根据购买商品的网络痕迹等非常有限的信息,为每一个客户构建用户画像。构建好画像后,把用户分层,然后和相应的标签进行匹配。
“然而,智能营销的模型做的效果再好,也很难通过少量的产品满足消费者的全部需要。”专注于智能金融赛道的慧安金科CEO黄铃说。
撬起AI金融的“支点”
AI金融不是一条坦途,人工智能在金融领域每一个业务的落地过程都充斥了“分歧”与“争端”,想要更好地落地金融,需要共同的衡量标准和相对通用的技术指标。
而这些标准,不仅能为技术提供方和使用方达成共识“牵桥搭线”,也撕开了一道AI金融难以大规模落地的口子。
随着与科技公司的合作愈发紧密,金融机构逐渐摸索出一套比较通用的技术指标,比如KS值、AUC、F-score,来鉴别哪家金融科技公司的AI实力更强。
KS值越大,表明正负样本区分的程度越好,AI模型越好;「AUC」(Area Under Curve)可以分析在一条曲线下的面积到底有多大,如果曲线下的面积越大,这个模型效果越好,反之模型效果越差;「F-score」,用来判断准确率。
此外,模型覆盖率也是考验AI产品是否有很好效果的指标之一。
假设模型可以覆盖1000万人,目标是需要触及客户900万人。如果在测试时,模型覆盖了1000人,触及到的目标客户达到901人,达到了模型的测试标准,但是,因为测试的样本量太少、测试的次数太少,不代表AI产品就达到了标准。
AI模型也是有时效性的,随着时间的变化,它的性能是否会大幅下降?AI模型在更新的过程中,是否需要大量时间和金钱?AI模型和银行的核心系统在对接的过程当中是否简易?AI模型本身是否做的很标准化?
这些都是在技术指标之外,银行使用AI产品时,必须要考量的标准。
冰鉴科技CEO顾凌云说到:“部分金融机构,会执行一套客观的指标来考察AI企业的产品质量。以24小时、7天或者30天为一个期限,他们会时时刻刻监控模型的效果,一旦模型的效果超出规定范围,马上就会根据期限调整产品。即使你本身的模型效果很稳定,他也会每3个月做一次测评,每6个月做一次测评,每一年对供应商进行一次重新的测评和调换。”
通过这种方法,金融机构可以保证他们使用的产品,一直由最佳技术实力的公司提供,而反过来,也不断磨砺和推动科技公司在技术上的不断创新与发展。
|给我一个支点,我能撬起整个地球。
作为第一个掌握杠杆原理的科学家,阿基米德认为只要找到事物的内在规律,即使撬动地球也是一件自然而然的事情。
但是,想要撬起「AI金融」这座大山却殊为不易,需要找到许多支点,除了推进金融科技公司和金融机构“达成共识”外,怎样驱动人工智能更加“智能化”和怎样促进监管与科技之间的“协同发展”,也是我们需要思考的问题。
人工在前,智能在后
|人工与智能,孰好?
这是一个自AI创立以来,人们就津津乐道的话题,也是每一个AI企业家都需要思考和抉择的问题。
慧安金科CEO黄铃认为,人工和智能是互为补充的,具有完全不一样的属性。
人工,可以在自己已有经验基础上做非常复杂的推理,能够根据一些蛛丝马迹做复杂的关联和分析,挖掘出潜伏非常深、伪装特别像的风险 。
但是,人工也有几方面的问题。
第一,要成为一个非常有经验的专家,需要长时间的积累和沉淀。
第二,「人工」处理数据的“带宽”非常有限,一天只能处理几十个案件,发现很少的问题。
而对于机器智能来说,「人工」的劣势,恰恰是它的优势。它有足够的带宽处理海量的数据,还可以按照一些推理规则或者机器学习模型,帮助人们减少工作。
黄铃说:“我们可以通过准确率、覆盖率这两个量化指标,对人工智能产出的效果进行全面评估。通过ROI来判断这个人工智能项目是否取得了良好的效果。”
按照目前的发展来看,AI在人脸识别、文本识别以及风控、合规和监管等场景,效果都非常好。有些领域,AI的水平和能力甚至超过人类,比如风控合规监管,机器可以达到人类97%或者98%的水平。
但是相比人类,特别是非常资深的专家,AI的推理能力还是远远不够。
“AI其实像一个被高考机器惯出来的孩子。”蚂蚁集团首席AI科学家漆远这样形容AI目前发展“偏科”的情况,好比一位有着特别强大记忆体的学生,能通过题海战术学习了大量知识点之后,做题效率极高,却不懂怎么推理。
比如在智能风控领域,存在大量的欺诈分子,他们隐蔽身份的手法千变万化,机器也难以察觉。如何使用数据、对数据特征分析以及如何把特征组合起来,产生一个准确高效的信贷风控模型,十分具有挑战性,需要有经验的AI人才。
监管与科技
|科技可向善,也可为恶。
避恶扬善,是一个永恒的话题。
邦盛科技的王雷认为:“机器学习等技术,最大的一个问题是不透明、不可解释。”而这一特征给监管带来了许多困扰。
人工智能应用往往通过采用神经网络,使用算法产生结果,其复杂程度只有计算机可以理解,有时候连金融科技公司也不清楚人工智能是如何决策的。这种情形下,相关部门是否监管、如何监管科技公司成了一大难题。
随着技术与产业的进一步融合,人工智能的决策可能涉及数百万美元——甚至是关系到人类的健康和安全,在金融等受到高度监管的行业中,不能解释人工智能的决策,对于企业和个体而言,都面临着极大的风险,这也给监管部门提出了更高的要求。
人们往往认为监管与科技的关系是,先有人工智能等科技,后有监管,监管部门的技术与理念永远落后于科技公司,实则不是。
品钛副总裁李惠科说到:“政府监管部门跟业界之间的讨论是非常频繁的,一些高级别的监管官员会直接在群里,提各种各样的问题和业内的公司管理者们一起进行思考。”科技企业在迅猛发展的时候,监管也在与时俱进,并参与和推动整个生态的发展。
如果非要形容科技公司与监管之间的关系,科技公司就是非常前沿、时尚的法拉利跑车,而「监管」是在整个道路上面设计红绿灯、限速、停车等各种标志的交通规则。
跑得再快的法拉利,受到交通规则的管制,到了路口,也要停下来;而红绿灯的设置,保证了科技公司这辆飞车不至于“超速行驶”或者“跑得太慢”。雷锋网雷锋网雷锋网