众口说金:做风控如烹牛排,建模能到几成熟?
第五次全国金融工作会议在北京召开,这次会议有三个核心议题,一是服务实体经济,二是防控金融风险,三是深化金融改革。国家大政方针的变化势必会影响到风口浪尖上的汽车金融,金融经营的就是风险,今天就跟大家聊聊风险这些事。
▌Q1:残值数据研究方面的一些体会。
许伟:残值能让你了解到你要卖车时车在市场上值多少钱,残值分析可以通过很多方法来解决,有的用传统的统计分析方法,有的用现有的大数据、机器学习方法,但是残值预测基本上能够解决问题的方法只有大数据,大数据或者机器学习就是对未来的预测。这一块我们做了两年,两年前我们预测了一个结果,到今天我们来跟它对比,我们去看我们的预测差距有多大,如果有差距,差距在哪里,我们会去回溯、会去分析,是模型不好?还是数据基础没搭对?还是因为哪些因素没有考虑到等等。如此往复,不停去迭代和优化自己预测的方式和准确度,到今天看到的偏离值还是比较欣慰的。
▌Q2:怎么会想到把人和车给结合到一起呢?
闫文涛:因为征信公司它的大数据天然是为人服务的,识别人的风险,我们要把人的风险和具体的场景相结合。比如我们今年看到汽车金融这一块有很大的市场,于是我们在思考如何将人的识别能力和车的风险结合起来,我觉得这是我们征信公司发展的方向。所以我们想在汽车金融方面做点自己的贡献,识别一下风险,我们内部已经做了很多关于车的模型,我们体内的大数据对于车的风险的识别是有非常强的判断能力的,能够为车的风险解决很多问题,所以我们想到把公司的产品往汽车金融里面来推一下。因为在现在的消费场景里面,可能最大的一块就是车了,那么和我们公司的战略来比,这也是我们的一个方向,所以我觉得就顺理成章了。
▌Q3:如何评估企业风控体系搭建得是否完善?
许伟:我们上游服务的金融机构比较多,实事求是地讲,五花八门,见过很严格的,也见过很粗犷的。粗犷型的一般都是依托于一线的业务员,严管型的就是说谁也不相信,我就相信递交的真实的客户资料和一些交易场景所提供的一些证资,要跟买车人握手的照片、视频等等。所以基本上还是比较乱,其实银行的资管部门,他脑袋里面打了一个很大的问号,每家肯定都不会说自己差,我们要把真的风控做得好的挑出来,因为它直接反映了你资产的坏账,我们分析完以后可以看到一个完整的报告,不好的我们要把它规避掉。粗犷型的基本上业务员就可以决定给一个消费者贷款,可能一开始查一下银行征信,有的比较粗犷的金融企业,查完之后没有污点,可能说这个人确实还款能力很好,也有可能是个白户,白户就是压根没有办过信用卡,只要你不是黑户就会给办,你看到会惊呆了。尤其是地方性银行有些不太懂,车在一开始控得特别严,想看看到底是怎么样的。就像江苏也有一家地方性银行,就是这种模式,效率也比较低,客户体验也比较差,就走向了另外一个极端。
▌Q4:如何有效利用大数据搭建风控模型?考虑哪些风险因素?数据哪些是真实的、有效的、透明的?
闫文涛:以前更多地是从一个假设好的函数规则来进行判断,判断这个人是不是符合函数的平方或者开方,或者一个线性的方式。现在通过机器学习的能力可能改变了这种评价的逻辑,可能更多地从几万笔或者几千笔的数据维度里面进行校验,能够把一些无序的、看起来很复杂的、很杂乱的通过技术识别出来。可能在以前通过一些线性函数直接把这个人拒掉了,但通过机器学习的方式又把这个人识别出来了。大家可能以为这个世界可能就是遵循某个函数规则来进行的,但实际上这个世界更多的不像大家想的,可能确实是杂乱无章的,或者很复杂的,不是线性的。
▌Q5:现在市场有很多新兴的公司,建模的能力尚不具备,有什么建议?
许伟:基本上现在和数据沾边的公司就会说我是一家大数据公司,这里边有真有假。其实在这个行业里面,尤其是做大数据分析或者机器学习的人才特别少,很多公司其实根本没有能力去构建大数据分析或者机器学习的这一套风控的东西,这个就跟牛排一样,六成熟就是会用机器学习的模型,因为现在你到很多地方都能找到源代码,还包括模型的介绍,这一类型的人现在有很多,比较优秀的;再高一个层次,七成熟,大体上能够知道一些常用的数据,应该用什么模型来做分析,学机器学习的一些的研究生在这方向会接触得比较多,经过两年科班培训,才了解一些模型的特性、各种策略;再高一个层次,八成熟,可以称得上真正的牛排,他可以对现有的算法或者逻辑进行改造,因为你的商业逻辑毕竟跟工通用的商业逻辑还是有区别的,因为你肯定有你自身的特性;当然也有一些博士生和大学教授可以达到更高的水平——九成熟,因为你能创造一个商业模型基本上可以到顶级的会议去参会,或者发表论文,还有很多老师要求比较高的,他们把一些市场化的需求创造出来,那些模型也会通过论文公布出来,大家也能够看到、引用、尝试;最高顶尖级别的可以对整个机器学习的领域分析的方向进行前瞻性的思考,我认为这一类别的全球不会超过一百。我觉得目前从事机器学习的在全国应该不超过10万人。我认为你至少是一个七成熟的牛排的团,你才能称为自己是机器学习。
▌Q6:中诚信是“几成熟”?
闫文涛:现在的大数据公司有很多,在我看来我们是一个三角的关系,一个是互联网金融公司,第二个是金融科技公司,第三个就是大数据征信公司和大数据公司。刚才许伟兄把它比喻成牛排,我觉得可能金融科技公司是厨师,大数据公司提供食材,现在有很多大数据公司冒出来,但我觉得如果你的食材、你的大数据维度不够,或者一些关键的数据不够,再好厨子没有什么食材你也造不出什么特别好的东西来。所以首先你的大数据能力是非常关键的,这也是我们的一个优势,这是第一步。第二步就是这些新科技公司他的厨艺到底能把它做成六分熟、七分熟、八分、九分熟那是他的技能,我觉得这里面需要大量实践经验的检验,我们在大量的机器学习的过程中,发现在实操中有很多理论中没有碰到过的问题,我觉得一个企业有大量经验积累也是你提升厨艺的很好的方式,所以我们现在也提供大量的模型锻炼的机会来不断迭代我们的模型。
▌Q7:怎么看待直租业务?
许伟:当时最早做这个事的是大搜车的弹个车,把整个市场给点燃了,其实开始也有一些租赁公司或者金融公司在做尝试,但没有像弹个车一样广告铺天盖地去做宣传,在此之前主机厂商也有一些尝试。我一直觉得对金融这块业务要存在敬畏之心,现在国内很多做汽车金融的,尤其是互联网创业公司,他们甚至以前都没有在金融行业干过,他就觉得互联网的打法就是快,要量,风险就以后再说,我觉得可能这会有很大的问题。但也有一些这个公司还是比较谨慎,没有动作其实不是不想动,他还在观望,不着急进入这个战场,先要看看别人怎么做,把这个周期走完,有这种思考方法的人一般都是有资源。其实说白了就是三个方向的核心竞争优势,一个就是说我有非常低成本的钱,一个就是说我有非常强的渠道,还有一种就是说我的风控确实牛,你们不敢放我敢放,还不出坏账。有这三种核心竞争力的人基本上处于观望。但是你看国外的市场,就像美国,现在金融渗透率也比较高,在金融业务里面直租已经超过60%了,你可以看到直租未来的趋势、发展,而且这些玩家在美国基本就是主机厂,现在国内主机厂还没出手,我了解到的乘用车主机厂下边都有融资租赁公司,这种就是说我有渠道,主机厂就说我成本低,另一方面我手握货源。所以现在互联网公司跑在前面看到底谁最终能够收割这个市场。
|