程序猿讲故事 |颤抖吧!反人类的人机验证码
嗯,这个世界已经阻止不了程序猿了......
人机验证简介
人机验证(Captcha,全自动区分计算机和人类的公开图灵测试)是一类进行问答式身份验证的安全措施,目标是区分正常用户操作和计算机程序访问,从而差别处理以实现对系统的保护。
在Captcha测试中,作为服务器的计算机会自动生成一个问题交由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答Captcha的问题,所以回答出问题的用户就可以被认为是人类。
人机验证的必要性
随着网络的发展,大量计算机系统实现了互联。互联在给我们提供便捷的同时,也使得计算机程序时刻面临着各种各样的威胁,一旦被攻击,将会造成非常大的损失,因此程序的安全性变得十分重要。
比如接口枚举攻击就是常见的攻击类型。接口枚举攻击是指非法程序对正常接口在短时间内进行大量请求。
有时是对一次请求的重放,导致正常用户无法访问该接口或访问缓慢,属于拒绝服务攻击(DoS)的一种形式;有时是对接口请求参数进行枚举,试图破解安全防御,比如登录场景下,对登录密码进行枚举试错;有时是恶意消耗资源,比如对短信发送的接口进行攻击实现短信轰炸。
这些都属于高频率的异常访问,人机验证就是一种识别并阻止这类访问的安全机制。人机验证技术有助于保护系统免受垃圾信息、恶意注册的干扰,使系统运行更加安全。
常见的人机验证模式
传统的人机验证方法是利用图形的视觉识别来进行验证,常用验证方案有:图片字符验证、图片含义验证、上行短信验证。
验证码技术的使用非常广泛,比如,一个用户进行登录操作,连续几次都输错密码,将会提供验证码让其输入答案,这样可以防止对登录操作做暴力破解。但验证码在提供安全机制的同时,会影响用户体验,近年来对验证技术的改进主要集中在不降低安全性的同时提高用户体验。
第一代验证模式被称为标准验证模式,也是我们最常见的图形验证码、语音验证码。其原理是基于机器难以处理复杂的计算机视觉及语音识别问题,而人类却可以轻松的识别来区分人类及机器。
这一代验证码初步利用了人类知识容易解答,而计算机难以解答的机制进行人机判断。为了降低机器对图形的识别概率,往往会在生成的图片中加入干扰项。最早期的验证码,使用扭曲的字母和变化的背景颜色梯度来防御图像分析。
后来,一种更现代的验证码,不使用扭曲的背景及字母,而是增加一条曲线来使得图像分析更困难。另一种增加图像区分难度的方法为是将符号彼此拥挤在一起,但这也使得真人用户比较难以识别。
第二代验证模式被称为创新验证模式,是基于第一代验证码的核心思想(通过人类知识可以解答,而计算机难以解答的问题进行人机判断)而产生的创新的交互优化型验证码。
第二代验证码基于第一代验证码的核心原理--“人机之间知识的差异”,拓展出大量创新型验证码,比如:加减乘除数学算式型的验证码、知识问答验证码等。大名鼎鼎的12306 网站所使用的验证码也属于此类。
第三代验证模式,即无知识性验证模式。其最大的特点是不再基于知识进行人机判断,而是基于人类固有的生物特征以及操作的环境信息综合决策,来判断是人类还是机器。无知识型验证码最大特点即无需人类思考,从而不会打断用户操作,进而提供更好的用户体验。
人机验证框架设计
对于人机验证的过程,我们可以抽象为3个阶段:识别➡️ 触发➡️ 验证。
识别阶段:获取每次请求的当前信息和历史信息,根据预定义规则,决定验证机制是否被触发。
触发阶段:拦截正常业务逻辑执行,根据环境上下文信息不同,生成不同类型的验证码,如字符型验证码,短信验证码等。
验证阶段:用户输入验证答案后,进行比对,决定是否对该操作放行进入正常业务处理。也可能提升风险等级后,触发更高级别验证机制。
框架在考虑功能性需求的同时,因人机验证组件在使用场景上,往往是独立于正常业务逻辑模块的,因此要兼顾到开发人员使用人机验证组件时,对原有业务逻辑无侵入,做到应用透明。下图是一个典型的人机验证框架处理过程:
框架说明:
操作2,3表示,拦截请求模块从Redis数据库中读取请求的历史信息,以判断是否需要触发人机验证。
操作11,12表示,拦截请求模块要求二次验证模块,向验证码服务模块发起二次验证,以判断客户端是否通过人机验证,以及是否符合人机验证的安全级别。
接口异常访问的识别方法
人机验证机制主要针对的就是高频率的异常访问,因此判定高频率异常访问的规则如下,如果IP地址A在T秒内对接口B的访问次数超过N次,就触发人机验证。
假设给定的场景如下(后面介绍中三个示例都基于该场景):IP地址A在60秒内对接口B的访问次数超过120次为异常访问。
本文中,我们使用Redis来存储计数信息。Redis是Key-value类型的内存中的数据结构存储系统,即Value可以是多种类型的数据结构,如String,List,Hash。Redis还可以给Key设置过期时间,时间到了,Key和Value就会被清除。
对于Key的设置来说,3种不同方法采用同一个模式,可以根据IP地址A + 访问的方法B的名字(或者访问的URL+HTTP方法)设为Key,该Key对应的Value专门用于记录IP地址A对方法B的访问历史记录。
但是不同方法,对于Value和有效期的设置,则不同。
嗯......你在说什么?(扶额)
识别方法1 – 固定时间窗口计数模式
用Redis来存储固定时间窗口内的访问总数:
Value的设置:可以认为Value是正整数,代表访问次数
有效期设置:Key的有效期设为时间窗口的大小,例如示例中的60s
每次访问时,先判断Key是否存在,当Key不存在时(第一次出现或已经过期),创建一个新Key,并将对应的Value设为1,表示已经访问1次,同时设置该Key的过期时间为60秒;当Key已经存在时,取出Key对应的Value值,如果Value已经等于120,则拒绝访问或触发验证码;如果Value小于120,则允许访问并给Value加1。
算法流程图如下:
算法性质:
如上图所示,虽然在蓝色时间段和绿色时间段内,访问次数都不会超过120次,但是该算法的缺点是在两个连续的时间段的连接处,可以在短时间内(红色时间段加紫色时间段)达到239次的访问量,因此在黄色线段代表的时间段内访问量达到了239次,远超过限制的120次,这显然不是我们想看到的。
识别方法2 – 滑动时间窗口全量计数模式
用Redis来存储每次访问的时间:
Value的设置:可以认为Value是List,List的大小始终不大于120
有效期设置:不设置有效期
每次访问时,先判断Key是否存在,当Key不存在时(第一次出现),创建一个新Key,并在对应的空的List右侧增加一个元素,该元素记录此次的访问时间,该Key不设置过期时间;当Key已经存在时,得到Key对应的List的长度。
如果List的长度小于120,则在List的右侧增加一个表示此次访问时间的元素;如果List的长度等于120,则在List的右侧增加一个表示此次访问时间的元素,并删除List左侧的第一个元素,然后判断List最左侧和最右侧两个元素的时间差,如果时间差大于60秒,则允许访问,如果时间差小于60秒,则拒绝访问或触发验证码。
算法流程图如下:
算法性质:
该算法记录的是每次访问的时间,因此可以精确保证任意的连续120次访问,其中的第1次和第120次的时间间隔都不会少于60秒。
识别方法3 –Token Bucket算法控制访问频率模式
简单来看,可以将这个算法类比成有一个水龙头以固定的速度在不断地往一个水桶中放水,然后不断地有水瓢到这个水桶中打水去浇花,如果水桶中没水了,就不能浇花了。
如果水桶的水满了,那么水就从水桶中溢出了。在这里,水桶就相当于Bucket,水就相当于Token,水瓢取水就相当于从Bucket中取出Token。下面是原始的Token Bucket算法:
原始的Token Bucket算法概述:
1. 如果一个请求可以从Bucket中获得一个Token(即Bucket中的Token数量大于等于1),则请求放行,并将Bucket中的Token数量减1;如果Bucket中Token数为0或者Token数小于1,则请求被拒绝;
2. Bucket有最大容量,Bucket有一个初始的Token数;(可以为0,或者为小于最大容量的一个值)
3. 会以一定的速率不断向Bucket中添加Token,如果在Bucket中的Token数量等于最大容量,而且没有Token消耗时,新的额外的Token会被抛弃。
对于原始的Token Bucket算法,由于要以一定的速率均匀地向Bucket中添加Token,所以初步的实现想法是为Bucket设置一个定时器,每过一个时间间隔,就向这个Bucket中添加一定数量的Token。
但是这样的实现方式在现实中基本没办法用,原因在于,这种算法要给每个Bucket添加一个定时器,一个定时器就是一个线程,而在人机验证中往往会存在多个Bucket,Bucket的数量就等于访问服务器的用户数量,这就会使得定时器占用服务器的很多资源。
于是就有了下面的改进算法,来替代定时器这种实现方式。
用Redis来存储访问历史记录:
Value的设置:可以认为Value是一个有四个属性的Java对象,分别为:Capacity(表示Bucket的最大容量),Rate(向Bucket里面添加Token的速率,单位是个/秒),lastAccessTime(表示上一次访问的时间)Count(表示对应lastAccessTime时候Bucket中的Token数量)
有效期设置:Key的有效期设为60秒
改进算法详细说明:
1. Bucket的最大容量设为(120个 * 1/6);
2. 当一个Key不存在时(第一次出现,或者已经过期,Key的过期时间为60秒),新创建一个Key和Bucket,将Bucket的初始容量设置为Bucket的最大容量,然后将Count值减1(本次请求消耗1个Token);
3. 添加Token的速率为(120个 * 5/6)/ 60秒,使得在这个Key的生存周期内最多得到的Token数为(初始容量 20 + 生存周期60秒内加入的Token数100)120,满足60秒内不超过120次的要求;
4. 将初始容量设置为120 * 1/6 是为了应对突发的高频率请求;
5. 如果将初始容量设置为0,然后在Key的生存周期内以120个/60秒的速率添加Token的话,无法应对60秒的前小段时间的持续高频率请求(比如前2秒以4次/秒的频率发起请求,后续就不再发起请求,具有这样特征的请求应该是合理的,不应该被马上拒绝),这样的用户体验并不友好;
算法流程图如下:
算法性质:
1
如上图所示,蓝色线段和绿色线段表示两个连续的时间段,在这两个时间段(60秒)内,访问总次数最多为120次(因为一共就往Bucket中添加120个Token),理论上应该是对任意的60秒内,访问次数不超过120次。
如果实现为滑动窗口,则可以更准确地控制访问次数,但是由于滑动窗口很难实现,只能用这个Token Bucket算法的变种来代替实现。
2
与对访问次数计数的方法一样,这个算法也会在两个连续时间段的连接处出现超次数访问的情况。
对于红色时间段,可以使用蓝色时间段之前积攒下来的Token,但是由于Bucket的最大容量就为20,所以最多积攒20个Token;对于紫色时间段,可以全部使用绿色时间段初始时的20个Token,在黄色线段对应的时间段内,外部添加的Token数为(120个 * 5/6)。
因此,黄色时间段内的Token总数为(120个 * 7/6),仅超过限制次数120次的1/6,相比于对访问次数计数的方法,超过限制次数的一倍,Token Bucket超过的次数还算可以接受。
3
该算法设定Bucket的最大容量等于Bucket的初始容量,因此如果最大容量设为限制次数的1/8,则黄色时间段内的最大访问次数可以达到限制次数的9/8。
最大容量的设定需要在应对突发高频率访问的能力和两个连续时间段连接处超过限制次数的多少,这两者之间权衡。
比较与结论
不同的流量控制算法有不同的适用情景,需要考虑到算法性能,流量特征,使用目的等多方面因素。流量控制有两类:
1. 第一类像web service对调用次数的控制,比如一天24小时免费调用不超过100次,这类流量控制更关注的是一天内实际访问的总次数,而不太关注访问的时间段,以及访问时间段内的访问频率;
2. 另一类就像人机验证对访问频率的控制,虽说判定异常流量依据的规则是60秒内访问次数不超过120次,但是,这只是衡量访问频率的一种表示方法,可以理解为平均访问频率为2次每秒,因此更关注的是访问时间段内的访问频率,而不是60秒内的访问次数到底是多少。
下面就以上提到的三种算法进行比较分析:
看完的同学,今天给自己加个鸡腿吧🍗!
作者简介:兴业数金研究开发总部 吴晓岩、侯响响、杨益明
祝贺丨兴业数金金融云信息科技人员知识培训第一批次顺利结业
为提高兴业数金金融云业务各合作银行科技人员的信息科技技术水平,兴业数金于2017年9月18日-19日开展了第一批次的信息科技人员知识培训。培训主要面向各合作行负责机房、网络、IT风险管理和运维管理等的员工,一共有超过五十多家银行的七十多位人员参与了本次培训。
本次培训是兴业数金成立后,开展的第一次面向合作行信息科技人员的系统性的知识培训,由兴业数金相关技术骨干分别讲授了系统管理、机房网络管理、云计算知识、IT风险管理等方面的知识体系内容。经过紧张的培训、学习和最后的考试,所有学员均通过了本次培训考试,顺利结业。
兴业数金希望通过培训提高合作行科技人员的技术能力,在其岗位上发挥更大的作用。兴业数金也将会根据学员的反馈意见,不断调整和优化培训内容。
兴业数金金融云业务的前身,源自于兴业银行银银合作中心信息科技输出业务。本着服务广大合作银行的理念,兴业数金一直与合作伙伴分享自身发展历程中积累的经验、教训、理念、技术、文化、产品等,希望能够带动各合作行的客户们形成一个信息共享的服务圈、生态圈,共同提升科技实力,共同发展与成长。
通过本次培训,一方面加强了合作行科技人员的技术能力,另一方面也加强了兴业数金和客户的亲密关系。
最后,再次祝贺所有学员顺利结业。
兴业数金成为云安全联盟CSA企业级会员单位
017年9月,兴业数金正式获批加入“云安全联盟”(Cloud Security Alliance,CSA),成为云安全联盟中国区成立后首批“中国企业会员”单位。
在2017年9月11-13日召开的“2017年度互联网安全大会”上,兴业数金IT风险总监许志恒领取了来自云安全联盟颁发的会员证书,双方就云安全服务方面做了进一步的交流与探讨。
作为大会的演讲嘉宾,许志恒先生参与了互联网安全大会云计算安全分会场的嘉宾对话环节,就兴业数金“数金云”将监管合规要求落实在行业云服务领域的实践进行了分享,获得了现场与会人员的一致好评。
云安全联盟代表着云安全领域的高水准,具有广泛的国际影响力。许志恒先生表示:“兴业数金加入云安全联盟,将加强与领先安全企业的合作,持续提升自身信息安全能力建设,努力为客户带来更安全、更优质的金融行业云服务。”
兴业数金的“数金云”产品,其在信息安全领域的建设一直采用银行级的高标准要求自己,在满足监管合规的基础上,一直持续探索新科技、新技术,不断完善自身安全水平建设,形成了安全架构、安全技术、安全管理等一体化的解决方案。
开放式物流云平台来了,该怎么“玩”好风控呢?
2016年我国社会物流总费用高达11.1万亿,作为占GDP将近15%的第二大产业,其中却有大量中小企业因为融资困难而举步维艰。
为了缓解中小企业融资困境,物流企业与商业银行联合创新了物流金融模式,然而随之而来的是新模式下产生的新风险,如何控制与防范新风险成了商业银行以及物流企业亟需解决的问题。
为此,基于物流运输业务特点,研究中小企业的业务模式和信贷融资行为,分析对其产生影响的关键因素,并打造基于物流行业的开放式平台,为中小企业提供一揽子综合性金融服务,从而促进中小企业的发展,具有重要的现实意义。
中小企业融资困境,物流金融应运而生
目前,货运物流已经形成了一个庞大的产业链,是当今时代的一个标志,物流行业每年的发展都会创一个新高,专业化、国际化、规模化、集团化、多元化等趋向也越来越明显。从2010年至2016年,社会物流总费用从7.1万亿增长至11.1万亿,复合年增速为8.8%,其中,2016年社会物流总费用与GDP的占比为14.9%。
图一:近年社会物流总费用
然而,由于中小企业信用评级低、长期性权益性资本匮乏和银行信贷条件过高、信贷配比限制、民间融资成本过高等原因,中小企业的信贷融资困境问题日益显现。在这种大背景下,将物流业与金融业强强结合的物流金融模式应运而生,一方面增强了中小企业的发展能力,另一方面也有助于商业银行拓展信贷渠道。
物流金融,顾名思义,是物流行业的金融衍生服务。从研究的对象主体上看,物流金融有别于供应链金融,前者是物流企业为主导的供应链金融服务,后者是对整个供应链提供的金融服务。
物流金融最基本的模式是仓单质押模式,在此基础上衍生出其它不同的创新型物流金融模式,具体包含信用证担保、替代采购模式、仓单质押、垫资代收货款、买方信贷、垫付货款和授信融资等模式。
新的融资模式,伴随着新的风险
虽然通过物流交易信息的监控有助于对中小企业贷款的管理,但物流金融在国内还是一种新事物,无论是对于物流公司、金融机构、还是融资企业均处于探索阶段。由于风险主体之间风险与收益不对等、流动资产评估体系不完善、物流金融信贷业务经验不足、风险管理方法欠缺等原因使得在开展物流金融时存在一定的风险。
物流金融中的风险可以划分为客观信用风险和主观信用风险,前者是指交易对象无力履约的风险,来源于法律风险、宏观市场风险;后者是指非对称信息下的主观违约风险,来源于业务风险和财务风险。
图二:物流金融中的各类风险
创新风控模式,护航物流金融
由于客观信用风险多由外部客观原因造成,因此相应的防范措施一般采用对于宏观市场和法律政策开展实时监控、事后预警的方式。而对于主观信用风险,本文认为通过扎实推进数据、模型、系统,及数据应用等领域的建设,以降低中小企业违约风险,并提高商业银行自身的盈利能力和服务水平。
第一,做实数据基础。存储并积累整个运输流程的数据,包括但不限于上游货主历史订单和支付信息,物流企业历史运单信息,运输车辆历史运单信息等,这些动态、实时的交易数据,相比于银行静态的客户数据和财务数据,可以洞察企业经营整个过程,更是企业经营的直观反映,有助于银行揭示其客户隐性的潜在风险,是银行信贷审批、风险预警一个很好的补充。
第二,做实算法模型。在历史数据积累不够充分的情况下,需要从专家经验提升至规则加模型。基于专家经验的算法和规则设置,可以从业务稳定性、还款能力、还款意愿、信用历史、第三方数据等方面全面评估中小企业信用风险,并将算法结果应用于授信审批过程,以降低业务审批的边际成本。
与此同时,也要注重模型独立验证团队的建设。算法模型上线使用后,验证团队应对算法模型的表现进行持续监控和验证,评估风险模型实际运行效果,持续对风险模型进行更新优化及再开发,修正算法模型存在的缺陷,以确保算法模型的有效性和满足监管合规要求。
第三,做实信息系统。一方面,通过采用分布式文件存储、NewSQL数据库等数据存储技术解决物流金融相关数据的可扩展管理及存储问题,实现高频、海量的交易相关数据高效、安全的存储。另一方面,打造线上化和自动化的融资业务流程,实现全流程线上化操作和处理。即通过互联网渠道,在线实现融资申请、授信审批、提款还款、风险预警等业务流程,实现用信、授信和贷后管理的一体化与自动化。
第四,做实数据应用。针对中小企业主体风险高、业务存续期限短的客观性,从全新的视角来看待中小企业的融资风险,侧重短期视角和单笔业务交易来进行审批决策。一方面,侧重于从流动性、周转能力等短期还款能力的数据来看待企业经营,从而提高决策的时效性和准确性;另一方面,重债项、轻主体,即以安全性高的单笔业务交易数据为基础,再辅以算法模型来计算单笔业务的融资限额,从而实现动态化、精细化的风险管理。
落实创新方案,践行普惠金融
兴业数金作为银行系金融科技子公司的先行者,本着“让金融更简单、让金融更美好”的使命,致力于为中小银行、非银行金融机构以及非金融机构提供金融科技的创新服务。在物流行业生态圈中,兴业数金将通过打造物流行业云平台,构建基于物流大数据的智能风控算法模型,助力商业银行提升物流生态圈中核心企业及上下游提供综合金融服务水平,缓解中小企业融资困境,践行普惠金融理念。
第一,打造物流金融的第四方物流平台,增强资源信息的整合力度
数金的第四方物流云平台(4PL),突破了第三方物流供应方在综合技术、集成技术、全球扩展能力上存在的局限性,而从更高的维度完成评估、设计、制定全面的供应链集成方案。
基于4PL平台,一方面实现了供应链管理、一体化物流和上下游产业整合的功能,满足客户信息发布、交易匹配、合同签订、支付结算等需要,提升物流行业中企业的管理效率。
另一方面,通过自动获取和整合物流链上的交易数据,使供货商、物流企业、融资企业和商业银行之间的资金流、物流与信息流循环运作,彻底杜绝数据在传递过程中的“加工处理”,确保数据真实性和时效性,降低交易双方的信息不对称程度,夯实物流金融风控的数据基础。
图三:数金物流云平台
第二,以算法模型为创新驱动,打造持续领先的风险管理能力
在第四方物流云平台全景大数据充分整合的基础上,再结合第三方机构获取的企业及个人征信信息,行业信息等外部数据,构建物流金融风控模型,切实提升商业银行的风险管理水平。
一方面借助层次分析法(AHP)处理较为复杂而模糊的大数据,配合行业专家经验对指标进行排序,再通过计算判断矩阵的最大特征值和特征向量得到各元素的权重,实现量化打分评级的效果,并将信用评分结果应用于额度计算、贷款定价等审批决策过程,实现信贷审批精准量化决策辅助。
另一方面,在数据积累一定程度下,基于人工智能、机器学习、统计学、信息检索、数据库等技术,利用信息值(IV)、相关性、共线性(VIF)等技术手段筛选删除失效的财务指标,让中小融资企业为迎合传统风控模型而人为调整的各项财务指标减弱或失效,同时挖掘出潜在的、有效的风险特征,数据规律、规则、趋势等,达到“总结过去、预测未来”的智能化效果。
第三,连接众多商业银行,提供线上聚合融资服务
物流云平台通过连接底端的众多商业银行,开发机构管理、用户管理、产品管理、流程管理、模型管理、策略管理等功能模块,并基于物流平台交易数据和第三方外部数据,依托智能风控算法模型,实现在线申请、在线审批、在线签约、在线放款、在线还款和贷后管理等线上全信贷流程,为中小物流企业提供聚合融资服务,不仅提升了传统商业银行的业务效率和服务水平,而且也降低中小企业融资成本,缓解了中小企业融资难、融资贵的困境,将普惠金融的“惠”落到实处,保证了普惠金融业务的可持续性发展。
作者:兴业数金算法实验室 陈文彬 陈秀益
牵手啦|兴业数金与TalkingData 公司达成战略合作
9月11日至12日,由TalkingData公司主办的“T11 2017 智能数据峰会”在北京举办。在现场,兴业数金与TalkingData公司签署战略合作协议。
“这次战略合作是兴业数金和TalkingData公司的强强联合,在金融行业互联网移动应用领域有良好的合作基础和广阔的合作空间。”签约仪式上,兴业数金总裁助理陈旭群先生表示。
“未来,TalkingData公司将把最新版本的统计分析平台软件部署到兴业数金的“数金云”上,双方共建云分析平台,以SaaS方式为银行客户提供移动应用的统计分析服务。”
近年来,大数据日益成为国家基础性战略资源,蕴藏着巨大的潜力和能量。在国家层面,发展大数据已成为提升竞争力的战略选择;在经济层面,发展大数据已成为打造新动能的关键要素;在行业层面,发展大数据已成为驱动转型发展的重要引擎。推动大数据发展,已成为从政府到民间、从行业组织到企业机构的社会共识。
作为经济发展重要的组成部分,金融行业机构的数据应用和发展趋势亟待探讨。
以中小银行为例,一方面,经济下行的大环境下,资产收益率降低,不良率持续增高;另一方面,经营范围受限,规模发展空间有限;再加上互联网金融冲击,传统金融业务难以展开,客户流失严重。
如何用好大数据、让大数据带来可量化的价值,是中小银行甚至金融机构,转型能否成功的重中之重。
(兴业数金数据产品研发总监 张振原)
“目前,中小金融机构当下的数据诉求主要包括几个方面,数据仓库的建立、数据建模、分析、操作性数据储存、统一客户视图、客户关系管理等。”兴业数金数据产品研发总监张振原先生在现场演讲时,指出当前中小金融机构的数据需求现状。
TalkingData公司作为国内最大的企业级移动互联网第三方数据服务提供商,专注于移动互联网大数据领域,在移动产品运营、用户体验优化等方面有非常丰富的技术和经验储备,可以说是大数据行业的独角兽。
兴业数金作为目前国内的银行信息系统云服务平台,依托兴业银行集团综合优势,集监管认可、合作行认同;安全、可靠、架构合理;产品齐全、品类丰富;服务体系完善、响应迅速等多项优势于一身,在民营银行及城商行领域取得重大发展。
此次兴业数金与Talkingdata公司的合作,整合双方优势,相当于把行业内对于数据服务的标准提升到一个全新的高度。
右二为 兴业数金总裁助理 陈旭群
右一为 兴业数金网络金融事业部总经理 汤迅
“未来双方共建的云分析平台,将为中小银行及非银金融企业客户提供包括精细化运营的方法论和指标体系、追踪用户行为数据的能力、移动大数据采集和管理的能力、以及第三方大数据交换平台对接的能力。”现场,陈旭群先生对双方合作内容做了简单的介绍,“同时,为客户提供综合性的移动运营数据平台解决方案。能够有效的帮助客户提升移动应用的用户体验和服务质量、开展基于大数据支撑的业务创新、提升营销效果。”
“我相信未来这样强强联手提出行业解决方案的合作模式在Fintech领域中也会越来越多,兴业数金也抱着开放的心态,欢迎与更多垂直领域的优秀企业加强合作和交流。”
动态 |构建金融科技生态,打造西部金融创新引擎
9月7日至8日,由《金融电子化》杂志社、丝绸之路农商银行发展联盟联合举办的第二届“一带一路”金融科技发展(西安)论坛在西安召开。兴业数金受邀出席本次论坛,并分享了公司在金融科技领域的创新应用。
会议以“共商、共建、共享——‘一带一路’战略下的金融科技与金融创新”为主题,与会嘉宾共商金融科技创新助推区域金融经济发展之道。
据中国人民银行报告显示,截至2016年末,银行业在东部地区网点数8.8万个、资产规模112.4万亿元,中部地区网点数5.3 万个、资产规模31.2万亿元;西部地区网点6.0万个、资产规模37.9万亿元。对比可见,西部地区在网点数量、人员规模上已向东部地区看齐,但资产规模上还存在较大差距。
因此,快速推动西部地区金融实力增长,从业务、管理等层面缩小与东部地区、中大型银行的差距,是实现区域经济发展之道的重中之重。
“结合目前小微实体经济发展过程中面临的,如可靠抵押物缺失、征信数据覆盖不足、普惠金融运营成本等实际问题。我们可以看到,利用金融科技填平金融与实体经济间的信息鸿沟,这一举措刻不容缓。”兴业数金总裁陈翀先生现场发表,对金融科技应用的看法。
(兴业数金总裁陈翀先生 现场演讲)
2007年开始,兴业银行集团就开始为中小银行提供科技系统输出,即目前的“数金云”产品。提供包括财富管理业务合作,支付结算业务合作,机构投资交易平台等内容的服务体系,旨在解决中小银行和机构技术人员不足、资金匮乏等问题。截至2017年7月末签约机构1208家,累计联网上线903家,成为国内出色的银行信息系统云服务平台。
随着金融科技的不断普及和应用,银行与金融科技公司也从各自独立发展到跨界竞合。可以想象,未来,银行与金融科技公司将实现生态重构。
而在此趋势下,兴业数金为中小银行等金融机构提供的服务也将不断升级和扩展。
陈翀先生在会上介绍,“通过接入第三方开放银行平台,将金融机构特有的服务通过组件化形成兴业数金的“金融+”连接层,在此基础上,集成、融合其它金融科技公司的力量,为金融行业的客户提供基于生产、生活场景的金融服务。”
未来,兴业数金将通过融合银行的专业、稳健与金融科技的敏捷、方便,完成与先进金融科技生态的对接,实践普惠金融。
生而为数据,也有意想不到的权利!
写在开篇:
近日,陕北绥德产妇马某从病区跳楼身亡。院方称“产妇签署了《授权书》,未获得被授权人(马某丈夫)同意,医院无权改变生产方式。”
然而,从授权内容看,(马某)并没有放弃本人决定权。正确理解是:家人此时有权签字决定手术,本人也有权决定!家人意见与本人冲突时,以本人为准,本人有最终决定权。
这里的关键词是“权利”二字。
今天我们也来谈谈“权”,数据权。
进入大数据时代的今天,伴随着移动互联、云计算、物联网等事物的蓬勃发展,数据规模出现爆发式增长,企业对于数据的利用也呈现出各种各样的形式。
随之而来的是,屡屡发生却难以解决和定性的侵权事件,给身处有数据沉淀公司的法律工作者们带来了苦恼。
“我们APP上,娱乐新闻的内容被第三方网站未经授权转载,转载的同时,客户端底下的用户评论也一并被抓取了。这些评论被实时抓取,并且是一个不断扩充的过程。”搜狐法务经理马晓明曾经分享过一个数据被侵犯的典型例子。
然而在法律层面,数据权究竟是一种什么权利,其包括哪些方面的内涵,数据的权利主体到底是谁,被侵权后如何运用法律手段维护自己的权益(“自己”可以是数据提供者和控制者),保护力度究竟多大,这些问题在理论界和司法实务界都尚未有定论。今天和大家一起简单的讨论下这方面的几个问题。
学术大牛们的探(Si)讨(Bi)
目前关于数据权的性质,较权威的观点当属中央财经大学吴韬在去年召开的“数据产业与新治理论坛”上,对法学界四大主流“数据权利与权属”观点做的细致论述。总结来说,当前学界对于数据权属存在四种主流学说:新型人格权说、知识产权说、商业秘密说以及数据财产权说。
新型人格权说
“人格权”顾名思义,是关乎人的尊严、自由的一项与生俱来的权利,例如传统的姓名权、肖像权、名誉权、隐私权、婚姻自由权等权利内涵。
数据权之所以被认为是一项人格权,原因在于数据本身包含了个人信息,而个人信息的利用涉及到个人的尊严与自由,本身具有精神利益的属性。
但是“数据权”又不同于传统意义上的人格权。
首先,数据权是人格权的商品化。个人或是企业产生的数据,如果完全静止在数据机房中,也就失去了大数据时代的基石。
其次,数据的内容为个人信息,然而传统人格权中,保护个人信息的隐私权制度的重心在于防范个人隐私信息的披露。这与数据所强调的作为一种资源予以控制和利用情况有根本区别。
因此,多数民法学者倾向于将数据权与个人信息权相联系,作为一种新型人格权进行规制。
知识产权说
知识产权是关于人类在社会实践中,创造的智力劳动成果的专有权利。将数据权归为知识产权说的学者,较多关注的是数据的表现形式。
举个栗子,电话号码、个人位置信息这样的信息本身,在大部分情况下是一种个人信息,但并不是私有财产。然而,经过收集、整理、排序等,却可能构成一个著作权法下的数据库作品。若再将数据进行收集加工,并使之成为具有可复制、可加工、可转移的形式要件,就的确可能成为现行知识产权法律保护的客体,从而获得一定程度的排他权利。
商业秘密说
《反不正当竞争法》第十条规定:“本条所称的商业秘密,是指不为公众所知悉、能为权利人带来经济利益、具有实用性并经权利人采取保密措施的技术信息和经营信息。”商业秘密具有非公开性、非排他性以及包含经济价值的特征。
数据可以作为技术信息和经营信息的载体,具有经济价值,并且作为秘密得到保护,一旦被他人掌握即失去了原本的价值。
数据财产权说
与新型人格权相对应的,必然有新型财产权的说法。
该观点认为数据作为一种经济资源,构成企业资产的重要组成部分,是信息通讯技术发展的必然结果。数据本身具有财产权的特性,数据集不仅具有经济价值,而且可以被主体所控制。
数据的本质是一种电磁记录,可以存储于特定的介质之中,主体可以对其实现占有、使用和处分,也可以实现占有的转移。另一方面,如上文所说,数据常常受到数据提供者隐私权、著作权、或者商业秘密的制约,持有人或控制人对数据的处分权并不完整。这也是数据权,不同于传统财产权的地方。
再举个大栗子
以上关于数据权属的学说各有侧重,但似乎都并不能覆盖数据的全部形态。
而在司法实践中,据北京市海淀区人民法院中关村法庭庭长陈昶屹发布的《大数据与知识产权司法保护的现状及展望调研报告》介绍,在涉及大数据的相关典型案件中,不正当竞争纠纷案件占比达46.2%;著作权案件占比为23%;其余为隐私权、名誉权和技术服务合同纠纷。
典型可见由数据纠纷引发的“不正当竞争第一案”——新浪微博诉脉脉。
案件起因是“新浪微博”运营商微梦公司与“脉脉”运营商淘友公司签订了《开发者协议》,约定网络用户在使用脉脉时,可以使用其新浪微博账号进行登录。
“新浪微博”随后发现“脉脉”抓取用户,包括头像、昵称、性别、教育、职业等信息,并模仿“新浪微博”加V认证机制,遂终止合作。
其后,“新浪微博”向法院主张“脉脉”在与其合作期间以及合作终止后,不当使用新浪微博用户信息,导致用户信息泄露和商业竞争利益受损,构成不正当竞争行为。
经过两审终审,法院认定“脉脉”构成不正当竞争行为。
案件的争议点在于,《开发者协议》授权登录下,脉脉抓取用户包括头像、昵称、性别、教育、职业等信息是否具有正当性。
根据技术调查官的技术调查及行业惯例,抓取用户头像、昵称等行为属于实现二者合作需要抓取的“必要”信息,但是教育、职业等能够完整分析出用户的生活、学习、工作等基本状态和需求的信息,则已经超越了二者合作协议授权中“脉脉”可以抓取的信息范畴。因此,该行为构成不正当竞争行为。
立法者的眼里(都是沙子还是一片朦胧?)
比较有意思的是,我国法律对于以上讨论中涉及到的“个人信息”、“商业秘密”等概念本身的性质,在今年出台的《民法总则》中才得以明确。
2017年3月15日通过的《民法总则》第111条规定:“自然人的个人信息受法律保护。任何组织和个人需要获取他人个人信息的,应当依法取得并确保信息安全,不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息。”至此,才确立了个人信息权作为一项人格权的独立地位。
此外,第123条第五款,已明确将商业秘密纳入知识产权的保护范围。对于“商业秘密”本身性质的争论终于尘埃落定,也是我国民事实体法律对于商业秘密权的立法肯定。
在2016年7月5日公布的《民法总则》(一审稿草案)中,曾将“数据信息”结合起来作为一种“知识产权”加以保护,但立马引起了争议。反对的观点认为数据与知识产权有一定差别,前者是对事物属性的描述和记录,后者的核心是人的智慧成果。于是在后续的草案中,“数据”又从知识产权的分类中剥离出来。
最终,《民法总则》第127条规定:“法律对数据、网络虚拟财产的保护有规定的,依照其规定。” 立法将数据纳入民法总则的范畴,对“数据权”这一新事物做出了必要的回应,确立了其作为民事权利的地位。但在权利属性上,并未明确给出划定。
浅谈数据权
笔者认为,数据的权利体系可以是一种双向结合的体系。一方面是原始数据权利,偏向于人格权的规制。另一方面是合法的数据持有人或控制人,拥有的受人格权制约的数据财产权。
具体来说,作为自然人在生活中产生的个人数据,应注重数据人格权的保护。除上文讨论的隐私权外,还应关注个人对于数据使用的知情同意权、数据修改权以及数据被遗忘权(欧洲居民可以向搜索引擎申请在搜索结果中删除有关个人的“不恰当的、不相关的、过时多余”[inadequate, irrelevant, excessive]的网页链接,但在国内来说还需探讨)。
而一旦数据被商业化,进行市场流通交易,其财产权的特性即体现出来。包括了数据交易过程中的收集、占有、加工、处理、使用、转让等权利。
对于兴业数金来说,将更多的关注受人格权制约的数据财产权内容。作为商业数据的控制者,公司在数据的商业过程中投入了大量资金、技术和人力成本,实现了数据的价值变现,理应得到与其创造价值相匹配的回报,而此种回报多体现为财产权益。
当然,在商业数据使用、交易以及数据保护方面的法律规制以及相关判例,还需要进行更深入探讨。
本文作者:兴业数金风控与法规团队 周熠
文章参考:吴韬.法学界四大主流“数据权利与权属”观点;董潇、蔡克蒙、周梦瑶.《民法总则》中的隐私、个人信息和数据保护规定;瞿淼、孙欢欢.数据交易合同的法律问题等
小微信贷说|从传统到智能,下一步在何方?
下沉小微业务是国内诸多银行面对利率市场化挑战的必然选择,特别是区域性银行,纷纷将小微业务作为核心战略之一,在组织上和技术上进行了大量的投入。过去十年,小微信贷一直以超过大中型企业贷款的增速持续快速增长。
但是,近期经济环境正在发生变化,很多银行开始重新审视和调整业务发展模式,寻求适合自身的定位。大型银行开始逐步退出小微业务,而中小型银行在战略中依然把小微业务放在核心位置,小微业务正在分化。
从成熟市场的发展趋势来看,这种定位的分化是市场化的必然选择。小微金融市场开始进入一个从“量变”到“质变”的调整期。原来野蛮粗放、跑马圈地的经营理念已不再适合现在的经济发展形势。
小微信贷传统模式
在讨论小微信贷未来方向前,应先理清小微信贷的业务模式。根据最传统的分类,小微业务发展主要有两大主流模式:IPC信贷员模式以及信贷工厂模式,如下图所示:
在IPC信贷员模式下,营销人员下沉到业务前线,深入基层单点营销,信贷技术上关注客户品质和稳定性,通过交叉验证技术和现金流检验技术评估客户还款能力。
IPC业务模式有着开业扩张快、收益率高、适合处理软信息等优点,但也存在人均产能低、技术传导变形和易产生道德风险等缺点,特别是在开业3-4年之后存在着规模扩张乏力和风险暴露多的瓶颈。但实践证明,在短时间内,IPC能快速铺开小微业务,尤其适用于小微短期增体量、快发展的业务战略。
在包商银行IPC模式一举成功后,国开行针对该模式进行了改造,联合建行、中安信业小贷公司,以助贷形式开展小微贷业务。
在该模式下,小贷公司取代银行信贷员,进行客户探索、贷前考察、贷款审核决策、贷后管理、贷款催收;国开行负责贷款资金的提供;而建行负责结算代理。
可见,这种类IPC模式在本质上与IPC无差:作业能力强、业务经验老道的营销人员包揽大部分任务。
不难发现,上述模式特别适用于城农商行、村镇银行等区域型中小银行。然而随着自身体量的增长及小微业务规模的扩张,这种人力与时间成本过高的模式便显得心有余而力不足。
如果说IPC与类IPC助贷模式的核心特点是信贷员通过交叉验证、财务报表重构等技术对客户还款意愿及能力进行综合考察,那么另一种模式,信贷工厂模式的核心特点则是专人专岗、任务细分,强调流水作业。
此概念源自新加坡淡马锡集团。对信贷流程进行功能性切割,以类似工厂生产线的方式,将小微金融服务岗位做流水线式分工。对此,设置专人专职、分工明确的标准化操作。同时,通过业务的标准化、批量化和集约化运作来适应小微业务额度小、客户分散、业务量大的业务特点。
此外,借助评分卡模型,快速得出客户审批决策。但该模式的主要缺点是解决不了底层资产的真实性问题,前端信息要素流失较多,对单个用户风险识别力弱,模型评分效果受制于数据输入;而且模型运行一段时间后,产生的隐患在于其规律及策略可能逐步被市场所熟悉而导致风险。
互联网时代:冲击与变革
过去,商业银行通过探索并尝试小微信贷模式,有效推动了小微业务的扩张。虽说信贷业务下沉推动了小微业务的高速发展,但风险逐步在暴露。根据银监会2016年初数据显示,小微信贷不良率已达2.6%,远高于商业银行整体不良贷款率1.67%。
然而随着互联网浪潮下涌现的P2P、网络小贷机构等,以收益覆盖风险为立足点,在放款速率及便捷性上向商业银行提出了挑战。
由上可见,互联网信贷行业规模发展迅猛,并会在未来持续激增。在过去三年中,用户数由5千万户增至1.6亿户并与积极在2020年达到2.2亿户;而互联网信贷规模由1千亿增至1.2万亿,并预计在2020年实现5.7万亿的庞大体量。
随着客户行为逐步偏向互联网化、非银网络金融及机构日渐崛起,商业银行不得不以信贷智能化的视角去重新审视小微业务。
然而,那些尝试互联网信贷的商业银行逐渐意识到:智能信贷的核心是大数据风控,而数据质量是智能信贷大数据风控体系的前提,征信数据质量的好坏直接影响着智能信贷可行性。
相比领先国家而言,我国的征信行业在数据质量以及背后的体系上尚有较大的进步空间。一方面,我国征信体系发展历史尚浅,覆盖率仍不足。另一方面,我国经营主体较为单一,国有系机构占比较高,市场化机构较少,行业缺乏多元化竞争促进发展。
此外,主体征信机构八成以上是信贷类数据,缺乏非银数据,类型较为单一,征信需求方难以对被征信者进行有效的多维度验证。这也使得互联网金融在面对缺乏信贷记录的长尾客户群体时较为无力。因此商业银行针对大数据风控作业下的征信合作伙伴需严加筛选。
另一方面,互联网时代中原混战,对于此监管层的频频发力,其政策对小微贷业务的指导性不可忽视。例如,近期银监会限定联合贷款的合作机构必须为其监管设立持牌的银行金融机构;提高风险数据合作商准入门槛,加强机构设立与经营合规性的评估;严格把控风控技术供应者的信息系统能力水平、数据合法性、数据质量与真实性。
小微信贷创新模式
由上文可见,随着互联网技术的冲击、非银机构的威胁、监管政策的缩紧、客群行为的变动等种种因素,迫使商业银行寻求创新小微信贷模式。对此,一些领先的商业银行觉察到:拓宽获客渠道、优化数据质量、强化风控技术已成为小微信贷突围的重要工作。在营销推广环节应做到线上与线下整合,大数据与互联网技术结合,不断降低产业成本。
在征信环节中,应该通过引入互联网数据源,针对搜索、社交、出行、消费数据等开展大数据征信,使得对客户的分析更加科学准确,有效降低小微金融业务的信用成本。在风险监测、预警和防控措施上,可以依靠云计算和搜索引擎技术,对大数据进行高效分析,并以较低的运营成本去计算资金需求者的风险定价、违约概率等。
对于此,富有开创精神的商业银行在渠道、征信数据、风控技术等展开了多方探索并形成了业务创新。其中备受关注的一大突破口,便是“助贷机构+撮合平台”模式。
其最主要区别于传统小微贷模式之处在于商业银行对自身的定位重新审视,由“全程作业”向“专注做实资金端”进行了转变。在这种指导思维下,商业银行,特别是区域中小型银行,与其投入高成本自建业务渠道能力,不如索性将业务环节下沉、让不论是场景触点、人员能力亦或是资产设计均更为优秀的互联网金融企业来完成。
同理,对于保留着传统信审风控作业能力的商业银行而言,在基于互联网的大数据分析、反欺诈措施、数据征信等流程环节上,具备更专业能力的金融科技公司显然就成为了合作首选。而这些能够提供线上风控技术的金融科技公司,也就顺理成章成为了解决资产荒资金荒问题、连接两端的撮合式平台。
如此,三方定位清晰、各尽所能,通过资源交换、分润计价等合作机制,共同服务小微金融。
智能信贷金融科技企业案例
商业银行加强智能化小微模式建设的需求,带动金融科技企业对智能信贷领域的高度关注。鉴于此,领先金融科技企业已围绕小微信贷流程,积极尝试变革。不论是探索创新合作模式,还是突破征信难问题、融合其他科技概念等,他们以自己独有的方式与资源优势在智能信贷领域中各下苦功、暗中发力。
平安金科作为业内领先的综合型金服企业,在小微信贷业务上采取了上文所述的“打通资产资金两端的撮合平台”模式。
不同于常见的三方合作方式,平安金科做了进一步改造,融合了集团化经营策略,在资产端选取旗下的小贷公司如平安好贷、平安钱进等作为客户触点与场景渠道。
与此同时,集团作为业务的背后靠山,一方面向小贷公司提供小微贷款资金,另一方面向金科提供用于收购不良资产的兜底资金。这种发挥集团资源优势、探索内部协同潜力的模式非常值得其他金控平台,尤其是金融系金科公司去学习借鉴、去尝试摸索。
牛鼎丰是近年来初显头角的集团系金科公司中深耕信用评估环节的专家。作为小牛资本旗下的金融科技企业,于16年成立的牛鼎丰在战略聚焦上秉承集团策略,专注于小微市场方案、致力于大数据风控应用。
牛鼎丰信用评估平台产品具有高效、灵活、实时的特点。对此,牛鼎丰在产品设计上重点关注了几点:通过搜索引擎管理的不断完善及网络爬虫技术的深化运用来大幅提高企业信息的抓取精准度;通过Hadoop集群进行数据储存计算以构建挖掘平台;通过机器学习等技术改善评估模型并形成计算模块以供实时评分与定期追踪。
值得一提的是,针对前文提及的征信数据质量问题,牛鼎丰的解决方案是双轨并行:一方面,利用自身累积的数据库,整合线下、线上的结构和非结构数据,深化行为数据。另一方面,向第三方大数据“借力”,积极对接征信企业的征信数据及评测。
这套闭环风控体系实现了80%的自动化,贯穿准入、反欺诈、评级、授信、定价再到放款过程,审批时间压缩至短短两天,比起传统风控,无论是风控因子、风控规则、风控模型,都具备显著优势。从横向看,它有效细分用户群体和产品定价,扩展多套针对性模型,提升了效率,有效降低处理成本,丰富了金融产品和服务;而纵向则以机器学习快速迭代优化风控模型,及时应对欺诈和违约行为的变化。
狐狸金服是搜狐旗下的金融科技企业,始于14年成立的网络借贷服务平台“搜易贷”。在大数据风控环节日渐发力的狐狸金服自主开发了智能风控系统“风刃”。
此外值得一提的是,狐狸金服将AI概念融入大数据风控之中,实现了动态规划风控流程,即通过人工智能来干预和适配流程的各个环节,提高效率,减少成本。
这改变了之前各业务线预配置单一业务流程的模式,在人工智能的支持下,“风刃”能够做到针对不同的用户,根据不同的信用等级、不同的社交网络、不同的行为数据等实时监控、实时反馈,最终确立各不相同的个性化工作流程,保证最低的风控成本,并根据实际情况进行精准定价。
“融合人工智能和机器学习于智能信贷”,这种将看似独立的金融科技主题进行有机结合的创新思路值得其他金融科技借鉴参考。
小微信贷变迁:下一步在何方
在经济下行、客户互联网化、非银机构小微贷发展等多重冲击下,商业银行小微信贷模式必须进行改造升级。利用资金利率的日益市场化,将风险定价能力作为小微作业核心竞争力仍是小微业务的基本准则。而在保留传统风控技术能力的同时,积极构建智能信贷能力,则是互联网时代下突破发展瓶颈、直面混业竞争的重要策略。
而以区域型中小银行为例的商业银行,由于技术资源匮乏、科创基因有限等原因,难以独立自主发展智能信贷风控技术或构建互联网小微贷作业能力。这恰恰为金融科技企业带来了庞大的市场机会。如何在技术研发、产品优化等领域进行创新融合将成为这些金科企业智能信贷业务的基础。而业务销售能力、合作机构与渠道的建设,则会是成功的关键。
兴业数金区块链云服务即将开启免费试用!!
9月1日,以“架构人机同行”为主题的IBM Systems创行者高峰论坛在北京召开。兴业数金作为IBM重要合作伙伴出席论坛和发表主题演讲,并在会上公布兴业数金区块链云服务即将开启免费试用的重大消息。
此次论坛主要探讨,面向人工智能、区块链、云计算、开源数据库等领域,科技企业从诞生期技术试水,到商业应用期价值变现的战略规划和方向。
契合主题内容,兴业数金监事长杨忠先生、兴业数金云计算事业部总经理郑子洲先生和云计算事业部总监周旭强先生,分别从兴业数金在云计算领域的解决方案、数金云产品中的人工智能、区块链应用这三方面发表精彩演讲。
当下,商业世界的数字化转型步入深水区,新经济模式带来的可信、安全、增长等挑战,呼唤新技术方案的补位。技术世界中,人工智能、区块链、云计算等风口技术步入深度应用期,从“硬件产品”提供者向“架构解决方案”交付者的业务深化发展,考验企业IT架构的“变革”与“构建”两大能力。
兴业数金监事长杨忠先生在高峰对话环节,对兴业数金在云计算领域的行业云解决方案做了系统的说明。
图左一为:IBM大中华区副总裁 郑军 图右一为:兴业数金监事长杨忠
“兴业数金将云计算业务发展聚焦在金融行业云上,并推出‘数金云’品牌。
在基础架构层,数金云通过融合性的技术架构,满足多种金融应用场景下的技术实现要求。
在平台层,除了业界熟知的数据库、大数据、消息队列等技术平台以外,我们还重点打造一些前沿技术和理念的创新平台服务,比如区块链平台服务、人工智能平台服务、金融组件平台服务。基于这些创新平台,我们当前已经实现了电子合同、数字票据、智能投顾等创新业务应用的投产。
在应用层,当前主要提供银行应用SaaS服务,目前,金融云签约客户数超过300家。未来,我们要通过创新构建共赢生态,兴业数金要连接金融机构,将金融机构特有的服务通过组件化的方式加以抽象、整理,形成兴业数金的‘金融+’连接层,在此基础上,集成、融合其它金融科技公司的力量,为金融行业的客户提供基于生产、生活场景的金融服务,金融科技公司、兴业数金和金融机构一起构成紧密共赢的生态圈。”
兴业数金监事长 杨忠
作为兴业数金的合作行之一,九江银行CIO肖璟先生从用户角度发表了自己的看法。
九江银行CIO 肖璟
“开业初期,和很多中小型区域性银行一样,九江银行无论是在软硬件上还是人力资源上,行内整体IT水平都已无法满足全行高速业务发展的实际需要。九江银行和兴业从2008年正式启动合作,到2009年3月,基于兴业的整体IT系统上线,整个实施和迁移工程仅用时不到一年。此次合作为我行带来的价值是立竿见影的。当时核心系统的开发运维全托管给兴业,很大程度上缓解了我行开发人力不足,基础运维薄弱的问题。在一些共性问题处理上,如监管项目、创新业务等,兴业也给予我行很大的支持。 ”
长期以来,兴业数金不仅为客户提供基础的技术架构,在平台层和产品应用层面也具有优势竞争力。
在下午的媒体采访环节中,兴业数金监事长杨忠先生进一步对“数金云”在应用层布局展开详细介绍。“关于SaaS到PaaS的服务,目标是我们的创新能够融合进产业生态、消费生态、医疗生态、物流生态以及智慧城市的生态中。因为我们所有金融服务都是为了这些生态而存在的,如果我们这个生态能做得好,合作商就会一个个加进来,我们就会提供非常好的服务,这种潜力就是无限的。”
采访现场
IBM大中华区硬件系统部杰出工程师 李永辉
“在这种场景下,兴业数金如果能够帮助不管是本地银行还是海外分支公司,他们的经验是没办法可以取代的。随着技术发展,IBM除了云以外,像区块链、人工智能、认知技术,这些技术的门槛比一般的会再提高。假如今天Fintech定位就是做Fintech的话,兴业数金已经积累了很多服务,认知服务、区块链的服务,将来在这个行业的竞争层面上就会跟人家不一样。”
分论坛现场,兴业数金云计算事业部总经理郑子洲先生和云计算事业部总监周旭强先生,则分别进一步对数金云产品中的人工智能和区块链应用做了深入的介绍。
兴业数金云计算事业部总经理 郑子洲
在人工智能应用方面,兴业数金做了很多创新。具体的产品方面,包括已经推出的智能投顾产品,已涵盖基金和股票,能为所有用户提供智能化配置、满足个性化需求。
郑子洲表示,“以兴业数金人工智能算法为代表的金融科技产品触及了金融风险定价、投资决策等核心职能,创造出新的产品及业务模式。”
兴业数金会场展台:左边为人工智能算法投顾产品,右边为区块链产品
除了在智能算法领域的研究,兴业数金早有布局对人脸障碍识别的探索。
“通过智能影像识别系统可以实时检测出各种类型的遮挡并进行预警,并支持多种目标同时检测。透过分析从150+面部遮挡的录像中抽取1500+张照片,使用16层RCNN神经元网络,在一台Power平台上经过一天深度学习培训,便能识别出97%的准确率。”
同时,兴业数金在人工智能GPU的平台正在部署。平台上线后将对金融机构开放,届时欢迎大家来进行实验一下。
在区块链分论坛,周旭强先生则对区块链云服务的产品层面和场景应用进行全面介绍。
兴业数金云计算事业部总监 周旭强
“从产品层面来看,兴业数金的区块链云服务具以下主要优势:
1、提供高性能、高安全性的区块链服务平台,用户只需低成本投入就可以获得专业的区块链服务实例,大大降低使用区块链进行业务创新的技术门槛;
2、LinuxOne服务器平台和X86服务器平台混合组网部署能力,可给客户提供两种规格的服务级别;
3、丰富的区块链应用投产及运营经验,可辅导客户进行应用场景的构建和实现;
4、在提供区块链技术服务同时,协同兴业银行提供金融服务,形成技术与金融业务结合的综合解决方案,可适用于供应链金融、数字票据、积分联盟等典型应用场景。
从应用层面来看,基于数金云区块链服务,兴业数金已经再电子合同服务平台、银行业欺诈和危险信息共享平台等领域有了应用案例。电子合同服务平台通过引入公证处、司法鉴定中心等联盟链节点,可有效提高电子合同存证的的公信力。
正在实施中的银行业欺诈和危险信息共享平台,则创造性地采用双层区块链技术及量子加密通讯技术,实现威胁情报原始信息在多家银行间的分布式共享、脱敏信息在银行与外部相关机构之间的分布式共享。”
兴业数金小伙伴在展台区为与会人员进行亲切交流
现场,周旭强先生还宣布了一个好消息——兴业数金区块链云服务即将开启免费试用!!
具体开启日期,小编将第一时间通知大家。届时,只需要留下联系方式和企业邮箱,就可以获得免费使用的权限,千万别错过。
数金云落地创新实践及优势
9月1日,以“架构人机同行”为主题的IBMSystems创行者高峰论坛在北京召开,兴业数金作为IBM重要合作伙伴出席论坛和发表主题演讲。此次论坛主要探讨,面向人工智能、区块链、云计算、开源数据库等领域,科技企业从诞生期技术试水,到商业应用期价值变现的战略规划和方向。
兴业数金云计算事业部总经理 郑子洲
以下为兴业数金云计算事业部总经理郑子洲先生,在分论坛现场发表的主题演讲内容节选。
兴业银行在金融行业云已经耕耘了十几年。2015年,兴业银行将这块业务剥离出来成立专门的子公司兴业数金,在专业的基础上把金融行业云做得更大更强。2017年3月,我们重新梳理构建了金融行业云服务品牌,推出真正专业的金融行业云--数金云,为中小金融机构提供一站式、全方位云服务。
金融行业,特别是银行业对于云计算的诉求,除了敏捷有弹性这个最基本的特性以外,还有两点,一个就是要安全稳定,这个是我们金融行业应用云平台最主要基本的诉求;第二个就是,云并不代表只有X86,我们所需要的是融合架构的云。
作为国内的金融行业云服务商,兴业数金打造的金融行业云服务品牌——数金云除了满足上述三大诉求之外,还具有三大独特优势。
首先,数金云具有集团综合优势。数金云为合作伙伴提供的不止是系统托管,技术层面的服务,还包括综合金融的一些业务连接。因为兴业数金是背靠兴业银行集团,除了全牌照,还具备运营机制。
另一方面,就是监管合规的优势。兴业数金的工作一直以来都是在银监会的监管和指导下开展的,包括这方面的管理规范,兴业银行也有参与制定。
最后,银行的需求不止于X86服务器,还需要处理传统业务和数据的Power架构服务器,而这些东西是兴业数金所具备的先天优势。
结合数金云产品的优势,我们可以看到银行业或者说金融业对于云平台的需求。对于金融行业云平台而言,运营机制、监管和技术都缺一不可。
今天,主要从技术角度来讲数金云的服务。数金云提供从IaaS到PaaS到SaaS到BaaS不同层次的服务。
IaaS可以提供全融合架构,不止有x86、Power资源;在存储方面,有软件定义存储,有分布式存储,也有集中式存储;在网络方面,既有传统网络、又有SDN。可以很好的满足金融行业复杂的业务场景需求。
PaaS层,除了典型的技术组件、中间件、数据库等这些应用以外,还将很多金融行业业务中常见的公共组件抽出来,进行封装形成服务化,对外提供组件服务。
SaaS层,不同的用户群体对于整个系统的需求有很大差异,兴业数金面向民营银行、村镇银行、城商行通过三大系列分别提供不同的解决方案。
在创新服务方面,以人工智能云服务为例,兴业数金采用Power+GPU的集群,构建了人工智能平台,用户可以便捷的使用这些功能。
在人工智能应用方面,兴业数金做了很多创新。具体的产品方面,包括已经推出的智能投顾产品,已涵盖基金和股票,能为所有用户提供智能化配置、满足个性化需求。以兴业数金人工智能算法为代表的金融科技产品触及了金融风险定价、投资决策等核心职能,创造出新的产品及业务模式。
除了在智能算法领域的研究,兴业数金早有布局对人脸障碍识别的探索。
通过智能影像识别系统可以实时检测出各种类型的遮挡并进行预警,并支持多种目标同时检测。透过分析从150+面部遮挡的录像中抽取1500+张照片,使用16层RCNN神经元网络,在一台Power平台上经过一天深度学习培训,便能识别出97%的准确率。
除了这些应用以外,兴业数金不遗余力推动人工智能人才的培养。在今年6月份,数金、IBM和CSDN共同组织了人工智能编程线下马拉松大赛。
未来,兴业数金希望,我们新的平台能够有一个新的视野,为我们的金融行业用户提供一个更强壮、更安全、更专业的金融行业云。
关于金融科技的9个小故事
都在说金融科技改变生活
听起来伟光正
但生活很接地气
整那些虚的没用
今天
小编就带大家已经走进一些场景
感受下金融科技对日常生活的影响
关于移动支付
▽
不好意思,放错图,下面才是。
▽
关于云计算
▽
关于区块链
▽
关于人工智能
▽
还有
▽
哈哈哈哈
根本停不下来
▽
▽
高潮在这里
▽
程序猿讲故事|建模就像做衣服
谁说程序猿注孤生,数金的程序猿就体贴温柔(偶尔)会讲人话啊。
今天的这篇文章奏是程序猿开脑洞并配合脑图,给小白们讲解了领域建模方法在通用金融超市中的应用,超级通俗易懂滴。
近年来,移动互联和互联网金融快速发展,用户使用金融服务的习惯正在被快速改变,以往需要去营业厅排队办理的业务,如今大多已可以在互联网或移动终端上完成。
传统金融机构逐步将业务从“线下”搬到“线上”,以提升业务办理效率,降低经营成本。一方面,金融机构推出直销银行应用,在将传统储蓄、理财业务转移到线上的同时,嫁接非现场开户产品,拓宽产品来源,如股票基金、保险、黄金投资等。另一方面,部分银行通过打造金融生态平台,将生活场景与金融服务进行融合。
移动互联和互联网金融的迅速发展使得传统渠道不再那么重要,中小银行有了与大中银行同一起跑线竞争的机会。
为服务合作银行在线销售金融产品的需求,兴业数金建设通用金融超市系统,提供从系统建设到产品输出的完整解决方案,作为合作行与金融产品提供商之间的连接器。在这套生态体系中,金融产品提供商是超市的货源,合作行是超市的名字,而建造超市、装配商品,就是数金的工作。
但是随着合作的范围越来越大,大到商品类型,小到结账方式,各个金融机构对超市的要求也各不相同。那么问题出现了,是否由于客户各不相同的需求,就必须为每个客户从头开始实现一个系统呢?
若每新增一个客户,就需要开发一套系统,在实施效率和质量上,显然无法满足客户期待的互联网节奏。为此,数金引入软件工程学术界的前沿理论——软件产品线工程模式,解决客户个性化定制与软件交付效率之间的矛盾。本文主要介绍软件产品线工程理论中,基于领域特征模型的需求分析方法在通用金融超市中的应用。
戏说软件产品线工程
假设你是个裁缝,专门帮人做衣服。开始的时候几天只有一两个顾客上门,你很珍惜,为他们精心设计,制作最适合他们的衣服。然而随着你名声鹊起,逐渐变成一天有几个、几十个、最后几百个顾客光顾你的裁缝铺。你起早贪黑夜以继日都无法完成任务。这该如何是好?你一拍脑袋想出一个好主意:批量生产。按着批量生产的套路,只要设计好一件衣服,每天出个几百件也是分分钟的事情。
然而,顾客并不买账呀。大家穿着新衣服上街,结果发现一天撞衫了几十次,于是来找你理论了。“你这裁缝怎么回事啊,我们一胖一瘦一黄一黑,怎么穿的衣服一模一样。”这该如何是好,难道又要回到夜以继日赶工的生活?
并不需要,衣服的模式千变万化不离其中,即便高端如Vera Wang定制婚纱,也是遵循婚纱设计原则,但在各细节处进行创意设计。因此,只需要对批量生产出来的衣服可变处做个性化修改,比如给衣服换个颜色,或者裁剪一下,再交给顾客就皆大欢喜了。
数金的软件产品线就是这样的存在。人家生产的是衣服,数金生产的是软件。
严肃的介绍软件产品线工程
面对日益复杂的软件系统,软件复用被认为是解决“软件危机”、提高软件开发效率和质量、实现软件产业工业化生产方式的重要途径。
多年来软件复用的研究和实践表明,面向特定领域的软件复用活动相对容易取得成功。这里的领域不是大众印象中的金融领域、教育领域等行业领域,而是指一组具有相似和相近软件需求的应用系统,这些应用系统实现相同的主要功能,有着大致相同的体系架构,但又有合理的个性化诉求,以满足不同组织差异化的经营模式。
特定领域的软件复用相对容易获得成功,被认为能取得成功的原因如下:
领域的内聚性:领域知识逻辑上具有紧密相关性;
领域的稳定性:在一定时间内,领域知识不会发生剧烈的变化;
与传统面向单应用的软件工程方法不同,软件产品线方法关注于核心资产的开发,以及将这些核心资产适配到不同的应用系统中。
这里的核心资产不仅仅是软件代码或构件,还包括需求、体系结构、测试用例等。为了满足不同受众对应的应用系统的个性化需求,产品线理论中引入可变性模型的概念,这种共性/可变性的分析思维模式,贯穿整个软件开发的生命周期。
为了更好地区分核心资产开发与应用,软件产品线工程将整个研发过程分为2个过程:
领域工程(Domain engineering):这个过程负责建立一个可复用的平台,定义产品线的共性与可变性,创造可复用的核心资产(领域需求、参考体系结构、构件、测试用例)。领域工程的成功,很大程度上取决于积累的领域知识。透彻了解市场和客户的领域专家,可以有效预见和识别领域共性及可变性。
应用工程(Application engineering):新系统的开发不再是从零开始,而是建立在对分析、设计、实现等阶段的软件资产大量复用的基础上,根据具体应用需求(确定可变点),复用这些资产创建应用系统。
在实际运作的过程中,这两个过程经常互相交互,彼此促进。应用工程中,经常会根据不同客户实际情况,丰富领域知识,对共性/可变性模型进行演化,增强领域模型。而领域模型的不断迭代,会促进下一个项目的应用开发效率与质量。
好的,可以开始讲人话了。
比如现在要为几家客户开发金融超市应用,先从领域工程做起。
首先,拿到业务需求以后,先不急着开始做,而是让来自各个团队的大佬坐在一起,根据他们丰富的经验和预见未来的能力,讨论一下这个应用大概长成什么样子,有什么功能,需要接入什么技术等。按照讨论结果建立一个特征模型,然后走一遍开发流程,得到一个兼容各种情况的超级产品,这个超级产品包括了金融超市应用必需的各种模块,且需求文档、架构、测试资产一应俱全。
注意此时,大佬们除了要总结出这一系列金融超市的共性之外,还要标记哪些地方可能会出现不同,这样才方便后续对这一系列产品的修改和裁剪。
完成了第一步后,接着来到第二步:应用工程。
这时候只需要按照顾客的要求给超级系统做需求的裁剪,像搭积木一般装配出来客户需要的应用系统。同时在定制过程中也要给第一步提供反馈:“明明大家都是瘦子你为什么要设计成胖子的款式”,“金链子太老土了现在都流行用电线作佩饰了”……及时修正超级系统,使改动幅度尽可能的小,等软件已经按照要求修改完毕后,就可以把产品交给客户了。
需要指出的是,此时的产品和真正的产品线上的产品还有一些不同:它们都是连体婴儿。它们都分享着在第一步中设计出的“超级”系统,而不是一个个完全独立的产品。
产品线模式下的需求分析
传统的需求分析方法一般有五个步骤:需求获取、需求分析、规格说明、需求验证、需求管理。业务分析人员,通过有目的和计划的交流以明确用户想要达到的效果,在此基础上用UML等工具进行需求建模,然后用规范无异议的语言进行描述说明,同时考虑预算、可移植性、可维护性等方面的非功能性需求。
产品线工程中的需求分析,并不是对传统软件需求分析方法的颠覆,而是站在领域共性/可变性分析的高度,系统化地思考问题域。
它和传统需求分析方法比,有如下不同:
需求分析过程中,需要识别哪些是对于所有应用共性的特征,哪些是针对特定应用需要调整的;
为了适应对领域需求的复用要求,领域模型不仅要记录领域内的系统具有的共性功能和质量属性,还要记录这些属性可能具有的变化性。所有需求中可能的选择,都显式地通过可变性模型(variability model)建模;
除了基于客户的反馈,领域需求分析还要考虑到未来需求可能的变化,例如因法律、标准、市场需求等引起的未来变化;
领域需求,指导领域设计阶段和实现阶段可复用软件资产的生产;
传统的需求分析,一般使用数据流图(DFD)、UML来表示需求。
数据流图从数据传递和加工的角度,以图形的方式刻画数据流从输入到输出的移动变换过程。
UML中,用例图(Use Case Model)从用户角度描述系统功能,并指代各功能的操作者。活动图描述了业务实现用例的工作流程。状态图描述状态到状态控制流,常用于动态特性建模。类图也经常用于需求分析,描述系统潜在的实体,以及实体之间的关系。
传统需求模型的薄弱点在于对于共性/可变性的描述能力不足。因此多年前学术界围绕着领域分析作了各种尝试,比较著名的有FODA(Feature-oriented Domain Analysis),旨在建立特征模型以直观描述系统共性和特性,包括实现功能,接口技术,专业技术等等;ODM(Organization Domain Modeling),着眼于对整个领域工程而非某个特定的系统建模;以及我们将要讨论的FORM(Feature-oriented Reuse Method),在FODA的基础上加上了对非功能需求的分析和对组件具体使用的指导。
面向特征的领域建模方法(FORM)
领域工程中,经常把特征(feature)作为系统需求规约的组织方式。特征是从用户角度对系统的感知,用特征对系统需求规约进行模块化组织是一种非常自然的手段。以特征模型为中心,由多种相关模型(用例模型、数据流模型)共同构成领域模型的方法,逐渐成为各种方法共同采用的手段。
通常,一个特征模型描述一个相对独立的需求实体。特征模型在关注单个特征的同时,也注重挖掘特征之间存在的关系。特征模型的基本组织结构提供了一种把各个独立的特征组织在一起的方式,从而描述出领域中的共性与可变性。
下图是一个典型的特征模型,描述在金融超市中绑定银行卡的需求。在应用系统A中,绑定他行卡必须首先上传用户身份证进行OCR识别及证件照片比对,然后完成鉴权后才能开通电子账户,并且只允许同时绑定一张他行卡关联到电子账户。而在应用系统B中,只需要通过鉴权即可开通电子账户,并且允许同时绑定多张他行卡到一个电子账户中。
特征模型提供了多种表示领域变化性的机制:必选特征Mandatory Feature、可选特征Optional feature、可选(多选一/多选多)特征Alternative feature。
可以看到特征模型的层次之间存在2种类型的关系:
1)整体特征对部分特征的控制和协调作用,例如:他行卡绑定特征与其子特征(OCR识别、证件图片比对、鉴权、开通电子账户)就反映了整体特征对部分特征的控制和协调作用。用矩形表示。
2)整体特征和部分特征逻辑上的紧密结合性,例如:他行卡绑定特征与子特征(允许绑定数量特征)则反映了整体特征和部分特征逻辑上的紧密结合性,即允许绑定数量是他行卡绑定执行过程中体现出来的行为特点,允许绑定数量不能脱离他行卡绑定而单独发生作用。用圆角矩形表示。
除了本功能内整体特征与部分特征之间的关系,不同功能间特征的相互依赖也不容忽视。为了满足本功能的某特征,很有可能会影响到另一功能的实现方法。比如在系统B中,同一个电子账户绑了N张卡,则为了防止几张卡间资金流通,系统B就不能像A一样直接实现账户充值,B的充值特征模型必然与A不同。
在应用工程阶段,通过对领域特征模型的剪裁和扩展,可以得到单个应用系统的需求规约。
对特征模型的剪裁存在两种不同的活动:
(1) 绑定一部分变化性特征(针对Alternative feature)
(2) 删除一部分变化性特征(针对Optional feature)
针对上面的例子,对系统A,裁剪后的特征模型如下:
对系统B,则有特征模型如下:
总结
虽然相对于传统的软件工程流程,软件产品线工程模式在初期的投入可能更高。但是磨刀不误砍柴工,鉴于这一系列产品有很大一部分用的是同一套系统,这种产品线的模式有很多好处。
首先它提高了开发效率,开发团队得以用更短的时间满足客户的需求;其次它降低了维护难度,维护团队不再需要对所有系统一一改进完善;第三它减小了出错概率,因为同一套系统需要经受比一般系统多几倍的测试,错误能够更及时地被发现、纠正。
作者:兴业数金公司研究开发总部 杨益明 吴思旖 殷静雯