随着5G移动通信、工业物联网、智慧城市等领域的发展,大数据及人工智能逐渐普及并形成产业规模。信息的逐渐公开透明化,在带来便利的同时,也埋下了数据安全隐患。数据既要开放流通,又要合规安全,对全行业都是一种挑战。
在日常生活中,我们经常会遇到数据流通“裸奔”的现象:当你在一家银行申请了信用卡,之后很快会收到许多别家银行的办卡邀请;当你在网上查询租房信息后,马上会有各种中介电话接踵而来......你的号码信息不知不觉中从一家流通到多家,这就是一个典型的数据泄露场景。
上海富数科技公司(以下简称“富数科技”)正是一个对抗数据泄露的科技公司。
在数据即生产力的时代背景下,安全计算作为一个比较新的领域,发展出了开源这种技术生态模式。不过,在富数科技创始人兼CEO张伟奇看来,当前阶段,解决运营商、银行这样高合规要求客户的需求,本地化与非开源可能是更好的模式。
对于当前的大数据安全行业,张伟奇在接受界面新闻记者专访时表示,“上个十年,数据安全是1.0时代,重点是数据防御的安全,未来十年将进入数据安全2.0时代,重点是数据开放的安全。”
布局安全多方计算
2020年对于发展数字经济来说,是重要的一年。国家发改委明确表示,今年将出台推动新型基础设施建设的相关政策文件,推进5G、物联网、车联网、工业互联网、人工智能、一体化大数据中心等新型基础设施投资。
大数据时代,企业与企业之间的数据协作变得更加透明与频繁,但是数据流通的过程却存在着安全隐患。据张伟奇介绍,数据孤岛和数据泄漏问题一直困扰着企业,导致很多业务无法开展——数据安全合规使用的界限在哪里?除了合同与法律约束之下的条例,更多的边界在哪里?这些对于数据业务使用者来说难以断定。
很长一段时间内,上述情况直接或间接导致了过去几年的数据不合规使用问题层出不穷。富数科技提倡的“算法定义边界”,试图予以解决——通过加密和人工智能算法,给数据一种可以自证清白的、合法合规合理的使用开放方式,这种方式即为安全多方计算。简而言之,它实现了数据本身不进行流动,流动的是数据背后的价值和知识。
一款名为“阿凡达(Avatar)”的安全多方计算产品在富数科技的实验室中被研发出来。Avatar作为一个私有化安全计算平台,已经获得了数十家大型合作伙伴的订单。
据官网介绍,富数安全多方计算解决方案已经完成了在银行、消费金融、汽车、医疗、政务等多个领域的落地应用,比如泛金融行业的精准营销和智能风控、联合资产定价;车联网领域的精准营销和智能驾驶本地化联邦建模;公共政务数据安全开放赋能中小微企业放贷;医疗领域和产业互联领域的行业指数联邦建模和安全统计等。
以银行为例,传统的数据使用方式有两个弊端:第一,银行去查第三方数据导致数据被恶意缓存利用,或者是双方联合建模样本需要出库,这样导致了一些第三方公司可能泄漏客户资料;其二,银行只能点对点单一维度与数据源建模合作。随着某银行池子事件等影响,银行对自身数据的管控升级,任何需要数据出库的动作变得异常谨慎。
张伟奇称,富数科技的Avatar安全多方计算技术则保护了银行的用户数据不出私域,物理上做到“绝对安全”,又能联合多家数据源进行多方联合建模,提升效果。
“对于政府机关、工业大数据、金融机构等涉及国计民生的领域,数据的安全与可控是重中之重”,张伟奇表示,“自主产权和硬核的技术实力是这些机关企业的衡量标准,此外,在确保数据不出库的情况下(联邦学习),结合各方数据无需暴露或集中地进行分布式加密隐私计算(多方安全计算),不论对企业、还是机关单位来说,都是双重保障。”
“本地化、非开源、自主自研”的决策
有别于国内其他几家安全计算科技公司,富数科技的安全计算产品Avatar标签颇为鲜明——本地化、非开源、自主自研。
Avatar作为富数科技的本地化部署安全计算产品,服务于运营商、银行等客户,从产品部署、建模培训到售后支持,形成自有的闭环。Avatar拥有核心四大功能模块,包括多方安全计算、联邦学习、匿踪查询、联盟区块链等。
“与客户的合作过程中,我们听到更多的声音是期望富数可以作为一家纯粹的安全技术供应商,赋能于数据业务”,张伟奇说,“实际上,富数科技的本地化部署方案,让富数完全不碰数据,富数也没有和银行竞争的金融业务,对于银行和数据源来说,做到了真正的中立。”。
据界面新闻记者了解,国内主流所谓的安全计算平台,有一大部分是基于TensorFlow等厂商内核来做集成。这种核心能力依赖于现成的东西,最大的优势是快速搭建出一个安全计算平台,但问题在于知识产权核心能力不在于自身,特别是TensorFlow这种非国有化的核心能力。
由于安全计算系统处于数据内外流通的关键位置,容易受到外部攻击,技术核心若不掌握在国人自己手中,做出来的产品安全则有待商榷——鉴于此,张伟奇在公司成立之初则决定坚持自主自研。
目前,富数科技公司有超过80%的员工是技术出身,这批安全领域的多名博士后、博士、硕士研究生,在数年的研发和实践中,将富数科技推上了中国通信标准化协会会员、中国信通院大数据安全及流通标准组成员的位置。在此之外,富数深度参与了安全多方计算标准和联邦学习标准的编制修订,并拥有数十项发明专利和资质认证。
张伟奇坦言,作为一项技术,必然会面临开源与非开源的选择,从大数据到人工智能,诸多的技术都以开源的方式来促进技术生态的共建与完善。对于安全计算技术中的联邦学习技术,也有微众银行等巨头选择了开源的路线。开源模式对于推动市场教育和技术发展都带来积极的作用。
不过,张伟奇认为,安全系统应该对监管机构和审计机构开放源代码,而对普罗大众非开源模式才更加符合安全计算的业务本质。现在有很多刚成立的公司,出于时间成本等多方考虑,多会直接采用开源框架包装后推向市场,但这也就意味着安全的实现方式、代码、接口、参数等处在一个曝光的环境下,其存在的风险点不容小觑。
基于此,富数走向了“本地化、非开源、自主自研”的小众道路。联邦学习非开源模式配合多方安全计算,被富数称为“组合拳”,目标是成为国内数据安全领域开辟自研新动力。
数据的价值和潜力
数据即是生产力。
专访中,张伟奇透露,“数据孤岛是当前行业最大的困境,如何从‘存在不可用’到‘可用不可见’,这个过程必须依赖于技术完整变革。”
不可否认,数据行业存在过多的暴利使用,抛开法律因素,就单单数据本身来说,多次的拷贝会迅速降低数据的价值,这是一种不健康的资源利用方式。
“作为生产要素之一,数据源的价值应该得到保护,每一次的使用都应该让数据源得到应有的收益”,张伟奇表示,“对数据行业的监管与规范,更大程度上会让数据行业规模放大,因为只有合规,数据价值才会健康成长。”
根据官方介绍,富数科技依托安全计算技术,已经服务于多行业,从行业到场景、从数据到业务、从算法到算力,已走在数据行业安全生态的构建之路上。
对于行业的发展和竞争,张伟奇表示,“安全计算行业目前来说算是萌芽期,各家科技公司取长补短,因为整个数据流通市场巨大,互相还构成不了真正的竞争对手。”他认为更好的一个词是“竞赛”,各家在比拼算法、工程等技术能力,目标其实是一致的,都是为国家的数据安全大计添砖加瓦,“这也是我们做公司的使命之一。”
他感言,要从行业出发、由业务落地,坚持自研技术,为新基建中的数据安全开放流通提供好底层的技术服务,数据安全解决方案的供应商才能真正为老百姓的用户隐私保驾护航。