阿里云:全域数据观(2023年)
封面页 (此页面将由下图全覆盖,此为编辑稿中的示意,将在终稿 PDF 版中做更新) 作者简介 作者:刘伟光 阿里巴巴集团副总裁、阿里云智能新金融&互联网事业部总经理,毕业于清华大学 电子工程系。 加入阿里云之前,在蚂蚁金服负责金融科技的商业推广和生态建设工作以及蚂蚁区 块链的商业拓展工作; 在企业软件市场深耕多年, 曾经创建 Pivotal 软件大中华区分 公司,开创了企业级大数据以及企业级云计算 PaaS 平台的市场先河。 在创建 Pivotal 中国软件公司之前,刘伟光曾经担任 EMC 大中国区数据计算事业部 总经理,并在甲骨文中国公司工作多年,曾经创建了 Exadata 大中国区的产品事业 部并担任事业部总监。 专家力荐 过去几年,阿里云、瓴羊等平台和企业,致力于将阿里十数年沉淀的数字化经验, 帮助企业尤其是金融机构,通过数据智能落地,探索业务的不断增长。今天,这些 经验和思考集结成册,相信无论对金融行业,还是每一个力求数字化的企业,都是 极好的经验交流的机会。信息(数据)只有流动起来,才能发挥出最大的价值。数 据的未来,就是我们的未来。 ——阿里巴巴集团副总裁、瓴羊 CEO 朋新宇 在过去的二十年,我们看到一个越来越明显的趋势,数据要素正在转化成为金融企 业新的“资产”, 在风险防范、 客户服务、 产品推广等领域发挥着不可或缺的作用, 助推金融企业的业务发展。但是数据并不会自发地转化为资产,业界的成功经验表 明,这背后需要建设一套完整的数据体系,并且需要有体系化的建设方法,否则企 业会深受数据质量差、 底数不清、 数据更新不及时、 数据口径不一致等问题的困扰。 该文基于阿里云多年服务金融行业的成功经验,针对金融企业在数据领域可能遭遇 的挑战,从多个维度阐述了数据体系的建设,并且总结了一套完整的数据体系建设 方法,对于金融企业而言有很强的借鉴意义。 ——阿里云智能副总裁、行业解决方案研发部总经理 曾震宇 一个看似稳定的行业会在什么时候迎来重大的业态改变?可能是新的生产要素出现 以及配合新要素的生产工具也出现新发展的时候,这个转变恰好刚刚开始。数据作 为新要素获得社会级的支持是近两年的事情,从数据要素统一大市场到数据资产记 账规则再到“数据二十条”的发布,我们看到的是国家为新要素发展做出的基础性 改变,但企业是否已经真的意识到了新要素的重要性?是否为此准备好了新工具? 是否为新工具调适了新组织?可能大部分企业尚未做好这样的准备,也在思考要不 要做、要怎么做。阿里云既经历了阿里自身的新要素建设,也观察了多个行业的新 要素探索,本次阿里云将经验与思考合盘托出,是一次对数据要素发展的“盘评治 享”,相信企业会在此找到同行者。 ——北京天润聚粮咨询执行董事总经理、中国计算机学会软件工程专委会委员 付晓岩 目录 引言 5 一、金融行业数据领域面临的困扰 7 1. 数据平台逐渐“掉队” . 7 2. 数据治理面临“熵增”困境 . 8 3. 数据资产面临“兵多、精兵少” 9 4. 数据服务“效率低” . 9 二、金融数据发展瓶颈的破题之术 11 1. 转换顶层设计思维 . 11 2. 锚定业务价值目标 . 13 3. 破除数据供需壁垒 . 14 4. 严控数据高质提效 . 15 5. 融合算力数智驱动 . 16 6. 强化数字人才能力 . 17 三、金融数据能力建设的核心观点 19 1. 以全局视角的驱动力 . 19 2. 以分层视角的核心力 . 23 3. 以业务视角的价值链 . 48 四、金融数据能力建设的成功要素 57 1. 关键能力和价值方向 . 57 2. 关键路径和成功要素 . 58 尾声 64 引言 5 引言 “大风起于青萍之末,浪成于微澜之间。”用这句话来形容中国金融行业数据领域 发展的历程颇为恰当。 从 2003 年银行的数据仓库开始建设到今天整整 20 年过去了,相比其他行业,金融 行业是真正完整地经历了数据仓库建设和大数据建设的两个十年周期;同时经历了 从 MPP 技术到 Hadoop 大数据开源技术,再到存储计算分离的云原生数据处理技 术;再到 AI 数据智能化的时代;从持续了 20 年的数据治理到今天全域数据资产管 理的数据中台化架构,关于金融行业的数据计算分析和智能化运营的探索从来没有 停止过。但是如何在原有的数据基础和平台技术积累上完成全局视角的数据能力提 升和技术体系的迭代,这是今天金融行业共同关注的话题,也是金融机构进入数字 化智能时代的重要标志。 阿里云历时五年助力阿里巴巴集团完成了全域数据中台的建设,同时也服务了众多 不同类型的金融行业客户在数据平台的建设和数据治理;数据智能化方面,在接触 了近千家金融机构了解实际业务需求和现状后, 激发了我们创造本文的热情与初衷, 期望用更全面、更立体的视角去定义数据的技术和业务价值;站在全局视角去剖析 数据生命周期的管理;站在云原生技术的视角去审视数据计算能力的未来布局。 同时全文解析了从底层数据计算到数据资产化的完整建设方法和路径,分析了当前 数据平台如何从分而治之的建设模式和技术体系逐步演进到全局的数据智能化中台。 关于数据领域研究,不仅仅是单纯的技术命题,我们也讨论了金融机构内部数据运 营模式以及数据人才建设体系这些当前重要话题。 期待本文能够为金融机构不同部门在治理/应用/运营/计算/决策等诸多数据方面的 工作,带来有价值的新发现,带来更多关于数据思想的碰撞。 本文共分为四个章节,全面围绕当前金融机构在经历近 20 年的数据建设中,依然 面临的效率、质量、服务、人才等方面问题,核心从业务对数据的痛点入手,通过 能力体系建设方法, 助力金融机构掌握数据能力体系的建设目标、 方法和成功要素, 从而推动金融机构逐步实现数据驱动业务发展的目标: 第一章从金融行业数据领域面临的问题出发, 重点描述当前金融机构在经历近20年 的数据领域建设后,仍然面临数据底数摸不清、数据治理差、数据服务低效、数据 资源不足和响应慢的问题,而这些都是我们面对不同金融机构、不同层级的客户提 引言 6 出的痛点和困惑。我们综合了相关问题,通过部分示例列举的方式给出了相关的判 断。 第二章结合第一章分析的数据体系、数据质量、数据资产、数据服务等领域面临的 困惑,提出采用全局思维,以业务价值为终极目标,分析数据领域问题,再进行分 层分步推进的总体策略。同时,为了便于读者理解,引出数据建设的 6 大断言,涵 盖了数据能力体系顶层设计、业务价值、数据服务、数据治理、数据平台、数字人 才相关领域的建设方向,希望为读者带来启发和帮助。 第三章从建设方法入手,给出金融行业未来数据能力建设的核心观点,首先从全局 视角规划企业数据能力体系的“1”张数据战略蓝图、 “3+1”数据体系以及 “6” 大核心能力,并对其中的数据体系提出了算力驱动、数据驱动和价值驱动的 3 大驱 动力;其次用分层思维,深化“3+1”数据体系设计,提出了数字基建 5 大法则、 数字资产 8 项能力、数字应用 3 个要素、运营保障 1 套机制的核心能力;最后站在 金融机构的“前中后台”不同部门的视角,以获客营销、产品定价、风险审计、数 据治理、技术架构等 5 个领域为例,分析数据体系为企业数字化