金融大数据平台建设实施方案
二、大数据平台建设 (一)大数据平台框架概述(一)大数据平台框架概述 大数据平台建设充分整合信息化资源,打破行业、部门之 间的信息壁垒,运用大数据技术进行采集、加工、建模、分析,将数据 价值融入到金融之中,从而提升创新能力和产品服务能力。主要 包括以下三部分: 1 1.大数据分析基础平台.大数据分析基础平台 按照功能划分数据区, 设计数据模型, 在统一流程调度下, 整合 各类数据,同现有的企业级数据仓库和历史数据存储系统一起, 形成基础数据体系,提供支撑经营管理的各类数据应用,支撑 上层应用。 2 2.大数据应用系统.大数据应用系统 基于基础数据平台, 持续建设各类数据应用系统, 通过数 据挖掘、计量分析和机器学习等手段,对丰富的大数据资源进行 开发使用, 并将数据决策化过程结合到风控、营销、 营运等经营管 理活动,充分发挥大数据价值。 3 3.大数据管控.大数据管控 建立数据标准, 提升数据质量, 加强元数据管理能力, 为 平台建设及安全提供保障 (二)大数据平台建设原则(二)大数据平台建设原则 大数据平台是大数据运用的基础实施,其设计、建设和 系统实现过程中,应遵循如下指导原则: 经济性:经济性:基于现有场景分析,对数据量进行合理评估, 确定大数据平台规模,后续根据实际情况再逐步优化扩容。 可扩展性:可扩展性:架构设计与功能划分模块化,考虑各接口的 开放性、可扩展性,便于系统的快速扩展与维护,便于第三 方系统的快速接入。 可靠性:可靠性:系统采用的系统结构、技术措施、开发手段都 应建立在已经相当成熟的应用基础上,在技术服务和维护响 应上同用户积极配合,确保系统的可靠;对数据指标要保证 完整性,准确性。 安全性:安全性:针对系统级、应用级、网络级,均提供合理的 安全手段和措施,为系统提供全方位的安全实施方案,确保 企业内部信息的安全。大数据技术必须自主可控。 先进性:先进性:涵盖结构化,半结构化和非结构化数据存储和 分析的特点。借鉴互联网大数据存储及分析的实践,使平台 具有良好的先进性和弹性。支撑当前及未来数据应用需求, 引入对应大数据相关技术。 平台性:平台性:归纳整理大数据需求,形成统一的大数据存储 服务和大数据分析服务。 利用多租户, 实现计算负荷和数据访 问负荷隔离。多集群统一管理。 分层解耦:分层解耦:大数据平台提供开放的、标准的接口,实现 与各应用产品的无缝对接 (三)基础数据来源(三)基础数据来源 1 1.银行内部大数据资源.银行内部大数据资源 客户自身信息以及其金融交易行为,依照目前积累沉淀 的数量资源情况,将数据主要分为三大类: 第一类:客户基础数据第一类:客户基础数据 客户信息数据,即客户基础数据,主要是指描述客户自 身特点的数据。 个人客户信息数据包括:个人姓名、性别、年龄、身份 信息、联系方式、职业、生活城市、工作地点、家庭地址、 所属行业、具体职业、婚姻状况、教育情况、工作经历、工 作技能、账户信息、产品信息、个人爱好等等。 企业客户信息数据包括:企业名称、关联企业、所属行 业、 销售金额、注册资本、账户信息、企业规模、企业地点、 分公司情况、客户和供应商、信用评价、主营业务、法人信 息等等。 将这些割裂的数据整合到大数据平台,形成全局数据, 再按照自身需要进行归类和打标签,由于都是结构化数据因 此将有利于数据分析。可以将这些信息集中在大数据管理平 台,对客户进行分类,依据其他的交易数据,进行产品开发 和决策支持。 第二类:支付信息第二类:支付信息 交易信息数据,可以称之为支付信息,主要是指客户通 过渠道发生的交易以及现金流信息。 个人客户交易信息:包括工资收入、个人消费、公共事 业缴费、信贷还款、转账交易、委托扣款、购买理财产品、 购买保险产品、信用卡还款等。 企业客户交易信息:包括供应链应收款项、供应链应付 款项、员工工资、企业运营支出、同分公司之间交易、同总 公司之间交易、税金支出、理财产品买卖、金融衍生产品购 买、公共费用支出、其他转账等。 第三类:资产信息第三类:资产信息 资产信息主要是指客户在金融机构端资产和负债信息, 同时也包含金融机构自身资产负债信息,其中数据大多来自 银行。 个人客户资产负债信息包括:购买的理财产品、定期存 款、活期存款、信用贷款、抵押贷款、信用卡负债、抵押房 产、企业年金等。 企业客户资产负债信息包括: 企业定期存款、 活期存款、 信用贷款、抵押贷款、担保额度、应收账款、应付账款、理 财产品、票据、债券、固定资产等。 银行自身端资产负债信息包括:自身资产和负债例如活 期存款、定期存款、借入负债、结算负债、现金资产、固定 资产贷款证券投资等。 第四类:新型业务数据第四类:新型业务数据 此类数据包括系统的运行日志、客服语音、视频影像、 网站日志等。 2 2.外部大数据来源.外部大数据来源 为了赢得差异化竞争,就必须考虑其他数据源的输入, 这些数据是自身不具有的,但是对其数据分析和决策起到了 很重要的作用。 线上交易、电商平台、社交网络等互联网数据来源,司 法、工商、财税等政府部门依法公开的信息,主要包括:互 联网消费行为数据 , 了解客户消费能力和消费偏好 等; 个人 严重行政处罚记录(如行政拘留等)、刑事犯罪记录、涉诉 情况(人身关系、财产关系) 、交通严重违规违章记录 等; 客户征信信息 、客户在其他银行或金融机构的贷款记录、信 用记录等信息等 ; 客户的第三方征信评级情况, 客户的社保、 纳税、公积金等信息 ,客户的社会保障情况及经济能力 ,工 作单位性质 , 客户社会身份 等; 客户在第三方催收机构的催 收记录、社会信息 等;出入境记录,客户出入境目的地、出 入境频率等;国内出行记录 ,客户出行习惯等 ;采用同大数 据厂商合作的方式,通过自身平台来采集数据或购买第三方 数据。 (四)大数据平台实现功能(四)大数据平台实现功能 大数据平台功能架构图 (1)批量实现较高水准的个性化客户产品服务,增加 客户粘性,推动业务创新。有效地将大数据分析系统够构建 客户 360 度全方位视图,设计更有竞争力的创新产品。对企 业型客户的财务状况、相关产业链上下游数据分析,把握客 现在的状况,更可以通过数据的交换、映射对其进行短期、 中期预测未来发展状况。同时通过与同行业中的企业比较, 以及利用公共平台收集企业的上、游对其评价,取得多维度 的评估,对中小企业风险进行有效的识别,从而缓解银行与 中小企业信息不对称问题,更好地推动中小企业市场业务创 新。 (2)针对客户需求,实现精准营销。银行借助大数据 分析平台,通过对客户的浏览记录、购买路径、消费数据, 进行挖掘、追踪、分析,将不同的客户群体进行聚类,根据 不同的客户特性打造个性化产品营销服务,将最适合的产品 服务推介给最需要的客户。提高客户对银行服务的认可程度 以及客户经理在营销过程中的专业程度。 (3)增强风险管控能力。大数据分析帮助银行摒弃原来 过度依靠贷款人提供财务报表获取信息的业务方式,转而对 其资产价格、账务流水、相关业务活动等流动性数据进行动 态监控,了解客户的自然属性和行为属性,结合客户行为分 析、客户信用度分析、客户风险分析以及客户的资产负债状 况,从而有效提升客户信息透明