国内外数据治理模型对比分析
014014 第 2 卷 第 2 期 2020 年 6 月 文 献 与 数 据学报 国内外数据治理模型对比分析 *A 肖洁琼 奉国和 (华南师范大学经济与管理学院信息管理系,广州 510006) 摘 要 [目的 / 意义]数据治理是数据科学时代关注的重要问题之一,研究数据治理模型是实现数 据价值最大化和数据治理最终目标的有效且必要途径。 [方法 / 过程]采用文献调查法分别对八种数据治 理模型在内涵、要素、功能及范围四方面进行对比分析。 [结果 / 结论]归纳与总结出不同模型的优势与 不足,为数据治理工作者在选择与使用时提供参考。 关键词数据治理模型 数据治理内涵 数据治理要素 数据治理功能 数据治理范围 分类号G203 DOI10.31193/SSAP.J.ISSN.2096-6695.2020.02.02 0 引 言 当前世界正处于工业4.0时代,各国经济发展战略白皮书都在强调利用大数据实现工业转型, 国外有美国的大数据研发战略 [1]和欧盟朝向开放科学体系[2] ,我国也颁布了国务院关 于促进大数据发展的行动纲要 [3] ,这些政策都旨在通过大数据、云计算和人工智能等技术,促 进数据共享和利用,实现工业协作和生态创新[4,5]。 在此背景下,从各种来源获得的以 ZETTABYTES 为单位的大型复杂数据集呈指数型增长, 这些数据在政府、医疗、教育、管理和物流等不同领域都有许多应用,例如,在美国被用于预防 犯罪和反恐,在韩国被用于支持智能政府运营和战略规划[6],但使用者在数据处理和管理方面 面临巨大的问题,实施大数据战略的组织和企业都亟需一套新的数据处理政策和模型。因此,数 据治理(Data Governance,DG)作为一个新兴话题成为研究人员和行业领导者关注焦点[7]。国 内学者张宁等[8]对数据治理概念、体系、内容和应用的相关研究进行述评,指出“框架设计” “价值探讨”是目前研究重点, “框架体系” “成熟度模型” “框架模型设计优化”是未来重点研究 领域。 * 本文系广州市科技计划基础与应用基础研究专题项目 “突发词探测理论、 方法与应用研究”(项目编号 202002030384) 成果之一。 [作者简介]肖洁琼(ORCID0000-0001-5783-2893),硕士研究生,研究方向为数据挖掘、信息计量学;奉国和(ORCID 0000-0002-0774-1544,通讯作者),教授,博士,研究方向为信息计量学、数据挖掘,Emailghfeng 。 0 引 言 015015 肖洁琼,奉国和 . 国内外数据治理模型对比分析[J]. 文献与数据学报,2020,2(2)014-025. 笔者以“数据治理”或“Data Governance”或“Ination Governance”为关键词检索相关 中外文文献,发现数据治理研究大致始于 2004 年,最先开始于企业实践,随后在学术界围绕模 型构建和案例分析展开讨论,主要集中于计算机技术、企业管理以及图书馆管理等领域[9]。关 于数据治理模型构建的研究,最早由大型信息咨询公司和标准化组织发起,随后延伸到学术界。 业界对于构建数据治理模型的研究成果集中在各组织机构提出的治理框架和模型,大体可以分 为三类数据治理成熟度评估模型[10,11]、数据治理过程模型[12,13]和数据治理要素模型[14,15,16]。 相对来说,学术界对数据治理模型的研究显得分散且独立。国内包冬梅[7]对国际影响力较大的 DAMA 框架和 DGI 框架的主要内容和要素架构进行了研究,并在此基础上提出针对我国高校图 书馆数据治理的 CALib 数据治理框架;刘越男和闫慧等[17]就大数据情境下的政府数据治理展 开研究并以贵州省抢险救灾实例进行论证;杨琳[18]在分析国内外数据治理理论、方法和需求的 基础上,提出面向大数据的治理框架并列举了相应的 应用场景。国外 K.Wende[19]提出了描述和 说明企业数据治理的弹性模型,认为模型应该由角色、决策域与主要活动以及职责三部分组成; S.Kim[20]提出将商业和 IT 技术结合来构造数据治理模型。相比于对数据治理模型的研究,分析 数据治理成功案例的研究则显得略少,夏义堃[21]对比分析部分发达国家政府数据治理政策和治 理模型,提出我国政府数据治理框架和治理内容的独特观点;K.Weber[22]基于 6 家不同类型跨 国公司有关数据治理的社区行动研究项目,提出了一个由数据质量角色、决策域和责任三部分 组成的数据治理责任分担矩阵模型。此外,还有一些学者从数据治理的内涵、要素、模型等角 度进行述评,指出治理体系和治理模型的设计是未来研究的重点方向,数据治理实践是终极目 标[8,23,24]。 结合国内外文献调查可发现,首先,在数据治理领域,学界和业界的关联并不紧密。学界和 业界对数据治理的定义并没有随着时间推移而集中发生改变或达成共识,业界各机构对数据治理 的定义更多取决于业务需求和商业竞争而不是学术界研究成果;但是,学界的研究却是随着业界 的发展产生波动,不少学术研究成果都是在业界出现新理论、新模型和新案例的基础上产生的。 由此可见,在数据治理领域,业界对数据治理理论和模型的研究进度快于学术界,且研究成果被 学术界认可。其次,构建大量的数据治理模型并不能促成大批成功的数据治理案例产生,究其原 因,学 界对 于数据治理的研究与推崇并不能代表企业和组织 愿意 接受理论使用模型。组织机构想 要实现数据价值 最大 化, 就需要进行数据治理,构建具有高度可操作性的模型[20];然而,现有 研究成果并没有阐述组织机构如何进行数据治理模型的选择、实施与维护。因此,笔者从组织机 构实际应用出发,选择国内外大型知名标准化组织和咨询公司相关数据治理框架模型作为研究对 象,使用文献调研法,选择深受业界和学界认可的 4 个标准化组织和 4 个咨询公司提出的 8 种数 据治理模型,并对它们的发布时间、发布机构和模型名称做了简要梳理(见表 1) 。笔者希望通 过分析表 1 所列 8 种数据治理模型所体现的治理内涵、构成要素、特点、功能和使用范围,探索 不同模型优势与不足,并结合我国开展数据治理的现实环境,着重对组织结构构造数据治理模型 提出新的思考,以期为相关研究提供借鉴与参考。 016 第 2 卷 第 2 期 2020 年 6 月 文 献 与 数 据学报 016 表 1 数据治理模型基本信息 机构类型发布时间发布机构模型名称 标准化组织 2004 年国际数据治理研究所(DGI)DGI 数据治理框架 2008 年 9 月国际数据管理协会(DAMA)DAMA 数据治理模型 2015 年 5 月信息技术服务标准(ITSS)(中国)数据治理白皮书模型 高等教育统计局(HESA)(英国)HESA 数据治理模型 咨询公司 2007 年 10 月国际商业机器公司(IBM)数据治理委员会(美国)IBM 数据治理模型 2008 年 12 月高德纳咨询公司(Gartner)(美国)Gartner 6 阶段成熟度模型 2015 年 3 月 Mustimuhw 信息解决方案公司(Mustimuhw Infor