科技情报大数据挖掘与服务平台
推荐单位意见推荐单位意见 项目名称科技情报大数据挖掘与服务平台 推 荐 单 位 中国人工智能学会 (专家) 推荐单位(专家)意见 该项目为“研究者社会网络搜索与挖掘系统( ArnetMiner) ” ,经李德毅院士组成的 评审委员会评审,得到了各位评审专家的充分肯定,获得2013 年度吴文俊人工智能科 学技术进步奖一等奖。此后,该项目相继展开近三年的创新研究,取得了多项进展, 主要包括1 1)理论研究)理论研究在多源异构数据语义集成,面向科技创新的网络用户行为分 析,构建多维关系依赖的知识图谱等方面取得突破,新增发表论文30 篇(其中CCF A 类论文 13 篇) ;2 2)知识产权)知识产权积极推动知识产权保护,新增授权专利 5 项,项目相关 授权专利达到了 12 项;3 3)经济效益)经济效益项目核心技术及工具获得了多个企事业单位的 认可,集成应用如搜狗、亿赞普、点通等单位的主流产品中,产生经济效益超过 5 亿 元;4 4)社会效益)社会效益项目系统向科技界免费开放访问接口及各种数据,为KDD, ICDM, WSDM 等 20 余个重要国际会议提供审稿人推荐及语义信息服务;积极参与建设中国 工程院主导的“中国工程科技知识中心”建设,成为其12 个分中心之一;并参与建设 联合国教科文组织主导的国际工程科技知识中心,成为其核心应用之一,为第三世界 国家免费提供科技信息咨询及知识挖掘服务。 综合上述情况,我会同意推荐该项目申报 2016 年度国家科学技术发明奖。 项目简介项目简介 科技数据记载着科学技术的发展和进步,对其进行深入挖掘,可以及时了解和掌握 科技动态,加快科技创新速度,提高科技生产力,让学术成果真正服务于经济发展和 社会进步,为决策部门提供综合性战略性情报服务。这对于提高我国互联网科学管理 水平,促进互联网经济发展,推动数据挖掘、信息检索、情报分析以及网络科学等相 关学科的发展,占领下一代信息技术和知识服务的科技制高点具有重要的战略意义。 推荐项目针对互联网环境下科技信息资源规模大、分布及异构等特征,率先提出并 研发了以知识和研究者为核心的异构网络深度挖掘与服务平台,实现了亿级节点的大 规模科技知识图谱的建立;创新性的提出面向科技创新的群体智能挖掘方法,为理解 网络群体行为的形成和动态演化奠定了理论基础。项目主要发明及创新点如下 1)提出了多维依赖关系信息抽取方法和基于最小风险的语义集成框架,大大提高 了语义信息的抽取精度,实现了亿级节点的大规模科技知识图谱的建立; 2)创新性的提出面向科技创新的群体智能挖掘方法,系统性的给出了网络结构和 网络用户行为之间的关联关系,为理解网络群体行为的形成和动态演化奠定理论基础; 3)提出面向科技知识网络的异构对象统一建模方法 将异构对象映射至低维隐空间 进行排序学习,解决了知识网络中的异构对象排序难题,实现了异构对象全局权威度 的高效计算; 4)研发了具有完全自主知识产权的新一代研究人员社会网络的学术信息挖掘和搜 索系统 ArnetMiner(后更名为 AMiner) ,提供面向学术、专利和科技新闻的搜索、语 义分析、科技成果评价及趋势分析等功能。 项目获得发明专利授权 12 项,取得软件著作权 6 项;发表相关学术论文 112 篇, Google Scholar 引用超过 5800 次。项目相关应用系统 AMiner 自 2006 年上线以来已 经产生了显著的学术影响和社会效益。目前已为全球 220 个国家/地区 700 多万独立 IP 访问提供服务,发表在 SIGKDD’08 上介绍关键技术的代表论文 Google Scholar 引 用 531 次,在该会近 8 年发表的 1508 篇论文中排名第 7。项目获得中国人工智能学会 科技进步一等奖、中国电子学会自然科学二等奖、北京市自然科学三等奖。项目研究 成果还在微软必应搜索、搜狗、亿赞普、点通、华为、IBM、通用、美孚、腾讯等企 业的合作项目中得到推广应用,近三年相关产品新增销售额超过 5 亿元。 客观评价客观评价 1. 对项目的评价 1)2013 年 8 月 29 日,教育部对“研究者社会网络搜索与挖掘系统”进行了成果鉴 定。鉴定委员会认为项目成果完善了 Web 语义集成、主题模型、网络排序以及 社会网络搜索与挖掘的理论体系和技术方法 被认为是世界上最有代表性的学 术社会网络分析系统之一鉴定委员会一致认为,项目核心技术达到国际先进、 国内领先水平。 2)2013 年 10 月,项目“研究者社会网络搜索与挖掘系统(ArnetMiner)”在与国内 近 40 项研究成果的竞争中胜出,获得了中国人工智能学会第三届吴文俊人工智能 科学技术进步一等奖(仅一名一等奖) 。 2. 对 ArnetMiner 系统评价 1)2008 年,介绍 “研究者社会网络搜索与挖掘系统”框架及核心技术的文章 “ArnetMiner Extraction and Mining of Academic Social Networks”发表在数据挖掘领 域的国际顶级会议 SIGKDD‘2008 上。论文 Google Scholar 引用次数 540 次。 2) UIUC大学的知名教授Dan Roth在Coling上关于专家发现的论文使用Arnetminer 的结果作为评测标准。 3)著名研究机构 DERI 资深研究员 P. Buitelaar 等人在论文中提到ArnetMiner 是 当前著名的学术研究者社会网络搜索工具。 4)南安普顿大学 Tiropanis 等人撰写的综述中多次提到 ArnetMiner 系统,评价 ArnetMiner 是“搜索与匹配方面最有代表性的工具” 3. 对项目核心技术评价 1)创新点1信息集成工具RiMOM 在国际本体映射竞赛 OAEI 中连续 6 年夺得 9 项子任务第一的好成绩; 在 2008 年 OAEI 结果分析报告中, RiMOM 被认为是“Top Matching System”。 2)创新点 2关于大规模社交网络中影响力分析的论文发表在 SIGKDD’2009 上, 在 ACM 的 Digital Library 中已经下载 3792 次,在该会议近六年(2008-2013)所 有 1208 篇文章中下载次数排名第一。 3)创新点 3在异构网络排序学习模型的研究中,将用户影响力分析应用在交叉 领域协作关系推荐, 论文发表在 SIGKDD’2012 上, 被评审认为是“This is a very nice paperwhichproposesanovelapproachforcross-domaincollaboration recommendation”,论文获得最佳 Poster 奖。 推广应用情况推广应用情况 项目研发成果 AMiner 系统自 2006 年上线运行以来,至今已经过 8 次重大改版升 级,吸引了来自 220 个国家/地区 700 万独立 IP 的访问,为公众免费提供了超过 200 万 次数据/代码/工具下载,收集了超过 1 亿 5 千万用户日志。Google Analytic分析工具最 新