蚂蚁文库
换一换
首页 蚂蚁文库 > 资源分类 > DOCX文档下载
 

实用分类系统及其实现方法

  • 资源ID:52542553       资源大小:18.20KB        全文页数:13页
  • 资源格式: DOCX        下载权限:游客/注册会员    下载费用:6积分 【人民币6元】
快捷注册下载 游客一键下载
会员登录下载
三方登录下载: 微信快捷登录 QQ登录  
下载资源需要6积分 【人民币6元】
邮箱/手机:
温馨提示:
支付成功后,系统会自动生成账号(用户名和密码都是您填写的邮箱或者手机号),方便下次登录下载和查询订单;
支付方式: 微信支付    支付宝   
验证码:   换一换

 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

实用分类系统及其实现方法

实用分类系统及其实现方法 1 语义网与实用分类系统 目前计算机硬件技术已经有了长足的发展,但是大量数字化信息的表达还停留在“机读”水平,缺乏应有的“智能”去“读懂”数字化信息;互联网仍然处在“混沌网”和缺乏互操作性的阶段,其根本问题在于缺乏语义。语义网的出现将改变这种状况,简单地说,语义网就是机器可以理解的信息,是数据网或全球性的数据库。作为当前因特网的延伸,语义网赋予信息以清晰的定义和含义,为数字化的信息加上“智能”,促进人与计算机的合作,能够最大限度地发挥因特网的潜力,使该技术能够让机器支持全球化的知识交流[1]。 W3CWorld wide web consortium在语义网的开发中,将工作重点放在了可扩展置标语言XML和资源描述框架RDF为基础的实施技术方面,而其中的核心部分便是对实用分类系统Ontology的开发和利用,实用分类系统与计算语言学相结合,将成为应用领域里关于数据含义的聚集库。实用分类系统是为共享领域内的通用说明、定义和关系提供的一个语义框架,它的最终目标是精确地表示那些隐含的信息,使得它们可以被软件系统重用和共享。 语义网的整套标准和技术可以划分为一个从基础的国际码Unicode和统一资源标识URI到最高的信任层Trust的层式结构,如图1所示。 国标码、统一资源标识、可扩展置标语言及其相关技术如名域Namespaee和可扩展置标结构语言构成语义网的原始物理基础,这一层奠定了数据的格式和语法,但并不能赋子数据以语义,即数据的含义和各种数据之间的联系。资源描述结构及其语言通过定义概念之间的关系使数据能够自我描述,这项标准建立了“计算机可读数据”的环境。但是这还不够,因为计算机不能像人那样聪明地判断“电脑”就是“计算机”,而且“掌上电脑”是电脑中的一个类型,可以具有记事、日历、上网的多种功能。要让信息系统能够处理并懂得这些数据和它们之间的关系,就必须设计实用分类系统词汇表ontology vocabulary)来定义这些概念,统一用词,建立参照系统将有关的概念联系在一起,逻辑推理logic、证明proof和信任trust这些最高层次的技术必定依赖于实用分类系统的建立。 2 实用分类系统和图书馆分类法 实用分类系统的主要成分是一套对某一领域里的知识进行表述的词和术语,编制者根据该知识领域的结构将这些词和术语组成等级类目,并且应用面向对象Object-Oriented的方法按需要给一些类目加上更细的定义。实用分类系统与传统知识分类工具的一个根本区别就是系统的概念、特性、限制条件等都是计算机可读的,所以实用分类表中的知识定义可以被再利用。具体区别参照表1。 由上表可以看出实用分类系统中概念之关系的表达比图书馆分类法要广而且深,这是由于实用分类系统主要为机器增加“智能”进而实现自动化处理信息、知识分享和再利用而建立的。所以在数据模型和表述语言方面,它的结构和数据库很接近,通过简单的处理即可以将整个分类系统转换成数据库而直接实施到信息系统的开发和建设当中去,为知识采集和知识库的建立搭建平台。实用分类系统中的概念、特性、关系和规划就像神经网络中的神经单元,统管着自己那个小领域的知识内容、特征和方法,建造实用分类系统相当于建造信息处理所需的智能单元,是开发语义网的基础。 3 实用分类系统的构造设计 构造和设计实用分类系统Ontology是很复杂的,这主要是因为有关实用分类系统的研究尚处在雏形阶段,没有统一的定义和固定的应用领域。专有领域实用分类系统和共享领域实用分类系统的建立都是刚刚起步。但现阶段构造实用分类系统的素材却是多种多样的,就其完整性而言,有结构的、半结构的和无结构的等。 有结构的素材如数据库结构、叙词表、术语分类表等。①数据库的结构对于建立实用分类系统有重要的影响,但是数据库样式表Database schema和实用分类系统ontology中的实例instances是不同的,和Database schema相比,ontology具有以下特点ontology也可视为数据,ontology是和语义相结合的,ontology被经常地重复使用,ontology在本质上是分散的,Ontology数据模型是丰富多样的,层级关系也可视为ontology的同等概念。②由于按照叙词表对文献进行标引之后,可以利用计算机对文献信息进行快速、准确、全面的检索,20世纪80年代以来叙词表的编制有了长足的进展。在网络环境下,叙词表不但在建立各个领域的实用分类系统中将充当重要角色,而且,更重要的是要首先结合各个知识领域的发展与自身概念性强的特点,建立能够驾驭各领域的具有叙词语言特色的实用分类系统,为将来语义网中的智能检索奠定基础。③术语分类表是长期以来各学科发展的重要成果,在这方面充分利用也要比从头做起容易得多。 半结构的素材包括网页、词典或字典等半结构的来源。有专家把实用分类系统分作静态Static ontology、动态Dynamic ontology、目的Intentional ontology、社会Social ontology4类,在编制实用分类系统时,具有完整结构的素材固然有较好的利用价值,但是半结构以及无结构的素材因为有较好的开放性、可扩展性,对于描述动态实用分类系统Dynamic ontology和社会实用分类系统Social ontology更有开发前景。 实用分类系统ontology在编制中应首先被视作一种具有生命周期的东西,西方有学者将规范化Specificadon、概念化Conceptualization、格式化alization、执行Implementation、保存Maintenance作为实用分类系统生命周期中的5个阶段,但同时也指出这5个阶段不是固定不变的,Maintenance也不是最终的目的,新知识的层出不穷和过于零散、无结构促使在编制实用分类。系统时要吐故纳新,时刻保持重复可用的生命力。 透彻理解ontology对技术操作的指导意义和掌握大量的素材是编制实用分类系统的前提,此外,在编制时还要有步骤地进行。一般而言,构造和设计实用分类系统有下面几个步骤。如图2所示。 首先,要确定实用分类系统的目的和范围。即所研究的领域和范围领域越大,所建实用分类系统越大。一般而言有三种实用分类系统,如图3所示。 不同的领域可以构建不同的实用分类系统,即使是同一个领域内,实用分类系统也有不同的层次;而我们研究目的的不同也决定着实用分类系统的大小。比如在数字图书馆的建设中,基于文本文献的实用分类系统是一个层次,基于XML的多媒体信息的实用分类系统是一个层次,而基于对数字图书馆全程知识管理的实用分类系统又是一个层次。目的和范围的不同决定我们将建立一个怎样的体系,以及在建立这个体系的过程中将花多少成本,而这一系统将来能发挥多大作用。 其次,进行实用分类系统分析。构建实用分类系统的核心是建立概念间的等级结构及定义概念属性,从而利用逻辑推理来推导概念之间的

注意事项

本文(实用分类系统及其实现方法)为本站会员(知识电梯)主动上传,蚂蚁文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蚂蚁文库(发送邮件至2303240369@qq.com或直接QQ联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们


网站客服QQ:2303240369

copyright@ 2017-2027 mayiwenku.com 

网站版权所有  智慧蚂蚁网络

经营许可证号:ICP备2024020385号



收起
展开