公务员期刊网 精选范文 信息分类标准范文

信息分类标准精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的信息分类标准主题范文,仅供参考,欢迎阅读并收藏。

信息分类标准

第1篇:信息分类标准范文

众所周知,新品牌要在竞争激烈的市场中迅速崛起,快速实现从“0”到“1”的转变,在原有产品基础上寻找到合适的新品类是一个非常有效的策略。那么,一个有效的新品类至少应该满足哪些标准呢?远卓机构认为,成功开创的新品类至少要满足五个标准:站得稳,展得开,收得拢,伸得远,传得快。

其一,站得稳。新品类不仅要有产品质量做根基,而且要能够找到其潜在的消费者需求基础。满足这两个条件后,新品类仍然要有渠道基础,唯有如此,新品类才可能在市场上站得稳。例如,我们在服务潮峰钢构集团时,开创了精品钢构这一新品类,满足了大量客户对于钢结构建筑质量的高要求,有效推动了该品牌在全国范围内的迅速崛起,品牌知名度和美誉度火线飙升,很快位居行业前列。

其二,展得开。新品类必须有足够的支点来支撑,通俗地说就是,围绕新品类要能展得开,为新品类找到形式新颖、内容相异、主题鲜明的支点。例如,山叶电动车根据社会现状和发展趋势、行业现状和发展趋势、企业现状和发展趋势以及消费者需求现状和发展趋势,提出人文电动车这一新品类,然后围绕人文电动车这一新品类,在处理经销商关系时大胆创新,将经销商全部视为“事业元素”,获得了经销商的大力支持,影响了整个电动车行业。此外,山叶针对大量电动车由于厂家倒闭而维修难的现状,全力展开“领养电动车孤儿”活动,掀起震惊行业的电动车“收孤风暴”,感动了无数电动车用户。实际上,山叶这些活动都是“人文电动车”这一新品类的有效拓展,直接向社会展示了人文电动车的具体内涵。

其三,收得拢。新品类的命名必须具有“高度”和“广度”,换句话说就是能够“海纳百川”,或者说是“一览众山小”,能够将品牌未来发展过程中的各种有利资源聚集“麾下”,形成一股合力,有效推动品牌的良性发展。

第2篇:信息分类标准范文

【摘要题】信息资源建设与管理

【关键词】网络信息分类法/网络信息组织/分类法构建

【正文】

根据网络信息和用户检索需求的特点,依据网络环境构建科学、实用的网络信息分类法,是信息资源组织管理研究的重点之一。本文主要以1999年—2005年的中国学术期刊网数据为信息源,从构建方法、原则、语言、大纲、信息技术应用等6个方面回顾了近年来网络信息分类法构建的研究进展。

1构建网络信息分类法的依据或方法

目前,网络信息分类法主要是指网络搜索引擎分类体系。基于“分类工具通常是根据分类对象的特点和用户需求,结合一定的技术环境建立的”认识,马张华在《分类搜索引擎类目体系研究》一文中论述了分类搜索引擎类目结构的编制依据:(1)从分类对象来看,网络资源的特点是数量、种类多,动态性强,新兴科学、商业、娱乐的资源数量较多,传统知识门类的资源相对较少,要求有新的、适合处理对象的分类架构。(2)从用户需求来看,网络的使用对象涉及所有的终端用户。(3)从技术环境来看,网络信息分类体系应充分利用计算机操作环境与超文本技术,在体系构建、类目设置等方面发展不同于传统分类法的技术特色。[1]

陈树年提出建构网上知识分类体系的(基本结构)编制方法,即:①有一个涵盖各知识领域、结构清晰、层次简明、能满足网上信息组织需要的分类体系;②采用等级结构展示知识的系统联系,构成枝干分明的主题树或脉络清晰的知识地图;③类目的排列和检索结果的排列方法应采用对用户最有用的排列次序;④分类体系的标记应适当保留。[2]石晓华等在分析了网络信息分类法与传统分类法的优劣之后,首次提出了建构《中国网络信息分类法》的建议,并列举了具体的编制方法,即:①以传统分类主题体系为基础,建构多维的分类体系;②栏目因需而设,突出重点;③控制分级,减少栏目层次;④根据用户确定栏目名称的规范程度。[3]张琪玉则提出了一整套设计方针,即:①为不同类型的需求提供不同特性的分类体系;②在统一框架下设置分散独立、各自完整的分类体系;③分类体系的类目设置不以网罗全部网络信息资源为目标;④分类体系应具有开放性和可变性,并应有反映新颖信息的措施。他也设计了一个供普通用户使用的分类体系框架。[4]王知津赞同石晓华的第①、②、③建议,认为可以借鉴传统分类体系,构建《网络信息分类法》,实现网络信息分类法与主题词表的结合,即分类主题一体化。实现分类主题一体化,需要做好三个方面的工作:①建立一个结构简明的知识分类体系,通过对信息资源的系统分类,实现对网络信息的宏观控制;②建立一个智能化的控制词表,实现作者语言与用户检索语言的控制和转换;③建立分类体系与控制词表的系统联系,即将标引语言纳入分类体系,这样既可以用自然语言直接检索,也可以在任何类下进行语词检索,从而较好实现分类与主题的兼容。[5]董琳提出的思路是设计一个融知识分类、行业分类、网站信息分类于一体的综合性中文网站分类体系。[6]该体系把一级大类分为5大模块:较丰富信息的模块、高查询率模块、学科专业模块、查询入口模块、综合网站模块。常设20个一级类目,把主题作为主要聚类标准,学科和专业作为辅助聚类标准。

另外,陆宝益提出编制的具体步骤,即建立专门机构,配备专业人员;开展深入调研,制定可行计划;广泛征求意见,不断修改完善。[7]其他学者,如陈代春、赵培云、刘颖、许磊等也从不同角度论述了如何构建统一的网络信息分类法的问题。

2网络信息分类法构建的原则

构建新的网络信息分类体系,需要吸收现有搜索引擎分类体系优势,借鉴传统分类法的部分长处,并遵循基本的设计指导原则。有的学者[8]认为,强调类表的科学性和专业性,而忽略了最终用户——信息需求者的利益,是传统文献分类法无法适应网络信息分类的基本原因之一,所以建立中文网络信息分类体系应以实用性为主。持相同观点的学者,如,史学斌提出“实用性、自然性、系统性和技术性、针对性”原则[9]。郑庆胜指出“实用性、全面性、规律性、统一性和特殊性”原则[10]等。

持相反观点的学者认为,首要的原则是科学性原则。吴丹认为,与传统分类法一样,网络信息分类也必须具备科学性原则,分类体系仍必须以科学的知识分类为基础,即科学性原则、易用性原则、针对性原则、动态性原则[11]。其他学者,如陆宝益提出“科学性、自然性、实用性、同一性、通用性、兼容性、发展性”原则[12]、朱蓓玲提出“科学性、实用性、易用性、自然性、针对性、快捷性、系统技术性”原则[13]。敬卿、吴静提出的“科学性、实用性、易用性、自然性、通用性”原则[14]。邓香莲提出的“科学性、简洁性、直接性、实用性、动态性、自然性”原则[15]也应归属此类。

关于网络信息分类体系的原则,研究者智者见智,较多学者都提到了应遵循“科学性、实用性、自然性”原则。主要分歧是强调科学性优先还是实用性优先。笔者认为,网络信息分类法要适应组织网络信息动态变化的需要,满足用户复杂的信息查询需求,对于综合性、大众性的中文网络信息分类体系,必须以实用性原则为主,兼顾科学性的原则。

3网络信息分类法构建的语言

从实践来看,传统的文献分类法使用的是典型的人工语言,而网络信息分类法使用的主要是自然语言。因为人工语言严格的规范性使用户丧失了检索中的自主性和能动性,背离了以人为本的原则,自然语言是检索语言发展的必然。[16]张琪玉教授则指出由于自然语言有其固有的缺陷,网络信息检索不可能仅仅使用自然语言,也必须使用人工语言。情报检索用语发展的大趋势,是情报检索语言的自然语言化和自然语言的情报检索语言化,是两者的初级结合到完全融合的过程。[17]所以有的学者认为需要对网络受控语言进行适合于网民大众习惯用语的改造,提出了“受控语言网民化”的思想。[18]陈晶也指出:“改进受控语言的易用化是网络环境下的大势所趋,而对自然语言进行必要的控制也是网络环境下势在必行的,两者的相互渗透、有机结合是情报检索语言发展的大趋势。”[19]

有的学者认为分类主题一体化语言,实质是受控语言内部的一体化,它不能适应网络检索的发展,应当建立更适合于网络信息检索的自然语言与受控语言结合的一体化语言。[20]有的学者通过分析受控语言和自然语言各自在网络中的应用,分析其优缺点,指出无论受控语言还是自然语言都有各自独特的优点和缺陷,不能彼此取代,可以相互补充。而“它们在网络中的应用研究也表明两者之间呈现出明显的相互交织兼容的趋势”。[21]

笔者认为,任何一种语言都有长处和短处,都不能完全满足网络用户多样化需求,分类语言和主题语言相结合、自然语言和人工语言相结合才是建构网络信息分类法的发展趋势。

4网络信息分类法的大纲设计

对网络信息分类法进行深入研究并提出大纲或框架的代表作有文献[22]、[23]、[24]。陈树年阐述了构建网上分类体系的原则与技术后,提出了一个适用于一般用户的综合性中文搜索引擎的信息分类大纲,该大纲包括22个大类,即哲学与宗教、人文与社会科学、社会文化、文学与艺术、教育与人才、体育与健身、休闲与生活娱乐、旅游与服务业、医学与健康、经济与金融、政治、法律、军事、历史与地理、自然科学、农业科学、工程技术、计算机与网络、新闻与媒体、图书馆与参考资料、国家与地区、综合网站。并指出以学术和技术为主的搜索引擎、专业搜索引擎最好以权威分类法(或其中的某些类)为基础,经过一定的改造后用于网上信息的组织和检索,因为其科学的体系和严密的结构是非专业人员所不能独立完成的。[22]吴丹采取学科分类与事物分类兼顾的方式,也设计了一个包含有18个大类和若干二级类目的网络信息分类体系设计方案。18个大类,即政治法律与军事、新闻与媒体、商业与经济、自然科学、农业与工程技术、计算机与网络、教育、哲学与宗教、人文社会科学、文化艺术、历史与地理、国家与地区、旅游与交通、医学与健康、生活服务、体育与健身、娱乐休闲、图书馆与参考资料。[23]许培扬提出了中文网络信息分类法应由简表、主表、索引和使用指南四部分组成。简表一般由1-4级类目构成,主表由全部类目构成。索引包括:①本表与其他分类体系的对应,用于不同分类体系的转换;②英译名称索引,从英查汉或从汉查英。使用指南是分类体系的详细说明。[24]

5现代技术在网络信息分类法构建中的应用

由于网络信息分类法必须能适应网络技术环境,这就要求在编制过程中适当采用许多现代信息技术,如自动分类技术、人工智能技术、网格技术等等,以适应网络技术环境的发展特点。马张华专文阐述了超文本技术在网络信息分类法编制中的应用。[25]他指出:超文本技术可以改进主题之间多维关系的揭示;可以从多个角度组织信息资源;可以进行轮排,亦即多表列类;可以设置镜像类目,根据需要对某些重点类目或热点类目突出反映;可以动态设置类目和动态揭示类目之间的关系,根据需要及时增添类目或删改类目;可用于联结不同的检索系统,增加检索入口;可以联结分类体系与相应的说明文字与规则系统。

陈旭论述了分面分类在网络信息分类法编制中的应用。[26]文章首先论述了在编制网络信息分类法时,可根据需要利用仿分技术编制各种类型的通用复分表、专用复分表及规定必要的仿分。其次论述了分面叙词表的应用。最后论述了分面分类在可视化检索中的应用。即在检索界面上设置主题分面、书目形式分面、时间分面和地域分面,然后再按等级列举的方式分别展开,既便于类表的修订与维护,又便于用户检索更为专指的信息。

周淑云在《分类主题一体化构建网络信息分类体系》[27]一文中指出,理想的网络分类法应是分类法和主题法的结合使用,理想的模式是以“分类一主题”的方式对知识进行组织,形成一种兼具分类、主题两种标引和查找功能的新型检索语言,从而为不同层次和不同需求的用户分别提供不同的信息查询功能。分类主题一体化的网络分类体系既突破了传统分类法层层划分、层层隶属的等级结构又克服了主题法系统性差,将同类信息分类的特点。对此问题进行论述的还有郭丽芳、梅伯平、苏瑞竹等。

6构建中微观层面的具体问题

对网络信息分类法编制的一些具体问题,许多学者都予以了详细的探讨。

陈树年在《网络信息分类法研究》中研究了聚类标准、大类设置、展开层次、类目种类、类目名称、多分类体系、分类标准与使用次序、类目设置的均衡性和规律性、重点类目、交叉关系的处理、类目的排列、类目的注释和说明、用户界面的设计等,并给出了相应的改进意见。[28]他认为,关于聚类标准,综合性网络信息分类法聚类的主要标准应当是“主题和专题”,专业搜索引擎可以学科或专业为主要聚类标准,或结合主题聚类运用;关于大类的设置数量通常以10-20个为宜;关于类目的名称要做到准确、通用和精练;关于类目种类包括“子类”与“网站”两种,“在每一类下,把内容宽泛,各个下位类不能容纳的信息归纳为‘综合网站’集中收录是网络分娄法实用的作法”。

其它方面,人们观点大致雷同。如,关于分类体系展开层次,陈树年提出基本应控制在3-6级之间;赵培云认为根据目前网络信息的实际情况和用户浏览查询心理,综合性网络信息分类标准,类目应控制在三、四层为宜,专业搜索引擎和网站可适当延伸。[29]张琪玉提出类目细分应控制在五级左右。[30]

总之,由于网络信息、网络信息用户、网络信息技术环境等特点,这就决定了网络信息分类法的编制原则和技术方法,有别于传统分类法的编制原则和技术方法,但是传统文献分类法和现有网络信息分类体系的成功经验可以给网络信息分类法提供有益的借鉴。我们建议,应当由国家信息产业部牵头,组织图书情报界专家、计算机专家、网络公司等相关专家,广泛征求意见,尽早编制出一部用户满意、质量较高的网络信息分类法。

【参考文献】

[1]马张华.分类搜索引擎类目体系研究.图书情报工作,2001(2):36-40

[2][22]陈树年.搜索引擎及网络信息资源的分类组织.图书情报工作,2000(4):31-37

[3]石晓华,王春芳。网络信息分类与传统分类法的优劣分析——兼谈构建《中国网络信息分类法》.图书馆理论与实践,2001(1):43-45

[4][30]张琪玉.网络信息检索工具的分类体系.江苏图书馆学报,2002(4):7-11

[5]王知津,肖洪.网络信息组织对传统信息组织的借鉴.图书馆工作与研究,2003(4):2-7

[6]董琳.网络信息分类组织的发展趋势与标准化.图书情报知识,2004(2):65-67

[7][12]陆宝益.论创建我国统一的网络信息分类法.中国图书馆学报,2004(6):44-47

[8]千忠红.网络信息环境下的传统分类法.图书情报工作,1999(2):37-39

[9]史学斌.网络信息分类体系.图书馆,2002(1):33-35,20

[10]郑庆胜,易晓阳.从新浪等网站看网络信息分类体系的建立.图书馆建设,2003(1):69-71

[11][23]吴丹.网络信息分类体系设计.图书情报知识,2002(5):37-39

[13]朱蓓玲.浅析构建网络信息分类体系.情报杂志,2004(8):110-111,114

[14]敬卿,吴静.网络分类目录规范化初探.图书馆,2002(1):49-50

[15]邓香莲.文献信息分类与网络信息分类之比较研究.情报资料工作,2002(6):43-45

[16]粟慧.以人为本的必然:人工检索语言向自然语言的转变.图书馆,2000(2):9-10

[17]张琪玉.网络信息检索用语言的发展趋势.图书馆杂志,2001(3):5-7

[18]梁树柏,高夕果.受控语言网民化的思考.情报杂志,2002(8):69-71

[19]陈晶.论网络环境下情报检索语言的发展.情报杂志,2002(6):54-55

[20]吕娟,袁相琴.论第四种情报检索语言系统.中国图书馆学报,2002(1):87-92

[21]焦玉英,李法运.网络环境下信息检索语言的优化研究.情报学报,2003(3):291-296

[24]许培扬,张玢.网络信息分类标准研究进展.医学情报工作,2002(6):324-326

[25]马张华,李玲.超文本技术在分类法编制中的应用.大学图书馆学报,2001(1):60-62,66

[26]陈旭.分面分类在网络资源组织中的应用.图书情报工作,2002(1):59-61

[27]周淑云.分类主题一体化构建网络信息分类体系.现代情报,2003(4):113-114

第3篇:信息分类标准范文

关键词:环境信息 信息分类 多维树状信息结构 球形网状信息结构

中图分类号:X5 文献标识码:A 文章编号:1674-098X(2015)10(b)-0192-02

环境信息,顾名思义是与环境有关的信息,但在学术上至今为止还没有统一的国际一致认可的定义。环境信息分类是环境信息标准化的重要基础,是环境信息化的关键环节之一。建立一个科学、规范、精简、高效、实用的环境信息体系,能够支持信息使用者用最简单、最短的时间获取最有价值的环境信息[1]。我国对环境信息分类已有一定的研究基础。当前环境信息分类方法比较直观、易于理解,便于内容的组织与归纳。然而,随着“智慧环保”“环保物联网”“移动互联网”的发展,环境信息内容不断扩大,此环境信息分类法忽略了各个类目点的数据内容交叉性,又切割了各个类目点之间的内在客观联系。该文在充分分析环境信息分类现状和环境信息的概念及发展特征的基础上,提出新型环境信息分类方法,为环境信息的高效利用提供新思路[2]。

1 研究方法

目前,环境信息分类采用的线分类法和面分类法;线分类法属于一维分类法,体现的是垂直方向上的概念逻辑关联;面分类法为二维分类法,体现的是水平方向上的概念逻辑关联。然而,环境是多因素的复杂系统,是一个多学科交叉融合的开放体系,环境系统内部体现的是交叉融合的多维逻辑关联[3]。

(1)多维树状信息结构。

该分类方法需满足以下条件:所有维度的总和所涵盖的内容能够构成完整的系统范畴和领域,每一个分类维度内涵必须是互相独立、无重复的。同时,需预留足够的类目,以保证新事物出现时不至于打乱已建立的分类体系和结构[4]。

系统中的每个子系统映射为信息空间的一个信息维,每一个信息维包括一颗以维度为根级的分类树,分类树包括若干子树,子树由相互独立的域构成,域是叶级分类。树、子树和域构成了该数据维下的二维分类结构[5]。

(2)球形网状信息结构。

球形网状信息结构则是结合树形数据结构基础上演变而来。构建步骤:

一是将信息按照树形结构分类。

二是调整每一个信息树及其分类的位置并旋转一定的角度、形成一个有边界的多边形整体效果,将所有的信息单元数据对象放在全集空间中考察。

三是对于实践中所生产的每一个信息单元,先根据信息的主要功能与价值确定其直接归属的栏目,用实线连接该信息单元和其宿主栏目。并考察信息单元与其他栏目的关联性,关联性强的用虚线连接,关联性弱的则不连接。

四是当所有的信息树分类和信息单元都在这个全集空间中标示出来时,再把该模型放到立体空间去观察,最后得到一个球形网状的结构模型。

2 结果与讨论

2.1 多维树状环境信息分类

环境信息除了要体现环境系统的丰富内涵,同时也要表达信息特征和时空特征。因此,环境信息的三个基本维度可视为:环境属性维、信息属性维和时空定位属性维。

(1)环境属性维。

环境是多因素的复杂系统,信息包括丰富的内涵。通过对环境政治活动和环境自然因素分析,结合我国用户对环境信息的需求,该文将环境属性维分为活动行为和环境要素。

活动行为,是按政府对环境监管进行分类,主要有环境管理、生态保护、污染防治、环境科研、公众参与和环境产业发展等。

环境要素,是按人类对环境的一般认识进行分类,主要有水、大气、生物、土壤、辐射、声和社会环境等。

(2)信息属性维。

信息属性说明环境信息的来源、信息内容及信息表现形式,该维度服务于信息的标准化技术操作。

环境信息来源,通过具体分析环境信息来源,采用相应的数据集成技术,可方便信息的自动化接收和存储。该文将环境信息来源分为:环保系统内部信息、跨部门共享信息、公共网络资源、公共科技资源等。

环境信息内容,根据对环境内涵的分析,环境信息内容可以分为科普知识、监测预警、行政审批、法律政策、新闻公告和科研成果等。

环境信息表现形式,根据信息表现的一般分类,该文环境信息表现形式分为文本、图表、声音、视频、地图等。

(3)时空定位属性维。

环境具有明显的时空特征,环境信息也需要反映时空特性,该文将时空定位维分为时间特征、时效特征和空间范围。

时间特征,按照环境信息关联的自然时间进行定位,该文将时间特征信息分为预测信息、当前信息和历史信息。

时效特征,按照环境信息接收到的时间效力进行定位,该文将时效特征分为实时信息、准实时信息、延迟信息等。

空间范围,按照环境信息关联的空间位置实现空间定位,该文将空间范围分为世界、全国、区域、流域、地方等。

2.2 球形网状环境信息分类

根据以上分类,环境信息树包括8类:活动行为、环境要素、信息来源、信息内容、表现形式、时间特征、时效特征和空间范围,将每个信息树按其分类旋转一定角度形成空间效果,将实践中的每一个信息单元与各个环境信息树进行关联,形成一个环境信息的球形网状结构。

2.3 结果讨论

该文所采用的多维树状信息分类法和球形网状结构的信息分类法,具有以下特点:

(1)多维树状信息分类法从环境属性维、信息属性维和时空定位属性维对环境信息进行分类,基本涵盖了环境及信息的所有内涵和特征,克服了现在以线、面混合分类法对于数据内容交叉性不强的缺陷,为环境信息分类提出新方向。

(2)球形网状结构的信息分类法是在多维树状信息结构的基础演变形成,增强了环境信息类别间的内存联系,使环境信息分类体系更富有组织性、有机性。

(3)同时,环境信息的多维分类及网状联结也为信息的存储和查询效率提出了更高的要求,要求更高性能的物理存储、更合理的数据库结构,以及更加高效的搜索技术。

3 结语

多维树状环境信息分类和球形网状环境信息分类是以环境信息的特征为基础,以信息高效利用需求为导向,提出的现代化新型环境信息分类方法,它克服了传统环境分类数据内容交叉性弱、内在客观联系不强等缺陷,是科学、规范、精简、高效、实用的环境信息体系构建的基础理论,为现代环境信息资源目录体系和环境信息资源中心的建设提供了新思路。该研究旨在抛砖引玉,希望更多学者进行探讨,为推动环境信息的综合有效利用以及环境信息化发展做出努力。

参考文献

[1] 关于在环境事物中获取信息、公众参与决策和司法救济的公约(奥胡斯公约).欧洲经济委员会环境政策委员会于1998年在“欧洲环境”第四次部长级会议[Z].

[2] 尹荣楼,李爱荣.环境信息分类编码标准化[J].环境科学研究,1994,7(2):39-43.

[3] 王健,甘国辉.多维农业信息分类体系[J].农业工程学报,2004,20(4):152-155.

第4篇:信息分类标准范文

关键词:知识管理 知识化监理 知识结构

信息工程监理是最近几年兴起的保障信息化建设质量的一种约束机制。它采用“五控两管一协调”的控制模式,对业主、承建单位的项目行为实施监督,保障信息化建设的质量,避免“豆腐渣”工程,起着不可或缺的重要作用。

一、信息化建设与知识管理

信息化建设是以知识管理为核心,信息资源为基础,提高组织核心竞争力为目的的全面整合或再造组织业务流程的过程。知识管理是获取、储存、学习、共享、创新知识的管理控制过程。在信息化建设中,企业、政府等组织通过知识管理,从现有的业务流程和数据中,挖掘、获取并确定各类知识资源,定位拥有专业知识、经验的个体,将个体的知识、经验、信息提升为组织的知识资源,有序传递、整合、规划和有效利用知识资源,有助于提高组织的整体业务、技术和管理水平。

在承建单位实施信息化建设中,知识管理是通过公司内雇员、部门、可能的跨国公司合作、与业主的沟通协调,传递、整合、有效利用本单位的知识资源,运用信息技术,通过设计最优技术方案、控制施工质量,共享和创造知识价值。

在信息化建设中,对组织内各种各类知识进行评估,挖掘、获取真正有用的知识。知识不仅仅是信息,是显性知识和隐性知识的集合。通过评估,区分知识和信息、知识管理和信息管理,以实现资源的充分开发与应用。

整合或再造业务流程,是与知识管理密切相关的。1990年美国管理专家Michael Hammer提出了“业务流程重组”(Business Process ReengineeringBPR)的概念,它是以用户需求为导向,信息化、知识化为基础,对用户的业务流程进行再思考、关键性的重新设计和根本的变革,从而获得在成本、质量、服务和速度等方面业绩的持续改善。在业务流程重组中,信息(知识)的获取、分类、存储、利用,只有与知识管理结合,才能够发挥更有效的作用。

知识管理技术贯穿于信息化建设始终,它与信息技术相辅相成。在知识获取、学习、共享、创新的过程中,整合各种信息技术,构建完整的知识管理体系,是知识经济时代信息技术的新发展。

二、信息资源规划和整合

信息资源整合(Information Resource Integrating, IRI)的前提是进行统一的信息资源规划(Information Resource Planning, IRP),消除“信息孤岛”,共享信息资源。信息资源的规划是实施信息化工程的基础,IRP的基础是建立信息资源管理基础标准,IRI的实质是通过信息技术改造、重建或重构数据环境。信息产业部的《信息系统工程监理暂行规定》中定义信息资源系统为“以信息技术为主要手段建立的信息资源采集、储存、处理的资源系统”。

在信息化建设中,信息资源规划是很重要的一环。在组织的生产、经营、服务活动中,会产生大量的数据、资料、指标、图纸、报表及其它显性资源,也存在各种各类的知识、拥有专业知识和经验的个体等隐性资源。信息资源规划是对实施信息化后产生、控制、使用这些资源进行识别和分类;评估、挖掘、获取、共享各类知识;对承载信息资源的信息基础设施进行分析、设计和指导。

(一)信息资源规划的主要任务

信息资源规划的任务是对支撑业务流程的逻辑相关的数据进行分类,建立具有结构化、标准化、一致性的共享数据库。分析业务流程重组后产生、控制和使用的数据,了解各种数据的内容、范围、可靠性等,理解数据的共享要求和应用策略以及数据使用中的问题,使信息资源规划能够满足数据资源的管理要求。

(二)信息资源管理标准

信息资源管理标准是指决定信息系统质量的、进行信息资源开发利用的基本标准。威廉·德雷尔1985年在其《数据管理》专著中总结了信息资源管理的基础标准———数据管理五项标准,内容如下:

1.数据元素标准。数据元素(Data Elements)是信息资源中最小的信息单位,是抽象的数据对象。它的质量是构建稳定的数据结构基础的关键。数据元素标准包括数据元素命名标准、标数据元素识标准和数据元素一致性标准。

2.信息分类编码标准。是信息标准中的基础标准。信息分类编码(Information Classifying and Coding)的对象,是一些最重要的数据元素,自动处理、检索、存储和传输信息的质量及效率与这些元素紧密相关。信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立一定的分类系统和排列顺序,便于管理和使用信息。信息编码就是在信息分类的基础上,将编码对象赋予有一定规律性的、易于计算机和人识别和处理的符号。信息分类编码工作要确定每个编码对象的编码规则、码表结构和代码表。

3.用户视图标准。用户视图(User View)是一些数据元素的集合,表示用户对信息需求和数据实体的最终解释。用户视图是数据的系统外在表现形式,是系统的输入、输出媒介和手段。用户视图与外部数据流是同一词,来自某个数据源或流向某个数据接收端的数据流。常用的用户视图有纸面的,如图纸、单证、表单、报表、账册等;有电子的,如屏幕格式等。

4.概念数据库标准。概念数据库(Conceptual Database)是用户对数据存储的最终解释。用户的信息需求,应首先界定概念数据库。概念数据库是综合信息资源用户的数据要求构成的全局数据库,表示数据库的整体数据组织状况和逻辑结构。

5.逻辑数据库标准。逻辑数据库(Logical Database)是系统分析设计人员的解释。在关系数据库模型中,逻辑数据库是一组规范化的基本表(Base Table),是从概念数据库中映射出的所需信息。逻辑数据库表示的是局部数据的数据库逻辑结构。

(三)信息资源规划方案

在定义数据管理标准的基础上,制定信息资源规划方案,为业务流程重组提供依据,为系统设计提供基础。

在信息资源规划中,将隐性资源转变为显性资源,有序传递、整合、规划和有效利用各类知识资源。因此,信息资源规划是资源的知识管理规划。信息技术的投资,可能不会给企业带来明显的效益,因为基于信息的竞争优势正在逐渐转变为基于知识管理的竞争优势,以信息资源规划为核心的信息系统规划,如果不实施知识管理,将不会产生显著的信息化效益。

(四)资源整合

第5篇:信息分类标准范文

我国政府信息化进程从20世纪80年代开始到现在已有20多年的时间。政府部门的信息资源建设和政府内网信息门户建设已具较大规模,但由于缺乏统一规划,造成了各部门应用系统的开发平台不同、操作系统不同,特别是数据库管理系统千差万别,各系统之间“不联不通”,从而形成了一个个“信息孤岛”。因此当前电子政务建设面临着两项任务,一项是政府信息资源整合、流程优化,建立有效的领导决策支持系统;另一项是提供周到、方便的公共服务能力,即构建电子服务型政府。

一、信息资源整合

在短期内建设完成电子服务型政府的困难是:我国目前电子政务物理网的基础设施和单项应用虽然很丰富,但是信息资源共享与交换能力不足,因此重视数据流分析和办公流程整合,搞好软件系统的顶层设计是电子政务建设必须经历的重要阶段。信息资源整合的三项内容:内容整合、数据整合、应用整合。

从总体上看,内容整合包括对分散异构信息资源体系的整合。首先,原则上是在兼顾信息资源现有配置与管理状况的条件下,实现无缝整合;其次,在新的信息交换与共享平台上,开发新的应用,实现信息资源的最大增值。

数据整合的关键是构建基础数据库和建立数据中心。基础数据库包括人口数据库、法人单位数据库、自然资源和空间地理数据库、宏观经济数据库和各地方特殊资源数据库等。其中数据中心的建立是电子政务的基石,是政府信息化的基础设施。

应用整合包括包含G2G、G2B、G2C和G2E(政府对公务员)等模式下的政务应用系统及协同工作与决策支持系统。

此外,电子政务标准规范体系和电子政务安全体系作为电子政务建设的核心内容,也不容忽视。

二、信息资源整合的难点

电子政务工程建设经过多年的开发和积累,政府各部门存在了大量的数据库,对这些现有数据库系统进行整合中遇到的难题主要有:

1.对现有分散异构的信息资源如何无缝接入。包括结构化数据资源的接入、非结构化数据的接入和应用软件系统的接入。

2.整合后信息系统的管理问题。现有信息资源的管理分为自上而下的管理、集中式管理、可控性自主管理、个性化管理和实时性管理等多种管理模式。信息资源整合后将实行分布式信息资源管理。如何实现物理上分散、逻辑上集中、应用上分散、管理与服务集中将是面临的主要难题。

3.如何满足新的需求。包括共享需求、交换需求、协同需求等。

4.支持不同用户的访问需求。包括支持不用授权的可控性访问、不同用户的个性化服务、支持单一性访问、支持实时性的应用需求。

三、信息资源整合方案

整合后的管理架构体系分5层,如图1所示。

该管理架构的优势是:

1.视图管理层中所有管理模块都提供与WebService的接口,易于实现分布部属,统一管理。

2.统一的资源目录层PKI和PMI中心层中的授权管理可以灵活定义用户类型和用户属性,从而可以方便地定义信息栏目下的不同条目或应用下的不同操作,灵活定制授权策略。支持第三方CA认证及其资源目录系统和第三方应用系统的集成。

3.组件封装层:涵盖了日常工作中用到的各种文件模版,并提供旧文件查询等功能。

4.软件层:提供各种办公应用软件及专用软件。

四、信息资源整合的成功案例

2005年全国电子政务建设步入新的发展阶段。以河北省电子政务“112”工程为例,该工程的重点是构建了统一的电子政务平台和12个应用系统。

1.统一的电子政务平台:公务内网、公务外网和信息交换系统

2.12个重点应用系统:办公及网上审批系统、财税和审计监管系统、社会保障信息系统、宏观经济信息系统、农业信息及服务系统、自然资源和基础地理信息系统、社区综合管理服务系统、人口基本信息管理系统、应急联动信息系统、公共卫生信息系统、信用信息服务系统、综合教育信息系统。

系统建设分三个阶段进行:

第一阶段(需求分析阶段):主要任务是业务梳理和用户视图及数据流分析。通过业务梳理和分析,按照信息工程方法论,建立起由职能域、业务过程、业务活动构成的业务模型;通过对报表、单证、帐册等用户视图的登记和拆分,得到所涉及的数据项及其分布情况;通过对数据流也就是用户视图流动的分析,得到业务与数据的关联关系,形成数据流程图。通过对输入、输出、存储等数据流的量化分析,得到对网络通信和数据存储设备的量化需求。

第二阶段(系统建模阶段):系统建模是需求分析的继续和定型,这一阶段的主要任务是建立系统的功能模型、数据模型和体系结构模型。在对需求分析阶段得到的业务过程、业务活动能否计算机化进行分析的基础上,将可计算机化的业务过程、业务活动用功能模块和程序模块表达出来,建立起功能模型,解决系统做什么的问题;通过对需求阶段得到的数据流程图、用户视图、数据项及其分布情况的进一步分析、分类和规范化,按业务主题和业务需要建立起由主题数据库、基本表、数据元素集构成的数据模型,解决系统信息如何组织的问题;通过对功能模型和数据模型关联关系的分析,建立起系统的体系结构模型,表达出子系统与主题数据库的关联情况以及各子系统的程序模块与基本表的关联情况,为共享数据库的创建与使用、数据分布分析和制定开发计划提供决策依据。

第三阶段(信息分类编码阶段):主要任务是数据元素规范化、信息分类编码和专项报告编制。利用数据元素规范化理论和方法,对基本表中的每一个数据元素进行分析、规范和一致性控制,数据模型也得到进一步完善;通过对数据元素内涵的分析,识别信息分类编码对象并进行适当分类,按照国际、国家、地方、企业的顺序,进行信息分类编码标准调研,对确需自己进行编码的对象,要制定编码规则、编制相应的代码表,并通过收集已有的编码标准,最终形成系统所需的完整的信息分类编码标准;在完成信息资源规划方案的基础上,通过对整个过程和成果的总结与提炼,分别形成流程优化、信息资源管理基础标准、数据交换标准、数据环境建设、投资分析等五个专项报告。

2005年4月29日,河北省电子政务“112”工程顺利通过国家信息化专家组的评审,开始在电子政务建设中发挥效用。

第6篇:信息分类标准范文

关键词:知识库;农业信息分类;mysql

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)32-7560-02

Abstract: Through the research on database technology and techniques for classification of agricultural information, designing the structure of agricultural technology database and developing the agricultural information acquisition system, provides the input interface for the agricultural knowledge acquisition. The design of agricultural database building a foundation for the developing of agricultural knowledge retrieval system. The practical application proves that, the agricultural knowledge database providing a good support for the development of agricultural information retrieval system.

Key word: knowledge database; agricultural information classification; mysql

新疆地域辽阔,农业、牧业生产较分散,特别是牧民生产生活地点不固定,农业科技人员很难进行定点科技服务。通过农业知识库建设,建立农业信息话务咨询中心,农牧民在田间地头通过为农服务热线即可咨询生产过程中遇到的各种问题,这将大大提高我区为农服务水平,及时帮助农户快速解决生产中遇到的各种问题,提高为农服务质量,促进我区农、林、牧、副、渔业快速发展。因此农业知识库的构建与实现是建立农业信息话务中心的迫切需求。

1 农业信息分类

农业知识库需要储存大量的农业数据,为了合理的构建农业知识库,需要研究农业信息科学的分类方法。经过调查研究、咨询相关专家以及查阅相关书籍,依据“农业信息分类标准草案”,我们将农业信息分为种植业及制品、渔业、畜牧业、农业生产资料、园林、农机械、植物病理、动物病理类,每个大类下面又分二级类别、三级类别、四级类别。以种植业及其制品为例,其二级类别又可分为粮食作物、经济作物、蔬菜、瓜果类、油类。二级类别下又设三级类别,以粮食作物为例其三级类别又可分为谷物,三级类别下又设四级类别,以谷物为例,其四级类别包括大麦、燕麦、荞麦、青稞等具体植物;经济作物的三级级类别又可分为油料、豆类、棉麻、糖类作物。油料的四级类别又分为花生、油菜、芥菜等植物;豆类的四级类别包括大豆、蚕豆、豌豆、等植物;棉、麻的四级类别包括棉花、细绒棉、木棉、野麻、剑麻等植物;糖类作物的四级类别包括甘蔗、甜菜。蔬菜的三级类别又可分为根菜类、茎菜类、叶菜类、花菜类、果菜类、种子类。根菜的四级类别分为萝卜、大头菜、牛蒡等植物;茎菜类的四级类别又分为马铃薯、菊芋、藕等植物;叶菜类的四级类别包括小白菜、菠菜、芹菜等植物;花菜类下面有花椰菜、青花菜、金针菜等植物;果菜类四级类别包括黄瓜、南瓜、苦瓜等植物;种菜类四级类别包括籽用西瓜、莲子、芡实;瓜果类三级类别包括瓜类、果类、坚果、干果。瓜类四级类别包括西瓜、甜瓜、哈密瓜等植物;果类下面有苹果、桃、石榴等植物;坚果、干果下面有按巴旦木、核桃、葡萄干等植物。油类又可分为食用油。食用油下面有花生油、豆油、菜籽油等。按照这样的方法将其余七类由大至小细分。

3 知识录入系统的设计与实现

知识库数据的获取主要包括三种途径,第一种途径是通过网络爬虫从相关农业网站抓取信息,然后分类导入知识库,第二种途径为人工录入已掌握的大量农业科技信息,第三种途径为用户检索过程中查询不到的关键词经客服人员搜索再次录入知识库,通过这三种途径不断丰富农业知识库,为方便人工录入,开发了农业知识库录入接口,开发技术采用jsp+servlet+strus,服务器使用fedora14.农业知识录入界面如图2。

在知识录入过程中,首先要选择所录农业科技知识所属一级类别、二级类别、三级类别和四级类别,然后在标题栏中输入农业知识标题,在内容栏中输入农业知识内容,点击提交即可。农业信息的分类不但利于数据的存储,而且为后期开发农业科技知识检索系统及用户个性信息定制提供了基础。

4 结束语

目前该知识库已设计完毕,数据录入工作正在进行,已录入农业科技知识3000余条,网络爬虫采集数据经分类入库350多万条,为农业知识检索系统提供了数据支持,起到了为农服务的目的。

参考文献:

[1] 李永可,李悦,陈燕红,等.农业知识检索系统的设计与实现[J].电脑知识与技术,2014,10(23):5449-5452.

[2] 李永可,张太红,冯向萍.中文农业网站多元线性回归识别研究[J].新疆农业大学学报,2011,34(5):442-446.

[3] 胡毅,刘波,方逵.农业知识库知识检索系统研究与实现[J].农机化研究,2013(6):13-18.

[4] 王玉娟.农业知识文本库检索系统关键技术研究[D].长沙:湖南农业大学,2012.

[5] 王斌.信息检索导论[M].北京:人民邮电出版社,2010.

[6] 王玉娟,方逵.农业知识库检索系统探索[J].宁夏农林科技.2012(4):24-27

[7] 罗武.农业知识库知识录入系统关键技术研究与实现[D].长沙:湖南农业大学,2011.

第7篇:信息分类标准范文

P键词:工程项目 WBS 计算机

一、WBS简介

Work Breakdown Structure(WBS)是一种全面系统的工程项目分析法,是项目管理的基础性工作。[1]它可以将庞大的工程分解为方便管理的工作包,这样可以增加对工程的费用、进度和质量控制的准确度。早在在上世纪七八十年代,就成为国际上进行工程项目管理的基本方法。

WBS是一个由软件、硬件、服务以及资料组成的以产品为中心的层次体系,它确定了整个项目工程的走向,对项目工程起到了决定作用。[2]WBS可以对需要进行研制或者生产的产品进行显示并且在最终的产品与工作单元之间建立起一座桥梁,在确定产品单元时起着至关重要的作用。WBS具体可以分为四类,分别为:纲要性WBS、项目纲要性WBS,合同WBS和项目WBS,它的建立必须遵守整体性、系统性和可追溯性的原则,这是WBS作为工程项目管理的要求。那么,为了实现这三项原则,在针对WBS进行设计时要特别注意结构、代码和报告这三要素的设计。

二、工作包模型

工作包是工作包模型的基本构成单元,而工作包又是在对项目进行分解后的结果上形成的。工作包模型的思路就是将工作包作为整个项目的具体控制对象,实现高效化管理。工期控制、费用控制等在项目进行中对各个单元的控制都可以成为工作包的控制对象,这样一来可以为整个工程提供一个完整准确的的信息。由于工作包的上述属性导致由其组成的层次结构体系在反映工程项目生产过程的同时还可以反映项目的内部联系和目标要求,进而支持项目控制的整个过程。

在工作包模型建立后,可以利用计算机数据库技术对整个工程项目进行集成化管理。工程项目的分类与编码关系到计算机在工程项目中充分发挥自身的功能,因此工作包的建立尤其重要。

如图一所示工作包模型:

图一:工作包模型

三、工程项目信息的分类体系

工程项目信息分类体系始于西方国家,经过几十年的发展演变已经形成了多个体系,其分类领域也逐渐扩大。[3]这一演变正是工程项目信息管理内容增加的写照。信息分类是建立WBS 的基础,因为不同的项目参与者有不同的理解,他们各自按照自身从事的行业来制定信息分类体系,这些体系势必会与信息分类体系对应的编码体系有所差别。这大大影响了项目参与者与各方的信息交流,为计算机技术在建筑业中的应用带来了不便。

在众多工程项目信息分类体系中,ISO集众家之所长提出了按照空间和工种的特性、设施种类、建筑材料等逐层分解的方法。这种方法目前应用最为广泛,具体分类标准如下:

1.设施:按照用途划分,比如房屋、道路、车站、厂房、大坝等。

2.空间:按照范围构成划分,比如招待所、公寓楼、娱乐区、办公楼、道路区等。

3.分部:按照设施的物理构成部分以及一定的功能性划分。比如外墙、供热系统、电力系统等。

4.工作段:按照工种特性来分,且必须小于分部。比如结构工程电气工程等。

5.建筑配件和材料:工程项目永久性的一部分,按照不同用途来进行分类。比如用于大坝观测、用于观测自动化系统信号传递等。

6.建筑辅助:在工程项目中国其临时作用且不构成永久性的部分,比如梯子、脚手架、设备等。

这个ISO技术报告框架是多国专家学者在对本国具体工程项目进行研究后得出的工程项目分类和编码体系。这种分类体系是在ISO技术报告上进行细分后产生的,使得层次更加清晰结构更见简单明了,更好的突出了重点,有利于对工程项目的整体控制且包括了所有的土木工程,适合WBS的编制。

四、工程项目信息编码的内容与方式

对项目分解体系进行编码是项目信息编码的主要内容,包括时间上、参与者(建设方、设计方、承包商等)建筑材料、建筑设备等有型资源的编码和项目文档的编码等。

编码可以采用字母和符号等多种方式来进行。比较常见的简单编码结构主要是树状结构,这种结构主要是指将下一级的编码进行汇总后形成上一级,是一个如树状的包含关系。这种编码方式虽然有利于信息的汇总但是这种分类方法缺陷很多,比如在扩展性上就受到了本身结构的限制。而比较复杂的编码方式有分面结构,就是指将编码分为不同的部分,然后对其进行结合形成完整的意义。这种结构相对于上述的树状结构扩展性更强。第三种编码方式是结合了前两种方式产生的,是指在保持树状结构的同时改善汇总方式,采取不同组合的方法增强扩展力度。

以上三种编码方式已经被广泛应用于各个国家或者地区的项目编码体系中,但是随着计算机应用技术水平的逐步提高,国际上比较认可的是第二种方式即分面结构。综上所述,不同的编码方式有不同的优点与缺点,应该根据具体情况具体分析,选择最佳的编码方式,保证项目的稳定性与兼容性。

五、结语

工程项目的建设必定会产生大量的数据,那么对数据进行有效的分析与整理就成为了项目管理的重点。为了满足工作包模型及数据结构建立的需要,应当对工程项目中产生的数据进行重点统计分析,利用计算机技术,综合整体的工程项目进行取舍,建立起工作包的关系模型。随后透过关系模型建立数据库模型就大大的降低了难度,更加快捷简单。计算据数据库是整个工程项目中应用计算机技术最为重要的部分,只有将工作包与计算机紧密结合才可能实现管理手段的飞跃。而将其结合的方式就是建立工作包,这样可以极大的提高项目管理效率,实现高效管理。这样可以使管理者更加灵活有效的组织调控项目计划,对整个项目在宏观上有足够的认识。除此之外,WBS的运用还可以对项目实施中的进度、费用等进行严格的控制,保证项目按照计在控制中实施,实现效率与质量的双赢。

参考文献:

[1]刘金星.改进的WBS方法在工程项目管理中的应用[J].建筑经济,2011(6):18-21

[2]王俊军.WBS方法在工程项目管理中的应用探讨[J].工程技术,2016(9):283-283

[3]张波.工程项目管理中WBS分解及实现的探讨[J].中国西部科技,2014(6):4-6

第8篇:信息分类标准范文

[关键词]Web3.0分众分类标签

[分类号]TP393 G254

随着互联网技术的迅猛发展,Web2.0以应用的开放性、信息传播的交互性、读写并存的表达方式、社会化的联合方式和便捷化的体验方式,使得越来越多的网民参与到互联网信息的创造及中。然而,随着信息量的快速增长,由此衍生的信息杂乱无章、信息的纯净度和可信度大大降低、搜索引擎精准度下降等问题相继出现在互联网用户面前,网民越来越期待及时准确地获得切合自身需求的信息和知识,以及便捷的互动交流和信息的协同共享。面对这一问题,网络模式急需更新换代,能够为用户提供一种更加高效、精确和个性化的互联网平台的Web3.0模式成为首选的解决方案。

1 Web3.0及其特征

Web3.0是新一代互联网应用的统称,它是建立在Web2.0的基础上,包含了Web2.0的所有特点,但同时为了让人们更好地利用网络资源,Web3.0提供了一种方便管理、方便查找信息资料,能够自己控制一切的全新的服务:网站内的信息可以直接和其他网站相关信息进行交互,能够对多家网站的信息进行整合使用,并能根据用户需求,智能化处理互联网海量信息的整合,最终聚合用户个性化的需求,同时实现真正意义上的互联互通。总之,相对于Web1.0的“浏览和下载”、Web2.0的“参与、展示和互动”,Web3.0的核心理念是“个性、精准和智能”。其主要特征表现如下:

1.1个性化信息聚合

Web3.0最大的特点在于信息的聚合以及提供个性化的信息服务,真正的Web3.0时代不仅仅是按照用户需求提供综合化服务,创建综合化服务平台,更关键的是,把散布在互联网上的各种信息点以及用户的需求点聚合和对接起来,提供基于用户偏好的个性化聚合服务。

1.2信息检索的高精准度

Web3.0在对于UGC(用户生产内容)筛选性过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到自己想要感兴趣的信息内容,避免了大量信息带来的搜索疲劳。

1.3搜索引擎的智能化

Web3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的智能平台。在这样的平台上,用户可用自然语言表达自己的查询意图,搜索引擎能够对查询进行解析,提取相关概念,组合查询表达式,从而返回准确的结果;甚至,用户可以提出完整的问题,通过搜索获得一些问题的解决方案。

1.4多种终端平台、跨网站和跨语言信息交互

Web3.0不仅能够实现不同网站间的信息交互,而且还能实现不同终端的兼容。通过互联网与通信的融合,用户可以用所有智能终端(固定电话、移动电话、PC、IPTV以及其他智能终端)轻松享受看得见、听得到、用得好、即时交互的信息服务。另外,Web3.0的智能翻译引擎突破了国家、语言的限制,使用户用自己的母语可以与全世界所有人进行交流,实现了更大范围内的信息交流与共享。

2 分众分类及其特征

分众分类(Folksonomy)是随着Web2.0而产生的新型网络信息分类法,也叫大众分类、社会分类、自由分类等,它就是由网络信息用户自发地为某类信息定义一组标签(Tag)进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。其实质就是以词为类,但其类目却是平面的、非等级的,它是用户用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果。

2.1分众分类的优势

与传统网络信息分类方法相比,分众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。分众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。其优势主要表现在:首先,分众分类的标签形成过程充分体现了其自由性,任何用户都可以自由选择自然语言语词来对感兴趣的资源进行标注,从而可以从多个维度来揭示信息内容;其次,分众分类具备实时性与适应性,用户可以随时对其阅读或创建的内容和主题创建标签,并立即保存下来,并被允许即时快速的进行标签用语的修改;第三,分众分类为用户提供了共享标签的功能,任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相近的内容。

2.2分众分类的局限

作为使用非控词汇的分众分类目前还存在一定的局限性,具体表现如下:

2.2.1标签的多样性 由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异,导致不同用户在标注同一信息时使用了不同的标签,但是系统却无法创建这些标签之间的联系。标签的多样性极大的影响系统的检全率。

2.2.2标签的模糊性 分众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。标签的模糊性使用户不得不花更多的时间和精力找到与检索标签相关的记录,因而影响到系统的检准率。

2.2.3标签的扁平化组织 分众分类的组织方式与传统的等级体系分类法组织方式不同,它是扁平化的,没有等级层次的划分。因此,系统无法识别各个标签之间的等级层次联系。一方面,这种由于标签缺乏等级控制造成的信息分散也必然影响了信息的检全率;另一方面,类目的平面非等级显示同样会隐藏一些有价值的信息。同时,信息越多利用标签直接找到相关信息就越困难。

2.2.4系统间的交互性很低 很多网络系统都具有标注资源和分享标签的能力,但是目前各个分众分类系统在语义表达和格式规范上并不一致,这不仅阻碍了各个系统之间的信息交互和软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的分众分类系统之间的交互性更低。

2.2.5标签问语义关系缺乏 分众分类是以高频标签作为类目的一种信息分类方法,其分类结构是平面的,标签间是平等关系,缺乏对标签间的层次体系关系、属性关系和其他的复杂语义关系的描述,而标签间语义关系的缺乏不仅影响到检索的精准度,更重要的是对智能化搜索带来诸多障碍。

3 Web3.0对分众分类的需求

Web3.0的基础是Web2.0,因而,分众分类也是Web3.0的一种主要的信息组织方式。但是目前分众分类所具有的上述局限性显然阻碍了Web3.0的核心理念――“精准、个性和智能”的真正实现,Web3.0的发展需求决定了分众分类的发展方向,因而,未来的分众分类还需要在以下几个方面进一步拓展。

3.1微内容的自由整合与过滤研究

微内容是Web3.0的基本信息单元,由于Web3.0同样具有草根性,其内容良莠不齐,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,因而首先需要对微内容进行筛选性的过滤研究。这部分的研究主要包括:研究分析用户的行为特征,寻找可信度高的微内容源;对微内容的价值进行判定,并按价值量的高低作不同处理;对垃圾信息进行有效过滤等等;其次,研究如何应用Mashup技术对用户生成的微内容进行整合,如何利用ONTO/RSS基础聚合技术对微内容进行有效聚合,从而使信息的特征性更加明显,为实现Web3.0的“个性化”打下基础。

3.2微内容的标准化与结构化研究

要实现Web3.0的跨平台、跨社区、跨语言的信息共享,需要对微内容进行标准化与结构化研究,提出一个通用的数据标准。这方面的研究主要包括微内容的拆分标准、属性选择、结构化表征、数据逻辑结构标准以及数据的存储结构标准等,其目的是使微信息之间实现互动,让Web完全可编程,从而满足复杂程序的需求,为信息在不同的应用平台之间的整合和传播提供支撑。目前,有关微内容的标准化和结构化的研究则仅限于企业网站的构建,如红门资讯在微内容的拆分、词义标准化和结构化等方面进行了深入的研究,其推出的公用信息平台已经实现了厂家信息、商家信息、品牌信息、文章信息等160多类信息平台间的自由互动。但目前整个IT行业中并没有一套完善的有关微内容的拆分、属性选择、结构化表示等方面的标准,这对实现整个互联网信息的无缝连接带来障碍。

3.3标注的规范控制研究

Web3.0核心理念之一是“精准”,而因为网络用户标注行为缺乏控制,导致标签的多样性、模糊性和随意性等缺点,进而影响到检索的精准度,因而需要对用户的标注行为进行规范性控制。主要研究包括:如何利用受控词表等对同义词、近义词、专有名词等进行限定,并构建规范的标引词库推荐用户使用;如何确定标签的含义以及标签间的关联,以帮助用户在创建标签时进行选择;如何利用后控手段对不断产生的大量标签进行筛选、融合和规范化处理,并将其与核心标签关联等等。其目的避免网络用户生产出各种错误的、无意义的、不规则的标签,从而提高标签系统的准确性、兼容性和开放性,以实现标签集合的移植与共享,促进不同网络信息系统对信息资源的协同组织。目前,国内外学者都对标签的规范控制研究显示出极大的兴趣,纷纷提出了多种规范标注行为,从而提高标签质量的解决措施,如有些网站在用户标注时提供一些规范词供用户选择,或对用户的标注结果进行词义转换等,但总的来说研究的系统性不够,其深度和广度都有待加深与拓宽,从而提高检索的“精准度”。

3.4标签的基本属性研究

标签是分众分类形成和使用的基础,也是分众分类类目体系的基本构成单元。标签指代并标示Web3.0环境中的各种微内容,通过查找标签能够检索到关联的微内容。因而,标签本身的相关属性决着信息检索的质量和效率,所以,需要对标签的特征、标签的价值判定(包括垃圾标签的处理)、标签使用量的分布规律、标签的赋予权、标签的翻译、标签库的构建等展开进一步的研究;同时,因为目前的标签比较侧重于横向关系的表达,而专业性、学术性信息的表达则需要纵向和横向两个方面的参照系,因而,如何加强纵向关系的表达,仍然有待于进一步研究。目前,对标签的特征、标签价值判定的相关研究比较多,而对标签使用量的分布规律、标签的赋予权、标签的翻译、标签库的构建等方面的研究相对较少。

3.5传统分类法与大众分类法的融合研究

分众分类是由网络用户的自发标引行为产生,尽管这在一定程度上体现了用户对知识分类的共性,但由于不同使用目的对信息的类分会使得相同的信息被划分在不同的类别中。这种平面胜的分类体系,既无法准确地表达出相关标签的层次,也难揭示出信息之间复杂的关系;另外,受大众浅层信息需求的误导,很多有价值的信息也容易被淹没。因而,分众分类的质量无法满足Web3.0检索精准度的需求。而传统分类法特别是文献分类法历史悠久,在一定程度上体现了知识分类的科学性。为此,应该将分众分类与传统分类法进行融合,以提高信息分类的质量和效率,如可先对选定范围内全部信息划分大类的基础上允许网络用户再进行知识细分。把众多的标签先按人为大类存放,既增强了标引一致性,又降低了平面非等级结构的标签所带来的检索难度。

3.6标签的聚类研究

由于分众分类允许用户使用不同的标签来标记相似的资源,但并不了解这些标签之间的关系,因而其内容检索机制受到严重的阻碍。为克服这一局限,有必要针对标签的统计学规律、标签间的共现分析、层次分析、标签与特定人和物的相关度、标签间的相似度比较等问题进行聚类分析,其目的是寻找相关标签群,从而形成立体的分类体系,并在此基础上展开标签关系库的构建研究。显然,这部分的研究有助于实现Web3.0的“精准”和“个性化信息聚合”。

3.7标签间的关联研究

Web3.0的特征之一是要让用户跨越不同的应用平台,并共享不同社区的信息资源,而这种信息的共享除了需要相关内容的标准化、结构化和规范化研究外,更重要的是通过标签的方式进行相互链接,现有的标签只能做到对站内的关键词进行关联,不同网站之间站信息没有形成真正的网络和关联,往往存在信息“孤岛”,常常要借助其他的搜索引擎,因而未来的研究应该着重予标签间关联的深化研究。一方面,研究同一网站中同一文本和不同文本间的所有标签之间的自动链接技术;另一方面,研究不同网站间标签的关联,从而在更大范围、更高层次上建立起词间关系网络,为实现Web3.0的“跨平台”信息交互打下基础。

3.8标签与本体的结合研究

本体是在语义网环境下为解决语义歧义、实现信息智能处理而提出的一种形式化描述的、共享的概念认知模型,它是对某一领域知识的规范化描述,不仅提供了概念明确的定义,而且揭示了概念问丰富的语义关系,使知识能够在人与人之间、人和系统之间以及各种异构系统之间进行广泛的共享和交流。显然,本体所具备的特性正好弥补了分众分类的许多不足,因而,需要充分挖掘标签间的语义关系,将标签与本体进行结合研究。具体研究包括:分析分众分类中用户、网络资源和标签三者之间的同现关系,对分众分类中的各种标签进行语义分析,研究标签之间的主题相关性,并给出这些标签间相互关系的明确定义,同时探讨如何基于标签的语义关系构建被标注对象之间的联系,并在标签中建立起概念层次,构建大众标注中各类标签词的本体,从而构成语义Web的基础,真正实现web3.0的“智能化”。目前,这方面的研究多集中在标签语义的提取、标签本体的构建等方面,并推出了多种语义标注平台。但是目前在大多数语义标注的过程中仍需要大量人工的辅助,标注平台的可用性、互用性、重用性和扩展性较差,需要进一步提高。

3.9用户兴趣模型构建研究

第9篇:信息分类标准范文

概念模型的作用

概念模型是对某一领域信息高度抽象化的静态描述,它包括类、类关联和类属性等模型基本元素的定义,是进一步细化应用系统模型的基础。

1994年,国际标准化组织第215技术委员会提出了“卫生信息建模框架”。该框架说明了信息模型应当是由概念模型到逻辑模型,最后细化到物理模型。2002年美国CDC在“公共卫生概念数据模型”一文中提出信息模型可划分为主题域模型、类关系模型、概念数据模型、逻辑数据模型、数据库设计模型和物理数据库模型,它们分别处于上、中、下三个层级,这种层级关系与ISO提出的层级结构一致,只是美国CDC的层级划分更加细致。

因此,概念模型是连接高层模型和低层模型的桥梁和纽带。对于一个具体信息的开发过程而言,上层模型在某个领域内是高度抽象和概括的,它们不涉及过多的细节,独立于具体的信息系统; 对整个领域的信息化建设都具有指导意义,它是信息标准化的基础。

公共卫生信息领域具有多领域跨学科的特点。概念模型提供了一个易于理解的公共卫生信息的整体框架,是公共卫生数据字典的基础框架。在概念模型的指导下,对公共卫生数据元的理解和应用变得更加方便和容易。因此,概念模型将为公共卫生信息系统的开发提供一个整体框架和数据应用指南。

在公共卫生信息领域内,该概念模型可以支持多个信息系统的开发,减少重复性工作,降低开发成本,加快系统的开发速度。在同一个概念模型指导下开发的多个系统间具有良好的一致性,同时也为系统间的数据交换与共享奠定良好基础。

概念模型的构建方法

对于一个具体系统而言,建立一个模型不是很困难,但建立一个抽象的元模型――概念模型则要困难得多。建立国家公共卫生概念模型需要经历从具体到抽象这样一个反复的过程。HL7(Health Level 7)推荐的建立概念模型的技术路线与方法是从用例分析到信息分析,最后到建立概念信息模型。

类、类关联、类属性和数据类型是概念模型的重要组成部分。概念模型中的类属性同样具有较高的抽象性和一般性,发现这些属性也需要经过从具体实例分析――领域信息分析――概念信息模型分析这样一个抽象与泛化的过程。

我国公共卫生信息概念模型的构建主要是通过以下步骤实现的:

1. 主题域的确定

信息是对于活动、活动关联方以及它们之间关系的抽象与描述。在公共卫生领域,参照美国CDC提出的公共卫生概念数据模型(PHCDM),将我国公共卫生划分为卫生相关活动、参与者、材料和位置4个主题域。其中卫生相关活动是卫生信息来源的主体,是四个主题域中最重要、最活跃的一个,而其余三个均为活动的关联方,位置说明活动发生的地点,参与者为活动的参与方如卫生服务的提供方或接受方,材料是活动中所涉及的物质,比如标本、菌株等等。这些构成了公共卫生信息概念模型的四个主题域。

2. 类

具有相同属性的同类事物、概念组成类。以上四个主题域各为一类,每个主题域下又可以分成若干主类。以卫生相关活动为例,结合我国公共卫生信息的分类框架,可以将卫生相关活动抽象为四个主类――疾病预防控制、公共卫生服务、公共卫生管理及卫生监督。

3. 类关联与属性设置

类之间存在一定的联系,称为类关联,其作用在于使不同的类形成一个完整、联系的结构。在公共卫生信息概念模型的建模中,主要涉及父子类关联,关系关联和参与关联三种类关联。

父子类关联指的是每个类(主类或子类)下面还可以根据实际划分为若干更小的类。上位类(通称为父类)与下位类(通称为子类)关联称为父子类关联。很显然,子类对于父类的属性有继承的关系。

关系关联描述的是在同一主类内部各个类或者是实例之间的关联关系,如疾病预防控制主类的不同活动之间(疫情暴发与检测之间)的关系。

参与关联则是指不同主类的类之间发生的关系。例如疫情监测类(属于卫生相关活动主题域的某个类)与调查者(属于参与者主题域的某个类),或者与标本(属于材料主题域中的某个类)之间存在参与的关系等。

属性是对类以及类关联所具有的特性的描述,是描述类的特征的元数据,改变属性的值可以改变类的行为和外观。概念模型类属性设置应遵循HL7 RIM所规范的属性格式及内容,在此基础上按照自身的需求精化、修饰属性,形成模型独特的属性。

4. 概念模型的建模技术与方法

首先是应用UML的用例分析方法进行业务分析。这是指对业务过程中所有参与元素的拆解、对比、描述、再定义与组合。然后在用例分析的基础上,进行泛化分析。即对各组成元素进行分析、判别、抽象,并归纳成不同的类。下图1为在卫生检测中的几个用例分析过程。图2为泛化与抽象过程。经过泛化与抽象,对卫生检测相关活动,可提炼出5个子类: 申请、受理、检测、报告、质量控制。用例分析与泛化是公共卫生信息概念模型建模的重要阶段和技术,要应用于公共卫生信息概念模型建模的全过程中。

公共卫生概念模型框架与内容

我国公共卫生信息的概念模型包括了4个主题域及35个类。其核心为4个主题域(卫生相关活动,参与者、材料及位置)。在模型的建立中,公共卫生相关活动主题域及各级子类的确定采用了公共卫生信息分类框架的结果。作为模型,还对其他3个主题域进行了详细的分类,并增加了关联类的内容及对于类属性描述的要求。在这里要区分信息分类与模型之间的关系及区别。信息分类框架关心的是对信息的分类,确定信息所在的位置以便用户存放、查找及使用,因此并不涉及对于主题域、类之间的关联以及类属性的描述。而建立模型的目的是为了理解信息,描述信息。理解信息包括了解信息的来源(借助于信息框架)及关联,描述信息包括对数据元这个信息的基本单元属性及关联的描述,以便在统一的规范下查询、使用信息。

概念模型的应用

概念模型可以辅助系统设计者分析所需要采集的数据及属性,建立相应的逻辑数据模型(Logical Data Model),从而规范信息系统的建设。下面以伤害监测为例说明模型的应用。