公务员期刊网 精选范文 诗句分类范文

诗句分类精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的诗句分类主题范文,仅供参考,欢迎阅读并收藏。

诗句分类

第1篇:诗句分类范文

以下的实例剖解,数据来自一个典型的中型超市:好佳(化名)。

好佳大约有2500个单品,分成数十个品类,每个品类下还有小类、单晶。其中饮料是好佳超市的重点品类,我们将以该品类数据为依据进行分析举例。为行文简洁,省略大部分数据列表。

饮料小类分析

利用EXCEL表格,将各个小类的“销售占比”和“SKU占比”列出来,很容易得到图1。

分析:

1.好佳超市饮料类销售的主体是碳酸饮料和果汁,占饮料销售额的61.95%,SKU数占饮料全体SKU的57.94%。

2.深入看:在两大销售主体中,碳酸饮料的销售效率较高,SKU数占全体饮料的18.69%,却带来了37.52%的销售额。相比之下,果汁销售效率略低,SKU占饮料总SKU的39.25%,只带来了24.43%的销售额。

3.水奶(果奶、钙奶等乳酸饮料)的SKU占比为15.89%,但销售只占饮料销售的10.9%,销售效率略低。但从数值上看,只有16个SKU对于水奶这个类别不是多了,而是少了。由于水奶的个性化需求特点明显,造成顾客可选择余地少,因此销售不高。

改进建议:

1.进一步提高果汁的单品销售效率,也就是提高单品在单位时间里的销售数量。当然这里没有提供各个小类的平均毛利率和供应商返利数据,如果某个小类的平均毛利率和返利水平不高,则可先不考虑销售效率。

2.对水奶等乳酸饮料的商品结构进行市场调研(如考察竞品店),内容包括商品的品种、价格、包装大小,找到热销的SKU,推动这一类别达到平均销售水平。

3.运动饮料毛利比较高,也是比较时尚的商品类别,只有在促销上下工夫,才能刺激销售。

改进紧迫度:

ABC分类分析

实际上,应该形成ABC分析的定期检查制度,但多数企业却疏于实施。

分析:

1.从图2可以看出,47.7%的SKU贡献了饮料总销售的80.2%(A类商品),73.9%的SKU则贡献了总销售的94.8%(A类及B类商品)。

2.而有26.2%的SKU只为超市带来了5.2%的销售收入(C类商品)。

3.饮料平均销售额为119.55,达到并超过平均销售额的SKU数为42,占饮料总SKU的39.25%。

改进建议:

1.报表中没有单品对应的库存数据,建议结合库存进一步分析,加强对贡献了80%销售的单品的库存管理,防止缺断货。而对只贡献了5%销售额的单品库存,要进行整顿,清理高库存商品,释放被占压的资金。

第2篇:诗句分类范文

关键词: 半监督; 图模型; 局部聚类; 自适应; 图像分类

中图分类号: TP391.41 文献标志码: A

0引言

图像分类是图像处理的一个非常重要的研究方向。目前在机器学习[1]领域有很多方法来解决图像分类问题,半监督学习(SemiSupervisedLearning,SSL)[2-3]是其中重要的一种。半监督学习通过标签数据和未知标签数据结合学习,利用大量的未标记样本和少量的标记样本来建立分类器,通过利用未标记样本中隐藏的数据信息来提高分类器性能 于图的半监督学习是目前半监督学习领域的一个主流方向。在当今研究领域中,已有很多方法[4-7],并在图像分类问题上取得了一定的效果。这类方法具有直观、可解释性,且分类能力比监督的分类方法强。该类算法建立在图论基础上[8-13],在图像分类中,基于图的半监督方法以图像中的像素点作为节点,像素点之间的空间距离作为边,将图像映射为一个无向加权图,通过构造图上目标函数来实现分类。线性近邻传递(LinearNeighborhoodPropagation,LNP)[5]作为基于图的半监督方法中的一种,计算复杂度为O(n3),其中n为样本个数。图像的大小直接影响计算复杂度的高低;同时,近邻参数k的选择是否恰当将会直接影响最终分类结果。近年来对LNP算法的改进大多都集中图的构造上,如何充分利用近邻信息来提高分类效果成为大家共同关注的问题[14-16]。本文则在LNP中引入局部聚类和自适应近邻选取思想来解决以上问题。局部聚类的目的是将相同类别的样本聚到一起,形成点簇集,从而大大减少建图时的顶点数目,带来计算上的优势。同时,对于每一个节点的近邻数目,采用测地距离和欧氏距离之间的关系来动态确定,达到提高分类精度的目的。最后通过LNP算法实现图像分类。实验结果验证了此方法的有效性和可行性,适于解决较大且复杂的图像分类问题。

从表1可看出:随着图像的增大,LNP分类算法运行时间将大大增加;虽然本文方法也是如此,但相对LNP来说,能够大大缩短运行时间,同时在分类结果上有更好的表现。从表1中可以发现,本文方法比LNP方法在正确率上均有所提高,horse230、horse252正确率提高比较大,而horse109、horse263的正确率上提高较小。这是因为在horse230、horse252中目标内部颜色信息、相似区域跳跃点较多,在手工标记样本时,并不能完全涵盖所有颜色信息。LNP分类时,在这些区域并不能取得很好的效果,而本文方法局部聚类时,得到至多包含一种标记点簇的点簇集,并且将其标记信息扩散到整个点簇内,形成建图的顶点集,这样能够去除跳跃点,保护目标内在结构信息。并且近邻参数k的自适应选择,能够更好地保护边缘,因此取得了更好的分类效果。而horse109、horse263图像简单,颜色信息较少,且目标与背景差异明显,因此正确率提高较小。使用quickshift局部聚类大大减少了建图时的顶点数目,降低了矩阵规模,在矩阵相乘求逆等运算中用时更少,提高了运算效率;同时,k的自适应选择,能够很好地保护图像内在结构和边缘,去除相邻相似区域的一些跳跃点,提高了分类正确率。这在图1中有更为直观的体现。

图1表示的是分别运用LNP方法及本文方法对表1中对应的8幅图像进行分类的结果。从图1可看出,本文方法在目标内部区域基本上可以正确分类,而边缘、背景与目标外观相似的地方会有错分,而LNP方法在目标内部、边缘以及背景均会出现明显的错分。特别地,在目标内部颜色信息较多、背景与目标相似信息较多的情况下,本文方法在边缘、背景以及目标内部均有更好的分类结果。因为本文方法在局部聚类时,得到的点簇作为建图时的顶点,这样能够去除局部区域的跳跃点,减少局部颜色信息;同时自适应选择近邻参数k,更好地保护图像内在结构以及边缘,得到更好的分类结果。这在图1中(d)和(f)的对比中可以清楚地看到。因此,实验结果表明,基于局部聚类的自适应LNP分类算法在分类正确率和运行时间上,均要明显优于LNP分类算法 于局部聚类的自适应LNP分类算法先进行局部聚类,形成点簇集,以点簇集为节点建立图模型,减小矩阵规模,大大降低运算时间。同时采用邻域信息来重构权值,更好地保护图像内部结构,并且使其自适应选择近邻数目;能够更好地保护边缘,达到提高分类效果的目的。

5结语

本文提出了一种基于局部聚类的自适应LNP图像分类方法。该方法首先通过局部quickshift算法将图像进行局部聚类,形成点簇集,然后以点簇集为节点建立图模型。通过将整个图模型裁剪成一个个局部线性小区域,而后将所有的局部线性区域重组来近似整个图模型,邻域数目的选择通过自适应算法实现。实验结果表明,与LNP分类算法相比,本文方法降低了计算复杂度,并且很好地保留了图像的内在结构信息以及边缘,使用更少的时间得到了较好的分类结果。

参考文献:

[1]ZHOUZH,WANGJ.Machinelearningandapplication[M].Beijing:TsinghuaUniversityPress,2007.(周志华,王珏.机器学习及其应用[M].北京:清华大学出版社,2007.)

[2]CHAPELLEO,SCHOLKOPFB,ZIENA.Semisupervisedlearning[M].Cambridge:TheMITPress,2006:237-273.

[3]ZHUXJ.Semisupervisedlearningliteraturesurvey[EB/OL].[20120805].http://pages.cs.wisc.edu/~jerryzhu/pub/ssl_survey.pdf.

[4]ZHOUD,BOUSQUETO,LALTN,etal.Learningwithlocalandglobalconsistency[C]//Proceedingsofthe2003AdvancesinNeuralInformationProcessingSystems.Cambridge,MA:MITPress,2004:321-328.

[5]WANGF,ZHANGC.Labelpropagationthroughlinearneighborhoods[J].IEEETransactionsonKnowledgeandDataEngineering,2008,20(1):55-67.

[6]BELKINM,NIYOGIP,SINDHWANIV.Manifoldregularization:ageometricframeworkforlearningfromlabeledandunlabeledexamples[J].JournalofMachineLearningResearch,2006,7(11):2399-2434.

[7]ZHUXJ,GHAHARMANIZ,LAFFERTYJ.SemisupervisedlearningusingGaussianfieldsandharmonicfunctions[C]//Proceedingsofthe20thInternationalConferenceonMachineLearning.Madison:AAAIPress,2003:912-919.

[8]YONGL.Manifoldregularizedmultitasklearningforsemisupervisedmultilabelimageclassification[J].IEEETransactionsonImageProcessing,2013,22(2):523-536.

[9]BIJRALAS,RATLIFFN,SREBRON.Semisupervisedlearningwithdensitybaseddistances[EB/OL].[20130101].http:///abs/1202.3702.

[10]GONGYC,CHENCL.Graphbasedsemisupervisedlearningwithmanifoldpreprocessingforimageclassification[C]//SMC2008:Proceedingsofthe2008IEEEInternationalConferenceonSystems,ManandCybernetics.Piscataway,NJ:IEEEPress,2008:391-395.

[11]LIUW,HEJF,CHANGSF.Largegraphconstructionforscalablesemisupervisedlearning[C]//Proceedingsofthe27thInternationalConferenceonMachineLearning.Haifa,Israel:[s.n.],2010:679-686.

[12]ZHUXJ.Semisupervisedlearningwithgraphs[D].Pittsburgh:CarnegieMellonUniversity,LanguageTechnologiesInstitute,SchoolofComputerScience,2005.

[13]GOMEZCHOVAL.Meanmapkernelmethodsforsemisupervisedcloudclassification[J].IEEETransactionsonGeoscienceandRemoteSensing,2010,48(1):207-220.

[14]ZHANHR.Researchongraphbasedsemisupervisedlearning[D].Wuhan:HuazhongUniversityofScienceandTechnology,2009.

[15]WULX.Researchandimplementationoftimeseriesclassificationbasedonsemisupervisedlearning[D].Dalian:DalianUniversityofTechnology,2011.

[16]XUPP.LNPbasedsemisupervisedlearningalgorithms[D].Xian:XidianUniversity,2009.

[17]VEDALDIA,SOATTOS.Quickshiftandkernelmethodsformodeseeking[J].ECCV2008:Proceedingsofthe10thEuropeanConferenceonComputerVision,Marseille,LNCS5305.Berlin:SpringerVerlag,2008:705-718.

[18]COMANICIUD,MEERP,MEMBERS.Meanshift:arobustapproachtowardfeaturespaceanalysis[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2002,24(5):603-619.

[19]HAOJB.Researchongraphbasedsemisupervisedlearningmodelandclassifierdesign[D].Hefei:UniversityofScienceandTechnologyofChina,2009.

[20]TENENBAUMJB,deSILVAV,LANGFORDJC.Aglobalgeometricframeworkfornonlineardimensionalityreduction[J].Science,2000,290(5500):2319-2323.

[21]BELKINM,NIYOGIP.Laplacianeigenmapsandspectraltechniquesforembeddingandclustering[C]//Proceedingsofthe2002AdvancesinNeuralInformationProcessingSystems.Cambridge,MA:MITPress,2001:585-591.

[22]GOLUBGH,vanLOANCF.Matrixcomputations[M].3rded.London:TheJohnsHopkinsUniversityPress,1996.

第3篇:诗句分类范文

关键词:时评论据;日常累积型论据;调查研究型论据;文献研究

中图分类号:G210 文献标识码:A 文章编码:1672-8122(2014)06-0047-03

时评论据的分类,新闻界通常是在本体视域内进行考察,即按照表述事实还是表述客观规律,把论据分为事实性论据和理论性论据[1]。这种分类方式几乎“统治”了所有关于论据的研究。这种分类方式界定清晰、科学合理,有助于研究者和受众对论据的辨析。但是,评论者在实践中往往更需要查寻、选择论据而不是辨别论据,因此这种分类方式对于评论者的实务操作帮助有限。

本文笔者认为,时评的论据分类还需要从主体视域出发,即从评论者获取论据的过程和途径着手。本文按照评论主体获取论据途径的不同,把论据分为日常累积型论据和调查研究型论据。日常累积型论据是指评论者通过日常学习、生活的经历所积累的认识或知识;调查研究型论据是指评论者通过调查研究所获得的与论题相关的事实和认识。这种分类方式可以促使评论者重视调查采访的作用,并以研究型思维来查找论据,更好地适应时展的需要。

一、日常累积型论据

日常累积型论据包括评论者个人生活经历、评论者通过长期的阅读学习所获得的理论修养和知识储备、评论者关注新闻时事所获得的较新的新闻事实、评论者通过广泛的人脉资源所获得的重要资料等。

生活积累和个人经历是人们直接获得的阅历和体验。人们碰到的具体事件、所处的情境、与只是听到的或看到的相比,更加真实、更富有意义,感受也最深刻。它往往是典型的、独特的、生动的、专业的、或有戏剧性效果的,容易吸引人和打动人,通常也是真实的(除非评论者有意造假),因此是极为珍贵的论据,对评论者至关重要。如现《纽约时报》专栏评论家克里斯托弗,生活阅历非常丰富:哈佛毕业后在牛津大学学习法律,获奖学金并以一流成绩毕业。随后,他在开罗学过阿拉伯语,在台北学过汉语。在学生时代,他就成为背包客,游历过非洲和亚洲,以写文章来贴补旅行开支。他曾在四个大洲居住过,报道过六个大洲的新闻;旅行超过150个国家;到过美国的50个州、中国的每一个省、日本的所有重要岛屿。在旅行过程中,他遇到过疟疾、暴乱,在非洲遇到过空难。这样丰富的阅历,对他的专栏写作大有帮助。另外,他的妻子为华裔,并且本人多次来到中国调研,这使他对中国问题相当熟稔,在写作相关论题时驾轻就熟。

学习和阅读也是人们知识积累的重要方式。许多时评作者都有学者身份或背景,在某些领域中有精深的研究。如著名学者李敖博闻强记,著作等身。他深厚的学术积淀可说是他评论成功的最大因素。在《李敖有话说》中,他讲到一个观点,就能拿出一本书来,找到出处;对历史上的事件案例,如数家珍,信手拈来,令人叹为观止。

日常累积型论据具有以下特点:一是使用方便,可以灵活运用。日常累积型论据多数已经“内化”进入评论者的知识体系,如同一个随调随取的图书馆。评论者面对时评论题时,可以在最短的时间迅捷地把累积型论据调动出来。这是调查研究型论据所无法替代的。二是日常累积型论据的收集重在日常积累,表现出鲜明的渐进性。三是日常累积型论据依赖评论者的个人兴趣和关注点。评论者因为生活经历的不同,其所掌握的各种事实信息及理论储备会有较大差异。评论者有可能凭借独特资源或特殊经历获得非常有价值的论据,这些论据会增加评论的知识含量,甚至成为评论作品成功的决定性因素。

二、调查研究型论据

传统的评论研究注重评论者知识的积累,强调日积月累之功,这是非常必要的。但是,时评自身的发展、多领域的渗透以及多元化的论题,决定了评论者必须拥有“取之不尽,用之不竭”的资料。这个功夫,不是光凭个人积累和脑筋的记忆力可以完成的,必须利用科学的方法,对论题进行调查研究,更有效率地发现并寻找到与论题相关的论据。

如果把调查研究型论据进一步细分,可以分为一手论据和二手论据。一手论据是那些在新闻事件发生或调查时所产生的资料,主要来自评论者的亲身调查。包括采访资料、现场照片、影像纪录、广播录音、证人证词等。二手论据是与新闻事件或所论现象相关的、他人制作的资料,主要来自评论者的文献研究。包括关于某个新闻事件、人物或社会现象的书籍、论文、网页、文件,由他人记述实际见闻所做的访问或传记等。

通过亲身来到新闻发生地进行采访,从而获得一手论据,这是西方评论者已经习以为常的做法。如美国学者芬克所说,这样做可以为评论提供“附加值”[2]。仍以《纽约时报》专栏评论家克里斯托弗为例。他不仅生活阅历丰富,还多次在重大事件中获得直接采访机会。2011年2月,埃及和巴林发生动荡。他先是来到新闻事件的中心――埃及开罗的塔拉广场采访,撰写了专栏评论并发回了现场照片;随后,他来到另一个新闻事件中心巴林进行采访,撰写了专栏评论《在巴林,子弹在飞》(In Bahrain, the Bullets Fly)。2011年8月,利比亚局势动荡之际,他又来到的黎波里采访并撰写了专栏评论。这些采访虽然未必能保证其评论的公正客观,但至少可以为他的写作提供丰富的一手资料,同时向受众暗示:他在这个问题上更有发言权。

与此相比,国内的媒体评论员鲜有采访机会。多位学者提出应给予评论员采访机会或建立相应机制保证评论员获得一手论据。如赵振宇教授提出应建立新形势下的评论记者工作机制,即融记者和评论员于一体,由评论记者完成对新闻事实的采制和评论的写作[3]。这一问题已引起国内评论界的关注并有所行动。

对于国内的评论者来说,即使没有采访机会,进行一些调查也会为评论提供一手资料。如2010年8月间,有媒体对国内某旅游景点门票价格上涨提出批评,提出“埃及金字塔对本国人只收相当于人民币1.3元的门票”。媒体人高明勇对此感到怀疑,他通过网络搜索、致电旅行社和埃及驻华大使馆,查明这个论据与事实不符:埃及本国国民进入金字塔景区的费用约合人民币75元左右[4]。作者的评论正因为使用了调查结果作论据,才使事实更清楚,受众也会更加认同。

二手论据多来自文献研究。这一研究方式在现代时评写作中越来越重要。如学者李希光所说,评论者需要具备“深入文献研究的能力”。每个人的知识结构都有一定的局限性,即使是专业领域,也并非样样精通。评论者应有研究能力,在评论中综合运用新获得的知识[5]。时评的论题领域遍及社会各个层面,评论者不可能全部知晓;评论者再勤奋,对于一些专业性较强的领域,也很难有深厚的积累。现实的应对之策是:评论者除了要知识渊博、博闻强记、勤于积累之外,应树立一种研究思路,广泛吸收前人智慧,在此基础上立论和论证。

现代大型媒体,一般都会拥有一个规模宏大的资料室,帮助记者编辑和评论员查找资料,以协助完成报道和评论任务。随着网络时代的来临,专业知识的搜索相对容易,这为评论者寻找论据提供了方便,当然也提出了新的挑战。《科学》杂志2011年的一项研究表明,互联网已经成为一种人与外部的交互记忆,信息被存储在自身之外,人们更多的是记住信息的位置,而不是记住信息本身,被称之为Google效应[6]。换句话说,评论者本人未必要拥有太多的论据资料,但是,必须知道到哪里能够获得这些资料。

时评中的二手论据具有以下三个特点:一是信息总量丰富。在知识爆炸的年代,各种信息和数据形成信息的海洋,任何专业领域、相关话题都隐藏其中,真正可谓“取之不竭,用之不尽”。二是查找不易。这些有效信息分散在图书馆、资料库和互联网的各个角落,如何迅速有效地把它们找出来,需要评论者掌握搜索技术,也需要有一定的耐心和毅力。三是二手论据一般来说属于公共信息,人人皆可获取。评论者使用二手论据的优势不在于其独特性,而在于对它们的理解和整合,即评论者是否可以在短时间内将研究文献融会贯通。这对评论者的研究能力提出了较高要求。

三、研究论据的查找

通过文献研究获得论据,需要评论者通过科学、认真的查找来获得前人关于所要评论论题的论述,如书籍、论文、研究报告、统计数据等,要求评论者具有一定的研究能力。

(一)研究论据的资源

在知识爆炸的网络时代,时评作者可以获得研究论据的信息资源众多,主要包括以下几种:

1.图书馆资源

在可能的情况下,评论者可以通过《中国图书资料分类法》在图书馆中找到与论题相关的书籍。通过网络,也可以访问各图书馆的联机公共检索目录(Online Public Catalog,简称OPAC)。只需登录图书馆网站,进入“联机公共书目查询”或“馆藏书目数据库检索”即可查询图书馆藏书。

2.互联网资源

在搜索引擎的强大威力下,互联网可以快速地为查询者提供大量的信息。但是有优势有时候也是劣势。由于互联网信息来源庞杂,正式与非正式信息及其交叉渠道共存,信息缺乏有效的组织管理,因此在甄别信息有效性方面给检索者带来很大的挑战。

除了提高网络素养和熟练使用搜索引擎之外,评论者要尽可能熟悉所评论的领域的网络资源。如通过中国政府网页(http:///govinfo/)链接到各政府部门网站,可检索到大量的有关信息;通过国家统计局网站(http://)可以获取各年、月社会经济指标等统计数据等;通过新华网等新闻媒体网站可以获取免费新闻信息及各领域动态信息。评论者还可以通过搜索引擎查找专题信息,如中文的百度、搜狗,英文的Yahoo、Alta、Vista、Deja News,专业的Google Scholar、Philes、medscape等[8]。

3.专业学术数据库资源

相比互联网上资料的良莠不齐,专业学术数据库汇集了许多有价值的资料,这些资料难以在互联网上被检测到。这些数据库的用户为了获得服务必须支付一定的费用。现在一些教育研究机构可以向社会提供服务,如中国国家图书馆(http:///)就向社会公开了大量资源,只要办理读者卡(免费)的用户,登录后就可接触大量中外文数据库并在线阅读一些学术著作、学位论文和期刊论文。

如中国知网提供了丰富的知识信息资源,使用最为广泛。中国知网数据库包括中国期刊全文数据库、中国博士学位论文全文数据库、中国优秀硕士论文全文数据库、中国重要报纸全文数据库、中国重要会议论文全文数据库等,可以对海量数据进行简单或高级检索。

一些国外数据库也包含着重要的信息资源。较为优秀的英文数据库有EBSCO、PROQUEST、SAGE数据库等。EBSCO数据库经管类的文献比较全,多为权威期刊,且大多能查到全文。PROQUEST系列(尤其是ABI和ARL)是非常好的数据库,特点是比较全面,期刊追溯时间长,但有时只有题录,没有原文。SAGE数据库涉及商业、人文科学、社会科学、自然科学、医药学等学科,同时包括特殊学科研究的数据库等内容。

(二)研究文献的查找策略

对于时评来说,研究文献的查找受到其文体写作特点的限制,有一定的特殊要求,主要包括:1.时间要求。时评受时效性要求,需要尽快查找到相关信息,不能如学术研究那样“慢工出细活”。2.通俗性要求。时评属于大众性文体,因此不能使用过于专业化的词汇,这就要求评论者尽快“消化”这些文献资料,使之通俗化,方便受众接受。3.确定性要求。时评要求论点鲜明,以期得到具有确定性的观点信息。评论者不需要对学术争议过分涉及,应避免在信息海洋中迷失,使自己的观点犹疑不定。

结合时评的文体特点,评论者在做文献研究时应尽量做到以下几点:

一是瞄准新文献资源。较新的文献资源如果是事实性论据,一般是比较新颖的事实,往往引用者比较少,可以增加论据的新鲜性;如果是理论性论据,新文献较多反映理论前沿,理论价值较高。而且新文献中新观点较多,适应时评“求新”的特点。

二是瞄准权威文献资源。限于时间要求,评论者应选取比较经典和最有权威性的文献来进行精读。学术研究尽管论著多多,但真正很有价值的往往是少数。应通过筛选,尽量保留权威文献,剔除档次低的文献。在选择时可以有意识选择那些较有信誉的期刊所发表的文章,或者由该领域的权威作者所著的文献,也可以咨询相关领域专家或图书馆员。

三是文献阅读在精不在多。大批的文献只需要研读其摘要及关键词。经过筛选后,选择少数文献阅读全文。如果有可能的话,找到权威的综述性或述评性文献,可以帮助评论者更快地了解这个论题的研究发展及现状。

四是评论者需要从资料中得出自己的见解和观点。评论者不能局限于介绍他人观点和研究成果,还要对各种论据进行恰当而中肯的评价,并依据这些论据做出自己的判断。时评不仅在于“述”,要点在于“评”,要根据论据得出自己的主要观点、结论、存在问题、发展趋势,并提出自己的意见。

综上所述,从主体视域出发,时评作者在准备论据时应做到“一体两翼”:即既要注重日常生活的深厚积累,也要具备强大的采访和文献研究能力。一方面,日常积累可以增加评论者的知识底蕴,为可能的调查研究提供帮助。评论者对议题的了解越多,知识积累越多,就越能够得心应手地开展采访和研究;另一方面,通过调查研究可以增加评论者的知识广度,使评论者能够扩大评论面,增加评论的附加值,开阔知识视野。评论者通过采访和文献研究所得到的知识,必将进一步沉淀为评论者的日常积累,增加对议题的理解,为未来的评论实践所用,从而形成良性循环,让评论者保持知识积累上的“开放状态”。

参考文献:

[1] 丁法章.当代新闻评论教程[M].上海:复旦大学出版社,2012.

[2] (美)康拉德芬克著.柳珊,顾振凯,郝瑞译.冲击力―新闻评论写作教程[M].北京:新华出版社,2002.

[3] 赵振宇.现代新闻评论[M].武汉:武汉大学出版社,2009.

[4] 高明勇.埃及金字塔门票真的才1.3元吗?[N].新华每日电讯,2010-8-31.

[5] 李希光,孙静惟,王晶.新闻采访与写作教程[M].北京:清华大学出版社,2011.

第4篇:诗句分类范文

[关键词]系统聚类Q型因子分析生活质量

1引言

居民生活的改善提高不只是体现在物质生活上,还需要物质、文化等方面的协调发展。广东省经济发展一直走在全国前列,虽然广东各城市的经济发展程度可能有所差异,但各市的生活质量情况,不能只从经济发展程度进行描述。因此,需要依據广东省的情况提出有效的城市人口生活质量水平的分类评定方法,一方面,可以给个人家庭提供生活方式改善的建议;另一方面,能给政府部门制定政策、资金投放提供建议。生活质量水平的提高,体现了以人为本的科学发展观思想,有助于推动社会发展,推进实现全面小康社会。

针对城市居民生活质量评价,国内很多作者应用了成熟的方法。张亮[1]的安徽城市居民生活质量评价分析中,从经济、社会、环境三方面进行指标选取;秦岭[2]的人口生活质量水平综合评价中,更具体地从物质生活、社会环境、生态环境、精神生活四部分筛选;孙峰华[3]的中国省会城市人口生活质量评价研究中将要素划分为空间与非空间。上述研究选取的指标内涵丰富,但是多以经济、环境为主。所以,对于人口生活质量评价,本文选取的指标更侧向于居民生活方面以及精神文化方面,同时在经济方面融入房地产的潜在影响,考虑房价对居民生活质量影响。

2指标选取及数据预处理

生活质量是以生活水平为基础,同时衡量人的精神文化等高级需求的满足程度以及对环境状况的评价。因此,本文从经济基础、环境状况、社会基建、居民生活进行考虑,选取广东省21个城市2015年的地区生产总值()、竣工房屋价值()、常住居民人均收入()、常住居民人均消费支出()、邮电业务总量()、城市公共交通车辆标准运营数()、餐饮业营业额()、城乡基本养老保险基金征缴额()、失业保险基金征缴额()、卫生技术人员数()、人均公园绿地面积()、城镇生活垃圾无害化处理率()、城镇污水处理率()、财政在教育方面的预算支出()、研究与开发机构科技经费支出()旅游业营业额()、和人口密度()作为研究指标,考虑到数据的实效性、可得性及准确性,本文数据均取自2016年《广东省统计年鉴》。

由于选取的指标原始数据单位不一致,为消除量纲影响,需要对数据进行标准化预处理。本文将采用Z-score标准化方法。

3城市生活质量等级分类

聚类分析能科学有效地反映客观事物的内在差别和联系,反映各类事物之间的差异,因此,本文将采用实践中被广泛运用的系统聚类方法,对广东省21个城市的居民生活质量状况进行划分。

系统聚类的基本思想是:先将每个样品各自看成一类,然后规定样品间距离以及各类之间的距离后,选择当中距离最小的一对合并成新的一类,接着计算新类与其他类之间的距离,再将距离最近的两类合并。每次减少一类,直至所有样品合为一类。

本文采用人们普遍接受的直观距离描述——欧氏距离,度量样品间距离;类之间的距离,采用基于方差分析方法的分类效果较好的Wald最小方差法。应用SAS软件进行数据处理,所得结果见聚类结果树状图及聚类历史结果(因结果表格篇幅过长,下表只取前5类。)

根据聚类结果,由半偏统计量,可以发现n=1及n=2时统计量最大,说明这两步合并效果不合理,应采取上一步的分类,因此,合并为2或3类比较合适。由伪F统计量,在n=3时,统计量出现了局部增大,因此,分成3类比较合适。

综上,通过观察分析,可以认为,将21个城市分为3类比较合适,分别为广州、深圳;东莞、佛山、惠州、中山、珠海;潮州、揭阳、云浮、河源、茂名、湛江、清远、汕尾、阳江、韶关、肇庆、江门、梅州、汕头。

4城市生活质量差异

为分析广东省21个城市的人口生活质量差异,本文采用多元统计中的Q型因子分析方法,多角度剖析城市人口生活质量差异的共有原因,针对问题给出合理的改进建议。因子分析是研究从变量群中提取共性因子的统计技术,它可以从许多变量中,找出隐藏的具有代表性的因子。

根据计算结果,三个特征值累计方差贡献比率达到90.697%。因此,根据主成分法,可以选取三个公共因子。

由于因子载荷矩阵并不是唯一的,为更好确定因子的实际内容,对因子进行适当的旋转,使因子载荷矩阵的结构更加清楚,使每一个变量F尽量只负荷在一个因子上。本文采用方差最大正交旋转,旨在尽量使得任一个变量只在一个因子上有高贡献率,在其它因子上的载荷几乎为0,或任一因子只在少数变量上有高载荷,而在其它变量上的载荷几乎为0。因子旋转后的特征结果如上表2,因子载荷矩阵如下表3。

根据因子载荷矩阵,可以按公共因子将指标分为三类。第一类F1包含人口密度、城乡基本养老保险基金征缴额、失业保险基金征缴额、城市公共交通车辆标准运营数、邮电业务总量、地区生产总值、财政在教育方面的预算支出、常住居民人均消费支出、常住居民人均收入、餐饮业营业额,反映了居民生活的经济基础以及基本的社会生活状况,相当于居民生活质量的基础评定。

第二类F2包含研究与开发机构科技经费支出、旅游业营业额、卫生技术人员数、竣工房屋价值,这是可以反映居民生活质量提高程度的因子。科学是第一生产力。一个城市是否有源源不断的发展动力,很大程度上取决于该市的科技发展。只有不断的创新,居民的生活质量才能不断地提升。其次,文化产业的崛起,也能反映居民生活质量的提升。再者,居高不下的房地产,实际上增加了居民的生活负担,对居民生活质量的提升起到一定阻碍作用。综合起来,第二类因子能够反映城市当前居民生活质量的提高高度。

第三类F3包含城镇生活垃圾无害化处理率、城镇污水处理率、人均公园绿地面积,反映了居民的环境生活,其中的生活垃圾和污水处理刻画了居民在生活上产生的污染,即生活成本,越低的损耗,可以从侧面反映生活质量的改善提高

根据所得的公共因子及其因子载荷,根据回归分析法,可以计算各城市在三个公共因子上的得分,具体计算方法如下:

为了综合21个城市的人口生活质量情况,本文采取方差贡献率占比作为权重,计算出它们的综合得分。下表仅选取每类城市中的一个代表(结果保留三位有效数字)。

5结果分析

结合聚类和因子分析的结果,本文可将广东省21个城市分为三个不同生活质量水平类型,依据他们改进方向分为:环境型、创新型、物质型。

广州、深圳属于环境型,它们在F1、F2上得分较高,说明该类城市注重经济和社会发展,人民生活基础较高,同时,注意经济发展的可持续性,着力提高城市科技创新能力。然而,在居民生活环境方面,该类城市得分处在中等水平,这意味着,尽管该类城市人民生活基础较高,但仍有一定提升空间,在对生活废弃物处理方面,仍需改进。建议该类城市均衡发展,找到经济发展与环境保护的平衡点,推进环保措施的落地实行。

中山等五个城市属于创新型,它们在F3上得分较高,在F1上得分仅次于环境型城市,说明该类城市人民生活基础较好,且注重居民生活环境的保护。然而,该类城市在F2上得分较低,说明该类城市在科技创新方面的投入不够,导致其经济实力仍与环境型城市存在差距,需注意经济发展模式。建议该类城市加大科技创新、文化发展产业的投入,注重发展的可持续性。

韶关等14个城市属于物质型,这些城市在三个公共因子上的得分普遍不太理想,它们仅在F2上差强人意,这说明该类城市人民生活基础、生活质量相对较低,因此该类城市的人民生活质量有较大改善空间,但与此同时,该类城市注重科技发展,相信假以时日,该类城市的人民生活水平将会有较大幅度的提升。建议该类城市加快经济发展,大力发展多元经济,激发经济发展活力,同时坚持原有教育、科技发展。

参考文献: 

[1]张亮,赵雪雁,张胜武,李定,侯彩霞. 安徽城市居民生活质量评价及其空间格局分析[J]. 经济地理,2014,(04):84-90. 

[2]秦嶺,宋丽敏. 人口生活质量水平综合评价[J].市场与人口分析,2004,(06):37-40. 

[3]孙峰华,魏晓,王兴中,邵举平. 中国省会城市人口生活质量评价研究[J].中国人口科学,2005,(01):69-75+98. 

第5篇:诗句分类范文

关键词:森林分类经营;必要性;具体措施

1 林场实行森林分类经营的必要性

1.1 实行森林分类经营可使商品林真正走向市场

我国的林业是粗放型经济的代表,在长期的经营过程中,林业的生产周期一般较长,很难在较短的时期内见效,产出投入比例不高,不能保证正常的投资回报等因素影响,无法吸引到充足的资金投入,导致林业在低端产业中循环。受我国长期计划经济体制的影响,林业的生产经营部门没有自主的经营权和决策权,在当前的市场经济条件下,林业的生产经营没有根据市场的规律运行,无法在市场经济中进行优胜劣汰的竞争,导致林业不能完全的走向市场。

进行森林分类经营,使林业的经营走向市场,遵循市场的经济规律,实现林业的进一步发展,实现林业的商品化经营,林业部门可以根据市场的行情和需求来选择那些经济效益好的树种进行经营,使林业的经营部门取得一定的经济利润,在较高的林业投资回报的吸引下,也可以吸引社会生产资源参与到林业部门的投资,改变林业部门资金紧张的状况。林场只有实行森林的分类经营,才能确保商品林经营走上一条市场化的发展道路,林业部门拥有自主的决策权,林业的生产和企业生产行为一样,经济效益是企业经营活动的重点,在利润的刺激下,林场经营者的积极性就会大大提高,也可以防止在陌生的领域进行盲目的投资,给林业部门带来较大损失。

1.2 实行森林分类经营可使生态公益林得到有效的经营和保护

在我国生态公益林的主要作用是对环境和生态进行保护,经营者不是直接的受益主体,因此,出现了受益者不经营、不投入、而获益,经营者实行经营和投入而不受益的矛盾。以往不实行森林分类经营的时候,生态公益林,包括林场的防护林等,是林场中只有投入没有产出的对象,没有利润的情况下,导致林场经营者的积极性下降,不进行人力、物力、财力的投入来确保林场的经营。没有进行森林的分类经营,导致林场权益与责任之间没有进行明确的划分,防护林等生态公益林由于缺乏有效的经营和管理,没有发挥实际的生态效益。

对森林进行分类经营之后,明确林场的投入和产出关系,经营者的责任权利关系,充分发挥政府在市场经济中进行宏观调控的手段和能力,加强对生态公益林的经营和管理,实现生态林的效益,不但有利于提高对生态公益林的经营和管理水平,而且使生态林的生态效益得到最大发挥。

1.3 森林分类经营是有效利用林场林地资源的前提

林场最重要的生产资源是林地,林场为了实现自身的经营活动,需要消耗大量的资源来维护林地的所有权,增加了生产的成本。同时,由于自身经营管理水平的限制,林场对有限的林地资源利用效率不高,只有进行森林的分类经营,对有限的林地进行科学合理的规划,根据森林的主体功能划分具体的经营类型,加大对商品林中高效林业的经营力度,提高对林场资源的使用率。

2 森林分类经营措施

2.1 林场划类经营

林场可根据林场资源构成情况,把林场划分商品生产型和生态公益型林场2大类型。对前者进行规范管理,若占用林地资源应缴纳林地占用费,国家投资形成的资产效益应折成股份,在林场分配过程中,将国家股份所得上缴代表国家行使资产管理职能的相关部门,林场的经营活动照章纳税,林场对经营活动的投入应通过国家计划解决。为了增强林地的经济活力,在森林生态防护效益的基础上,林场可以从事商品生产。

2.2 林场森林资源划类经营

对林场划类经营后,还应对林场森林资源进行划类经营。生态公益型林场的经营投入主要通过经营管理投入预算,由国家投资解决。商品经营型林场由于存在2类资源,必须对森林资源划类经营。对于商品林,应完全由林场自主经营,行政主管部门要减少对其直接干预;对于生态公益林,应通过实行森林效益补偿制度,对经营投入问题进行解决。

3 结语

当前,对林场进行综合发展时,如何进行有效的分类运作是一个需要重视的问题。对林场的分类运作设置综合化的管控体系,同时进行合理的政策辅助,是活动开展的关键点。林业的管理部门要实事求是根据林场当地的实际情况,在相关的理念体系的主导作用下,找到一个适合促进当地林场经济效益的运作体系。对林场实施分类运作,重要的工作是前期做好综合规划,进行分类设置。公益林的发展依然是林场分类经营的难点,吸引更多的资金加入到公益林的发展和维护,是林场实现全面发展的重点。

参考文献

1 陈火春.再谈森林分类经营林业[J].调查规划,2001(7)

第6篇:诗句分类范文

【关键词】经济实力;评价体系;因子分析;聚类分析;区域划分

一、引言

作为全国的能源化工基地,山西省近年来的经济建设取得了较为显著的成绩,然而由于自然基础、经济基础等各方面原因,区域内经济差异较大,因此,为实现山西省转型跨越式发展,达到经济快速发展的目标,缩小区域内经济差异、促进各区域协调发展已成为全省开展各项工作的一个核心。而这一目标的实现,必须建立在对11个市区科学的经济分析基础之上。本文正是利用因子分析和聚类分析对山西省各市区的经济实力进行了综合测评,并通过划分区域,找出各市区的优势和不足,以使山西实现可持续发展。

二、构建经济指标体系

所选取的评价指标体系应能客观真实地反映各地区的实际情况,不仅包括投资产出状况,也要反映该地区的居民支出水平,基于此,本文选取了各地区生产总值(X1)、地方财政收入(X2)、商品出口总额(X3)、人均生产总值(X4)、人均储蓄存款(X5)、资本形成总额(X6)、固定资产投资总额(X7)[1]。其中人均储蓄存款与人均消费水平成相反关系,所以人均储蓄存款在一定程度上也能反映居民支出水平。

三、因子分析

因子分析是通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象的变量”来表示其基本的数据结构,以达到降维、简化数据的目的[2]。

由于旋转前的因子载荷阵显示的每个因子在不同变量上的载荷没有明显差异,为便于对因子命名,对因子载荷阵进行了旋转。

(四)由因子得分系数和原始变量的标准化值可求得各市区每个因子的得分数。

四、聚类分析

根据因子得分分析区域发展的趋同程度,可对原始数据标准化后再进行系统聚类,以辅助分析。对各市区的变量F1和变量F2的每个数据在SPSS中利用系统聚类法进行聚类分析,其结果如下:

第一类:太原

第二类:大同、长治、晋中、运城、忻州、临汾、吕梁

第三类:阳泉、晋城、朔州

因子分析的综合得分在一定程度上反映了各市区综合经济实力,而聚类分析的结果对深入了解各市区在投资产出及支出方面的优劣有重要的意义。太原作为省会,在两方面均占有优势。而第二类中的大同、长治、晋中、运城、忻州、临汾、吕梁在投资产出方面比较占优势,在支出方面却低于全省平均水平。第三类中的阳泉、晋城、朔州在投资产出方面低于全省平均水平,而消费支出则高于全省平均水平。

五、结论与建议

1.结论

从11个市区经济实力因子分析的综合得分可以看出,各市区综合经济实力存在较大差异,排名第一的太原得分为1.887,而排名最后的忻州仅为-0.640。在公因子F1上的差距更为显著,第一名太原与最后一名阳泉相差3.665,在公因子F2上的差距也较明显,第一名太原与排在最后的运城相差2.878。

而聚类分析不仅考虑到综合得分,还考虑到各市区在产出与支出方面的特点。通过聚类分析,可以把山西省分为三类,在同一类别中的政策措施可以相互借鉴。

2.建议

(1)典型引路,整体推进。从因子分析的综合得分看,太原的经济实力很高,得分远远高于其他市区,堪称典范,其他市区应向发展好的市区看齐,综合考虑自身的地理位置、资源特点等,采取积极有效的措施,以促进经济的跨越式发展。

(2)有针对性地采取策略。对于投资产出占优势支出水平较低的长治、吕梁、运城等地,在保持优势的同时,要促进居民支出,在做精煤炭产业的同时,大力发展诸如旅游业、制造业等多元产业,创建低碳环保的循环经济模式。而阳泉、晋城、朔州等地,要鼓励外资和本地民间资本进入工业制造、基础设施、生态建设、城市公用事业等领域,积极引进战略投资、优势企业及重大项目,认真学习借鉴附着在资本载体上的管理、技术、企业文化和工业文明等,提升发展的活力和后劲。

(3)整体规划、协调发展。山西省应作为一个整体,用系统的观点统一进行规划管理,针对各市区的优势与弱项,从全局出发,综合考虑经济布局、经济发展目标、三大产业结构调整等各因素,构建”一核一圈三群”为主体的城镇化发展格局,将山西省打造成一个统筹兼顾、可持续发展的先进省份。本文在聚类分析基础上的经济实力分区可以为全省的整体规划提供政策参考。

参考文献

第7篇:诗句分类范文

关键词:聚类技术、Java

中图分类号:TP3 文献标识码:A 文章编号:1009-3044(2013)08-1894-06

1 研究背景

JAVA是一种跨平台的语言,灵活性比较大,运用范围广,能运用到各种系统和领域中。聚类技术最近几年越来越受到大家的追捧,聚类算法的应用也得到了推广,在生物学上,聚类能通过基因和蛋白质的这两类的分类或者聚类,对种群中固定结果的重新认识和分析,从而推导出不同的植物或者动物种类:在市场关系上,市场分析人员也可以通过聚类发现客户数据中不同的客户群体,对这些群体的不相同类的特征进行模式刻画,从而能预测某客户群体的购买类型。不仅如此,聚类也能对internet上的web中的文档或者文件进行分类,而发现对人们有价值的知识,此外聚类还可以对其他方法进行预处理过程,对这些方法起辅助作用。

基于JAVA的聚类分析的实现,给聚类技术的推广起到推风助浪的作用,使得聚类技术能在更多的领域中拓宽。

2 聚类分析概念

聚类是运用数据对象之间的距离,并运用相关的聚类分析原则将对象逐一划分到多个簇(clusters)中。每一个簇中中也包含了多个相同类属对象,同一个簇钟的对象之间的相似度要比不同簇的相似度大,最终的聚类能使得各簇种对象的相似度最小,这样就达到聚类的目的了。这样的聚类分析不仅可以对数据分析和知道的挖掘提供数据依据,也可以解开事物数据之间的内在联系和区分,这使得聚类分析爱成为数据挖掘技术中不可缺少的成员。

3.2 层次聚类

层次聚类是根据凝聚或分裂的层次分解形式对数据对象集合进行层次分解。分裂的方法是自顶向下的方法,首先把所有的数据对象点归为一类,然后以此分裂成更小的类,分裂到每个对象能够单独在一个类中为止。凝聚与分裂的方法相反,是一种自底向上的方法,“底”在这里指的是单个数据点,首先以单个数据点作为一个类,然后对相近的数据对象进行合并归纳成新的类,直到所有的数据对象合并成一个类为止,这个类在层次上面叫着的最上层,整个运作过程是自底向上的方式运作。常用的算法有利用层次方法的平衡迭代归约和聚类―BIRCH。

3.3 基于密度的方法

基于密度的方法就是让最近区域密度值达到一定的标准,也就是有一个具体的阀值即对象的个数,还有就是该区域半径值,以这些标准来对对象进行聚类。用这种方法的好处是避免了划分方法中发现球状簇的局限。例如基于高密度连接区域的密度聚类方法――DBSCAN。

3.4 基于网格的方法

基于网格的方法就是在网格接结构的基础上对数据进行聚类,我们将采用量化的方式把空间对象分成有限的数目单元,这样就是对空间对象进行网格。这种算法有―CLIQUE算法。

3.5 基于模型的方法

基于模型的方式就是给定一个模型,根据模型的要求寻找最合适的对象的方法。在对象空间的密度数来构建一个模型,通过统计数字自动来决定聚类的数目,从而去掉不需要的噪声数据,使得聚类的方法更有力。这种方法有COBWEB算法,网络神经方法有SOM算法。

3.6 基于约束的方法

对数据的个体对象进行约束,或者设置聚类参数来约束,来进行聚类的方法。因为在我们的客观世界中聚类的问题存在很多的约束条件,但是这些条件都是很发杂的,往往不被有效的利用出来,从而不能对这方法进行进行广泛的推广和应用。这种方法有COD (Clustering with Ob2structed Distance)。

第三步:计算每个聚类中所有对象的均值,得出新的聚类中心。

第四步:对新的聚类中心重复上面的第二和第三步,并得到新的聚类中心,直止新的聚类点不再更新。得出最终的聚类中心。

初值的好坏直接影响到K―Means算法的最后结果,也可以因为初值的问题导致聚类的结果有天差万别,因此要改变K―Means算法的初值的取法,是K―Means算法的改进的关键。

中心点的选取不同直接影响到聚类结果不同,因此初始聚类中心的选择在 K―Means算法中非常重要。实际应用中,我们即希望中心点能够尽量分散,也希望这些中心点具有一定的代表性,这也是我们聚类的目的。我们运用一种基于试探性的算法---最大最小距离算法可以对初始聚类中心的选择做出相对较好判断,它能相对智能地确定最佳的初始聚类的中心,可以提高划分初始数据集的效率,避免过去K―Means算法中选取初始聚类过于邻近,而导致聚类结果不佳的情况。

参考文献:

[1] 朱福喜. Java程序设计技巧与开发实例[M].北京:人民邮电出版社,2004,2.

[2] 陆惠恩.实用软件工程[M].北京:清华大学出版社,2006,5.

[3] (美)Bruce Eckel著,陈昊天译.Java编程思想[M].北京:机械工业出版社,2007,6.

第8篇:诗句分类范文

1.1国外政策工具的发展历史及成果

对于政策工具研究最早是在20世纪50年代中期由达尔和林德布洛姆撰写的文章《论现代国家采取的政治——经济技术》中提出来的。但政策工具研究兴起于20世纪80年代。20世纪80年代初的时候,荷兰的吉尔霍德委员会便得出了以下结论:政策工具知识的缺乏和不足是导致政策失败的重要原因。所以,为了解决这个问题我们需要建立和发展一门政策工具理论并将之付诸实践。这时期最有影响力的著作要数1983年胡德的《政府的工具》。到了20世纪90年代及本世纪初,政策工具的研究得到了迅速地发展。目前,它已成为了当代西方公共管理学和政策科学研究的一个焦点主题,同时也正在成长为一个新的学科分支。这一时期的代表作无非要数以下两本了:一是20世纪90年代初的盖伊·彼得斯和冯·尼斯潘主编的《公共政策工具;对公共管理工具的评价》;二是莱斯特·M·萨拉蒙主编的《政府工具——新治理指南》。其中笔者尤其要指出《公共政策工具——对公共管理工具的评价》一书,该书是1992年春在荷兰鹿特丹大学举行的政策工具研讨会上的论文集,在众多教材中较为全面地反映了当时政策工具研究的状况,是一本让我们更好地了解公共政策工具并做进一步研究的很好的参考书。

根据上文知道西方政策工具的真正兴起与发展是在20世纪80年代之后,那么其原因有哪些呢?笔者借鉴了陈振民等学者的著作,将原因概述为以下四点:一是政府的管理和政策的执行是很复杂的,这就导致人们对政策执行工具的反思;二是此时西方一些福利国家相继失败,政府的工作效率低下,政策时常失灵,人们产生了了解政策失灵的原因和解决方案的强烈要求,而不少解决方案就存在于政策工具的理论之中;三是现代的社会科学领域的学者们开始注重理论与实践的紧密结合,导致他们对工具性知识的更多地追求;四是政策工具是政策科学研究领域的问题之一,政策科学自身发展到一定阶段,自然会将政策工具纳入研究重点之一。

1.2国内政策工具的发展历史及成果

在我国关于政策工具的研究是在本世纪初才慢慢被国内学者所重视的,所以说它在我国的起步较晚,属于新兴研究领域,自然所取得的成果也是有限的。据我国国家图书馆和北京大学图书馆藏文献进行检索发现,我国目前还没有真正意义上的政策工具专著,只有一本中文版译著,是由顾建光翻译《公共政策工具:对公共管理工具的评价》一书所得,于2007年1月由中国人民大学出版社出版。其余的成果主要是教材和论文。对公共政策研究进行介绍的教材笔者所知道的主要有:张金马主编的《政策科学导论》(1992年版);张国庆主偏的《现代公共政策导论》(1997版);陈振民主编的《政策科学》(1998年版);陈振民编著的《公共政策分析》(包括2002、2003年两版);陈庆云主编的《公共政策分析》(2006);陶学荣主编的《公共政策学》(2006);郭红玲主编的《公共政策学导论》(2007);陈潭主编的《公共政策学原理》(2008);严强主编的《公共政策学》(2008)等等。其中还有一本是2006年出版的由庞诗所译的豪特利和拉米什的《公共政策研究——政策循环与政策子系统》一书,其内容也有关于政策工具的介绍。至于论文也有数篇:2003年的主要是张成福的《论政府治理工具及其选择》;2004年的主要有陈振民的《政府工具研究与政府管理方式》;2005年的主要有卢霞的《政府工具研究的新进展》,徐程的《政府工具视角:一种审视政府治理的新途径》,王伟昌的《新“治理”范式与政府工具研究》,储亚萍的《论作为政府管理工具的合同》;2006年的主要有陈振民的《政府工具研究的新进展》,吕志奎的《公共政策工具的选择——政策执行研究的新视角》,周奋进等的《政府“治理工具”的选择与行政行政制约》,余瑶的《当代中国政府工具选择刍议》,朱喜群的《论政府治理工具的选择》;2007年主要有杨卫玲的《公共信息;政府治理工具箱中最有效的“软工具”》;2008年姜国兵的《对公共政策工具五大主题的理论反思》,等等。

2政策工具的内涵

政策工具又称为治理工具,政府工具,国内外众多学者都对其从不同的角度做了不同的定义,表述各异。国外主要有以下一些定义:尼德汉认为工具是“公共机构可以合法获得的统治可能性”。霍格威尔夫认为“工具是行动者能够使用或潜在地加以使用,以便达成一个或更多目标的事物”。林格林将工具定义为:“致力于影响和治理社会过程的具有相似特征的一系列政策活动”。美国学者莱斯特和斯图尔特认为政策工具是政策执行的技术。澳大利亚学者欧文·E·休斯把政府工具定义为:“政府的行为方式,以及通过某种途径用以调节政府行为的机制”。另一个美国学者萨拉蒙则认为工具是“一个行动者能够使用或潜在地加以使用,以便达成一个或更多目的的任何事物”。而豪利特和拉米什则指出,政策工具是政府赖以推行政策的手段,是政府在部署和贯彻政策时拥有的实际方法和手段。

国内知名学者陈振民、张成福、陶学荣、严强等等都对政策工具的内涵作发表了自己的看法。有的认为政策工具是实现政策目标或结果的手段;有的认为政策工具指的是政府将其实质目标转化为具体行动的路径和机制,是政府治理的核心,没有政策工具,便无法实现政府的目标{有的则认为政策工具是“公共部门或社会组织为解决某一社会问题或达成一定的政策目标而采用的具体手段和方式的总称”等等。

从以上定义我们可以看出,虽然各个学者对政策工具的定义千差万别,但这些定义都体现了共同的基本属性一一公共政策主体在执行政策过程中,在达成政策目标中所采取的手段、方法和途径。结合这些定义,笔者认为政策工具是公共政策制定主体,尤其是执政党和政府部门选择的并具体加以运用以执行公共政策,达成政策目标,从而解决政策问题的途径和手段。

3政策工具的分类

3.1政策工具的分类简介

关于政策工具的分类,学者们也是由于角度不同众说纷芸,表述各异。综合起来有以下一些分类结果:荷兰经济学家科臣(另一表述为德国经济学家基尔申)最早试图对政策工具加以分类。他关注的是一系列执行经济政策从而获得最优化结果的工具。他整理出了64种工具,但是只是列举,并未作系统化的分类。美国政治学家罗威、达尔和林德布洛姆等人对这些工具进行了宽泛的分类,认为可以分为规制性工具和非规制性工具两大类。萨拉蒙在前人研究的基础之上又加上了开支性工具和非开支性工具两种类型。胡德相比较前几位学者来说提出了稍显系统化的分类框架,他认为所有的政策工具无一例外的都会使用到以下四种资源中的任一种或几种。这四种资源是信息、权威、财力和可利用的正式组织。麦克唐纳和艾莫尔则根据工具所要求达到的目标将之分为四类:命令型工具、激励型工具、能力建设型工具和系统变迁型工具。施耐德和英格拉姆等人的分类与之有些类似,他们认为政策工具可分为激励型工具、能力建设型工具、符号与规劝型工具和学习型工具四类。著名政策分析家狄龙将政策工具分为法律工具、经济工具和交流工具三类。这种分类方法在西方比较受推崇。另一种更新近的三分法是管制性工具、财政激励工具和信息转移工具。加拿大公共政策学者霍莱特和拉梅什根据政策工具的强制性程度将政策工具分为强制性工具、自愿性工具和混合性工具。此种分类方法在众多方法中更具解释力、更合理,在下文,笔者将对之进行详细介绍。加拿大政策科学布鲁斯.德林和理查德.菲德也是根据政策工具的强制性程度将政府工具分为自律型政策工具和全民所有型政策工具,前者强制程度最低,而后者强制程度最高。这种分类为政策工具分类体现政府与社会之间的关系做了基础性的贡献。欧文.E.休斯认为政府的干预都可以通过供应、补贴、生产和管制这四方面的经济手段得以实现。林德和彼得斯则认为政策工具是多元化的,它们可以包括命令条款、财政补助、管制规定、征税、劝戒、权威和契约。奥斯本和盖布勒在《改革政府》一书中将政策工具比作是“政府箭袋里的箭”,并将之分为以下三类:传统类工具、创新类工具和先锋类工具。E·S·萨瓦斯认为政策工具有政府服务、政府间协议、契约、特许经营、补助、市场、用户付费、志愿服务等等。

以上是西方对政策工具的大致分类情况,接下来我们看一下国内主要的分类情况。国内学者的分类总结起来主要有三种,一种是张成福在《公共管理学》中的分类,他政府介入的程度将政策工具分为政府部门直接提供财货与服务、政府部门委托其他部门提供、签约外包、补助或补贴、抵用券、经营特许权、政府贩售特定服务、自我协助、志愿服务和市场运作。第二种是陈振民的分类,他认为政策工具可分为三大类:市场化工具、工商管理技术和社会化手段。最后一种是陶学荣的分类,他将政策工具则分为:经济性工具、行政性工具、管理性工具、政治性工具和社会性工具五类。

3.2政策工具分类的不足和困难

(1)不足。

虽然很多学者对在政策工具分类上做出了尝试,关于这方面的成果也不少,正如上文所述的那样。但是我们不得不承认政策工具的分类依然存在不少问题。有的分类太过于宽泛不够具体,从而不便操作。比如说林德布洛姆等人作出的分类。有的分类选用的是列举法,太过于具体。最大的弊端是难以穷尽,不科学严谨。有的分类没有相互区别、相互排斥。有的分类又太注重借鉴企业的分类了,从而有忽视“公共性”的嫌疑。有的分类对诸如谈判、说服等非正式工具没有加以重视。

(2)困难。

政策工具分类有以上的诸多困难,是有其原因的,这些原因也可以说是现在政策分类不可避免的困难。笔者认为大致有以下几点:一是政策工具本身包含的内容太丰富了,以至于不同类别之间有时相互交叉。二是我们在研究政策工具时往往处在静态的角度,这样容易导致我们分类方式的僵化。三是政策工具分类研究中存在着“灰色领域”,这个领域属于哪个类别不好判断。四是政策工具的分类不仅仅是一个技术层面的问题,还涉及很多价值因素在其中。在公共组织中不同价值的选择和整合是很难的。五是现在社会的公共问题日趋复杂,要想解决这些复杂的问题需要整合不同的政策工具,这也是有一定难度的。总而言之,关于政策工具及其分类的研究依然有很长的路要走。本文借鉴前人的成果小谈了一下政策工具的发展历史和分类,首先是对之有个基础性的了解,其次是为进一步的研究做铺垫。

第9篇:诗句分类范文

关键词:核函数;划分聚类;k-折交叉验证;PAM(围绕中心点的划分);主成分分析

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)27-6185-04

随着智能化的到来,机器学习技术得到广泛的重视。当前,数据挖掘技术的发展,以及社会应用对云计算、大数据等的要求也越来越高。分类、关联规则、聚类、时间序列与序列模式、Web挖掘、空间挖掘技术等得到了较快发展。作为一种基于统计学习理论的支持向量机(SVM)成为了数据挖掘的一种比较重要且有特色的方法,在分类、聚类方面有着很重要的意义。支持向量机使用结构风险最小化原则代替经验风险最小化原则,采用将低维空间映射到高维空间,在非线性、小样本、二分类、高维模式应用环境中具有一些明显的优势。

支持向量机目前在二分类问题中得到了深入的研究,在多类分类问题的求解上也提出了很多解决办法。聚类作为数据挖掘的另一个重要领域,则相对于分类而言,研究的较少。文献[6]对将支持向量机的思想应用于聚类做了简单的介绍,并且提出了采用主成分分析(PCA)进行特征提取的一种线性降维的简单算法。

支持向量机具有的明显优势,有一个很重要的原因,就是采用了核函数(但核函数不一定只用在SVM上)。该文根据核函数在支持向量机上进行有效分类的启发,将核函数思想应用到划分聚类上,在Matlab环境下进行了应用与实现。

1 核函数

核函数对支持向量机的分类性能有影响。核函数的形式的选取,参数的选择,都是核函数的应用必须考虑的问题。

核函数具有以下优点:

2)采用核函数可以处理高维数据。这是因为采用核函数后,输入空间的维数对核函数的矩阵没有影响。这样就避免了所谓的“维数灾难”,并且计算量得到了减小。

3)核函数对于支持向量机是至关重要的,但核函数的思想绝不仅仅只用于支持向量机处理上。实际上,只要一个应用,在建立模型后存在内积形式,都可以采用K(x,x’)去替换,这样就有可能改进目标算法。这样,核函数思想就可以与聚类算法相结合,在聚类的预处理步骤上,能够设计出各种基于核函数的子算法,更重要的是这两部分的设计可以独立开展,根据不同的应用环境进行筛选,找出合适的算法。

4)核函数有多种形式,相同的核函数的参数也会不同。有些应用,适合采用某一种核函数,而有些应用可能要采用另一种核函数。

核函数应用中,Mercer定理具有很重要的意义。Mercer定理指出:要证明K是一个核函数,不必去寻找Φ变换函数,只需要在数据训练集上求出各个内积Kij,然后只要判断一下矩阵K是不是半正定矩阵就可以了。满足Mercer条件的函数就能作为核函数。

2 聚类

2.1 聚类简介

聚类和分类一样,是数据挖掘的一项重要功能。分类是一种有监督的学习。而聚类与分类不同,聚类中要划分的组(簇)事先是不确定的,而是由数据决定的,因此聚类是一种无监督的学习。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类具有重要的意义和普遍的价值。在日常生活中,经常有“物以类聚,人以群分”的说法,聚类能够很好地刻画数据的属性以及群体行为特征。聚类的目标就是将数据采用某种算法,根据数据本身的属性,划分成若干组(簇),分组的依据是在同一个组(簇)中的数据之间具有较高的相似度,在不同的组(簇)中具有很低的相似度。

目前,数据挖掘技术以及大数据技术面对的是巨大的、复杂的、异构的数据集,聚类分析算法面临很大的挑战。一个好的聚类分析算法应该考虑以下一些方面:

1) 可伸缩性:聚类算法在小数据集和大数据集上均能得出有效的结论;

2) 能够处理各种数据类型的属性,并且能够处理高维、稀疏数据;

3) 能够根据数据本身的特征,找出任意形状的组(簇),而不是仅仅发现类球类的簇;

4) 对专业领域知识依赖性低;聚类的结果应该是易于理解、便于应用;

5)数据集输入的顺序对聚类的结果影响较小;

6) 能够对噪声进行处理;能够根据实际应用的约束条件进行聚类。

2.2 距离与相似度的度量

从聚类的概念上可以看出,数据元素之间的相似度是聚类分析中很重要的因素。如何来定义数据对象之间的相似度,对聚类分析的质量有决定作用。相似度在通常情况下可以用距离d(xi,xj)来衡量,当xi与xj相似时,d(xi,xj)值较小;而当xi与xj不相似时,d(xi,xj)较大。

常用的度量标准有:

1)两个数据对象之间的距离函数(相似性测度)

对于具有连续特征的数据集空间,常用的距离函数有明科夫斯基距离、二次型距离、余弦距离等;对于二元类型的数据集,可以采用简单匹配系数(SMC)、Jaccard系数和Rao系数进行描述。

2) 簇间距离(不相似性测度)

描述两个簇间的距离,可以有以下一些方法:

采用两个簇中相距最远的两个数据之间的距离来表示簇间距离(最远距离法);

采用两个簇中相距最近的两个数据之间的距离来表示簇间距离(最近距离法);

采用两个簇中的中心点的距离作为簇间距离,簇的中心可以用该簇所有元素的算术平均表示(簇中心点法);

采用两个簇中任意的两个数据对象之间的距离表示簇间距离(簇平均法);

除了以上四种方法外,还可以采用离差平方和来描述簇间距离。

2.3 聚类的类型

聚类的类型按照不同的标准,有不同的分法。这里根据聚类分析算法的设计思路,将聚类分成以下5种类型。

1)划分聚类

这是最基本的聚类方法,划分思想比较接近日常生活。若给定l个数据(可以是多维),将这l个数据划分成k类,k

划分聚类的方法常用的有:k-平均、k-原型、k-中心点、k-模、PAM、CLARA以及CLARANS等。

2)层次聚类

层次聚类就是采用自顶向下(分裂)或自底向上(凝聚)的方法,相继地分裂或合并,直到终止条件满足的一种聚类算法。分裂的算法有DIANA算法,凝聚的算法有AGNES。

3) 密度聚类

该方法不采用距离作为相似性度量,可以很好地解决前述算法偏向于得出类似于球类的聚类结果。密度聚类采用数据是否属于相连的密度域,采用直接密度可达、密度可达来寻找相连密度域的数据,将符合要求的数据插入到相应的组(簇)中。典型的密度聚类算法是DBSCAN。

4)网格聚类

CLIQUE算法、STING算法等是常用的网格聚类算法。网格聚类算法首先将数据空间划分成有限个单元的网格,以后的处理都是基于每个单元进行。该类算法速度快,因为与所处理的数据个数没有关系,而只与数据空间中的单元的个数有关。该类算法很有价值,不需要事先给定聚类的簇个数,能够发现任意形状、任意大小的簇,且计算结果与数据输入顺序无关。

5)模型聚类

给一个簇先设定一个模型,然后以这个模型为依据去寻找满足模型的数据,将其归于该模型对应的簇。基于神经网络的模型有SOM,基于统计学模型的方法有Gaussian Mixture Model(混合高斯模型)。

本文主要对划分聚类的k-平均算法和PAM算法进行。

3 核函数在划分聚类中的应用与实现

3.1 核函数与聚类结合研究现状

文献[1]对核函数在支持向量机上的应用做了探讨,并采用了k-折交叉验证与网格搜索法,对Breast Cancer数据集上采用多项式、RBF和Sigmoid核函数进行了实验验证;文献[2]采用最小包含球的思想,介绍了一种核向量机(CVM),并与SVM做了比较;文献[3]认为主成分分析(PCA)降维的目的是对原始数据的重构,而不是为了进行分类,因此会降低分类效果,于是提出了采用高斯核函数和核化离散差判别分析的一种核化聚类判别分析方法(KSCDA);文献[4]将多项式核函数、RBF核函数和Sigmoid核函数应用到了遥感图像几何校正中并做了详细的实验验证;文献[5]将Gauss核函数的应用到了航空AE3007发动机一次引气故障的诊断中,对Gauss核函数的参数和相应的支持向量机的惩罚因子C的不同组合作了较为详尽的论述;文献[6]对核函数的原理与性质作了较为深入的介绍,并对聚类和主成分分析(PCA)给出了应用的一般思路;文献[7]对数据挖掘中聚类的原理和算法做了较为详细的介绍,特别是对划分聚类、密度聚类、层次聚类和网格聚类做了较为详尽的举例;文献[8]则采用基于余弦函数的夹角大小来进行相似度测度定义,并应用到了自底向上的凝聚层次聚类中,对6个元素的高维稀疏矩阵进行了实验仿真;文献[9]对常用的核函数,运用Libsvm工具箱,在Matlab平台上做了一些实验验证,得出了一些直观的效果;文献[10]将核函数思想应用到了自组织映射(SOM)网络流量分析,提出了kSOM方法,能够对有多个统计特征属性的网络流量在应用层进行分类。

3.2 核函数在聚类分析中的应用要点

根据对聚类和核函数的特点分析,根据文献[8],发现核函数的思想在聚类中的应用可以通过对相似度度量上来进行设计。例如,在判断两个向量的相似度时,采用传统的距离计算方法,对于复杂的高维稀疏矩阵,往往计算量大,由于有了核函数的思想,可以采用计算两个向量的夹角的大小进行数据对象的相似度判别。

于是根据空间解析几何原理,夹角的大小cos(θ)=xi·xj/(||xi||*||xj||);

其中θ∈[0,π/2]。当夹角越小时,两个数据对象越相似;夹角越大时,两个数据对象就越不相似。

更进一步,借用支持向量机中核函数的应用的思想,将相似度夹角的计算可以简单地改成带有核函数K(x,x’),这样对于计算高维、稀疏空间向量的相似度带来很大方便。

3.2.1 核函数在k-平均聚类算法上的应用

k-平均算法,是一个最简单、最基本的聚类算法。该算法的思想是初始随机给定k个簇中心,按照最邻近原则把待分类数据划分到相应的簇,然后按平均法重新计算各个簇的中心,确定新的簇心。一直迭代,直到准则函数收敛。由于k-平均算法要频繁计算两个数据之间的距离,因此,核函数思想应用到k-平均算法能够解决高维稀疏数据之间的距离计算。算法如下:

算法目标:输入l个数据和需要聚类出的簇的个数k,得出聚类的k个簇

1)输入未聚类的l个初始数据点集和簇的个数k;

2)随机选取k个数据作为初始的中心;

3)计算每个数据与簇中心的余弦相似测度,并聚类到与该数据最相似的簇中去;

这里由于采用了核函数思想,将传统的距离用计算余弦夹角相似测度,而余弦夹角的相似测度的计算又引入了核函数的思想,对于内积的计算可以通过所采用的核函数进行。核函数可以选择多项式核函数、RBF核函数和Sigmoid核函数等。

4)计算每个簇中所有数据的相似测度平均值,并将这个平均值作为新的聚类中心。若计算结果满足所设定的准则函数,则转7;

5)重复3,计算每个数据到簇中心的余弦相似测度,并聚类到与该数据最相似的簇中去;

6)重复4,计算每个簇中所有点的相似测度平均值,并将这个平均值作为新的簇中心

7)输出聚类的结果k个簇

3.2.2核函数在围绕中心点划分(PAM)算法上的应用

PAM算法选用簇中位置最靠近中心的数据作为中心点,然后把l个对象划分成k个簇。可以最初随机选取k个对象作为中心点,反复用非中心点数据来代替中心点,这样找出更加合理的中心点。从PAM的执行过程中可以看出,PAM算法在替换中心点时,计算代价非常高。PAM算法克服了k-平均聚类对噪声数据和孤立点数据的敏感性,但在处理大数据集上,由于替换中心点的复杂性,失去了k-平均聚类对处理大数据集的相对高效与可伸缩性。

究其原因,PAM算法中在用非中心点替换中心点时,在计算代价上的组合情况较多。因此,采用基于余弦相似测度的核函数应用,在传统PAM算法的两点之间距离的计算上,采用核函数进行,可能会对效率有所提高。

对于PAM算法,算法的步骤基本不需要改变,主要将算法中的用非中心点代替中心点试探时,在计算代价和总代价时,改为采用余弦相似测度来进行度量。

3.3采用核函数的两个划分聚类算法性能

算法的实现采用了 Matlab 7.1,数据集采用了用Matlab 7.1随机产生的100个5维空间的数据myData,并进行了一些手工调整。在聚类时,采用了标准的k-平均聚类、标准的PAM聚类,以及采用了改进的核函数聚类的k-平均聚类和PAM聚类算法。核函数采用了RBF核函数、多项式核函数以及Sigmoid核函数。

4 结束语

将核函数的思想应用到划分聚类中,对k-平均聚类算法和PAM算法在距离的计算上改为采用了基于核函数的余弦相似测度的计算,从效果上看,在k-平均聚类算法性能的提高上要优于PAM算法。这是因为PAM对数据量较大的数据集效率下降的较快。下一步的工作,准备将核函数的思想应用到另外两种能够处理较大数据集的划分聚类算法CLARA算法和CLARANS中去。

参考文献:

[1] 奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3):123-128.

[2] 许敏.核向量机算法研究及应用[J].无锡职业技术学院学报,2012,11(4):73-76.

[3] 李天恩,何桢.基于改进的核化聚类判别分析的故障识别[J].管理工程学报,2012,26(3):34-41.

[4] 孙军,黎琪,李和睿.支持向量机遥感图像几何校正中的不同核算法的比较[J].四川兵工学报,2012,33(8):76-80.

[5] 郑波.基于Gauss核函数的SVM故障诊断技术研究[J].中国民航飞行学院学报,2012,23(3):49-51.

[6] 邓乃扬,田英杰.支持向量机-理论、算法与拓展[M].北京:科学出版社,2009:81-111

[7] 毛国君,段立娟.数据挖掘原理与算法[M].北京:清华大学出版社,2005:156-181

[8] 陈森平,陈启买,吴志杰.基于核函数的层次聚类算法[J].暨南大学学报,2011,32(1):31-35.