公务员期刊网 精选范文 计算机科学与生物学范文

计算机科学与生物学精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机科学与生物学主题范文,仅供参考,欢迎阅读并收藏。

计算机科学与生物学

第1篇:计算机科学与生物学范文

关键词: 离散数学 计算机科学 数据结构

离散数学是计算机应用必不可少的工具,例如数理逻辑在数据模型、计算机语义、人工智能等方面的应用,集合论在数据库技术中的应用,代数系统在信息安全中的密码学方面的应用,图论在信息检索、网络布线、指令系统优化等方面的应用。

1.离散数学与其他课程的关系

1.1离散数学与数据结构的关系

离散数学与数据结构的关系非常紧密,数据结构课程描述的对象有四种,分别是线形结构、集合、树形结构和图结构,这些对象都是离散数学研究的内容。线形结构中的线形表、栈、队列等都是根据数据元素之间关系的不同而建立的对象,离散数学中的关系这一章就是研究有关元素之间的不同关系的内容;数据结构中的集合对象及集合的各种运算都是离散数学中集合论研究的内容;离散数学中的树和图论的内容为数据结构中的树形结构对象和图结构对象的研究提供很好的知识基础。

1.2离散数学与数据库原理的关系

目前数据库原理主要研究的数据库类型是关系数据库。关系数据库中的关系演算和关系模型需要用到离散数学中的谓词逻辑的知识;关系数据库的逻辑结构是由行和列构成的二维表,表之间的连接操作需要用到离散数学中的笛卡儿积的知识,表数据的查询、插入、删除和修改等操作都需要用到离散数学中的关系代数理论和数理逻辑中的知识。

1.3离散数学与数字逻辑的关系

数字逻辑为计算机硬件中的电路设计提供了重要理论,而离散数学中的数理逻辑部分为数字逻辑提供了重要的数学基础。在离散数学中命题逻辑中的连结词运算可以解决电路设计中的由高低电平表示的各信号之间的运算以及二进制数的位运算等问题。

1.4离散数学与编译原理的关系

编译原理和技术是软件工程技术人员很重要的基础知识,编译程序是非常复杂的系统程序,包括词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成、依赖机器的代码优化7个阶段。离散数学中的计算模型[2]这一章的语言和文法、有限状态机、语言的识别和图灵机等知识点为编译程序中的词法分析和语法分析提供了基础。

2.离散数学在计算机学科中的应用

2.1数理逻辑在人工智能中的应用

人工智能是计算机学科中一个非常重要的方向,离散数学在人工智能中的应用主要是数理逻辑部分在人工智能中的应用。人类的自然语言可以用符号进行表示。语言的符号化就是数理逻辑研究的基本内容,计算机智能化的前提就是将人类的语言符号化成机器可以识别的符号,这样计算机才能进行推理,才能具有智能。由此可见数理逻辑中重要的思想、方法及内容已贯穿人工智能的整个学科。

2.2图论在数据结构中的应用

离散数学在数据结构中的应用主要是图论部分在数据结构中的应用,树在图论中具有重要的地位。树是一种非线性数据结构,在现实生活中可以用树表示某一家族的家谱或某公司的组织结构,也可以用它来表示计算机中文件的组织结构,树中二叉树在计算机科学中有着重要的应用。二叉树共有三种遍历方法:前序遍历法、中序遍历法和后序遍历法。

通过访问不同的遍历序列,可以得到不同的节点序列,通常在计算机中利用不同的遍历方法读出代数表达式,以便在计算机中对代数表达式进行操作。

2.3集合论在数据库系统理论中的应用

集合论是离散数学中极其重要的一部分,它在数据库中有广泛的应用。我们可以利用关系理论使数据库从网络型、层次型转变成关系型,这样使数据库中的数据容易表示,并且易于存储和处理,使逻辑结构简单、数据独立性强、数据共享、数据冗余可控和操作简单。当数据库中记录较多时,集合中的笛卡儿积方便了记录的查询、插入、删除和修改。

2.4代数系统在通信方面的应用

代数系统在计算机中的应用广泛,例如有限机,开关线路的计数等方面。但最常用的是在纠错码方面的应用。在计算机和数据通信中,经常需要将二进制数字信号进行传递,这种传递常常距离很远,所以难免出现错误。通常采用纠错码避免这种错误的发生,而设计的这种纠错码的数学基础就是代数系统。

2.5离散数学在生物信息学中的应用

生物信息学是现代计算机科学中一个崭新的分支,它是计算机科学与生物学相结合的产物。由于DNA是离散数学中的序列结构,美国科学院院士,近代离散数学的奠基人Rota教授预言,生物学中的组合问题将成为离散数学的一个前沿领域。DNA计算机的基本思想是:以DNA碱基序列作为信息编码的载体,利用现代分子生物学技术,在试管内控制酶作用下的DNA序列反应,作为实现运算的过程;这样,以反应前DNA序列作为输入的数据,反应后的DNA序列作为运算的结果,DNA计算机几乎能够解决所有的NP完全问题。

3.结语

现在我国每一所大学的计算机专业都开设离散数学课程,正因为离散数学在计算机科学中的重要性,可以说没有离散数学就没有计算机理论,也就没有计算机科学。所以,应努力学习离散数学,推动离散数学的研究,使它在计算机中有更广泛的应用。

参考文献:

[1]朱家义,苗国义等.基于知识关系的离散数学教学内容设计[J].计算机教育,2010(18):98-100.

[2]方世昌.离散数学.西安电子科技大学出版社,1985.

[3]陈敏,李泽军.离散数学在计算机学科中的应用[J].电脑知识与技术,2009,5(1):251-252.

[4]B.Kolman,R.Busby&S.Ross.Discrete Mathematical Structure.

第2篇:计算机科学与生物学范文

关键词:生物信息学;教材;师范院校

20世纪80年代末以来,生物信息学以惊人的发展速度,获得了很多突破性成就,正日益成为生命科学在21世纪发展的核心内容。对于未来生物科学中坚力量的现代生物科学工作者而言,掌握生物信息学的相关知识尤为重要。

作为一门新兴的课程,生物信息学课程在全国很多高等院校都已经开设,并进行了一些卓有成效的探索和改革。我们结合自身的教学实践和相关学校的教学现状,对师范院校生物信息学课程教学内容、师资力量、教学模式和方法、跨学科合作、教学实践实施情况等方面的现状进行了积极分析和思考。目前,师范院校生物信息学教学的现状如下。

一、教学内容陈旧、教学资源缺乏

生物信息学是一门新兴的学科,在高等院校开设时间较晚,我国对生物信息学专业精品课程的建设方面投入不够,成熟的生物信息学教学大纲、教案、多媒体课件、教学视频和习题等教学资源稀少。目前,市场上也缺乏相关的生物信息学教学多媒体课件和音像制品辅导材料等相关产品,造成生物信息学教学资源匮乏的现状。

目前师范院校所用教材大多数是徐程主编的《生物信息与数据处理》,蒋彦等编著的《基础生物信息学及应用》等几种不同版本的教材。这些教材在知识性、科学性和系统性方面还行,但是在教学内容的新颖性、时效性和实践性以及生物相关背景的介绍和对师范院校的适用性等方面有所欠缺。生物信息学的知识日新月异,新的数据库、新的软件、新的算法层出不穷,而生物信息学的课堂往往不能及时地将最新进展呈现给学生,导致课堂内容陈旧,不利于学生的发展和对生物信息知识的合理掌握,从而影响了生物信息学教学的质量。

二、师资力量缺乏

生物信息学是一门新兴的交叉学科,需要熟练掌握计算机与生物学知识的老师来授课。然而,实际上,由于缺少生物信息学的专业教师,教授该学科的教师多为生物学其他课程兼任,这些老师往往缺乏专门的生物信息学训练,在知识的传授和应用方面存在欠缺。与生物信息学教学要求存在着较大的差距,不能很好地满足教学大纲的要求。另外,师范院校通常将生物信息学作为选修课来开设,该课程在专业建设和人才培养方案中的地位偏低,造成相关部门对师资培养不够重视。

三、教学模式和方法落后

由于生物信息学课程涉及大量的数据库和软件知识,教师普遍采用多媒体教学。而多媒体课件的容量通常很大,学生忙于笔记,难以把握重难点。同时,幻灯片展示的知识点犹如放电影一般一闪而过,学生没有足够的时间思考和消化,跟不上教师的进度。教师进行多媒体教学时,往往是一堂课上从头讲到尾,语调缺乏抑扬顿挫,没有起伏,学生很容易昏昏欲睡。因此,教师虽然使用的是先进的教学工具,采用模式的却是传统的灌输式教学,只管埋头照本宣科,不管学生接收领悟多少。学生为了达到期末考试标准,只顾死记硬背,这样的教育让学生失去创新精神和主动思考的能力,失去对生物信息课程的兴趣。

四、缺乏与相关学科的合作交流

生物信息学实际上是生物学与计算机科学的交叉学科。然而一般高校往往只在生命科学学院开设生物信息学,由生物学老师来担任授课老师。由于对计算机科学知识的缺乏,导致生物专业教师对生物信息学课程很难深入开展;另一方面,计算机科学专业由于没有开设生物信息学课程,使学生不能了解到生物信息学的重要性,以及如何使计算机科学更快更好地发挥其在生物信息学中的作用。总的来说,生物信息学课程的建设欠缺相关学科的协作,不能有效地整合资源,不利于培养复合型人才。

五、缺乏实践教学内容

现有的生物信息学课程也有一些实践内容,但实践课时数少,内容相对简单,缺乏系统完善的实践过程。教师为学生讲授具体知识时,通常只通过多媒体课件演示操作,并没有为学生设置具体的动手操作步骤。使得学生对信息反馈迟钝,印象不深刻,不容易掌握方法。生物信息学实践教学并不需要价格昂贵的实验设备,只需要一网的电脑和一些相关的分析软件便可以进行实验。然而,目前的状况是,生物信息学课程中真正开展实践性教学的内容少之又少。

生物信息学的学习是一个长期积累的过程,教学水平的提高也需要在大量的教学实践中不断总结和完善。我们通过分析发现,在师范院校生物信息学教学中仍存在很多问题,其原因是多方面的,需要教学工作者进一步深入探讨并提出切实可行的策略。

参考文献:

[1]汤丽华.浅谈大学本科生物信息学课程建设与教学[J].科技

信息,2010(1).

[2]贾小平,孔祥生.生物信息学实践教学初探[J].陕西教育,

2010(3).

[3]军.农学专业生物信息学课程教学改革探析[J].现代农

业科技,2010(5).

[4]郝新保.充分利用网络资源开展生物信息学教育[J].中国医

第3篇:计算机科学与生物学范文

关键词:高性能计算;应用;中医药

中图分类号:R-3 文献标识码:A 文章编号:2095-5707(2016)06-0010-03

Abstract: High performance computing (HPC), as a new and important research tool, has been applied in many fields successfully. Application of HPC in the TCM field is still in the exploratory stage. HPC in the future may be innovatively applied in the field of genomics Chinese herbal medicine, virtual medicine screening of new TCM, TCM data mining and big data analytics, modeling and simulation and so on.

Key words: high performance computing (HPC); application; TCM

高性能计算是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机。高性能计算是世界各国竞相发展的前沿技术,是体现一个国家综合实力和科技竞争力的重要指标。

科学计算作为科研方法变革的产物,已经发展成为与传统的理论、实验并驾齐驱的第三种科研方法,并且日益成为越来越重要的科研方法。科学计算方法的运用,是高性能计算应用的基础和前提条件,而使高性能计算真正发挥作用主要取决于高性能计算的应用研究水平[1]。本文对于促进高性能计算未来在中医药领域的应用、丰富中医药信息学的研究内容及由此产生的中医药科研方法的创新具有推动作用。

1 高性能计算应用概况

1.1 我国在高性能计算应用领域仍处于落后水平

在高性能计算的研发和应用领域美国一直处于世界领先水平,日本和欧洲国家紧随其后长期位居世界先进行列。近年来,我国在高性能计算硬件的研发方面取得了突破性进展,通过自主创新逐步掌握了一批硬件研发的关键技术。中国国防科技大学研制的天河系列超级计算机连续多次在世界超级计算机排行榜中名列首位,标志着我国高性能计算的硬件研究水平目前已经接近国际先进水平。但在应用软件方面的发展严重滞后于硬件的发展水平,自主开发的高性能计算应用软件严重匮乏,需要大量购买和引进国外开发的应用软件,重要和关键部门的应用受制于人[2]。应用软件是高性能计算应用的基础,由于应用软件研发水平的严重落后,目前我国在高性能计算应用领域仍处于落后水平。

1.2 国内外高性能计算主要的应用领域

高性能计算作为崭新和重要的科研工具,目前已经在众多的领域得到了成功应用,各种前沿科学研究、技术开发和工程设计都越来越多地使用了高性能计算,高性能计算已经日益成为科技创新的重要力量。目前主要的应用领域包括气象数值模拟与预报、地震预报、纳米技术、生物医学、环境科学、空间科学、材料科学、计算物理、计算化学、流体力学、地震三维成像、石油勘探、天体星系模拟、大气与海洋模拟、固体地球模拟、工业设计、核武器研究、全球气候模型、湍流分析、飞行动力学、海洋环流、流体力学和超导模型等[1]。在生物医学领域的应用目前主要集中在人类基因组学、蛋白质组学、药物设计、分子动力学模拟等方面。

1.3 高性能计算应用的瓶颈

高性能计算虽然已经在众多领域得到了成功应用,但由于技术难度等的限制,仍然属于高投入高产出的非普及型应用。目前制约高性能计算应用的主要问题包括软件开发的技术难度非常大,系统使用成本过高,不仅体现在软硬件购置费用昂贵,而且系统运行维护成本过高,大型系统的年电费需上千万元[2]。比较高精尖的应用范围、非常高的技术要求和过高的使用成本,这些都限制了高性能计算的广泛应用。

2 高性能计算在中医药领域应用的可行性分析

2.1 高性能计算在领域应用的前提条件

高性能计算在领域应用的条件首先需要应用领域具有较高的科研水平,特别是能够通过科学计算的方法建立相应的数学物理模型和应用软件来解决实际问题,利用高性能计算才有可能促成应用领域研究水平的大幅度提高。通过对高性能计算应用领域的最高学术奖戈登奖获奖项目的分析,这些获奖的应用项目绝大多数都具有多学科交叉融合的背景,这反映了高性能计算的应用需要应用领域与计算机科学、数学等学科的跨学科合作[3]。随着高性能计算的应用,近些年高性能计算与应用学科的交叉学科不断涌现,产生了计算化学、计算物理学、计算生物学等许多新兴学科,这些交叉学科的产生标志着高性能计算在这些领域得到了高水平应用。

2.2 计算生物学的启示

计算生物学是一门以生命科学中的现象和规律作为研究对象,以解决生物学问题为最终目标,通过模拟和仿真的方法对生物学问题进行定量和定性研究的新兴学科。计算生物学与生物信息学比较,最大的不同之处在于生物信息学侧重于生物信息的采集、存储、处理和分析,而计算生物学侧重于对生命现象进行研究、解决生物学问题[4]。目前计算生物学领域的研究主要集中在蛋白质行为的模拟、药物分子的筛选、基因测序等方面。

虽然目前中医药领域还不满足高性能计算的应用条件,但通过借鉴计算生物学的研究方法,未来有可能在中医药领域开展具有创新性的高性能计算的应用研究。

3 高性能计算在中医药领域应用的展望

3.1 中药植物药的基因组学

基因组学是遗传学的一个分支,研究生物基因组和如何利用基因,涉及基因作图、测序和整个基因组功能分析,研究内容包括以全基因组测序为目标的结构基因组学和以基因功能鉴定为目标的功能基因组学。基因组学是高性能计算应用的一个重要方向,没有高性能计算人类的基因组计划就不可能实现,高性能计算已经成为基因组学研究不可或缺的科研工具。随着基因组学研究的深入、技术的成熟和成本的大幅度下降,使得基因组学的研究逐渐由人类的基因组学扩展到动物、植物等多个相近领域。利用高性能计算在基因组学方面成熟的应用软件开展中药植物药的基因组学研究未来有可能是高性能计算在中医药领域的重要应用。

3.2 中药新药的虚拟药物筛选

利用高性能计算进行虚拟药物筛选目前已经成为西药新药开发的一条崭新和重要的途径。新药研发的核心工作之一是从大量的化合物样品库中发现有药理活性的化合物,计算机虚拟筛选辅助新药开发是利用统计学和分子模型化技术来指导新的先导结构的发现或设计,从而减少实验室的工作量,缩短开发周期、降低开发成本。近年来对多靶点药物的研究已经成为国际上新药开发的一个重要的研究热点,中药是天然的多靶点药物,蕴含着巨大的新药创制的潜力[5-6]。应用高性能计算开展中药新药的虚拟药物筛选有可能成为中药新药开发的崭新途径。

3.3 中医药数据挖掘和大数据分析

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。大数据分析是指对规模巨大的数据进行分析,目前世界各国对大数据分析技术高度重视,大数据被视为国家重要的战略资源。数据挖掘和大数据分析是高性能计算应用的重要领域之一。目前中医药领域的数据挖掘和大数据分析主要集中在对方剂配伍规律、中医证治规律等的研究,现有的研究水平还不能构成对高性能计算的迫切需求。随着数据挖掘和大数据分析在中医药领域应用水平的提高,数据研究的内容、方法和结果的日趋丰富,随着数据量的积累和研究方法复杂度的提高,中医药数据挖掘和大数据分析未来有可能成为高性能计算在中医药领域富有潜力的应用。

3.4 模拟与仿真

模拟与仿真是依靠计算机通过数值计算和图像显示的方法,对工程、物理、生物等各类问题进行研究。高性能计算不仅具有强大的计算功能,还可以模拟或代替由于受经济或者其他条件限制不能进行的实验。2013年10月,哈佛大学教授Martin Karplus、斯坦福大学教授Michael Levitt和南加州大学教授Arieh Warshel因“为复杂化学系统创立了多尺度模型”而获得诺贝尔奖,评委会声明中称这一成果意味着对于化学家来说计算机已经成为同试管一样重要的工具[1]。

计算机模拟方法在生命科学中已经得到了迅速的发展和广泛的应用。高性能计算应用领域的最高学术奖戈登奖获奖项目“在20万CPU核和异构体系结构上的千万亿次持续性能血流模拟”,该项目模拟了血液流动状态,可以辅助血栓的早期病理学诊断及抗血栓药物的研究。另一项获奖项目“呼之欲出的猫:包含109规模神经元、1013规模突触的大脑皮质模拟”,对神经元和突触规模与猫大脑相当的大脑皮质功能进行了模拟,并以此为基础开展了认知计算的研究[3]。此外国内外大量的高性能计算被用于分子动力学模拟,分子动力学模拟是一种数值模拟方法,通过将分子抽象为由化学键连接的质点按照基于牛顿力学的数学模型迭代求解分子体系的行为。利用高性能计算进行分子动力学模拟已经成为化学和生物学研究中与实验手段相当的标准研究方式[7-8]。模拟和仿真技术在中医药研究中的应用未来有可能成为高性能计算在中医药领域创新性的应用。

4 小结

高性能计算的应用是使高性能计算真正发挥作用的软实力,是高性能计算领域重要的研究内容。高性能计算的应用需要多学科的交叉与合作,计算生物学的产生标志着高性能计算在生物医学领域得到了成功应用。

高性能计算在中医药领域的应用目前还处于探索阶段,尚不具备大规模应用的条件和基础。未来有可能通过借鉴计算生物学的研究方法在中药植物药的基因组学、中药新药的虚拟药物筛选、中医药数据挖掘和大数据分析、模拟与仿真等领域进行开创性的应用研究。高性能计算在中医药领域的应用将会对中医药科研方法的创新与发展产生深刻的影响。

参考文献

[1] 顾蓓蓓,武虹,迟学斌,等.国内外高性能计算应用发展概况分析[J].科研信息化技术与应用,2014,5(4):82-91.

[2] 周兴铭.高性能计算技术发展[J].自然杂志,2011,33(5):249-254.

[3] 张理论,邓小刚.戈登奖――分析与思考[J].计算机工程与科学, 2012,34(8):44-52.

[4] 徐书华,金力.计算生物学[J].科学,2009,61(4):34-37.

[5] 朱伟,罗颂平.治疗输卵管阻塞性不孕的中药多靶活性成分计算机虚拟筛选[J].时珍国医国药,2012,23(6):1531-1532.

[6] ,孙晓波.网络药理学:中医药现代化的新机遇[J].药学学报,2012,47(6):696-703.

第4篇:计算机科学与生物学范文

关键词 生物科学;交叉学科;编辑加工

中图分类号Q-0 文献标识码 A 文章编号 1674-6708(2015)131-0034-02

生物科学是研究生物的结构、功能、发生和发展规律的一门自然学科,它既研究各种生命活动的现象和本质,又研究生物与生物之间、生物与环境之间的相互关系,以及生命科学原理和技术在人类经济、社会活动中的应用。目前,科学的协同作用及相互激励作用逐渐被人们所认识,随着各国政府和科学界对生命科学的日益重视,化学家、物理学家和数学家从已经获取的新的生命信息中,不断修改、增添各自学科的理论、定义,从而使得一大批生物科学交叉学科蓬勃发展,如生物地理学、生物力学、生物光学、结构生物学、纳米生物学、计算生物学、生物信息学、耦合仿生学、合成生物学、生物医学工程学、系统生物学、生物伦理学等。

加工这类交叉学科的稿件,对编辑人员的业务能力要求较高,如知识结构、科学认知能力、逻辑分析能力、文字表达能力等。尤其是进行规范性编辑加工时,要求编辑具有掌握不同学科行业规范的能力。下面根据生物学与所交叉学科的不同,举例子说明编辑加工此类稿件的要点。需要说明的是,本文主要介绍稿件中遇到的相关学科内容的加工重点,至于生物学范畴内的基础知识加工规范,在此不再赘述。

1 与物理学的交叉

生物学与物理学交叉的学科主要有生物力学、生物光学、生物声学等,这类稿件中,除了对生物学基础知识的加工外,主要涉及对数学公式、数学符号规范方面的加工。

数学公式和数学符号的特点是字母多(英文、希文等)、符号多(各种运算符号和数学符号)、层次多(上下角标、行列式、矩阵等),因此编辑加工难度较大,且极易出现错误。为了使科技类图书做到标准化、规范化,使数学公式更加简明、规范、准确、直观,下面从数学公式和数学符号两个方面介绍加工要点。

1.1 数学公式

1)数学公式一般以另行居中排为原则。

2)公式前面,如上行末文字是“令”、“为”、“有”、“是”、“得”等字时,其后不加任何标点符号。

3)公式中常用的括号有圆括号、方括号、花括号,三种括号多重使用时,一般是圆括号外套方括号,外再套花括号。

4)一般情况下,如果公式不是特别复杂,则符号说明可在“式中,”之后按接排式的版式排(中间用分号隔开)。

5)公式需加排序号,采用阿拉伯数码,并用圆括号括起,放在公式右边行末版口处。

6)公式中的主辅线要分清(一般主线比辅线长),并且主线要与运算符号在同一水平线上。

7)方程组在编排时应尽量排在一面上。

8)编排行列式和矩阵时,应特别注意元素的行列要上下对齐,每一行的间距要均匀一致,行距通常为半个字距;对角矩阵的对角元素所在的列应明显区分,不能上下重叠,混淆不清。

1.2 数学符号

数学符号的字体以国家标准为依据,主要有大、小写的区别,白、黑体的区别,正、斜体的区别。

1)未知量的符号,表示变量的字母、变量符号,以及表示点、线段的符号用白斜体。

2)集合符号用黑正体,如集合B。

3)矢量(向量)符号、张量符号、矩阵符号都用黑斜体表示,如力F、张量T、矩阵A。

交叉类稿件的加工中还应特别注意公式里出现的容易混淆的字符,如英文字母的大小写容易混淆、英文字母O和阿拉伯数字0容易混淆、英文字母a和希腊文字α等。因此编辑在加工时一定要认真、仔细地标识清楚,以避免排版人员在排版时出错。

另外,一些物理学和数学家的名字也会有常用错别字,如“傅利叶”应该为“傅里叶”、“笛卡尔”应该为“笛卡儿”。

当然,关于数学公式和数学符号的使用还有很多详细的要求,以上列出的仅是生物类交叉学科图书中最容易遇到的问题。

2 与化学的交叉

生物学与化学交叉的学科中,主要任务是对化学式的加工,最容易出问题的主要有以下几处。

1)单箭头表示反应单向进行,双箭头表示反应双向进行。

2)化学元素符号用整体,表示反应组分数量的变量符号用斜体。

3)有机化学式中,化学键的键长要统一。

4)有机化学式中,元素符号和键号必须对准。

3 与计算机科学的交叉

随着后基因组时代的到来,生物学与计算机科学的交叉学科应运而生,包括生物信息学、计算生物学、合成生物学等。这类稿件的加工通常注意以下几点。

1)会出现数学公式和符号,加工重点见上。

2)有较多的计算机软件生成图或者屏幕抓图,因此加工时一定要注意图片的清晰度,图片模糊的话需要作者重新提供。

3)稿件中会出现较多的缩略词、简写,包括计算模型的缩略词、研究机构的缩略词、数据库的缩略词等,因此加工时要注意这些缩略词是否前后一致;同时要尽量保证这些缩略词的拼写正确。例如,“GenBank数据库”不能写成“GeneBank数据库”。

4)稿件中有时会出现一些代码程序,特别注意,这时不能根据我们已有的编辑加工知识去随意修改,因为代码有其本身固有的格式。

4 与医学的交叉

生物学与医学的交叉学科包括生物医学工程学、生物医学影像学、生物制药、医学细胞生物学等。这类稿件的加工难点主要是一些常见医学术语的规范。例如,“罗音”应该为“音”、“爱滋病”应该为“艾滋病”、“抗菌素”应改为“抗生素”、“心肌梗塞”应改为“心肌梗死”等。

4.1 与环境科学、地理学的交叉

生物学与环境科学、地理学的交叉主要涉及一些生态学科类的图书,如水资源、森林资源、农业气候资源等。这类稿件的加工中,除了涉及生物学的基础知识外,加工的重点主要为地图、插图类问题和数据错误。

1)地图、插图类问题。

(1)岛点差错(漏标主要岛点)。

(2)界限画法错误(国界、未定界)。

(3)注记差错(级别、字色、错别字)。

(4)区域设色差错(如台湾底色)。

(5)比例尺差错。

2)数据错误。

(1)求和、求平均值、计算增长率等错误。

(2)正文中的数据与表中的数据不一致。

(3)同一个数据,前后文不一致。

(4)文字描述与数据不一致,如“第一年是272t,第二年是230t,增长了……”。

5 与社会科学的交叉

生命伦理学关注的是生物学、医学、控制论、政治、法律、哲学和神学这些领域的相互关系中产生的问题。因此其通常会存在较大的争议。在这类稿件的加工过程中要特别留意是否存在宗教、信仰方面的敏感问题。这类问题可能并不多见,一旦出现就要特别引起重视,属于政治性差错的范畴。

另外需要注意的是,在科技类图书中会出现很多专业名词,特别是交叉学科的图书,涉及的专业类别很广,编辑的知识不肯能面面俱到,如果遇到不太熟悉的专业名词,一定要核查准确,确定是错误的字、词才可以改动,绝对不能妄改。关于专业名词,可以在全国科学技术名词审定委员会网站上进行核实。

随着我国科学技术的不断进步和发展,科技类图书承载“介绍新知、推广技术、传播资讯、传承文化”的使命不断增强。因此,科技类图书的编辑应当密切跟踪相关学科发展前沿,以此为基础增强科技类稿件的科学性,判断稿件的真理性,提高稿件的逻辑性。作为联系作者与读者的桥梁,科技类图书的编辑要着力拓宽自己的知识领域,只有这样才能编辑加工出高质量、高水平的科技稿件。

参考文献

[1]张祖权.科技文献中插图编辑加工刍议.科技期刊编辑研究文集(第四集),1996.

第5篇:计算机科学与生物学范文

1SIS计算机病毒传播模型

人们发现计算机病毒的传播特性与生物学中的流行病病毒有很多共性之处,所以有可能根据流行病的数学模型推出计算机病毒传播的数学模型。1991年,J.O.Kephart和S.R.White[1]联想到这种共性,首次用流行病的数学模型对计算机病毒的传播进行了分析,根据Kermach-Mchendrick生物病毒传播模型提出了计算机病毒的传播模型——SIS模型,如(1)式。Kermach-Mchendrick生物病毒传播模型描述了一定范围下的生物体在t时刻下处于两种状态之一:易感染状态(Susceptible)和感染状态(Infectious),而易感染者受到病毒感染变成感染者。SIS计算机病毒传播模型与Kermach-Mchendric模型不同之处[2]主要在于计算机病毒感染者能够以一定的治愈率δ被治愈马上转化为易感染状态,而生物体被感染后则可能死亡或获得免疫力,因此计算机状态转变过程是:SusceptibleInfectiousSusceptible。在当今云概念可能广泛实际应用的情况下,原有SIS模型的缺点——将所有的计算机被感染的比率和治愈率都规定为一定的,有可能得到改观。由于所有区域内的计算机都由一个功能强大的云端后台来控制,计算机病毒还有可能进行远程感染,各计算机被感染的概率会比较接近,受每台计算机的感染特征和连接率的影响减小,同时治愈率也是比较接近的。但另一方面,SIS模型所提出的“计算机病毒感染者被治愈后马上转化为易感染状态”与现实网络病毒传播特性相比变得更加不符。由于互联网提供云服务,执行云安全,被治愈后的计算机系统会集体升级杀毒软件、安装漏洞补丁,增强对病毒的防范、免疫能力,不会立刻转化为易感染状态。

2SIR计算机病毒传播模型

在计算机病毒传播和控制策略的研究中,一些是基于SusceptibleInfectiousRemoved(SIR)模型进行的。计算机病毒传播的SIR模型[3],又被称为经典普通传播模型:计算机被感染后可能瘫痪或获得免疫力,在一段时间内不会被其他感染者感染,属于“被移除状态”,则在确定范围下的计算机被划分为3个状态,易感染状态(Susceptible)、感染状态(Infectious)和被移除状态(Removed),如(2)式。计算机的状态转变过程为:SusceptibleInfectiousRemoved。由于SIR模型对项轨线和阀值进行了较为仔细的分析和研究,分析了计算机被感染后的变化,因而要比SIS模型有了提高[4]。当云端后台控制区域内的所有计算机时,已感染病毒的计算机可能会被“移除”出体系外,进行隔离,也就是SIR模型中所说的被移除状态(Removed)。但SIR模型并没有考虑到在云安全已逐步得到应用的情况下,未被病毒感染的计算机会在感染前就得到病毒信息,下载相应的漏洞补丁,升级杀毒软件,使计算机对此种病毒具有预免疫能力;实际中,不仅已被病毒感染的计算机可以从传染中被移除,未被病毒感染的计算机也有可能从传染中被移除。

3SIRS计算机病毒传播模型

RPastor-Satorras等[5]使用平均场理论研究了在均匀网络上的计算机病毒传播过程,认为感染病毒后瘫痪或获得免疫力的计算机,可以一定的生还率μ再次变成易感染者,则计算机的状态转变过程为:Sus-ceptibleInfectiousRemovedSusceptible,提出了SIRS计算机病毒传播模型:其中,β表示一个已感染病毒的计算机将病毒传染给与其它易感计算机的概率,δ表示一个已感染病毒的计算机可以被治愈的概率。假如感染率β比较高,病毒则会大量传播;假如治愈率δ比较高,病毒传播则会得到抑制。SIRS模型考虑了更加具体一些,注意到瘫痪或获得免疫力的计算机有可能再次变成易感染者,但在云概念的实际应用中,这种可能性变小,虽然病毒感染有可能出现成片爆发的趋势,而由于云安全的执行,对病毒的控制也会进行较为系统的组织。

第6篇:计算机科学与生物学范文

[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。

一、生物信息学的产生

21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。

二、生物信息学研究内容

(一)序列比对

比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。

(二)结构比对

比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。

(三)蛋白质结构预测

从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。

(四)计算机辅助基因识别

给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。

(五)非编码区分析和DNA语言研究

在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。

三、生物信息学的新技术

(一)Lipshutz(Affymetrix,Santaclara,CA,USA)

描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。(二)基因的功能分析

Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。

Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。

(三)新的数据工具

Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。

Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。

参考文献:

第7篇:计算机科学与生物学范文

关键词:DNA计算机;计算方式;生命观

1 DNA计算的理论、特点和问题

1994年11月美国计算机科学家 L.阿德勒曼(L.Adleman)在《科学》上公布了DNA计算机的理论,并成功的运用DNA计算机解决了一个有向哈密尔顿路径问题[1]。这一成果迅速在国际上产生了巨大反响[2],同时也引起了国内学者的关注[3]。一些人相信,DNA计算蕴含的理念可使计算的方式产生“进化”。另一些人则看到DNA计算的理念将有助于揭示生命的本质与演化。总之,这一全新的计算理论,将在数学与生命科学中产生极其深远而广大的影响。同时它也提出了一系列值得我们深思的哲学性问题。

DNA计算机目前尚处在理论研究阶段,一旦它在实用意义上获得成功,DNA计算将彻底改变计算机硬件的性质。在过去的半个世纪里,计算机完全就是物理芯片的同义词。但阿德勒曼DNA计算机则是一种化学反应计算机[4]。它的基本构想是:以DNA碱基序列作为信息编码的载体,利用现代分子生物学技术,在试管内控制酶作用下的DNA序列反应,作为实现运算的过程;这样,以反应前DNA序列作为输入的数据,反应后的DNA序列作为运算的结果。阿德勒曼具体应用哈密尔顿有向图这个经典NPC问题,详细描述了他的理论。

DNA计算机的提出,产生于这样一个发现,即生物与数学的相似性:①生物体异常复杂的结构是对由DNA序列表示的初始信息执行简单操作(复制、剪接)的结果;②可计算函数f(w)的结果可以通过在w上执行一系列基本的简单函数而获得。阿德勒曼不仅意识到这两个过程的相似性,而且意识到可以利用生物过程来模拟数学过程,更确切地说是,DNA串可用于表示信息,酶可用于模拟简单的计算。这是因为:①DNA是由称作核苷酸的一些单元组成,这些核苷酸随着附在其上的化学组或基的不同而不同。共有四种基:腺瞟吟、鸟瞟吟、胞嘧啶和胸腺嘧啶,分别用A、G、C、T表示。一些单个的核苷酸顺序连在一起形成DNA链。单链DNA可以看作是由符合A、G、C、T组成的字符串。从数学上讲,这意味着我们可以用一个含有四个字符的字符集∑=A、G、C、T来为信息编码(电子计算机仅使用0和1这两个数字)。②DNA序列上的一些简单操作需要酶的协助,不同的酶发挥不同的作用。起作用的有四种酶:a.限制性内切酶,主要功能是切开包含限制性位点的双链DNA;b.DNA连接酶,它主要是把一个DNA链的端点同另一个链连接在一起;c.DNA聚合酶,它的功能包括DNA的复制与促进DNA的合成;d.外切酶,它可以有选择地破坏双链或单链DNA分子。正是基于这四种酶的协作实现了DNA计算。

自阿德勒曼用DNA计算机解决了哈密尔顿有向图问题,随后很快便有人用DNA计算机相继解决了其他一些疑难问题(NPC完全问题),如可满足性问题等。与电子计算机相比,DNA计算机有明显的优势。不过,这些还仅仅是利用分子技术解决的几个特定问题,是为解决特定问题而进行的一次性实验。DNA计算机还没有一个固定的程式。由于问题的多样性导致所采用的分子生物学技术的多样性,具体问题需要设计具体的实验方案。于是,便引出了两个根本性的问题,阿德勒曼最早就意识到了它们:①DNA计算机可以解决哪些问题?确切地说,DNA计算机是完备的吗?即通过操纵DNA能完成所有的(图灵机)可计算函数吗?②是否可设计出可编程序的DNA计算机?即是否存在类似于电子计算机的通用计算模型——图灵机——那样的通用DNA系统(模型)?目前,人们正处在对这两个根本性问题的研究过程之中。在我们看来,这就类似于在电子计算机诞生之前的20世纪三四十年代——理论计算机的研究阶段。如今,已经提出了多种DNA计算模型,但各有千秋,公认的DNA计算机的“图灵机”还没有诞生。相对而言,一种被称为“剪接系统”的DNA计算机模型较为成功[5]。

由于DNA链可以比作在四字符集上的串,为DNA计算建模的自然方式就是利用专门处理字符和字符串的形式语言理论。建模的关键就是要将实际的DNA重组抽象为数学上的剪接操作。实际的DNA重组,就是在前面所提到的四种“工具酶”的作用下,对DNA链的切割和粘贴的组合过程。其数学抽象称为剪接操作。大体可做如下描述:给定字符集∑(其元素为符号)及其上的两个字符串x、y,利用剪接规则r剪接x和y的过程可以分为:①在由剪接规则r决定的位置上切割x和y;②分别将结果中x的前段和y的后段、y的前段和x的后段连在一起。∑ 的剪接规则 r是形如α1#β1$α2#β2的词,其中α1、β1、α2、β2是∑的串,#和$是∑外的标记符。我们称z和w是根据剪接规则r=α1#β1$α2#β2剪接x和y的结果,当且仅当存在∑上的x1、xƇ、y2、yƈ使得

x=x1α1β1xƇ, y=y2α2β2yƈ

且 z=x1α1β2yƈ, w=y2α2β1xƇ

并记作(x,y) (z,w)。α1β1和α2β2这两个串称为剪接位点;x和y称为剪接项。剪接规则r决定了切割的位点和位置:第一项在α1和β1之间,第二项在α2和β2之间。值得注意的是位点α1β1和α2β2会分别在x和y中出现多次,如果这样,选择哪一个位点是不确定的。结果会造成对x和y剪接的结果是(z,w)的一个集合。

将剪接操作当作基本工具来构建一种生成机制,便形成了剪接系统。给定一个字符串集A,A∑*,∑*为字符集∑上由连接操作生成的字符串的集合(∑*中的元素为串),以及一个剪接现则集R(r∈R∑*#∑*$∑*#∑*),由此所生成的东西是由如下方法得到的串组成;从集A开始,在A和已获得的串上重复使用剪接规则。另外,应该说明一点,通常剪接x和y得到z和w后,仍可以将x和y当作剪接项,与此相似,对新生成的z和x也没有数量上的限制。但对某些串仅可使用有限次。故在数学上不用集合来表示剪接项,而用多重集——在每个时刻都应当记录每个串可用的个数。至此,可以给出剪接系统的一个简洁而又严格的定义:剪接系统是一个四元组r=(∑、T、A、R),其中∑是一个字符集,T ∑是终结字符集,A是∑*上的多重集,R是剪接规则的集合。

定义了DNA计算的数学模型后,便可以来回答前面提出的DNA计算的完备性与通用性问题。在计算机科学中,众所周知的丘奇一图灵论点深刻地刻画了任何实际计算机的计算能力——任何可计算函数都是可由图灵机计算的函数(一般递归函数)。现已证明:剪接系统是计算完备的,即任何可计算函数都可以用剪接系统来计算。换句话说就是,任何图灵机可计算的函数都可以由这种DNA计算模型来计算。反之亦然。这就回答了DNA计算机可以解决哪些问题——全部图灵机可计算问题。

对于第二个问题——是否存在基于剪接的可编程计算机——也有了肯定的答案:对每个给定的字符集T,都存在一个剪接系统,其公理集和规则集都是有限的,而且对于以T为终结字符集的一类系统是通用的。这就是说,理论上存在一个基于剪接操作的通用可编程的DNA计算机。程序由往通用计算机公理集中添加的字符串组成。程序会有多个,而可利用的公理集合有无穷多个。这些计算机使用的生物操作只有合成、剪接(切割一连接)和抽取。

理论上DNA计算机具有现代电子计算机同样的计算能力,但它具有的巨大潜力(功能)却是电子计算机不可比拟的:DNA计算机运算速度极快,其几天的运算量就相当于计算机问世以来世界上所有计算机的总运算量;它的贮存容量非常大,1立方分米的DNA溶液可以存储1万亿亿位二进制的数据,超过目前所有计算机的存储容量;它的能量消耗只有一台普通计算机的十亿分之一。如此优越的分子计算机当然是激动人心的。然而它离开发、实际应用还有相当的距离,尚有许多现实的技术性问题需要去解决。如生物操作的困难,有时轻微的振荡就会使DNA断裂;有些DNA会粘在试管壁、抽筒尖上,从而就在计算中丢失了。尽管DNA计算机面对着许许多多的质疑,但它的提出者阿德勒曼教授依然是极其乐观的:DNA计算机刚刚提出,尚在胚胎时期,与发展了半个世纪的电子计算机相比,确实相形见细。在他看来,提出DNA计算机并不就是要与电子计算机竞争。首先,分子计算的观念拓宽了人们对自然计算现象的理解,特别是生物学中基本算法的理解。另外,DNA计算的观念向现有的计算机科学和数学提出了挑战,相信它所蕴涵的理念可以使计算的方式发生进化。

DNA计算理论是目前西方发达国家的一个研究热点,有些困难已经通过新的程序设计技术(无须等待生物技术的发展),采用概率算法及修改数学问题等传统的解决方案得以解决。人们大都相信,分子计算的实际应用在未来是可行的。另外,要知道,类似合成杂交、抽取等所有生物操作的问题,都已被大自然中的生物系统所涉及,而且这些问题在生物体内已成功的解决了,这就不会在生物体外解决不了。向大自然学习,问题就会得到解决。

2 DNA计算:计算方式的进化

1994年11月阿得勒曼在提出DNA计算机的时候就相信:DNA计算机所蕴涵的理念可使计算的方式产生进化。后来的研究者就更坚信这一点了。如加拿大的卡尔(L.Kari)就更明确的指出:“DNA计算是考察计算问题的一种全新的方式。或许这正是大自然做数学的方法:不是用加和减,而是用切割和粘贴、用插入和删除。正如用十进制计数是因为我们有十个手指那样,或许我们目前计算中的基本功能仅因为人类历史使然。正如人们已经采用其它进制计数一样,或许现在是考虑其它的计算方式的时候了”[6]。我们以为,这一说法是很有启示性的。确实,仔细回顾一下人类计算方式或计算技术的历史,就不难体会到目前人们的计算方式确实是一种历史的结果,而非计算本性的逻辑必然。不过为了进一步论证和拓展这一观点,下面有必要就什么是计算。计算的方式是什么等问题给予一个简要的回答。

计算的本质是什么?应该说人类对其已经有了一个基本的清晰的认识,这就是递归论或可计算性理论中所揭示的一个基本内容:计算就是依据一定的法则对有关符号串的变换过程。根据丘奇一图灵论点,一切可计算的函数都是递归函数。抽象地说,计算的本质就是递归。不过这里我们想给出一个直观的描述:计算就是从已知符号开始,一步一步地改变符号串,经过有限步骤后,最终得到一个满足预定条件的符号串的过程。这样一种有限的符号串的变换过程与递归过程是等价的、一致的。所谓计算方式就是符号变换的操作方式,尤其指最基本的动作方式。广义地讲,还应包括符号的载体或符号的外在表现形式。从中国古代的筹算方式(一组竹棍表征)、珠算方式,到后来的笔算方式就是一系列的计算方式的变化(它们各自具有各自的操作方式)。相对于后来的机器计算方式,这些计算的方式均可归结为“手工计算方式”,其特点是用手工操作符号,实施符号的变换——摆排竹棍、拨弄算珠或书写符号。机器计算的历史可以追溯到1641年,当年18岁的法国数学家帕斯卡尔从机械时钟得到启示——齿轮也能计数,成功地制作了一台齿轮传动的八位加法计算机。这使人类计算方式、计算技术进入了一个新的阶段。后来经过人们数百年的艰辛努力,终于在1945年成功地研制出了世界上第一台电子计算机。从此,人类进入了一个全新的计算技术时代。就电子计算机而言,至今它也经历了四个大的时期。从最早的帕斯卡尔齿轮机到今天最先进的电子计算机,计算技术有了长足的发展。这是一个计算方式发生重大变革的历史时期。这时计算表现为一种物理性质的机械的操作过程。但是,无论是手工计算还是机器计算,其计算方式——操作的基本动作都是一种物理性质的符号变换,具体是由“加”和“减”这种基本动作构成的。二者的区别就在于前者是手工的,后者是自动的。

然而,如今出现的DNA计算则有了更大的本质性的变化。计算不再是一种物理性质的符号变换,而是一种化学性质的符号变换,即不再是物理性质的‘“加”、“减”操作,而是化学性质的切割和粘贴、插入和删除。这种计算方式的变革是前所未有的,具有划时代的意义。它将彻底改变计算机硬件的性质,改变计算机基本的运作方式,其意义将是极为深远的。我们完全可以做这样一番想象,一旦DNA计算机全面实现,那么真正的“人机合一”就会实现。到那时,人们最不需要的就是电脑,因为大脑本身就是一台自然的DNA计算机,人们真正需要的只是一个接口。DNA计算机蕴涵的理念不仅可以使计算的方式产生进化,而且可以使人类的大脑、思维产生进化。这是我们对阿德勒曼认识的一点补充。然而,尽管DNA计算较之以往的各种计算有了重大的变革,但是,在计算本质上,它同人类有史以来的一切计算都是等价的、一致的。这是因为:任何可计算函数都可由剪接系统来实现,即任何图灵机可计算的函数也可以由DNA计算机来计算。反之,任何由剪接系统计算的函数都可由留灵机计算。这就是说,DNA计算也是一种递归计算。这一结论有着重要的数学意义。它一方面使人们认识了DNA计算的本质;另一方面进一步证实或支持了丘奇一图灵论点,使丘奇一图灵论点首次获得了电子计算机之外的生物计算机的证实,这种证实自然是更加有力的。

综上所述,我们看到,计算之所以为计算,在于它具有一种根本的递归性,或在于它是一种可一步一步进行的符号串变换操作。至于这种符号变换的操作方式如何,以及符号的载体或其外在表现形式如何,都不是本质性的东西,它们无不是一种历史的结果,无不处于一种不断变革或进化的过程之中。符号可以用一组竹棍表征、用一组算珠表征、用一组字母表征,也可以用齿轮表征、用电流表征,还可以分子表征、电子表征等等。不同表征下的符号变换有着不同的操作方式,甚至同一种表征下的符号变换都可以有不同的操作方式。在此,计算本质的统一性与计算方式的多样性得到了深刻的体现。我们相信,随着科学技术的不断发展,计算方式的多样性还会有新的表现。既然DNA计算机的出现已经打开了人们畅想未来计算方式的思维视窗,那么就让我们翘首以待吧。

3 DNA计算:生命进化的方式

生命是什么?生命是怎样进化的?这是人类一个永恒的话题。随着自然科学的不断发展,生命问题也在不断变换着其形式,人们对它的理解、认识也在不断地更新,以适应新的理论的发展与进步。在20世纪八九十年代,由于人类基因组计划、计算机人工生命、遗传方法和DNA计算机等一系列全新的理论和观念的出现,使人们对生命是什么、生命是怎样进化的等重大基础性问题再一次产生了新的理解。这种理解的核心内容是:生命就是一台自然计算机。生命的法则就是算法,生命就是以计算的方式在进化着。DNA计算对这样一种生命观给予了强有力的支持。DNA计算表明了计算存在于生物学的根基上,计算处于生命的核心,生命本身就是由一系列复杂的计算组成的。下面我们对此作一个简要的论述。

什么是算法?简单地说,算法就是求解某类问题的通用法则或方法。通常要求用它能够在有限步骤内一步一步地完成对问题的求解。换句话说,算法也就是对有关数据或符号进行变换的方法规则。计算就是对算法的执行或对数据、符号依据有关规则进行的变换操作。长期以来,计算、算法一直是数学的专有概念。但如今由于电子计算机深刻而广泛的运用,使人们对这两个基本概念有了更宽泛地认识,使它们泛化到了整个自然界。认为自然界就是一台巨型自然计算机。任何一种自然过程都是自然规律作用于一定条件下的物理或信息过程,其本质上都体现了一种严格的计算和算法特征。在此,自然系统相当于计算机的硬件,自然规律相当于计算机的软件,而自然过程就是计算机的计算过程。生命系统作为自然界中最复杂最有特色的系统,它也就是形形的自然计算机中的一种。

DNA计算机就是对生命这种自然机的一种表征。这是因为,DNA是生命的信息库和程序库,既是一套自复制的程序,同时又是一个以进化论为基础发展过来并正在发展的程序。它构成了遗传、发育、进化统一的物质基础。现代生物学表明,一方面DNA可以看作是由A、G、C、T四个字符组成的字符串。从数学上讲,这意味着我们可以用一个含有四个字符的字符集∑={A、G、C、T}为信息编码。DNA代码与计算机代码所不同的只是它不是二进制的,而是一种四进制代码。有人甚至指出:除了专业术语不同之外,分子生物学杂志里面的每一页都可以换成计算机技术杂志的内容。另一方面,DNA能够对该信息载体进行一系列可控制的变换(即化学反应)。变换的具体方式是DNA的复制、剪切、连接、修复,变换的过程就是一种生命过程,也即生命的自构造性特征。因此,我们完全可以把生命看作是一台自然计算机,生命的进化法则就是算法。另外,DNA作为一种自然语言,和计算机程序语言一样,具有不同的层次,具有递归、并行、模块化的基本特征。现代生物学表明,一维线性分子在特定的环境中通过复杂而准确的信息处理,可拓展为一个丰富的四维时空生命体,这种展现过程所获得的新信息反过来又不断地反映到一维线性分子中,导致生物物种的不断进化。这正是DNA程序语言层次性的表现。一维DNA序列只不过是最低级的生命机器语言,所有的高级语言都必须编译成DNA序列语言才能执行。目前,DNA这种自然语言的词法、句法规则我们尚不清楚,但本质上是一种程序化语言[7] 。

DNA计算机的提出,就是一种分子算法的化学实现。以前分子算法,如自复制自动机、胞格自动机、遗传算法、人工生命等全都是在电子计算机上实现的,DNA计算机的出现是分子算法的化学实现的开端。这种立足于可控的生物化学反应或反应系统,无疑更加有力地直接地表明了生物现象与过程的计算特征。而这对于现代生物学的研究自然有着十分积极的影响。正如阿得勒曼所说:DNA计算机的构想,是从另一个角度出发启示人们用算法的观念研究生命。“算法对于生命的意义,就在于以过程或程序描述代替对生物的状态或结构描述,将生命表示为一种算法的逻辑,把对生命的研究转换成为对算法的研究”[8]。在这个意义上,生命就是程序、就是算法——一种能够实现自我复制、自我构造和自我进化的算法。在尼葛洛庞帝的《数字化生存》中,有一个已是众所周知的主题论断:计算不再只和计算机有关,它决定我们的生存。但是,尼葛洛庞帝仅是从社会生活的意义上说这番话的。我们在这里则要赋予它另一种新的含义——生理生存,即计算决定我们的肉体的生存。

生物学界这种算法观念的广泛运用,更增强了人们运用算法观念看待整个自然界的信心,拓展了人们对自然现象的理解。要知道生命是最复杂的自然现象之一,是自然界进化的最高代表。因此,我们完全有理由猜想:整个宇宙也是按算法构成的,是按算法演化的。现实世界之万事万物只不过是算法的复杂程度的多样性。从虚无到存在、从非生命到生命、从感觉到意识,或许整个世界的进化过程就是一个计算复杂性不断增长的过程。看来毕达哥拉斯或许真是对的:万物皆数!应该说,这便是DNA计算机所蕴涵的最深奥的哲学理念:数学可能是万物的基础,数学可能是现实世界和可能世界的核心。今天,我们或许应该将毕达哥拉斯的哲学再向前推进一步:存在的意识就是数学意识。因为DNA计算宣称数学处于生命的核心。

参考文献

[1]L M Adleman. Molecular Computation of Solutions to Combinatorial Problems [J].Science, 1994.266. Science, 1994. 266.

[2]M Linial. On the Potential of Molecular Computing [J]. Science, 1995.268.

[3]邓少平,等.DNA计算的一些基本问题[J].科学(中文版),1996(5).

[4]Barry Cipra.Computer Science discovers DNA[J].What's Happening in the Mathematical Science.AMS,1996(3).

第8篇:计算机科学与生物学范文

关键词:人工生命;人工智能;人造生命;物理主义

中图分类号:N031 文献标识码:A 文章编号:16711165(2011)02002104

一般认为,“人工生命”、“人工智能”和“人造生命”是三个分别从计算机科学领域、智能研究和基因工程领域提出的概念。20世纪90年代未,中科院曾邦哲提出人工生物系统(artificial biosystem)的工程生物系统概念,用以整合计算机领域和遗传工程领域的两个概念。概念上的整合一方面体现了“人工生命”与“人造生命”两者之间的承接性,另一方面也预示着“人工生命”发展与生物学理论发展之间的密切关联。诚如“人工生命是具有自然生命现象的人造系统”[1],那么进入微观领域,生命规律的探索与对生命分子的操作使得“人工生命”具有了反身性。这种反身性恰恰体现了“人工生命”研究并不在于使人“非人化”[2],使生命也成为技术的对象,而是包含了一定生命认识的特殊生命活动。那么,剖析人类基因组计划的推进过程,就可能找到“人工生命”概念演进背后内在思想动因,从而为洞悉生命科学发展趋势提供一条线索。

一、“人工生命”阶段:肯定物理主义

在人体细胞核内,质量只有0.0000005毫克,宽度仅为0.02微米的DNA包含着大约30亿个碱基排列。科学家相信人类DNA序列是人类生命的决定因素,人类生命活动中发生一切事情都与这一序列息息相关。[3]除了特殊情况之外,DNA中含有的庞大信息能够被一字不差地复制,然后传给后代。要想获得这些信息,就需要测定DNA序列的碱基序列,这也是人类基因组计划的核心工作。那么,测序工作则成为“人工生命”的一个阶段,对生命信息传递过程的模拟也就构成了“人工生命”研究的起点。

基于人类全部24条染色体中3×109个碱基具有固定性的化学关系即A-T、G-C,于是DNA碱基序列的测定工作实际上可以被描述为科学家接受生命分子信号的过程。应用申农所建立的一般信息系统模型,在一定的指令下进行信号传递成为“人工生命”的最初目标。强人工生命观念将“生命系统的演化作为一个可以从任何特殊媒介物中抽象出来的过程”(John Von Neumann)。以抢占计算机存储的方式,生命演化过程被计算机程序模拟出来。人们相信,如果生命遵循既定的程序,那么只要编写好程序,生命就能进行准确的信号传递,也就实现了“人工生命”。首先试图为生命编写程序的是生物学家林登迈尔。20世纪60年代中期,林登迈尔为红海藻、青苔等植物的生长发育建立模型,提出了一种被称为“L-系统”的形态发生系统,又被称为“繁殖(发生)算法”。在编写好的程序下,生命系统转化为信号系统。生命信号模型以量化或模型化的方式来展示生命的属性。这意味着:“如果具有冯•诺伊曼式的自我复制能力或繁殖的能力,那么这个实体就是有生命的。”[4]

冯•诺伊曼所证明的自我繁殖的生命信号系统应和了人们对微观生命分子世界的物理主义观点,其实质是将诸如细胞这样一个具有新陈代谢功能的生命单元放在既定的关系下。尽管将生命活动视为一种生命信号传递颠覆了传统的生命物质实体论,却仍然将生命置于某种固定关系下,意味着其也不可能跳出物理主义的决定论框架。一方面,“人工生命”研究进行了生命信号传递模,并在计算机领域中建立虚拟生命系统;另一方面,人们在质疑申农的一般信息模型的同时也开始质疑“人工生命”。针对申农的一般信息模型,有学者认为:“申农通讯信息系统模型具有两方面的重大缺陷:一是该模型未能注意信息系统的一般反馈性机制;二是该模型描述的还仅仅是信息接收系统。”[5]可见,申农的一般信息模型不具有反馈性机制或不能够自创生。于是,这样一种生命的信息论观点,即“在生命运动之中物质实体-载体是流动的,组织形式-信息才是稳定保持的”[6],表明“人工生命”所模拟的对象是在既定关系之下的生命信号的传递过程。

面对人类基因组计划这样巨大的基因工程项目,测定了组成人类DNA的约30亿个碱基中85%的碱基序列只是完成了所谓工作草图。获得的基因草图只是为给基因命名、分析基因创造了条件,需要进一步找到能够提供信息的标记基因,进行基因追踪,但寻找基因的工作却相当复杂。一般信息模型不可能作为模拟这一活动的基础。

二、“人工智能”阶段:怀疑物理主义

一般认为,人类共有5万~10万个基因,如果某个基因发生了变异或者产生缺陷,必然会引起机能上的障碍。根据变异的DNA标记基因来确定另外一个基因的位置,这样就可以将其位置制成详细的地图,通过检查DNA序列来识别基因突变。学者们以DNA标记为基础的DNA基因图谱寻找致病基因。在一阶段,“人工生命”模拟的对象是寻找基因,而寻找基因的关键则体现为对信息的识别。人类基因组计划在此阶段的工作可以反映“人工智能”的研究。

尽管早在1956年,美国的麦卡锡就提出“人工智能”(artificial intelligence)概念,但直到20世纪80年代末,人们才将“人工智能”作为“人工生命”的一种形式。“人工智能”阶段需要计算机能够准确识别信息。对于智能的研究涉及诸如意识(consciouness)、自我(self)、心灵(mind)、无意识(unconscious mind)等问题。对此,之前将生命作为信号系统的一般信息模型显然无法发挥作用。面对信息的识别和反馈机制等一系列问题,人们试图将信息学、控制论、自动化、仿生学、生物学、心理学、数理逻辑、语言学、医学和哲学各学科整合,并在计算机领域实践,甚至在机器人、经济政治决策、控制系统、仿真系统中应用。然而,这种学科上的整合并没有使人们找到合适的模型来取代之前的信号模型用以描述识别信息过程所具有的非线性特征。

对此,一部分学者试图通过重新定义“人工智能”概念,区分出强“人工智能”和弱“人工智能”的方式来解决问题。弱“人工智能”用模拟识别信息后所表现出的行为来反推对信息的识别,也就是让机器的行为看起来就像是人所表现出的智能行为一样。而强“人工智能”则将识别信息的功能强加于计算机,如约翰•罗杰斯•希尔勒(John Rogers Searle)就计算机和其他信息处理机器的工作形式提出“计算机不仅是用来研究人的思维的一种工具;相反,只要运行适当的程序,计算机本身就是有思维的”[7]。无论是强“人工智能”还是弱“人工智能”,都将“人工智能”划分为四类:机器“像人一样思考”、 “像人一样行动”、“理性地思考”和“理性地行动”。但是,这两种观点都没有进一步对任何一种类型进行模型化。这就表明尽管在观念上人们已经不再将生命系统作为信号系统,但其仍成为“人工生命”模拟的对象。

1999年,获得了诺贝尔生理学或医学奖的布洛贝尔创立了著名的“蛋白质的命运”假说,即关于新生成的蛋白质去向的“信号假说”。他认为细胞内存在某种信号,这种信号决定了新生成的蛋白质的去向。这意味着每个蛋白质都能够获得向某个地方移动的信息,就像邮编一样,可以让蛋白质找到准确位置。也就是说,由十几个氨基酸组成的“信号肽”使得蛋白质能够识别信息,并在某种程度上具有了主动性。这种主动性与物理主义的决定论观点发生了冲突。

弄清各种基因各自会生成何种蛋白质成为需找基因的重要环节,因为如果知道了信号肽的基因,就可以知道周围的基因是决定何种蛋白质的基因。“信号肽”的发现大大推进了人类基因计划,然而,“人工智能”研究中并没有明确给出一个可以超越一般信息模型的新模型。

三、“人造生命”阶段:突破物理主义

在识别了基因信息之后,就需要对基因突变作出解释。人们已经发现,致命的基因突变由于地域特征和环境不同,其结果也会各不相同。这就意味着,人们在对待人类基因时必须考虑环境的因素:一方面,环境可能使基因突变形成恶性基因,另一方面则也能促使发生有益的突变,从而形成更为适应环境的基因整体。从后者来看,环境如何引发新基因整体的形成就成为对基因与环境之间关系所进行的解释,这也就成为人类基因组计划的后期工作,此阶段的“人工生命”研究也将面临更为深入的问题。

“对基因整体性的认识大体有两类。一类是在分子遗传学坚信基因独立性存在的前提下,根据不同功能种类的基因间的协同关系诠释基因系统的整体存在。而今,这一方向已在原核生物领域取得辉煌的成果;另一类是在关注物种(种群)的发育和进化并结合分子生物学的基础上,探究基因的整体存在,即基因集成、基因组织单元及其关系的研究。目前,这一方向已受到综合进化论者及其他一些生物学者的高度重视。”[8]后者恰恰体现了环境对基因的作用。“人造生命”的提出则将这种作用的意义凸显出来。从其他生命体中提取基因建立新染色体的操作,实际上就是将特定基因从已有的环境中分离开来,再将提取的基因染色体放入新的环境之中,即嵌入已经被剔除了遗传密码的细胞中,这样染色体在新环境中形成新的基因组织,控制这个细胞,发育变成新的生命体。2010年5月20日,美国私立科研机构克雷格•文特尔研究所宣布:世界首例人造生命――完全由人造基因控制的单细胞细菌诞生,并将“人造生命”起名为“辛西娅”。这项具有里程碑意义的实验表明:新的生命体可以在实验室里“被创造”,而不是一定要通过“进化”来完成。“辛西娅”的产生在一定意义上证明了可以通过人工环境能够实现对基因的作用。

“人造生命”为“人工生命”提出了更深层次的问题。“人工生命”概念不同于传统生命观和科学观。“传统生物学用分析方法研究生命。通过分析,解剖现有生命的物种、生物体、器官、细胞、细胞器,即通过分析现有生命的最小部件来理解生命。人工生命用综合方法研究生命,在人工系统中对简单的零件进行组合,使其产生类同生命的行为,力图在计算机或其他媒体中合成生命。”[9]“人造生命”则进一步模拟生命整体功能如何形成。这也改变了对生命的认识,从“如吾所说的生命(lifeasweknowit)”转变为“如其所能的生命(lifeasitcouldbe)”[10]。生命作为各个功能叠加的物理主义观念被打破,取而代之的是一种功能整体性观念。

“人造生命”已有的成果在一定程度上揭示了环境对基因整体功能的作用机制,如果能够找到体现这种机制的模型,就将推动生命科学的发展。事实上,人类基因组计划都是建立在DNA分子序列的符号化前提下的。没有这种符号操作,人们就不可能应用计算机来获得、识别并整合生命信息。而这一符号学思路恰恰应和了美国著名的科学家、认知心理学家、人工智能学家西蒙(Simon Blackurn)的理论。西蒙的“物理符号系统假设”进一步阐释了这一思路。“物理符号系统假设”强调“所研究的对象是一个具体的物质系统,如计算机的构造系统、人的神经系统、大脑的神经元等。所谓符号就是模式,如任何一个模式,只要它能和其他模式相区别,他就是一个符号。”[11]“物理符号系统假设”从信息论模型进入了符号学模型。“人工生命”从对“生命表现出的行为的功能模拟”转向对“生命内在创造机制的功能模拟”。

这种符号学模型提示,在经常变化的环境作用下,微观生命分子形成了不同的功能整体,具有内在的适应性意义。人们在无法支配环境的情况下支配基因,就可能造成有害的影响。从“人工生命”、“人工智能”到“人造生命”的概念演进,可以得出承认生命本身具有内在意义,具有一定的主动性将成为未来生命科学理论发展的一种趋势。

参考文献:

[1]班晓娟.人工智能与人工生命[J].计算机工程与应用,2002(15):1-7.

[2]林德宏.评人的“非人化”――一种现代技术机械论[J].自然辩证法研究,1999(3):23-27.

[3]孙啸,陆祖宏,谢建明.生物信息学基础[M].北京:清华大学出版社,2005:9.

[4]李建会.生命科学哲学[M].北京:北京师范大学出版社,2006:127.

[5]邬.信息哲学――理论、体系、方法[M].北京:商务印书馆,2005:75.

[6]沈骊天.生命信息与信息生命观[J].系统辩证学学报,1998(4):71-73.

[7]JOHN R. Minds, brains, and programs[J]. Behavioral and Brain Sciences, 1980, 3 (3): 417-457.

[8]董华,李恒灵.基因整体实在论[J].科学技术与辩证法,1997(6):31-34.

[9]林德宏.科学思想史[M].南京:江苏科学技术出版社,2004:326.

第9篇:计算机科学与生物学范文

关键词:自然计算;自然辩证法;一元论;物质智能

一、引言

自然计算(Nature Inspired Computation)具有模仿自然界的特点,通常是一类具有自适应、自组织、自学习能力的模型与算法,能够解决传统计算方法难于解决的各种复杂问题。自然计算的应用领域包括复杂优化问题求解、智能控制、模式识别、网络安全、硬件设计、社会经济、生态环境等各个方面[1,2]。在哲学领域也被有些自学科学家称为“人工生命”[3]。目前在哲学研究领域有提法为“计算主义”,认为“宇宙是一个巨大的计算系统”,自然界的运行规律即“计算”[4]。本文对自然计算的形成、发展和本质规律进行分析,指出其中所包含的自然辩证法思想。

二、自然计算的发展规律

计算方法从经典算法到自然计算的发展过程,是人类对事物的本质认识过程。人类早期在生产生活中,为了合理利用资源,提高生产效率,降低成本,想出了用最少的代价换取最高的效率的方法,即优化计算。通常把研究最优(或近优)解及其求解方法的学科称为优化计算。它是一种以数学为基础,用于求解各种工程问题优化解的应用技术。现代优化算法的主要应用对象是优化问题中的难解问题,也就是优化理论中的NP-hard问题[5]。

优化计算的理论和方法的形成分为三个阶段:古典极值理论、近代数值优化理论、自然计算。基于数学演绎和推理的微分法和变分法是早期古典极值理论的代表性方法,其中比较著名的有柯西(Cauchy)最速下降法、拉格朗日(Lagrangian)数乘法。随着社会生产力的发展,在本世纪40年代,针对运输和生产问题的线性规划求解方法被苏联科学家康托洛维奇提出,而且随后由于电子计算机的发明和飞速发展,基于计算机的近代数值优化方法占据了优化计算的主导地位。牛顿法、单纯形法、共轭梯度、变尺度法和模式搜索法等一系列有代表性的数值计算方法相继涌现并不断完善,使得优化理论形成为一门独立和完整的学科分支[6]。尽管在近代已经有大量的数值优化算法,但是这些理论和方法都是基于严格的数学模型,当模型中变量维数增高、约束方程较多且非线性较强,或者模型无法用现实的方程来描述时,这些数值优化算法都出现如下问题:不能进行有效求解;求解时间复杂度过高、求解精度较低(如陷入局部最优、解不稳定等)。而且由于问题的增加,形成了NP-hard理论,目前已经证明了传统的优化算法无法处理NP-hard问题。

进入80年代以来,生命科学与工程科学相互交叉、相互渗透和相互促进,优化技术和理论中神经网络、进化计算和群体智能计算等新兴算法相继出现和不断完善,形成了适应处理复杂问题并能够在非确定性、非精确环境中进行概率推理和学习的现代优化方法——自然计算[1,2]。自然计算从提出就受到各个领域专家学者的广泛关注,成为众多学科及其相互的交叉学科的研究热点。近年来,自然计算与生物学原理、脑神经科学等学科研究相互融合,在实际研究和应用中发现,它们之间的相互补充可以有效地表示和解决实际问题。随着近十年来智能计算理论的发展与丰富,智能计算的应用领域日渐宽广,在生物医学、工业控制、经济管理、数据挖掘、模式识别、网络智能控制等众多领域都取得了令人瞩目的研究成果和应用。

三、自然计算与一元论

早期人类算法是基于纯粹的数学理论演绎和推理的微分法和变分法,这些方法从本质上来说是人类对一部分自然规律的提取和抽象,是对自然界的不完全认识。随着生产力的提高和生产规模的扩大,人类遇到更多更复杂的问题,尽管这时候已经从最初的极值理论发展为数值算法理论,但是对于NP-hard这类问题人类还是束手无策。一部分科学家想到的是模仿人脑的思维方式去解决问题,即人工神经网络算法。最初的想法是认为如果研究清楚了大脑思考问题和解决问题的方式,构造出类似大脑的计算机神经系统,就可以让神经网络解决所有问题。其中有代表性的有两种神经网络构造方法,第一种是采用自上而下的方式,首先抽取大脑的思考问题的规则和方式,但由于人类还没有搞清楚大脑生理结构上的诸多奥秘,对人脑思考解决问题的规则更不可能完全获取,所以研究出来的神经网络有很多缺陷,造成对很多问题无法解决;第二种是采用自下而上的方式,模仿人类智能的产生过程。人类获取智能是从婴儿时期的遗传反应式智能,到通过学习、记忆获取知识,通过推理产生新智能[7]。这种方式较前一种方式更加接近人类智能的产生过程,但由于对人类智能产生过程的探索还不完全,这种方式构造的神经网络,也只能部分解决问题。

在智能计算被提出之前,生命科学家和计算机科学家通过探索,发现不只有人脑解决问题的方式具有智能,很多自然界的生物解决问题都具有智能。如群体智能算法,是从一些群体生物协作解决问题得到启发而形成。典型的例子如蜜蜂群体可以盖出规则的蜂巢,而且蜂巢的形状、大小以及其他特征都非常规则,似乎是预先计算好而用机械方式产生的[8]。同时期科学发发现生物的免疫系统也具有智能,在病毒入侵后,会产生免疫反应,产生具有记忆能力的抗体。当下次相同的病毒入侵后,能够迅速产生免疫反应,清除病毒。此外,免疫系统还能够分辨哪些组织细胞属于自身,哪些组织细胞被感染或者变异,并自动进行清除。结合这种方式,科学家发明了人工免疫算法[9]。随着越来越多的自然界物质(有机物和无机物都具有智能行为)的智能行为被发现,人类认识到以前的各种算法都只是自然界运行规律的部分体现,人类想要解决所有的NP-hard问题或者解决所有的计算优化问题,必须要认识到自然界运行规律的本质,自然界运行规律包含着解决所有问题的机制,于是将诸如神经网络计算、人工免疫计算、蚁群计算、人工鱼群计算、DNA计算等诸多智能计算都归结到自然计算。目前哲学家、生命科学家和计算机科学家都致力于研究自然界运行规律,获取自然界运行的本质,以便解决所有问题。

从自然计算的发展过程来看,人类提出诸多的算法,如经典的极值理论算法、数值理论算法,这些算法最后都被证明是自然界运行规律的部分体现,为了解决所有的计算问题,必须要用自然计算去解决。算法统一于自然计算,这正是辩证唯物论中一元论的体现。