公务员期刊网 精选范文 生物信息学概念范文

生物信息学概念精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的生物信息学概念主题范文,仅供参考,欢迎阅读并收藏。

生物信息学概念

第1篇:生物信息学概念范文

1 正确的学习态度――物理学习观的前提

在传统的物理教学模式、物理学习方式的驱动下,多数高中学生对物理教师有依赖心理,表现为学习不主动,缺乏浓厚的学习兴趣,上课前等老师来、课堂上等老师讲、下课等老师布置作业等等,这种学习态度与新课改要求格格不入,是不正确的学习态度,新课改倡导学生积极主动学习、主动发展,凸显学生的主体地位。因此,高中生应该主动投入到物理学习的过程中,始终保持良好的学习态度,主动参与到学习中。

“头脑是需要被点燃的火把”,这也给我们物理教学和物理学习提出了培养学生正确的学习观,形成正确的学习态度的必要性。同时心理学研究也表明:在老师的引领下看书学习和听老师讲,学生学会的知识只是所占所学知识的最多是15%,而自己主动探讨、亲身经历的内容则可以达到80%以上。从这一理论来说,老师在多个层面调动学生学习物理的内驱力,让他们以积极地心态学习高中物理,亲身经历学习过程,改变被动的方式,积极投入到物理学习中,为高中物理学习成绩的提高,迈开坚实的一步。

2 找到学习支点――物理学习观的基础

如果将物理学习比作高楼大厦的建筑,支点也就是建筑高楼的脚手架,那么,脚手架搭在哪儿最合适,无疑是关键问题。对于高中物理来说,支点问题就是物理的知识点的理解和物理规律的掌握。

物理学科是实践性比较强的学科之一,物理概念和物理规律等都有“物”的基础,应重视其得出的全过程,知其然知其所以然,学会追根朔源,否则,忽略了物理的“理”,想学好物理就是天方夜谭。

因此,教学中,应该引导学生从记忆概念、背诵规律、题海战术中走出来,否则,做一道题记住一道题的解法,没做过的见到就束手无策,使知识和应用支离破碎。如果每一道习题都能认真分析,明确求解过程的依据,清楚物理的概念和物理规律的理解和运用,逐渐形成独立解决问题的能力,再碰到“生题”时,能快速找到问题的切入点,“生题”也就不“生”了。比如在力学问题中,滑动摩擦力是重点,它与两个相接触的物体间的弹力的方向垂直大小成正比。而弹力是被动力力,它的大小与物体的运动情况和其它受力情况有关,通常由此方向的运动情况用牛顿第二定律解出。如果运动情况或者其它受力情况发生变化,弹力的大小都会发生变化,甚至方向都会变为反向。由于弹力的变化进而引起滑动摩擦力的变化,改变了平行于接触面的运动情况。在这些概念规律和方法掌握后此类问题基本能够迎刃而解。

3 构建知识体系――物理学习观的核心

物理知识包括物理现象、概念、规律和物理方法,老师指导学生构建知识体系,可以采用以线串点的思路。高中物理研究力和运动的关系是其中一条主线,主线上有三条支线,分别是力、运动和反应两者之间关系的规律。第一条支线线上有五种性质力,分别是重力、弹力、摩擦力、电场力和磁场力,主要各自产生机理、大小和方向、相互关系和特点。第二条支线主要有三个描述参量:位移、速度和加速度,几个典型的运动:匀速直线运动、匀加速直线运动、(类)抛体运动、圆周运动和简谐运动,弄清各自运动参量随时间变化的规律等。第三条支线有牛顿定律、动能定理和守恒定律等。几条主线再构建成网络,这样物理知识体系就初步建立。当然完整的体系建立还需做大量的其它工作,但学生只要有了这种意识并开始实施并取得了阶段性成果,他们一定乐于这项工作,其实从某种意义上说我们更需要这个过程。布鲁纳就把结构的重要性放在首位,他强调指出:“不论我们选教什么学科,务必使学生理解该学科的基本结构。”布鲁纳的这一思想道出了构建知识体系的重要性。

4 明确思路和方法――物理学习观的关键

笛卡儿的“最有价值的知识是方法的知识”说出了方法和思路的重要性。物理学板块不是很多,每一个版块思路和方法都不同,比如在力学和电磁学中主体内容是研究力和运动的关系。解决这类问题有两种观点:一是力和运动的观点,在直线运动中运用牛顿第二定律和运动学公式解决,在曲线运动中,抛体运动和类抛体运动运用分解的方法转化为直线运动处理。圆周运动的运动学公式主要是向心加速度的公式。二是功和能的观念。主要涉及两种能量:动能和势能。两个功能关系:一是重力、弹力和电场力等保守力做功等于对应的势能的减少量,二是外力的总功等于质点动能的增加。这两种思路相辅相成,在中学阶段,有些问题由两种思路都能找的解决问题的方法,此时就有方法优劣的甄别的问题。有些只能由一个观点出发得出解决问题的办法。

如果在解决力和运动的问题时,没有这些方法作指导,做题时务必出现思路枯竭,对题束手无策,望洋生叹之感便会油然而生。相反,如果掌握了科学的方法,可以举一反三,将这些方法和思路纳入一定的轨道,便可以快速找到解决问题的途径,从而解决问题技能进一步提高。

第2篇:生物信息学概念范文

关键词:新课改 ;探究实验; 发现问题

物理实验在物理教学中占有重要的地位,它既是物理教学的基础,也是物理教学的内容、方法、手段,在新课程标准的物理教学中倡导学生自主学习、研究性学习,加强科学探究《课程标准》第三部分专门列入一项――科学探究及物理实验能力要求,列表说明探究要素和基本要求,所以实验在物理教学中的地位不但没有削弱,还大大加强了,因为实验能为学生的自主学习、科学探究打下基础,又能为学生的自主学习、科学探究提供物质的保证,在学生智能结构的发展中占有重要的地位 。本人就探究性物理实验教学在高中年级进行了初步的尝试与探索,淡几点实践中的体会.

一、物理探究性学习活动方式

高中物理探究性学习活动的开展方式是多种多样的。 以物理规律为主的探究活动的基本过程是:通过对实验现象的观察,或应用已知规律、理论对某一现象进行逻辑推理,找出一些问题,然后设计实验,采集实验数据,对实验数据进行分析归纳,最终得到规律性的结论。如高一、高二年级的学生可以探究的小课题有:用传感器探究影响摩擦力大小的因素、探究单摆的周期与哪些因素有关、探究碰撞中的能量问题、光在界面发生折射时遵从什么规律、如何查找电路故障、气垫上弹簧振子的周期与质量、劲度的关系等。

二、探究性物理实验需注意的两个问题

1. 实验设计要具有探究性

考察我们当前的实验教学的现状发现,不少课堂上,学生们也在忙于收集数据,解释并求证结果,但是如何根据有限的线索确定证据收集的方向,如何在不止一个可能合理的解释面前做出决策呢?这对于学生至关重要,但这个环节常常被教师替代.缺乏真正意义上的探究。因此,实验设计要具有探究性是指:所设计的实验包含的物理规律往往隐藏在较深的层次,需要学生去挖掘。实验的条件和结果之间往往存在较大的距离,需要学生去跨越。解决问题的方法与途径往往不太明确.需要学生通过尝试错误,得出假设并验证假设来寻找。

2.探究性实验教学设计要在内容上把握主干,形式上注重质量

长期以来,我们重视知识的传授而忽视了能力培养.注重知识的结果,往往淡化甚至不管知识获得的过程。教育太急于看到知识传授的结果,太讲究“效率”了。因此.很多教师用“高效益”的方式将实验的结果得出的规律告诉学生。然后把大量的时间用于反复通过习题训练理解掌握规律,但这样做恰恰是本末倒置的。对于学生还不是很理解的规律,即使是通过大量的习题反复演练.其知识的迁移能力仍是比较弱的,一旦出现新的情境.许多学生将束手无策。

实验小组活动的开展,保持了学生对自然界的好奇心,增强了学生对科学实验探究的兴趣,许多同学在活动中始终有一种兴奋感、满足感,激发了学生质疑和探究的兴趣。我们感到许多学生学习物理的劲头提高了,喜爱物理学科的人数更多了,某些所谓的“差生”也在实验活动中崭露头角,使得其他同学刮目相看。问问题的人多了,学生的分析和观察能力提高了,学生中常常可以看到为了某一个物理问题许多人为它争论,学生间的交流多了,相互合作多了,关系更融洽了,更自信更富于挑战了。课外小制作、小发明是物理实验整体探究性学习的重要途径,这种活动分为验证性小制作和探究性小发明。即使是验证性的小制作,它制作的过程本身就是一种探究性的活动。这种探究性的活动,对培养学生的兴趣和特长具有重要意义,并能为学生今后的创造活动奠定良好的基础。为避免实验制作的盲目性,事先应制订好目标,保证有充足的时间讨论设计可行的实验方案,学生可以小组为单位,在完成实验方案后进行交流取长补短,再次讨论修改实验方案,拿出可行的实验方案可进行制作实验。值得注意的是在小制作、小发明完成后,教师千万不能忽视对学生作品的评价,学生为自己制作或发明出的作品喜悦的同时更希望其他同学老师一同分享他的快乐,教师及时的评讲或评比,既给学生一种满足感,又能够自然巧妙地指出作品中的不足,充分突出了学生的主体性和教师的主导性作用,探究性活动的开展,学生的观察能力,思辨能力,捕捉有用信息的能力、应用物理知识解决具体问题的能力有了很大的提高。

第3篇:生物信息学概念范文

关键词: 生物信息学;高等数学;教学效果; 教学方法; 多媒体

生物信息学是综合计算机科学、 信息技术和数学的理论和方法来研究生物学信息的交叉学科。数学作为生物信息学研究的基本工具, 已经成为生物信息学专业的必修课程。高等数学是大学数学的基础课程, 通过高等数学的学习, 学生不仅可以掌握基本的数学概念, 公式及方法, 更可以提高自己的逻辑能力以及运用数学解决生物信息学问题的能力。因而高等数学教学效果的好坏, 直接影响到一个学校, 一门学科人才的培养, 进而会影响到我国的科技发展水平与现代化进程。笔者结合此领域教师们多年的教学实践, 结合生物信息学的专业特点从课前、 课上、 课后三个方面阐述提高高等数学教学效果的几点建议。

1做好充分的课前准备,有的放矢。

要想在有限的课堂时间内达到最好的教学效果,教师首先需要在课前认真备课, 尤其要注意重点内容的强调以及知识点的衔接, 使得一次课成为一部完整的电影, 而不是多个场景的组合。同时, 由于生物信息学是一门快速发展的交叉科学, 因此在授课的过程中教师应当将生物信息学的前沿发展动态与课程内容进行合理的融合, 这就需要教师在课前阅读大量的科研文献, 做到教学科研一体化。此外, 还要精心制作课件, 好的课件不仅要字体大小适中, 背景美观而不杂乱, 又要适当的加一些有趣的动画。对于高等数学这样一门相对枯燥的学科, 小小的动画会让学生的精神为之一振, 间接提高教学效果。同时要做到内容简洁明了, 真正起到提纲挈领的作用。对于高等数学下册来说, 课件的制作尤为重要。比如, 第一型曲面积分概念的引入, 不仅需要有准确的三维图像, 而且引入概念的过程也要提纲式地逐条列出, 使学生清晰地了解一个抽象的数学概念是怎样产生的。

2多方位开展课上教学实践。

2.1 多媒体与板书结合

多媒体的出现为高等数学的教学带来了极大方便。比如曲线与曲面积分的章节中, 很多问题都需要结合三维图像来解答, 在黑板上画立体图形既浪费时间, 又很难画得准确, 而利用多媒体则只需在课件中插入相应的三维图像就可以了。还有一些冗长的概念或公式, 用多媒体展示一目了然, 省时省力。多媒体虽然为教学带来了诸多方便, 但它并不能完全代替板书。比如, 具体的解题过程如果只写在课件上, 那么学生就只是观众, 在观看一道题怎么解答。而利用板书引导学生,在书写每一步的时候让学生思考下一步应该怎么做, 那么学生就是参与者了。定理或公式的推导也是同样的道理。所以上课时要做到多媒体与板书的有机结合, 多媒体展示提纲和图像, 板书书写具体的解题和推导过程。

2.2 重视基础知识的教学

要狠抓以基本概念、 基本理论、 基本方法为主的“ 三基” 教学。高等数学虽然看起来很难, 但它实际上是由很多基本概念和理论方法交织而成的。只有牢固地掌握基础知识, 才能理解数学的精髓, 才能熟练的运用这些知识来解决复杂的生物信息学问题。对于基本概念, 要用尽可能通俗的, 形象的语言或直观的图像来解释, 必要的时候也可以用实物演示。比如, 莫比乌斯带的定义是单侧曲面, 这个概念用语言很难形容, 但如果用一张纸条演示一下, 学生就完全理解了。对于基本定理, 一定要在黑板上写下详细的推导过程, 让学生了解怎样从一些已有的知识推导出一个新的结论, 这样学生就不是在死记硬背定理的内容, 而是真的学会了。对于基本方法, 则要让学生反复练习, 熟能生巧, 多做练习还会提高学生的计算能力。

2.3 注重课堂练习

在课堂上要坚持" 教师是主导, 学生是主体" 的教学原则,要做到精讲多练、 勤练。每堂课都可能会讲多个知识点, 多种类型题, 如果一味的填鸭式教学, 学生往往只是“ 懂了” , 而不是“ 会了” 。所以在每一道类型题讲完之后, 要立刻找一道相似的题目, 给学生一定的时间让学生自己练习, 及时消化和掌握所学的知识, 并且要重视理论联系实际, 将数学的知识应用到具体的生物信息学研究中去。比如, 介绍了矩阵的概念之后, 就可以向学生介绍基因芯片的制备、 基因表达谱的数据格式等内容, 将基因芯片检测的全基因组范围的基因表达信息用矩阵表示出来了, 矩阵的每一行代表一个基因在所有芯片实验中的表达水平, 每一列代表在同一张芯片上所有基因的表达值, 这样从一个矩阵就可以观察到不同条件下每一个基因的表达变化了。除了每堂课都要让学生有一定的练习之外, 在每一章或者每一个大问题结束之后还要开设习题课。在习题课上, 教师首先要总结这一部分所学的重要知识点以及它们之间的联系, 使学生在思维中形成一个完整有机的知识体系, 整体的把握知识框架, 这比掌握零散的知识点更有效。其次, 对本部分每一种重点的类型题都找一两道类似的题目讲解, 使学生在记忆开始模糊的时候重新回忆起来, 从而牢固地掌握本部分内容, 为开始新的篇章打好基础。

2.4 建立和谐的师生关系

高等数学是一门相对较难的学科, 学生在学习起来比较吃力, 这样就容易形成逆反心理, 因此建立和谐的师生关系是达到良好教学效果的必要条件。首先, 师生之间是平等的,闻道有先后, 术业有专攻而已。这就要求教师在上课的时候不要高高在上, 要多多与学生交流, 在每一个知识点过后及时询问学生是否理解, 如果没理解就再讲一遍。课下也同样要走入到学生中去, 及时解答他们的问题, 还可以跟学生谈一些与课程无关的东西, 拉近与学生的距离。只有切身体验到他们的感受和需求才能更好的完成教与学的任务。

3 通过课后的练习巩固高等数学课上所学的知识

根据艾宾浩斯遗忘曲线, 如果只是上课记住了, 课下就不再复习,那么所掌握的内容就会迅速遗忘。所以, 适量的课后作业是非常必要的, 几道习题几十分钟就可以起到巩固知识的作用。同时, 教师也可以根据自身的科研方向, 设计一些小的科研课题, 鼓励和引导学生进行思考, 如何利用学到的高等数学知识去解决实际的生物信息学问题。此外, 教师对n后作业的批改同样重要, 通过对每一份作业的仔细批阅, 找出学生犯错的共性和个性问题, 在下堂课着重讲解, 那么学生再遇到类似问题时就不会犯同样的错误了。同时还要对做的好的学生给予表扬和鼓励。

高等数学作为生物信息学专业的必修基础课, 其教学效果的好坏直接影响到生物信息学人才的培养以及学科的建设, 而要提高高等数学的教学效果, 就要做到课前认真备课,课上利用多媒体与板书结合的教学手段, 重视基础内容的教学与练习, 同时活跃课堂气氛, 保持和谐的师生关系, 并在课后布置适量的课后作业。

参考文献:

[1] 张红梅.提高高等数学教学效果的几点见解.赤子,2009,4:45

[2] 孙啸,陆祖宏,谢建明.生物信息学基础.第1版.北京: 清华大学出版社,2005.286-287.

第4篇:生物信息学概念范文

关键词 生物信息学 教学改革 医学 教学模式

中图分类号:Q811-4 文献标识码:A

21世纪是生命科学的世纪,人类及模式生物基因组计划的全面实施,使分子生物学数据以爆炸性速度增长。面对基因组学、蛋白质组学、基因芯片、分子进化等大量的生物信息,在计算机科学、网络技术以及生物分析技术的相互作用和渗透下,诞生了一门崭新的学科――生物信息学(Bioinformatics)。生物信息学利用计算机和互联网,以数据库为载体,运用数学算法和计算模型,研究生物信息数据的获取、处理、存储、分发、分析和解释等方面,进而阐明和解释庞杂的生物数据所蕴含的意义。生物信息学跨越了整个生命科学领域,近年来在医药学研究中发挥了不可替代的作用,无论是从分子生物学的角度阐述病因,还是对疾病的预防、诊断、治疗与新药研发都将产生巨大的推动作用,医学生物信息学必然在未来的医学研究中处于关键地位,但生物信息学的理工科特性决定了该课程在医学教育中开展的难度。本文结合医学院校特色和生物信息学课程特点,探讨开设医学生物信息学课程的必要性,分析生物信息学课程在教学实践中存在的问题,提出本校开展生物信息学教学的实施方法。

1 医学生物信息学的主要研究内容

1.1 疾病基因的发现与鉴定

约有6000种以上的人类疾患与特异基因的改变有关,某些关键性基因或其产物的结构功能异常,可以直接或间接地导致疾病的发生。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段。例如:通过构建肿瘤cDNA文库或表达序列标签(expression sequence tag,EST)分析差异表达基因,揭示肿瘤发生的分子水平变化,寻找靶基因。

1.2 药物设计与新药研发

生物信息技术为药物研究、设计提供了崭新的研究思路和手段。利用数据资料、软件工具筛选药物作用的靶位和候选基因,阐明其结构和功能关系,指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物。

生物信息药物设计常用的方法有:①三维结构搜寻,寻找符合特定性质和三维结构的分子,从而发现合适的药物分子。②分子对接,建立大量化合物的三维结构数据库,依次搜索小分子配体使其与受体的活性位点结合,通过优化使得配体与受体的形状和相互作用最佳匹配。③全新药物设计,利用计算机自动设计出与受体活性部位的几何形状和化学性质相匹配的结构新颖的药物分子。

生物信息学方法为药物研制提供了更多的、潜在的靶标,大大减少药物研发的成本,提高研发的质量和效率。

1.3 流行病学研究中的应用

将流行病学的遗传和非遗传性的研究与生物信息学结合起来,会对疾病的机理、个体对某种疾病的易感性和疾病在群体中的分布有更明确的认识,对疾病的预防和治疗有极大的指导意义。

2 医学生物信息学课程的特点及主要困难分析

2.1 课程内容丰富,学科交叉,数据庞杂

生物信息学利用生物学,计算机科学和信息技术揭示大量复杂的生物数据所赋有的生物学奥秘,是一门交叉性学科,并且理科特性很强,需要深入理解分析。目前生物信息学包含了基因组、蛋白质组、代谢及药物等多个部分,每个部分都具有各自的特色和相应的分析技术。根据《Nucleic Acids Research》统计,全球共有约1000多个主要的生物医学数据库,涵盖了生物医学研究的诸多领域。学生不仅要掌握获取和利用海量生物信息的基本知识和技术,还应掌握相关的数学、物理学、计算机程序设计等知识和技术,又因为医学专业学生的数理知识有限,学习起来有一定的困难。

2.2 操作性和实践性强

生物信息学是一门操作性和实践性很强的学科,主要是在互联网环境中,依靠计算机,利用数据库和各种信息处理软件来进行生物信息学方面的分析工作。针对医学专业学生开设生物信息学课程,其教学内容应注重理论与实践紧密结合,着重学习利用计算机对各种生物信息资源和数据库的检索,使用方法与技巧,真正做到学有所用。

2.3 现状与困难分析

目前,国内的生物信息学教学基本沿用以“教师讲授为主”的传统教学模式,与生物信息学交叉前沿性特点不相适应,实验教学单一,多为验证性试验,缺乏综合性和设计性。此外,医学专业学生计算机知识薄弱,对生物信息学的算法与数据库的原理和特点等不甚了解,在高通量数据处理面前力不从心,影响对问题的分析能力。

3 医学生物信息学课程开设实施方法和对策

3.1 根据医学专业特点设计教学内容,建立具有模块化的教学大纲

目前尚未形成系统、成熟的生物信息学教学模式。开设课程之前,对医学专业学生进行问卷调查,让他们选择医学生物信息学课程中感兴趣的、需要学习的知识内容,并提出难点问题。教师汇总问卷结果,对授课内容进行调整,建立模块化的教学大纲,例如:导论模块、数据库及使用模块、基因组信息学及其分析方法模块、蛋白质组生物信息学模块、代谢和药物生物信息学及系统生物学模块等,使学生清楚每个模块的特点和作用,提高学生的学习兴趣,激发学生的学习热情。

3.2 强化实验教学,激发学生的创新思维和创新意识

生物信息学的学习是运用生物医学、数学、以及计算机科学等诸多学科知识进行分析、判断、推理、综合的实践过程,强化实验教学显得尤为重要。另外,采用PBL(Problem Based Learning)教学法,可以有效地激发学生的创新思维和创新意识。

3.2.1 注重实验操作

生物信息学实验课程以计算机操作为主,需要学生灵活应用互联网、数据库和多种生物信息学软件,所以实验操作显得尤为重要,加大实验比例,为学生提供较多的实验操作机会,不仅提高了学生的动手能力,而且大大提高了学生在因特网环境下对生物大分子序列、生物大分子结构进行生物信息学分析的能力,是提高学生学习生物信息学效果的有力保障。

3.2.2 采用PBL教学模式,优化实验内容

加大设计性实验的比例,采用PBL教学法,根据学生能力和兴趣进行分组,由教师提出问题并布置真实性任务,使学生在已有的知识基础上,通过查找文献、小组讨论、探索,最终完成任务,写出试验报告。由教师对任务完成过程及结果进行点评,对学生掌握知识的程度及学生的科研、应用能力进行评价,并提出进一步的提高方向。学生在实验操作的过程中,不断地发现问题、解决问题,有效地激发了学生的创新思维和创新意识。

3.3 改革教学方法,革新考核方式

3.3.1 结合多媒体技术与双语教学

多媒体技术教学灵活生动,教师在讲授难于理解的概念和生物信息学工具时,可以直接打开相关软件和网站进行演示,使抽象的生物信息学知识以具体的、动态的形式展现出来,从而加深学生对课程的掌握程度。此外,生物信息学涉及到的数据库、网站、应用软件多为英文界面,所以双语授课显得尤为重要,教师可借助多媒体,对课程进行中英整合讲解。

3.3.2 结合科研实例进行教学

生物信息学是一门不断完善和发展的学科,数据库的更新、相关软件的升级、算法的优化等,通常会随着科研中遇到的生物学问题变化而变化,所以教师可以结合现阶段的科研背景和具体的研究方向,结合实例进行教学,可以让学生真正掌握利用生物信息学方法解决生物学问题的思路,并培养和提高学生的科学思维能力,使学生由知识的被动接受者变为知识的主动发现者、探究者,教师则由知识的传授者转变为教学活动的指导者、组织者。

3.3.3 采用无纸化考核方式

适当降低课程理论难度,减少不必要的数学理论推导,注重实际应用、解决问题能力的培养,通过上机实践操作,考核学生对基本知识和原理的掌握情况,克服传统的死记硬背现象。

4.结语

生物信息学作为一门交叉学科,发挥了其独特的桥梁作用,已经广泛地渗透到医学的各个研究领域。本文针对开设医学生物信息学课程的必要性和教学模式进行了探讨,以提高学生学习的自主性、实际操作能力和解决问题的应用能力为目标,不断改进教学手段、加强教学过程的趣味性,以期培养综合型的、高素质、现代化医学人才。

参考文献

[1] 伍欣星,赵.生物信息学基础与临床医学应用指南[M].北京:科学出版社,2005.

[2] 张阳德.生物信息学[M].北京:科学出版社,2009.

[3] WeiLi-ping,YuJun.BioinformaticsinChina:APersonalPerspective[J].PlosComputationalBiology,2008,4(4):e1000020.

[4] 汪凡军,张楚瑜.生物信息学在医学上的应用[J].国际检验医学杂志,2006,27(2).

第5篇:生物信息学概念范文

关键词: 生物信息学 农业研究领域 应用

“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。

1.生物信息学在农业模式植物研究领域中的应用

1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。

2.生物信息学在种质资源保存研究领域中的应用

种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。

3.生物信息学在农药设计开发研究领域中的应用

传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。

现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。

4.生物学信息学在作物遗传育种研究领域中的应用

随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物

中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。

5.生物信息学在生态环境平衡研究领域中的应用

在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。

美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。

6.生物信息学在食品安全研究领域中的应用

食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。

转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。

  生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。

参考文献:

[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.

[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.

[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.

[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.

[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.

[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.

[7]guy d,noel

e,mike a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.

[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.

[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.

[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.

[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.

[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.

[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.

[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.

[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.

[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.

[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.

[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.

[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.

[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.

[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75

[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.

[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.

[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.

[25]苏晨曦,潘迎捷,赵勇等.疏水网格滤膜技术检测食源性致病菌的研究进展[j].微生物学杂志,2010,30,(6):76-81.

第6篇:生物信息学概念范文

[关键词]生物信息学;案例教学;生物类专业

[中图分类号]G64 [文献标识码]A [文章编号]1005-6432(2014)48-0179-03

生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、、分析和解释等在内的所有方面,综合运用生物学、数学、计算机科学等方法,阐述和理解数据所包含的生物学意义。作为21世纪生命科学领域发展最为迅速的学科之一,生物信息学已成为介于生物学和计算机科学前沿的重要学科。实验室的每一项技术,从简单的克隆、PCR到基因数据分析都需要在计算机上进行处理。因此对生物学专业的学生而言,具有一定程度的理解和应用生物信息学技术的能力是十分必要的。而课程是为培养目标服务的。这就要求教师在有限的授课时间内,使学生不仅掌握基本的理论知识,紧跟科研的最新进展,而且在今后的科研工作中能学以致用。

1 理论与实践相结合的教学手段

根据当今生物信息学的发展方向,教师结合理论教学内容增加综合性、开放性实验,使学生循序渐进地理解和掌握生物信息学的原理和方法,进而运用合适的生物信息学工具解决问题。本文以两个案例解析这一教学过程。一是信息的简单检索。在获取生物信息的同时,理解数据库概念、动态规划和bootstrap等算法;二是高通量测序的数据分析。在实现大规模数据处理和分析的同时,掌握统计分析基础知识。

1.1 生物信息的简单检索

近一二十年,生物学数据,尤其是序列数据,以指数级的方式增长。以GenBank的核酸数据库为例,每12~20个月数据就翻一番,略高于Moore定律提供的参考数值。如何从这些海量数据中获取想要的信息,已成为生物学专业学生必须掌握的技能之一。而如何正确获取和应用信息,则需要了解数据是如何被存储、解析,以及背后隐藏的算法。因此围绕正确挖掘数据信息这一主题,设计以下案例,通过4步展开教和学。

1.1.1 讲解

基于大数据教师引申出数据库存储信息的概念。而后分类介绍常用的基因组数据库、核酸序列数据库、蛋白质序列数据库、蛋白质结构数据库以及各种常用复合数据库。

1.1.2 演示

了解上述常用的数据库之后,教师实例演示数据库检索。通过逐层提出问题,诱导学生思考如何利用上述不同的数据库资源,一步一步挖掘所需的信息。例如,被测序的片段是哪个基因?该基因编码的蛋白质序列是什么?是否有保守的功能结构域?在亚细胞的什么位置发挥什么功能?可能的三级结构?和哪些蛋白或RNA存在可能的相互作用?它在进化中又是如何演变的?

1.1.3 实践

让学生上机操作上述实例,体验各个数据库的侧重点,并理解不同软件不同参数的意义或差别。比如GenBank和Swissprot的侧重点,PAM-n和BLOSUM-n的选取。

1.1.4 成文

引导学生形成可重复计算的科学文档。对每一个案例,教师展示常规性的文件组织形式:/data,/analysis,/scripts,/reference等。写说明文档的时候,要求学生记录每一个分析步骤的所有细节:数据库的网址、软件的名称、版本、输入的文件、精确的运行参数、结果的提取等。

通过这样的案例教学模式,一是较好地将知识点融合串联到教师讲授和学生上机操作中。二是使学生不仅熟悉各种常见的数据库,而且理解数据库中各个软件及其参数的意义,遇到实际问题也不再束手无策。而教师也可以充分参与到学生的学习中,对学生上机操作过程中出现的一些主要理论与技能问题了如指掌。通过教―学―练―教―练,达到学以致用的教学目的。三是培养学生创建较好的文档及其组织形式,形成科学研究的可重复性(replication)和可复现性(reproducibility)。不仅有利于追溯前因,而且对代码的复用,以及对结果应用于新项目都非常必要。

1.2 高通量测序数据的分析

随着高通量测序技术的兴起,大量物种的全基因组数据、转录组数据和其他类型数据被测定完成或正在进行中,每天都有成千上万的数据被源源不断地输入相应的生物信息库中。这些大规模数据的不断产出,使得生物学专业学生掌握高通量数据分析技术已成为一种趋势。因此,教师有必要将这部分内容由理论讲授过渡到上机操作。

1.2.1 介绍

教师以DNA测序技术发展为主线,理论介绍De Novo测序、ChIP-seq测序、RNA-seq测序、Methyl-seq测序等。并通过拍摄的录像,向学生直观地展示不同的测序仪及其特点。

1.2.2 演示

教师对整个分析过程进行详细的阐述并实时上机演示(下图)。以转录组RNA-seq为例,包括测序质量的评估(碱基组成和碱基质量分析)、clean reads的筛选、利用TopHat/Bowtie将筛选出来的reads比对到参考转录本、统计reads在参考基因上的分布情况及覆盖度,判断比对结果是否通过第二次质控、通过cuffmerge将重复测序得到的reads形成一致性转录本、基因结构优化、基因覆盖度统计、使用cuffdiff筛选差异表达基因和鉴别可变剪切体、对结果基因进行聚类分析、GO和pathway富集性分析。

1.2.3 实践

让学生分组讨论并上机实现上述数据分析流程。掌握基本的Linux命令、统计计算和可视化分析。

1.2.4 成文

引导学生形成规范化文档和脚本,以便回溯和可重复性使用。

高通量数据分析不仅涉及的知识点多,而且需要在Linux下进行简单的操作和软件的使用。对生物学专业的学生来说,容易造成心理上的抗拒。教师可以采用“分而食之”的策略:将教学内容分成相对独立完整又有一定联系的几个部分(下图)。对于每部分内容,教师利用已讲解的相关知识给学生实时演示,并给出教师自己的理解和结果。然后把学生分组,让他们根据自己的理解,带着兴趣和疑问上机实践。并在上机操作过程中,鼓励学生之间、学生与教师之间及时讨论交流。最后让学生将所有内容串联起来,介绍本组的实验内容及解决办法。通过这种方式能较明显地消除心理顾虑,有助于学生独立思考,独立解决问题。

“RNA-seq数据分析”案例教学流程图

2 以能力测试为中心的考核方式

对于生物学专业的学生而言,生物信息学是一门实践性很强的学科。因此,教师采用以“能力测试”为中心,知识与技能考核并重的考核方式。以上述两个案例为例,在期末考试中,教师将NCBI GEO中“(RNA-seq[Title])AND “Mus musculus”[porgn:__txid10090]”722个实验数据,随机分配给每个学生。要求每个学生对分配到的RNA-seq数据进行差异表达分析,聚类分析和富集性分析。并选择合适的基因,分析其保守的功能结构域、亚细胞定位以及可能的蛋白质结构和功能、可能结合的转录因子、相互作用的蛋白质网络和信号通路、构建相应的系统进化树。

学生对上述每一个小题从“知识点”、“参考资料”、“使用软件或工具”、“参数”、“脚本”、“结果”分别答题,不仅非常有效地明确所学的内容,而且很好地杜绝了作弊行为。

3 教学效果

为了解案例教学的效果,本课程案例教改活动向2011级生物科学和免疫学专业学生QQ群发放电子问卷,共收回82份答卷,统计结果如下表所示。从表中可以看出,案例教学模式使学生有较强的参与感,能较好地提高学生的学习兴趣,学生对理论问题的认识更为深刻。

4 结 论

案例教学基于具体的事例,将一系列的知识点有机地串联起来,并通过实例操作达到学以致用的目的。从学生反馈意见可以看出,这种理论与实践结合的教学模式,很好地提高了学生的学习兴趣。考虑到有限的授课时间和不同学生的学习背景,作为教师需要设计合适的案例,从而达到较好的教学效果。一般可以遵循以下原则。

4.1 具有代表性

所选的案例既要经典又要紧跟科学前沿。比如第一个案例所蕴含的数据库检索、序列比对和系统进化树的构建,在生物信息学中,属于较经典且核心的知识点。而第二个案例选择的对象则与当前的科研热点紧密联系。

4.2 具有偏向性

生物信息学本身是个交叉学科,涉及的知识点相对较多。面对生物类专业背景的学生,我们侧重生物信息学方法或者工具(软件)的应用,而不是强调算法。比如第一个案例中系统进化树的构建,我们只是以5条8bp长的序列为例讲解最小进化法和邻接法、最大简约法、最大似然法以及贝叶斯推断,重点在于强调不同的数据适合采用上述哪些方法以及如何用Mega等软件实现系统进化树的构建。

4.3 先后案例有层次性

比如第一个案例中,学生掌握了Windows下的序列比对。对于第二个案例中Linux下的Bowtie就容易理解并操作。

4.4 具有拓展性

比如第一个案例中,在Windows的DOS下进行批量序列比对时,不同的参数设置,输出不同的数据格式。第二个案例中,Bowtie最多允许3个错配,如果允许更多的错配数,则可以采用SOAPaligner/ SOAP2实现。学生可以根据自己的兴趣和能力,选择拓展性内容进行继续学习。

4.5 良好的成文习惯

引导学生养成良好的文档组织和书写习惯。每一个案例,都要求学生形成可重复性和可复现性的文档,对于整理分析思路、核实结果、重复使用代码都起到事半功倍的效果。

生物信息学是现代生物科学研究的重要工具和载体。如何有效正确地应用生物信息学,是每一个生物实验者需要具备的能力。教师应紧跟学科发展的速度,围绕学以致用的原则,将案例教学科学地、和谐地应用到教学实践中,不仅使学生掌握一定的理论知识,从而正确地应用软件工具,而且逐渐培养学生自我分析和解决问题的能力。

参考文献:

[1]LuscombeNM,Greenbaum D,Gerstein M.Whatis bioinformatics? A proposed definition and overview of the field[J].Methods Inf Med,2001,40(4).

[2]ENCODE Project Consortium.An integrated encyclopedia of DNA elements in the human genome[J].Nature,2012,489(7414).

[3]1000 Genomes Project Consortium,Abecasis GR,Auton A,Brooks LD,DePristo MA,Durbin RM,Handsaker RE,Kang HM,Marth GT,McVean GA.An integrated map of genetic variation from 1,092 human genomes[J].Nature,2012,491(7422).

[4]Sandve GK,Nekrutenko A,Taylor J,Hovig E.Ten simple rules for reproducible computational research[J].PLoS Comput Biol,2013,9(10).

[5]McCormick M,Liu X,Jomier J,Marion C,Ibanez L.ITK:enabling reproducible research and open science[J].Front Neuroinform,2014(8).

[6]李伟兰.论大学生学习心理障碍的成因及基本对策[J].湖北函授大学学报,2012,5(25).

第7篇:生物信息学概念范文

关键词:药物筛选;分子印迹技术;高通量筛选技术;生物芯片技术;生物信息学技术

药物筛选是应用适当的方法和技术根据特定的目的对药物进行优选的过程。药物的种类很多,从大量的药物中找出对特定疾病有针对性治疗作用的药物是个复杂的过程。传统的药物筛选一般是采用生物学方法,也就是将药物与相应的病原作用,能够有效抑制病原生长或对已有病原有杀灭作用的即为有效药物。然而对于由病毒或细菌引起的具有强传染性的疾病此种方法是一项既繁琐,危险性大又对实验条件要求极高的工作。因此,应建立非生物学方法来替代传统生物学方法。所谓的非生物学药物筛选方法即在不接触传染性病原的情况下进行药物筛选。筛选的方法可以是间接的筛选药物,如分子印迹法、生物信息学法;也可以是获得病原的相应结合靶点来选取有效药物,如高通量筛选技术和生物芯片技术。本文将对非生物学药物筛选方法进行简要综述[1]。

1分子印迹技术

分子印迹技术也叫分子烙印技术或分子模板技术(molecularimprintingtechnique,MIT),是一种模拟抗原与抗体相互作用的人工生物模板技术。分子印迹聚合物(molecularlyimprintedpolymers,MIPs)也就是由分子印迹技术制备出来的,具有高效、稳定、使用寿命长等优点。在对映体和异构体的分离[2,3]、固相萃取[4,5]、缓控释给药系统[6]、临床药物分析、膜分离技术[7]、模拟酶催化[8]、化学仿生传感器[9]等领域中MIPs都展现了良好的应用前景。MIPs的制备过程为:①在溶剂(致孔剂)中将模板分子和功能单体按照一定比例混合后一定条件下进行反应,通过共价键或非共价键作用形成可逆的模板分子-功能单体复合物;②加入交联剂、引发剂,使模板-功能单体复合物通过聚合反应在模板分子周围形成高交联的刚性聚合物;③将模板分子(印迹分子)从聚合物中洗脱解离出来,这样在聚合物的骨架上便留下了一个对模板分子有“预定”选择性的识别空位。空位中含有精确排列的与模板分子官能团相互补的由功能单体提供的功能基团[10]。分子印迹聚合物中的空位和模板分子形状、大小完全一样,从而实现对模板分子的特异性识别。印迹聚合过程如图1所示[11]。MIT具有分子识别性强、固定相制备简便快速、操作简单、性质比较稳定(耐酸碱、耐高温、高压等)、溶剂消耗量小、模板和MIPs都可以回收再利用等优点。

应用分子印迹技术,根据已筛选出的对相应病原有抑制作用的化合物作为模板建立生物法替代筛选模型。一方面可以避免与病原的直接接触,增强安全性;二是可以在普通实验室进行实验,实验条件要求低;三是有针对性的选择有效药物成分,缩短了筛选时间和实验强度;四是精确有效筛选。如中草药含的化合物结构类型多样,含量悬殊且许多成分是未知的,因此从中分离纯化有效成分是一项费时费力的工作,而且容易丢失微量的有效成分。为了尽快从中草药中寻找出高效的实体药物及各配方的有效成分,以及将中药推向国际市场并从中发现疗效显著的符合欧美市场要求的新药,就可以应用分子印迹技术来达到这个目的。谢建春等[12]以骆驼蓬种籽中抗肿瘤活性化合物哈尔满作为模板,用非共价键法制备了对哈尔满结构类似物哈尔明及哈马灵具有强亲和性的分子印迹聚合物。分离鉴定了骆驼蓬种籽甲醇粗提物中所含的哈尔明及哈马灵两种抗肿瘤活性成分。此实验结果说明了通过分子印迹技术能够有效地对中草药活性成分进行分离。实验还说明了通过分子印迹亲和色谱与质谱联用可以分离鉴定复杂成分中有效成分。这对于筛选已知药物的结构类似物无疑是种简单快速安全的方法。

2高通量药物筛选技术

高通量药物筛选(highthroughputscreening,HTS)是20世纪80年代后期发展起来的一项快速寻找新药的技术。筛选的对象是药物作用靶点,根据待选样品与靶点是否相互作用来判断待选化合物的生物活性。高通量药物筛选技术涉及自动化控制技术、细胞生物学技术、药理学实验技术、分子生物学技术和管理技术以及计算机计算等。随着各学科的发展及相应技术的成熟[13],高通量药物筛选技术凭借其自动化操作系统和微量灵敏的检测系统,使其筛选速度快、规模大、用量小实现一药多筛。

高通量筛选的体外模型通常有分子水平模型和细胞水平的模型,分子水平模型主要分为受体模型、酶筛选模型和离子通道筛选模型。细胞水平药物筛选模型是以细胞功能为基础的筛选模型。各种模型筛选的原理有3个方面,一是待选化合物与靶点的作用。多数情况下药物与靶点相结合从而产生治疗作用。其作用原理如同受体-配体相互作用。可以与相应受体结合的化合物就有可能是有活性的成分;二是待选化合物对酶活性的影响。生物体内的许多生理生化反应都必须有酶的参与,加入待测化合物的同时测定酶的一些指标,以指标的变化为依据来评价化合物的作用。此种模型相对易于检测,被普遍使用;三是待测化合物对细胞的作用。通过化合物的筛选,了解整体细胞对化合物作用的反应。靶向细胞因子、生长因子、离子通道和G-蛋白耦联受体(GPCR)在细胞水平上的功能性检测中都取得了成功的进展[13]。(i)复合物化(ii)聚合(iii)去模板分子a.模板分子b.聚合前复合物c.聚合后复合物d.模板分子去除后的聚合物图1分子印迹聚合过程示意图据统计高通量药物筛选技术每天可以对数以万计的样品化合物进行筛选,应用得最多的是组合化学库。我国中药资源丰富,许多资源尚未开发。有部分中药及组方治疗作用明确,但大部分作用机理尚不清楚。从而限制了中药的发展及国际化的要求。由于中药有效成分具有多靶点的作用特点,故天然产物库的建立将为高通量药物筛选提供更多更全面的化合物[14,15],同时中药有效成分的作用机理也会明确。罗弟祥等[16]用PTP1B(蛋白酪氨酸磷酸酶1B)抑制剂高通量筛选模型对17940个植物提取物和其组分进行了筛选,阳性率为2.85%[17]。另外针对肿瘤、2型糖尿病[18]、神经系统疾病、免疫系统疾病和感染性疾病等相关靶点明确的疾病,已经逐步建立和完善了以高通量分子筛选模型为初筛的筛选体系。随着生物化学、分子生物学、细胞生物学、蛋白质组学及基因工程等学科的发展,疾病的发病机理越来越明确。特别是对于一些病毒和病菌,它们的致病靶标也越发的清晰。只要针对相应的靶标进行筛选,就能够很快找到相应的有效药物,这样就可以减少操作的危险性,避免与相应病原直接接触,同时也加快了药物的筛选速度及筛选的精确性[19]。曹鸿鹏等[20]以神经氨酸酶(NA)为抗流感药物的作用靶点建立可用于高通量药物筛选的模型来筛选NA抑制剂,初筛发现12个化合物对流感病毒神经氨酸酶有可重复的抑制活性。高通量药物筛选过程是从药物作用靶点水平筛选药物即只是停留在分子细胞水平,而药物的作用多数是要全面分析。由于药物经过体内循环代谢到达靶点时的浓度及代谢物药效是有变化的,所以必须在筛选之后进行相应的组织器官和整体动物水平的药物筛选来确定药效。

3生物芯片技术

生物芯片(biochip)是指采用光导原位合成或微量点样等方法,将大量生物大分子如核酸片段、多肽分子甚至组织切片、细胞等生物样品以阵列式有序地固化于支持物(玻片、硅片、聚丙烯酰胺凝胶、尼龙膜等载体)的表面,组成密集二维分子排列,然后与已标记的待测生物样品中靶分子杂交,通过特定的仪器对杂交信号的强度进行检测分析来判断样品中靶分子的种类和数量[21],从而实现对细胞、蛋白质、DNA以及其它生物组分的检测,把生化分析系统中的样品制备、生化反应和结果检测3个部分有机的结合起来,具有快速、高通量、高信息量、平行化、集约化、微型化、自动化、成本低、污染少、用途广等特点[22]。

生物芯片包括基因芯片、蛋白质芯片、芯片实验室(微全分析系统)、细胞芯片以及组织芯片等。另外根据原理还有组件型微阵列芯片、通道型微阵列芯片、生物传感芯片等新型生物芯片。药物通过不同的靶点作用于组织细胞,直接或间接地影响细胞内基因的表达及蛋白质的生成。通过对用药前后两组样品进行表达谱生物芯片检测,就可以反映出该药物作用后相应组织或细胞中基因表达谱及蛋白质等的变化,从而揭示药物的作用。生物芯片技术可以寻找药物靶标、进行毒理学研究、研究药物处理细胞后基因的表达情况、药物分析、中药研究、指导临床个体化用药、抗药性研究、建立生物技术平台等[23]。

托娅等[24]研究基因芯片筛选抗肿瘤血管生成中草药的相关基因,实验结果显示利用基因芯片技术可从基因水平解释中药的作用机制,为新药的开发提供理论依据。LiX等[25]采用微流体芯片技术检测中药成分对白血病细胞的早期细胞毒性,结果表明用此法不但能够缩短药物筛选的周期、降低实验成本而且还能解决传统技术中遇到的颜色和化学干扰问题。生物芯片技术使高通量药物筛选的单靶点单模型模式转变为同时对多靶点进行筛选的新模式,逐渐形成了超高通量药物筛选的概念。由于生物芯片体积小,包含的药物作用靶点多,从理论上讲,生物芯片技术和高通量药物筛选技术相结合,不仅可同时对大量化合物进行生物活性筛选,而且可同时对大量药物作用靶点筛选。随着分子生物学的发展而建立起来的分子水平的药物筛选模型,可以从更深入的层次评价药物的作用,从而可以为许多疑难病症提供新的治疗途径和方法。应用生物芯片大规模的筛选研究可以减少大量的动物试验,缩短药物筛选所用时间,增强实验过程中的安全性,从而带动药物的研究和开发。

4生物信息学技术

第8篇:生物信息学概念范文

【关键词】亚细胞定位;特征信息提取;预测算法

亚细胞定位是指某种蛋白或某种基因表达产物在细胞内的具体存在部位,即根据所给出的蛋白质序列来预测其所在的亚细胞位置。蛋白质是基因功能的执行者,机体中的每一个细胞和所有重要组成部分都有它的参与,正是由于它是与生命及与各种形式的生命活动紧密联系在一起的物质,越来越多的生物学、生物信息学研究者开始对蛋白质的功能预测及分析进行了研究。然而,蛋白质只有经分选信号引导后运输到特定的细胞器中,才能参与细胞的各种生命活动,执行它的功能,如果其运送位置发生偏差,将会影响细胞功能甚至整个生物体。因此,蛋白质在细胞中的正确定位是细胞系统高度有序运转的前提保障。研究细胞中蛋白质定位的机制和规律,预测蛋白质的亚细胞定位,对于了解蛋白质结构、性质和功能,了解蛋白质之间的相互作用,研究疾病机理和发展新药物以及探索生命的规律和奥秘具有重要意义。

随着核酸和蛋白质序列等生物数据的高速膨胀,单纯以传统实验方法来确定蛋白质亚细胞定位具有成本高、实验时间长,预测精度不理想,会耗费大量的人力和物力等缺点,已经无法满足生命科学研究的需要。因此,需要寻找一种快速、有效、准确的计算方法来预测蛋白质亚细胞定位。近年来,生物信息学在这方面开展了广泛的研究并且取得一系列很有意义的成果,数据库的构建和亚细胞定位分析及预测加速了蛋白质结构和功能的研究。一方面,生物信息学研究可以对大规模的实验数据进行分析和提取生物学信息,同时可以根据现有数据对一些目前还未知的蛋白质做出预测;另一方面,不断增长的亚细胞定位数据也可以用来验证并改进预测结果。目前,利用生物信息学方法进行蛋白质亚细胞定位预测已经成为了一个研究热点。

从20世纪90年代初至今,蛋白质亚细胞定位预测一直是生物信息学研究的热点问题之一。通过分析国内外研究者的研究方法,不难发现这些方法的主要不同在于两个方面: 第一,蛋白质特征信息的提取,主要是指将蛋白质相关特征信息提取出之后转化成高维的特征向量,作为预测的输入。蛋白质序列特征信息主要包括氨基酸顺序相关性、氨基酸在蛋白质中出现的频率、氨基酸物理化学性质等。第二,预测算法的设计,根据提取的特征向量集,利用有效的算法预测蛋白质的亚细胞定位。算法影响亚细胞预测精度的重要因素,现有预测算法中,统计学和机器学习方法使用的最为广泛。

利用计算方法来预测蛋白质亚细胞定位属于统计模式识别中的模式多分类问题。问题的研究一般包括以下四个步骤:(1)具有客观代表性的蛋白质数据集的构建; (2)蛋白质序列的特征提取,即蛋白质序列编码,从蛋白质中提取特征参数,实现字母序列到数值特征的转换;(3)预测算法的选取,即如何根据提取的特征参数,设计有效的分类或识别模型类;(4)对预测结果进行评估,即预测模型的测试与检验以及结果性能的评估。

1 数据集的构建

研究蛋白质亚细胞定位的数据集基本来自SWISS-PROT数据库。该数据库建于1986年,是目前世界上存储蛋白质序列最主要的一级数据库之一。利用这个数据库研究蛋白质的亚细胞定位时,需要对其中的数据进行筛选。通常的筛选标准有:(1)针对研究对象,挑选特定物种的相关蛋白质序列;(2)在构建数据集时,需要知道每个蛋白质序列所在的亚细胞位置,所以只有包含明确的亚细胞定位信息的序列才被选入数据集中;(3)序列长度不能太短;(4)数据冗余度,要求同源性低;(5)排除样本量太少的亚细胞类别。

除了利用SWISS-PROT数据库外,还有LOCATE、TargetP家族数据集等。近年来,随着研究的不断深入,蛋白质序列数据集越来越复杂,目前最复杂的数据集是酵母蛋白质序列数据集,包含22种亚细胞蛋白质。

2 蛋白质特征信息的提取

蛋白质序列特征提取的目的是,从蛋白质序列中提取特征信息,并用适当的数学方法来描述或表示这些信息,使之能正确反映序列与结构或功能之间的关系,这于蛋白质亚细胞定位是至关重要的,也是研究蛋白质功能结构的关键。根据提取特征信息的不同,可以归纳为3类。

2.1 基于氨基酸的组成和性质

氨基酸组成是一种最基本的序列特征,也是亚细胞定位预测中使用得最为普遍的一种蛋白质特征信息。蛋白质一般有20 种氨基酸组成,氨基酸组成将每种氨基酸在蛋白质序列中出现的频率抽取出来作为一个20维的向量。1994年,Nakashima和 Nishikawa最早通过利用氨基酸组成进行了蛋白质亚细胞定位预测,对细胞内和细胞外蛋白质定位分别取得了88%和 84%的预测准确率。

2.2 基于蛋白质序列的N端分选信号的方法

一般认为蛋白质在合成的过程中,其N端包含一些特殊的分选信号,这些信号能够指导新合成的蛋白质分选到特定的亚细胞中,包括信号肽、线粒体转移肽、叶绿体运输肽、核定位信号、类囊体腔转移肽和过氧化物酶体定位信号等。这种信息的有效性取决于蛋白质序列完整性,一旦蛋白质序列的N端信号不完整或者丢失,预测结果就可能失效。

2.3 基于功能域和基因注释的方法

蛋白质序列在长期的进化过程中,某些特定位点上的氨基酸残基具有高度的保守性,这些位点称为功能域。2002年功能域组分的概念首次被用于蛋白质亚细胞定位,这种方法显著提高了亚细胞定位的质量。2006年,引入GO注释来预测人类蛋白质的亚细胞位置。但是,基于功能与和基因注释的方法对于数据库功能注释信息的完善程度依赖性较大,如果数据库中没有足够的功能域或基因注释条目,那么将无法确定蛋白质的亚细胞定位。

由于不同的特征从不同的角度刻画蛋白质序列,目前没有一种特征能够很好地刻画蛋白质的亚细胞定位特征,单独利用某种特征难以在预测效果上取得大的突破。将多种特征提取方法组合起来已经成为亚细胞定位预测中最为普遍的一种方法。

3 蛋白质亚细胞定位预测算法

蛋白质亚细胞定位预测中另一个重要因素是识别算法,成功的分类算法应该是能够高效、正确的将不同亚细胞位置的蛋白质分开。在蛋白质亚细胞定位预测方面,主要的算法包括5类:基于简单选择判别规则的方法;基于距离度量的近邻方法;基于人工神经网络的方法;基于马尔可夫模型的方法;基于向量机的方法。常用预测方法有神经网络、支持向量机 、最邻近算法三种。

(1)神经网络。神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。神经网络具有良好的鲁棒性和容错性,因此,不仅在蛋白质亚细胞定位领域受到青睐,在模式识别的其他领域也得到了广泛的应用。

(2)支持向量机。支持向量机是一种基于统计学习理论分类技术,它在蛋白质特征向量映射到的高维空间中,找到一个使(下转第32页)(上接第12页)分类误差最小的最优分类面。由于支持向量机具有较好的推广能力,许多学者选择它作为蛋白质亚细胞定位预测的首选分类器。

(3)基于距离的近邻方法。基于距离的近邻方法原理是根据某种距离度量方法来度量样本之间的相似性,距离越近则两样本有可能出现在相同细胞器中。随后的研究中,研究者将基于距离的近邻方法做了推广,如模糊K近邻方法,加权模糊K近邻方法等。基于距离的近邻方法,不需要人为的选择参数,适合求解大规模问题,运算速度较快。

随着研究的不断深入,将多种算法进行融合,来预测蛋白质亚细胞定位已经逐渐成为研究的趋势。2010年,赵禹等用离散增量结合支持向量机方法预测蛋白质亚细胞定位。多种算法的融合,在提高蛋白质亚细胞定位预测的精度和加快算法运行速度方面取得了良好的效果。

4 预测算法的检验和评估

选用适当的预测算法之后,需要对算法进行评估,即检验出算法的准确率,它是评价一个分类算法性能好坏的重要指标,也是与其它分类预测算法比较的依据。预测算法的检验方法主要有自身一致性检验、独立性检验、留一法检验三种[29]。

留一交叉验证(1eave-one-outcross-validation,LOOCV)每次取出数据集中的一条蛋 白质序列作为测试样本,而剩余的蛋白质序列作为训练集对测试样本的亚细胞进行定位预测。直到所有样本序列都被测试一遍为止。LOOCV的缺点是计算成本高,费时,但是其结果更加严格可靠,已经在很多方法中得到了应用。

评估预测算法常用的算法评价指标有 :敏感性、特异性和 Matthew相关系数。敏感性指标是指每类样本中被正确识别的比例,反映了预测成功率;特异性指标是指被判别为第i类的样本中真正属于第i类的比例,反映了预测的可信度。

Sensitivity(i)=■×100%

Spencificity(i)=■×100%

Matthews相关系数MCC可以对算法的准确率进行评估。

MCC(i)=■

其中,tp(i)是第i类样本中被预测正确的数目,fn(i)是第i类样本被错误的判别为其他类别的数目,fp(i)是非第i类样本但被预测为第i类样本的数目,tn(i)是非第i类样本中被预测正确的样本数目。MCC指标取值0至1,取值越高说明分类器的性能越好,当MCC取1时,所有样本均被正确识别;当MCC取0时,分类器的判别效果与随机指派的结果一样,这样的分类器是最差的。

【参考文献】

[1]徐建华,朱家勇.生物信息学在蛋白质结构与功能预测中的应用[J].J Med Mol Biol, 2005,2(3):227-232.

[2]张树波,赖剑煌.蛋白质亚细胞定位预测的机器学习方法[J].计算机科学,2009,36( 4):29-33.

[3]张丽.蛋白质亚细胞定位的序列编码及预测方法研究[D].湖南:湖南大学计算与通信学院,2010.

[4]郭丽丽,陈月辉.基于机器学习的蛋白质亚细胞定位预测[J].信息技术与信息化,2011,5:73-75.

[5]吴文佳.蛋白质亚细胞定位预测方法研究[D].南京:南京航空航天大学,2008.

第9篇:生物信息学概念范文

关键词:信息论;哲学;本体论;自我

信息论的创始人申农为解决通讯技术中的信息编码问题,提出通讯系统的一般模型,发表了《通信的数学理论》《噪声中的通信》两篇论文,从而奠定了信息论的理论基础。他指出“信息论(狭义的)的基本结果,都是针对某些非常特殊的问题的,它们未必切合像心理学、经济学以及其他一些社会科学领域。”[1]因此,信息论分为广义信息论和狭义信息论。狭义信息论即申农早期的研究成果为主,它以编码理论为中心,主要研究信息系统模型、信息的度量、信息容量、编码理论及噪声理论等。广义信息论又称信息科学,主要研究以计算机处理为中心的信息处理的基本理论,包括评议、文字的处理、图像识别、学习理论及其各种应用。维纳认为“信息既不是物质,也不是能量,信息就是信息,不懂得它,就不懂得唯物主义。[2]”虽然维纳并没有给出信息的确切定义,但却第一次将信息科学映射到哲学问题上。

此后,信息科学的发展冲击了20世纪下半叶以来的哲学思想路线,重新开启了对哲学形而上问题的探讨。虽然从物理角度来说,信息是按照一定的方式排列组合起来的信号序列,它借助于某种介质作为通道来传递、加工和贮存。但是随着现代科学技术的发展,信息科学技术建构起了全新的语言环境、精神环境,“把我们从对事物的直接领悟中顺顺当当地推到由逻辑间隔隔开的世界中[3]”,使“知识源保持着一种抽象的控制论意义下的距离[4]”,从而消解了现实中的语言涵义。而现代人类依靠网络空间高速传播的思想,将世界空间缩小,人们凭借大众传播媒介或个人或组织给予的信息来建构起世界的“脑海图景”,并以此来判断世界并给予回应。正如“洞穴”隐喻一般,真实移动的“实体”不再真实,而意识、信息构筑的世界更“实际”,真实的世界成为“符号的宇宙”。哲学家海姆认为虚拟现实表现为七大特征:模拟性、交互作用、人工性、沉浸性、遥在、全身沉浸和网络通信。正统哲学都是基于客观实在现实性范畴框架内的哲学,客体是意识的容器,在主体和客体之间具有明显界限,而信息科学技术的发展,“电子化”的语言方式可快捷地扫描人的思想,意识的力量在某种程度上得以强化。由此,使我们不得不重新思考信息科学是否揭示并决定着我们对世界的认知和发问方式。

哲学本以人本意识为主,是自觉之自我的最高意识成就,它依赖于社会的发展而发展。在康德建立了系统完善的形而上学之后,尼采宣布了“上帝已死”,海德格尔对“自我”“存在”的考证也对人类自身发展做了完备的总结,维特根斯坦认为“哲学仅余下的任务是语言分析!”,似乎哲学没落到只囿于语言这一狭小领域,但信息科学技术的发展为自我、本体等哲学概念提出了重新思考的空间。信息科学在自身运动、发展的进程中,呈现出自身历史的反映、自身性质的规定、自身发展的种种可能性这三种自在、自为、再生的基本形态,这三种关于事物历史、现状、未来的间接存在凝结在一个具有特定结构和状态的直接存在物中,这种直接存在的结构和状态被凝结着它的间接存在所规定。也即是说,自我、本体等概念被信息科学尤指信息技术、互联网这一间接存在所规定。方东美先生认为:“希腊人把时间的体系化成空间的体系,然后再就时间来看,表面上是有过去、现在、未来的实践连续性,而这个过去、现在、未来,都可以化成现在的影像。换句话说,是把真实现在变成空间化的现在,这样就便于把过去的影像纳入了现在,把未来的影像也以前瞻的方式把它收到现实当中,然后以一个空间化的现在笼罩一切过去现在和未来”[5]。这样一种“了解时间的不重要,才是智慧之门[6]”,因此,哲学关于“我”、“本体”、“存在”等概念的思考由时间、空间的三维方向转向一维的趋向。

此外,分析哲学家卡尔纳普对语义信息的关注,将申农的信息论引向人类领域,认为由于人的选择、接受、记忆的选择性存在,信息本身存在着解读的很大不确定性和可能性,因此有主观与客观、低级与高级、自然与社会信息等之分。生物信息学认为生物信息包括遗传信息、神经――激素信息、代谢信息和人脑信息等多方面。物理学家T.Stonier在《信息物理学》提出的“信息子”认为“有组织就必然有结构,有结构就必然有信息”。在信息N论中,信息不是具有“粒子性”的能够构成世界的“本原”,而是具有演绎性的能够生成世界的“生元”,信息的“生成”特性使世界本体成为一种过程本体,也就成了一个信息集合体。这些在信息论基础上发展起来众多交叉学科,如量子信息学、生物信息学、物理信息学等等,他们都试图从信息主义解释万物缘由的本体论论调,暂且不论对错,但其提供的视角也是一种哲学尝试。虽然信息科学技术在某种程度上剥离了对生命的人文关怀,使其变得些许冰冷,但对一些哲学概念的分析给飘散在浩浩荡荡信息长流中的理论派别提供了一种更深层次、更基础的思维范式,从而推及对人类、宇宙的认识。

(作者单位:四川省社会科学院研究生院)

参考文献:

[1]钟义信.信息科学原理[M].福建人民出版社,1988,26.

[2]N.维纳.控制论[M].北京:科学教育出版社,1962,48.