前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的生物信息学主题范文,仅供参考,欢迎阅读并收藏。
[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。
一、生物信息学的产生
21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。
二、生物信息学研究内容
(一)序列比对
比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。
(二)结构比对
比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。
(三)蛋白质结构预测
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。
(四)计算机辅助基因识别
给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。
(五)非编码区分析和DNA语言研究
在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。
三、生物信息学的新技术
(一)Lipshutz(Affymetrix,Santa clara,CA,USA)
描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen, Branford, CT, USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。
(二)基因的功能分析
Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。
Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列 是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distant relationship)。Levitt(Stanford univeersity,Palo Alto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(ab initio folding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segment matching)来完成的,计算机程弃SegMod就是基于同源模建方法的。
(三)新的数据工具
Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(common coordinate system)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。
Candlin(PE applied Biosystems,Foster City,CA,USA)介绍了一种新的存储直接来自ABⅠPrism dNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。
参考文献
中图分类号: G643;Q-3 文献标识码: B 文章编号: 1008-2409(2008)05-0967-03
人类基因组计划的成功实施使生命科学进入了信息时代。基因组学、蛋白质组学和生物芯片 技术的发展,使得与生命科学相关的数据量呈线性高速增长。对这些数据全面、正确的解读 ,为阐明生命的本质提供了可能。连接生物数据与医学科学研究的是生物信息学(Bioinform atics)。应用生物信息学研究方法分析生物数据,提出与疾病发生、发展相关的基因或基因 群,再进行实验验证,是一条高效的研究途经。医学是研究生命的科学,医学研究在基础上 就注定离不开对生物信息的了解。
我国目前医学研究生教学模式主要有两种, 一是医学本科教育延续过来的理论型, 这种类型 的教育是在本科教学大纲的基础上, 按照教学计划进行理论讲授, 最后按照导师指定的课题 完成毕业论文。这种培养模式突出理论学习, 忽视了实验机能和科研能力的培养。二是科研 能力培养的前轻后重型, 前期只是进行理论授课, 后期由导师指导学生的科研。这种模式虽 然开设了一定的实验项目, 但对研究生科研能力的培养缺乏系统性, 并且前期的培养不足直 接影响到研究生后期的学位课题和论文的进度、质量。
因此,笔者对生物信息学在医学硕士研究生中的教育初探,不但有利于该门课程尚未完全形 成成熟的课程体系之际,为教师学习借鉴先进的教育思想与教学实践经验,更有利于医学硕 士研究生对生物信息学的学习。
1 生物信息学的研究范围
生物信息学是一门新兴的交叉学科,涉及生物学、数学和信息科学等学科领域,并注定以互 联网为媒介,数据库为载体,利用数学知识、各种计算模型,并以计算机为工具,进行各种 生物信息分析,以理解海量分子数据中的生物学含义。
生物信息包括多种类型的数据,如核酸和蛋白质序列、蛋白质二级结构和三级结构的数据等 。由实验获得的核酸蛋白序列和三维结构数据等构成初级数据,由此构建的数据库称初级数 据库。由初级数据分析得来的诸如二级结构、疏水位点、结构域(Domain),由核酸序列翻译 来的蛋白质以及预测的二级三级结构,称为二级数据。创新算法和软件是生物信息学持续发 展的基础,高通量生物学研究方法和平台技术是验证生物信息学研究结果的关键技术。因此 ,现代生物信息学是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学 等学科相互渗透而形成的交叉学科,是应用计算机技术和信息论方法研究蛋白质及核酸序列 等各种生物信息的采集、存储、传递、检索、分析和解读,以帮助了解生物学和遗传学信息 的科学。从其研究所涉及的学科上看,生物信息学是集生物学、数学、信息学和计算机科学 一体化的一门新的科学;从其研究的主要内容上看,基因组信息学、蛋白质的结构模拟以及 药物设计是生物信息学的三个重要组成部分,并有机地结合在一起[1]。
2 医学硕士研究生中的生物信息学教学初探
2.1 课堂教学重在教授实践技巧与方法
生物信息学在医学研究生中的教学应以教授实践技巧为主,以介绍原理为辅,深入浅出,注 重课堂知识与科研实践的紧密结合。课堂讲授应简要介绍生物信息学的相关算法、原理,着 重介绍其使用技巧与方法,真正做到“有的放矢”,而这也是教学的重点和难点。
在教学中对于这部分内容应遵循深入浅出、避繁就简的原则,结合具体实例分析算法,避免 空洞复杂的算法讲解让学生觉得枯燥乏味、晦涩难懂,产生畏惧心理,知难而退;注重讲解 使用技巧与方法的思想和来龙去脉,让学生真正掌握解决问题的思路,培养其科学思维能力 ,并采用探讨式教学鼓励学生思考,通过讨论与研究的方式循序渐进的掌握复杂的内容,介 绍相关的教学和物理学知识,使学生充分体会到生物信息学与其他学科的关系,其他学科的 思想方法对于生物科学的重要性,培养其自觉地将其他学科的方法和思想应用于解决生物 学问题的科学素质。 任何学科都处于不断地发展、更新中,生物信息无论是理论研究还是 应用研究仍处于不断发展完善中,同时随着新的应用领域和新问题的发现,其他学科的方 法也在不断地应用于生物信息学,进一步增加了其多学科交叉融合的深度和广度。
2.2 充分利用现代化教育技术,采用案例教学
目前,高等院校在教室内配备的多媒体投影播放系统,促进了多媒体教学的广泛应用。生物 信息学采用多媒体教学是适应学科特点、提高教学效果和充分利用现代化教育技术的一项基 本要求。作为生物信息学教学的基本模式,多媒体教学使讲解的内容更加直观形象,尤其是 对于具体数据库的介绍以及数据库检索、数据库相似性搜索、序列分析和蛋白质结构预测等 内容涉及到的具体方法和工具的讲解,可以激发学生的学习兴趣,加深学生对知识的理解和 掌握,提高学生理论与实践相结合的能力。
但多媒体教室也有局限性,学生主要以听讲为主不能及时实践,教师讲解与学生实践相脱节 ,如果将生物信息学课程安排在计算机房内进行,并采用多媒体电子教室的教学方式可以解 决上述问题。在教学中采用启发式教学,为学生建立教学情景,学生通过与教师、同学的协 商讨论,参与操作,发现知识,理解知识并掌握知识。例如在讲授“目的基因序列的查寻” 时,除对基本内容的介绍,如数据库的发展、分类等,其他采用案例法,让学生利用搜索工 具查找三大公共核酸数据库,并通过数据库网站的介绍内容对该数据库的发展、内容、特点 进行学习并总结,通过讨论和实际的数据库浏览操作了解三大公共核酸数据库并且掌握数据 库使用方法。
2.3 采用“讲、练”一体化的教学模式,强调学生实践能力的培养
生物信息学课堂教学积极学习借鉴职业培训和计算机课程教学中“讲、练、做”一体化的教 学模式,在理论教学中增加实训内容,在实践教学中结合理论讲授,改变了传统的“以教师 为中心、以教材和讲授为中心”教学方式。
根据教学内容和学生的认知规律,灵活地采用先理论后实践或先实践后理论或边理论边实践 的方法,融生物信息学理论教学与实践操作为一体,使学生的知识和能力得到同步、协调、 综合发展。通常采用先讲后练的方法,即首先介绍原理、方法,之后设计相关的实训内容 让学生上机实践。对于操作性内容和生物信息分析的方法和工具的讲解采取了进行实际演示 的方法,教师边讲解边示范,学生在听课时边听讲边练习或者教师讲解结束后学生再进行练 习,理论与实践高度结合,充分发挥课堂教学的生动性、直观性,加深学生对知识的理解, 培养和提高学生的实践操作能力。
2.4 发挥网络教学优势,优化生物信息学实验教学内容
生物信息学实验教学主要是针对海量生物数据处理与分析的实际需要,培养学生综合运用生 物信息学知识和方法进行生物信息提取、储存、处理、分析的能力,提高学生应用理论知识 解决问题的能力和独立思考、综合分析的能力。生物信息学实验教学内容的选择与安排应按 照循序渐进的原则,针对特定的典型性的生物信息学问题设计,以综合性、设计性实验内容 为主,明确目的要求,突出重点,充分发挥学生的主观能动性和探索精神,以激发学生学习 的主动性和创造性为出发点,加强学生创新精神和实验能力的培养。生物信息学实验教学以 互联网为媒介、计算机为工具,全部在计算机网络实验室内完成。在教学中,充分利用网络 的交互特点实现信息技术与课程的结合。教师通过电子邮件将实验教学内容、实验序列、工 具等传递给学生,学生同样通过电子邮件将实验报告、作业、问题和意见等反馈给教师,教 师在网上批改实验报告后将成绩和评语发送给学生,让学生及时了解自己的学习情况。
生物信息实验教学与现代网络和信息技术密不可分,在教学工作中充分利用现代教育技术较 其他课程更具优势。区别于其他生命科学课程,在教学过程中要求有发达的互联网和计算机 作为必备条件。调查显示国内高校都已建立校园网,其中拥有1000 M主干带宽的高校已占调 查 总数的64.9%,2005年一些综合类大学和理工类院校将率先升级到万兆校园网[2] ,这些都为生物信息学课程在高校开设提供了良好的物质基础。
2.5 考试无纸化,加强实践能力考核
考试重点是考查学生对生物信息分析的基本方法和技能的掌握程度和对结果的分析解释能力 。因此,在生物信息学考试中尝试引入实践技能考试,重点考核学生知识应用能力。实践技 能考试采用无纸化考试方式,学生在互联网环境下,对序列进行生物信息分析并对结果进行 解释,不仅考核学生对基本知识和基本原理的掌握,而且考查学生进行生物信息分析的实际 能力和分析思考能力。通过实践技能考试,淡化理论考试,克服传统的死记硬背,促进学生 注重提高理论用于实践的综合能力,同时更有效地提高学生计算机应用能力。除采用实践技 能考试并将其作为学生成绩的主要部分外,还加强了对学生平时学习态度、学习能力、创新 思维等方面的考核。
总之,生物信息学教学是网络环境下生物教学的全新内容。通过上述教学措施,提高了学生 的 学习积极性、实践操作能力、解决实际问题的综合应用能力及创新能力,收到了良好的教学 效果,得到了学生的普遍欢迎,具有较强的可操作性和实践性。在今后的教学实践中,随着 教师自身素质的提高和进一步的教学改革将会不断完善生物信息学教学,培养具有“大科学 ”素质和意识的医学研究生人才。
参考文献:
[1] 张阳德.生物信息学[M].北京:科学出版社,2004:4.
关键词: 生物信息学 农业研究领域 应用
“生物信息学”是英文单词“Bioinformatics”的中文译名,其概念是1956年在美国田纳西州Gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者Lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家Collins F博士在华盛顿隆重宣布人类基因组计划(Human Genome Project,HGP)的所有目标全部实现[3]。这标志着后基因组时代(Post Genome Era,PGE)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。
1.生物信息学在农业模式植物研究领域中的应用
1997年5月美国启动国家植物基因组计划(NPGI),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(HGP)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(TA)集合数据库TIGR、植物核酸序列数据库PlantGDB、研究玉米遗传学和基因组学的MazeGDB数据库、研究草类和水稻的Gramene数据库、研究马铃薯的PoMaMo数据库,等等。
2.生物信息学在种质资源保存研究领域中的应用
种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至DN段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、AFLP、SSAP、RBIP和SNP等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。
3.生物信息学在农药设计开发研究领域中的应用
传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。Itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-Neu5Ac2en和4-胍基-Neu5Ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。TANG SY等学者研制出新一代抗AIDS药物saquinavir[12]。Pungpo等已经设计出几种新型高效的抗HIV-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。
现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。
4.生物学信息学在作物遗传育种研究领域中的应用
随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。
5.生物信息学在生态环境平衡研究领域中的应用
在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 DNA,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。
美国农业研究中心(ARS) 的农药特性信息数据库(PPD) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(Toyohashi University of Technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(IRIS) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。
6.生物信息学在食品安全研究领域中的应用
食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用PCR法[19]、RT-PCR法、荧光RT-PCR法、多重PCR[20]和多重荧光定量PCR等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、ELISA法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。
转基因食品检测是通过设计特异性的引物对食品样品的DNA提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。
生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。
参考文献:
[1]Yockey HP,Platzman RP,Quastler H.Symposium on Information.Theory in Biology.Pergamon Press,New York,London,1958.
[2]郑国清,张瑞玲.生物信息学的形成与发展[J].河南农业科学,2002,(11):4-7.
[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.
[4]曹学军.基因研究的又一壮举――美国国家植物基因组计划[J].国外科技动态,2001,1:24-25.
[5]MICHAEL B.Genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[J].PhilosTransR Soc Lond B Bio Sci,2002,357(1422):731-736.
[6]卢新雄.植物种质资源库的设计与建设要求[J].植物学通报,2006,23,(1):119-125.
[7]GUY D,NOEL E,MIKE A.Using bioinformatics to analyse germplasm collections [J].Springer Netherlands,2004:39-54.
[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.
[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.
[10]Austen M,Dohrmann C.Phenotype―first screening for the identification of novel drug targets.Drug Discov Today,2005,10,(4):275-282.
[11]ARUN AGRAWAL,ASHWINI CHHATRE.State involvement and forest cogovernance:Evidence from the IndianHmi alayas.StComp International Developmen.t Sep 2007:67-86.
[12]TANG SY.Institutionsand collective action:Self-governance in irrigation [M].San Francisco,CA:ICSPress,1999.
[13]PUNGPO P,SAPARPAKORN P,WOLSCHANN P,et a.l Computer-aided moleculardesign of highly potentHIV-1 RT inhibitors:3D QSAR and moleculardocking studies of efavirenz derivatives[J].SAR QSAR EnvironRes,2006,17,(4):353-370.
[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[J].计算机与应用化学,1999,16,(5):400.
[15]VASSILEV D,LEUNISSEN J,ATANASSOV A.Application of bioinformatics in plant breeding[J].Biotechnology & Biotechnological Equipment,2005,3:139-152.
[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[J].微生物学杂志,2008,28,(4):93-97.
[17]程树培,严峻,郝春博等.环境生物技术信息学进展[J].环境污染治理技术与设备,2002,3,(11):92-94.
[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[J].微生物学杂志,2009,29,(6):61-64.
[19]赵玉玲,张天生,张巧艳.PCR 法快速检测肉食品污染沙门菌的实验研究[J].微生物学杂志,2010,30,(3):103-105.
[20]徐义刚,崔丽春,李苏龙等.多重PCR方法快速检测4种主要致腹泻性大肠埃希菌[J].微生物学杂志,2010,30,(3) :25-29.
[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[J].微生物学杂志,2010,30,(6):71-75
[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[J].重庆医学,2010,(22):3128-3131.
[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[J].微生物学杂志,2009,29,(4):79-83.
[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[J].微生物学杂志,2009,29,(5):67-72.
[25]苏晨曦,潘迎捷,赵勇等.疏水网格滤膜技术检测食源性致病菌的研究进展[J].微生物学杂志,2010,30,(6):76-81.
关键词: 生物信息学 农业研究领域 应用
“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。
1.生物信息学在农业模式植物研究领域中的应用
1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。
2.生物信息学在种质资源保存研究领域中的应用
种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。
3.生物信息学在农药设计开发研究领域中的应用
传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。
现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。
4.生物学信息学在作物遗传育种研究领域中的应用
随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息
学的方法,先从模式生物中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。
5.生物信息学在生态环境平衡研究领域中的应用
在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。
美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。
6.生物信息学在食品安全研究领域中的应用
食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。
转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。
生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。
参考文献:
[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.
[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.
[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.
[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.
[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.
[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.
[7]guy d
,noel e,mike a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.
[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.
[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.
[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.
[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.
[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.
[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.
[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.
[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.
[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.
[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.
[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.
[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.
[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.
[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75
[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.
[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.
[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.
关键词: 生物信息学 农业研究领域 应用
“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。
1.生物信息学在农业模式植物研究领域中的应用
1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。
2.生物信息学在种质资源保存研究领域中的应用
种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。
3.生物信息学在农药设计开发研究领域中的应用
传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。
现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。
4.生物学信息学在作物遗传育种研究领域中的应用
随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物
中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。
5.生物信息学在生态环境平衡研究领域中的应用
在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。
美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。
6.生物信息学在食品安全研究领域中的应用
食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。
转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。
生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。
参考文献:
[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.
[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.
[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.
[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.
[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.
[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.
[7]guy d,noel e,mik
e a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.
[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.
[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.
[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.
[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.
[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.
[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.
[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.
[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.
[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.
[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.
[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.
[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.
[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.
[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75
[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.
[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.
[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.
[25]苏晨曦,潘迎捷,赵勇等.疏水网格滤膜技术检测食源性致病菌的研究进展[j].微生物学杂志,2010,30,(6):76-81.
关键词:生物信息学;研究生;培养模式
中图分类号 G642.0 文献标识码 A 文章编号 1007-7731(2016)22-0120-02
随着基因组测序技术的飞速发展,学科交叉的趋势也越来越明显,如生物信息学、数字医学、金融数学、环境生态学等,交叉学科的产生意味着跨学科时代的到来,这是不同科学门类领域学科相互渗透融合,凭借对象整合、概念移植理论渗透和类比推理等方法,对象世界及其变化进行体认和再现后形成的新学科[1]。这就要求我们必须创新,鼓励创新,而鼓励创新需要鼓励创新性人才培养,尤其是研究生阶段的人才培养,因为这个阶段的培养是建立在学科发展的国际前沿基础上的,但在高等院校中,由于当前研究生教育制度的“单一专业制”,限制了跨学科人才培养。然而,面对如此巨大变革,庞大的测序数据也是当前研究人员面对最困难的问题,此时生物信息学得到高度重视。尽管生物信息学是以生物为研究对象的学科,但是它的研究手段却是计算机与统计学算法相结合,涵盖了生物信息的获取、处理、存储、分配、分析以及阐述等各个方面以理解和利用海量的生物学数据为目的学科,这对我们生物学专业的学生来说无疑是学习和研究的屏障,培养其理论思维能力,创新能力和实践能力尤为重要,如何在生物学本科生中培养生物信息学研究生是生物学科研究生培养的难点。探索如何克服这一难点而培养能力和自主性强的生物信息学科研究生将具有十分重要的意义,本文就跨学科培养生物信息学研究生所面临的一些问题进行探讨。
1 跨学科培养生物信息学研究生的必要性
跨学科或交叉学科的出现发挥了明显的作用,为许多领域的科学问题提供了答案。法国作家普鲁斯特曾说,真正的发现之旅,并不是去寻找新大陆,而是采用一种新视角[2]。在某一个学科内无法解决的问题,如果换个角度就很可能迎刃而解,这种创新性的问题答案的获得不但需要多学科的协同攻关,更需要在研究生教育方面培养一大批高层次的具有跨学科思维并掌握多学科理论与方法的人才,这样才能更好地推动科技创新。在国外,跨学科研究已经非常普遍。如在德国的柏林工业大学已经建立跨系研究中心、跨学科研究小组、大学研究论坛以及跨学科研究协会等组织;在日本,名古屋大学建立了复合专业群以促进学科前沿交叉领域的发展和研究生素质的提高[3]。这些不争的事实均反映了在世界范围内跨学科研究生培养的趋势所在,跨学科生物信息学研究生的培养也不例外。
2 跨学科培养生物信息学研究生的优势与不足
我国研究生教育培养已从传统单一学科的培养模式向跨学科和学科交叉的培养方向发展,跨学科、跨专业选择的研究生数量也日渐增多,已成规模。跨学科的研究生同本专业研究生相比,既有优势,也存在一定的不足,当然包括跨学科培养的生物信息学研究生。跨学科培养的优势在于研究生能虼佣嘟嵌瓤悸俏侍猓有可能因为学科交叉而产生独特的研究方法和思维方式,形成创新点;也可以从不同的专业角度发现问题、观察问题、研究问题、解决问题。不足之处有:在新学科的基础知识及专业知识积累上有所欠缺,对很多问题理解不透彻,初期也可能学习,科研压力大很难进入科研状态,如果自我调节能力不强,导致有些研究生可能会出现自卑情绪,需要一定的适应阶段,但过了这个阶段,跨学科的优势即可逐步显现出来。
3 跨学科培养生物信息学研究生的制约因素
在高等教育体系中,本科教育和研究生教育分别培养应用型人才和研究型、创新型人才[4]。近年来,为了适应社会发展对复合型高层次人才的需求,我国许多高等院校逐步开展了对研究生的跨学科培养。但在培养过程中,存在一些制约其发展因素,主要表现在以下几个方面:
3.1 培养理念与方式 在传统的教育管理理念与方式下,研究生教育的培养主题依然是单学科,而非多学科、交叉学科、跨学科。我国大多数院校的研究生培养仍然采取这种模式,虽然也培养了一些杰出人才,但总体上不利于研究生多方面知识的获取,使研究生缺乏创新性。对于跨学科培养研究生,行政管理条例应该灵活,研究生学制期限也不应该固定,因人而异等等均收到一定的限制,无法实施。在高等院校在课程的设置上,一般很少设立学科跨度大的专业必修课和选修课,学院与学院之间基本不再进行跨学院跨学科开课,选课上缺乏协作性,研究生培养计划中也没有整体的培养应对跨学科的培养方案等。
3.2 培养体制与机构 我国大多数的高校是以一级学科为基础设置学院,学院数量较多,学校也习惯于以学院为基本单位,学院内部学科包容量较少,专业划分过于详细,而此时可能忽略了跨学科与交叉学科过于规范的培养框架。目前,我国有很多高校拥有独具特色和优势的学科与专业,但由于僵化的培养制度,难于形成特色或优势学科主导下的跨学科培养方案,更不利于高层次人才的培养。所以,跨学科培养存在一定的体制问题,学生在掌握了大量交叉学科知识及研究方法后,还要认清主导学科并能解决实际问题。如果在培养过程中过于重视现有的培养制度和教学计划,就容易使整个培养体系走向僵化,不但不能促进跨学科的发展,更难以培养出适应社会发展需要的复合型高层次的人才。
3.3 导师与研究生个人 在指导教师方面,大多数导师也不具有跨学科学习与跨学科研究的经历,其开展的研究项目也只是单一学科的。而刚刚跨学科的研究生也可能和导师的情况类似,这样导师与学生的学科知识结构都相对单一,对其他学科知识及发展动态掌握不够,使跨学科培养在双方面都受到了阻碍。所以,在跨学科研究上,导师和学生都应该拥有跨学科研究的知识背景,既要掌握一定的跨学科相关知识和研究方法,也要经常参与跨学科的学术交流,积极进行跨学科建设和跨学科项目的研究。
4 跨学科培养生物信息学研究生的必要措施
跨学科的研究生培养是一个长期而又复杂的过程,跨学科生物信息学研究生培养也不例外,从培养过程中涉及的制约因素考虑,为提高跨学科生物信息学研究生创新人才的培养水平,提出以下主要措施:
4.1 建立健全相关跨学科培养制度 在组织机构上,设置好学院后,应注意适当增加学院的学科数量,以促进不同学科不同专业的交叉与融合。在资源利用上,实现资源共享,由学校统一进行管理大型实验设备和仪器,建立相关的技术与服务平台,避免资源闲置或浪费现象的发生,提高资源利用率,更要打破学科专业之间的界限,积极争取校企与科研院所的合作等,进行研究生联合培养。
4.2 完善跨学科培养方式 跨学科培养涉及到很多环节,首先在考试科目的设置、试卷命题及复试上,都要尽可能按跨学科招生。既要注重考察考生知识容量,也要考察考生的能力是否具备跨学科培养的潜力,优先录取综合素质高的跨学科考生。此外,招生录取途径也应该多样化,如导师有招生自[5]。在研究生课程教学上,更要注重课程的交叉性与综合性,还要引入交叉学科研究的最新成果,使研究生了解学科发展动态。另外,跨学科研究生可以在不同实验室进行学习,提高自身能力,积极参加学校或学院组织的学术交流、多听跨学科的学术报告和学术讲座等。
此外,还要注重激励机制,目前,许多高校及科研院所在评估科研人员的业绩时,过于注重甚至只考虑第一作者的贡献,其他作者的贡献忽略不计,这样非常不利于跨学科研究的培养,影响积极性。许多生物信息学的研究是和其他的生物学科交叉发展的,第一作者贡献固然大,其他位次的也要适当的考虑,这样才能使得研究生的跨学科教育快速发展。
4.3 重视导师与研究生的跨学科研究 跨学科研究生的水平高低c导师的学术水平、综合能力等有直接的关系,因为导师对研究生选题、技术路线等方面具有很大的指导作用。研究生在跨学科上也应高度重视,储备知识,拓展思维,这样和导师进行的跨学科沟通时才能顺利进行,有利于发展。导师方面,我们倡导的多导师制,也就是我们常听说的还有副导师,这样更能有效地培养研究生的全面知识与试验技能,有助于跨学科的创新性。培养跨学科的生物信息生学研究生的知识与技能,多导师制更值得提倡,因为其中涉及很多软件知识、计算机知识、生物学知识等多个学科的知识和技能,这样可以相互补充,有助于问题的解决。
我国研究生教育具有多层次性、多类型的人才培养模式,但跨学科人才培养仍处在探索阶段,存在很多制约因素,但跨学科研究生培养对于培养创新型人才有着及其重要的作用,可能成为培养交叉学科人才、创新人才的有效途径。
参考文献
[1]炎冰,宋子良.交叉学科概念新解[J].科学技术与辩证法,1996,13(4):51-54.
[2]林崇德,罗良.建设创新型国家与创新人才的培养[J].北京师范大学学报(社会科学版)2007,1:29-34.
[3]何沐蓉,朱浩,常军武.跨学科培养生物医学研究生[J].学位与研究生教育,2011,7(7):11-16.
[4]贾川.我国高校跨学科研究生培养机制研究[D].长沙:国防科学技术大学,2008.
文献标识码:A
文章编号:1007-7847(2015)02-0119-05Bioinformatic Analysis of TATA-binding Protein of ZebrafishYANG Shao-bin, FENG Jing-wen, ZHAO Wen-cheng, WANG Zhao-song, XU Shi-lei*(Tianjin Medical University Cancer Institute and Hospital, National Clinical Research Center for Cancer, Tianjin Key Laboratory of Cancer Prevention and Therapy, Tianjin 300060, China)Abstract : TATA-binding protein (TBP) is important in the process of transcription initiation in zebrafish. By means of bioinformatic methods, TBP of zebrafish is illustrated and analyzed by physicochemical property, sequence homology among different species, conserved domains, transmembrane structures, hydrophilici ty/hydrophobicity, protein secondary structure, protein tertiary structure, as well as protein-protein interactions. The results showed that zebrafish TBP consists of 302 amino acids, with isoelectric point of 9.8. This protein belongs to the TBP superfamily without transmembrane structure, and it is a hydrophilic protein. The secondary structure analysis showed that it contained 5 a. helices and 8 f3 sheets and random coil was the major structure element. The reliability of predicted three-dimensional structure of zebrafish TBP was up to 98.9%. Further analysis proved that the predicted protein structure was stable. It showed that the 10 most relevant interaction proteins with the zebrafish TBP were all transcription factors or TF II D complex members. Therefore, the results provided great information about zebrafish TBP in transcription regulation for further research.Key words: zebrafish; TATA-binding protein; bioinformatics(Life Science Research, 2015,19(2): 119?123)
TATA结合蛋白(TATA-binding protein,TBP)址一种特异性结合DNA序列上TATA框的转录因子。TATA序列存在于真核细胞基因启动子中转录起始位点上游30个bp左右[1]。TBP与其他一些TBP相关蛋白共同组成厂TFⅡD复合物,TFⅡD是一种常见的转录因子,它是RNA聚合酶Ⅱ起始复合体的组成部分。TBP能够帮助RNA聚合酶Ⅱ跨过转录起始位点。TBP在DNA双链解链(double strand separation)的过程中也起到一定的作用,这是通过其能够使DNA弯曲80°来实现[2-4]。TBP的另一个特点是含有一长串谷氨酰胺氨基酸残基。这个区域调节TBP的C端和DNA的结合能力、转录复合体形成的比率以及转录的起始。斑马鱼属于鲤科,鲤目。由于再生能力强的特性,斑马鱼经常被当作研究脊椎动物的生物模型[5]。分析研究斑马鱼TBP有助于更好地理解斑马鱼基因转录过程。到目前为止,对斑马鱼TBP的生物学研究已经有一定的进展,但是对其生物信息学分析还未见报道。为此,本研究采用生物信息学方法,对斑马鱼TBP的理化性质、保守结构域、跨膜区、亲水性/疏水性、二级结构、三级结构、与其他物种亲缘关系等进行预测和分析,为其后续研究奠定全面的理论基础。1材料与方法1.1材料数据资料来源于UniProt网站已经注册的TBP氨基酸序列。其中TBP:斑马鱼zebrafish(Q7SXL3)、非洲爪蛙Xenopus laevis( P27633)、小鼠Mouse( P29037)、牛Bos taurus (Q2HJ52)、人Human( P20226)。1.2方法利用ProtParam分析蛋白质理化性质;蛋白序列同源性、多序列比对及序列系统进化树分别由NCBI protein blast .ClustalX2.0、njplot等软件实现;利用TMHMM、ProtScale分析蛋白质的跨膜区和疏水性;NCBI Conserved Domains数据库用来分析保守区域;Jpred、Swiss-Model和Structural Analysis and Verification Server分别预测蛋白质二级、三级结构及其合理性。String则用来预测蛋白质的相互作用。各软件、数据库的相关信息如表1。2结果与分析2.1斑马鱼TBP的理化性质预测和分析使用ProtParam蛋白质理化性质预测网站对5种TBP进行理化性质预测,得到结果如表2。结果显示,TBP基因在5个不同物种中编码的氨基酸个数在297~339之间;相对分子质量在32702.8~37698.1之间;各物种TBP等电点差异其微,均在9.8附近,说明TBP是碱性蛋白质;TBP在5个物种中的半衰期均达到了30h;5种蛋白的不稳定系数均大于40,表明它们不是稳定蛋白;各TBP的脂肪族系数在76.58~88.65之间;5种蛋白的平均疏水性均为负值,表明它们都是亲水蛋白质。2.2斑马鱼TBP的同源性预测和分析
使用Protein Blast软件对斑马鱼TBP进行同源性分析,数据显示,非洲爪蛙、小鼠、牛、人TBP与斑马鱼TBP进行比较时,比对序列覆盖范围(Query cover)分别是100%、100%、100%、75%;在此基础上的序列相似性(Identity)分别为88%、86%、85%、93%,;利用ClustalX2.1程序对斑马鱼TBP与非洲爪蛙、小鼠、牛、人TBP序列进行多重比对,发现各物种问多聚谷氨酰胺区如图1。结果显示,由低等物种到高等物种,TBP多聚谷氨酰胺区谷氨酰胺氨基酸残基数量在进化过程中不断增加,推测谷氨酰胺区的长度与TBP的转录调节能力呈正相关。
关键词 生物信息学 教学改革 医学 教学模式
中图分类号:Q811-4 文献标识码:A
21世纪是生命科学的世纪,人类及模式生物基因组计划的全面实施,使分子生物学数据以爆炸性速度增长。面对基因组学、蛋白质组学、基因芯片、分子进化等大量的生物信息,在计算机科学、网络技术以及生物分析技术的相互作用和渗透下,诞生了一门崭新的学科――生物信息学(Bioinformatics)。生物信息学利用计算机和互联网,以数据库为载体,运用数学算法和计算模型,研究生物信息数据的获取、处理、存储、分发、分析和解释等方面,进而阐明和解释庞杂的生物数据所蕴含的意义。生物信息学跨越了整个生命科学领域,近年来在医药学研究中发挥了不可替代的作用,无论是从分子生物学的角度阐述病因,还是对疾病的预防、诊断、治疗与新药研发都将产生巨大的推动作用,医学生物信息学必然在未来的医学研究中处于关键地位,但生物信息学的理工科特性决定了该课程在医学教育中开展的难度。本文结合医学院校特色和生物信息学课程特点,探讨开设医学生物信息学课程的必要性,分析生物信息学课程在教学实践中存在的问题,提出本校开展生物信息学教学的实施方法。
1 医学生物信息学的主要研究内容
1.1 疾病基因的发现与鉴定
约有6000种以上的人类疾患与特异基因的改变有关,某些关键性基因或其产物的结构功能异常,可以直接或间接地导致疾病的发生。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段。例如:通过构建肿瘤cDNA文库或表达序列标签(expression sequence tag,EST)分析差异表达基因,揭示肿瘤发生的分子水平变化,寻找靶基因。
1.2 药物设计与新药研发
生物信息技术为药物研究、设计提供了崭新的研究思路和手段。利用数据资料、软件工具筛选药物作用的靶位和候选基因,阐明其结构和功能关系,指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物。
生物信息药物设计常用的方法有:①三维结构搜寻,寻找符合特定性质和三维结构的分子,从而发现合适的药物分子。②分子对接,建立大量化合物的三维结构数据库,依次搜索小分子配体使其与受体的活性位点结合,通过优化使得配体与受体的形状和相互作用最佳匹配。③全新药物设计,利用计算机自动设计出与受体活性部位的几何形状和化学性质相匹配的结构新颖的药物分子。
生物信息学方法为药物研制提供了更多的、潜在的靶标,大大减少药物研发的成本,提高研发的质量和效率。
1.3 流行病学研究中的应用
将流行病学的遗传和非遗传性的研究与生物信息学结合起来,会对疾病的机理、个体对某种疾病的易感性和疾病在群体中的分布有更明确的认识,对疾病的预防和治疗有极大的指导意义。
2 医学生物信息学课程的特点及主要困难分析
2.1 课程内容丰富,学科交叉,数据庞杂
生物信息学利用生物学,计算机科学和信息技术揭示大量复杂的生物数据所赋有的生物学奥秘,是一门交叉性学科,并且理科特性很强,需要深入理解分析。目前生物信息学包含了基因组、蛋白质组、代谢及药物等多个部分,每个部分都具有各自的特色和相应的分析技术。根据《Nucleic Acids Research》统计,全球共有约1000多个主要的生物医学数据库,涵盖了生物医学研究的诸多领域。学生不仅要掌握获取和利用海量生物信息的基本知识和技术,还应掌握相关的数学、物理学、计算机程序设计等知识和技术,又因为医学专业学生的数理知识有限,学习起来有一定的困难。
2.2 操作性和实践性强
生物信息学是一门操作性和实践性很强的学科,主要是在互联网环境中,依靠计算机,利用数据库和各种信息处理软件来进行生物信息学方面的分析工作。针对医学专业学生开设生物信息学课程,其教学内容应注重理论与实践紧密结合,着重学习利用计算机对各种生物信息资源和数据库的检索,使用方法与技巧,真正做到学有所用。
2.3 现状与困难分析
目前,国内的生物信息学教学基本沿用以“教师讲授为主”的传统教学模式,与生物信息学交叉前沿性特点不相适应,实验教学单一,多为验证性试验,缺乏综合性和设计性。此外,医学专业学生计算机知识薄弱,对生物信息学的算法与数据库的原理和特点等不甚了解,在高通量数据处理面前力不从心,影响对问题的分析能力。
3 医学生物信息学课程开设实施方法和对策
3.1 根据医学专业特点设计教学内容,建立具有模块化的教学大纲
目前尚未形成系统、成熟的生物信息学教学模式。开设课程之前,对医学专业学生进行问卷调查,让他们选择医学生物信息学课程中感兴趣的、需要学习的知识内容,并提出难点问题。教师汇总问卷结果,对授课内容进行调整,建立模块化的教学大纲,例如:导论模块、数据库及使用模块、基因组信息学及其分析方法模块、蛋白质组生物信息学模块、代谢和药物生物信息学及系统生物学模块等,使学生清楚每个模块的特点和作用,提高学生的学习兴趣,激发学生的学习热情。
3.2 强化实验教学,激发学生的创新思维和创新意识
生物信息学的学习是运用生物医学、数学、以及计算机科学等诸多学科知识进行分析、判断、推理、综合的实践过程,强化实验教学显得尤为重要。另外,采用PBL(Problem Based Learning)教学法,可以有效地激发学生的创新思维和创新意识。
3.2.1 注重实验操作
生物信息学实验课程以计算机操作为主,需要学生灵活应用互联网、数据库和多种生物信息学软件,所以实验操作显得尤为重要,加大实验比例,为学生提供较多的实验操作机会,不仅提高了学生的动手能力,而且大大提高了学生在因特网环境下对生物大分子序列、生物大分子结构进行生物信息学分析的能力,是提高学生学习生物信息学效果的有力保障。
3.2.2 采用PBL教学模式,优化实验内容
加大设计性实验的比例,采用PBL教学法,根据学生能力和兴趣进行分组,由教师提出问题并布置真实性任务,使学生在已有的知识基础上,通过查找文献、小组讨论、探索,最终完成任务,写出试验报告。由教师对任务完成过程及结果进行点评,对学生掌握知识的程度及学生的科研、应用能力进行评价,并提出进一步的提高方向。学生在实验操作的过程中,不断地发现问题、解决问题,有效地激发了学生的创新思维和创新意识。
3.3 改革教学方法,革新考核方式
3.3.1 结合多媒体技术与双语教学
多媒体技术教学灵活生动,教师在讲授难于理解的概念和生物信息学工具时,可以直接打开相关软件和网站进行演示,使抽象的生物信息学知识以具体的、动态的形式展现出来,从而加深学生对课程的掌握程度。此外,生物信息学涉及到的数据库、网站、应用软件多为英文界面,所以双语授课显得尤为重要,教师可借助多媒体,对课程进行中英整合讲解。
3.3.2 结合科研实例进行教学
生物信息学是一门不断完善和发展的学科,数据库的更新、相关软件的升级、算法的优化等,通常会随着科研中遇到的生物学问题变化而变化,所以教师可以结合现阶段的科研背景和具体的研究方向,结合实例进行教学,可以让学生真正掌握利用生物信息学方法解决生物学问题的思路,并培养和提高学生的科学思维能力,使学生由知识的被动接受者变为知识的主动发现者、探究者,教师则由知识的传授者转变为教学活动的指导者、组织者。
3.3.3 采用无纸化考核方式
适当降低课程理论难度,减少不必要的数学理论推导,注重实际应用、解决问题能力的培养,通过上机实践操作,考核学生对基本知识和原理的掌握情况,克服传统的死记硬背现象。
4.结语
生物信息学作为一门交叉学科,发挥了其独特的桥梁作用,已经广泛地渗透到医学的各个研究领域。本文针对开设医学生物信息学课程的必要性和教学模式进行了探讨,以提高学生学习的自主性、实际操作能力和解决问题的应用能力为目标,不断改进教学手段、加强教学过程的趣味性,以期培养综合型的、高素质、现代化医学人才。
参考文献
[1] 伍欣星,赵.生物信息学基础与临床医学应用指南[M].北京:科学出版社,2005.
[2] 张阳德.生物信息学[M].北京:科学出版社,2009.
[3] WeiLi-ping,YuJun.BioinformaticsinChina:APersonalPerspective[J].PlosComputationalBiology,2008,4(4):e1000020.
[4] 汪凡军,张楚瑜.生物信息学在医学上的应用[J].国际检验医学杂志,2006,27(2).
【关键词】 生物信息学;2型糖尿病;SLC30A8
【Abstract】 Objective To investigate the structure and function of type 2 diabetes gene (SLC30A8) by bioinformatic methods. Methods Based on the human genome resource database, the programs of BioEdit, DANMAN and on line tools SMART, MHMM Server v. 2.0, NetPhos2.0 Serve, 3djigsaw were used for the analysis of protein basic characters, 3D structure and function prediction. Results The protein of gene SLC30A8 encoding was a transmembrane protein,it was important to transport zinc. Conclusions Protein encoded by SLC30A8 gene probably regulates and controls insulin secretion.
【Key words】 Bioinformatics; Type 2 diabetes; SLC30A8
众多研究显示,遗传因素在2型糖尿病(T2DM)发病中起着非常重要的作用〔1,2〕,但由于T2DM系多基因遗传病,研究的进展非常缓慢,直到2005年,不管是采用候选基因法还是连锁定位克隆法,只有极少数几个T2DM的易感基因在一些种族的研究中得到重复验证,而它们仅轻度增加T2DM的发病风险〔3〕。近2年多来,随着高通量SNPS检测技术的出现和全基因组关联(GWA)研究策略的运用,T2DM遗传学的研究取得了一些突破性进展,美国和欧洲多个基因研究组织采用全基因组分析法对1 464例T2DM患者和1 467例糖耐量正常个体的基因结构进行了系统研究,确认了几个与糖尿病相关的新基因位点——TCF7L2、SLC30A8、CDKN2A、CDKN2B、GF2BP2、CDKAL1〔4〕,这些基因的功能和调控机制还不十分清楚。在国内,邬莹等〔5〕研究发现在中国汉族人群中,CDKAL1、CDKN2A/B、SLC30A8等基因上的数个SNP位点与T2DM风险显著相关。SLC30A8基因也是中国人T2DM的一个易感基因,但对SLC30A8基因的研究还不够深入。因此,本文利用生物信息学工具和数据库,对SLC30A8进行分析,研究SLC30A8基因的功能,了解中国人糖尿病的遗传学基础,对预防和控制糖尿病具有重要的理论和临床意义。
1 材料与方法
1.1 材料 人类糖尿病基因SLC30A8核苷酸序列来源于已经提交到GenBank数据库(GI:224589820)的序列。
1.2 SLC30A8基因结构分析及SLC30A8基因编码蛋白质的理化性质分析 通过NCBI的ORF Finder、Protparam、Computer pI/MW确定其完整编码框并预测蛋白质的理化性质;信号肽序列分析采用SignalP工具;蛋白质翻译后修饰的糖基化位点和磷酸化位点分析分别采用DictyOGlyc在线软件和NetPhos 2.0 Server分析;氨基酸序列的同源性比对用ClustalW在线工具完成,通过蛋白分析专家系统Expasy所提供的在线分析工具ProtScale分析蛋白的疏水性。
1.3 SLC30A8基因编码蛋白质的结构和功能分析 利用互联网ExPaSy数据库进行SLC30A8蛋白质的跨膜结构域分析;利用PUMA2服务器的SOPM软件进行蛋白序列的二级结构的分析;利用ExPasy的3djigsaw工具(bmm.icnet.uk/servers/3djigsaw/)向蛋白质立体结构数据库PDB(Protein Data Bank)提交蛋白质的序列;利用RasMol软件显示蛋白的三维分子结构。利用在线工具TMHMM分析蛋白质的跨膜结构域;利用COILS进行卷曲螺旋分析;利用Pfam进行蛋白的结构域功能分析〔6〕。
2 结 果
2.1 SLC30A8在染色体上的定位及基因结构 人类糖尿病基因SLC30A8的Gene ID是169 026,定位在8q24.11。SLC30A8基因核苷酸序列全长41 617 bp(NC000008.9),含8个外显子。mRNA序列长5 373 bp,编码369个氨基酸的蛋白质(NP776250),有2个PolyA信号区域分布位于1 933~1 938、 5 353~5 338,5个PolyA位点分别位于1 955、1 961、2 750、2 754、5 373。见表1。表1 SLC30A8外显子序列和对应的mRNA序列
2.2 SLC30A8基因编码的蛋白基本性质分析
2.2.1 开放阅读框(ORF)分析 ORF从第231个核苷酸开始,终止于第1 340个核苷酸,由其推导的氨基酸序列以甲硫氨酸为起始氨基酸,长为369个氨基酸。
2.2.2 疏水性分析 疏水性是氨基酸的一种重要性质,疏水性氨基酸倾向于远离周围水分子,将自己包埋进蛋白质的内部,这一趋势加上空间立体条件和其他一些因素最终决定了一个蛋白质折叠形成的三维空间构象〔7〕。通过分析可以得到蛋白质的亲疏水区域,这一结果一方面为二级结构预测结果提供参考,另一方面还可为结构域及功能域的划分提供依据。ProtScale预测结果表明:疏水性最大值为3.044,最小值为-2.889(图1)。
图1 SLC30A8氨基酸序列的疏水性2.2.3 信号肽、跨膜结构域及翻译后修饰分析 进行信号肽分析有助于蛋白质功能域的区分及蛋白质细胞定位。根据SignalP分析,蛋白质C分值、Y分值和S分值分别在248、157和150位点,分别为0.142、0.228和0.833,其信号肽计算结论为“NO”,表明其N端不含信号肽(图2),推测其不是分泌蛋白。图2 SLC30A8氨基酸序列的信号肽预测分析
跨膜结构域是膜中蛋白和膜脂相结合的主要部位,它可能作为膜受体起作用,也可能定位于膜的锚定蛋白或离子通道蛋白等,通过跨膜结构域预测可以正确认识蛋白质结构、功能及在细胞中的作用部位。笔者利用通过TMPRED服务器分析,表明该蛋白质是一个6次跨膜的蛋白质,在4和5螺旋之间有一个富含组氨酸的环(图3)。用Smart对 SLC30A8基因的产物进行蛋白质序列结构功能域分析,结果表明蛋白质含有2个N糖基化位点,2个N酰基化位点。NetPhos 2.0Server磷酸化位点分析结果表明:分值>0.5的磷酸化位点有:丝氨酸(Ser)磷酸化位点8个、苏氨酸(Thr)磷酸化位点1个、酪氨酸(Tyr)磷酸化位点2个,计11个磷酸化位点,这些位点均匀分布于整个多肽链中。见图4。图3 SLC30A8氨基酸序列的跨膜结构域分析图4 SLC30A8氨基酸序列的磷酸化位点分析 图5 SLC30A8蛋白质三级结构的同源建模2.3 基因编码蛋白质结构分析
2.3.1 三级结构构建与功能域分析 图5可见,三级结构是蛋白质结构预测的最终目的。要充分研究蛋白质的功能,就需把蛋白质的高级结构研究清楚。从氨基酸序列预测三级结构的技术很多,其中之一是同源建模,它通过比较未知结构蛋白质序列与已知结构的蛋白质序列来预测蛋白质结构,可以通过同源建模以击中序列的已知结构为模板,对蛋白质进行精确的结构模型构建。作者利用Expasy的3djigsaw工具预测蛋白质的三维结构,利用Ramol软件察看预测结果。
hhhhhhhhcccccccccccchhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhcccc
WHRAEILGALLSILCIWVVTGVLVYLACERLLYPDYQIQATVMIIV
eeeeeeeeeeehhhhhhhhhhhhhhhhhhhccccchhhhhhhhhhhhhhhhhhhhhh
SSCAVAANIVLTVVLHQRCLGHNHKEVQANASVRAAFVHALG
hhhhhhhhheeeccccccchhhhhhhhhhhhhhhhhhhhhhhheeehcccccccc
DLFQSISVLISALIIYFKPEYKIADPICTFIFSILVLASTITILKDFSILL
chhhhhhhhhhcchhhhhhheehhhchhhhhhhhhhhcccccchhhhhhhhhhhhh
MEGVPKSLNYSGVKELILAVDGVLSVHSLHIWSLTMNQVILSA
HVATAASRDSQVVRREIAKALSKSFTMHSLTIQMESPVDQDP
DCLFCEDPCD
hccceceeeeeecccccccccccccccccc(总长度369 bp)
图6 SLC30A8氨基酸序列的二级结构分析
3 讨 论
从以上的研究和分析可以看出,糖尿病相关基因SLC30A8编码的蛋白质是一种多次跨膜蛋白,并且蛋白经过了多种形式的修饰。磷酸化和去磷酸化是细胞内信号传导的重要方式,而此蛋白有11个位点发生了磷酸化,蛋白质通过磷酸化和去磷酸化而发生构象改变导致其活性或性质的改变,从而调节细胞中各个生命活动过程, 所以推测SLC30A8基因编码的蛋白质是一个有功能的比较活跃的蛋白质。另外蛋白质还发生了糖基化和酰基化,推测蛋白质具有传导信号的功能。研究表明SLC30A8编码的是一种在胰岛细胞大量表达的锌离子转运蛋白,其主要功能是将胞浆内的锌离子转运到胰岛素分泌囊泡中,参与胰岛素结晶六聚体的形成〔8〕。因此推测SLC30A8异常,可能会影响胰岛细胞胰岛素的正常分泌。本文利用生物信息学工具盒数据库资源对SLC30A8基因的染色体定位、基因结构及所编码的蛋白质性质、结构等进行了分析,为进一步研究SLC30A8基因在糖尿病发生中的作用提供参考依据。目前关于SLC30A8基因的研究还很少,其编码的蛋白质是如何调控锌离子转运的以及如何参与胰岛素分泌的都将有待于进一步研究。
参考文献
1 Kahn SE.The importance of betacell failure in the development and progression of type 2 diabetes〔J〕.J Clin Endocrinol Metab, 2001;86(19):404758.
2 Bergman RN,Ader M,Huecking K,et al.Accurate assessment of βcell function.The hyperbolic correction〔J〕.Diabetes,2002;51(suppl 1):21220.
3 Sladek R,Rocheleau G,Rung J,et al.A genomewide association study identifies novel risk loci for type 2 diabetes〔J〕.Nature,2007;445(7130):8815.
4 Scott LJ,Mohlke KL,Bonnycastle LL,et al.A genomewide association study of type 2 diabetes in Finns detects multiple susceptibility variants〔J〕.Science,2007;316(5829):13415.
5 Wu Y,Li HX,Ruth J,et al.Common Variants in CDKAL1,CDKN2A/B,IGF2BP2,SLC30A8,and HHEX/IDE Genes are associated with type 2 diabetes and impaired fasting glucose in a chinese han population〔J〕. Diabetes,2008;57(10):283442.
6 薛庆中.DNA和蛋白质序列数据分析工具〔M〕.北京:科学出版社,2009:7298.