当前位置:首页 > 第3章 基因组学
样的图谱,个体YAC可以被亚克隆到粘粒中进行更精细的定序。最后,粘粒的插入片段可以用限制性内切酶分成更小的片段,亚克隆后进一步鉴定。
原位杂交 将一核酸探针与染色体杂交获得在特异染色体带的定位。传统的体外杂交使用放射性探针,现已被使用非放射性的荧光探针的荧光体外杂交(fisH)取代。除了它的速度和效率,这个方法的另一个优点是可以同时使用具有不同的荧光生色基团的探针根据颜色的不同来鉴别不同的靶位点,从而可以确定基因次序(又参见染色体着色)。对中期染色体的FISH给出1—lOMbp的解析度;然而同样的技术也可应用于间期染色质,或应用于人工延长的染色质纤维(直观体外杂交,dirvish)和裸DNA(DNA纤维杂交),解析度小于10Kbp. 去折叠DNA的广泛成环要求包括延伸纤维FISH的作图工作需通过对结果的统计分析来印证。 物理作图速度与效率通过网格库(gridded libraries)的引入有了较大的提高。也即文库克隆(例如全基因组的YAC或从特异的YACs而来的粘粒)被挑出并置于多孔板的单个孔中培养。然后,不像常规的筛库方法那样将克隆转到滤膜上(参见噬斑移动,克隆印迹),而是以网格状排列将克隆点到滤膜上,这样每一克隆可以精确地对应。这一技术减少了在克隆辨别中的混淆还可以使网格库进一步分散到其他库中进行相关工作。
表1.7 用来产生基因组克隆重叠的技术
技术 原理
染色体步移 在理论上,可以使用随机克隆筛选基因组文库获得相互覆盖的克隆,然后将
这些克隆作为探针以同样的方式将获得更多的相互覆盖的片段。实际上克隆与克隆之间的步移由于重复DNA的出现而复杂化,特别当使用如YACs这样的大容量载体时。重复DNA可以通过与已知的重复序列预杂交而抑制(例如人类基因组中的Alu顺序)。而且实际上并不使用整个克隆而使用标记的末端片段为探针。与YAC有关的另一个问题是嵌合性,因而YAC的步移往往要求染色体制备的FISH实验为补充。
杂交作图 用一套随机克隆筛选文库来辩明相互覆盖的克隆。从余下的阴性克隆中,选择
另一套随机克隆并重复筛选过程。重复这种策略直到所有的克隆都被杂交。
寡核苷酸作图 寡核苷酸与一系列粘粒克隆杂交。与同样的寡核苷酸杂交的粘粒应该是相
互覆盖的。也可以将寡核苷酸设计为处于共有基序周围来获得序列信息。
限制性片段指纹 用一组限制性内切酶消化克隆,这样对每个克隆都产生一限制图谱。个
别克隆的图谱相互比较获得相互覆盖的区域。
顺序标记位点(STS)通过测试随机亚克隆的DNA片段如测试它们在基因组Southem印迹中
获得单个条带,或用PCR获得单个产物的能力来鉴定单一序列,它们被称为序列标记位点(STS)。用这些标记物来测试整个基因组,包含同一STS的两个或多个克隆必然相互覆盖。通过测试cDNA而非基因组克隆可能可以加快潜在STS的鉴别,因为在cDNA中更可能包含单一的DNA序列。
重复DNA指纹 包含很多重复DNA的哺乳类基因组可以用来获得克隆重叠。重复DNA指纹
包括YAC或粘粒用限制性内切酶消化,并用重复DNA探针作Southem印迹,例如Alu元件特异性探针。具有同样的带型的克隆可能相互覆盖。类似的基于PCR的技术使用单个Alu特异的引物扩增头对头AZu元件之间的基因组DNA,通过电泳对扩增产物进行分析,具有同样的带型的克隆可能相互覆盖。
6限制图 限制性内切酶可用来产生基于限制位点位置的物理图谱(限制图,restriction maps)。图的解析度依赖于DNA片段中限制位点出现频率,而这又由限制位点的大小和碱基组成所决定。具有4—6bp识别位点的酶可用来产生小DNA分子如质粒,PCR片段和入插入片段
的限制图。具有较大的限制内切位点(8一10bp)和/或识别未被充分代表序列如哺乳动物基因组中的CpG的内切酶称为稀有切割者。可以用这种酶来获得整条染色体的限制图谱,虽然产生的DNA片段必须用脉冲场凝肢电泳等方法分离。分离获得的限制性片段可以通过杂交或PCR来测试所携带的标记。使用一组限制性内切酶使片段定序并相互重叠。
7比较基因组作图 比较基因组学是基因组科学的分支,它涉及不同种类基因组间的比较。这种比较有两个目的:提供基因与基因组进化有关的信息(即在基因组水平了解种间的相同与不同之处),并通过比较或同线性作图(comparative or synteny mapping)为基因克隆提供帮助。脊椎动物种间的比较作图特别有价值,因为它可能为人类的遗传疾病提供新的动物模型和新的治疗方法,同时也可提供脊椎动物进化模式有关的信息。河豚鱼基因组是特别有用的比较作图工具,因为它的堆积程度与基因密度高,在鱼与其他的脊椎动物中谱系往往是保守的,但河豚鱼基因组中的基因更容易分离,因而可用作探针来监测保守的哺乳类基因。
脊椎动物的比较作图通过不同水平的保守染色体片段来描绘。低解析度的比较作图可以用染色体着色(zoo-FISH),即从一个种类的单个染色体上分离得到的DNA被扩增,用荧光探针标记后,与另一种类的中期染色体进行原位杂交。人类与猫的染色体之间的比较显示了广泛的同线性,在某些例子中观察到整条染色体的保守,而在人类与小鼠中保守区域要小得多[X染色体特别强烈地保守,因为对X偶联基因座有剂量补偿效应的限制。在更精细的尺度中,比较作图可以显示在同线性片段的标记之间的保守联系。用于比较研究的标记类别为基因(在种间差异很小的基因),而不是在谱系研究中使用的高变的微卫星标记(种内具有多态性,在种间保守程度低)。通过比较测序获得的功能性DNA序列的保守性可帮助鉴别基因和基因外的调控元件。哺乳动物中的比较作图由锚参比基因座(anchor reference loci)的使用而增强。它们位于染色体片段中,表现了所有构建中的哺乳类基因组图谱的保守联系(这种片段如SCEUSs:最小的保守进化单位片段,smallest conserved evolution unit segments)。在SCEUs或其他区域鉴别的单一序列(序列标记位点)可以用来产生标记图谱,使所有将获得的哺乳类基因组图谱相互联系。在所有的哺乳动物中保守的序列标记位点被称为CATS(保守锚标记序列,conserved anchor—tagged sequences)
2.4 基因测序方法
2.4.1 历史的回顾——新技术的发展是决定因素
基因组测序与物理图谱的制作是密不可分的,物理图谱的制作又同分子克隆技术分不开的。限制性内切酶的发现,导致了第一个物理图谱,SV40的物理图谱的完成(Danna and Nathans,1971)。新克隆技术,尤其是YAC和BAC的发明,使物理图谱的制作向前大大地迈进了一步。它们的长度使STS(Olson et al,1989)成为有力的物理图谱路标,而保证了图谱的连贯性。大肠杆菌、酵母和秀丽小杆线虫等物理图谱的完成则标志着制作技术的成熟。有了精确的物理图谱,测序就变得常规化了。
第一个生命基因组(φX174)序列的测定是1977年在英国的Sanger试验室完成的,而Sanger的末端终止法测序以其速度与准确性很快取代了Maxam和Gilbert的化学法。大规模测序的开始是以荧光自动分析仪的发明开始的(Hunkapiller et a1,1991)。它不仅效率高而且测序的质量也比手工操作高得多。由于DNA聚合酶的不断修饰和荧光底物的不断更新,在很长的一段时间里,荧光测序法会保持主导地位。毛细管电泳也有可能在不久的将来取代现在的平板电泳。现在的难点之一,是由于受到毛细管的空间和电泳介质的限制使读序的长度不够。一般停留在500bp左右,而平板电泳则高达600bp到900bp左右。然而,就测序的目的不同,两者都会得到广泛地应用。例如,毛细管电泳可用来测cDNA或小片段基因组DNA
的顺序,而平板电泳可用于大片段基因组DNA的组装。
除了基本技术和仪器外,测序的策略也很重要。散弹测序法(shotgun sequencing)是策略的代表作之一。它主要依赖于计算机技术将单一读序自动组装起来,而减少人工操作。人工不仅昂贵,而且常造成判断错误。有些小规模的测序还用到质粒排列法,但用于大规模测序效率很低。虽然省去一些测序,但人工却花得多,总体效率远不如散弹法。DNA测序逐渐的规模化与工业化的过程中,成熟的技术将被保留,不成熟的将被淘汰。
DNA大规模序列测定是在低精度遗传图谱与物理图谱宣告完成后,酵母和秀丽新小杆线虫测序工作显示不容质疑的成功希望时开始的(Olson,1995)。英国桑格中心的John Sulston和美国圣路易斯华盛顿大学的Robert Waterston是这个领域的先驱。不容忽略的是这些物理图谱的关键作用,它们为测序提供了基本原料。没有这样的基本原料,测序的速度就会受到限制。
2.4.2 基因组测序和cDNA测序的区别
在人们通常的印象中,测序是一项很容易掌握的技术,并没有什么难度。这大概是人们很少接触基因组测序的缘故。基因组测序与人们经常接触的cDNA测序存在很大的不同,下面列举出两者之间的区别:
基因组测序 cDNA测序 BAC、YAC文库筛选 无 STS或酶切指纹物理图谱 无
散弹法亚克隆文库组建 cDNA文库组建 长距读序、高质量数据 无限制
序列组装软件(如Phred—Phrap—Consed) 无或简单组装 间隙连接(需要软件协助,如Autofinish等和分子克隆) 无 序列组装结果检验 无 克隆长距离连接(>1Mb) 无 基因寻找软件 无
价格高(每测序道5—15美元) 价格低(每测序道<5美元
2.4.3 测序主要方法简介
1.Sanger双脱氧链中止法
这种方法有时也被称为引物合成法或酶催引物合成法,该方法要求使用一种单链的DNA模板和一种适当的DNA合成引物。使用DNA聚合酶以单链DNA作为模板,以2’,3’—双脱氧核苷三磷酸(dNTP)为底物,使之掺入到核苷酸链的3’—末端,因为双脱氧核苷三磷酸缺少3’—羟基,因此使DNA链的延长终止。由于在双脱氧核苷三磷酸上标记有放射性物质或荧光物质,通过变性凝胶的电泳可以得到终止于不同残基的DNA片段的谱带,经过分析即可得到相应的DNA序列。由于该方法所测序列DNA来源于酶促合成的DNA,因此可能有误差存在。但是由于高质量的酶制剂的获得,以及合成引物成本的降低,测序反应的日臻完善,该方法已得到广泛的应用。
2.Maxam-Gilbert化学修饰法
该方法的基本原理是使用化学试剂处理具有末端放射性标记的DNA片段,造成碱基的特异性切割。由此产生一组具有各种不同长度的DNA链的混合物,经过凝胶电泳按大小分离和放射自显影后,可以根据X射线片上显现的谱带直接读出待测DNA片段的核苷酸顺序。该方法有如下优点:只需要简单的化学试剂,所测序列结果来源于原DNA分子。该方法还可以用来分析甲基化等DNA修饰情况,可以通过化学保护及修饰干扰实验来研究DNA二级结构及蛋
白质与DNA的相互作用。 3.DNA杂交测序法
如果一段较短的DNA探针能同靶DN八分子中的某一段杂交,并能形成完全的双链体分子,我们就可以据此推断靶DNA分子中存在与探针相互的序列。杂交测序方法就是基于这一原理建立的。该方法主要有以下两个步骤:首先是将待测的靶DNA分子同一组序列己知的寡核苷酸探针进行杂交;然后是对能够同靶DNA完全形成双链体的分子的寡核苷酸探针之间的碱基重叠关系进行分析,从而得出靶DNA的碱基序列。这是一种理想化的状态,实际上的杂交模式远比这复杂。但是,DNA杂交测序法操作简单快捷,不需要复杂的凝胶电泳,使用的仪器价格低廉,在几分钟甚至几秒内就可以得到结果。相信随着计算机技术,基因芯片技术的发展,DNA杂交测序法一定能得到更广泛的应用。 4.测序技术的自动化
人类基因组计划中有大量的DNA序列需要测定,如果只是使用手工操作的方法显然是不现实的,测序技术的自动化就成为了必然。
测序技术的自动化主要是测序结果分析的自动化。手工测序结果的分析依赖于人工读取放射自显影图片,这种读片方法存在着效率低、速度慢、错误率高等问题。随着DNA测序技术应用的日益广泛,这种分析方法成为了急待突破的瓶颈。在1986年,Smith等报道了一种使用4种不同的荧光染料分别标记4种不同的碱基,反应后,在同一个电泳管中电泳,通过激光作用诱发荧光,通过记录荧光达到检测目的。然而由于不同的荧光染料有不同的电泳迁移率,使得各种染料标记的碱基的吸收光谱出现重叠的现象,增加了DNA序列分析的复杂性。同年,Ansorge报道一种使用四甲基罗丹明作为惟—的荧光染料,预先标记于M13引物上。然后按照标准的双脱氧末端终止法进行反应,并用聚丙烯酰胺凝胶电泳进行分离。所不同的是采用激光装置激发荧光,并有相应的荧光信号接收装置,可以将荧光信号转换成电信号输入到数据处理系统中,这样就可以直接得到待测的序列数据。随着应用的日益广泛,这类荧光标记的自动测序系统也日益完善。 5.DNA测序无疑将规模化和工业化
DNA测序的规模化和工业化是势在必行的。随着工艺的不断更新,,新技术的不断出现,小作坊式的操作终将被淘汰。20世纪80年代初单克隆抗体的制作就走过这样的路子,而现在做单抗自然的成了公司或企业界的事情。科学不仅是以创造为主要变量,时间、空间、质量和协作等都是必不可少的参数。DNA测序的工业化将不断冲击人类基因组计划有步骤的实施。人类基因组计划的“逐个克隆”或“逐个染色体”的测序策略,一直在受冲击之中。新技术的出现往往将科学的预言打破,我们拭目以待。
DNA测序的工业化也将促使新项目的展开。价格的低廉,市场的开拓,可使一些以前无法想象的项目成为现实。目前的测序单上除了人以外还有小鼠、大鼠、黑猩猩、斑马鱼、河豚鱼,将来还会加上猪、羊、牛、马、狗、猫等等。植物也会有一个更长的清单。
不难想象,在21世纪里,从事基因组研究的科学家们需要的第一硬件就是计算机,一端连在数据库,一端连在工业化管理和运作的“理想试验室”,脖子上挂着电话和同行设计试验,讨论结果,口述文章。实验室里不是摆满仪器和试剂,而是一套完整的健身器。虽然要作的工作还很多,比如基因功能的研究,基因产物——酶和蛋白水平的研究等,这个日子的到来不会是很久远的。就现在的进展来看,因为基因组研究的高度工业化水平,很难相信这些工作在10年或20年后还会在一般的实验室里完成。
2.4.4 基因组序列的测定过程
(1)基因组测序的基础
物理图谱的连续性是大规模测序的基本保障,也是资金消耗预算的基本出发点。在没有
共分享92篇相关文档