內容

介紹

人类基因组測序于2003年完成,经过13年的国际合作和三十亿美元的投资。人類基因組計劃中使用桑格測序(尽管大量优化),自20世纪70年代发明的DNA測序的主要方法。

今天,用于測序的需求呈几何级数增长,与需要大量的基因组DNA进行快速分析,廉价地和准确。多亏统称为下一代測序新的測序技术,现在有可能在几个小时内測序整个人基因组。

Sanger測序和新一代測序

后面下一代測序(NGS)的原理是类似的的Sanger測序,這依賴于毛細管電泳。基因組鏈被分段,並且在每個片段的堿基被發射的信號來識別時的片段針對模板鏈連接。
需要用于測序单独的步骤,分离(通过电泳)和检测该Sanger法,这使得它难以自动化样品制备,它是在通过量,可扩展性和分辨率的限制。该NGS方法使用结合在Sanger測序开发来处理百万反应平行,导致非常高的速度,并可以通过在降低成本的技术的基于阵列的測序。那花了很多年,桑格方法的基因组測序项目,现在可以在NGS小时内完成,虽然较短读长(那在时间序列碱基数),少的准确性。

DNA測序的新一代方法有三个基本步骤:

  • 文庫制備:庫使用DNA的隨機片段創建,接著用自定義接頭結紮
  • 放大:该库是用克隆擴增的方法和擴增PCR
  • 測序:DNA被使用几种不同方法之一进行測序

圖書館准備

首先,DNA被兩種酶或通過超聲處理(激勵用超聲波),以創建更小股線分段。然後適配器(合成DNA的短雙鏈件)被連接到這些片段用DNA連接酶的幫助下,聯接的DNA鏈的酶。適配器使序列成爲結合到互補配對。

適配器被合成,使一端是“粘性”,而另一種是'鈍'(非粘性),以期加入鈍端的鈍端DNA。這可能導致分子,因此形成二聚體之間的堿基配對的潛在的問題。爲了防止這種情況,DNA的化學結構被利用,因爲結紮開出的3'-OH和5'-P結束之間進行。通過從適配器的粘性末端除去磷酸鹽和因此建立一個5'-OH端相反,DNA連接酶是無法形成兩個末端之間的橋(圖1)。

新一代測序文库制备

圖1 | 新一代測序文库制备

为了測序是成功的,该文库片段需要在PCR菌落或'polonies“,因为它们是公知的,它包括一个特定的文库片段的许多拷贝的在空间上聚集。由于這些polonies附著在一個平面方式,所述陣列的特征可以酶促並行操縱。文库构建的这种方法比菌落采摘和大肠杆菌克隆的用于分离和擴增DNA为Sanger測序先前劳动密集型过程快得多,但是,这是在片段的读出长度为代价。

放大

文库擴增是必需的,以便从音序接收的信号是强到足以精确地检测。用酶擴增,可发生导致某些文库片段的优先擴增的现象,如“偏置”和“复制”。相反,有几种类型的擴增过程的其中使用的PCR来创建大量的DNA簇。

乳液PCR

乳液油,珠,PCR混合物和文庫DNA混合以形成這導致微孔(形成的乳液圖2)。

乳液PCR

圖2 | 乳液PCR

为了使測序过程是成功的,每个微井应包含一胎圈与DNA的一条链(微井的约15%是该组合物的)。在PCR然後變性的文庫片段領先兩個單獨的鏈,其中(反向鏈)之一退火至珠粒。退火的DNA通过聚合酶从朝向引物位点的珠开始擴增。原始反向鏈然後變性,並從胎圈只有重新退火釋放到珠,得到兩個分開的鏈。这些都被擴增,得到附着在胎圈两条DNA链。該處理然後在30-60個循環導致DNA的簇重複。这种技术已经被批评为耗时的性质,因为它需要很多步骤(成型和破乳,PCR擴增,浓缩等),尽管它在许多的NGS平台的广泛使用。這也是相對低效的,因爲只有兩個周圍三分之二乳液的微反應器實際上將包含一個珠子。因此,一個額外的步驟是必需的空系統,從而導致更多的潛在不准確分離。

大橋PCR

流動池的表面上密集地塗覆有對附著在DNA文庫片段(引物互補的引物如圖3)。然後將DNA連接到隨機的細胞的表面上,其中它暴露于試劑用于基于聚合酶延伸。在加入核苷酸和酶,DNA的單鏈的自由端附著在經由互補的引物的細胞的表面上,形成橋接結構。酶,然後用橋相互作用,使它們的雙鏈,這樣,當變性發生時,兩個單鏈DNA片段連接到在靠近表面。這一過程的重複導致局部相同鏈的克隆簇。爲了優化集群密度,試劑濃度必須密切監控,以避免過度擁擠。

橋接PCR

圖3 | 橋接PCR

測序

新一代測序的几个竞争方法已经由不同的公司开发的。

454焦磷酸測序

焦磷酸測序是基于“測序通过合成”的原则,在互补链在聚合酶(的存在下合成的圖4)。相反,使用双脱氧核苷酸终止链的擴增(如在Sanger測序),焦磷酸測序代替检测何时核苷酸加到DNA链焦磷酸的释放。它最初使用乳液PCR技术来构建用于測序所需的polonies并移除互补链。接着,将单链DNA的測序引物杂交到链(引物结合区)的端部,则四种不同的dNTP,然后依次制成在polonies进出井流动。當正確的dNTP被酶納入鏈,它會導致焦磷酸鹽的釋放。在ATP硫酸和腺苷的存在下,將焦磷酸轉化爲ATP。這項ATP分子用于熒光素熒光素酶催化轉化爲氧化螢光素,它産生可與相機被檢測的光。光的相對強度正比于加入的堿的量(即兩倍的強度的峰值表示兩個相同的堿基相繼增加了)。

454焦磷酸測序

圖4 | 454焦磷酸測序

焦磷酸測序,由454生命科学公司研制,是新一代測序的早期成功之一; 的確,454生命科學公司生産的第一個商用的下一代音序器。然而,该方法是由其他技术黯然失色,并在2013年,新业主罗氏宣布454生命科学的關閉和454焦磷酸測序平台停产。

离子洪流半导体測序

离子洪流測序采用了“測序通过合成”的方式,在一个新的DNA链,目标链互补,在一次合成一个碱基。一種半導體芯片檢測的DNA聚合(期間産生的氫離子圖5)。

以下使用乳液PCR聚合酶群落的形成,DNA文库片段被顺序地充斥各三磷酸核苷(的dNTP),如焦磷酸測序。則的dNTP摻入新鏈如果互補的靶鏈的核苷酸。每個成功添加的核苷酸的時候,氫離子被釋放出來,並且它由定序器的pH傳感器檢測到。如在焦磷酸測序方法中,如果被加入相同的核苷酸的一个以上,在pH值/信号强度的变化是相应较大。

离子洪流半导体測序

圖5 | 离子洪流半导体測序

离子洪流測序是第一个商业化的技术不使用荧光和摄像头扫描; 它因此比許多其他方法更快和更便宜。不幸的是,它可能難以枚舉加入相同的堿基數連續。例如,可能難以區分pH變化爲長度9的homorepeat長度10的一個,使得難以重複序列進行解碼。

通过连接測序(固体)

固体为測序的酶方法,使用DNA连接酶,在生物技术广泛用于其结扎双链DNA链的能力(一种酶圖6)。乳液PCR用于以固定/放大已上的珠子结合到靶序列(即是序列待測序)一个单链DNA引物结合区(称为适配器)。然後,這些珠粒沈積到玻璃表面-珠的高密度,可以實現這反過來,增加了該技術的吞吐量。

一旦珠沈積發生,長度爲N的引物雜交到適配器,則珠粒暴露于具有在5種不同的熒光染料'端和3羟基'端8聚體探針的文庫。基地1和2是对核苷酸互补,而碱基3-5待測序是简并碱基6-8是肌苷碱基。只有一個互補的探針將雜交到靶序列鄰近于引物。DNA連接酶是隨後使用的8聚體探針加入到引物。堿基5和6之間的硫代磷酸酯連接允許熒光染料從使用銀離子的片段被裂解。這個裂解允許測量熒光(四種不同的熒光染料的使用,所有這些都具有不同的發射光譜),並還産生可經曆進一步結紮5'-磷酸基。一旦第一轮測序完成,延伸产物被熔化掉,然后进行第二轮測序是perfomed与长度为N-1的引物。測序的多轮使用较短的引物各时间(即N-2,N-3等),并测量荧光确保目标被測序。

由于两碱基測序方法(因为每个基被有效地測序两次),固体技术是高度准确的(在含有第六底漆99.999%,这是最精确的第二代平台),也便宜。它可以在7天的时间可以产生数据的30 GB完成一次运行。不幸的是,它的主要缺點是,讀取長度短,使得它不適合于許多應用。

測序结扎

圖6 | 測序结扎

可逆终止子測序(Illumina公司)

可逆终止子測序从在传统的Sanger法的不同,而不是终止不可逆地使用双脱氧核苷酸的引物延伸,修饰的核苷酸在可逆终止使用。而许多其它技术使用乳液PCR来擴增该DNA文库片段,可逆终止使用桥的PCR,提高该工艺阶段的效率。

可逆的终止子可分为两类:3'-O-阻斷可逆終止子和3'-暢通可逆終止子。

3'-O-阻斷可逆終止子

该机构通过合成方法使用測序,拉长以逐步的方式的引物。首先,測序引物和模板固定于固体支持物。支撐暴露于四個DNA堿基,其具有除了一個3'-O-疊氮基連接(到含氮堿)不同的熒光團(的圖7)。

在Illumina的測序中使用荧光标记的dNTP结构

圖7 | 在Illumina的測序使用结构荧光标记的dNTP

只有正確的堿基退火至目標,並隨後連接到引物。然後將固體載體進行成像並且尚未摻入的核苷酸被沖走和熒光分支使用的TCEP(三(2-羧乙基)膦)裂解。TCEP還刪除3'-O-疊氮基,再生的3'-OH,循環可以重複(圖8)。

可逆终止子測序

圖8 | 可逆终止測序

3'-暢通可逆終止

的3'-暢通可逆終止子的可逆终止基团连接到基极和荧光基团,它现在作为终止基团的一部分,以及作为记者两者。此方法从3'-O-阻斷可逆終止子方法的不同之处有三种:第一,3'-位没有被阻塞(即基座具有游离的3'-OH); 熒光團是所有四種堿基相同; 和每個修改堿的順序,而不是在同一時間流。

這些技術的主要缺點在于它們的差讀出長度,這可以通過兩個現象之一引起的。爲了防止兩個核苷酸的摻入在一個單一的工序中,一個塊到位,但在沒有嵌段加成的情況下,由于差的合成,股線可以成爲相創建這限制了讀出長度的噪聲進行。如果熒光團沒有被成功連接或移除噪聲也可以被創建。这些问题是在其他測序方法盛行,并且是主要限制因素读取长度。

該技術是由Illumina公司首創,用自己的HiSeq和MiSeq平台。HiSeq是最便宜的为每百万个碱基0.02 $成本的第二代測序仪的。它还具有600 GB的每个输出高位运行数据需要大约8天的时间完成。

第三代測序

技术的新世代以来一直使用单分子測序和单实时測序的发展,消除对克隆擴增的需要。這減少了由PCR錯誤,簡化了庫制劑,以及最重要的是,使用更高的吞吐量平台高得多的讀出長度。实例包括太平洋Biosciences的平台,它使用SMRT(单分子实时)測序,得到一个约一千个碱基和Helicos Biosciences公司利用单分子測序,因此并不要求事先測序擴增读长。牛津納米孔技術目前正在開發其受到改變作爲DNA穿過孔的電流矽基納米孔。这预计是DNA測序的高通量快速的方法,尽管如通过孔减缓交通问题必须首先解决。

 

測序表观遗传修饰

正如新一代測序使基因測序大规模,现在已经很清楚最近,遗传密码不包含有机物所需的所有信息。表觀遺傳修飾的DNA堿基,特別是5-甲基胞嘧啶,也傳達重要信息。

所有的第二代測序平台依赖,如Sanger測序,PCR的,因此无法序列修饰的DNA碱基。實際上,無論是5-甲基胞嘧啶和5-羟甲基被視爲由參與的PCR酶胞嘧啶; 因此,表观遗传信息測序过程中丢失。

亚硫酸盐測序

亚硫酸盐測序利用了胞嘧啶和5-甲基胞嘧啶相对于亚硫酸氢盐的反应性的差异:胞嘧啶亚硫酸氢脱氨,形成尿嘧啶(測序时,其內容为T),而5-甲基胞嘧啶是反应性(即读为C)。如果两个測序运行并行,一个有亚硫酸氢盐处理和一个没有,完成了两次运行的输出之间的差异表明,在原始序列甲基化的胞嘧啶。這種技術還可以用于雙鏈DNA,因爲用亞硫酸氫處理後的鏈不再互補,並且可以被視爲單鏈DNA。

5-羟甲基,另一个重要的表观遗传修饰,反应用亚硫酸氢形成胞嘧啶-5-甲基磺酸盐(为C測序时其內容)。这有点复杂事务,并且意味着亚硫酸氢盐測序不能用作甲基化的本身就是一个真实指示器。

氧化亚硫酸氢盐測序

氧化亚硫酸氢盐測序添加化学氧化步骤,其中使用氢过钌酸铵,KRuO4,亚硫酸氢盐处理前5-羟甲基转化为5- formylcytosine。5- Formylcytosine被deformylated和脱氨基,以形成由亚硫酸氢盐处理尿嘧啶。现在,三个独立的測序运行是必要区分胞嘧啶,5-甲基胞嘧啶和5-羟甲基(参见圖9)。

用亚硫酸氢盐測序表观遗传修饰

圖9 | 利用測序表观遗传修饰的亚硫酸氢

新一代測序中的应用

新一代測序已使研究人员能够收集数量庞大的基因測序数据。這種技術具有的應用,如過多:診斷和了解複雜疾病; 全基因组測序; 表觀遺傳修飾的分析; 线粒体測序; 转录组測序 - 了解基因变异如何表达改变影响到一个有机体; 和外显子測序 - 在外显子组突变被认为含有高达90%的突变在人类基因组,从而导致疾病。DNA技術已被用于鑒定和分離負責某些疾病的基因,並且提供被稱爲“基因療法”有缺陷的基因的正確副本。

在基因治療中大焦點區域是癌症治療-一種可能的方法是引進的反義RNA(其特異性地防止靶蛋白的合成)向癌基因,這是觸發以形成腫瘤細胞。另一種方法被命名爲“自殺基因療法”它引入基因來殺死癌細胞選擇性。毒性的蛋白質和酶的許多遺傳密碼是已知的,和引入這些基因進入腫瘤細胞會導致細胞死亡。在此方法的困難在于確保非常精確的遞送系統,以防止殺死健康細胞。
这些方法成为可能通过測序来分析肿瘤的基因组,从而使医学专家能够更有效地定制化疗和其它癌症的治疗,以病人的独特遗传组成,彻底改变个性化医疗的诊断阶段。

随着DNA測序成本下降,这将变得更加普遍,这带来了一些问题。測序产生大量数据,并且有与处理和存储的数据相关联的许多计算挑战。也有伦理问题,诸如个人的DNA的所有权时,DNA被測序。DNA測序数据必须安全地存储,因为有一些保险集团,抵押贷款经纪人和雇主可以使用这些数据来修改保险报价或候选人区分的担忧。測序也可能有助于找出个体是否具有增加的风险的特定疾病,但病人是否被通知或者如果有这种疾病的治疗是另一个问题完全。

香港基因檢測中心

HK.DNA DIAGNOSTICS CENTRE LIMITED

Call Us: 00852-55129372 For Emergency