电竞比分网-中国电竞赛事及体育赛事平台

分享

“基因2.0時代”的核心技術:基因合成(下)

 生物_醫(yī)藥_科研 2019-07-10

高通量基因測序等技術“讀”DNA,基于遺傳信息正快速用于醫(yī)療健康等,此為當下“基因1.0時代”;而正在醞釀的“基因2.0時代”,通過基因合成 “寫”DNA,能夠深度理解和設計生物系統(tǒng),重構育種和能源等領域。預見未來,本文從技術角度一覽基因合成原理和流程(下篇)。

* 歡迎向基因慧投稿,融資信息首發(fā)免費。

劃重點

1. 主要技術平臺:物理掩膜法原位合成儀器、光敏保護基團介導的光控原位合成儀器、基于電化學介導酸脫保護合成方法的半導體原位合成儀器、噴墨式打印DNA原位合成儀器、基于硅片的噴墨式合成儀器及原位拼接技術。 

2.主要技術挑戰(zhàn):產量過低、合成長度受限、合成準確性局限、成本仍需優(yōu)化。

3.提高合成保真性的對策:需改進芯片設計以及合成工藝,并引入額外的錯誤糾正措施,來降低合成錯誤率。

圖片來自網絡

DNA測序和人工合成技術共同推進了合成生物學的快速發(fā)展。隨著技術發(fā)展,測序成本被急劇壓縮,基因合成和寡核苷酸合成的成本有一定降低,但并沒呈現(xiàn)顯著態(tài)勢,仍有優(yōu)化空間,這也是規(guī)?;慨a的核心因素。

如何解決這個問題,我們先來認識DNA合成成本及技術平臺。

基因合成的成本一般與寡核苷酸的合成成本直接相關。十多年來,寡核苷酸的合成成本沒有明顯下降。通常根據合成規(guī)模、寡核苷酸的長度和供應商的不同,每個堿基的合成成本不同。傳統(tǒng)的供應商進行基因合成的成本約為每堿基0.10到0.30美元(1kb基因的成本為100-300美元)(Hughes, R.A. and A.D. Ellington 2019)。

基因合成的主要成本來自寡核苷酸合成的試劑消耗,此外,DNA合成還是一個勞動密集型的過程。因此,減少合成試劑消耗,提高通量,提高基因裝配過程的自動化和準確性,才能顯著降低基因合成的綜合成本。基于微陣列的寡核苷酸合成技術,以及對應的下游DNA片段組裝技術的發(fā)展,正是顯著降低基因合成成本的希望所在。

 一   寡核苷酸微陣列合成

1) 主要技術平臺

圖1:寡核苷酸固相合成方法。A.柱式合成;B.微陣列合成。(來源:Cold Spring Harb Perspect Biol)

微陣列寡核苷酸合成技術,也被稱為芯片合成技術 (圖1B) ,最初用于診斷,現(xiàn)在已經成為一種極有希望低成本替代柱式寡核苷酸合成的方法。Affymetrix公司是這一領域的早期先驅之一,開發(fā)了物理掩膜法原位合成儀器(Fodor et al. 1991;Pease et al. 1994) ,采用光活化化學技術,利用標準掩膜光刻技術在芯片表面選擇性地脫保護特殊的光不穩(wěn)定性核苷亞磷酰胺單體,從而控制不同區(qū)域的寡核苷酸合成。

圖2:主要微陣列合成技術平臺。(來源:作者)

Roche Nimblegen公司和LC Sciences公司(聯(lián)川生物國際研發(fā)中心)簡化了光介導的合成過程,將光控方法從物理掩膜升級到數字化控制方法,開發(fā)了光敏保護基團介導的光控原位合成儀器(Singh-Gasson et al. 1999;Gao et al. 2001)。

CustomArray公司開發(fā)了基于電化學介導酸脫保護合成方法的半導體原位合成儀器(Egeland, R.D. et al. 2002; Ghindilis, A.L., et al.2007),可使用標準的亞磷酰胺單體和相關試劑進行DNA合成,避免了昂貴的物理掩膜或光學儀器。Agilent公司研發(fā)的噴墨式打印DNA原位合成儀器則采用非接觸式工業(yè)噴墨印刷工藝,四種堿基單體作為“墨水”逐個噴點在芯片上,實現(xiàn)原位打印寡核苷酸引物,該公司能夠合成長度超過200個核苷酸的長鏈引物(Recht, M.I., et al.1996;Hughes, T.R., et al.2001)。Twist公司開發(fā)了基于硅片的噴墨式合成儀器及原位拼接技術(專利US9981239B2, US9677067B2)。

2) 主要技術優(yōu)勢及缺陷

基于芯片的寡核苷酸微陣列合成技術提供了傳統(tǒng)柱式合成所不可能實現(xiàn)的多通道合成模式。由于每張芯片可能有上萬的合成密度,一些合成儀甚至能夠同時合成多張芯片,微陣列的合成能力遠遠超過了最大的柱式合成儀器。但是因為芯片合成的寡核苷酸組分過于復雜,無法單獨分離,如果這些寡核苷酸用于DNA合成,會存在組裝背景過于復雜的挑戰(zhàn)。

微陣列合成平臺可以顯著提高寡核苷酸的合成通量,合成所需消耗的試劑量顯著減少,從而大大降低了成本。根據平臺、寡核苷酸長度和合成規(guī)模的不同,基于微陣列平臺合成的寡核苷酸成本從0.00001到0.0001美元不等。與柱式合成寡核苷酸每個堿基0.05-0.10美元的成本相比,芯片合成寡核苷酸在基因合成應用中的優(yōu)勢十分明顯。

【對于基因合成應用場景,不利之處】

1.單條寡核苷酸的產量過低,通常比柱式合成低2-4個數量級。

2.合成長度受限、產物過于復雜,干擾后續(xù)的DNA組裝過程。

3.合成準確性受限,引入更多合成錯誤,提高驗證和錯誤矯正成本。

 二   基于微陣列寡核苷酸的基因合成策略

1) 主要挑戰(zhàn)及對應解決方案

目前基因組層面的人工合成基本是始于柱式合成的寡核苷酸,或者商業(yè)合成的經過克隆驗證的1-2 kbDNA模塊,無法成熟運用成本更低、通量更高的微陣列合成寡核苷酸,原因在于微陣列進行DNA的從頭合成拼接仍存在一系列待解決的問題。

【待解決的問題】

1.合成長度短。

2.錯誤率高。

3.單種序列合成產量低。

4.寡核苷酸庫成分復雜,不利于拼接。

但是這些問題不是不可逾越的(圖3)。比如,Church研究組等采用寡核苷酸亞庫擴增的策略,并引入酶法糾正系統(tǒng),解決了錯誤率、產量和成分復雜的難點(Kosuri, Eroshenko et al. 2010);高曉連研究組和Church研究組等通過擴增提高寡核苷酸濃度,并通過反向鏈雜交來降低錯誤率(Tian, Gong et al. 2004);田敬東研究組采用物理手段將寡核苷酸分組到不同微孔,再通過原位擴增拼接,來降低成分的復雜性(Quan, Saaem et al. 2011)。

圖3:微陣列寡核苷酸用于基因合成。A. 芯片原位組裝;B. 亞庫組裝策略。(來源:Cold Spring Harb Perspect Biol)

2) 微陣列寡核苷酸合成及拼接保真性低

微陣列合成寡核苷酸用于基因合成最嚴峻的一個問題是微陣列合成的寡核苷酸質量往往較低,與柱式合成的寡核苷酸相比存在更多合成錯誤(Kosuri and Church 2014;Wan et al. 2014)。 

導致合成質量下降的原因之一是芯片上寡核苷酸序列的脫嘌呤化,在合成周期中,由于新生的寡核苷酸長時間暴露在脫保護試劑中,脫嘌呤會自發(fā)發(fā)生。優(yōu)化反應條件和試劑在合成芯片的流動循環(huán),可以有效提高寡核苷酸合成芯片的質量,減少脫嘌呤的發(fā)生,提高得率,進而合成長達200nt的寡核苷酸(LeProust et al . 2010年)。 

另一個原因是 邊緣效應”,包括反應液滴未對準,試劑封閉不力,或光控系統(tǒng)中光束偏移導致不精確的脫保護反應,都會造成邊緣效應,導致鄰近區(qū)域的寡核苷酸序列產生堿基錯誤。對芯片設計的改進可以提高微陣列寡核苷酸的保真度(Saaem et al. 2010)。因此,微陣列芯片設計和合成試劑、工藝的不斷改進,將推動低成本、高質量、長寡核苷酸的高保真合成,為基因合成服務。

3) 提高合成保真性的對策

目前微陣列寡核苷酸直接用于基因合成的最大問題依舊是錯誤率較高,需改進芯片設計以及合成工藝來降低合成錯誤率(Wan, Li et al. 2014, Lubock, Zhang et al. 2017)。在寡核苷酸化學合成過程中,每一步單體成功偶聯(lián)的效率大于或等于98% (Tian, Gong et al. 2004)。插入和缺失突變是這一過程中最常見的兩種突變類型。缺失突變通常來自未完成的偶聯(lián)或者脫保護步驟,每個位置發(fā)生缺失突變的概率大約是5%。而插入突變通常是非預期的DMT切割反應導致的,每個位置發(fā)生的概率高達0.4% (Hall, Micheletti et al. 2009)。除去這些非特異的副產物,芯片合成的100 mer寡核苷酸中只有30%是目標產物(Tian, Ma et al. 2009)。存在合成錯誤的寡核苷酸被引入基因拼接階段,會將錯誤率進一步放大。

【拼接過程錯誤率高的應對方法】

1.寡核苷酸純化:純化后的寡核苷酸可以將合成產物的保真性提高數倍(Xiong, Yao et al. 2006)。但是這種方法只能去除長度不正確的錯誤序列,無法識別堿基替換的突變類型(Young and Dong 2004)。對于分辨和去除單個堿基缺失或插入突變的寡核苷酸也存在一定困難,而這種突變類型恰好是基因拼裝過程中的主要突變類型(Tian, Gong et al. 2004)。 

2.功能篩選:當合成的目標DNA是編碼序列時,功能篩選可以用來去除含有突變導致失去功能的DNA產物。在化學合成寡核苷酸的過程中,n-1的邊產物是引入突變的主要類型(Tian, Gong et al. 2004)。功能篩選方法對于去除寡核苷酸化學合成過程中的單個堿基缺失突變類型是非常有效的。Cox等人利用該方法,將正確合成的DNA序列的比例提高了4到5倍(Cox, Lape et al. 2007)。 

3.二代測序方法選擇正確寡核苷酸:Matzas等人利用羅氏454測序技術與挑揀磁珠的機器人相結合,從測序序列中有選擇地去除寡核苷酸序列(附著在磁珠上),將正確序列用于基因合成(Matzas, Stahler et al. 2010)。Kim等人使用隨機序列標簽在454測序反應中標記單個序列,并使用這些標簽選擇性地擴增正確序列(Kim, Han et al. 2012)。Schwartz等人采用類似的方法,利用Illumina測序條碼,通過選擇性擴增序列驗證的條碼序列,選出正確的序列(Schwartz, Lee et al. 2012)。2016年Klein等人改進了這一方法,從單個寡核苷酸池中組裝了2271條131-250 bp長度的片段,將正確比例提高到70.6% (Klein, Lajoie et al. 2016)。 

4.錯配識別糾錯方法:錯配修復系統(tǒng)相關的蛋白可以維持基因組DNA復制過程中序列的保真性(Modrich 1991)。引入錯配識別蛋白到人工合成DNA的糾錯系統(tǒng),可以顯著提高DNA拼裝產物的保真性。

基于錯配修飾系統(tǒng)相關蛋白來提高合成保真性的策略,一種是錯配結合蛋白系統(tǒng)。錯配結合蛋白可以選擇性地結合含有錯配的DNA雙鏈,形成蛋白質-DNA復合體,該復合體和未結合的正確DNA可以通過凝膠阻滯分析(Gel-shift assay)或者親和柱分離,最終達到錯誤去除的目的(Modrich 1991)。Carr等人成功開發(fā)用于糾錯系統(tǒng),并可以顯著提高DNA的保真度,將錯誤率從1.8 errors/kb降低到0.1 error/kb (Carr, Park et al. 2004, Binkowski, Richmond et al. 2005)。Binkowski, B. F.等人則在此基礎上優(yōu)化了糾錯系統(tǒng),將蛋白質固定在固相基質上,特異性結合含有錯配的DNA雙鏈,形成較大的蛋白質-DNA復合體,而后通過離心方法去除,得到未結合的正確配對的DNA雙鏈,該方法可以將組裝的GFPuv基因序列的錯誤率從1.3 error/kb降低到0.3 error/kb(Binkowski, Richmond et al. 2005)。聯(lián)川創(chuàng)始人高曉連教授課題組使用MutS固定化纖維素柱成功將基于芯片寡核苷酸拼接的DNA片段錯誤率降低超過20倍(從14.25 error/kb 降至0.66 error/kb) (Wan, Li et al. 2014)。 

另一種用于糾錯系統(tǒng)的蛋白——錯配識別內切酶,可以特異性地識別并切割異源DNA雙鏈上的錯配位置。切割后的序列可以進行大小篩選,或加入另外的酶,比如DNA聚合酶或者外切酶進行降解或者修復。修復后的DNA片段可以通過片段之間的重疊區(qū)域重新被延長至目標長度。Fuhrmann等人比較了噬菌體T4內切酶VII和大腸桿菌內切酶V的糾錯效果,分別可以將合成基因的錯誤率從6.52 error/kb降低到1.62 error/kb和1.98 error/kb(Fuhrmann, Oertel et al. 2005)。基于特異性錯配識別內切酶CEL的糾錯系統(tǒng)已經有商業(yè)化試劑盒,可以將化學合成DNA產物的錯誤率降低16倍,至0.11 error/kb(Kosuri, Eroshenko et al. 2010, Saaem, Ma et al. 2012)。但目前這些方法要想應用到自動化基因合成中,其成本、通量和工作模式仍需要改進。因此,對于基于微陣列寡核苷酸的DNA從頭合成來說,合成基因長度且序列正確的DNA片段比拼接更長片段(比如代謝通路或基因組)更需要突破時間和成本的限制。

 三   展望

在過去的40年中,化學合成方法的自動化發(fā)展以及基因合成方法的發(fā)展促進了我們對生物學的理解,并為生物系統(tǒng)的可預測工程化改造奠定了基礎。人工合成的DNA已被用于評測功能組件(Salis et al.2009;Callura et al. 2012),合成基因疫苗(Dormitzer et al.2013),構建合成基因回路(Salis et al.2009;Sowa et al. 2015;Nielsen et al. 2016),基因組合成以及新興的“DNA存儲”領域。

DNA合成技術在生物工程發(fā)展中處于核心地位,當與由NGS產生的大量序列數據相結合時,將有助于合成生物學向更廣闊的應用方向發(fā)展。高通量寡核苷酸合成技術,與高保真組裝技術、自動化技術的結合,使大規(guī)模的工程化改造成為可能。 

當前,較短的DNA片段(1kb)通??梢暂p易得到,但更長的DNA片段組裝仍然對操作人員的技術水平提出更高要求和挑戰(zhàn)。目標序列中存在二級結構以及重復序列都會對其組裝構成挑戰(zhàn)。在DNA合成完畢轉入細胞時,合成DNA結構還可能對宿主細胞造成生長抑制。然而,科技的進步之快令人咋舌,40多年前第一條tRNA基因被合成,2016年第一個最小細菌基因組被合成。人們對生物系統(tǒng)及工程改造的復雜性已經有了深刻的認識,但未來仍有許多知識等待我們去探索。


歡迎就技術/產業(yè)綜述等向基因慧投稿

投稿郵箱:info@genonet.cn

  作者簡介  

李璐璐  博士

李璐璐(微信號:luannelee),博士,畢業(yè)于中國科學技術大學生物化學與分子生物學專業(yè),師從合成生物學先驅高曉連教授,主要進行基于芯片寡核苷酸的高保真組裝技術開發(fā),成果發(fā)表于Nucleic Acids Research 雜志。2014年加入杭州聯(lián)川生物,現(xiàn)任研發(fā)部主管,負責DNA合成技術及NGS基因檢測技術的開發(fā)工作。

參考資料:

1.Binkowski, B. F., K. E. Richmond, J. Kaysen, M. R. Sussman andP. J. Belshaw (2005). 'Correcting errors in synthetic DNA throughconsensus shuffling.' Nucleic Acids Research 33(6).

2.Carr, P. A., J. S. Park, Y. J. Lee, T. Yu, S. G. Zhang and J. M.Jacobson (2004). 'Protein-mediated error correction for de novo DNAsynthesis.' Nucleic Acids Research 32(20).

3.Cox, J. C., J. Lape, M. A. Sayed and H. W. Hellinga (2007).'Protein fabrication automation.' Protein Science 16(3): 379-390.

4.Fuhrmann, M., W. Oertel, P. Berthold and P. Hegemann (2005).'Removal of mismatched bases from synthetic genes by enzymatic mismatchcleavage.' Nucleic Acids Research 33(6).

5.Hall, B., J. M. Micheletti, P. Satya, K. Ogle, J. Pollard and A.D. Ellington (2009). 'Design, synthesis, and amplification of DNA poolsfor in vitro selection.' Curr Protoc Nucleic Acid Chem Chapter 9: Unit 92.

6.Kim, H., H. Han, J. Ahn, J. Lee, N. Cho, H. Jang, H. Kim, S.Kwon and D. Bang (2012). ''Shotgun DNA synthesis' for the high-throughputconstruction of large DNA molecules.' Nucleic Acids Res 40(18): e140.

7.Klein, J. C., M. J. Lajoie, J. J. Schwartz, E. M. Strauch, J.Nelson, D. Baker and J. Shendure (2016). 'Multiplex pairwise assembly ofarray-derived DNA oligonucleotides.' Nucleic Acids Res 44(5): e43.

8.Kosuri, S., N. Eroshenko, E. M. Leproust, M. Super, J. Way, J.B. Li and G. M. Church (2010). 'Scalable gene synthesis by selectiveamplification of DNA pools from high-fidelity microchips.' Nat Biotechnol28(12): 1295-1299.

9.Lubock, N. B., D. Zhang, A. M. Sidore, G. M. Church and S.Kosuri (2017). 'A systematic comparison of error correction enzymes bynext-generation sequencing.' Nucleic acids research 45(15): 9206-9217.

10.Matzas, M., P. F. Stahler, N. Kefer, N. Siebelt, V. Boisguerin,J. T. Leonard, A. Keller, C. F. Stahler, P. Haberle, B. Gharizadeh, F.Babrzadeh and G. M. Church (2010). 'High-fidelity gene synthesis byretrieval of sequence-verified DNA identified using high-throughputpyrosequencing.' Nat Biotechnol 28(12): 1291-1294.

11.Modrich, P. (1991). 'Mechanisms and biological effects ofmismatch repair.' Annu Rev Genet 25: 229-253.

12.Quan, J., I. Saaem, N. Tang, S. Ma, N. Negre, H. Gong, K. P.White and J. Tian (2011). 'Parallel on-chip gene synthesis and applicationto optimization of protein expression.' Nat Biotechnol 29(5): 449-452.

13.Saaem, I., S. Ma, J. Quan and J. Tian (2012). 'Errorcorrection of microchip synthesized genes using Surveyor nuclease.'Nucleic Acids Res 40(3): e23.

14.Schwartz, J. J., C. Lee and J. Shendure (2012). 'Accurategene synthesis with tag-directed retrieval of sequence-verified DNAmolecules.' Nature Methods 9: 913.

15.Tian, J., H. Gong, N. Sheng, X. Zhou, E. Gulari, X. Gao and G.Church (2004). 'Accurate multiplex gene synthesis from programmable DNAmicrochips.' Nature 432(7020): 1050-1054.

16.Tian, J. D., K. S. Ma and I. Saaem (2009). 'Advancinghigh-throughput gene synthesis technology.' Molecular Biosystems 5(7):714-722.

17.Wan, W., L. Li, Q. Xu, Z. Wang, Y. Yao, R. Wang, J. Zhang, H.Liu, X. Gao and J. Hong (2014). 'Error removal in microchip-synthesizedDNA using immobilized MutS.' Nucleic Acids Res 42(12): e102.

18.Xiong, A. S., Q. H. Yao, R. H. Peng, H. Duan, X. Li, H. Q. Fan,Z. M. Cheng and Y. Li (2006). 'PCR-based accurate synthesis of long DNAsequences.' Nature Protocols 1(2): 791-797.

19.Young, L. and Q. H. Dong (2004). 'Two-step total genesynthesis method.' Nucleic Acids Research 32(7).

20.Xie, Z.-X., et al., 'Perfect' designer chromosome Vand behavior of a ring derivative. Science, 2017. 355(6329).

21.Shen, Y., et al., Deep functional analysis of synII, a770-kilobase synthetic yeast chromosome. Science, 2017. 355(6329).

22.Wu, Y., et al., Bug mapping and fitness testing of chemicallysynthesized chromosome X. Science, 2017. 355(6329).

23.Zhang, W., et al., Engineering the ribosomal DNA in a megabasesynthetic chromosome. Science, 2017. 355(6329).

24.Hughes, R.A.and A.D. Ellington, Synthetic DNASynthesis and Assembly: Putting the Synthetic in Synthetic Biology. ColdSpring Harb Perspect Biol, 2017. 9(1).

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多