核酸链的大规模平行酶促合成
1.本发明涉及用于大规模平行合成核酸链的新方法。
2.生物学可以以非凡的密度、稳定性和效率存储信息,有可能在数量级上胜过基于电子的长期数据存储。大自然可以在人类细胞中常规地存储和提取超过3千兆字节的信息,并协调信息的分层传递,以分化组织和调节代谢过程。然而,这些信息的存储和访问与数据中编码的生物过程紧密相连;因此,将其改写为数字数据存储严重受限于我们目前以可比较的半导体数字规模读写dna的能力。dna测序的最新进展已经极大地提高了我们的读取能力,每次测序运行的通量超过了兆兆碱基dna(terabases of dna),为高通量读取提供了可能性,尽管即使是这种通量也不足以实现与数字系统相当的通量。就通量和成本而言,dna合成能力落后于测序能力至少两个数量级。然而,使用现有的dna合成和测序技术的演示已经证明了这种方法在数据存储方面的能力,例如church等人,science,337(6102):1628(2012);organick等人,nature biotechnology,36(3):242
‑
248(2018);等等。挑战在于,自然界中密集的分层数据存储要求在编码算法、dna合成和dna测序方面都取得突破,才能提供真正的基于分子的数据存储能力。
3.特别是,当前的dna数据存储方法将读取和写入视为单独的过程,因此信息在合成过程中被编码在dna中,合成和编码的dna链被单独存储,并且通过选择性扩增和测序来检索信息,例如,bornholt等人,ieee micro,37(3):98
‑
104(2017)。如果在同一基底上支持dna的写入或合成以及dna的读取或测序的dna存储设备可用,则可以更有利地利用dna的高信息存储能力。
4.发明概述
5.本发明涉及多于一种核酸的平行无模板酶促合成方法;并且更具体地,涉及具有局部电化学去保护步骤的平行无模板酶促合成核酸的方法。局部电化学去保护可以以多于一种方式完成,包括,例如,控制局部反应位点的ph以去保护对ph敏感的键,和/或通过使对氧化还原敏感的保护基团还原或氧化来控制局部反应位点和参比电极之间的电位差或电压差以去保护。在一些实施方案中,电化学去保护使用电极阵列局部实施,其中每个反应位点的电化学性质的控制由一个或更多个相关电极确定。在一些实施方案中,本发明涉及在基底上平行合成多核苷酸以存储信息,以及同一基底上测序该多核苷酸以检索信息。在一些实施方案中,这种测序使用合成测序方法进行,该方法使用脱氧核苷三磷酸(dntp),其可以具有通过局部电化学变化可去除的标记和/或通过局部电化学变化可去除的3
’‑
o
‑
封闭基团。
6.本发明的另一个目的是集成提供分子数据存储系统所需的多于一种先进技术,该系统将用最佳工业实践来设计、测试和优化。这要求先进的新的dna合成技术、新的dna测序方法、微型制造、微流体和稳健的编码。为此,本发明提出通过使用酶促核酸合成和相关的生物学机制来利用生物学编码系统的分子精度和多样性,使用微系统和微流体来获得对生物化学的精确控制,从而实现高度平行化的合成、读出和存储,和/或使用快速设计
‑
构建
‑
测试迭代、过程控制工具箱,包括设计实验来提供完全集成的系统而不是单独的技术。
7.本发明的方法为存储、检索和操作系统提供了技术解决方案。更具体地说,存储部
分通过组合新的酶促dna合成技术的潜力和现有的并被证明高度平行化的自动化方法来解决。检索部分通过利用现有的“合成测序”(sbs)技术结合数据结构的优化来解决,现有的“合成测序”(sbs)技术经过优化以与特定的dna结构、条形码编码(barcoding)和密度一起作用。操作系统部分展示了用于优化数据密度的方案。
8.在一些实施方案中,通过本发明的方法产生的多于一种多核苷酸可以组合形成更大的片段,诸如用于合成生物学中使用的基因。
9.在一些实施方案中,本发明的无模板酶促合成方法可用于将另外的信息附加到携带编码信息的预先存在的多核苷酸上。这种添加的信息可以纠正预先存在的信息,例如在纠正或更新地址时,或者添加的信息可以在某种意义上简单地否定或作废预先存在的信息。
10.在一种这样的实施方案中,可以将包含预先存在的信息的多核苷酸接种在反应位点上,并在动力学排斥条件下或通过模板步移进行扩增,例如ma等人,proc.natl.acad.sci.,110(35):14320
‑
14323(2013);美国专利9476080;8895249;等等。通过将核苷酸的预定序列酶促偶联到克隆的多核苷酸的末端来向克隆的多核苷酸添加新的信息。核苷酸的预定序列可以包括编码格式的新信息。在一些实施方案中,在添加新信息之前,克隆的多核苷酸被部分或全部测序,使得在特定反应位点添加的新信息可以取决于通过初始测序从特定位点的克隆的多核苷酸提取的信息含量。在一些实施方案中,已经添加了新信息的克隆的多核苷酸可以从反应位点裂解,用于储存或用于进一步的处理步骤。
11.在一些实施方案中,可以使用比天然核苷酸更耐降解的修饰的核苷酸来合成多核苷酸,从而增加储存寿命和信息完整性。在一些实施方案中,用硫代磷酸酯、2
’‑
氟代或2
’‑
o
‑
me核苷酸单体完全代替天然核苷酸单体,或作为合成链中核苷酸的一部分,例如,以减少酶促降解。在一些实施方案中,完整的多核苷酸通过磷酸化其3
’‑
末端而被“封端”,例如,以降低核酸外切酶消化的可能性。在一些实施方案中,可以通过使用在外环胺上也具有碱基保护基团的3
’‑
o
‑
保护的dntp(例如,n
‑
苄基
‑
datp、n
‑
苄基
‑
dctp、n
‑
异丁基
‑
dgtp等)来减少脱氨作用,例如,beaucage和iyer,tetrahedron,48(12):2223
‑
2311(1992)(尤其是表3);narang,synthesis and applications of dna and rna,第1章(academic press,orlando,1987);srivastava等人,国际专利公布wo2010/134992;等等。
12.在一些实施方案中,具有编码信息的多核苷酸可以以例如更耐脱嘌呤的双链形式储存或保持。在其他实施方案中,选择使da相比于其他单体的使用最大化且使dt的使用最小化的编码方案,以使对脱嘌呤的耐受最大化。在一种特定的这样的实施方案中,信息仅使用da、dc和dg编码。在一些实施方案中,本发明的包括合成(写入)多核苷酸和测序(读取)多核苷酸的步骤的方法包括通过合成测序法校对新合成的多核苷酸的步骤,该合成测序法产生双链产物用于储存。为了以后检索多核苷酸中编码的信息,可以将测序链解链并进行重新测序步骤。
13.在一些实施方案中,含有信息的多核苷酸储存在载体溶液中,诸如,容易获得的天然dna,诸如鲑精dna,聚阳离子诸如亚精胺、聚乙烯吡咯烷酮、聚甲基丙烯酸甲酯等。
14.在一些实施方案中,本发明用于并行合成多于一种多核苷酸的方法包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点可操作地与至少一个工作电极相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接并具有3
’‑
o
‑
电化
学不稳定的保护基团;(b)对每种核苷酸进行以下的循环:(i)通过在预定地址处的每个电极和参比电极之间产生电压差,从而使电化学不稳定的保护基团被裂解,以在预定地址的电极处对引发剂或延伸片段去保护,从而在预定地址的电极处的引发剂或延伸片段上产生游离的3
’‑
羟基,(ii)在延伸条件下,使预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;和(c)重复步骤(b),直到预定序列的多核苷酸的阵列完整。
15.在一些实施方案中,本发明涉及具有校对的多核苷酸的无模板酶促合成方法。这样的方法可以以以下步骤实施:a)在与至少一个工作电极可操作地相关联的反应位点提供引发剂,其中所述引发剂具有游离的3
‑
o
‑
羟基;b)重复以下的循环:(i)在延伸条件下,使具有游离3
’‑
o
‑
羟基的引发剂或其延伸片段与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸延伸引发剂或其延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;和(ii)将步骤(i)的延伸片段去保护以形成具有游离3
’‑
羟基的延伸片段,直到多核苷酸完整并且测序引物结合位点被附加到其3’末端;和c)将测序引物退火至测序引物结合位点并对多核苷酸进行测序。
16.在一些实施方案中,本发明涉及一种在多核苷酸阵列上存储信息和从多核苷酸阵列检索信息的方法。这样的方法可以通过以下步骤实施:(a)提供反应位点的空间可寻址阵列,其中每个反应位点可操作地与至少一个工作电极相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接并具有3
’‑
o
‑
电化学不稳定的保护基团;(b)对每种核苷酸进行以下的循环:(i)通过在预定地址处的每个电极和参比电极之间产生预定的电压差使得电化学不稳定的保护基团被裂解,在预定地址的电极处使引发剂或延伸片段去保护,从而在预定地址的电极处的引发剂或延伸片段上产生游离的3
’‑
羟基,(ii)在延伸条件下,使预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;(c)重复步骤(b),直到预定序列的多核苷酸阵列完整,其中每个完整的多核苷酸在其3’末端以5’至3’方向包含信息编码区和测序引物结合位点;和(d)通过在一个或更多个反应位点将测序引物退火到测序引物结合位点并对完整的多核苷酸进行合成测序,从信息编码区检索信息。
17.附图简述
18.图1a包含酶促合成循环的示意图,其中将3
’‑
o
‑
保护的dntp添加到核酸链上,然后去保护。图1b说明了本发明的一种实施方案在可寻址电极阵列上平行无模板酶促合成多于一种多核苷酸的步骤。
19.图2说明了用于数据存储的寡核苷酸的设计(a)和使用中间引物的用于数据存储的寡核苷酸的设计(b)。
20.图3比较了二进制编码(现有技术)、标准dna四进制编码(现有技术)、根据本发明的存在/不存在组合编码(其中数据在每个循环中在核苷酸的存在或不存在下编码的碱基混合物)和根据本发明的25%组合编码(其中数据以每个循环中每个碱基的%编码的碱基混合物——每个碱基有5个可能的%水平:0%、25%、75%和100%)。
21.图4展示了在dna阵列的一个孔上使用如图3中展示的本发明的不存在/存在组合
方案进行编码的实例。数据以14为基数进行编码(x1,x2,
…
,x14)。这里表示的代码x1 x2 x10 x6 x11 x8存储在6nt长的dna链上。它编码超过22位的数据。使用四进制编码,需要12个核苷酸的dna片段来存储相同数量的数据。
22.图5示出了伪3d dna数据存储的实例。微阵列网格是2d的,而dna序列(或组合方案中的序列混合物)是第三个维度。
23.图6a是用于控制电极的电化学条件的恒电位仪电子电路的实施方案。
24.图6b图解说明了用于在电极阵列上合成多核苷酸的设备的实施方案,其中试剂按顺序流过阵列。
25.图6c图解说明了用于在电极阵列上合成多核苷酸的装置的实施方案,该装置使用液滴将试剂输送到电极的反应位点。
26.图7a
‑
图7d说明了对于无模板酶促合成可能的数据存储技术。
27.图8显示了来自反应的延伸产物的电泳图谱,其中不能掺入3
’‑
o
‑
叠氮甲基保护的dntp的突变tdt成功地用3
’‑
o
‑
羟基dntp延伸引物,而3
’‑
o
‑
羟基dntp又是电化学去保护反应的产物,从而展示了电化学使3
’‑
o
‑
叠氮甲基核苷酸去保护的可能性。
28.图9说明了对于若干孵育时间,使3
’‑
o
‑
nh2
‑
核苷酸去保护(即,将3
’‑
o
‑
nh2转化为3
’‑
oh)的效率与ph的关系。
29.发明详述
30.虽然本发明适用于各种修改和替代形式,但其细节已经通过附图中的实例被显示并且将被详细描述。然而,应该理解的是,本发明并非将本发明限制于所描述的特定实施方案。本发明将涵盖落入本发明精神和范围内的所有修改形式、等同物和替代形式。例如,为了说明的目的,装置和阵列的微电子部分以cmos技术实现。然而,应该理解的是,本公开内容不旨在限制这方面,因为可以利用其他基于半导体的技术来实现本文讨论的系统的微电子部分的各个方面。用于制造本发明阵列的指南可在关于集成电路设计和制造以及微机械加工的许多可得的参考文献和论文中找到,包括但不限于allen等人,cmos analog circuit design(oxford university press,2nd edition,2002);levinson,principles of lithography,second edition(spie press,2005);doering和nishi,editors,handbook of semiconductor manufacturing technology,second edition(crc press,2007);baker,cmos circuit design,layout,and simulation(ieee press,wiley
‑
interscience,2008);veendrick,deep
‑
submicron cmos ics(kluwer
‑
deventer,1998);cao,nanostructures&nanomaterials(imperial college press,2004);等等,其相关部分通过引用特此并入。同样,用于进行本发明的电化学测量的指南可在关于该主题的许多可得的参考文献和论文中找到,包括但不限于sawyer等人,electrochemistry for chemists,2nd edition(wiley interscience,1995);bard和faulkner,electrochemical methods:fundamentals and applications,2nd edition(wiley,2000);等等,其相关部分通过引用特此并入。
31.在一方面,本发明提供了一种允许大规模平行酶促合成多核苷酸的新方法。如上所述,在一个方面,该方法使用电化学不稳定的保护基团在大规模电极阵列上进行简单的平行合成。在该方法的一种应用中,多核苷酸用于存储数据,该数据随后可以通过dna测序操作从同一合成支持物检索,例如,使用合成测序技术,特别是使用电化学不稳定的封闭基
团和/或标记的技术。
32.a.酶促dna合成的背景。
33.最近,已经开发了一种酶促合成方法来产生具有最佳纯度的非常长的dna或rna链(wo2015/159023)。导致核苷酸添加到核酸链的酶促合成过程的循环包括两个连续的步骤,分别对应于延伸步骤和去保护步骤(图1a)。概括地说,在延伸步骤期间,聚合酶将包含保护基团的核苷酸添加到核酸链中。然后,从这个新添加的核苷酸除去保护基团,以便能够进行另外的循环。与化学合成相比,这种新的酶促合成技术给核酸合成带来了巨大的改进。下表描述了对于数据存储的主要益处:
[0034][0035]
通常,无模板酶促dna合成的方法包括重复的循环步骤,诸如图1a所示,其中在每个循环中,预定的核苷酸与引发剂或生长链偶联。以下参考文献描述了无模板酶促合成的一般要素:ybert等人,国际专利公布wo/2015/159023;ybert等人,国际专利公布wo/2017/216472;hyman,美国专利5436143;hiatt等人,美国专利5763594;jensen等人,biochemistry,57:1821
‑
1832(2018);mathews等人,organic&biomolecular chemistry,doi:0.1039/c6ob01371f(2016);schmitz等人,organic lett.,1(11):1729
‑
1731(1999)。
[0036]
提供了例如附接于固体支持物(102)的引发剂多核苷酸(100),其具有游离的3
’‑
羟基基团(103)。在有效将3
’‑
o
‑
保护的dntp酶促掺入到引发剂多核苷酸(100)(或延伸的引发剂多核苷酸)的3’末端的条件(104)下,向引发剂多核苷酸(100)(或后续循环中的延伸的引发剂多核苷酸)添加3
’‑
o
‑
保护的dntp和无模板聚合酶,诸如tdt或其变体(例如ybert等人,wo/2017/216472)。该反应产生延伸的引发剂多核苷酸,其3
’‑
羟基受到保护(106)。如果延伸的引发剂多核苷酸包含竞争序列,那么3
’‑
o
‑
保护基团可以被去除,或者去保护,并且期望的序列可以从原始的引发剂多核苷酸裂解。这种裂解可以使用多于一种单链裂解技术中的任何一种来进行,例如,通过在原始引发剂多核苷酸内的预定位置插入可裂解的核苷酸。示例性的可裂解核苷酸可以是被尿嘧啶dna糖基化酶裂解的尿嘧啶核苷酸。如果延伸的引发剂多核苷酸不包含完整的序列,那么去除3
’‑
o
‑
保护基团以暴露游离的3
’‑
羟基(103),并且使延伸的引发剂多核苷酸经受另一循环的核苷酸添加和去保护。根据本发明的一个方面,3
’‑
o
‑
保护基团是电化学不稳定基团。也就是说,保护基团的去保护或裂解通过改变导致裂解的保护基团附近的电化学条件来实现。电化学条件的这种变化可以通过改变或施加物理量来产生,诸如电压差或光来激活辅助物质,这继而引起保护基团位置的电化学条件的变化,诸如ph的升高或降低。在一些实施方案中,电化学不稳定基团包括例如对ph敏感的保护基团,每当ph改变到预定值时,该对ph敏感的保护基团就被裂解。在其他实施方案中,电化学不稳定基团包括这样的保护基团:每当还原或氧化条件改变时,例如通过增加或减
少保护基团位置的电压差,保护基团就被直接裂解。
[0037]
如本文所用,“引发剂”(或等效术语,诸如,“引发片段”、“引发剂核酸”、“引发剂寡核苷酸”等)通常是指具有游离3
’‑
末端的短寡核苷酸序列,其可被无模板聚合酶诸如tdt进一步延伸。在一种实施方案中,引发片段是dna引发片段。在替代实施方案中,引发片段是rna引发片段。在一些实施方案中,引发片段具有3和100个之间的核苷酸,特别是3和20个之间的核苷酸。在一些实施方案中,引发片段是单链的。在替代实施方案中,引发片段是双链的。在一些实施方案中,引发剂可以包含具有游离羟基的非核酸化合物,tdt可以将3
’‑
o
‑
保护的dntp偶联到该化合物上,例如baiga,美国专利公布us2019/0078065和us2019/0078126。
[0038]
回到图1a,在一些实施方案中,在每个合成步骤中,在3
’‑
o
‑
保护的dntp的存在下,使用无模板聚合酶诸如tdt,将核苷酸的有序序列偶联到引发剂核酸。在一些实施方案中,合成寡核苷酸的方法包括以下步骤:(a)提供具有游离3
’‑
羟基的引发剂;(b)在延伸条件下,在3
’‑
o
‑
保护的核苷三磷酸的存在下,使具有游离3
’‑
羟基的引发剂或延伸中间体与无模板聚合酶反应,产生3
’‑
o
‑
保护的延伸中间体;(c)将延伸中间体去保护以产生具有游离3
’‑
羟基的延伸中间体;和(d)重复步骤(b)和(c),直到多核苷酸被合成。(术语“延伸中间体”、“延伸产物”和“延伸片段”可互换地使用)。在一些实施方案中,引发剂以例如通过其5’末端附接于固体支持物的寡核苷酸提供。上述方法还可以包括反应或延伸步骤之后以及去保护步骤之后的洗涤步骤。例如,反应步骤可以包括去除未掺入的核苷三磷酸的子步骤,例如在预定的孵育期或反应时间后通过洗涤去除。这种预定的孵育期或反应时间可以是几秒钟,例如30秒,至几分钟,例如30分钟。
[0039]
本发明中使用的3
’‑
o
‑
封闭的dntp可以从商业供应商处购买,或者使用公开的技术合成,例如美国专利7057026;guo等人,proc.natl.acad.sci.,105(27):9145
‑
9150(2008);benner,美国专利7544794。
[0040]
上述方法还可以包括在反应或延伸步骤之后以及去保护步骤之后的封端步骤以及洗涤步骤。如上所述,在一些实施方案中,可以包括封端步骤,其中未延伸的游离3
’‑
羟基与阻止封端链的任何进一步延伸的化合物反应。在一些实施方案中,这种化合物可以是双脱氧核苷三磷酸。在其他实施方案中,具有游离3
’‑
羟基的非延伸链可以通过用3
’‑
核酸外切酶活性例如exo i处理它们来降解。例如,参见hyman,美国专利5436143。同样,在一些实施方案中,未能解封闭的链可以被处理以除去该链或使其对进一步的延伸呈惰性。
[0041]
在一些实施方案中,用于延长或延伸步骤的反应条件可以包括以下:2.0μm纯化的tdt;125
‑
600μm 3'
‑
o
‑
保护的dntp(例如3'
‑
o
‑
nh2‑
保护的dntp);约10至约500mm的二甲胂酸钾缓冲液(ph在6.5和7.5之间)和约0.01至约10mm的二价阳离子(例如coc12或mnc12),其中延伸反应可在50μl的反应体积中,在rt至45℃范围内的温度进行3分钟。
[0042]
酶促核酸合成使得能够比化学更快地合成更长和更纯的dna片段。循环时间因素对于数据存储特别有意义,因为它能够将通量提高15到20倍。在水性介质中进行合成也使其更加环保(合成过程中不使用有机溶剂),简化了仪器(不需要控制环境),并消除了对化学废料管理设施的需求。
[0043]
本发明现在提出改进这种酶促合成方法,以允许大规模平行合成。在第一方面,本发明提供了一种与ph控制的去保护相容的方法。
[0044]
b.平行酶促多核苷酸合成方法。
[0045]
在一方面,本发明提供了高度平行的无模板酶促合成多于一种不同多核苷酸的方法和装置,每种多核苷酸具有预定的核苷酸序列。在一些实施方案中,通过提供具有离散的、非重叠的、可寻址的位点的支持物来实现平行合成,在所述位点处合成单独的多核苷酸,并且提供了用于独立于其他位点控制每个位点的电化学条件的工具(means)。在一些实施方案中,这种平行合成支持物是具有可寻址位点的规则图案的平面支持物,诸如位点的直线图案或位点的六边形图案。在一些实施方案中,平面支持物的每个位点与一个或更多个电极相关联,这些电极的电特性可以在可寻址范围(manor)内独立于平面支持物的其他电极被控制。在一些实施方案中,这种平面支持物具有多于一个位点,包括至少256个位点、至少512个位点、至少1024个位点、至少5000个位点、至少10,000个位点、至少25,000个位点、或至少100,000个位点和多达10,000,000个位点。在一些实施方案中,这种平面支持物具有大于1000个、或10,000个、或25,000个、或50,000个、或100,000个、或500,000个的多于一个位点、和多达1,000,000个位点或多达10,000,000个位点。在一些实施方案中,这种平面支持物的位点以规则阵列布置,并且每个位点与至少一个与平面支持物集成的电极相关联。在一些实施方案中,发生合成和/或测序的离散位点各自具有.25μm2至1000μm2、或1μm2至1000μm2、或10μm2至1000μm2、或100μm2至1000μm2范围内的面积。在一些实施方案中,在每个位点合成的多核苷酸的量为至少10
‑6fmol、或至少10
‑3fmol、或至少1fmol、或至少1pmol,或者在每个位点合成的多核苷酸的量在10
‑6fmol至1fmol、或10
‑3fmol至1fmol、或1fmol至1pmol、或10
‑6pmol至10pmol、或10
‑6pmol至1pmol的范围内。在一些实施方案中,在每个位点合成的多核苷酸的数量在1000个分子到106个分子、或1000个分子到109个分子、或1000个分子到10
12
个分子的范围内。
[0046]
在一些实施方案中,在每个反应位点酶促合成的多核苷酸具有在50至500个核苷酸的范围内的长度;在其他实施方案中,这种多核苷酸具有在50至1000个核苷酸的范围内的长度。
[0047]
图1b说明了在可寻址的离散位点上平行合成多于一种多核苷酸的一种实施方案的步骤,所述位点可用于特定的光照射或用于电极活化。在一些实施方案中,阵列是可寻址电极阵列,其中可以控制单个电极,以在阵列的任何给定工作电极和反电极之间产生预定的电压差。提供阵列(120),使得每个位点(122)具有引发剂或具有受保护的3
’‑
羟基的延伸片段(表示为暗圆盘)。为了启动合成循环,使用可以限制在所选位点的位置的去保护方法,将所选位点(对应于下一个单体为a的多核苷酸的位点)的引发剂或延伸片段的3
’‑
羟基去保护(121)(表示为空心圆盘)。如下文更全面描述的,在一些实施方案中,这种局部去保护可以通过局部光反应或通过使用位点特异性电极的电压差的局部变化来实现。向选择性去保护的位点加入包含3
’‑
o
‑
保护的datp的试剂(124),并将无模板聚合酶诸如tdt输送至去保护的位点。如下文简要描述的,合成试剂可以以多于一种方式输送,诸如,通过整个阵列上的简单整体流动、由喷墨设备输送至单个位点的微滴等。在偶联反应进行到完成或达到合适程度的预定时间后,洗涤阵列,并在选定位点的下一组多核苷酸(对其c是下一个单体的那些)的3
’‑
羟基被去保护。向选择性去保护的位点加入包含3
’‑
o
‑
保护的dctp的试剂(128),并将无模板聚合酶诸如tdt输送至去保护的位点。对dgtp(130)和dttp(132)执行类似的步骤,直到循环完成。重复(134)循环,直到多核苷酸完整。
[0048]
光诱导的去保护。
[0049]
在一些实施方案中,本发明的方法使用光诱导的去保护,用光生成的酸进行局部去保护,例如gao等人,美国专利6426184、7491680和7838466。有利的是,寡核苷酸在流通池中合成,流动池非常类似于现在用于合成测序(sbs)的那些。sbs使用含有终止剂的修饰的dntp,终止剂阻止进一步聚合。所以只有一个碱基可以被聚合酶添加到每条生长的dna或rna拷贝链。测序反应对固体表面上分布的极大量不同模板分子同时进行。在向模板添加四种dntp后,终止剂被去除。这种化学被称为“可逆终止剂”。最后,开始另外四个循环的dntp添加。由于单个碱基以统一的方式添加到所有模板中,测序过程产生一组统一长度的dna/rna序列读段。有利的是,dna/rna样品通过片段化为片段(pieces)制备成“测序文库”,每个片段(piece)长约200个碱基。向每个末端添加定制的衔接子,并且文库流过固体表面(“流通池”),并且模板片段与该表面结合。随后,固相“桥扩增”pcr过程(簇生成)在流通池表面上产生紧密的物理簇状的每种模板的大约一百万个拷贝。
[0050]
在本发明的一些实施方案中,芯片可以在合成后通过sbs直接读取,以确保成功编码。在一些实施方案中,芯片可以是大约50cm2。芯片具有30μm、5μm或甚至1μm的微孔网格。如果间距(pitch)为5μm,那么孔的总数是2亿,如果间距为1μm,芯片具有50亿个微孔。寡核苷酸可以直接移植到孔的底部或填充在芯片中的珠上,这样每个芯片有且只有一个珠。可以通过使用数字微镜装置(dmd)在选择的孔中控制光生成的酸来实现去保护。
[0051]
在一些实施方案中,合成的寡核苷酸长度将多达400个核苷酸,因为这是通过使用双配对末端读段合成测序容易读取的最大长度。将寡核苷酸的长度增加到化学200nt以上,能够在芯片上实现更高的数据密度,因为数据密度作为索引将占用更低百分比的寡核苷酸。可选地,并且如果合成纯度允许,可以增加合成的长度,并且每200个核苷酸添加中间引物,以方便测序,从而对寡核苷酸进行顺序测序。
[0052]
一个孔间距离为5μm的流通池实现:
[0053]
·
400nt的两亿个寡核苷酸并行
[0054]
·
7h打印整个芯片(80 000 000 000nt)
[0055]
·
编码系统中每循环1.5位(参见下文)
[0056]
·
每个流通池15gb
[0057]
孔之间的间距为1μm(50亿个寡核苷酸并行)时,存储的数据量为375gb,执行此运行3次能够在一台仪器中合成超过1tb。
[0058]
流通池优选地是透明的,以允许uv去保护和测序。所需的dmd的数量有利地可为至少50。优选地,dmd的数量大于50,以增加孔的数量并使用共焦透镜,以便将间距减小到1μm并增加密度。
[0059]
产生局部ph变化的一个挑战是h3o 离子的扩散。为了防止污染,在去保护过程中,未被照射的孔和被照射的孔中的ph应尽可能稳定。有利地,在去保护过程中,被照射的孔中的ph在4.5和5.8之间,而未被照射的孔中ph保持在6左右。
[0060]
为了进一步增加存储的数据量,有可能开发非常快速地去保护(高达约1秒的去保护)的光不稳定核苷酸。由于酶促技术非常稳健并且可以在开放环境中使用,也可以在代替流通池的胶带(tape)上合成dna/rna。
[0061]
电化学去保护。
[0062]
可选地或除了局部光化学产生的ph变化之外,电极处电位的受控变化可用于直接或间接裂解电化学不稳定基团。例如,可以通过使用其氧化还原状态可以通过控制局部电压差来改变的电活性化合物,利用电压变化来间接裂解对ph敏感的保护基团,从而释放影响局部ph的电子,例如,southern,美国专利5667667;egeland和southern,美国专利公布us2004/0238369;egeland等人,nucleic acids research,33(14):e125(2005);maurer等人,美国专利9267213;fomina等人,labchip,16:2236
‑
2244(2016)。此外,可以使用能够大规模电化学去保护的芯片,例如,通过采用使用cmos芯片技术或其他半导体技术制造的电极阵列。这项技术的益处包括:
[0063]
·
间距减小以允许大量地大规模合成
[0064]
·
芯片的可堆叠性
[0065]
·
合成并储存在1μm的珠上
[0066]
·
使用半导体测序平台诸如ion torrent进行测序
[0067]
cmos芯片通过向单独可访问的位点产生电流或光来提供对每个合成位点的控制。感应的电流或光可以分别与电化学或光化学耦合,以产生局部质子,从而降低ph。在一些实施方案中,光化学生成的酸和电化学生成的酸二者用于在合成和/或测序过程中去保护3
’‑
羟基。
[0068]
在一些实施方案中,电极阵列上的每个位点可以被配置为恒电位仪和/或恒电流仪电化学电池(6001),如levine等人(上文引用)或metrohm应用笔记ec08所述。在恒电位模式,如图6a所示的恒电位仪/恒电流仪(pgstat)电路(6000)将精确地控制反电极(ce)(6002)相对于工作电极(we)(6004)的电位,使得工作电极(we)(6004)和参比电极(re)(6006)之间的电位差被很好地限定,并且对应于用户指定的值。在恒电流模式,控制we(6004)和ce(6002)之间的电流。re(6006)和we(6004)之间的电位差以及在ce(6002)和we(6004)之间电流流动被持续监控。通过使用pgstat,用户指定的值(即施加的电位或电流)通过使用负反馈机制在测量过程中的任何时候得到精确控制。
[0069]
从图解可以看出,ce(6002)连接到被称为控制放大器(ca)(6008)的电子模块的输出端。控制放大器迫使电流流经电池。电流值使用电流跟随器(lowcf)(6010)或分流器(highcr)(6012)分别测量低电流和高电流。一直用差分放大器(diffamp)(6016)测量re(6006)和s(6014)之间的电位差。根据仪器使用的模式(恒电位或恒电流),相应地设置pstat/gstat开关(6018)。该信号然后被馈送到求和点( )(6020),该求和点与由数模转换器(ein)(6022)设置的波形一起将被用作控制放大器的输入。
[0070]
反电极(也称为辅助电极)是用于闭合电化学电池中的电流回路的电极。它通常由惰性材料(例如pt、au、石墨、玻璃碳)制成,并且通常不参与电化学反应。因为电流在we(6004)和ce(6002)之间流动,所以ce的总表面积(电子的源/汇)通常大于we的面积,因此它不会成为电化学过程动力学的限制因素。
[0071]
参比电极是一种具有稳定且公知的电极电位的电极,并且它在电化学电池中用作电位控制和测量的参考点。参比电极电位的高稳定性通常通过使用氧化还原系统达到,该氧化还原系统具有氧化还原反应的每个参与物的恒定(缓冲或饱和)浓度。此外,流经参比电极的电流保持接近于零(理想情况下,零),这是通过使用ce关闭电池中的电流电路以及静电计上的非常高的输入阻抗(>100gohm)来实现的。
[0072]
工作电极是电化学系统中在其上发生感兴趣的反应的电极。常用的工作电极可由惰性材料诸如au、ag、pt、玻璃碳(gc)和hg滴以及薄膜电极等制成。工作电极(6004)可以包括用于附接分子的涂层,诸如用于无模板酶促多核苷酸合成的引发剂。
[0073]
双电极设置。在双电极电池设置中,ce(6002)和re(6006)在电极之一上短路,而we(6004)和s(6014)在另一个电极上短路。测量整个电池的电位。这包括来自ce/电解质界面和电解质本身的贡献。因此,只要对we(6004)电化学界面的界面电位的精确控制不重要,并且整个电池的行为正在研究中,就可以使用双电极配置。
[0074]
三电极设置。三电极电池设置是电化学中最常使用的电化学电池设置。在这种情况下,电流在ce(6002)和we(6004)之间流动。电位差在we(6004)和ce(6002)之间控制,并在re(6006)(优选地保持在we(6004)附近)和s(6014)之间测量。因为we(6004)与s(6014)相连,并且we(6004)保持在伪地(固定的、稳定的电位),通过控制ce(6002)的极化,re(6006)和we(6004)之间的电位差一直被控制。通常不测量we(6004)和ce(6002)之间的电位。这是控制放大器(6008)施加的电压,并且受仪器的顺从电压(compliance voltage)限制。调整顺从电压使得we(6004)和re(6006)之间的电位差将等于用户指定的电位差。这种配置允许相对于re(6006)来控制we(6004)处电化学界面的电位。
[0075]
包括在电路支撑基底中形成的多于一个可单独寻址的电极的大规模电极阵列,特别是cmos,已经被构建用于基于亚磷酰胺的合成和用于传感器应用,例如montgomery,美国专利6093302、6444111和6280595;gindilis,美国专利9339782;maurer等人,美国专利9267213;maurer等人,plosone,december 2006,issue 1,e34;fomina等人,labchip,16:2236
‑
2244(2016);kavusi等人,美国专利9075041;johnson等人,美国专利9874538和9910008;gordon等人,美国专利6251595;levine等人,等等。ieee j.solid state circuits,43:1859
‑
1871(2008);等等。这些参考文献为本发明的特定实施方案的设计提供了关于以下的指导:诸如电极数量、尺寸、组成和阵列位点处的配置的特征;用于电压和电流控制和测量的cmos电路;阵列制造和操作;在阵列位点附接或固定化学成分(诸如例如引发剂)的方法;等等。
[0076]
特别感兴趣的是在morimoto等人,anal.chem.80:905
‑
914(2008);levine等人(上文引用);以及fomina等人(上文引用)中描述的电极配置以及它们利用cmos技术的实现,特别是如levine等人和fomina等人所描述的。在本发明的一些实施方案中,提供了一种电极阵列,该电极阵列包括在cmos基底中的多于一个可单独寻址的工作电极,该工作电极在操作上与参比电极和反电极相关联,反电极可以在cmos电极阵列上或者与cmos电极阵列分离。cmos电路被配置使得工作电极和反电极之间的电压可以被调整,以在选择的工作电极和参比电极之间建立和保持期望的电压差。可以在选择的工作电极处改变期望的电压差,以裂解电化学不稳定的保护基团。
[0077]
酶促合成和电化学去保护的组合。
[0078]
在一个方面,本发明还提供了一种组合不同方法的解决方案,以通过降低ph,用酶促dna合成技术诱导特别控制的去保护。酶促合成与水性介质完全相容。大多数化学、电化学或光化学,能够通过物理驱动使ph发生变化,只在水性介质中起作用。本发明通过开发用于改变ph的合适化学和用于酶促合成的合适缓冲剂、试剂和保护基团,提供了使这两个方面相容的技术方案。因此,在一种实施方案中,可控化学与dna合成和流通池芯片表面化学
相容。
[0079]
电化学或诱导的去保护,即在反应位点附近的电极使用电压变化,已被用于在基于亚磷酰胺的合成中去除dmt保护基团,例如,egeland等人,nucleic acids research,33(14):e125(2005);montgomery(以上引用)。本发明部分地是发现和认识到,平行的无模板酶促多核苷酸合成可以使用对酶促合成特异的保护基团的电化学去保护来完成。特别地,3
’‑
o
‑
叠氮甲基保护基团可以通过直接还原来裂解,并且3
’‑
o
‑
氨基保护基团可以通过电活性中间化合物调节局部ph来间接裂解。例如,在后者的情况下,在一些实施方案中,典型的去保护溶液是用hcl滴定至ph 5.0
‑
5.5的700mm亚硝酸钠(nano2)和1m乙酸钠。阵列的反应位点处的3
’‑
o
‑
nh2基团的局部去保护可以通过将局部ph从ph 7降低到ph 5来实现。
[0080]
用于实现本发明方法的设备。用于实现本发明方法的设备的组件在图6b中示意性示出。流通池和电极阵列(600)包括反应位点阵列,每个反应位点可包括微孔、增强引发剂或其他组分附接的涂层,并且每个反应位点可操作地与一个或更多个电极相关联。在一些实施方案中,电极阵列与cmos控制和测量电路集成为单个芯片。流通池可以具有多于一种设计,用于控制电极阵列上试剂的路径和流速。在一些实施方案中,流通池是微流体装置。也就是说,它可以用微机械加工技术或精密模制来制造,以包括另外的流体通道、室等。在一个方面,流通池包括入口(602)、出口(603)和流动室(605),用于限定试剂在电极阵列(607)上的流动路径。试剂在离开流通池和传感器阵列(600)后被丢弃到废料容器(606)中。根据该实施方案,该设备的功能是以预定的顺序、预定的持续时间、预定的流速向流通池和电极阵列(600)输送不同的试剂,并且任选地测量电极位置处的物理和/或化学参数,这些参数提供关于其中发生的反应的状态的信息。为此,流体控制器(618)通过管线(620和622)控制多于一种试剂(614)(例如,在合适的缓冲液和去保护溶液中的3
’‑
o
‑
保护的dntp和/或无模板的聚合酶)的驱动力,并通过常规仪器控制软件例如lab view(national instruments,austin,tex.)控制阀门(例如,612和616)的操作。
[0081]
试剂可以通过泵、气压或其他常规方法驱动通过流体通道、阀门和流通池。在一些实施方案中,单个参比电极(608)可以定位于流通池和传感器阵列(600)的上游。在其他实施方案中,参比电极可以定位于流动室内。在一些实施方案中,在整个多步反应中,单一流体或试剂与参比电极(608)接触。这可以通过图6b所示的配置来实现,其中试剂(614)被引导穿过通道(609)到达流通池(605)。当这些试剂流动时,阀(612)关闭,从而防止任何清洗溶液流入通道(609)。尽管洗涤溶液的流动被停止,但在参比电极、通道(609)和电极阵列(607)之间仍有不间断的流体和电连通(electrical communication)。大多数试剂(614)在流过通道(609)时扩散到通道(611)中,但是选择参比电极(608)和通道(609)与通道(611)之间的连接处之间的距离,使得在公共通道(609)中流动的试剂很少或不到达参比电极(608)。尽管图6b和其他图将电极(例如,参比电极608)图示为与流体通道(例如,611)同心的圆柱体,但是参比电极诸如(608),可以具有多于一种不同的形状。例如,它可以是插入(611)的内腔的导线(wire)。在一个方面,参比电极(608)构成通道(612)的一部分,该部分由导电材料诸如不锈钢、金等制成。在一些实施方案中,该材料对于与其接触的试剂是惰性的。在一种实施方案中,参比电极(608)是由导电材料制成的管,其形成通道(612)的一部分。
[0082]
参考电压的电位取决于电极和电极接触的溶液之间的界面。例如,不同核苷三磷
酸的溶液可导致参考电压改变,从而导致工作电极发生不希望的变化。对于使用频繁洗涤步骤的多步反应,洗涤溶液(610)可被选择作为与参比电极(608)连续接触的试剂,如图6b所示。
[0083]
该实施方案的其他组件包括阵列控制器(624),用于提供偏置电压(bias voltage)(诸如以控制工作电极和反电极(621)之间的电位,其可以与阵列(607)集成或不集成)以及给电极阵列的定时和控制信号(如果这种组件没有集成到电极阵列中),并且用于收集和/或处理输出信号。可以通过用户界面(628)展示和输入来自流通池和电极阵列(600)的信息以及仪器设置和控制。对于一些实施方案,例如核酸合成和/或测序,流通池和传感器阵列(600)的温度被控制,使得反应发生,并且测量在已知的、并且优选地预定的温度进行。这种温度可以由传统的温度控制装置诸如珀耳帖装置(peltier device)等控制。在一个方面,通过控制流经流通池的试剂的温度来方便地控制温度。该设备的流通池和流体回路可以通过多于一种方法和材料制造。在选择材料时要考虑的因素包括所需的化学惰性程度、操作条件例如温度等、要输送的试剂体积、是否需要参考电压、可制造性等。对于小规模的流体输送,微流体制造技术非常适合于制造本发明的流体回路,并且对于本领域的普通技术人员来说,这种技术的指导是容易获得的,例如,malloy,plastic part design for injection molding:an introduction(hanser gardner publications,1994);herold等人,editors,lab
‑
on
‑
a
‑
chip technology(vol.1):fabrication and microfluidics(caister academic press,2009);等等。对于中等规模和更大规模的流体输送,可以使用常规的机械加工技术来制造可以组装到本发明的流通池或流体回路中的部件。在一方面,塑料诸如聚碳酸酯、聚甲基丙烯酸甲酯等可用于制造本发明的流通池和流体回路。
[0084]
图6c图解说明了用于实施本发明方法的替代设备,其中使用喷墨微滴发生器将一些试剂输送到反应位点。上述许多设计特征适用于该实施方案。如上,流通池和电极阵列(650)包括反应位点阵列,每个反应位点可包括微孔、增强引发剂或其他组分附接的涂层,并且每个反应位点可操作地与一个或更多个电极相关联。如上,在一些实施方案中,电极阵列可与cmos控制和测量电路集成为单个芯片。流通池可以具有多于一种设计,用于控制电极阵列上试剂的路径和流速;然而,与图6b的设备不同,这里电极阵列的反应位点必须是可接近的,以便通过打印头(680)输送含试剂的液滴。在一个方面,流通池包括入口(652)、出口(653)和流动室(655),用于限定试剂(未由打印头(680)输送)在电极阵列(657)上的流动路径。试剂在离开流通池和传感器阵列(650)后被丢弃到废料容器(656)中。根据该实施方案,该设备的功能是经由入口(652)或打印头(680)以预定的顺序、预定的持续时间、预定的流速向流通池和电极阵列(650)输送不同的试剂,并且任选地测量电极或反应位点处的物理和/或化学参数,这些参数提供关于其中发生的反应的状态的信息。为此,流体控制器(658)通过管线(671a、6711b和671c)、阀(660a和660b)和打印头(680)控制。阀(660a)和阀(660b)控制洗涤溶液(661)和去保护溶液(662)(如果需要)向流通池(657)的输送。用于喷墨输送系统的设计和控制的指南是本领域技术人员熟知的,并可以在美国专利公布us2003/0170698和美国专利6306599;6323043;7276336;7534561;以及类似的参考文献中找到。
[0085]
在一些实施方案中,单个参比电极(608)可以位于流通池和传感器阵列(600)的上
游。在其他实施方案中,参比电极可以位于流动室内。在一些实施方案中,可以使用单个反电极(663),或者在其他实施方案中,可以使用一个以上的反电极,并且如上所述,这种反电极可以集成或可以不集成在与阵列(657)的工作电极相同的电子基底上。
[0086]
该设备通过用户界面(692)控制,用户界面(692)继而通过流体/喷墨控制器(665)和阵列控制器(690)驱动和监控合成步骤,如虚线(671、672和673)所示。具体地,物理参数诸如温度,以及用于电极选择、电压控制、传感器读数等的电路,由阵列控制器(690)处理;试剂(696)的选择、液滴速率、头移动等由流体/喷墨控制器(665)控制。在一些实施方案中,在3
’‑
o
‑
保护的dntp单体和/或无模板聚合酶的液滴输送期间,反应位点和参比电极(681)之间的电解质连接被破坏,因为流通池(655)可以被排干以防止接收不同单体的相邻反应位点之间的交叉污染。在一些实施方案中,这种交叉污染可以通过提供被疏水区域包围的反应位点来避免,使得当电解质诸如清洗溶液或去保护溶液从流动室后退时,每个位点被分离的液体液滴包围,例如,如brennan,美国专利5474796、6921636等中所述。特别是,当流动室充满去保护溶液时,连续的电解质路径恢复到参比电极(681)和反电极,反电极可以在阵列(657)上或阵列外。
[0087]
在一些实施方式中,选择工作电极和参比电极之间的电压差的值,以避免不希望的氧化还原反应,诸如水的电解,使得气泡不会在装置的流体中形成。在一些实施方案中,在本发明中引起电化学反应的预定电压差为约1.5伏或更低。
[0088]
在一些实施方案中,本发明的方法,诸如由图6b和图6c的设备实现的方法,可以包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点可操作地与至少一个工作电极相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接并且具有3
’‑
o
‑
电化学不稳定的保护基团;(b)对每种核苷酸进行包括以下步骤的循环:(i)通过在预定地址的每个电极和参比电极之间产生电压差,从而使电化学不稳定的保护基团裂解,以在预定地址的电极处对引发剂或延伸片段去保护,从而在预定地址的电极处的引发剂或延伸片段上产生游离的3
’‑
羟基,和(ii)在延伸条件下,使预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;和(c)重复步骤(b),直到预定序列的多核苷酸阵列完整。反应位点通常是基底上的离散区域,其中合成了具有预定序列的单一种类的多核苷酸。反应位点在空间上是可寻址的,因为它们在基底或表面上具有明确的位置,这些位置通常形成规则的图案,诸如直线图案、六边形图案等。每个反应位点在操作上与至少一个工作电极相关联,即反应位点处的电位或电压可以由其相关联的一个或更多个工作电极来控制或确定。通常反应位点和工作电极在空间上是对齐的。也就是说,如果电极是嵌入在基底表面上的圆盘(disc)或其他平面结构,则反应位点占据的面积对应于电极表面的面积。这有利于确保在反应位点发生的反应中的均匀电效应。在一些实施方案中,反应位点可包括工作电极表面上的基底或膜,例如,这种基底或膜可用于促进组分诸如引发剂的附接和/或保持。这种基底和电极可以集成在半导体装置诸如cmos装置中。关于步骤(b),对每种核苷酸进行指定的步骤循环并不意味着局限于四种核苷酸a、c、g和t。在一些实施方案中,每种核苷酸意味着a、c、g和t的子集。在其他实施方案中,每种核苷酸意味着可包括非天然核苷酸或可用于在多核苷酸中编码信息的其他核苷酸类似物的扩展集合。多于一种不依赖模板的dna聚合酶可用于本
发明的方法中;特别地,使用末端脱氧核苷酸转移酶的变体,例如如在ybert等人,国际专利公布wo/2019/030149等中描述的。步骤(b)的循环可以包括另外的步骤,诸如洗涤步骤。延伸条件包括缓冲液、盐、温度、辅因子等,它们对于所用的无模板聚合酶的掺入活性是必要的或有用的。
[0089]
在一些实施方案中,电化学不稳定的保护基团可以是对ph敏感的,并且可以通过工作电极和参比电极之间的电压差来调节ph,该电压激活电活性剂,继而改变ph,例如,通过引用特此并入的southern,美国专利5667667;mauer等人,美国专利9267213;等等。示例性的电活性剂包括氢醌、苯醌、醌及其衍生物。
[0090]
在一些实施方案中,电化学不稳定的保护基团本身可以是氧化还原敏感的,使得工作电极和参比电极之间的电压差将电化学不稳定的保护基团转化为还原状态,从而裂解所述电化学不稳定的保护基团。特别地,在一些实施方案中,氧化还原敏感的3
’‑
o
‑
保护基团是叠氮甲基。
[0091]
上述设备或类似设备可用于存储和检索合成多核苷酸中编码的信息。多核苷酸中编码的信息可以通过对多核苷酸测序来检索。实际上可以使用任何核酸测序技术,但是对于一些实施方案,特别是那些在电极阵列上进行测序的实施方案,合成测序技术是最感兴趣的,例如,如bentley等人,nature,456:53
‑
59(2008);rothberg等人,nature,475:348
‑
352(2011);ravi等人,methods mol biol.1706:223
‑
232(2018);等等中公开的。在一些实施方案中,本发明的电极阵列上的多核苷酸使用采用可逆终止剂的合成测序方法进行测序或读取,所述可逆终止剂诸如携带可裂解荧光标记的可逆终止剂。这种测序方法在以下参考文献中描述,这些文献通过引用并入本文:wu等人,proc.natl.acad.sci.,104(42):16462
‑
16467(2007);guo等人,acc.chem.res.43(4):551
‑
563(2010);ju等人,proc.natl.acad.sci.,103(52):19635
‑
19640(2006);guo等人,proc.natl.acad.sci.,105(27):9145
‑
9150(2008);barnes等人,美国专利7057026;等等。特别地,在一些实施方案中,用于在本发明的电极阵列上对多核苷酸进行测序的合成测序方法中使用了具有荧光标记的3
’‑
o
‑
叠氮甲基核苷三磷酸的可逆终止剂。在一些实施方案中,在进行荧光测量以确定多核苷酸模板中互补核苷酸的身份后,掺入的3
’‑
o
‑
叠氮甲基核苷酸被电化学解封闭。
[0092]
在一些实施方案中,用于在多核苷酸中存储信息和从这种多核苷酸检索信息的方法可以包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点可操作地与至少一个工作电极相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接且具有3
’‑
o
‑
电化学不稳定的保护基团;(b)对每种核苷酸进行以下的循环:(i)通过在预定地址的每个电极和参比电极之间产生预定的电压差,从而使电化学不稳定的保护基团裂解,以在预定地址的电极处对引发剂或延伸的片段去保护,从而在预定地址的电极处的引发剂或延伸片段上产生游离的3
’‑
羟基,(ii)在延伸条件下,使预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;(c)重复步骤(b),直到预定序列的多核苷酸阵列完整,其中每个完整的多核苷酸在其3’末端以5’至3’方向包含信息编码区和测序引物结合位点;和(d)通过在一个或更多个反应位点将测序引物退火到测序引物结合位点并合成测序完整的多核苷酸的信息编码区,从信息编码区检索信息。在一些实施方案中,信息编码区可以包含用
于处理或操纵多核苷酸的其他特征,诸如另外的引物结合位点、限制性位点等。
[0093]
在一些实施方案中,合成测序可以包括通过模板依赖性聚合酶将标记的可逆封闭的核苷三磷酸掺入到所述测序引物或其延伸物中,使得掺入的标记的可逆封闭的核苷三磷酸的身份由反应位点处多核苷酸的所述序列确定。在一些实施方案中,标记的可逆封闭的核苷三磷酸的标记和封闭基团可以附接到标记的可逆封闭的核苷三磷酸的单独部分,使得解封闭和标记去除可以通过相同的步骤或不同的步骤完成。特别感兴趣的是标记的可逆封闭的核苷三磷酸,其包含3
’‑
o
‑
电化学不稳定的封闭基团,该封闭基团通过在预定地址的每个电极和参比电极之间产生预定的电压差而从预定地址的反应位点处的延伸测序引物中除去。以这种方式,可以对全部反应位点或预定子集的反应位点处的多核苷酸进行测序或读取。
[0094]
应当理解,用于裂解不同保护基团或封闭基团的电压差可以不同,因此提及“预定电压差”是指特定用于产生特定效果的预定电压差,诸如通过电活性剂产生期望的局部ph变化以导致特定基团的裂解,或通过其还原直接裂解特定基团,等等。
[0095]
在一些实施方案中,可能有利的是在离散的反应位点合成少量的多核苷酸,然后扩增它们以进一步填充或填入反应位点。这可以通过依赖于热循环的技术来完成,诸如桥pcr,或者可以通过等温技术来完成,诸如重组酶
‑
聚合酶扩增的模板步移。
[0096]
在一些实施方案中,阵列上的一部分反应位点可以具有与其他反应位点的引发剂上的保护基团正交的3
’‑
o
‑
电化学不稳定的保护基团的引发剂,或者同一反应位点内的一部分引发剂可以包含相对于同一反应位点的其他引发剂正交的3
’‑
o
‑
电化学不稳定的保护基团。关于两种或更多种保护基团的“正交”是指用于裂解一种保护基团的条件不会影响其他保护基团,并且对于每种保护基团的去除条件亦是这样。
[0097]
在一些实施方案中,在不同反应位点的至少两个完整的多核苷酸具有包含不同序列的测序引物结合位点,使得至少两个完整的多核苷酸可以被分别测序。在一些情况下,测序引物结合位点通过无模板酶促合成来连接,在其他实施方案中,这种引物结合位点可以连接到合成的多核苷酸。
[0098]
在一些实施方案中,测序引物结合位点的不同序列与其相应信息编码区中编码的不同信息相关联。这种不同的测序引物结合位点可以索引存储在阵列的多核苷酸中的信息的子集。
[0099]
图7a
‑
7d描述了本发明用于产生其核苷酸序列编码信息的多核苷酸、减少该多核苷酸中的错误、存储该多核苷酸和从该多核苷酸检索信息的多于一种实施方案。图7a示出了包括纠错的实施方案。电极阵列(700)显示为具有与电极(未显示)和引发剂序列(704)相关联的单个反应位点(702),所述引发剂序列(704)具有游离的3
’‑
羟基和不稳定的键或核苷酸(706),所述键或核苷酸能够被裂解以留下游离的3
’‑
羟基。在一些实施方案中,键或核苷酸(706)是电化学不稳定的,使得它可以在反应位点(702)被选择性地裂解。引发剂(704)通过使用3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶的无模板酶促合成被延伸(708),以产生全长多核苷酸(710),之后全长多核苷酸(710)被测序以确认其具有所需序列。如果错误(714)被确定,则多核苷酸(710)可以在不稳定键y(706)处被选择性裂解,并且替换多核苷酸(720)可以被重新合成(718)。
[0100]
在一些实施方案中,合成步骤可以通过检测在掺入过程中从dntp释放的标记的焦
磷酸基团来监测,例如fuller等人,美国专利7223541,从而(例如)来自反应位点的荧光信号图谱将指示预期的核苷酸是否掺入生长的多核苷酸中,以及错误掺入(如果有的话)的程度。
[0101]
图7b示出了本发明的另一种实施方案,其中电极阵列的不同反应位点具有带有正交保护基团的引发剂。在该实施方案的一种应用中,通过仅将一部分反应位点的引发剂上的第一保护基团去保护,可以仅在一部分反应位点上合成多核苷酸,其中另一个反应位点上的第二保护基团不被除去。在替代实施方案中,具有正交保护基团的引发剂可以填充相同的反应位点。如图7b所示,电极阵列(722)具有各自分别带有引发剂(725)和引发剂(727)的反应位点(724)和反应位点(726)。引发剂(725)和引发剂(727)任选地分别包括不稳定键“y”和“w”,并且分别包括电化学不稳定的保护基团3
’‑
o
‑
nh2(728)和3
’‑
o
‑
ch2n3(730)。保护基团之一,例如3
’‑
o
‑
nh2,可以被去除,并且多核苷酸(732)被合成(731)。如果在对多核苷酸(732)进行测序(733)时发现错误(734),那么具有不正确序列的多核苷酸任选地可以被裂解(735),在不同反应位点的第二保护基团(730)可以被去保护,并且具有预期序列的多核苷酸可以被重新合成(736)以产生正确序列的多核苷酸(738)。可选地,带有错误(734)的多核苷酸(732)可以在阵列(722)上保持完整,即不被裂解,并且其地址或位置被注释为包含不正确的序列。图7a
‑
图7b的纠错方案可以与依赖于冗余的编码方案一起使用,或者它们可以用于减少确保存储信息的预定可靠性水平所需的冗余量。
[0102]
图7a和图7b的实施方案可以用以下步骤实现:(a)提供反应位点的空间可寻址阵列,其中每个反应位点可操作地与至少一个工作电极相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接且具有3
’‑
o
‑
电化学不稳定的保护基团;(b)对每种核苷酸进行以下的循环:(i)通过在预定地址的每个电极和参比电极之间产生预定的电压差,从而使电化学不稳定的保护基团裂解,以在预定地址的电极处对引发剂或延伸的片段去保护,从而在预定地址的电极处的引发剂或延伸的片段上产生游离的3
’‑
羟基,(ii)在延伸条件下,使预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;(c)重复步骤(b),直到预定序列的多核苷酸阵列完整,其中每个完整的多核苷酸在其3’末端以5’至3’方向包含信息编码区和测序引物结合位点;和(d)通过在一个或更多个反应位点将测序引物退火到测序引物结合位点并合成测序完整的多核苷酸,从信息编码区检索信息。在一些实施方案中,每个引发剂包含可裂解的核苷酸或可裂解的键,使得每当所述检索的信息指示合成错误时,引发剂可以在可裂解的核苷酸或可裂解的键处被裂解。在这种裂解后,多核苷酸可以从裂解的引发剂重新合成。在一些实施方案中,这种可裂解的键或核苷酸是电化学不稳定的。在其他实施方案中,阵列的一部分反应位点包含具有相对于阵列上其他反应位点的引发剂的其他3
’‑
o
‑
电化学不稳定的保护基团正交的3
’‑
o
‑
电化学不稳定的保护基团的引发剂。在这样的实施方案中,方法还包括在具有带有正交的3
’‑
o
‑
电化学不稳定的保护基团的引发剂的至少一个反应位点处将引发剂去保护的步骤,并且每当所述检索的信息指示合成错误时,重新合成预定序列的多核苷酸。也就是说,每当测序指示错误时,具有所需正确序列的多核苷酸在含有具有正交保护基团的引发剂的反应位点部分的反应位点之一上重新合成。具有不正确序列的多核苷酸可被裂解,或者其可被记录为具有不正确的序列,但是不会从
阵列裂解。
[0103]
在一些实施方案中,合成的多核苷酸储存在电极阵列上;也就是说,合成后,多核苷酸保留在阵列上,并与阵列一起储存。多核苷酸中编码的信息可以通过在多核苷酸保留在阵列上时对其进行原位测序来检索,或者可以从阵列上裂解下来并测序。
[0104]
图7c示出了用于读取或测序具有反应位点(741)的电极阵列(740)上的多核苷酸的三种方案。在方案1中,在合成信息编码区段(742)之后,合成自互补发夹形成区段(744),其包括序列x(746)、环序列(748)和序列x(746)的互补物序列z(750)。在退火条件下,z(750)与(746)杂交,从而可以进行测序反应(752)以产生延伸的链(754)。如上所述,所得的双链多核苷酸可以原样储存,或者可以从阵列(740)裂解下来单独储存。在一些实施方案中,所得的双链多核苷酸在回收过程中可在发夹(744)处被裂解,以便分离测序反应中产生的互补链(754),例如,如果测序反应留下不需要的加合物。方案1具有的优点在于,缺乏容易接近的游离3’或5’羟基使得所得的双链多核苷酸对核酸酶消化更具抗性。方案1具有优点(i)不需要测序引物,和(ii)如果选择位点特异性引物或如果在测序化学中使用电化学不稳定的封闭基团,那么在任何反应位点的单独读取是可能的。方案2类似于方案1,除了,多核苷酸(755)附加有引物结合位点(756)而不是发夹(744)。引物(760)退火至引物结合位点(756),并进行测序反应以读取多核苷酸(755)的序列。方案2具有的优点是可以在阵列上重复读取。此外,如果选择位点特异性引物或如果在测序化学中使用电化学不稳定的封闭基团,在任何反应位点的单独读取是可能的。
[0105]
在方案3中,在含有可裂解键(766)的引发剂上合成多核苷酸(765)后,多核苷酸(765)被裂解(768)以释放可与阵列(740)分开储存的链(770)。
[0106]
图7d回顾了用于多核苷酸储存的配置。图1)显示了最简单的储存配置;即,在阵列(774)上合成多核苷酸(777)后,阵列和多核苷酸一起储存,而不裂解多核苷酸(777)。图2)的配置与图1)相似,除了在合成后多核苷酸(790)被裂解(776)并在没有阵列的情况下储存。图3)和4)的配置分别对应于合成方案1和2。两种配置都产生双链多核苷酸,其具有的优点是允许链分开储存,以增加编码信息的安全性。
[0107]
c.其他合成考虑。
[0108]
纠错过程。预期错误的最大来源是脱嘌呤。在酸性条件中,dna碱基的这种降解在dna链中留下脱碱基位点。测序时,它们表现为4种碱基与sbs的混合物,并且很难处理。糖基化酶可以用来裂解那些脱碱基位点的寡核苷酸,使它们不可被测序检测(没有测序引物),这样它们就不会污染数据。
[0109]
重置合成。如果合成500nt以上的片段,sbs的使用可能不足以对其测序。因此,本发明的一个目的是提供一种测序长片段,并且特别是500nt以上片段的新方法。为此,本发明提出在寡核苷酸中添加一个或若干中间测序引物,以便能够对连续的较短寡核苷酸进行测序。
[0110]
如图2所示,寡核苷酸片段的“数据”可以被分成若干子数据片段(图2中的“数据1”和“数据2”)。测序时,该寡核苷酸可以首先使用反义测序引物和具有双重配对末端的正向测序引物1(300nt读段
‑
数据1,随机访问id,地址),并且然后使用正向测序引物2(150nt
–
数据2)进行测序。这可以与若干中间正向引物一起使用来读取任何需要的序列。为了在芯片上合成这些寡核苷酸,可以逐个核苷酸地合成中间引物,或者使用连接酶。中间引物后的错
误模式和之前一模一样。
[0111]
为了实现重置合成,本发明还提供了特定的dutp
‑
onh2可逆终止子核苷酸或rutp
‑
onh2可逆终止子核苷酸。本发明还提供了能够以可接受的产量掺入这两种核苷酸的酶变体(参见例如wo2017/216472)。dutp
‑
onh2可以在15分钟内通过user酶混合物:尿嘧啶dna糖基化酶和核酸内切酶viii的作用被裂解;并且rutp
‑
onh2通过koh 1m的作用2小时被裂解。结果,有可能在寡核苷酸序列的任何位置,并且特别是在数据区段和测序引物区段之间掺入那些核苷酸,并释放数据的不同部分,以从一个单一合成位点创建单个寡核苷酸。
[0112]
寡核苷酸池创建。合成后,有可能得到以寡核苷酸池形式合成的文库。有两种可能得到这个池:
[0113]
‑
裂解寡核苷酸
[0114]
‑
在芯片上进行等温扩增
[0115]
第二种解决方案提供了将dna材料保留在芯片上以简化测序的可能性。
[0116]
如下所述,寡核苷酸可以在其5’末端和3’末端具有测序引物。由于这些引物,该文库的等温扩增是可预见的。等温扩增优于标准pcr,因为循环温度会损坏芯片。
[0117]
d.与测序工作流程兼容的核酸阵列合成
[0118]
在另一方面,本发明提供了与测序工作流程兼容的新的核酸阵列合成。
[0119]
合成dna并在之后对其进行测序是非常繁琐的,因为用于读取和写入的化学是不相容的。合成和测序从未在同一个仪器中进行,因为它们涉及两种非常不同的技术(用于合成的有机化学和用于测序的酶促反应)。例如,用于亚磷酰胺化学的亚磷酰胺试剂必须在无水介质中操作(极少量的水将阻止反应的有效进行),而在合成测序、焦磷酸测序、纳米孔测序和离子半导体测序等情况下,测序在水性溶液中进行。对于工业来说,这是一个挑战,因为在使用前需要验证合成的dna的序列。当dna/rna在芯片上合成时尤其如此(微阵列工业或用于合成寡核苷酸池)。
[0120]
与测序兼容的芯片上合成。本发明通过允许与测序兼容的芯片上合成来提供上述问题的解决方案。根据本发明,dna/rna合成在与测序仪器兼容的流通池上酶促进行。由于在焦磷酸测序、合成测序和离子半导体测序中,测序依赖于与待测序链互补的dna链的酶促合成,因此将流通池针对酶促合成进行了优化,包括以下方面:
[0121]
1.注射含水试剂的可能性
[0122]
2.芯片中的层流
[0123]
3.表面钝化,以防止dna、酶和核苷酸粘附
[0124]
4.对多次酶促循环稳定
[0125]
例如,可以使用电化学、喷墨印刷或光诱导去保护来进行dna合成。合成后,获得的产物可以在其表面排列各种寡核苷酸,每个点包含不同的寡核苷酸。这种配置正是用于合成测序的配置。每个点是一个测序聚簇。在3’末端通过合成或连接添加测序引物是测序前唯一需要的准备工作。通常,样品制备要复杂得多,需要几个步骤(稀释、连接、pcr、桥扩增等)。它也可以是微珠在微孔中的阵列,每个微珠在其表面上具有确定序列的寡核苷酸。该仪器甚至可以同样用于合成和测序。例如,光化学合成和合成测序可以在类似的仪器中进行,因为它们都依赖于光学,并且需要透明的流通池。例如,电化学合成和离子半导体(ion torrent)测序也特别兼容。
[0126]
e.用于dna数据存储的组合编码方案。
[0127]
在另一方面,本发明提供了用于dna数据存储的编码方案。由于非常高的数据密度、简单和长期的存储,dna数据存储有能力扰乱数据存储市场。因此,它要求非常高的dna合成和测序通量才能可行。dna合成通常在2d微阵列上进行。数字数据通常以2为基数存储,而dna以4为基数存储(理论上2位可以编码在一个核苷酸中)。提高数据密度(并且附带地,提高合成和测序通量)的一种解决方案是将这一编码基数增加到4以上。一种解决方案是添加非天然的dna碱基(例如steven benner的aegis核苷酸),但这是有限的,而且会使测序更加困难。本发明现在提出仅使用四种天然碱基来增加编码基数。这个方案也可以用另外的非天然核苷酸来实现。
[0128]
组合方案。为了进一步实现数据密度,本发明提出通过在每个循环添加核苷酸的混合物而不是仅添加四种核苷酸中的一种来实现组合方案(图3和图4)。在一个孔中,每个循环添加核苷酸混合物可以增加编码数据的基数。使用上述存在/不存在机制,编码基数为14,并且可以将数据密度增加大约2倍。使用25%组合方案(图3),基数为35,使得每个循环能够编码5位(35>32=2^5)。10%的10级组合方案(x1=aaaaaaaaaa,x2=aaaaaaaaat,等等)将给出268的基数。这种组合编码可以很容易地使用sbs技术测序,并定量每个点上的核苷酸数量。
[0129]
编码方法每个循环的位数四进制2存在/不存在组合ln(14)/ln(2)=3.8125%组合ln(35)/ln(2)=5.1310%组合ln(268)/ln(2)=8.07
[0130]
伪3d数据存储。当存储合成支持物时,该方案可用于增加数据密度(如果需要检索数据,则在将来进行测序)。保存合成支持物大大减少了在测序中破译规定量的数据所需的读取次数。事实上,当数据被存储在dna寡核苷酸池中时,每个片段需要被读取平均50次(读段深度为50),以确保每个寡核苷酸已被测序。当保存固体支持物时,由于寡核苷酸完全有序,读取深度为1。在本发明的上下文中,这被命名为伪3d数据存储(流通池是2d,并且核苷酸序列代表第三维),以便能够将dna数据存储用于中等冷数据存储,并且使得能够容易地读出数字数据(图5)。有了1μm2的孔、400mer和25%组合方案,我们的流通池的数据密度将超过2000位/μm2。
[0131]
这种数据密度与当今最密集的数据存储介质相比:
[0132]
·
磁带:200gb/英寸2(2017年索尼世界纪录)=2480位/μm2[0133]
·
hd蓝光碟:13.6gb/英寸2(4层蓝光)=215位/μm2[0134]
·
1μm2,400mer,25%组合:>2000位/μm2[0135]
使用10%的组合方案将能够实现超过3500位/μm2,这在当今是尚未实现的。如果合成是在1μm的珠中而不是在芯片中进行,那么在1cm^3就可能存在超过100tb的数据,远远超过目前的存储技术。珠可以重新沉积在测序芯片中,用于以读段深度1读出。
[0136]
本发明的合成和测序方法可以与实际上任何编码方案一起使用,诸如在以下参考文献中公开的那些,这些文献通过引用并入:bornholt等人,ieee micro,37(3):98
‑
104(2017);goldman等人,nature,494:77
‑
80(2013);chen等人,美国专利公布us2018/
0265921;chen等人,us20180230509a1;strauss等人,us20170141793a1;blawat等人,ep3067809a1;等等。
[0137]
可裂解的键合和核苷酸
[0138]
各种各样的可裂解的键合,或者更具体地,可裂解的核苷酸,可以用于本发明的实施方案。如本文所用,术语“可裂解位点”是指单链核酸序列的核苷酸或主链键合,其可在预定条件下被切除或裂解,从而将单链核酸序列分成两部分。在一些实施方案中,裂解可裂解的核苷酸、可裂解的键合或可裂解的键的步骤在裂解的链上留下游离的3
’‑
羟基,从而例如允许裂解的链被聚合酶延伸。裂解步骤可以通过化学、热、酶促或基于光的裂解来进行。在一些实施方案中,可裂解的核苷酸可以是核苷酸类似物,诸如脱氧尿苷或8
‑
氧代
‑
脱氧鸟苷,它们被特定的糖基化酶(分别是例如尿嘧啶脱氧糖基化酶、随后核酸内切酶viii和8
‑
氧代鸟嘌呤dna糖基化酶)识别。在一些实施方案中,糖基化酶和/或核酸内切酶的裂解可能需要双链dna底物。
[0139]
在一些实施方案中,可裂解的核苷酸包括含有可被核酸内切酶iii裂解的碱基类似物的核苷酸,所述碱基类似物包括但不限于脲、胸腺嘧啶二醇、甲基丙醇二酸脲(methyl tartronyl urea)、四氧嘧啶、尿嘧啶二醇、6
‑
羟基
‑
5,6
‑
二氢胞嘧啶、5
‑
羟基乙内酰脲、5
‑
羟基胞嘧啶、反式
‑1‑
氨基甲酰基
‑2‑
氧代
‑
4,5
‑
二氢氧基咪唑烷、5,6
‑
二氢尿嘧啶、5
‑
羟基胞嘧啶、5
‑
羟基尿嘧啶、5
‑
羟基
‑6‑
氢尿嘧啶、5
‑
羟基
‑6‑
氢胸腺嘧啶、5,6
‑
二氢胸腺嘧啶。在一些实施方案中,可裂解的核苷酸包括含有可被甲酰胺基嘧啶dna糖基化酶裂解的碱基类似物的核苷酸,所述碱基类似物包括但不限于7,8
‑
二氢
‑8‑
氧代鸟嘌呤、7,8
‑
二氢
‑8‑
氧代肌苷、7,8
‑
二氢
‑8‑
氧代腺嘌呤、7,8
‑
二氢
‑8‑
氧代水粉蕈素、4,6
‑
二氨基
‑5‑
甲酰胺基嘧啶、2,6
‑
二氨基
‑4‑
羟基
‑
甲酰胺基嘧啶、2,6
‑
二氨基
‑4‑
羟基
‑5‑
n
‑
甲基甲酰胺基嘧啶、5
‑
羟基胞嘧啶、5
‑
羟基尿嘧啶。在一些实施方案中,可裂解的核苷酸包括包含可被hneil 1裂解的碱基类似物的核苷酸,所述碱基类似物包括但不限于胍基乙内酰脲、螺亚氨基二乙内酰脲、5
‑
羟基尿嘧啶、胸腺嘧啶二醇。在一些实施方案中,可裂解的核苷酸包括包含可被胸腺嘧啶dna糖基化酶裂解的碱基类似物的核苷酸,所述碱基类似物包括但不限于5
‑
甲酰基胞嘧啶和5
‑
羧基胞嘧啶。在一些实施方案中,可裂解的核苷酸包括包含可被人烷基腺嘌呤dna糖基化酶裂解的碱基类似物的核苷酸,所述碱基类似物包括但不限于3
‑
甲基腺嘌呤、3
‑
甲基鸟嘌呤、7
‑
甲基鸟嘌呤、7
‑
(2
‑
氯乙基)
‑
鸟嘌呤、7
‑
(2
‑
羟乙基)
‑
鸟嘌呤、7
‑
(2
‑
乙氧基乙基)
‑
鸟嘌呤、1,2
‑
双
‑
(7
‑
甲脒基)乙烷、1,n6‑
亚乙烯基腺嘌呤、1,n2‑
亚乙烯基鸟嘌呤、n2,3
‑
亚乙烯基鸟嘌呤、n2,3
‑
亚乙烯基鸟嘌呤、5
‑
甲酰基尿嘧啶、5
‑
羟基甲基尿嘧啶、次黄嘌呤。在一些实施方案中,可裂解的核苷酸包括可被5
‑
甲基胞嘧啶dna糖基化酶裂解的5
‑
甲基胞嘧啶。
[0140]
用于本文所述方法的示例性化学可裂解核苷酸间键合包括,例如,
‑
氰基醚、5
′‑
脱氧
‑5′‑
氨基氨基甲酸酯、3
′
脱氧
‑3′‑
氨基氨基甲酸酯、脲、2
′
氰基
‑3′
,5
′‑
磷酸二酯、3
′‑
(s)
‑
硫代磷酸酯、5
′‑
(s)
‑
硫代磷酸酯,3
′‑
(n)
‑
氨基磷酸酯、5
′‑
(n)
‑
氨基磷酸酯、
‑
氨基酰胺、邻位二醇、核糖核苷插入、2
′‑
氨基
‑3′
,5
′‑
磷酸二酯、烯丙基亚砜、酯、甲硅烷基醚、二硫缩醛、5
′‑
硫代
‑
furmal、
‑
羟基
‑
甲基
‑
膦酸双酰胺、乙缩醛、3
′‑
硫代
‑
furmal、甲基膦酸酯和磷酸三酯。核苷间甲硅烷基基团诸如三烷基甲硅烷基醚和二烷氧基硅烷通过用氟离子处理而裂解。碱可裂解的位点包括
‑
氰基醚、5
′‑
脱氧
‑5′‑
氨基氨基甲酸酯、3
′‑
脱氧
‑3′‑
氨基氨基甲酸酯、脲、2
′‑
氰基
‑3′
,5
′‑
磷酸二酯、2
′‑
氨基
‑3′
,5
′‑
磷酸二酯、酯和核糖。通过用硝酸
银或氯化汞处理,含硫核苷酸间键诸如3
′‑
(s)
‑
硫代磷酸酯和5
′‑
(s)
‑
硫代磷酸酯被裂解。酸可裂解位点包括3
′‑
(n)
‑
氨基磷酸酯、5
′‑
(n)
‑
氨基磷酸酯、二硫缩醛、乙缩醛和膦酸双酰胺。
‑
氨基酰胺核苷酸间键可通过用异硫氰酸酯处理来裂解,并且钛可用于裂解2
′‑
氨基
‑3′
,5
′‑
磷酸二酯
‑
o
‑
邻
‑
苄基核苷酸间键。邻位二醇键合可通过高碘酸盐处理而裂解。热可裂解的基团包括烯丙基亚砜和环己烯,而光不稳定的键合包括硝基苄基醚和胸苷二聚体。合成和裂解含有化学可裂解、热可裂解和光不稳定基团的核酸的方法描述于例如美国专利第5,700,642中。
[0141]
在以下参考文献中公开了另外的可裂解的键合:pon,r.,methods mol.biol.20:465
‑
496(1993);verma等人,ann.rev.biochem.67:99
‑
134(1998);美国专利第5,739,386、5,700,642和5,830,655号;和美国专利公布第2003/0186226和2004/0106728号;urdea等人,美国专利5367066。
[0142]
可裂解位点可以沿着寡核苷酸主链定位,例如,代替磷酸二酯基团之一的修饰的3
′‑5′
核苷酸间键合,诸如核糖、二烷氧基硅烷、硫代磷酸酯和氨基磷酸酯核苷酸间键合。可裂解的寡核苷酸类似物还可以包括在碱基或糖之一上的取代基或代替碱基或糖之一,诸如7
‑
去氮杂鸟苷、5
‑
甲基胞嘧啶、肌苷、尿苷等。
[0143]
化学可裂解寡核苷酸的合成和裂解条件在美国专利第5,700,642和5,830,655号中描述。硫代磷酸酯核苷酸间键合可以在温和的氧化条件下选择性裂解。氨基磷酸酯键的选择性裂解可以在弱酸条件诸如80%乙酸下进行。核糖的选择性裂解可以通过用稀氢氧化铵处理来进行。在另一种实施方案中,可裂解的连接部分可以是氨基接头。通过亚磷酰胺键合与接头结合的所得寡核苷酸可以用80%乙酸裂解,产生3
′‑
磷酸化寡核苷酸,其可以(如果需要)被磷酸酶去除。
[0144]
在一些实施方案中,可裂解的连接部分可以是可光裂解的接头,诸如邻硝基苄基可光裂解的接头。固体支持物上的光不稳定寡核苷酸的合成和裂解条件在例如venkatesan等人,j.org.chem.61:525
‑
529(1996),kahl等人,j.org.chem.64:507
‑
510(1999),kahl等人,j.org.chem.63:4870
‑
4871(1998),greenberg等人,j.org.chem.59:746
‑
753(1994),holmes等人,j.org.chem.62:2370
‑
2380(1997),和美国专利第5,739,386号中描述。基于邻硝基苄基的接头,诸如羟甲基、羟乙基和fmoc
‑
氨基乙基羧酸接头,也可以在商业上获得。
[0145]
在一些实施方案中,核糖核苷酸可以用作可裂解的核苷酸,其中裂解步骤可以使用核糖核酸酶诸如rna酶h来实施。在其他实施方案中,裂解步骤可以通过用切口酶处理来进行。
[0146]
实施例1
[0147]3’‑
o
‑
叠氮甲基
‑
核苷酸的电化学还原
[0148]
在本实施例中,通过在微孔中的电极上施加不同的电压持续不同时间长度来确定3
’‑
o
‑
叠氮甲基核苷酸的还原条件。通过lcms和凝胶电泳分析处理的核苷酸,以确定反应产物。
[0149]
使用两个铂电极,在3和10伏下在不同的时间量(0、30、60和300秒),向3
’‑
o
‑
叠氮甲基脱氧胸苷的20ul水性样品(@9mm)施加电流。然后用lcms和凝胶电泳评估样品中3’oh(去保护的)核苷酸的证据。处理的核苷酸用于通过突变末端脱氧核苷酸转移酶(seq id no:1)溶液延伸引物,该酶可以将3
’‑
羟基核苷酸而不是3
’‑
o
‑
叠氮甲基核苷酸偶联到引物。
延伸反应如下:4um tdt、136um dttp(来自微孔板的处理的核苷酸)、10nmol引物(5
’‑
fam
‑
多聚tdu
‑3’‑
oh),反应体积为103ul。在37℃孵育10分钟并除去未掺入的单体(1200rpm)后,通过凝胶电泳分离产物。lcms通过3'oh dntp条带(未显示)的出现显示了去保护的证据。分离的产物的电泳图示于图8中。对于300秒的样品(用*表示的柱)清晰可见的更大的条带表明,在处理的样品中存在去保护的dttp,并且叠氮甲基基团已经通过电化学去除,从而允许引物延伸形成n 1产物。
[0150]
实施例2
[0151]3’‑
o
‑
氨基
‑
核苷酸去保护的电化学控制
[0152]
dna的3’末端处的氨基氧基可逆保护基团在酸性条件被硝鎓离子(no )裂解,例如,benner,美国专利7544794。在本实验中,通过醌/氢醌氧化还原系统(例如,southern等人,美国专利公布us2004/0238369)电化学控制去保护缓冲液的ph,以将局部ph从初始值7.5(2分钟后产生>0.5%的去保护)降低到最终值5(在不到20秒内产生>99%)。结果显示在图9中,其中对于若干个孵育时间,ph与去保护效率的关系。
[0153]
定义
[0154]“微流体装置”是指一个或更多个室、端口和通道的集成系统,所述室、端口和通道互连并且处于流体连通,并且被设计用于单独或与提供支持功能的设备或仪器合作执行分析反应或过程,所述支持功能例如样品引入、流体和/或试剂驱动装置、温度控制、检测系统、数据收集和/或集成系统等。微流体装置还可包括阀、泵和内壁上的专门功能涂层,例如以防止样品组分或反应物的吸附、通过电渗促进试剂移动等。这样的装置通常制造在固体基质中,或者制造为固体基质,所述固体基质可以是玻璃、塑料或其他固体聚合物材料,并且通常具有易于检测和监测样品和试剂移动的平面形式,特别是通过光学或电化学方法检测和监测。微流体装置的特征通常具有小于几百平方微米的横截面尺寸,并且通路通常具有毛细管尺寸,例如具有约500μm至约0.1μm的最大横截面尺寸。微流体装置通常具有范围为1μl至几nl,例如10
‑
100nl的体积容量。微流体装置的制造和操作在本领域中是众所周知的,如通过引用并入的以下参考文献示例的:ramsey,美国专利第6,001,229;5,858,195;6,010,607和6,033,546号;soane等人,美国专利第5,126,022和6,054,034号;nelson等人,美国专利6,613,525;maher等人,美国专利第6,399,952号;ricco等人,国际专利公布wo 02/24322;bjornson等人,国际专利公布wo 99/19717;wilding等人,美国专利第5,587,128;5,498,392号;sia等人,electrophoresis,24:3563
‑
3576(2003);unger等人,science,288:113
‑
116(2000);enzelberger等人,美国专利第6,960,437号。
[0155]“多核苷酸”或“寡核苷酸”被可互换地使用并且各自表示核苷酸单体或其类似物的线性聚合物。构成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用的常规模式,例如沃森
‑
克里克型的碱基配对、碱基堆积、hoogsteen或反向hoogsteen类型的碱基配对等特异性结合至天然多核苷酸。此类单体及其核苷间键合可以是天然存在的,或者可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可包含pna、硫代磷酸核苷间键合、含有允许附接标记物(例如荧光团或半抗原等)的连接基团的碱基。每当使用寡核苷酸或多核苷酸要求酶促加工,例如通过聚合酶延伸、通过连接酶连接等,普通技术人员将理解,在那些情况下,寡核苷酸或多核苷酸在任何或某些位置处将不含有核苷间键合、糖部分或碱基的某些类似物。多核苷酸的大小范围通常从几个单体单元例如5
‑
40
(此时多核苷酸通常被称为“寡核苷酸”)到数千个单体单元。除非另有说明或从上下文明显的,每当多核苷酸或寡核苷酸以字母(大写或小写)序列表示时,例如“atgcctg”,应该理解的是核苷酸从左到右是5'
→
3'的顺序,并且“a”表示脱氧腺苷,“c”表示脱氧胞苷,“g”表示脱氧鸟苷,并且“t”表示胸苷,“i”表示脱氧肌苷,“u”表示尿苷。除非另有说明,术语和原子编号惯例将遵循在strachan和read,human molecular genetics 2(wiley
‑
liss,new york,1999)中公开的那些。通常多核苷酸包含由磷酸二酯键合连接的四种天然核苷(例如,对于dna的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷或对于rna的它们的核糖对应物);然而,它们还可包含非天然的核苷酸类似物,例如包含修饰的碱基、糖或核苷间键合。本领域技术人员清楚,在酶的活性具有特定寡核苷酸或多核苷酸底物的要求的情况下,例如单链dna、rna/dna双链体等,则选择用于寡核苷酸或多核苷酸底物的合适组成完全是在普通技术人员的知识范围内,特别是在来自论文的指导下,例如sambrook等人,molecular cloning,第二版(cold spring harbor laboratory,new york,1989)以及类似的参考文献。同样,寡核苷酸和多核苷酸可以指单链形式或双链形式(即寡核苷酸或多核苷酸及其各自的互补物的双链体)。对于普通技术人员来说将清楚的是,从术语使用的上下文,哪个形式是意图的或是否两种形式都是意图的。
[0156]“引物”是指天然或合成的寡核苷酸,其能够在与多核苷酸模板形成双链体后作为核酸合成的起始点并且从其3'末端沿模板延伸,从而形成延伸的双链体。引物的延伸通常用核酸聚合酶例如dna或rna聚合酶来进行。在延伸过程中添加的核苷酸的序列由模板多核苷酸的序列决定。通常通过dna聚合酶延伸引物。引物通常具有从14个核苷酸至40个核苷酸范围内或从18个核苷酸至36个核苷酸范围内的长度。在各种核酸扩增反应中采用引物,例如使用单一引物的线性扩增反应,或采用两种或更多种引物的聚合酶链式反应。对于选择用于特定应用的引物的长度和序列的指导为本领域普通技术人员所熟知,如通过引用并入的以下参考文献所证明的:dieffenbach,编辑,pcr primer:a laboratory manual,第二版(cold spring harbor press,new york,2003)。
[0157]
关于多核苷酸的“序列确定”、“测序”或“确定核苷酸序列”包括确定多核苷酸的部分以及全部序列信息。也就是说,这些术语包括全套四种天然核苷酸a、c、g和t的子集的序列,例如诸如靶多核苷酸的仅a和c的序列。也就是说,这些术语包括确定靶多核苷酸内的四种类型的核苷酸中的一种、两种、三种或全部的身份、顺序和位置。在一些实施方案中,这些术语包括确定靶多核苷酸内的四种类型的核苷酸中的两种、三种或全部的身份、顺序和位置。在一些实施方案中,序列确定可以通过鉴定靶多核苷酸"catcgc..."中单一类型核苷酸例如胞嘧啶的顺序和位置来完成,从而其序列被表示为二进制码,例如"100101...”代表“c
‑
(非c)(非c)c
‑
(非c)
‑
c...”等等。在一些实施方案中,该术语还可包括充当靶多核苷酸的指纹的靶多核苷酸的子序列;即,在多核苷酸的组中独特地标识靶多核苷酸的子序列,例如由细胞表达的所有不同的rna序列。
技术特征:
1.一种合成具有预定序列的多于一种多核苷酸的方法,所述方法包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点与至少一个工作电极可操作地相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接且具有3
’‑
o
‑
电化学不稳定的保护基团;(b)对每种核苷酸进行以下的循环:(i)通过在预定地址的每个电极和参比电极之间产生电压差从而使所述电化学不稳定的保护基团裂解,以在预定地址的电极处对引发剂或延伸片段去保护,从而在所述预定地址的电极处的所述引发剂或延伸片段上产生游离的3
’‑
羟基,(ii)在延伸条件下,使所述预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸所述预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;和(c)重复步骤(b),直到预定序列的多核苷酸阵列完整。2.根据权利要求1所述的方法,其中所述电化学不稳定的保护基团是ph敏感的,并且其中在所述预定地址处的所述电极和参比电极之间的所述电压差激活在所述预定地址处的电活性剂,所述电活性剂改变所述预定地址处的ph,从而裂解所述电化学不稳定的保护基团。3.根据权利要求2所述的方法,其中所述电化学不稳定的保护基团是氨基基团。4.根据权利要求1所述的方法,其中所述电化学不稳定的保护基团是氧化还原敏感的,并且其中在所述预定地址处的所述电极和参比电极之间的所述电压差还原在所述预定地址处的所述电化学不稳定的保护基团,从而裂解所述电化学不稳定的保护基团。5.根据权利要求4所述的方法,其中所述电化学不稳定的保护基团是叠氮甲基基团。6.一种在多核苷酸阵列中存储和检索信息的方法,所述方法包括以下步骤:(a)提供反应位点的空间可寻址阵列,其中每个反应位点与至少一个工作电极可操作地相关联,并且在其上设置有引发剂,所述引发剂通过它们的5
’‑
末端连接且具有3
’‑
o
‑
电化学不稳定的保护基团;(b)对每种核苷酸进行以下的循环:(i)通过在预定地址的每个电极和参比电极之间产生预定的电压差从而使所述电化学不稳定的保护基团裂解,以在预定地址的电极处对引发剂或延伸片段去保护,从而在所述预定地址的电极处的所述引发剂或延伸片段上产生游离的3
’‑
羟基,(ii)在延伸条件下,使所述预定地址处的电极与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸来延伸所述预定地址处的引发剂或延伸片段,以形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;(c)重复步骤(b),直到预定序列的多核苷酸阵列完整,其中每个完整的多核苷酸在其3’末端以5’至3’方向包含信息编码区和测序引物结合位点;和(d)通过在一个或更多个反应位点将测序引物退火到所述测序引物结合位点并对所述完整的多核苷酸进行合成测序,从所述信息编码区检索信息。7.根据权利要求6所述的方法,其中所述合成测序包括通过模板依赖性聚合酶将标记的可逆封闭的核苷三磷酸掺入到所述测序引物或其延伸物中,使得掺入的标记的可逆封闭的核苷三磷酸的身份由所述反应位点处所述多核苷酸的所述序列确定。
8.根据权利要求7所述的方法,其中所述标记的可逆封闭的核苷三磷酸包含3
’‑
o
‑
电化学不稳定的封闭基团,其通过在预定地址处的每个电极和所述参比电极之间产生预定的电压差从所述预定地址的反应位点处的所述延伸测序引物中除去。9.根据权利要求7或8所述的方法,其中所述标记的可逆封闭的核苷三磷酸的所述标记通过电化学不稳定键附接于其上,所述电化学不稳定键可以通过在每个预定地址处的工作电极和所述参比电极之间产生预定的电压差而在预定的反应位点被裂解。10.根据权利要求6至9中任一项所述的方法,其中所述电化学不稳定的保护基团和/或所述电化学不稳定的封闭基团各自是ph敏感的,并且其中所述预定地址处的所述电极和所述参比电极之间的所述电压差激活所述预定地址处的电活性剂,所述电活性剂改变所述预定地址处的ph,从而裂解所述电化学不稳定的保护基团和/或所述电化学不稳定的封闭基团。11.根据权利要求6至10中任一项所述的方法,其中所述电化学不稳定的保护基团或所述电化学不稳定的封闭基团是氨基基团。12.根据权利要求6至9中任一项所述的方法,其中所述电化学不稳定的保护基团和/或所述电化学不稳定的封闭基团是氧化还原敏感的,并且其中所述预定地址处的所述电极和所述参比电极之间的所述电压差还原所述预定地址处的所述电化学不稳定的保护基团和/或所述电化学不稳定的封闭基团,从而裂解所述电化学不稳定的保护基团。13.根据权利要求12所述的方法,其中所述电化学不稳定的保护基团或所述电化学不稳定的封闭基团是叠氮甲基基团。14.根据权利要求6至13中任一项所述的方法,其中每个所述完整的多核苷酸在其反应位点等温扩增。15.根据权利要求14所述的方法,其中所述等温扩增通过模板步移或重组酶
‑
聚合酶扩增进行。16.根据权利要求6至15中任一项所述的方法,其中所述引发剂的一部分具有相对于所述3
’‑
o
‑
电化学不稳定的保护基团正交的3
’‑
o
‑
保护基团。17.根据权利要求16所述的方法,其中所述正交的3
’‑
o
‑
保护基团被去除,并且其中每个所述完整的多核苷酸在其电极处等温扩增。18.根据权利要求6至17中任一项所述的方法,其中在不同的所述电极的至少两个所述完整的多核苷酸具有包含不同序列的所述测序引物结合位点,使得至少两个所述完整的多核苷酸可以被分别测序。19.根据权利要求18所述的方法,其中所述测序引物结合位点的所述不同序列与其相应信息编码区中编码的不同信息相关联。20.根据权利要求6至19中任一项所述的方法,其中所述合成测序方法包括使延伸测序引物的电化学不稳定的3
’‑
o
‑
封闭基团解封闭的步骤,并且其中所述步骤包括在每个所述电极和参比电极之间产生预定的电压差,使得所述电化学不稳定的保护基团被裂解。21.根据权利要求6至20中任一项所述的方法,其中所述引发剂中的每一种包含可裂解的核苷酸或可裂解的键,并且其中权利要求x1所述的方法还包括每当所述检索的信息指示合成错误时在可裂解的核苷酸或可裂解的键处裂解所述引发剂的步骤,以及从裂解的引发剂重新合成所述多核苷酸的步骤。
22.根据权利要求6至21中任一项所述的方法,其中所述反应位点的一部分包含具有与其他反应位点的引发剂的所述其他3
’‑
o
‑
电化学不稳定的保护基团正交的3
’‑
o
‑
电化学不稳定的保护基团的引发剂,并且其中根据权利要求6所述的方法还包括在具有带有正交的3
’‑
o
‑
电化学不稳定的保护基团的引发剂的至少一个反应位点将引发剂去保护的步骤,和每当所述检索的信息指示合成错误时重新合成预定序列的多核苷酸的步骤。23.一种具有校对的无模板酶促合成多核苷酸的方法,所述方法包括以下步骤:a)在与至少一个工作电极可操作地相关联的反应位点提供引发剂,其中所述引发剂具有游离的3
‑
o
‑
羟基;b)重复以下的循环:(i)在延伸条件下,使具有游离3
’‑
o
‑
羟基的所述引发剂或其延伸片段与3
’‑
o
‑
电化学不稳定的保护的核苷三磷酸和不依赖模板的dna聚合酶接触,从而通过掺入3
’‑
电化学不稳定的保护的核苷三磷酸延伸引发剂或其延伸片段,形成3
’‑
o
‑
电化学不稳定的保护的延伸片段;和(ii)将步骤(i)的延伸片段去保护以形成具有游离3
’‑
羟基的延伸片段,直到多核苷酸完整并且测序引物结合位点被附加到其3’末端;c)将测序引物退火至所述测序引物结合位点并对所述多核苷酸进行测序。24.根据权利要求23所述的方法,其中所述合成测序包括通过模板依赖性聚合酶将标记的可逆封闭的核苷三磷酸掺入到所述测序引物或其延伸物中,使得掺入的标记的可逆封闭的核苷三磷酸的身份由所述反应位点处所述多核苷酸的所述序列确定。25.根据权利要求24所述的方法,其中所述标记的可逆封闭的核苷三磷酸包含3
’‑
o
‑
电化学不稳定的封闭基团,其通过在预定地址处的每个电极和所述参比电极之间产生电压差,从而使所述电化学不稳定的封闭基团裂解,从所述预定地址的反应位点处的所述延伸测序引物中除去。26.根据权利要求24至25中任一项所述的方法,其中所述标记的可逆封闭的核苷三磷酸的所述标记通过电化学不稳定的键附接于其上,所述电化学不稳定的键可通过在每个预定地址处的工作电极和所述参比电极之间产生电压差而在预定反应位点被裂解。27.根据权利要求23至26中任一项所述的方法,其中所述电化学不稳定的保护基团和/或所述电化学阻断基团各自是ph敏感的,并且其中所述预定地址处的所述电极之间的所述电压差激活所述预定地址处的电活性剂,所述电活性剂改变所述预定地址处的ph,从而裂解所述电化学不稳定的保护基团或所述电化学不稳定的封闭基团。28.根据权利要求27所述的方法,其中所述电化学不稳定的保护基团和/或所述电化学不稳定的封闭基团是氨基基团。29.根据权利要求23至26中任一项所述的方法,其中所述电化学不稳定的保护基团或所述电化学不稳定的封闭基团是氧化还原敏感的,并且其中所述预定地址处的所述电极之间的所述电压差还原所述预定地址处的所述电化学不稳定的保护基团或所述电化学不稳定的封闭基团,从而裂解所述电化学不稳定的保护基团。30.根据权利要求29所述的方法,其中所述电化学不稳定的保护基团或所述电化学不稳定的封闭基团是叠氮甲基基团。31.根据权利要求23至30中任一项所述的方法,其中所述引发剂包含可裂解的核苷酸或可裂解的键,并且其中权利要求z1所述的方法还包括每当所述测序步骤指示合成错误时在可裂解的核苷酸或可裂解的键处裂解所述引发剂的步骤,以及从裂解的引发剂重新合成
所述多核苷酸的步骤。
技术总结
本发明涉及用于大规模平行无模板酶促合成预定序列的多于一种不同多核苷酸的方法。在一方面,本发明的方法采用大规模的反应位点阵列,每个反应位点与至少一个工作电极相关联,用于在预定的用户选择的位点处控制去保护和解封闭步骤。在另一方面,本发明提供了具有校对的无模板酶促合成,其中使用合成测序技术,特别是采用电化学不稳定的封闭基团,对预定反应位点处的完整多核苷酸进行测序。应位点处的完整多核苷酸进行测序。应位点处的完整多核苷酸进行测序。
技术研发人员:阿德里安
受保护的技术使用者:DNA斯克瑞普特公司
技术研发日:2019.07.05
技术公布日:2021/6/29
转载请注明原文地址:https://doc.8miu.com/read-5866.html