[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN106414773A - 利用分子孔表征目标分子的方法 - Google Patents

利用分子孔表征目标分子的方法 Download PDF

Info

Publication number
CN106414773A
CN106414773A CN201580029651.6A CN201580029651A CN106414773A CN 106414773 A CN106414773 A CN 106414773A CN 201580029651 A CN201580029651 A CN 201580029651A CN 106414773 A CN106414773 A CN 106414773A
Authority
CN
China
Prior art keywords
leu
polynucleotide
ala
analyte
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580029651.6A
Other languages
English (en)
Inventor
詹姆斯·安东尼·克拉克
马里恩·路易丝·克劳福德
詹姆斯·怀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technologies PLC
Original Assignee
Oxford Nanopore Technologies PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/GB2014/052737 external-priority patent/WO2015110777A1/en
Application filed by Oxford Nanopore Technologies PLC filed Critical Oxford Nanopore Technologies PLC
Priority to CN202310175646.2A priority Critical patent/CN116334198A/zh
Publication of CN106414773A publication Critical patent/CN106414773A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及确定多个分析物的存在、不存在或一个或多个特征的新方法。本发明涉及将第一分析物偶联到含有检测器的膜,并使用检测器研究第一分析物。本发明还涉及将第二分析物偶联到所述膜上并研究第二分析物。在研究第二分析物之前,将第一分析物与所述膜解偶联。本发明还涉及多核苷酸测序。

Description

利用分子孔表征目标分子的方法
技术领域
本发明涉及确定多个分析物的存在、不存在或确定多个分析物的一个或多个特征的新方法。本发明涉及将第一分析物与含有检测器的膜偶联,并使用检测器研究第一分析物。本发明还涉及将第二分析物偶联到膜上并研究第二分析物。在研究第二分析物之前,使第一分析物与膜解偶联。本发明还涉及多核苷酸的测序。
背景技术
目前需要涉及广泛应用范围的快速且廉价的多核苷酸(例如DNA或RNA)测序和识别技术。现有技术缓慢且昂贵,主要是因为它们依靠扩增技术来产生大量的多核苷酸,并且需要大量的专门的荧光化学物质用于信号检测。
跨膜孔(纳米孔)具有作为用于聚合物和各种小分子的直接的电生物传感器的巨大潜力。特别地,作为潜在DNA测序技术的纳米孔已成为最近焦点。
当跨越纳米孔施加电位时,当分析物(例如核苷酸)在桶状体中短暂驻留一段时间后,电流发生变化。对核苷酸的纳米孔检测给出了已知标记的电流变化和持续时间。在链测序方法中,使单个多核苷酸链穿过孔,得到对核苷酸的识别。链测序可以包括使用多核苷酸结合蛋白来控制多核苷酸穿过孔的移动。
之前已经证明,可以通过将分析物偶联到其中存在相关检测器的膜来实现超低浓度分析物传送。这进行检测所需的分析物的量降低了几个数量级(WO 2012/164270)。
发明内容
发明人惊奇地证明,可以通过将分析物顺序偶联到其中存在检测器的膜,研究多个样品中的多个分析物。在研究第二分析物之前,使第一分析物与膜解偶联。
因此,本发明提供了用于确定在两个或更多个样品中两个或更多个分析物的存在、不存在或一个或多个特征的方法,包括:
(a)使用一个或多个锚将第一样品中的第一分析物偶联至膜;
(b)使所述第一分析物与存在于所述膜中的检测器相互作用,并由此确定所述第一分析物的存在、不存在或一个或多个特征;
(c)使所述第一分析物与所述膜解偶联;
(d)使用一个或多个锚将第二样品中的第二分析物偶联至所述膜;以及
(e)允许第二分析物与膜中的检测器相互作用,并由此确定第二分析物的存在、不存在或一个或多个特征。
本发明还提供:
-使用胆固醇偶联到膜上的分析物与膜解偶联的方法,包括使分析物与环糊精或其衍生物接触,并由此使分析物与膜解偶联;以及
-用于确定在两个或更多个样品中两个或更多个分析物存在、不存在或一个或多个特征的试剂盒,包含(a)膜,(b)两个或更多个锚,其能够将所述两个或更多个分析物偶联至膜,和(c)一个或多个能够使所述两个或更多个分析物中的至少一个与所述膜解偶联的试剂。
附图说明
图1在(1)部分中显示了用于制备实施例2-4中使用的DNA的DNA模板(SEQ ID NO:31,标记为A1,SEQ ID NO:47标记为A2)。(2)部分显示了构建体X(在实施例2材料和方法中完整描述)的卡通图示——iSpC3间隔区显示为十字,四个5-硝基吲哚显示为灰色框,胆固醇系链显示为灰色椭圆形;标记b=SEQ ID NO:34,标记c=SEQ ID NO:35,标记d=SEQ IDNO:39,标记e=SEQ ID NO:41。(3)部分显示了构建体Y(在实施例2材料和方法中完整描述)的卡通图示——iSpC3间隔区显示为十字,四个5-硝基吲哚显示为灰色框,胆固醇系链显示为灰色椭圆形;标签b=SEQ ID NO:34,标签f=SEQ ID NO:37,标签g=SEQ ID NO:40,标签h=SEQ ID NO:30。
图2显示了纳米孔以其未阻断状态存在(显示为浅灰色)时相比于当发生解旋酶DNA移动并且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的实验时间进程(x轴标记=时间(s),y轴标记=百分比(%))。如标记为X的箭头所示,在2400秒时加入DNA构建体X。如标记为Y的箭头所示,在7200秒时加入DNA构建体Y。
图3显示了纳米孔以其未阻断状态存在(显示为浅灰色)时相比于当发生解旋酶DNA移动并且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的部分实验时间进程(x轴标记=时间(s),y轴标记=百分比(%))。如标记为X的箭头所示,在2700秒时加入DNA构建体X。如标记为F的箭头所示,在7500秒时进行缓冲液冲洗(10mL)。
图4显示了纳米孔以其未阻断状态存在(显示为浅灰色)时相比于当发生解旋酶DNA移动并且纳米孔被DNA链部分阻断(显示为黑色)时的时间的分比的部分实验时间进程(x轴标记=时间(s),y轴标记=百分比(%))。如标记为X的箭头所示,在2700秒时加入DNA构建体X。如标记为F的箭头所示,在6900秒时进行1分钟甲基-β-环糊精孵育然后冲洗(100μM,150μL)。
图5显示了纳米孔以其未阻断状态存在(显示为浅灰色)时相比于当发生解旋酶DNA移动并且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的部分实验时间进程(x轴标记=时间(s),y轴标记=百分比(%))。如标记为X的箭头所示,在2400秒时加入DNA构建体X。如标记为F的箭头和白色框所示,在6600至6900秒之间进行10分钟甲基-β-环糊精孵育然后冲洗(100μM,150μL)。
图6显示了纳米孔以其未阻断状态存在(显示为浅灰色)时相比于当发生解旋酶DNA移动并且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的部分实验时间进程(x轴标记=时间(s),y轴标记=百分比(%))。如标记为X的箭头所示,在2400秒时加入DNA构建体X。如标记为F的箭头和白色框所示,在6300至8100秒之间进行30分钟甲基-β-环糊精孵育然后冲洗(100μM,150μL)。
图7显示了实施例5中使用的DNA构建体如何系在膜上(标记为i)。移位穿过纳米孔的DNA链标记为a(SEQ ID NO:42,其3′端连接到四个iSpC3间隔区(标记为十字),所述间隔区在另一端连接到SEQ ID NO:43的5′端)。它与标记为b和c的两条链(分别为SEQ ID NO:44和45)杂交。SEQ ID NO:45在其3′端连接到6个iSp18间隔区(标记为d并显示为虚线),所述间隔区在其另一端连接到两个胸腺嘧啶和生物素基团(标记为f)。生物素基团与链霉亲和素(标记为e)结合,所述链霉亲和素还结合到脱硫生物素(标记为g)。脱硫生物素连接到SEQID NO:46的5′端,SEQ ID NO:46的另一端具有3′胆固醇TEG(标记为h)。
图8显示了实施例5中描述的实验的电流轨迹(y轴标记=电流(pA),x轴标记=时间(s))。所述轨迹显示了偶联步骤和使用游离的生物素去除偶联的DNA。*1标记对应于脱硫生物素剂(desthiobiotin extender)的添加,*2对应于DNA构建体P的添加,*3对应于游离生物素的添加,*4对应于缓冲冲洗液(buffer flush)的添加。
图9显示了图8中所示电流轨迹的三个放大区域(所有三个轨迹都具有以下轴标记-y轴标记=电流(pA),x轴标记=时间(s))。轨迹A,B和C是图8中所示轨迹的一部分的连续快照图。*1标记对应于脱硫生物素剂的添加,*2对应于DNA构建体P的添加,*3对应于游离生物素的添加,*4对应于缓冲冲洗液的添加。
序列表说明
SEQ ID NO:1显示了编码MS-B1突变MspA单体的密码子优化的多核苷酸序列。该突变体缺少信号序列并包括以下突变:D90N,D91N,D93N,D118R,D134R和E139K。
SEQ ID NO:2显示MspA单体的MS-Bi突变体的成熟形式的氨基酸序列。该突变体缺少信号序列并包括以下突变:D90N,D91N,D93N,D118R,D134R和E139K。
SEQ ID NO:3显示编码α-溶血素-E111N/K147N(α-HL-NN;Stoddart等人,PNAS,2009;106(19):7702-7707)的一个单体的多核昔酸序列。
SEQ ID NO:4显示α-HL-NN的一个单体的氨基酸序列。
SEQ ID NO:5至7示出了MspB、C和D的氨基酸序列。
SEQ ID NO:8示出了编码Phi29DNA聚合酶的多核苷酸序列。
SEQ ID NO:9示出了Phi29DNA聚合酶的氨基酸序列。
SEQ ID NO:10示出了来自大肠杆菌的sbcB基因的密码子优化的多核昔酸序列。它编码来自大肠杆菌的核酸外切酶I(EcoExo I)。
SEQ ID NO:11示出了来自大肠杆菌的核酸外切酶I(EcoExo I)的氨基酸序列。
SEQ ID NO:12示出了来自大肠杆菌的xthA基因的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶III。
SEQ ID NO:13示出了来自大肠杆菌的核酸外切酶III的氨基酸序列。该酶从双链DNA(dsDNA)的一条链以3′-5′方向进行5′单磷酸核苷的分布消化。链上的酶的引发需要约4个核苷酸的5′突出(overhang)。
SEQ ID NO:14示出了来自嗜热栖热菌(T.thermophilus)的recJ基因的密码子优化的多核苷酸序列。它编码来自嗜热栖热菌的RecJ酶(TthReeJ-cd)。
SEQ ID NO:15示出了来自嗜热栖热菌的RecJ酶的氨基酸序列(TthReeJ-cd)。该酶从ssDNA以5′-3′方向进行5′单磷酸核苷的进行性(processive)消化。链上的酶引发需要至少4个核苷酸。
SEQ ID NO:16示出了衍生自噬菌体λexo(redX)基因的密码子优化的多核苷酸序列。它编码噬菌体λ核酸外切酶。
SEQ ID NO:17示出了噬菌体λ核酸外切酶的氨基酸序列。该序列是组装成三聚体的三个相同亚基之一。该酶从dsDNA的一条链以5′-3′方向进行核苷酸的高度进行性消化(http://www.neb.com/nebecomm/products/productM0262.asp)。链上的酶引发优先需要约4个具有5′磷酸的核苷酸的5′突出。
SEQ ID NO:18示出了Hel308Mbu的氨基酸序列。
SEQ ID NO:19示出了Hel308Csy的氨基酸序列。
SEQ ID NO:20示出了Hel308Tga的的氨基酸序列。
SEQ ID NO:21示出了Hel308Mhu的氨基酸序列。
SEQ ID NO:22示出了TraI Eco的氨基酸序列。
SEQ ID NO:23示出了XPD Mbu的氨基酸序列。
SEQ ID NO:24示出了Dda 1993的氨基酸序列。
SEQ ID NO:25示出了Trwc Cba的氨基酸序列。
SEQ ID NO:26显示实施例1中使用的多核苷酸序列。
SEQ ID NO:27显示实施例1中使用的多核苷酸序列。SEQ ID NO:27其3′端连接到四个iSp18间隔区,所述间隔区在其另一端连接到SEQ ID NO:28的5′端。
SEQ ID NO:28显示实施例1中使用的多核苷酸序列。SEQ ID NO:28其5′端连接到四个iSp18间隔区,所述间隔区在其另一端连接到SEQ ID NO:27的3′端。
SEQ ID NO:29显示实施例1中使用的多核苷酸序列。
SEQ ID NO:30至41显示了实施例2中使用的多核苷酸序列。
SEQ ID NO:42至46显示了实施例5中使用的多核苷酸序列。
SEQ ID NO:47显示实施例2中使用的多核苷酸序列。
具体实施方式
应该理解的是,所公开的产品和方法的不同应用可以适用于本领域中的特定需要。也应理解的是,本文使用的术语仅用于描述本发明的具体实施方案,并且不意在限制。
此外,除非内容另外明确指出,否则用于本说明书和所附权利要求书中的单数形式“一”,“一个”,和“所述”包括复数指代。因此,例如,涉及“分析物”时包括两个或更多个分析物,涉及“多核苷酸”时包括两个或更多个多核昔酸,涉及“锚”时包括两个或更多个锚,涉及“解旋酶”时包括两个或更多个解旋酶,涉及“跨膜孔”时包括两个或更多个孔,等。
文本无论在上文还是下文中引用的所有出版物、专利和专利申请,以全文引用的方式纳入本文。
本发明的方法
本发明提供了用于确定两个或更多个分析物的存在、不存在或一个或多个特征的方法。该方法包括使用一个或多个锚将第一样品中的第一分析物偶联至膜,并允许所述分析物与膜中存在的检测器相互作用。由此确定第一分析物的存在、不存在或一个或多个特征。该方法还包括使用一个或多个锚将第二样品中的第二分析物偶联至膜,并允许第二分析物与膜中存在的检测器相互作用。由此确定第二分析物的存在、不存在或一个或多个特征。第一分析物可以在第二分析物偶联到膜上之前,之后或同时从膜上解偶联。
发明人惊奇地证明,通过将分析物偶联到其中存在检测器的膜可以实现将超低浓度的分析物传递到检测器。这使进行检测所需的分析物的量降低了几个数量级。不能预测所需分析物的量减少的程度。
特别地,本发明人令人惊讶地报道了单链多核苷酸的捕获比先前报道的提高了4个数量级。当检测器和分析物现在在同一平面上时,每秒会发生~103M s-1以上的相互作用,因为这两个分子在二维而不是三维上进行扩散。这对样品制备要求具有显著的影响,这些要求是诊断装置如下一代测序系统的关键问题。
此外,将分析物偶联至膜对于各种纳米孔-酶测序应用具有增加的优点。在链测序中,当在孔中引入多核苷酸分析物时,孔可以永久或暂时的阻断,从而阻止多核苷酸的测序。当多核苷酸分析物的一端远离孔定位时,例如通过偶联或系链(tethering)到膜上而定位,令人惊讶地发现,不再观察到这种暂时或永久的阻断。通过将多核苷酸的一端偶联到膜上而占据该端,还起到有效地增加检测器上的分析物浓度的作用,并因此增加测序系统的工作循环。
该方法当然有利于检测以低浓度存在的多个分析物。当两个或更多个待测定分析物中的每个分析物以约0.001pM至约1nM,例如小于0.01pM,小于0.1pM,小于1pM,小于10pM或小于100pM的浓度存在时,该方法优选允许确定所述两个或更多个待测定分析物的存在或一个或多个特征。
本发明的方法对于多核苷酸测序是特别有利的,因为仅可以从人血液获得少量的纯化多核苷酸。所述方法优选允许估计以约0.001pM至约1nM,例如小于0.01pM,小于0.1pM,小于1pM,小于10pM或小于100pM的浓度存在的多核苷酸的序列或允许对该多核昔酸的测序。如下文更详细讨论的,所述两个或更多个分析物可以是两个或更多个相同分析物。这在多核昔酸测序中是有利的,因为其允许多于一次地调查多核昔酸的序列。这导致提高的测序效率和准确性。
将多核昔酸的一端偶联至膜(甚至暂时地)也意味着将阻止该端干扰基于纳米孔的测序过程。
本发明的方法还具有其它优点。该方法提供了同时测定两个或更多个分析物的替代方案,其消除了对从每个分析物获得的测量信号进行解偶联的需要。该方法使得能够顺序测定两个或更多个分析物,其中,例如,用于确定每个分析物所需的条件不同,因此使得同时测量是不切实际的。该方法还方便地使得能够使用相同的膜测量两个或更多个分析物,从而提供膜多次使用的可能性并延长膜的寿命。
分析物
本发明的方法涉及确定两个或更多个分析物的存在、不存在或一个或多个特征。可以研究任何数量的分析物。例如,本发明的方法可以涉及确定3,4,5,6,7,8,9,10,20,30,50,100或更多个分析物的存在、不存在或一个或多个特征。如果使用本发明的方法研究三个或更多个分析物,则第二分析物也与膜解偶联,并针对第三分析物时增加所需数量的步骤。对于四个或更多个分析物时也是如此。
本发明的方法可包括确定或测定每个分析物的一个或多个特征。该方法可以涉及确定或测定每个分析物的两个,三个,四个或五个或更多个特征。所述一个或多个特征优选选自(i)分析物的大小,(ii)分析物的同一性,(iii)分析物的二级结构,和(iv)分析物是否被修饰。可以根据本发明测量(i)至(iv)的任何组合,例如{i},{ii},{iii},{iv},{i,ii},{i,iii}i,ii,iv},{i,iii,iv},{ii,iii},{i,iii,iv}或{i,ii,iii,iv}。与第二分析物相比,对于第一分析物,可以测量(i)至(iv)的不同组合,包括上面列出的那些组合中的任一种。该方法优选包括,估计第一多核苷酸和/或第二多核苷酸的序列或对第一多核苷酸和/或第二多核苷酸进行测序。
每个分析物可以是任何物质。合适的分析物包括但不限于金属离子,无机盐,聚合物,例如聚合酸或碱,染料,漂白剂,药物,诊断剂,兴奋剂,爆炸物和环境污染物。
第一分析物和/或第二分析物可以是从细胞分泌的分析物。或者,第一分析物和/或第二分析物可以是存在于细胞内的分析物,使得在进行本发明之前必须从细胞中提取该分析物。
第一分析物和/或第二分析物优选是氨基酸、肽、多肽、蛋白质或多核苷酸。氨基酸、肽,多肽或蛋白质可以是天然存在的或非天然存在的。多肽或蛋白质中可以包括合成或修饰的氨基酸。对于氨基酸的许多不同类型的修饰是本领域已知的。对于本发明,应当理解,第一分析物和/或第二分析物可以通过本领域可用的任何方法进行修饰。
蛋白质可以是酶、抗体、激素、生长因子或生长调节蛋白,例如细胞因子。细胞因子可以选自白介素,优选IFN-1,IL-2,IL-4,IL-5,IL-6,IL-10,IL-12或IL-13,干扰素,优选IL-γ或其它细胞因子如TNF-α。蛋白质可以是细菌蛋白质,真菌蛋白质,病毒蛋白质或寄生虫衍生的蛋白质。在其与检测器接触之前,蛋白质可以解折叠以形成多肽链。
第一分析物和/或第二分析物最优选是多核苷酸,例如核酸。以下更详细地讨论多核苷酸。多核昔酸可以在其5′端或3′端或沿着链的一个或多个中间点偶联至膜。多核苷酸可以是如下所讨论的单链或双链。多核苷酸可以是环状的。多核苷酸可以是适配体,与微小RNA(microRNA)杂交的探针或微小RNA自身(Wang,Y.等人,自然纳米技术(NatureNanotechnology),2011,6,668-674)。这两种多核苷酸分析物可以是结合两个蛋白质的多核苷酸,并且可以用于表征蛋白质,例如用于确定它们的浓度。
当分析物是与微小RNA杂交的探针时,探针可永久或暂时地偶联到膜上。这将在下面更详细地讨论。探针本身可以被配置为直接偶联至膜或可以与已经被配置为偶联至膜的互补多核苷酸杂交。分析物可以是杂交到探针的微小RNA的复合物,其中探针具有独特的序列或条形码,使其能够被明确地鉴定。
当第一分析物和/或第二分析物是适配体时,适配体可永久或暂时偶联至膜。适配体本身可以被配置为直接偶联至膜或可以与已经被配置为偶联至膜的互补多核苷酸杂交。适配体可以结合或未结合到蛋白质分析物,检测适配体的最终目的可以是检测其结合的蛋白质分析物的存在、不存在或一个或多个特征。
第一分析物和第二分析物可以彼此不同。例如,第一分析物可以是蛋白质,第二分析物可以是多核苷酸。或者,第一和第二分析物可以是不同的多核苷酸。在这种情况下,可以不需要在添加第二样品之前去除至少一部分第一样品。这将在下面更详细地讨论。如果该方法涉及研究三个或更多个分析物,则它们可以全部彼此不同或者它们中的一些可以彼此不同。
第一分析物和第二分析物可以是相同分析物的两个实例。第一分析物可以与第二分析物相同。这允许校验(proof reading),特别是如果分析物是多核苷酸。如果该方法涉及研究三个或更多个分析物,则它们可以全部是相同分析物的三个或更多个实例,或者它们中的一些可以是相同分析物的单独实例。
多核苷酸
第一和/或第二分析物优选是多核苷酸。多核苷酸,例如核酸,是包含两个或更多个核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任何组合。核苷酸可以是天然存在的或人工的。多核苷酸中的一个或多个核苷酸可以被氧化或甲基化。多核苷酸中的一个或多个核苷酸可能被损伤。例如,多核苷酸可以包含嘧啶二聚体。这样的二聚体通常与紫外线导致的损伤相关,并且是皮肤黑素瘤的主要原因。多核苷酸中的一个或多个核苷酸可以被修饰,例如用标记或标签修饰。合适的标记如下所述。多核苷酸可以包含一个或多个间隔区。
核苷酸通常含有核碱基、糖和至少一个磷酸基团。核碱基和糖形成核苷。
核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,更具体地,腺嘌呤(A),鸟嘌呤(G),胸腺嘧啶(T),尿嘧啶(U)和胞嘧啶(C)。
糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。糖优选是脱氧核糖。
多核苷酸优选包含以下核苷:脱氧腺苷(dA),脱氧尿苷(dU)和/或胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC)。
核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸,二磷酸或三磷酸。核苷酸可以包含多于三个磷酸,例如4或5个磷酸。磷酸可以连接在核昔酸的5′或3′侧。核昔酸包括但不限于腺苷单磷酸(AMP),鸟苷单磷酸(GMP),胸昔单磷酸(TMP),尿苷单磷酸(UMP),5-甲基胞苷单磷酸,5-羟甲基胞苷单磷酸,胞苷单磷酸(CMP),环腺苷单磷酸(cAMP),环鸟苷单磷酸(cGMP),脱氧腺苷单磷酸(dAMP),脱氧鸟昔单磷酸(dGMP),脱氧胸昔单磷酸(dTMP),脱氧尿苷单磷酸(dUMP),脱氧胞苷单磷酸(dCMP)和脱氧甲基胞苷单磷酸。核苷酸优选选自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP,dCMP和dUMP。
核苷酸可以是无碱基的(即缺乏核碱基)。核苷酸也可以缺少核碱基和糖(即,是C3间隔区)。
多核苷酸中的核苷酸可以以任何方式彼此连接。核苷酸通常通过其糖和磷酸基团连接,如在核酸中。核苷酸可以通过其核碱基连接,如在嘧啶二聚体中。
多核苷酸可以是单链或双链的。至少多核苷酸的一部分优选是双链的。
多核苷酸可以是核酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与DNA的一条链杂交的一条RNA链。多核苷酸可以是本领域已知的任何合成核酸,例如肽核酸(PNA),甘油核酸(GNA),苏糖核酸(TNA),锁核酸(LNA),桥联核酸(BNA)或其他具有核苷酸侧链的合成聚合物。PNA骨架由通过肽键连接的N-(2-氨基乙基)-甘氨酸重复单元组成。GNA骨架由通过磷酸二酯键连接的重复的乙二醇单元组成。TNA骨架由通过磷酸二酯键连接在一起的重复苏糖组成。LNA由如上所述的具有连接核糖部分中的2′氧和4′碳的额外桥的核糖核苷酸形成。
多核苷酸最优选核糖核酸(RNA)或脱氧核糖核酸(DNA)。
多核苷酸可以是任何长度。例如,多核苷酸可以是至少10,至少50,至少100,至少150,至少200,至少250,至少300,至少400或至少500个核苷酸或核苷酸对长度。多核苷酸可以是1000个或更多个核苷酸或核苷酸对,5000个或更多个核苷酸或核苷酸对长度,或100000或更多个核苷酸或核苷酸对长度。
样品
每个分析物通常存在于任何合适的样品中。本发明通常针对已知含有或怀疑含有分析物的两个或更多个样品实施。或者,本发明可以针对两个或更多个样品实施以确认两个或更多个已知或预期存在于样品中的分析物。
第一样品和/或第二样品可以是生物样品。本发明可以使用从任何有机体或微生物获得或提取的至少一种样品在体外进行实施。有机体或微生物通常是古细菌、原核生物或真核生物,并且通常属于以下五界之一:植物、动物、真菌、原核生物和原生生物。本发明可以对至少一种获自或提取自任何病毒的样品在体外进行实施。第一样品和/或第二样品优选是流体样品。第一样品和/或第二样品通常包括患者的体液。第一样品和/或第二样品可以是尿、淋巴液、唾液、粘液或羊水,但优选是血液、血浆或血清。通常,第一样品和/或第二样品是来源于人的,但是替代地,其可以来自另一种哺乳动物,例如来自商业养殖的动物,如马,牛,羊,鱼,鸡或猪,或者可以是宠物,例如猫或狗。或者,第一样品和/或第二样品可以是来源于植物,例如获自以下的样品:商业作物如谷物,豆类,水果或蔬菜,例如小麦,大麦,燕麦,油菜,玉米,大豆,水稻,大黄,香蕉,苹果,番茄,土豆,葡萄,烟草,豆类,小扁豆,甘蔗,可可,棉花。
第一样品和/或第二样品可以是非生物样品。非生物样品优选是流体样品。非生物样品的实例包括外科手术流体,水如饮用水,海水或河水,以及用于实验室试验的试剂。
第一样品和/或第二样品通常在用于本发明之前进行处理,例如通过离心或通过膜过滤掉不想要的分子或细胞(例如红细胞)。第一样品和/或第二样品可以在获取后立即测量。第一样品和/或第二样品也可以典型地在测定之前储存,优选在低于-70℃。
第一样品和第二样品可以彼此不同。例如,第一样品可以来自人,第二样品可以来自病毒。如果第一和第二样品彼此不同,它们可以含有或被怀疑含有相同的第一和第二分析物。如果该方法涉及研究三个或更多个样品,则它们可以全部彼此不同或者它们中的一些可以彼此不同。
第一样品和第二样品优选是相同样品的两个实例。第一样品优选与第二样品相同。这允许校验读取,特别是如果分析物是多核苷酸。如果该方法涉及研究三个或更多个样品,则它们可以全部是相同样品的三个或更多个实例,或者它们中的一些可以是相同样品的单独实例。
根据本发明可以使用任何膜。合适的膜是本领域公知的。膜优选是两亲性层。两亲性层是由两亲性分子形成的层,例如磷脂,其具有亲水性和亲脂性。两亲分子可以是合成的或天然存在的。形成单层的非天然存在的两亲物(一个或多个)是本领域已知的,包括例如嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两个或更多个单体亚单元聚合在一起产生单一聚合物链的聚合物材料。嵌段共聚物通常具有由每个单体亚单元贡献的性质。然而,嵌段共聚物可具有由各个亚单元形成的聚合物不具有的独特性质。可以改造嵌段共聚物,使得单体亚单元之一是疏水的(即亲脂的),而其它亚单元在水性介质中是亲水的。在这种情况下,嵌段共聚物可以具有两亲性质并且可以形成能模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚单元组成),但也可以由多于两个单体亚单元构成,以形成表现为两亲物的更复杂的构型。共聚物可以是三嵌段,四嵌段或五嵌段共聚物。膜优选是三嵌段共聚物膜。
古细菌双极性性四醚脂质(bipolar tetraether lipids)是天然存在的脂质,其被构建为使得该脂质形成单层膜。这些脂质通常存在于在恶劣的生物环境存活的极端微生物,嗜热菌,嗜盐菌和嗜酸菌中。它们的稳定性被认为源于最终双层的融合性质。通过产生具有亲水-疏水-亲水的通用基序的三嵌段聚合物,可以直接构建模拟这些生物实体的嵌段共聚物材料。这种材料可以形成单体膜,其类似于脂质双层而发挥作用,并且包括从囊泡到层状膜的一系列相行为。由这些三嵌段共聚物形成的膜与生物脂质膜相比具有一些优点。因为所述三嵌段共聚物是合成的,可仔细控制精确的构造以提供形成膜和与孔及其它蛋白质相互作用所需的正确的链长度和性质。
嵌段共聚物也可以由不归类为脂质亚材料的亚单元构造而成;例如疏水性聚合物可以由硅氧烷或其它非烃基单体制成。嵌段共聚物的亲水性子部也可以具有低的蛋白质结合性质,这允许产生当暴露于未加工的生物样品时高度耐受的膜。该头部基团单元还可以衍生自非经典脂质头部基团。
与生物脂质膜相比,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高得多的操作温度或pH范围。嵌段共聚物的合成性质为广泛的应用提供了定制基于聚合物的膜的平台。
在优选的实施方案中,本发明提供了用于确定两个或更多个样品中两个或更多个分析物的存在、不存在或一个或更多个特征的方法,包括(a)使用一个或多个锚将第一样品中的第一分析物偶联至膜,所述锚包括三嵌段共聚物,任选地其中所述膜被修饰以促进偶联;(b)使所述第一分析物与存在于所述膜中的检测器相互作用,由此确定所述第一分析物的存在、不存在或一个或多个特征;(c)使所述第一分析物与所述膜解偶联;(d)使用一个或多个锚将第二样品中的第二分析物偶联至所述膜;和(e)允许第二分析物与膜中的检测器相互作用,由此确定第二分析物的存在、不存在或一个或多个特征。
该膜最优选是国际申请号PCT/GB2013/052766或PCT/GB2013/052767中公开的膜之一。
两亲性分子可被化学修饰或官能化以促进分析物的偶联。
两亲性层可以是单层或双层。两亲性层通常是平面的。两亲性层可以是弯曲的。两亲性层可以被支撑。
两亲性膜通常是天然可移动的,基本上用作具有约10-8cm s-1的脂质扩散速率的二维流体。这意味着检测器和偶联的分析物通常可以在两亲性膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并且作为一系列实验研究的优良平台。例如,脂质双层可以用于通过单通道记录进行的膜蛋白的体外研究。或者,脂质双层可用作生物传感器以检测多种物质的存在。脂质双层可以是任何脂质双层。合适的脂质双层包括但不限于平面脂质双层、受支撑双层,或脂质体。脂质双层优选为平面脂质双层。合适的脂质双层在国际申请号PCT/GB08/000563(公开为WO 2008/102121),国际申请号PCT/GB08/004127(公开为WO 2009/077734)和国际申请号PCT/GB2006/001057(公开为WO 2006/100484)中公开。
形成脂质双层的方法是本领域已知的。合适的方法公开在实施例中。脂质双层通常通过Montal和Mueller(Proc.Natl.Acad.Sci.USA.,1972;69:3561-3566)的方法形成,其中脂质单层被携带在水溶液/空气界面上,穿过垂直于该界面的孔的任一侧。通常通过下述将脂质添加到电解质水溶液的表面:首先将脂质溶解在有机溶剂中,然后允许溶剂滴在孔的任一侧上的水溶液的表面上蒸发。一旦有机溶剂蒸发,孔的任一侧上的溶液/空气界面物理地上下移动,穿过所述孔直到形成双层。平面脂质双层可以形成为,穿过膜中的孔或穿过开口而进入凹部。
Montal&Mueller的方法是受欢迎的,因为它是形成适合于蛋白质孔插入的优质脂质双层的成本划算和相对直接的方法。形成双层的其他常见方法包括尖端浸渍、涂覆双层,和膜片钳夹脂质体双层(patch-clamping of liposome bilayers)。
尖端浸渍双层的形成需要使孔表面(例如,移液管尖端)接触到携带单层脂质的测试溶液的表面上。另外,首先通过允许溶解在有机溶剂中的脂质滴在溶液表面蒸发而在溶液/空气界面处产生脂质单层。然后通过Langmuir-Schaefer方法形成双层,并且需要机械自动化设备以相对于溶液表面移动孔。
对于涂覆的双层,将溶解在有机溶剂中的脂质滴直接施加到孔中,将其浸没在水性测试溶液中。使用油漆刷或等效物将脂质溶液稀薄地铺在孔上。溶剂的稀释导致脂质双层的形成。然而,从双层中完全去除溶剂是困难的,因此由该方法形成的双层在电化学测量期间不太稳定且更容易产生噪声。
膜片钳夹通常用于生物细胞膜的研究。通过抽吸将细胞膜夹到移液管的末端,并且膜的贴片附着在孔上。该方法已经被调整为通过夹持脂质体产生脂质双层,然后脂质体破裂以在移液管的孔口上留下脂质双层密封。该方法需要稳定的巨大且单层的脂质体以及在具有玻璃表面的材料中制造小孔。
脂质体可以通过超声,挤出或Mozafari方法(Colas等人(2007)Micron 38:841-847)形成。
在优选的实施方案中,脂质双层如国际申请号PCT/GB08/004127(公开为WO 2009/077734)中所述形成。有利地,在该方法中,脂质双层由干燥的脂质形成。在最优选的实施方案中,脂质双层穿越开口形成,如WO2009/077734(PCT/GB08/004127)中所述。
脂质双层由两个相对的脂质层形成。两层脂质排列成使得它们的疏水尾部基团彼此面对以形成疏水内部。脂质的亲水性头部基团在双层的每一侧上面向外朝向水性环境。双层可存在于许多脂质相中,包括但不限于液体无序相(流体层状相),液体有序相,固体有序相(层状凝胶相,交叉凝胶相(interdigitated gel phase))和平面双层晶体(层状亚凝胶相,层状结晶相)。
可以使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得形成具有所需性质(例如表面电荷)、支持膜蛋白的能力、堆积密度或机械性质的脂质双层。脂质组合物可以包含一个或多个不同的脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选含有1至10种脂质。脂质组合物可以包含天然存在的脂质和/或人工脂质。
脂质通常包含头部基团、界面部分和两个可以相同或不同的疏水尾部基团。合适的头部基团包括但不限于中性头部基团,例如二酰基甘油酯(DG)和神经酰胺(CM);两性离子头部基团,例如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电荷的头部基团,例如磷脂酰甘油(PG);磷脂酰丝氨酸(PS),磷脂酰肌醇(PI),磷酸(PA)和心磷脂(CA);以及带正电荷的头部基团,例如三甲基铵-丙烷(TAP)。合适的界面部分包括但不限于天然存在的界面部分,例如基于甘油或基于神经酰胺的部分。合适的疏水性尾部基团包括但不限于饱和烃链,例如月桂酸(正十二烷酸),肉豆蔻酸(正十四烷酸),棕榈酸(正十六烷酸),硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,例如油酸(顺-9-十八烷酸);和支链烃链,例如植烷酰基。链的长度和不饱和烃链中双键的位置和数目可以变化。链的长度和支链烃链中支链(例如甲基)的位置和数目可以变化。疏水性尾部基团可以作为醚或酯连接到界面部分。脂质可以是分枝菌酸。
脂质也可以是化学修饰的。脂质的头部基团或尾部基团可以是化学修饰的。头部基团已被化学修饰的合适的脂质包括但不限于PEG修饰的脂质,例如1,2-二酰基-sn-甘油基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化的PEG脂质,例如1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];和修饰为用于轭合的脂质,例如1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺-N-(琥珀酰基)和1,2-二棕榈酰基-sn-甘油基-3-磷酸乙醇胺-N-(生物素基)。尾部基团已经化学修饰的合适的脂质包括但不限于可聚合脂质,例如1,2-双(10,12-二十三碳二炔酰基)-sn-甘油基-3-磷酸胆碱;氟化脂质,例如1-棕榈酰基-2-(16-氟棕榈酰基)-sn-甘油基-3-磷酸胆碱;氘代脂质,例如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;和醚连接的脂质,例如1,2-二-O-植烷基-sn-甘油基-3-磷酸胆碱。脂质可以被化学修饰或官能化以促进分析物的偶联。
两亲性层,例如脂质组合物,通常包含一个或多个将影响该层的性质的添加剂。合适的添加剂包括但不限于脂肪酸,例如棕榈酸,肉豆蔻酸和油酸;脂肪醇,例如棕榈醇,肉豆蔻醇和油醇;甾醇,例如胆固醇,麦角固醇,羊毛甾醇,谷甾醇和豆甾醇;溶血磷脂,例如1-酰基-2-羟基-sn-甘油基-3-磷酸胆碱;和神经酰胺。
在另一个优选的实施方案中,膜是固态层。固态层可以由有机和无机材料形成,包括但不限于微电子材料,绝缘材料例如Si3N4,Al2O3和SiO,有机和无机聚合物例如聚酰胺,塑料例如或者弹性体例如双组分加成固化硅橡胶,以及玻璃。固态层可以由石墨烯形成。合适的石墨烯层公开在国际申请号PCT/US2008/010637(公开为WO 2009/035647)中。
该方法通常使用(i)包含孔的人工两亲性层,(ii)包含孔的分离的天然存在的脂质双层,或(iii)其中插入有孔的细胞进行实施。该方法通常使用人工两亲性层如人工三嵌段共聚物层进行实施。该层除了孔之外还可以包含其它跨膜蛋白和/或膜内蛋白以及其他分子。下面讨论合适的装置和条件。本发明的方法通常在体外进行。
偶联
每个分析物可以使用任何已知的方法偶联到膜上。使用一个或多个锚将每个分析物偶联至膜。
偶联意味着使用一个或多个锚将分析物有意地与膜连接。该方法优选包括使用一个或多个锚将第一分析物特异性偶联到膜上。该方法优选包括使用一个或多个锚将第二分析物特异性偶联到膜上。第一分析物和/或第二分析物优选不通过非特异性相互作用与膜偶联。
每个锚包含偶联(或结合)至适配体的基团和偶联(或结合)至膜的基团。每个锚可以共价地偶联(或结合)到适配体和/或膜。
每个分析物可以使用任何数量的锚,例如2,3,4个或更多个锚偶联到膜。例如,一个分析物可以使用两个锚偶联到膜,其中每个锚单独偶联(或结合)到分析物和膜。
所述一个或多个锚可以包含一个或多个多核苷酸结合蛋白。每个锚可以包含一个或多个多核苷酸结合蛋白。多核苷酸结合蛋白可以是下面讨论的任何一种。
在一些实施方案中,使用在第一分析物解偶联后留在膜中的一个或多个锚将第二分析物偶联到膜。或者,使用其它(或分开的)一个或多个锚将第二分析物偶联至膜。用于偶联第二分析物的一个或多个锚可以与用于偶联第一分析物的锚是相同类型,或者可以是不同类型的锚。这将在下面更详细地讨论。
如果膜是两亲性层,例如三嵌段共聚物膜,则一个或多个锚优选包含存在于膜中的多肽锚和/或存在于膜中的疏水锚。疏水锚优选是脂质,脂肪酸,固醇,碳纳米管,多肽,蛋白质或氨基酸,例如胆固醇,棕榈酸酯或生育酚。在优选实施例中,所述一个或多个锚不是检测器。
膜的组分,例如两亲性分子,共聚物或脂质,可以被化学修饰或官能化以形成一个或多个锚。以下更详细地讨论合适的化学修饰和官能化膜的组分的合适方式的实例。任何比例,例如至少0.01%,至少0.1%,至少1%,至少10%,至少25%,至少50%或100%的膜组分可以官能化。
第一和/或第二分析物可以直接偶联到膜。用于将第一分析物和/或第二分析物偶联至膜的一个或多个锚优选包含接头。所述一个或多个锚可包含一个或多个,例如2,3,4或更多个接头。一个接头可以用于将多于一个,例如2,3,4或更多个分析物偶联到膜上。
优选的接头包括但不限于聚合物,例如多核苷酸,聚乙二醇(PEG),多糖和多肽。这些连接体可以是直链、支链或环状的。例如,接头可以是环状多核苷酸。如果分析物本身是多核昔酸,其可以与环状多核苷酸接头上的互补序列杂交。
所述一个或多个锚或一个或多个接头可以包括可以被切割或分解的组分,例如限制位点或光不稳定基团。
官能化接头和它们可以偶联分子的方式是本领域已知的。例如,用马来酰亚胺基团官能化的接头将与蛋白质中的半胱氨酸残基反应并连接。在本发明的上下文中,蛋白质可以存在于膜中,可以是分析物本身或可以用于偶联(或结合)到分析物。这将在下面更详细地讨论。
可以使用“锁和钥匙”构造来避免分析物的交联。每个接头仅一端可以一起反应以形成更长的接头,并且接头的其他端各自分别与分析物或膜反应。这样的接头在国际申请号PCT/GBl0/000132(公开为WO 2010/086602)中描述。
接头优选在下文讨论的测序实施方案中使用。如果多核昔酸分析物直接永久偶联至膜,意义在于,其在与检测器相互作用时不会解偶联(即在步骤(b)或(e)中不解偶联),则一些序列数据将由于膜和检测器之间的距离导致测序不能继续进行到多核苷酸的末端而丢失。如果使用接头,则可以将多核苷酸分析物进行到完成。
偶联可以是永久的或稳定的。换句话说,偶联可以使得分析物在与检测器相互作用时保持偶联到膜(即在步骤(b)或(e)中不解偶联)。
偶联可以是暂时的。换句话说,偶联可以使得分析物在与检测器相互作用时从膜解偶联(即可以在步骤(b)或(e)中解偶联)。通常,第一分析物的一些保持偶联到膜,例如,因为它们不与检测器相互作用,因此需要在步骤(c)中解偶联。对于某些应用,例如适体器检测和多核苷酸测序,优选暂时性质的偶联。如果永久或稳定的接头直接连接到多核昔酸的5′或3′末端,并且接头短于膜和跨膜孔通道之间的距离,则一些序列数据将丢失,因为测序不能继续进行到多核苷酸的末端。如果偶联是暂时的,则当偶联的末端随机变得不含膜时,则多核苷酸可以进行到完成。形成永久/稳定或暂时连接的化学基团在下面更详细地讨论。分析物可以使用胆固醇或脂肪酰基链暂时地偶联至两亲性层或三嵌段共聚物膜。可以使用具有6至30个碳原子长度的任何脂肪酰基链,例如十六烷酸。
在优选的实施方案中,多核苷酸分析物例如核酸偶联到两亲性层,例如三嵌段共聚物膜或脂质双层。之前已经用各种不同的系链策略进行了核酸与合成脂质双层的偶联。这些结果总结在下表1中。
表1
合成的多核昔酸分析物和/或接头可以在合成反应中使用修饰的亚磷酰胺来官能化,其易于与直接加入的合适的锚基团如胆固醇,生育酚,棕榈酸酯,硫醇,脂质和生物素基团兼容。这些不同的连接化学基团提供了用于连接到多核苷酸的一组选择。每个不同的修饰基团以略微不同的方式偶联多核昔酸,并且偶联不总是永久性的,因此对分析物到膜提供了不同停留时间。上面讨论了暂时性偶联的优点。
多核苷酸到接头或到功能化膜的偶联也可以通过许多其它方式实现,条件是可以将互补反应性基团或锚定基团添加到多核苷酸。先前已经报道了向多核苷酸的任一端添加反应性基团。可使用T4多核苷酸激酶和ATPγS将硫醇基团添加到ssDNA或dsDNA的5′端(Grant,GP和PZQin(2007).″A facile method for attaching nitroxide spin labelsat the 5′terminus of nucleic acids.″Nucleic Acids Res 35(10):e77)。使用T4多核苷酸激酶和γ-[2-叠氮基乙基]-ATP或γ-[6-叠氮基己基]-ATP将叠氮基添加到ssDNA或dsDNA的5′-磷酸。使用硫醇或Click化学,可以将含有硫醇、碘乙酰胺OPSS或马来酰亚胺基团(对硫醇具有反应性)或DIBO(二苯并环辛炔)或炔基(对叠氮化物具有反应性)的系链共价连接到分析物。可以使用末端转移酶添加更多样化学基团例如生物素、硫醇和荧光团的选择,以将修饰的寡核昔酸纳入ssDNA的3′(Kumar,A.,P.Tchen,等(1988).″Nonradioactive labeling of synthetic oligonucleotide probes with terminaldeoxynucleotidyl transferase.″Anal Biochem 169(2):376-82)。链霉亲和素/生物素和/或链霉亲和素/脱硫生物素偶联可用于任何其它分析物。下面的实施例描述了如何使用链霉亲和素/生物素和链霉亲和素/脱硫生物素将多核苷酸偶联到膜上。也可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸酯)通过末端转移酶将锚直接添加到多核苷酶。
所述一个或多个锚优选通过杂交将第一分析物和/或第二分析物偶联到膜。杂交可以存在于一个或多个锚的任何部分中,例如存在于一个或多个锚和分析物之间,存在于一个或多个锚内,或存在于一个或多个锚和膜之间。在一个或多个锚中的杂交允许以如上所述的暂时方式偶联。例如,接头可以包含两个或更多个多核苷酸,例如3,4或5个多核苷酸,它们杂交在一起。如果第一分析物和/或第二分析物本身是多核苷酸,则所述一个或多个锚可以与第一多核苷酸分析物和/或第二多核苷酸分析物杂交。所述一个或多个锚可以直接与多核苷酸分析物杂交,直接与Y适配体和/或连接到多核苷酸分析物的前导序列杂交,或直接与多核苷酸分析物连接的发夹环适配体杂交(如下文更详细讨论的)。或者,所述一个或多个锚可以与一个或多个,例如2或3个中间多核苷酸(或“夹板(splint)”)杂交,其中所述中间多核苷酸杂交到多核苷酸分析物,杂交到Y适配体和/或连接到多核苷酸分析物的前导序列,或杂交到与多核昔酸分析物连接的发夹环适配体上(如下面更详细讨论的)。
所述一个或多个锚可以包括单链或双链多核苷酸。锚的一部分可以连接到单链或双链多核苷酸分析物。已经报道了使用T4RNA连接酶I连接ssDNA短片段(Troutt,A.B.,M.G.McHeyzer-Williams,等人(1992).″Ligation-anchored PCR:a simpleamplification technique with single-sided specificity.″Proc Natl Acad Sci USA89(20):9823-5)。或者,单链或双链多核苷酸可以连接到双链多核昔酸分析物,然后通过热或化学变性分离两条链。对于双链多核苷酸,可以向双链的一个或两个末端添加一段单链多核苷酸,或者向一个或两个末端添加双链多核昔酸。对于将单链多核苷酸添加到双链多核苷酸,可以使用T4RNA连接酶I实现,用于与单链多核苷酸的其他区域连接。对于将双链多核苷酸添加到双链多核苷酸分析物,连接可以用分别在分析物和添加的多核苷酸上的互补的3′dA/dT尾部“平端化(blunt-ended)”(对于许多样品制备应用,常规这样进行,以防止多联体或二聚体形成),或使用通过分析物的限制性消化产生的“粘性末端”以及连接相容的适配体“平端化”。然后,当双链体被变性,如果单链多核苷酸用于连接,则每条单链将具有5′或3′修饰,或者如果双链多核苷酸用于连接,则每条单链将具有在5′末端,3′末端或这两个末端的修饰。
如果多核苷酸分析物是合成的链,则可以在多核苷酸的化学合成期间加入一个或多个锚。例如,可以使用具有与其连接的反应性基团的引物合成多核苷酸。
腺苷酸化多核苷酸是连接反应中的中间体,其中腺苷单磷酸连接到多核苷酸的5′-磷酸。各种试剂盒可用于产生该中间体,例如来自NEB的5′DNA腺苷酸化试剂盒。通过在反应中用ATP代替修饰的核苷三磷酸,然后向多核昔酸的5′添加反应性基团(例如硫醇,胺,生物素,叠氮化物等)是可行的。也可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸酯)的5′DNA腺苷酸化试剂盒将锚直接添加到多核苷酸。
用于扩增基因组DNA的片段的常见技术是使用聚合酶链反应(PCR)。这里,使用两个合成的寡核苷酸引物,可以产生相同的DNA片段的多个拷贝,其中对于每个拷贝,双链中每条链的5′将是合成的多核苷酸。可以通过使用聚合酶将单个或多个核苷酸加入单链或双链DNA的3′端。可以使用的聚合酶的实例包括但不限于末端转移酶,Klenow和大肠杆菌Poly(A)聚合酶。通过在反应中用ATP代替修饰的核苷三磷酸,然后可以将锚例如胆固醇,硫醇,胺,叠氮化物,生物素或脂质掺入双链多核苷酸中。因此,扩增的多核苷酸的每个拷贝将含有锚。
理想地,分析物偶联至膜而不需要官能化所述分析物。这可以通过将一个或多个锚如多核苷酸结合蛋白或化学基团偶联至膜并允许一个或多个锚与分析物相互作用或通过使膜官能化来实现。所述一个或多个锚可以通过本文所述的任何方法偶联至膜。特别地,所述一个或多个锚可以包含一个或多个接头,例如马来酰亚胺官能化的接头。
在该实施方案中,分析物通常是RNA,DNA,PNA,TNA或LNA,并且可以是双链或单链的。该实施方案特别适合于基因组DNA分析物。
一个或多个锚可以包括下述任何基团:所述基团与单链或双链多核苷酸、分析物内的特定核苷酸序列或分析物内修饰的核苷酸模式,或存在于多核苷酸上的任何其它配体偶联、结合或相互作用。
用于锚中的合适的结合蛋白包括但不限于大肠杆菌单链结合蛋白,P5单链结合蛋白,T4gp32单链结合蛋白,TOPO V dsDNA结合区,人组蛋白,大肠杆菌HU DNA结合蛋白和其它古细菌、原核或真核的单链或双链多核苷酸(或核酸)结合蛋白,包括下面列出的那些。
特定核苷酸序列可以是由转录因子、核糖体、内切核酸酶、拓扑异构酶或复制起始因子识别的序列。修饰的核苷酸的模式可以是甲基化或损伤模式。
所述一个或多个锚可以包括与多核苷酸分析物偶联、结合、插入或相互作用的任何基团。所述基团可以通过静电、氢键或范德华相互作用而插入多核苷酸分析物或与多核苷酸分析物相互作用。这些基团包括赖氨酸单体、聚赖氨酸(其将与ssDNA或dsDNA相互作用)、溴化乙锭(其将插入dsDNA)、通用碱基或通用核苷酸(其可与任何多核苷酸分析物杂交)和锇复合物(其与甲基化碱基反应)。因此,多核苷酸分析物可以使用连接到膜上的一个或多个通用核苷酸与膜偶联。每个通用核苷酸可以使用一个或多个接头偶联至膜。通用核苷酸优选包含以下核昔碱基之一:次黄嘌呤,4-硝基吲哚,5-硝基吲哚,6-硝基吲哚,甲酰基吲哚,3-硝基吡咯,硝基咪唑,4-硝基吡唑,4-硝基苯并咪唑,5-硝基吲唑,4-氨基苯并咪唑或苯基(C6-芳香环)。通用核苷酸更优选包含以下核苷之一:2′-脱氧肌昔,肌昔,7-脱氮-2′-脱氧肌昔,7-脱氮肌苷,2-氮杂-脱氧肌苷,2-氮杂-肌苷,2-O′-甲基肌昔,4-硝基吲哚2′-脱氧核糖核苷,4-硝基吲哚核糖核苷,5-硝基吲哚2′-脱氧核糖核苷,5-硝基吲哚核糖核苷,6-硝基吲哚2′-脱氧核糖核苷,6-硝基吲哚核糖核苷,3-硝基吡咯2′-脱氧核糖核苷,3-硝基吡咯核糖核苷,次黄嘌呤的无环糖类似物,硝基咪唑2′-脱氧核糖核苷,硝基咪唑核糖核苷,4-硝基吡唑2′-脱氧核糖核苷,4-硝基吡唑核糖核苷,4-硝基苯并咪唑2′-脱氧核糖核苷,4-硝基苯并咪唑核糖核苷,5-硝基吲唑2′-脱氧核糖核苷,5-硝基吲唑脱氧核糖核苷,4-氨基苯并咪唑2′-脱氧核糖核苷,4-氨基苯并咪唑核糖核苷,苯基C-核糖核苷,苯基C-2′-脱氧核糖核苷,2′-脱氧鸟氨酸(2′-deoxynebularine),2′-脱氧异鸟嘌呤核苷,K-2′-脱氧核糖,P-2′脱氧核糖和吡咯烷。通用核苷酸更优选包含2′-脱氧肌苷。通用核苷酸更优选为IMP或dIMP。通用核苷酸最优选为dPMP(2′-脱氧-β-核苷单磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤单磷酸)。
所述一个或多个锚可以通过Hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向的Hoogsteen氢键(其中一个核碱基相对于另一个核碱基旋转180°)偶联(或结合)多核苷酸分析物。例如,所述一个或多个锚可以包含一个或多个核苷酸,一个或多个寡核苷酸或一个或多个多核苷酸,其与多核苷酸分析物形成Hoogsteen氢键或反向Hoogsteen氢键。这些类型的氢键允许第三多核苷酸链缠绕在双链螺旋上并形成三链体。所述一个或多个锚可以通过与双链体形成三链体而偶联(或结合)到双链多核苷酸分析物。
在该实施方案中,至少1%,至少10%,至少25%,至少50%或100%的膜组分可以被官能化。
当所述一个或多个锚包含蛋白质时,它们能够直接锚定到膜中,而不进行进一步的官能化,例如如果它已经具有与膜相容的外部疏水区域。此类蛋白质的实例包括但不限于跨膜蛋白,膜内蛋白和膜蛋白。或者,蛋白质可以用与膜兼容的基因融合的疏水区表达。这种疏水性蛋白质区域是本领域已知的。
所述一个或多个锚优选在与膜接触之前与分析物混合,但是所述一个或多个锚可以与膜接触并随后与分析物接触。
在另一方面,分析物可以使用上述方法进行官能化,使得其可以被特异性结合基团识别。具体地,分析物可以用配体如生物素(用于结合链霉亲和素)、直链淀粉(用于结合麦芽糖结合蛋白或融合蛋白)、Ni-NTA(用于结合聚组氨酸或聚组氨酸标记的蛋白)或肽(例如抗原)官能化。
根据优选的实施方案,当分析物连接到优先旋入孔中的前导序列时,一个或多个锚可以用于将多核苷酸分析物偶联到膜上。前导序列在下面更详细地讨论。优选地,多核昔酸分析物结合(例如连接)到优先旋入孔中的前导序列。这种前导序列可以包含均聚多核苷酸或无碱基区。前导序列通常设计为直接或经由一个或多个中间多核苷酸(或夹板)与一个或多个锚杂交。在这种情况下,一个或多个锚通常包含与前导序列中的序列互补或与一个或多个中间多核昔酸(或夹板)中的序列互补的多核苷酸序列。在这种情况下,一个或多个夹板通常包含与前导序列中的序列互补的多核苷酸序列。
上文讨论的用于将多核苷酸偶联至膜,例如两亲性层的任何方法当然可以应用于其它分析物和膜组合。在一些实施方案中,氨基酸、肽、多肽或蛋白质偶联至两亲性层,例如三嵌段共聚物层或脂质双层。对于这类分析物的化学连接可以使用各种方法。化学连接中使用的分子的实例是EDC(1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)。还可以使用市售试剂盒(Thermo Pierce,Part No.22980)将反应性基团加入到多核苷酸的5′端。合适的方法包括但不限于,使用组氨酸残基和Ni-NTA进行的暂时亲和性连接,以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸进行的更强的共价连接。
检测器
步骤(b)和(e)包括使第一分析物和第二分析物分别与膜中存在的检测器相互作用,从而分别确定第一分析物和第二分析物的存在、不存在或一个或多个特征。每个步骤中的检测器可以不同。每个步骤中的检测器通常是相同的。例如,优选允许第一和第二分析物与跨膜孔,优选相同的跨膜孔相互作用。
第一分析物和/或第二分析物的偶联对于分析物与检测器相互作用不是必需的。该偶联允许超低浓度分析物传递到检测器。
检测器可以是响应第一和/或第二分析物的存在、不存在或一个或多个特征而提供可读信号的任何结构。检测器可以是响应第一和/或第二分析物的存在或不存在而提供可读信号的任何结构。合适的检测器是本领域已知的。它们包括但不限于跨膜孔,隧道电极,分类电极(classis electrode),纳米管,FET(场效应晶体管)和光学检测器,例如原子力显微镜(AFM)和扫描隧道显微镜(STM)。
可以进行各种不同类型的测量。这包括但不限于:电测量和光学测量。可能的电测量包括:电流测量,阻抗测量,隧道测量(Ivanov AP等人,Nano Lett.2011 Jan 12;11(1):279-85)和FET测量(国际申请WO 2005/124888)。光学测量可以与电测量结合(Soni GV等人,Rev Sci Instrum.2010Jan;81(1):014301)。所述测量可以是跨膜电流测量,例如流过孔的离子电流测量。
可以使用如StoddartD等人,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72和国际申请WO 2000/28312中描述的标准单通道记录设备进行电测量。或者,可以使用多通道系统进行电测量,例如如国际申请WO 2009/077734和国际申请WO 2011/067559中所述。
该方法优选在跨膜施加电位的情况下进行。施加的电位可以是电压电位。或者,施加的电位可以是化学电位。其一个实例是使用跨膜,例如两亲性层的盐梯度。盐梯度在Holden等人,J Am Chem Soc。2007Jul 11;129(27):8650-5中公开。在一些情况下,随着多核苷酸分析物相对于孔移动,穿过检测器(或孔)的电流被用于估计或确定多核苷酸的序列。这是链测序。
在其他优选实施方案中,检测器不使用荧光手段检测分析物。
检测器优选包含跨膜孔。跨膜孔是在一定程度上穿过膜的结构。它允许由施加的电位驱动水合离子流过膜或在膜内流动。跨膜孔典型地穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不用必须穿过膜。它可以在一端封闭。例如,孔可以是膜一一水合离子可以沿着其流动或可以流入其中——中的阱,间隙,通道,沟槽或狭缝。
如果检测器是孔,步骤(b)优选包括(i)允许第一分析物与检测器相互作用,和(ii)在相互作用期间测量穿过检测器的电流,由此确定第一分析物的存在、不存在或一个或多个特征,和/或步骤(e)包括(i)允许第二分析物与检测器相互作用,和(ii)在相互作用期间测量穿过检测器的电流,由此确定第二分析物存在、不存在或一个或多个特征。
如果电流以对分析物特异的方式(即,如果检测到与分析物相关的流经孔的特征电流)流过孔,则存在第一或第二分析物。如果电流不以对分析物特异的方式流过孔,则不存在第一或第二分析物。类似地,可以使用在相互作用期间流过孔的电流来确定分析物的特征。
因此,本发明涉及分析物的纳米孔感测。本发明可以用于基于分析物对通过孔的电流的不同影响来区分相似结构的分析物。本发明还可以用于测量样品中特定分析物的浓度。
本发明还可以用于在体感测(bulk sensing)应用中使用许多或数千个孔的传感器中。
在第一或第二分析物与孔之间的相互作用期间,分析物以对该分析物特异的方式影响流过孔的电流。例如,特定分析物将在特定平均时间段和特定程度上减少流过孔的电流。换句话说,流过孔的电流对于特定分析物是不同的。可以进行对照实验以确定特定分析物对流过孔的电流的影响。然后可以将对测试样品实施本发明方法获得的结果与从这种对照实验得到的结果进行比较,以鉴定样品中的特定分析物,确定样品中是否存在特定分析物或确定各分析物的特征。以代表特定分析物的方式影响流过孔的电流的频率可以用于确定样品中分析物的浓度。
任何跨膜孔可用于本发明。孔可以是生物或人造的。合适的孔包括但不限于蛋白质孔,多核苷酸孔和固态孔。孔可以是DNA折纸孔(origami pore)(Langecker等人,Science,2012;338:932-936)。
跨膜孔优选是跨膜蛋白孔。跨膜蛋白孔是允许水合离子如分析物从膜的一侧流到膜的另一侧的多肽或多肽的集合。在本发明中,跨膜蛋白孔能够形成允许由施加电位驱动水合离子从膜的一侧流向另一侧的孔。跨膜蛋白质孔优选允许分析物例如核苷酸从膜(例如三嵌段共聚物膜)的一侧流向另一侧。跨膜蛋白孔允许多核苷酸,例如DNA或RNA,移动穿过所述孔。
跨膜蛋白孔可以是单体或低聚体。孔优选由几个重复亚基组成,例如至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个,至少11个,至少12个,至少13个或至少14个亚基,例如3,4,5,6,7,8,9,10,11,12,13或14个亚基。孔优选是六聚体,七聚体,八聚体或九聚体孔。孔可以是同源低聚物或异源低聚物。
跨膜蛋白孔通常包括离子可以流过的桶或通道。孔的亚基通常围绕中心轴,并且向跨膜β桶或通道或跨膜α-螺旋束或通道贡献链。
跨膜蛋白孔的桶或通道通常包含促进与分析物相互作用的氨基酸,例如核苷酸,多核苷酸或核酸。这些氨基酸优选位于桶或通道的收缩部附近。跨膜蛋白孔通常包含一个或多个带正电荷的氨基酸,例如精氨酸,赖氨酸或组氨酸,或芳族氨基酸,例如酪氨酸或色氨酸。这些氨基酸通常促进孔和核苷酸、多核苷酸或核酸之间的相互作用。
根据本发明使用的跨膜蛋白孔可以衍生自β桶孔或α-螺旋束孔。β-桶孔包括由β-链形成的桶或通道。合适的β-桶孔包括但不限于β-毒素,例如α-溶血素,炭疽毒素和杀白细胞素,以及细菌的外膜蛋白/孔蛋白,例如耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),例如MspA,MspB,MspC或MspD,胞溶素,外膜孔蛋白F(OmpF),外膜孔蛋白G(OmpG),外膜磷脂酶A和奈瑟氏菌自转运脂蛋白(NalP)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,例如WZA和ClyA毒素。跨膜孔可以衍生自胞溶素。在国际申请号PCT/GB2013/050667(公开为WO 2013/153359)中公开了衍生自胞溶素的合适的孔。跨膜孔可以衍生自Msp或α-溶血素(α-HL)。
跨膜蛋白孔优选衍生自Msp,优选MspA。这种孔将是低聚的,并且通常包含7,8,9或10个衍生自Msp的单体。孔可以是衍生自的Msp的同源低聚孔,包含相同的单体。或者,孔可以是衍生自Msp的异源低聚孔,包含至少一种不同于其它单体的单体。优选地,所述孔源自MspA或其同源物或旁系物。
衍生自Msp的单体通常包含SEQ ID NO:2或其变体所示的序列。SEQ ID NO:2是MspA单体的MS-(B1)8突变体。其包括以下突变:D90N,D91N,D93N,D118R,D134R和E139K。SEQID NO:2的变体是具有这样的氨基酸序列的多肽:从SEQ ID NO:2的氨基酸序列变化而来并且保留其形成孔的能力。变体形成孔的能力可以使用本领域已知的任何方法测定。例如,变体可以与其它合适的亚基一起插入两亲性层中,并且可以确定其低聚以形成孔的能力。用于将亚基插入膜例如两亲性层中的方法是本领域已知的。例如,亚基可以以纯化形式悬浮在含有三嵌段共聚物膜的溶液中,使得它扩散到膜并通过结合到膜并组装成功能状态而插入。或者,亚基可以使用M.A.Holden,H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503和国际申请No.PCT/GB2006/001057(公开号WO 2006/100484)中所述的“拾取和放置”方法直接插入膜中。
在SEQ ID NO:2的氨基酸序列的整个长度上,基于氨基酸同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸同一性,所述变体可以是至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,且更优选至少95%,97%或99%在整个序列上与SEQ ID NO:2的氨基酸序列同源。在100个或更多个,例如125,150,175或200个或更多个连续氨基酸的片段(stretch)上,可以具有至少80%,例如至少85%,90%或95%的氨基酸同一性(“严格同源性(hardhomology)”)。
可用本领域的标准方法测定同源性。例如,UWGCG包提供了用于计算同源性的BESTFIT程序,例如使用其默认设置(Devereux等人(1984)Nucleic Acids Research 12,p387-395)。可用PILEUP和BLAST算法计算同源性或比对(line up)序列(例如鉴定等效残基或相应序列(通常基于其默认设置)),例如Altschul S.F.(1993)J Mol Evol 36:290-300;Altschul,S.F等人(1990)J Mol Biol 215:403-10中所述。用于执行BLAST分析的软件可通过国家生物技术信息中心(http://www,ncbi.nlm.nih.gov/)公开获得。
SEQ ID NO:2是MspA单体的MS-(B1)8突变体。与MspA相比,该变体可以包含MspB、C或D单体中的任何突变。MspB、C和D的成熟形式示于SEQ ID NO:5至7中。特别地,所述变体可以包含存在于MspB:A138P中的以下取代。所述变体可以包含存在于MspC中的一个或多个下列取代:A96G,N102E和A138P。所述变体可包含存在于MspD中的一个或多个以下突变:G1,L2V,E5Q,L8V,D13G,W21A,D22E,K47T,I49H,I68V,D91G,A96Q,N102D,S103T,V104I,S136K和G141A的缺失。所述变体可以包含来自Msp B、C和D中的一个或多个突变和取代的组合。变体优选包含突变L88N。SEQ ID NO:2的变体除了MS-B1的所有突变之外还具有突变L88N,并称为MS-(B2)8。本发明中使用的孔优选为MS-(B2)8。除了MS-B1的所有突变之外,SEQ ID NO:2的变体具有突变G75S/G77S/L88N/Q126R,并称为MS-B2C。本发明中使用的孔优选为MS-(B2)8或MS-(B2C)8。
除了上文论述的那些之外,可以对SEQ ID NO:2的氨基酸序列进行氨基酸取代,例如高达1,2,3,4,5,10,20或30个取代。保守取代用具有相似化学结构、相似化学性质或相似侧链体积的其他氨基酸替换氨基酸。引入的氨基酸可以具有与它们替代的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。或者,保守取代可以引入另一个芳香族或脂肪族氨基酸代替之前存在的芳香族或脂肪族氨基酸。
SEQ ID NO:2的氨基酸序列的一个或多个氨基酸残基可以另外从上述多肽中缺失。可以缺失多至1,2,3,4,5,10,20或30个残基或更多个残基。
变体可以包括SEQ ID NO:2的片段。这类片段保留成孔活性。片段的长度可以为至少50,100,150或200个氨基酸。这样的片段可以用于产生孔。片段优选包含SEQ ID NO:2的孔形成结构域。片段必须包括SEQ IDNO:2的残基88,90,91,105,118和134中的一个。通常,片段包括SEQ ID NO:2的所有残基88,90,91,105,118和134。
一个或多个氨基酸可以替代地或另外地添加到上述多肽。可以在SEQ ID NO:2或其多肽变体或其片段的氨基酸序列的氨基末端或羧基末端提供延伸。延伸可以非常短,例如1至10个氨基酸长度。或者,延伸可以较长,例如高达50或100个氨基酸。载体蛋白可以与本发明的氨基酸序列融合。其它融合蛋白在下面更详细地论述。
如上所述,变体是具有下述氨基酸序列的多肽:从SEQ ID NO:2的氨基酸序列变化而来并且保留其形成孔的能力。变体通常包含负责形成孔的SEQ ID NO:2的区域。含有β桶状体的Msp的孔形成能力由每个亚基中的β片体提供。SEQ ID NO:2的变体通常包含SEQ IDNO:2中形成β片体的区域。可以对SEQ ID NO:2的形成β片体的区域进行一个或多个修饰,只要所得变体保留其形成孔的能力即可。SEQ ID NO:2的变体优选包括在其α螺旋和/或环区域内的一个或多个修饰,例如取代、添加或缺失。
衍生自Msp的单体含有一个或多个特异性修饰以便于对核苷酸的鉴别。衍生自Msp的单体也可以含有其它非特异性修饰,只要它们不干扰孔形成即可。许多非特异性侧链修饰是本领域已知的,并且可以对衍生自Msp的单体的侧链进行。这样的修饰包括例如通过与醛反应、然后用NaBH4还原而进行的氨基酸的还原性烷基化,用甲基乙酰亚胺酯(methylacetimidate)进行的脒基化,或用乙酸酐进行的酰化。
衍生自Msp的单体可以使用本领域中已知的标准方法来制备。衍生自Msp的单体可以通过合成或重组方式制成。例如,所述孔可通过体外翻译和转录(IVTT)合成。制造孔的合适的方法在国际申请No.PCT/GB09/001690(公开号为WO 2010/004273),PCT/GB09/001679(公开号为WO 2010/004265)或PCT/GB10/000133(公开号为WO 2010/086603)中有论述。论述了将孔插入膜的方法。
跨膜蛋白孔也优选衍生自α-溶血素(α-HL)。野生型α-HL孔由七个相同的单体或亚基形成(即它是七聚体)。α-溶血素-NN的一个单体或亚基的序列显示在SEQ ID NO:4中。
在一些实施方案中,跨膜蛋白孔是经化学修饰的。所述孔可以任何方式在任何位点进行化学修饰。所述跨膜蛋白孔优选通过下述进行化学修饰:将分子连接到一个或多个半胱氨酸(半胱氨酸连接),将分子连接到一个或多个赖氨酸,将分子连接到一个或多个非天然氨基酸,表位的酶修饰或末端的修饰。适用于进行这些修饰的方法是本领域已知的。所述跨膜蛋白孔可通过连接任何分子被化学修饰。例如,所述孔可以通过连接染料或荧光团被化学修饰。
孔中的任何数量的单体可以是化学修饰的。一个或多个,例如2,3,4,5,6,7,8,9或10个单体优选如上所述进行化学修饰。
半胱氨酸残基的反应性可以通过修饰相邻残基来增强。例如,侧翼精氨酸、组氨酸或赖氨酸残基的碱基将半胱氨酸硫醇基团的pKa变为更具反应性的S-基团的pKa。半胱氨酸残基的反应性可以用硫醇保护基团如dTNB保护。所述保护基团可以在接头连接之前与孔的一个或多个半胱氨酸残基反应。
所述分子(使用其对孔进行化学修饰)可以直接连接到所述孔或如国际申请No.PCT/GB09/001690(公开号WO 2010/004273),PCT/GB09/001679(公开号WO 2010/004265)或PCT/GB10/000133(公开号WO 2010/086603)中所公开通过接头连接到所述孔。
本文所述的任何蛋白质,例如跨膜蛋白孔可以使用本领域已知的标准方法制备。编码孔或构建体的多核苷酸序列可以使用本领域的标准方法衍生和复制。编码孔或构建体的多核苷酸序列可以使用本领域标准技术在细菌宿主细胞中表达。孔可以通过在细胞中由重组表达载体的多肽的原位表达而制备。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法在Sambrook,J.和Russell,D.(2001).Molecular Cloning:A LaboratoryManual,第3版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY中有描述。
孔可以从产生蛋白质的生物体通过任何蛋白质液相色谱系统纯化后,或在重组表达后大规模生产。典型的蛋白质液相色谱系统包括FPLC系统、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic系统和Gilson HPLC系统。
解偶联
本发明的方法包括将第一分析物与膜解偶联。本发明的方法可以包括将第二分析物与膜解偶联,例如如研究三个或更多个分析物时。
步骤(c)(即第一分析物的解偶联)可以在步骤(d)之前(即在将第二分析物偶联到膜之前)进行。步骤(d)可以在步骤(c)之前进行。如果第二分析物在第一分析物解偶联之前偶联到膜,步骤(c)优选包括从膜选择性地解偶联第一分析物(即,使第一分析物而不是第二分析物与膜解偶联)。本领域技术人员可以设计在其中实现选择性解偶联的系统。步骤(c)和(d)可以同时进行。这将在下面更详细地讨论。
在步骤(c)中,优选至少10%的第一分析物与膜解偶联。例如,第一分析物的至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或至少95%可以从膜解偶联。优选地,所有第一分析物与膜解偶联。可以使用检测器确定从膜解偶联的第一分析物的量。这在实施例中公开。
第一分析物可以使用任何已知的方法从膜上解偶联。第一分析物优选不使用检测器例如跨膜孔在步骤(c)中与膜解偶联。第一分析物优选不使用电压或施加电位与膜解偶联。
步骤(c)优选包括通过从膜上去除一个或多个锚而从膜上解偶联第一分析物。在这样的实施方案中,第二分析物使用其它(或单独的)一个或多个锚偶联到膜。用于偶联第二分析物的一个或多个锚可以与用于偶联第一分析物的锚是相同类型或不同类型的锚。
步骤(c)更优选包括使所述一个或多个锚与试剂接触,所述试剂对所述一个或多个锚具有比一个或多个锚对膜更高的亲和力。用于竞争性结合或免疫放射测定以确定分子的特异性结合能力的多种方案是本领域熟知的(参见例如Maddox等人,J.Exp.Med.158,1211-1226,1993)。该试剂从膜上去除一个或多个锚,从而使第一分析物解偶联。所述试剂优选是糖。可以使用对所述一个或多个锚具有比一个或多个锚对膜更高的亲和力的任何糖。糖可以是如下所述的环糊精或其衍生物。
所述一个或多个锚优选包含疏水锚,例如胆固醇,并且试剂优选是环糊精或其衍生物或脂质。环糊精或其衍生物可以是Eliseev,A.V.,和Schneider,H-J.(1994)J.Am.Chem.Soc.116,6081-6088中公开的任意一个。该试剂更优选为七-6-氨基-β-环糊精(am7-βCD),6-单脱氧-6-单氨基-β-环糊精(am1-βCD),七-(6-脱氧-6-胍基)环糊精(gu7-βCD),七(2,3,6-三-O-甲基)-β-环糊精或(2-羟丙基)-β-环糊精。可以使用本文公开的任何脂质。
所述一个或多个锚优选包含链霉亲和素,生物素或脱硫生物素,并且所述试剂优选是生物素,脱硫生物素或链霉亲和素。生物素和脱硫生物素二者结合链霉亲和素的亲和力比链霉亲和素结合到膜上的亲和力更高。生物素对链霉亲和素比对脱硫生物素具有更强的亲和力。因此,可以使用生物素或脱硫生物素从膜上去除包含链霉亲和素的锚,这取决于锚的组成。如实施例5和图7所示。
所述一个或多个锚优选包含蛋白质,并且所述试剂优选是特异性结合所述蛋白质的抗体或其片段。如果抗体以优先或高亲和力结合蛋白质,但不结合或者仅以低亲和力结合其它蛋白质或不同蛋白质,则抗体特异性结合该蛋白质。如果抗体以1×10-6M或更小,更优选1×10-7M或更小,5×10-8M或更小,更优选1×10-8M或更小或更优选5x 10-9M或更小的Kd结合,则抗体以优先或高的亲和力结合。如果抗体以1×10-6M或更高,更优选1×10-5M或更高,更优选1×10-4M或更高,更优选1×10-3M或更高,更优选为1×10-2M或更高的Kd结合,则抗体以低亲和力结合。任何方法可以用于检测结合或特异性结合。定量测量抗体与蛋白质的结合的方法是本领域熟知的。抗体可以是单克隆抗体或多克隆抗体。合适的抗体片段包括但不限于Fv,F(ab′)和F(ab’)2片段,以及单链抗体。此外,抗体或其片段可以是嵌合抗体或其片段,CDR接枝抗体或其片段,或人源化抗体或其片段。
步骤(c)优选包括使一个或多个锚与使其偶联至膜的能力降低的试剂接触。例如,试剂可以干扰一个或多个锚的结构和/或疏水性,从而降低它们偶联到膜的能力。所述一个或多个锚优选包含胆固醇,并且试剂优选为胆固醇脱氢酶。所述一个或多个锚优选包含脂质,并且试剂优选是磷脂酶。所述一个或多个锚优选包含蛋白质,并且试剂优选是蛋白酶或脲。合适的锚和试剂的其它组合对于本领域技术人员是清楚的。
步骤(c)优选包括通过将第一分析物与一个或多个锚分离而从膜上解偶联第一分析物。这可以以任何方式完成。例如,接头可以在包含接头的一个或多个锚中被切下。该实施方案特别适用于涉及通过杂交连接的一个或多个锚。这种锚在上文已讨论。
步骤(c)更优选包括通过使第一分析物和一个或多个锚与试剂接触,所述试剂与第一分析物竞争结合到一个或多个锚,从膜上解偶联第一分析物。用于测定和测量竞争性结合的方法是本领域已知的。试剂优选是与第一分析物竞争杂交到一个或多个锚的多核苷酸。例如,如果使用涉及杂交的一个或多个锚将第一分析物偶联到膜上,则可以通过使一个或多个锚与也与杂交位点杂交的多核苷酸接触来解偶联分析物。多核苷酸试剂通常以高于第一分析物和一个或多个锚的浓度的浓度添加。或者,多核苷酸试剂可以比第一分析物更强地与一个或多个锚杂交。
步骤(c)更优选包括(i)使第一分析物和一个或多个锚与以下物质接触:脲,三(2-羧乙基)膦(TCEP),二硫苏糖醇(DTT),链霉亲和素或生物素,UV光,酶或结合剂;(ii)加热所述第一分析物和一个或多个锚;或(iii)改变pH。脲,三(2-羧乙基)膦(TCEP)或二硫苏糖醇(DTT)能够破坏锚并将第一分析物与膜分离。如果锚包含链霉亲和素-生物素连接,则链霉亲和素试剂将竞争结合生物素。如果锚包含链霉亲和素-脱硫生物素连接,则生物素试剂将竞争结合链霉亲和素。紫外光可用于分解光不稳定基团。酶和结合剂可用于切下,分解或解开锚。优选的酶包括但不限于外切核酸酶,内切核酸酶或解旋酶。优选的结合剂包括但不限于酶,抗体或其片段或单链结合蛋白(SSB)。可以使用下面讨论的任何酶或上面讨论的抗体。加热和pH可以用于破坏杂交和其它连接。
如果通过使第一分析物与一个或多个锚分离将第一分析物与膜解偶联,则所述一个或多个锚将保留在膜中。步骤(d)优选包括使用与第一分析物分离的一个或多个锚将第二分析物偶联至膜。例如,第二分析物还可以具有与保留在膜中的一个或多个锚杂交的多核苷酸。或者,步骤(d)优选包括使用相对于与第一分析物分离的一个或多个锚而言独立的一个或多个锚(即,其它一个或多个锚)将第二分析物偶联至膜。所述独立的一个或多个锚可以与用于将第一分析物偶联到膜的锚是相同类型的锚或者可以是不同类型的锚。步骤(d)优选包括使用不同于与第一分析物分离的锚的一个或多个锚来将第二分析物偶联到膜上。
在优选的实施方案中,步骤(c)和(d)包括通过使膜与第二分析物接触而使得第二分析物与第一分析物竞争结合一个或多个锚并取代第一分析物,从而使第一分析物与膜解偶联。例如,如果使用涉及杂交的一个或多个锚将第一分析物偶联到膜上,则所述分析物可以通过使所述一个或多个锚与结合到多核苷酸的第二分析物接触来解偶联,其中所述多核苷酸也杂交到所述一个或多个锚中的杂交位点。第二分析物通常以高于第一分析物和一个或多个锚的浓度的浓度添加。或者,第二分析物可以比第一分析物更强地与一个或多个锚杂交。
去除或清洗
尽管在步骤(c)中第一分析物与膜解偶联,但是其不一定被去除或洗去。如果第二分析物可以容易地与第一分析物区分开,则不需要去除第一分析物。
在步骤(c)和(d)之间,所述方法优选还包括从膜去除至少一些第一样品。可以去除至少10%的第一样品,例如可以去除至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%或至少90%的第一样品。该方法更优选还包括从膜去除所有第一样品。这可以以任何方式完成。例如,在第一分析物已经解偶联后,可以用缓冲液洗涤膜。合适的缓冲液如下所述。
多核苷酸表征
本发明的方法优选涉及测量两个或更多个多核苷酸的一个或多个特征。所述两个或更多个多核苷酸可以是不同的多核苷酸或相同多核苷酸的两个实例。
可以研究任何数量的多核苷酸。例如,本发明的方法可以涉及确定3,4,5,6,7,8,9,10,20,30,50,100或更多个多核苷酸的存在、不存在或一个或多个特征。如果使用本发明的方法研究三个或更多个多核苷酸,则第二多核苷酸也与膜解偶联,并且针对第三多核苷酸增加所需数目的步骤。四个或更多个多核苷酸时也是如此。
多核苷酸可以是天然存在的或人工的。例如,该方法可用于验证两个或更多个制造的寡核苷酸的序列。所述方法通常在体外进行。
所述方法可以包括测量每个多核苷酸的两个、三个、四个或五个或更多个特征。所述的一个或多个特征优选选自(i)多核苷酸的长度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)多核苷酸的二级结构,以及(v)多核苷酸是否被修饰。根据本发明可以测量(i)到(v)的任意组合,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v},{ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。可以测量第一多核苷酸的与第二多核苷酸相比不同的(i)到(v)的组合,包括上面所列的任意组合。
对于(i),多核苷酸的长度可以例如通过确定所述多核苷酸和所述孔之间相互作用的次数或所述多核苷酸和所述孔之间相互作用的持续时间进行测量。
对于(ii),对多核苷酸的鉴别可以通过多种方式进行测定。对多核苷酸的识别可以联合多核苷酸序列的测定或不联合多核苷酸序列的测定而进行测定。前者是直接测定;对所述多核苷酸进行测序,并由此进行识别。后者可以多种方式完成。例如,可以测定多核苷酸中特定模序的存在(不需要测定多核苷酸的其余序列)。替代地,在所述方法中特定电和/或光信号的测定可以鉴别来自特定来源的多核苷酸。
对于(iii),多核苷酸的序列可以如前文所述进行测定。适合的测序方法,特别是那些使用电测量的方法,在Stoddart D等人,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72,以及国际申请WO 2000/28312中有描述。
对于(iv),二级结构可以多种方式测定。例如,如果所述方法涉及电测量,则二级结构可以利用流经孔的停留时间的变化或电流的变化进行测定。这使得能够对单链和双链多核苷酸区域进行辨别。
对于(v),可以测定任何修饰的存在与否。所述方法优选包括确定所述多核苷酸是否通过甲基化、氧化、损伤、用一个或多个蛋白质或一个或多个标记物、标签或间隔区进行了修饰。特定的修饰将导致与孔的特定的相互作用,这可使用下述方法测定。例如,可以基于孔与每个核苷酸的相互作用过程中流经所述孔的电流,来区分甲基胞嘧啶和胞嘧啶。
该方法可以使用适于研究膜/孔系统——其中孔存在于膜中——的任何设备进行。该方法可以使用适合于跨膜孔传感的任何设备进行。例如,所述设备包括含水溶液的腔室,以及将所述腔室分成两个区段的屏障。所述屏障典型地具有开孔,含所述孔的膜形成于所述开孔中。替代地,所述屏障形成其中存在孔的膜。
该方法可使用国际申请No.PCT/GB08/000562(WO 2008/102120)中描述的设备进行。
所述方法可以包括测量所述多核苷酸相对于所述孔移动时穿过所述孔的电流。因此,所述设备也可以包括能够施加电位并测量穿过所述膜和孔的电信号的电路。所述方法可以使用膜片钳或电压钳进行。所述方法优选涉及使用电压钳。
本发明方法可包括,当多核苷酸相对于孔移动时,测量穿过该孔的电流。用于测量穿过跨膜蛋白孔的离子电流的适宜条件是本领域已知的并在实施例中公开。所述方法通常通过跨膜和孔施加电压来实施。使用的电压通常为+5V到-5V,例如+4V到-4V,+3V到-3V或+2V到-2V。使用的电压通常为-600mV到+600mV或-400mV到+400mV。使用的电压优选在具有以下下限和上限的范围内,所述下限选自-400mV,-300mV,-200mV,-150mV,-100mV,-50mV,-20mV和0mV,所述上限独立地选自+10mV,+20mV,+50mV,+100mV,+150mV,+200mV,+300mV和+400mV。使用的电压更优选在100mV到240mV范围内,最优选在120mV到220mV范围内。可通过对孔施加提高的电位来增加对不同核苷酸的鉴别力。
所述方法通常在任何载荷子诸如金属盐(如碱金属盐)、卤盐(如氯化物盐(如碱金属氯化物盐))的存在下实施。载荷子可包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在上述示例性设备中,所述盐以水溶液存在于室中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl),或亚铁氰化钾和铁氰化钾的混合物。优选KCl、NaCl,和亚铁氰化钾和铁氰化钾的混合物。载荷子可以是跨所述膜不对称的。例如,所述载荷子的类型和/或浓度在膜的每一侧上可以不同。
所述盐浓度可以是饱和的。所述盐浓度可以是3M或更低并且通常为0.1-2.5M,0.3-1.9M,0.5-1.8M,0.7-1.7M,0.9-1.6M或1M-1.4M。所述盐浓度优选为150mM-1M。所述方法优选使用至少0.3M,例如至少0.4M,至少0.5M,至少0.6M,至少0.8M,至少1.0M,至少1.5M,至少2.0M,至少2.5M或至少3.0M的盐浓度而实施。高的盐浓度提供高的信噪比并使得电流能在正常电流波动的背景下识别代表核苷酸存在。
所述方法通常在缓冲剂的存在下实施。在上述示例性设备中,所述缓冲剂以水溶液存在于所述室中。任何缓冲剂均可用在本发明方法中。通常,所述缓冲剂为磷酸盐缓冲液。另一个适宜的缓冲剂为HEPES和三羟甲基氨基甲烷-HCl(Tris-HCl)缓冲液。所述方法通常在4.0-12.0,4.5-10.0,5.0-9.0,5.5-8.8,6.0-8.7或7.0-8.8或7.5-8.5的pH下实施。所用pH优选约为7.5。
所述方法可在0℃-100℃、15℃-95℃、16℃-90℃、17℃-85℃、18℃-80℃、19℃-70℃或20℃-60℃实施。所述方法通常在室温实施。所述方法可选地在能支持酶功能的温度下,例如约37℃实施。
步骤(b)优选包括使第一多核苷酸与控制第一多核苷酸与膜中存在的检测器的相互作用的多核苷酸结合蛋白相互作用,和/或步骤(e)优选包括允许第二多核苷酸与控制第二多核苷酸与膜中存在的检测器的相互作用的多核苷酸结合蛋白相互作用。
更优选地,所述方法包括(a)使用一个或多个锚将第一样品中的第一多核苷酸偶联至膜;(b)使所述第一多核苷酸与跨膜孔接触,使得所述第一多核苷酸移动穿过所述孔;(c)随着所述第一多核苷酸相对于所述孔移动获取一个或多个测量值,其中所述测量值代表所述第一多核苷酸的一个或多个特征,由此表征所述第一多核昔酸;(d)使所述第一多核苷酸与所述膜解偶联;(e)使用一个或多个锚将第二样品中的第二多核苷酸偶联至所述膜;(f)使所述第二多核昔酸与跨膜孔接触,使得所述第二多核苷酸移动穿过所述孔;和(g)随着所述第二多核苷酸相对于所述孔移动获取一个或多个测量值,其中所述测量值代表所述第二多核苷酸的一个或多个特征,由此表征所述第二多核苷酸。在该实施方案中,步骤(b)优选包括使第一多核苷酸与跨膜孔和多核苷酸结合蛋白质接触,使得所述蛋白质控制第一多核苷酸穿过孔的移动,和/或步骤(f)优选包括使第二多核苷酸与跨膜孔和多核苷酸结合蛋白质接触,使得所述蛋白质控制第二多核苷酸穿过所述孔的移动。
所述多核苷酸结合蛋白可以是能够结合到多核苷酸并控制其移动穿过所述孔的任何蛋白质。现有技术中可直接确定蛋白质是否结合到多核苷酸。该蛋白质通常与多核苷酸相互作用并修改其至少一种性质。该蛋白质可通过使多核苷酸裂解形成各单个核昔酸或短链核苷酸如二核苷酸或三核苷酸而修饰该多核苷酸。该部分可以通过将多核苷酸定向到或将其移动到特定位置,即控制其移动,而修饰所述多核苷酸。
所述多核苷酸结合蛋白优选地衍生自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并修饰其至少一种性质的多肽。该酶可以通过使多核苷酸裂解形成各单个核昔酸或短链核苷酸如二核苷酸或三核苷酸而修饰该多核苷酸。该酶可以通过使其定向到或将其移动到特定位置而修饰所述多核苷酸。所述多核苷酸处理酶不需要显示酶活性,只要它能够结合多核苷酸并控制其移动穿过所述孔即可。例如,该酶可以被修饰,以去除其酶活性,或者可以在防止其作为酶发挥作用的条件下使用。这样的条件在下面更详细地论述。
所述多核苷酸处理酶优选衍生自溶核酶。在酶的构建体中使用的所述多核苷酸处理酶更优选衍生自酶分类(EC)组3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中的任意成员。所述酶可以是国际申请PCT/GB10/000133(公开号为WO 2010/086603)中公开的任意酶。
优选的酶为聚合酶、核酸外切酶、解旋酶和拓扑异构酶,例如促旋酶。合适的酶包括,但不限于,来自大肠杆菌的核酸外切酶I(SEQ ID NO:11)、来自大肠杆菌的核酸外切酶III(SEQ ID NO:13)、来自嗜热栖热菌的RecJ(SEQ ID NO:15),和噬菌体λ核酸外切酶(SEQID NO:17)及其变体。包含SEQ ID NO:15或其变体所示序列的三个亚基相互作用形成三聚体核酸外切酶。所述酶优选是Phi29DNA聚合酶(SEQ ID NO:9)或其变体。拓扑异构酶优选是部分分类(EC)组5.99.1.2和5.99.1.3中的任意成员。
所述酶最优选衍生自解旋酶,如Hel308Mbu(SEQ ID NO:18),Hel308Csy(SEQ IDNO:19),Hel308Mhu(SEQ ID NO:20),TraI Eco(SEQ ID NO:21),XPD Mbu(SEQ ID NO:22)或其变体。本发明可以使用任何解旋酶。所述解旋酶可以是或者衍生自Hel308解旋酶、RecD解旋酶,例如TraI解旋酶或TrwC解旋酶、XPD解旋酶或Dda解旋酶。所述解旋酶可以是国际申请No.PCT/GB2012/052579(公开号WO 2013/057495);PCT/GB2012/053274(公开号WO 2013/098562);PCT/GB2012/053273(公开号WO2013098561);PCT/GB2013/051925(公开号WO2014/013260);PCT/GB2013/051924(公开号WO 2014/013259);PCT/GB2013/051928(公开号WO 2014/013262);以及PCT/GB2014/052736中公开的解旋酶、经修饰的解旋酶或解旋酶构建体中的任意成员。
所述解旋酶优选包含SEQ ID NO:25(Trwc Cba)或其变体中所示序列,SEQ ID NO:18(Hel308Mbu)或其变体中所示序列,或者SEQ ID NO:24(Dda)或其变体中所示序列。各变体可以以下文针对跨膜孔所述任意方式不同于天然序列。SEQ ID NO:24的优选变体包含E94C/A360C和之后的(ΔM1)G1G2(即M1缺失,然后添加G1和G2)或E94C/A360C/C109A/C136A和之后的(ΔM1)G1G2。
本发明可以使用任何数目的解旋酶。例如,可以使用1,2,3,4,5,6,7,8,9,10或更多个解旋酶。在一些实施方案中,可使用其他数目的解旋酶。
本发明方法优选包括使第一多核苷酸分析物和/或第二多核昔酸分析物与两个或更多个解旋酶接触。所述两个或更多个解旋酶通常为相同解旋酶。所述两个或更多个解旋酶可以是不同解旋酶。
所述两个或更多个解旋酶可以是上文提及的解旋酶的任意组合。所述两个或更多个解旋酶可以是两个或更多个Dda解旋酶。所述两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。所述两个或更多个解旋酶可以是相同解旋酶的不同变体。
所述两个或更多个解旋酶优选彼此连接。所述两个或更多个解旋酶更优选彼此共价连接。所述解旋酶可以以任何顺序使用任何方法连接。用于本发明的优选的解旋酶构建体在国际申请PCT/GB2013/051925(公开号WO 2014/013260);PCT/GB2013/051924(公开号WO 2014/013259);PCT/GB2013/051928(公开号WO 2014/013262);以及PCT/GB2014/052736中有描述。
SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的变体是具有下述氨基酸序列的酶:所述氨基酸序列从SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25变化而来并保留多核苷酸结合能力。这可以使用本领域已知的任何方法测定。例如,使所述变体与多核苷酸接触,然后测量其结合到多核苷酸并沿多核苷酸移动的能力。所述变体可以包括能促进对多核苷酸的结合和/或促进其在高盐浓度和/或室温下活性的修饰。各变体可以被修饰为,使其结合多核苷酸(即保留多核苷酸结合能力),但不具有解旋酶功能(即当提供了有助于移动的所有必要组分例如ATP和Mg2+时仍不能沿多核苷酸移动)。这种修饰是本领域公知的。例如,对解旋酶中Mg2+结合结构域的修饰通常导致不具有解旋酶功能的变体。这些类型的变体可用作分子制动器(见下文)。
基于氨基酸同一性,在SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列的整个长度上,变体将优选与该序列至少50%同源。更优选,基于氨基酸同一性,所述变体多肽在整个长度上可以与SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列,至少55%,至少60%至少65%,至少70%,至少75%至少80%,至少85%,至少90%且更优选至少95%,97%或99%同源。在200或更多,例如230,250,270,280,300,400,500,600,700,800,900或1000或更多个连续氨基酸片段上,可以具有至少为80%,例如至少85%,90%或95%的氨基酸同源性(“严格同源性”)。同源性可如上文所述进行确定。所述变体可以上文针对SEQ ID NO:2和4论述的任意方式不同于野生型序列。所述酶可以共价连接到孔。可使用任何方法将所述酶共价连接到孔。
优选的分子制动器是TrwC Cba-Q594A(SEQ ID NO:25,具有突变Q594A)。该变异不具有解旋酶的功能(即能结合多核苷酸,但当提供了有助于移动的所有必要组分例如ATP和Mg2+时仍不能沿多核苷酸移动)。
在链测序中,所述多核苷酸顺着或逆着所施加电位移位穿过所述孔。逐渐地或进行性地作用于双链多核苷酸上的核酸外切酶可用于在施加的电位下在所述孔的顺侧上使剩余的单链穿过,或者在反向电位下在所述孔的反侧上使剩余的单链穿过。同样地,解开双链DNA的解旋酶也可以类似的方式使用。也可以使用聚合酶。还有可能有这样的测序应用:其需要使链逆着施加电位移位,但是DNA必须在反向电位或没有电位的情况下首先被所述酶“捕获”。然后随着在结合之后电位被翻转,所述链将从顺侧到反侧而穿过所述孔并通过电流保持延伸的构造。单链DNA核酸外切酶或单链DNA依赖性聚合酶可用作分子马达,用于以受控且逐步的方式将最近移位的单链逆着施加的电位从反侧到顺侧穿过所述孔而拉回。
解旋酶(一个或多个)和分子制动器(一个或多个)
在优选实施方式中,该方法包括:
(a)对第一样品中的第一多核苷酸提供连接到第一多核苷酸的一个或多个解旋酶和连接到第一多核昔酸的一个或多个分子制动器;
(b)对第二样品中的第二多核苷酸提供连接到第二多核苷酸的一个或多个解旋酶和连接到第二多核苷酸的一个或多个分子制动器;
(c)使用一个或多个锚将第一样品中的第一多核苷酸偶联至膜;
(d)使所述第一多核苷酸与跨膜孔接触,并跨所述孔施加电位,使得所述一个或多个解旋酶和所述一个或多个分子制动器结合在一起,并且一起控制所述第一多核昔酸穿过所述孔的移动;
(e)随着所述第一多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述第一多核苷酸的一个或多个特征,由此表征所述第一多核苷酸;
(f)使所述第一多核苷酸与所述膜解偶联;
(g)使用一个或多个锚将所述第二样品中的所述第二多核苷酸偶联至所述膜;
(h)使所述第二多核苷酸与跨膜孔接触,并跨所述孔施加电位,使得所述一个或多个解旋酶和所述一个或多个分子制动器结合在一起,并且一起控制所述第二多核苷酸通过所述孔的移动;和
(i)随着第二多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表第二多核苷酸的一个或多个特征,由此表征第二多核苷酸。
这种类型的方法在国际申请PCT/GB2014/052737中详细讨论。
步骤(f)(即第一多核苷酸的解偶联)可以在步骤(g)之前(即在将第二多核苷酸偶联至膜之前)进行。步骤(g)可以在步骤(f)之前进行。如果第二多核苷酸在第一多核苷酸解偶联之前与膜偶联,则步骤(f)优选包括从所述膜上选择性地解偶联第一多核苷酸(即,使第一多核苷酸而不是第二多核苷酸与膜解偶联)。本领域技术人员可以设计在其中实现选择性解偶联的系统。步骤(f)和(g)可以同时进行。这将在下面更详细地讨论。
所述一个或多个解旋酶可以使上文所述的任何解旋酶。所述一个或多个分子制动器可以为结合到多核苷酸并减缓该多核苷酸穿过所述孔的移动的任何化合物或分子。所述一个或多个分子制动器优选为一个或多个多核苷酸结合蛋白。所述多核苷酸结合蛋白可以是能够结合到多核苷酸并控制其移动穿过所述孔的任何蛋白质。现有技术中可直接确定蛋白质是否结合到多核苷酸。所述蛋白通常与多核苷酸相互作用并修饰所述多核苷酸的至少一种特征。所述蛋白可通过使多核苷酸裂解形成各单个核苷酸或短链核苷酸,如二核苷酸或三核苷酸,来修饰所述多核苷酸。该部分可以通过将多核苷酸定向到或将其移动到特定位置,即控制其移动,来修饰所述多核昔酸。
所述多核苷酸结合蛋白优选衍生自多核苷酸处理酶。所述一个或多个分子制动器可以衍生自上述的任何多核苷酸处理酶。用作分子制动器的Phi29聚合酶的经修饰的变体(SEQ ID NO:9)在美国专利No.5576204中公开。充当分子制动器的Phi29聚合酶的经修饰的变体(SEQ ID NO:8)在美国专利5,576,204中有公开。所述一个或多个分子制动器优选衍生自解旋酶。
多核苷酸分析物中的间隔区
所述一个或多个解旋酶可以在一个或多个间隔区停滞,如在国际申请No.PCT/GB2014/050175(公开为WO 2014/135838)中论述的。本发明中可以使用在该国际申请中公开的一个或多个解旋酶和一个或多个间隔区的任意构造。
双链多核苷酸
第一多核苷酸分析物和/或第二多核苷酸分析物可以是双链的。如果多核苷酸分析物是双链的,则该方法优选地还包括在偶联步骤之前将发夹环适配体连接到多核昔酸的一端并分离多核苷酸的两条链以形成单链多核苷酸构建体。然后可以允许单链多核昔酸构建体与根据本发明的检测器相互作用。以这种方式连接和探究(interrogating)在双链构建体上的两条链提高了表征的效率和准确性。在国际申请号PCT/GB2010/000160(公开为WO2010/086622)和PCT/GB2012/051786(公开为WO 2013/014451)中公开了使用发夹环适配体进行的测序。
前导序列
在偶联步骤之前,所述方法优选包括将优先旋入孔中的前导序列连接到第一和/或第二多核苷酸分析物。前导序列促进了本发明的方法。前导序列被设计成优先旋入跨膜孔,从而促进多核苷酸分析物穿过孔的移动。前导序列也可以用于将多核苷酸连接到如上所述的一个或多个锚。
前导序列通常包含聚合物。聚合物优选带负电荷。聚合物优选是多核苷酸,例如DNA或RNA,修饰的多核苷酸(例如脱碱基DNA),PNA,LNA,聚乙二醇(PEG)或多肽。前导序列优选包含多核苷酸,更优选包含单链多核苷酸。前导序列可以包含上述任何多核苷酸。单链前导序列最优选包含单链DNA,例如poly dT部分。前导序列优选包含一个或多个间隔区。
前导序列可以是任何长度,但通常10至150个核苷酸长度,例如20至150个核苷酸长度。前导序列的长度通常取决于方法中使用的跨膜孔。
双偶联
本发明的方法可以涉及多个双链多核苷酸的双偶联。在优选的实施方案中,本发明涉及表征多个双链多核苷酸。该方法优选地包括:
(a)在第一样品中提供第一双链多核苷酸,其一端具有Y适配体并且另一端具有发夹环适配体,其中所述Y适配体包含用于将所述多核苷酸偶联至所述膜的一个或多个第一锚,其中所述发夹环适配体包含用于将所述多核苷酸偶联至所述膜的一个或多个第二锚,并且其中发夹环适配体与膜的偶联强度大于Y适配体与膜的偶联强度;
(b)以步骤(a)中定义的形式在第二样品中提供第二双链多核苷酸;
(c)将步骤(a)中提供的第一多核苷酸与膜偶联;
(d)使步骤(c)中偶联的第一多核苷酸与跨膜孔接触,使得第一多核苷酸的至少一条链移动通过所述孔;
(e)随着第一多核苷酸的至少一条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表第一多核苷酸的至少一条链的一个或多个特征,由此表征第一多核苷酸;
(f)使所述第一多核苷酸与所述膜解偶联;
(g)将步骤(b)中提供的第二多核苷酸与所述膜偶联;
(h)使在步骤(g)中偶联的第二多核苷酸与跨膜孔接触,使得第二多核苷酸的至少一条链移动通过所述孔;和
(i)随着第二多核苷酸的至少一条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表第二多核苷酸的至少一条链的一个或多个特征,由此表征第二多核苷酸。
这种类型的方法在英国申请1406147.7和1407815.8以及与本申请同时提交的国际申请中详细讨论。
所述双链多核苷酸在一端提供有Y适配体,在另一端提供有发夹环适配体。Y适配体和/或发夹环适配体通常是多核昔酸适配体。它们可以由上述任何多核苷酸形成。
Y适配体通常包含(a)双链区域和(b)单链区域或在另一端不互补的区域。如果Y适配体包含单链区域,则其可被描述为具有突出端。在Y适配体中存在非互补区域给予该适配体Y形状,因为两条链通常不像双链部分那样彼此杂交。Y适配体包括一个或多个第一锚。锚在上面更详细地讨论。
Y适配体优选包含优先旋入孔中的前导序列。前导序列如上所述。
发夹环适配体优选包含如上所述的可选择的结合部分。发夹环适配体和/或可选择的结合部分可以包括可以被切下,切割,劈开或水解的区域,如上文所述。
可以使用本领域已知的任何方法将Y适配体和/或发夹环适配体连接到多核苷酸。一个或两个适配体可以使用连接酶如T4DNA连接酶,大肠杆菌DNA连接酶,Taq DNA连接酶,Tma DNA连接酶和9°N DNA连接酶连接。或者,可以使用下面讨论的本发明的方法将适配体添加到多核苷酸。
在优选的实施方案中,所述方法的步骤a)包括修饰双链多核苷酸,使得其一端包含Y适配体和另一端包含发夹环适配体。可以使用任何方式的修饰。该方法优选包括根据本发明修饰双链多核苷酸。这将在下面更详细地讨论。修饰和表征的方法可以以任何方式组合。
发夹环适配体与膜偶联(或结合)强度大于Y适配体与膜偶联(或结合)强度。这可以以任何方式测量。用于测量偶联(或结合)强度的合适方法公开在英国申请1406147.7和1407815.8的实施例中以及与本申请同时提交的国际申请中。
发夹环适配体的偶联(或结合)强度优选是Y适配体偶联(或结合)强度的至少1.5倍,例如Y适配体偶联(或结合)强度的至少两倍,至少三倍,至少四倍,至少五倍或至少十倍。发夹环适配体对于膜的亲和常数(Kd)优选是Y适配体的亲和常数的至少1.5倍,例如多Y适配体偶联强度发至少两倍,至少三倍,至少四倍,至少五倍或至少十倍。
有几种方式使发夹环适配体比Y适配体更强地偶联(或结合)到膜。例如,发夹环适配体可以包括比Y适配体更多的锚。例如,发夹环适配体可以包括2,3或更多个第二锚,而Y适配体可以包括一个第一锚。
所述一个或多个第二锚与膜的偶联(或结合)强度可大于所述一个或多个第一锚偶联(或结合)至膜的强度。一个或多个第二锚偶联(或结合)到发夹环适配体的强度可以大于一个或多个第一锚偶联(或结合)到Y适配体的强度。一个或多个第一锚和一个或多个第二锚可以通过杂交连接到它们各自的适配体,并且一个或多个第二锚的杂交强度大于一个或多个第一锚的杂交强度。这些实施例的任何组合也可以用于本发明中。偶联(或结合)强度可以使用本领域已知的技术来测量。
一个或多个第二锚优选地包括一个或多个基团,其偶联(或结合)到膜的强度大于一个或多个第一锚的一个或多个基团偶联(或结合)到膜上的强度。在优选的实施方案中,发夹环适配体/一个或多个第二锚使用胆固醇与膜偶联(或结合),Y适配体/一个或多个第一锚使用棕榈酸酯与膜偶联(或结合)。胆固醇比棕榈酸酯更强地结合到三嵌段共聚物膜和脂质膜。在一个替换的实施方案中,发夹环适配体/一个或多个第二锚使用单酰基物质例如棕榈酸酯偶联(或结合)到膜上,并且Y适配体/一个或多个第一锚使用二酰基物质,例如二棕榈酰磷脂酰胆碱偶联(或结合)所述膜。
添加发夹环和前导序列
在偶联步骤之前,双链多核苷酸分析物优选与MuA转座酶和双链MuA底物组接触,其中底物组中的一部分底物是包含前导序列的Y适配体,并且底物组中的一部分底物是发夹环适配体。转座酶片段化双链多核苷酸分析物并将MuA底物连接到片段的一端或两端。这产生了多个修饰的双链多核苷酸,其一端包含前导序列,在另一端包含发夹环。然后可以使用本发明的方法研究修饰的双链多核苷酸。
这些基于MuA的方法公开在国际申请号PCT/GB2014/052505(公开为WO2015022544)中。它们还在英国申请1406147.7和1407815.8中,以及与本申请同时提交的国际申请(ONT IP 056)中详细讨论。
修饰的多核苷酸分析物
在表征之前,可以在通过使用多核苷酸分析物作为模板使聚合酶形成修饰的多核苷酸分析物的条件下,使多核苷酸分析物与聚合酶及游离核苷酸组接触来修饰第一多核苷酸分析物和/或第二多核苷酸分析物,其中当形成修饰的多核苷酸分析物时,聚合酶用不同的核苷酸种类替换多核苷酸分析物中的一个或多个核苷酸种类。然后可以如步骤a)和/或d)中那样将修饰的多核苷酸分析物偶联到膜上。这种类型的修改在国际申请No.PCT/GB2015/050483中描述。可以使用上述任何聚合酶。聚合酶优选Klenow或9o North。
在其中聚合酶使用模板多核苷酸作为模板形成修饰的多核苷酸的条件下,使模板多核苷酸与聚合酶接触。这样的条件是本领域已知的。例如,多核苷酸通常与可商购的聚合酶缓冲液中的聚合酶接触,例如来自New England的缓冲液。对于Klenow,温度优选为20至37℃,或者,对于9o North,温度优选为60至75℃。引物或3′发夹通常用作聚合酶延伸时的成核点。
使用跨膜孔进行的多核苷酸的表征,例如测序,通常包括分析由k个核苷酸组成的聚合物单元,其中k是正整数(即“k-聚体”)。这在国际申请号PCT/GB2012/052343(公开为WO2013/041878)中讨论。尽管期望在不同k聚体的电流测量值之间具有清楚的分离,但是通常这些测量值中的一些重叠的。特别是在k聚体中具有高数量的聚合物单元,即高k值时,变得难以分辨由不同k聚体产生的测量值以确定关于多核苷酸的导出信息,例如评估该多核苷酸的基本序列(underlying sequence)。
通过将模板多核苷酸分析物中的一个或多个核苷酸物质用经修饰多核苷酸分析物中的不同核苷酸物质替代,所述经修饰多核苷酸分析物含有与模板多核昔酸分析物中的k聚体不同的k聚体。所述经修饰多核苷酸分析物中的所述不同的k聚体能够产生与模板多核苷酸分析物中的k聚体不同的电流测量值,由此所述经修饰多核苷酸分析物提供不同于模板多核苷酸分析物的信息。来自所述经修饰多核苷酸分析物的这些额外信息使得更容易表征所述模板多核苷酸分析物。在一些情况下,所述经修饰多核苷酸分析物本身可以更容易地表征。例如,可将所述经修饰多核苷酸设计为包括其电流测量值之间具有增强的分离或明确的分离的k聚体,或者包括具有降低的噪声的k聚体。
优选实施方式
本发明提供了表征两个或更多个双链多核苷酸的方法,包括:
(a)在第一样品中提供第一双链多核苷酸,其一端具有第一Y适配体且另一端具有第一发夹环适配体,其中所述第一Y适配体包含一个或多个第一解旋酶和一个或多个用于将所述多核苷酸偶联至所述膜的第一锚,其中所述第一发夹环适配体包含所述一个或多个第一分子制动器和一个或多个用于将所述第一多核苷酸偶联至所述膜的第二锚,并且其中所述第一发夹环适配体与所述膜的偶联强度大于所述第一Y适配体与所述膜的偶联强度;
(b)在第二样品中提供第二双链多核昔酸,其一端具有第二Y适配体且另一端具有第二发夹环适配体,其中所述第二Y适配体包含一个或多个第二解旋酶和一个或多个用于将所述多核苷酸偶联至所述膜的第三锚,其中所述第二发夹环适配体包含一个或多个第二分子制动器和一个或多个用于将所述第二多核苷酸偶联至所述膜的第四锚,并且其中所述第二发夹环适配体与所述膜的偶联强度大于所述第二Y适配体到所述膜的偶联强度;
(c)将所述第一样品中的所述第一多核昔酸偶联至所述膜;
(d)使所述第一多核苷酸与跨膜孔接触,并跨所述孔施加电位,使得所述一个或多个解旋酶和所述一个或多个分子制动器结合在一起,并且二者一起控制所述第一多核苷酸穿过所述孔的移动;
(e)随着所述第一多核苷酸相对于所述孔移动,获取进行一个或多个测量值,其中所述测量值代表所述第一多核苷酸的一个或多个特征,由此表征所述第一多核苷酸;
(f)使所述第一多核苷酸与所述膜解偶联;
(g)将所述第二样品中的所述第二多核苷酸偶联至所述膜;
(h)使所述第二多核苷酸与跨膜孔接触,并跨所述孔施加电位,使得所述一个或多个解旋酶和所述一个或多个分子制动器结合在一起,并且二者一起控制所述第二多核苷酸通过所述孔的移动;和
(i)随着所述第二多核苷酸相对于所述孔移动,获取进行一个或多个测量值,其中所述测量值代表第二多核苷酸的一个或多个特征,由此表征第二多核苷酸。
这结合了在英国申请1406155.0,1406147.7,1407815.8和1406151.9以及国际申请PCT/GB2014/052737以及当时与本申请共同提交的国际申请(ONT IP056)中公开的方法。其中公开的任何实施例可以应用于优选实施方式。
其他表征方法
在另一个实施方案中,第一多核苷酸分析物和/或第二多核苷酸分析物通过当聚合酶将核苷酸掺入多核昔酸中时检测释放的标记物质进行表征。聚合酶使用第一和/或第二多核苷酸分析物作为模板。每个标记的物质对于每个核苷酸是特异性的。第一和/或第二多核苷酸分析物与跨膜孔、聚合酶和标记的核苷酸接触,使得当通过聚合酶将核昔酸添加到多核苷酸时,磷酸盐标记的物质被顺序地释放,其中磷酸盐物质含有对每个核苷酸特异性的标记。聚合酶可以是上述聚合酶中的任何一种。使用孔检测磷酸盐标记的物质,从而表征第一和/或第二多核苷酸分析物。这种类型的方法公开在欧洲申请号13187149.3(公开为EP 2682460)中。上面讨论的任何实施例同样适用于该方法。
涉及胆固醇和环糊精的方法
本发明还提供了将使用包含胆固醇的锚偶联到膜上的分析物从膜解偶联的方法,包括使分析物与环糊精或其衍生物接触,由此使该分析物与膜解偶联。上述任何实施方案,特别是涉及分析物、锚、环糊精或其衍生物和膜的那些实施方案,同样适用于该方法。分析物优选是多核苷酸。多核苷酸优选包含如上定义的前导序列。胆固醇锚优选包含与前导序列杂交的多核苷酸序列。多核苷酸序列优选与锚中的胆固醇共价连接。
试剂盒
本发明还提供了用于确定两个或更多个样品中两个或更多个分析物的存在、不存在或一个或多个特征的试剂盒,其包含(a)膜,(b)一个或多个锚,其能够将两个或多个更多的分析物偶联到膜,例如能够将第一分析物偶联到膜的一个或多个第一锚和能够将第二分析物偶联到膜的一个或多个第二锚,以及(c)一个或多个试剂,能够从膜解偶联所述两个或更多个分析物中的至少一个,例如两个。一个或多个锚和一个或多个试剂可以是上文参照本发明的方法讨论的那些中的任何一个。
试剂盒优选进一步包括检测器,例如跨膜孔。上面讨论的任何检测器可以在试剂盒中。
试剂盒优选地还包含能够优先旋入跨膜孔的发夹环和/或前导序列。试剂盒优选还包含多核苷酸结合蛋白。上文讨论了优选的发夹环,前导序列和多核苷酸结合蛋白。
以上关于本发明的方法讨论的任何实施方案同样适用于试剂盒。试剂盒可以进一步包含膜的组分,例如两亲性层或三嵌段共聚物膜的组分。
本发明的试剂盒可另外包括一种或多种能实施上述任何实施方案的其他试剂或仪器。所述试剂或仪器包括以下中的一种或多种:合适的缓冲液(水性溶液)、用于从受体获得样本的工具(如含有针的导管或仪器)、用于扩增和/或表达多核苷酸的工具,上文限定的膜,或者电压钳或膜片钳设备。试剂可以干态存在于所述试剂盒中,使得液体样本使该试剂重悬(resuspend)。可选地,所述试剂盒还可包括使该试剂盒能在本发明方法中使用的说明书或关于该方法可以用于哪种有机体的详细资料。
以下实施例用于说明本发明。
实施例
实施例1
该实施例显示了对照实验,其说明了通过在实验系统中存在甲基-β-环糊精,没有阻止溶液中未偶联至膜的游离DNA进入纳米孔。
材料和方法
在缓冲液(600mM KCl,25mM磷酸钾,75mM亚铁氰化钾(II),25mM铁氰化钾(III),pH8.0)中在15℃的温度下从插入嵌段共聚物中的单个MspA纳米孔MS(B1-G75S/G77S/L88N/Q126R)8MspA(MspA-B2C)(具有突变G75S/G77S/L88N/Q126R的SEQ ID NO:2)获得电测量值。在实现单个孔插入嵌段共聚物之后,然后将缓冲液(1mL,600mM KCl,25mM磷酸钾,75mM亚铁氰化钾(II),25mM铁氰化钾(III)pH8.0)流过系统以去除任何过量的MspA-B2C纳米孔。将两个DNA样品(100nM,1-SEQ ID NO:26和SEQ ID NO:29和2-SEQ ID NO:27,在其5′端连接到4个iSp18间隔区,所述间隔区在其另一端连接到SEQ ID NO:28的3′端)加入到系统中,实验在施加的120mV电位下运行30分钟。然后用甲基-β-环糊精(100μM)和浓度为100nM的DNA样品1和2以500μL的总体积冲洗该系统,实验在施加的120mV电位下进行另外30分钟。然后用两个1mL甲基-β-环糊精(100μM)冲洗液和浓度为100nM的DNA样品1和2冲洗该系统。
除了对于所有包含甲基-β-环糊精的步骤之外,进行与上述相似的对照实验,仅加入DNA样品,没有甲基-β-环糊精冲洗流过该系统。
结果
其中仅将游离DNA加入系统的对照实验一致地在电流轨迹中表现出短尖峰,该锋对应于DNA在所施加的电位下移位穿过纳米孔。这说明,每次用DNA样品1和2冲洗纳米孔系统都观察到DNA移位。
进行这些对照以确认,观察到的DNA移位数目的减少(参见实施例4)是由于甲基-β-环糊精从膜表面去除胆固醇,而不是防止链进入孔。该对照测试了环糊精是否可以沿着DNA的长度结合,阻碍DNA螺旋穿过孔的能力,并且因此防止该链被检测到,但是它仍然连接在膜上。在这些实验中,使用了游离DNA,其没有锚将其偶联到膜上,如果环糊精的相互作用特异性地限于胆固醇,则在这种情况下环糊精应该对DNA没有影响。因此,观察到的DNA移位数目的任何减少都是由于DNA主体的结合。在存在或不存在环糊精的情况下观察到DNA移位数目没有差异,这表明存在于系统中的环糊精不结合游离DNA,不阻止其穿过纳米孔的移位。
实施例2
该实施例显示了进一步的对照实验,其说明了当将偶联的DNA的第一样品加入到纳米孔系统中,然后加入第二样品,而不用没有DNA存在的解偶联剂或缓冲液冲洗系统时,在限定的时期内检测到的解旋酶控制的DNA移动的数目保持相当恒定,两个样品都观察到解旋酶控制的DNA移动。
材料和方法
本研究中使用的链来自λ基因组的45,042bp和48,487bp之间的区域。通过聚合酶PCR方法制备分析物,以根据需要在模板和模板互补链中每一个的限定末端包含杂交位点。对λ基因组DNA进行PCR。
使用KAPA HiFi 2x Master mix,λDNA(NEB)和引物SEQ ID NO:32和SEQ ID NO:33制备DNA模板(SEQ ID NO:31,其对应于与SEQ ID NO:47杂交的标记为A1的链的序列,SEQID NO:47对应于标记为A2的链的序列,参见图1(1))。使反应循环20次,通过在SephacrylS1000柱上凝胶过滤而纯化正确大小的产物,并使用Millipore Ultracel 15 50kDa浓缩器浓缩至0.25mg/ml。
根据相同的反应混合物制备用于电生理学实验的DNA构建体(X和Y);2x LongAmpTaq master mix,300nM引物1和2或3和4,1.2ng ul-1 DNA模板(SEQ ID NO:31,其对应于与SEQ ID NO:47杂交的标记A1的链的序列,SEQ ID NO:47对应于标记A2的链的序列,参见图1(1))。DNA构建体均根据相同的循环程序扩增;94℃2分钟,[94℃15秒,58℃30秒,65℃2分钟]12和65℃5分钟。DNA构建体根据制造商的说明书全部从0.8%琼脂糖凝胶中纯化(QiagenGel Extraction试剂盒),然后SPRI根据制造商的说明书进行纯化(Agencourt AMPure珠)。
对于DNA构建体X=SEQ ID NO:34,其3′端连接到四个iSpC3间隔区,所述间隔区在其相对端连接到到SEQ ID NO:35的5′端;SEQ ID NO:35在3′端连接到四个iSpC3间隔区,所述间隔区在其相对端连接到四个5-硝基吲哚,5-硝基吲哚连接到SEQ ID NO:39的3′端。用于产生构建体X的引物是引物1——SEQ ID NO:34,其3′端连接到四个iSpC3间隔区,所述间隔区在其另一端连接到SEQ ID NO:35的5′端;SEQ ID NO:35还在3′端连接到四个iSpC3间隔区,所述间隔区在其相对端连接到四个5-硝基吲哚,5-硝基吲哚连接到SEQ ID NO:36的5′端,和引物2——SEQ ID NO:37,其3′端连接到四个5-硝基吲哚,5-硝基吲哚在相对端连接到SEQ ID NO:38的5′端。
然后将构建体X与SEQ ID NO:41杂交,所述SEQ ID NO:41在3′端连接到6个iSp18间隔区,所述间隔区在其相对端连接到两个胸腺嘧啶和3′胆固醇TEG(图1(2)示出了构建体X的卡通示意图)。将系链在5倍过量下在室温在25mM磷酸钾缓冲液,151mM氯化钾,pH 8.0中退火10分钟。
对于DNA构建体Y=SEQ ID NO:34,其3′端连接到四个iSpC3间隔区,所述间隔区在相对端连接到在SEQ ID NO:37的5′端;SEQ ID NO:37在3′端连接到四个iSpC3间隔区,所述间隔区在其相对端连接到四个5-硝基吲哚,5-硝基吲哚连接到SEQ ID NO:40的5′端。用于产生构建体Y的引物是引物3——SEQ ID NO:34,其3′端连接到四个iSpC3间隔区,所述间隔区在其相对端连接到SEQ ID NO:37的5′端;SEQ ID NO:37还在3′端连接到四个iSpC3间隔区,所述间隔区在相对端连接到四个5-硝基吲哚,5-硝基吲哚连接到SEQ ID NO:38的5′端,和引物4——SEQ ID NO:35,在3′端连接到四个5-硝基吲哚,5-硝基吲哚在相对端连接到SEQ ID NO:36的5′端。
然后将构建体Y与SEQ ID NO:30杂交,所述SEQ IDNO:30在3′端连接到6个iSp18间隔区,所述间隔区在相对端连接到两个胸腺嘧啶和3′胆固醇TEG(图1(3)示出了构建体X的卡通示意图)。将系链在5倍过量下在室温在25mM磷酸钾缓冲液,151mM氯化钾,pH 8.0中退火10分钟。
在建立实验之前,将具有适当系链的DNA构建体X和Y(储液浓度20nM,添加至纳米孔系统的终浓度为0.1nM)独立地用所述试剂孵育。首先,在缓冲液(151mM KCl,25mM磷酸盐,2mM EDTA,pH8.0)中将所述DNA用T4Dda-E94C/A360C(储液浓度250nM,添加到纳米孔系统的终浓度为1nM,具有突变E94C/A360C的SEQ ID NO:24)在室温预孵育5分钟。5分钟后,将TMAD(500μM)加入到预混物中,将混合物再孵育5分钟。最后,向预混合物中加入MgCl2(10mM终浓度),ATP(2.5mM终浓度)和缓冲液(150mM亚铁氰化钾(II),150mM铁氰化钾和25mM磷酸钾pH 8.0)。
在缓冲液(25mM磷酸钾,150mM亚铁氰化钾(II),150mM铁氰化钾(III),pH 8.0)中从插入嵌段共聚物中的单个MspA纳米孔(MspA-B2C)获得电测量值。在实现单个孔插入嵌段共聚物后,将缓冲液(2mL,25mM磷酸钾pH 8.0,150mM亚铁氰化钾(II)和150mM铁氰化钾(III))流过系统以去除任何过量MspA纳米孔。然后将酶(T4Dda-E94C/A360C,1nM终浓度),DNA构建体X(0.1nM终浓度),燃料(MgCl2 10mM终浓度,ATP 2.5mM终浓度)的预混合物(总共150μL)加入到单纳米孔实验系统中,并且实验在120mV的保持电位下运行2小时,并监测解旋酶控制的DNA移动。两小时后,停止实验,将电位设置为零,然后将没有解偶联剂或冲洗缓冲液的DNA构建体Y/酶预混物(总共150μL)直接加入系统中。然后将实验在120mV的保持电位下再运行2小时,并监测解旋酶控制的DNA移动。
结果和讨论
由λ噬菌体基因组的相同3.8kb片段制备DNA构建体X和Y(分别显示于图1(a)和(b))。连接适配体以在双链体的一端产生突出的“前导体”,这允许通过孔进行捕获和旋入以及提供酶结合位点。另一端是钝化的,因此只有具有前导体的链被捕获并测序。两个样品具有连接到相反末端的适配体,使得前导体连接到DNA构建体X中的链A1(图1(2)中所示)和DNA构建体Y中的链A2(图1(3)中所示)。这意味着DNA构建体X和Y使用仅映射到λ基因组的不同区域的序列产生可检测的链移动。这些移动很容易区分,因此提供了一种方便的方法来识别两个不同的测试样品;然而,也可以使用具有不同序列的任何其他样品。
对于DNA构建体X和Y,用T4Dda-E94C/A360C观察到解旋酶控制的DNA移动。图2显示了纳米孔处于未阻断状态(显示为浅灰色)时相比于解旋酶DNA移动发生且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的实验时间进程。对于第一个2100秒,没有DNA存在于系统中,因此,纳米孔处于未阻断状态。在2400秒时加入DNA构建体X,并且在约80%的时间内发生解旋酶控制的DNA穿过纳米孔的移动。然后将DNA构建体Y在7200秒时流入纳米孔系统,并且在大约80%的时间内观察到解旋酶控制的DNA穿过纳米孔移动。
加入构建体X后,观察到的解旋酶控制的DNA移动都被认定为对应于该构建体。当构建体Y流入系统时,检测到对应于Y的解旋酶控制的DNA移动以及对应于构建体X的显著数量的移动。实验数据显示,在整个实验中检测的解旋酶控制的DNA移动的速率保持相当恒定,通过向系统中加入构建体Y,没有额外的冲洗或解偶联剂,两个样品都检测到解旋酶控制的DNA移动。
实施例3
该实施例说明当将偶联的DNA构建体X加入到纳米孔系统中时,不可能简单地通过用大量体积的缓冲液冲洗系统来去除样品。
材料和方法
如实施例2所述制备DNA构建体X和Y。如实施例2所述,用酶预孵育DNA构建体,用于产生构建体X和构建体Y预混物。
如实施例2中所述建立纳米孔实验系统。将DNA构建体X/酶预混物(总共300μL)加入到实验系统中,并且实验在120mV的保持电位下运行2小时,监测解旋酶控制的DNA移动。两小时后,停止实验方案,将电位设置为零,并将缓冲液(10mL,150mM亚铁氰化钾(II),150mM铁氰化钾(III),25mM磷酸钾pH 8.0)流过纳米孔系统以便试图去除偶联的DNA构建体X。在缓冲液冲洗后,在没有额外的DNA加入系统并在120mV的保持电位下进行实验两小时,并监测解旋酶控制的DNA移动。最后,将DNA构建体Y/酶预混物(总共300μL)加入到实验系统中,并且在120mV的保持电位下运行实验2小时,并监测解旋酶控制的DNA移动。
结果和讨论
对于DNA构建体X和Y,用T4Dda-E94C/A360C都观察到解旋酶控制的DNA移动。图3显示了纳米孔处于未阻断状态(显示为浅灰色)时相比于解旋酶DNA移动发生且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的实验时间进程的一部分。对于第一个2400秒,没有DNA存在于系统中,因此,纳米孔处于未阻断状态。在2700秒时加入DNA构建体X,约80%的时间发生解旋酶控制的DNA穿过纳米孔移动。在7500秒,使缓冲液(10mL)流过系统,然后监测纳米孔由于解旋酶控制的DNA移动而被部分阻断的时间百分比。用缓冲液冲洗后,约50%的时间发生解旋酶控制的DNA穿过纳米孔移动。这表明存在于系统中的偶联的DNA构建体X的量已经通过缓冲液冲洗而减少,然而,仍然检测到大量解旋酶控制的DNA移动。在添加DNA构建体Y时,检测到对应于Y的解旋酶控制的DNA移动以及对应于仍存在于系统中的构建体X的大量的解旋酶控制的DNA移动。
实施例4
该实施例说明了如何使用甲基-β-环糊精来将使用胆固醇TEG偶联到膜上的DNA从膜上解偶联。将甲基-β-环糊精的溶液加入到纳米孔系统中,达1,10和30分钟,并且在每次孵育后监测在限定的时间段内检测到的解旋酶控制的DNA移动的数量。该实验说明,即使使用仅一分钟的孵育时间,也能检测到DNA与膜的显著解偶联。
材料和方法
如实施例2所述制备DNA构建体X和Y。如实施例2所述,用酶预孵育DNA构建体,从而产生构建体X和构建体Y预混物。
如实施例2中所述设置纳米孔实验系统。将DNA构建体X/酶预混物(总共150μL)加入到实验系统中,并且实验在120mV的保持电位下运行2小时,监测解旋酶控制的DNA移动。两小时后,停止实验方案,将电位设置为零,并将甲基-β-环糊精(150μL,100μM)流至纳米孔系统上,并孵育1,10或30分钟,以尝试去除偶联的DNA构建体X。在适当的孵育时间后,将缓冲液(150μL,150mM亚铁氰化钾(II),150mM铁氰化钾(III),25mM磷酸钾,pH 8.0)冲洗流过系统以去除任何解偶联的DNA和过量的甲基-β-环糊精。在缓冲液冲洗之后,在没有额外的DNA加入系统并在120mV的保持电位下进行实验两小时,并监测解旋酶控制的DNA移动。最后,将DNA构建体Y/酶预混物(总共150μL)加入到实验系统中,并且在120mV的保持电位下运行实验2小时,并监测解旋酶控制的DNA移动。然后对DNA构建体Y重复相同的解偶联过程。
结果和讨论
对于DNA构建体X和Y,用T4Dda-E94C/A360C都观察到解旋酶控制的DNA移动。图4,图5和图6显示了纳米孔处于未阻断状态(显示为浅灰色)时相比于解旋酶DNA移动发生且纳米孔被DNA链部分阻断(显示为黑色)时的时间百分比的实验时间进程的一部分。图4,5和6分别对应于使用甲基-β-环糊精的孵育时间为1,10和30分钟。对于所有三个实验,在添加DNA之前,很少观察到或没有观察到解旋酶控制的DNA移动。在添加构建体X时,在约80%的时间内发生解旋酶控制的DNA穿过纳米孔移动。在针对不同孵育期和相应的缓冲液冲洗而加入甲基-β-环糊精后,纳米孔由于解旋酶控制的DNA移动而被部分阻断的时间百分比急剧降低至约20%,并且当孵育期为30分钟时,降至小于10%。这表明甲基-β-环糊精成功地将使用胆固醇偶联至膜的DNA从膜解偶联。与用缓冲液冲洗相比,甲基-β-环糊精显著地使更多偶联的DNA解偶联。
在向系统中加入DNA构建体Y后,鉴定了对应于构建体Y的解旋酶控制的DNA移动。小部分移动被鉴定为对应于构建体X,然而,相比于其中构建体X未从系统中冲洗(参见实施例2)或其中系链的构建体X用10mL缓冲液处理以试图将其从系统中去除(参见实施例3)的实验,被鉴定为X的事件的比例显著减少。对构建体Y重复甲基-β-环糊精解偶联过程,并且还显示使用该方法可以成功地将构建体Y与膜解偶联。
实施例5
该实施例说明了DNA如何通过结合有延伸链(extender)(其3′端还具有胆固醇)的5′脱硫生物素的链霉亲和素偶联到膜上,其中所述DNA已经具有生物素系链杂交到其上并且已经用链霉亲和素预孵育(参见图7的卡通示意图)。然后可以通过用游离生物素冲洗系统将该DNA构建体与膜解偶联。由于生物素对链霉亲和素比脱硫生物素对链霉亲和素具有更强的结合亲和力,因此,当生物素加入到系统中时,生物素竞争掉脱硫生物素,这确保了链的有效去除。这使得延伸链偶联到双层上并可用于将第二DNA构建体偶联到膜上。
材料和方法
实施例5中使用的DNA构建体显示于图7中。通过在50℃下杂交SEQ ID NO:45(50nM,其具有连接至其3′末端的6个iSp18间隔区,所述间隔区在相对端连接到两个胸腺嘧啶和3′生物素TEG)与由SEQ ID NO:42组成的DNA链10分钟,然后缓慢冷却而制备DNA构建体,其中所述SEQ ID NO:42在其3′端连接到四个iSpC3间隔区,所述间隔区在相对端连接到SEQ ID NO:43(50nM)的5′端。将链霉亲和素(终浓度50nM)加入到DNA混合物中(终浓度25nM),并在室温下孵育10分钟。该复合体将被称为DNA构建体P。
如实施例2中所述设置纳米孔实验系统。在120mV的施加电位下、没有向系统中添加DNA下进行对照实验15分钟。然后将脱硫生物素延伸链(SEQ ID NO:46,其5′端连接有脱硫生物素且3′端连接有胆固醇TEG)加入到纳米孔系统中,实验运行15分钟,使其偶联到膜。将DNA构建体P加入到实验系统(25nM)中,并且实验在120mV的施加电位下运行30分钟。然后向系统中加入游离生物素(50μM),实验进行另外30分钟。在生物素孵育后,使缓冲液流过系统(1mL,625mM KCl,100mM HEPES,pH8)以去除任何过量的生物素和解偶联的DNA。
结果和讨论
该实验说明了从膜上解偶联DNA构建体的另一种方法。图8示出了上述完整实验的电流轨迹。图9示出了前述实验步骤的几个连续快照。图9(A)显示当系统中不存在DNA时,纳米孔是开放的并且显示出几个区块(block)。*1标记了实验中当将延伸的脱硫生物素添加到系统中的点,未观察到对应于该短片段的电流区块。*2标记了将DNA构建体P加入系统的点。DNA的添加导致DNA电流区块,其一致地在70和100pA之间(参见图9A(轨迹的最后部分,9B是轨迹的第一部分))。*3标记了向系统中添加生物素(50μM)的点。显然,在添加生物素后,观察到的DNA电流区块的数量急剧减少。最后,*4对应于缓冲液冲洗步骤,其中DNA和生物素从系统中去除。该实验表明,通过将生物素冲洗到系统中,DNA构建体P可以从膜上解偶联。由于生物素对链霉亲和素比对脱硫生物素对链霉亲和素具有更强的结合亲和力,因此当生物素加入到系统中时,它竞争掉脱硫生物素,这确保了链的有效去除。生物素还与链霉亲和素上的其他空白结合位点结合,并从系统中去除整个链霉亲和素DNA复合体。这使得延伸链偶联到双层上并可用于将第二DNA构建体偶联到膜上。
实施例6
该实施例说明了如何使用(2-羟丙基)-β-环糊精从膜上解偶联使用胆固醇TEG与膜偶联的DNA。将各种不同浓度的(2-羟丙基)-β-环糊精加入到纳米孔系统中,监测对每个纳米孔在规定时间内检测到的解旋酶控制的DNA移动的数量的%变化。该实验说明,低至20mM(2-羟丙基)-β-环糊精的浓度导致孵育后对每个纳米孔检测到的解旋酶控制的DNA移动的数量减少(参见表2)。
材料和方法
如实施例2所述制备DNA构建体X。如实施例2所述,用酶预孵育DNA构建体,来制备构建体X预混物。
如实施例2所述设置纳米孔实验系统。将DNA构建体X/酶预混物(总共150μL)加入到实验系统中,并且实验在140mV的保持电位下运行2小时,监测解旋酶控制的DNA移动。两小时后,停止实验方案,将电位设置为零,并将(2-羟丙基)-β-环糊精(150μL,在500mM KCl中20mM,50mM,100mM或200mM,25mM磷酸钾pH8)流到纳米孔系统上并孵育10分钟,以试图去除偶联的DNA构建体X。在孵育后,将缓冲液(150μL,500mM KCl,25mM磷酸钾pH8)冲洗流过系统以去除任何解偶联的DNA和过量的(2-羟丙基)-β-环糊精。在缓冲液冲洗后,将缓冲液(含有燃料)加入系统(150uL 500mM KCl,25mM磷酸钾,2mM ATP,2mM MgCl 2pH8),没有额外的DNA,在保持电位140mV下持续2小时,监测解旋酶控制DNA移动。
结果和讨论
对于DNA构建体X,用T4Dda-E94C/A360C观察到解旋酶控制的DNA移动。下表2显示在系统用不同浓度的(2-羟丙基)-β-环糊精孵育后,对每个纳米孔检测到解旋酶控制的DNA移动的数目的平均%变化。对于所有实验,在加入DNA之前,观察到很少或没有观察到解旋酶控制的DNA移动。添加构建体X后,发生解旋酶控制的DNA移动穿过纳米孔。在加入不同浓度的(2-羟丙基)-β-环糊精和相应的缓冲液冲洗后,对每个纳米孔检测的解旋酶控制的DNA移动的数量的平均百分比变化为至少50%,并且当在200mM浓度下孵育时高达90%。这表明(2-羟丙基)-β-环糊精成功地将使用胆固醇偶联到膜上的DNA从膜上解偶联。
表2
序列表
<110> 牛津纳米孔技术公司
<120> 方法
<130> N402334WO
<150> GB1406155.0
<151> 2014-04-04
<150> PCT/GB2014/052737
<151> 2014-09-10
<160> 47
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> 人工序列
<220>
<223> 耻垢分枝杆菌孔蛋白A突变体(Mycobacterium smegmatis)
(D90N/D91N/D93N/D118R/D134R/E193K)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> 人工序列
<220>
<223> 耻垢分枝杆菌孔蛋白A突变体
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> α-溶血素突变体 (E111N/K147N)
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> α-溶血素突变体 (E111N/K147N)
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> 耻垢分枝杆菌
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> 耻垢分枝杆菌
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> 耻垢分枝杆菌
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 1830
<212> DNA
<213> 枯草芽孢杆菌噬菌体(Bacillus subtilis phage) phi29
<400> 8
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 9
<211> 608
<212> PRT
<213> 枯草芽孢杆菌噬菌体 phi29
<400> 9
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 10
<211> 1390
<212> DNA
<213> 大肠杆菌
<400> 10
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 11
<211> 485
<212> PRT
<213> 大肠杆菌
<400> 11
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 12
<211> 804
<212> DNA
<213> 大肠杆菌
<400> 12
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 13
<211> 268
<212> PRT
<213> 大肠杆菌
<400> 13
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 14
<211> 1275
<212> DNA
<213> 嗜热栖热菌(Thermus thermophilus)
<400> 14
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 15
<211> 425
<212> PRT
<213> 嗜热栖热菌
<400> 15
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 16
<211> 738
<212> DNA
<213> 噬菌体λ
<400> 16
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 17
<211> 226
<212> PRT
<213> 噬菌体λ
<400> 17
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 18
<211> 760
<212> PRT
<213> 布氏拟甲烷球菌(Methanococcoides burtonii)
<400> 18
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 19
<211> 707
<212> PRT
<213> 海绵共生古菌(Cenarchaeum symbiosum)
<400> 19
Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu
1 5 10 15
Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala
20 25 30
Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu
50 55 60
Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu
65 70 75 80
Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu
85 90 95
Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala
100 105 110
Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg
115 120 125
Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly
130 135 140
Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly
145 150 155 160
Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser
165 170 175
Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile
180 185 190
Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val
195 200 205
Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp
210 215 220
Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp
225 230 235 240
Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala
245 250 255
Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val
260 265 270
Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala
275 280 285
Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu
290 295 300
Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn
305 310 315 320
Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile
325 330 335
Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro
340 345 350
Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser
355 360 365
Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly
370 375 380
Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val
385 390 395 400
Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu
405 410 415
Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile
420 425 430
His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp
435 440 445
Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu
450 455 460
Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu
465 470 475 480
Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met
485 490 495
Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr
500 505 510
Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu
515 520 525
Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe
530 535 540
Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala
545 550 555 560
Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg
565 570 575
Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys
580 585 590
Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val
595 600 605
Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His
610 615 620
Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg
625 630 635 640
Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys
645 650 655
Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys
660 665 670
Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val
675 680 685
Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg
690 695 700
Lys Gly Gly
705
<210> 20
<211> 720
<212> PRT
<213> 科超嗜热古菌(Thermococcus gammatolerans)
<400> 20
Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu
50 55 60
Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu
85 90 95
Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu
100 105 110
Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala
130 135 140
Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser
165 170 175
Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser
180 185 190
Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe
195 200 205
His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro
210 215 220
Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly
225 230 235 240
Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu
245 250 255
Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg
260 265 270
Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu
275 280 285
Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly
290 295 300
Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly
305 310 315 320
Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn
325 330 335
Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly
340 345 350
Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly
355 360 365
Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val
370 375 380
Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly
385 390 395 400
Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg
405 410 415
Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro
420 425 430
Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys
435 440 445
Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu
450 455 460
Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro
465 470 475 480
Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr
485 490 495
Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn
500 505 510
Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr
515 520 525
Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr
530 535 540
Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser
545 550 555 560
Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu
565 570 575
Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser
580 585 590
Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu
595 600 605
Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu
610 615 620
Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val
625 630 635 640
Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys
645 650 655
Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile
660 665 670
Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala
675 680 685
Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val
690 695 700
Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg
705 710 715 720
<210> 21
<211> 799
<212> PRT
<213> 亨氏甲烷螺菌(Methanospirillum hungatei)
<400> 21
Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys
1 5 10 15
His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile
50 55 60
Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly
85 90 95
Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn
100 105 110
Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn
115 120 125
Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val
130 135 140
His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile
145 150 155 160
Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr
180 185 190
Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr
195 200 205
Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly
210 215 220
Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly
245 250 255
Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser
260 265 270
Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly
275 280 285
Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn
305 310 315 320
Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala
340 345 350
Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe
385 390 395 400
Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala
405 410 415
Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His
420 425 430
Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe
435 440 445
Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile
450 455 460
Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu
465 470 475 480
Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro
485 490 495
Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro
500 505 510
Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln
515 520 525
Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu
530 535 540
Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu
545 550 555 560
Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr
565 570 575
Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly
580 585 590
Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu
595 600 605
Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser
610 615 620
Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser
625 630 635 640
Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala
645 650 655
Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg
660 665 670
Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg
675 680 685
Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser
690 695 700
Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile
705 710 715 720
Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile
725 730 735
Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp
740 745 750
Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn
755 760 765
Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp
770 775 780
Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys
785 790 795
<210> 22
<211> 1756
<212> PRT
<213> 大肠杆菌
<400> 22
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 23
<211> 726
<212> PRT
<213> 布氏拟甲烷球菌(Methanococcoides burtonii)
<400> 23
Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys
1 5 10 15
Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met
20 25 30
Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr
35 40 45
Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys
50 55 60
Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile
65 70 75 80
Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val
85 90 95
Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu
100 105 110
Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg
115 120 125
Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr
130 135 140
Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser
145 150 155 160
Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg
165 170 175
Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe
180 185 190
Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp
195 200 205
His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu
210 215 220
Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn
225 230 235 240
Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln
245 250 255
Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala
260 265 270
Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala
275 280 285
Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile
290 295 300
His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn
305 310 315 320
Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr
325 330 335
Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly
340 345 350
Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile
355 360 365
Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu
370 375 380
Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg
385 390 395 400
Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu
405 410 415
Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met
420 425 430
Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys
435 440 445
Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met
450 455 460
Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile
465 470 475 480
Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu
485 490 495
Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn
500 505 510
Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp
515 520 525
Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala
530 535 540
Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val
545 550 555 560
Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu
565 570 575
Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser
580 585 590
Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg
595 600 605
Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp
610 615 620
Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly
625 630 635 640
Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg
645 650 655
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
660 665 670
Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly
675 680 685
Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe
690 695 700
Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe
705 710 715 720
Met Asp Asn Asp Glu Gln
725
<210> 24
<211> 439
<212> PRT
<213> 肠杆菌噬菌体(Enterobacteria phage)T4
<400> 24
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 25
<211> 970
<212> PRT
<213> 肉毒杆菌(Clostridium botulinum)
<400> 25
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 26
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列。
<400> 26
tttttttttt cttttttttc ttttttggtt ggttgttggt tgg 43
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列。
<400> 27
tttttttttt cttttttttt 20
<210> 28
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列。
<400> 28
ggttggttgt tggttgg 17
<210> 29
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列。
<400> 29
ttaatgctaa tcgtgatagg ggt 23
<210> 30
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 30
gttctactaa accgtgtcaa tcagtgtc 28
<210> 31
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 31
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgcgct aacaacctcc tgccgttttg cccgtgcata tcggtcacga acaaatctga 120
ttactaaaca cagtagcctg gatttgttct atcagtaatc gaccttattc ctaattaaat 180
agagcaaatc cccttattgg gggtaagaca tgaagatgcc agaaaaacat gacctgttgg 240
ccgccattct cgcggcaaag gaacaaggca tcggggcaat ccttgcgttt gcaatggcgt 300
accttcgcgg cagatataat ggcggtgcgt ttacaaaaac agtaatcgac gcaacgatgt 360
gcgccattat cgcctagttc attcgtgacc ttctcgactt cgccggacta agtagcaatc 420
tcgcttatat aacgagcgtg tttatcggct acatcggtac tgactcgatt ggttcgctta 480
tcaaacgctt cgctgctaaa aaagccggag tagaagatgg tagaaatcaa taatcaacgt 540
aaggcgttcc tcgatatgct ggcgtggtcg gagggaactg ataacggacg tcagaaaacc 600
agaaatcatg gttatgacgt cattgtaggc ggagagctat ttactgatta ctccgatcac 660
cctcgcaaac ttgtcacgct aaacccaaaa ctcaaatcaa caggcgccgg acgctaccag 720
cttctttccc gttggtggga tgcctaccgc aagcagcttg gcctgaaaga cttctctccg 780
aaaagtcagg acgctgtggc attgcagcag attaaggagc gtggcgcttt acctatgatt 840
gatcgtggtg atatccgtca ggcaatcgac cgttgcagca atatctgggc ttcactgccg 900
ggcgctggtt atggtcagtt cgagcataag gctgacagcc tgattgcaaa attcaaagaa 960
gcgggcggaa cggtcagaga gattgatgta tgagcagagt caccgcgatt atctccgctc 1020
tggttatctg catcatcgtc tgcctgtcat gggctgttaa tcattaccgt gataacgcca 1080
ttacctacaa agcccagcgc gacaaaaatg ccagagaact gaagctggcg aacgcggcaa 1140
ttactgacat gcagatgcgt cagcgtgatg ttgctgcgct cgatgcaaaa tacacgaagg 1200
agttagctga tgctaaagct gaaaatgatg ctctgcgtga tgatgttgcc gctggtcgtc 1260
gtcggttgca catcaaagca gtctgtcagt cagtgcgtga agccaccacc gcctccggcg 1320
tggataatgc agcctccccc cgactggcag acaccgctga acgggattat ttcaccctca 1380
gagagaggct gatcactatg caaaaacaac tggaaggaac ccagaagtat attaatgagc 1440
agtgcagata gagttgccca tatcgatggg caactcatgc aattattgtg agcaatacac 1500
acgcgcttcc agcggagtat aaatgcctaa agtaataaaa ccgagcaatc catttacgaa 1560
tgtttgctgg gtttctgttt taacaacatt ttctgcgccg ccacaaattt tggctgcatc 1620
gacagttttc ttctgcccaa ttccagaaac gaagaaatga tgggtgatgg tttcctttgg 1680
tgctactgct gccggtttgt tttgaacagt aaacgtctgt tgagcacatc ctgtaataag 1740
cagggccagc gcagtagcga gtagcatttt tttcatggtg ttattcccga tgctttttga 1800
agttcgcaga atcgtatgtg tagaaaatta aacaaaccct aaacaatgag ttgaaatttc 1860
atattgttaa tatttattaa tgtatgtcag gtgcgatgaa tcgtcattgt attcccggat 1920
taactatgtc cacagccctg acggggaact tctctgcggg agtgtccggg aataattaaa 1980
acgatgcaca cagggtttag cgcgtacacg tattgcatta tgccaacgcc ccggtgctga 2040
cacggaagaa accggacgtt atgatttagc gtggaaagat ttgtgtagtg ttctgaatgc 2100
tctcagtaaa tagtaatgaa ttatcaaagg tatagtaata tcttttatgt tcatggatat 2160
ttgtaaccca tcggaaaact cctgctttag caagattttc cctgtattgc tgaaatgtga 2220
tttctcttga tttcaaccta tcataggacg tttctataag atgcgtgttt cttgagaatt 2280
taacatttac aaccttttta agtcctttta ttaacacggt gttatcgttt tctaacacga 2340
tgtgaatatt atctgtggct agatagtaaa tataatgtga gacgttgtga cgttttagtt 2400
cagaataaaa caattcacag tctaaatctt ttcgcacttg atcgaatatt tctttaaaaa 2460
tggcaacctg agccattggt aaaaccttcc atgtgatacg agggcgcgta gtttgcatta 2520
tcgtttttat cgtttcaatc tggtctgacc tccttgtgtt ttgttgatga tttatgtcaa 2580
atattaggaa tgttttcact taatagtatt ggttgcgtaa caaagtgcgg tcctgctggc 2640
attctggagg gaaatacaac cgacagatgt atgtaaggcc aacgtgctca aatcttcata 2700
cagaaagatt tgaagtaata ttttaaccgc tagatgaaga gcaagcgcat ggagcgacaa 2760
aatgaataaa gaacaatctg ctgatgatcc ctccgtggat ctgattcgtg taaaaaatat 2820
gcttaatagc accatttcta tgagttaccc tgatgttgta attgcatgta tagaacataa 2880
ggtgtctctg gaagcattca gagcaattga ggcagcgttg gtgaagcacg ataataatat 2940
gaaggattat tccctggtgg ttgactgatc accataactg ctaatcattc aaactattta 3000
gtctgtgaca gagccaacac gcagtctgtc actgtcagga aagtggtaaa actgcaactc 3060
aattactgca atgccctcgt aattaagtga atttacaata tcgtcctgtt cggagggaag 3120
aacgcgggat gttcattctt catcactttt aattgatgta tatgctctct tttctgacgt 3180
tagtctccga cggcaggctt caatgaccca ggctgagaaa ttcccggacc ctttttgctc 3240
aagagcgatg ttaatttgtt caatcatttg gttaggaaag cggatgttgc gggttgttgt 3300
tctgcgggtt ctgttcttcg ttgacatgag gttgccccgt attcagtgtc gctgatttgt 3360
attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga tacctgcgtc 3420
ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat gtagatgata 3480
atcattatca ctttacgggt cctttccggt gaaaaaaaag gtaccaaaaa aaacatcgtc 3540
gtgagtagtg aaccgtaagc 3560
<210> 32
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 32
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgcgct aacaacctcc tgccg 85
<210> 33
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 33
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60
acccgtaaag tg 72
<210> 34
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 34
tttttttttt tttttttttt tttttttttt tttttttttt tttttt 46
<210> 35
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 35
ggttgtttct gttggtgctg atattgc 27
<210> 36
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 36
gccatcagat tgtgtttgtt agtcgct 27
<210> 37
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 37
acactgattg acacggttta gtagaac 27
<210> 38
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 38
gcttacggtt cactactcac gacgatg 27
<210> 39
<211> 3587
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 39
gccatcagat tgtgtttgtt agtcgctgcc atcagattgt gtttgttagt cgcttttttt 60
ttttggaatt ttttttttgg aatttttttt ttgcgctaac aacctcctgc cgttttgccc 120
gtgcatatcg gtcacgaaca aatctgatta ctaaacacag tagcctggat ttgttctatc 180
agtaatcgac cttattccta attaaataga gcaaatcccc ttattggggg taagacatga 240
agatgccaga aaaacatgac ctgttggccg ccattctcgc ggcaaaggaa caaggcatcg 300
gggcaatcct tgcgtttgca atggcgtacc ttcgcggcag atataatggc ggtgcgttta 360
caaaaacagt aatcgacgca acgatgtgcg ccattatcgc ctagttcatt cgtgaccttc 420
tcgacttcgc cggactaagt agcaatctcg cttatataac gagcgtgttt atcggctaca 480
tcggtactga ctcgattggt tcgcttatca aacgcttcgc tgctaaaaaa gccggagtag 540
aagatggtag aaatcaataa tcaacgtaag gcgttcctcg atatgctggc gtggtcggag 600
ggaactgata acggacgtca gaaaaccaga aatcatggtt atgacgtcat tgtaggcgga 660
gagctattta ctgattactc cgatcaccct cgcaaacttg tcacgctaaa cccaaaactc 720
aaatcaacag gcgccggacg ctaccagctt ctttcccgtt ggtgggatgc ctaccgcaag 780
cagcttggcc tgaaagactt ctctccgaaa agtcaggacg ctgtggcatt gcagcagatt 840
aaggagcgtg gcgctttacc tatgattgat cgtggtgata tccgtcaggc aatcgaccgt 900
tgcagcaata tctgggcttc actgccgggc gctggttatg gtcagttcga gcataaggct 960
gacagcctga ttgcaaaatt caaagaagcg ggcggaacgg tcagagagat tgatgtatga 1020
gcagagtcac cgcgattatc tccgctctgg ttatctgcat catcgtctgc ctgtcatggg 1080
ctgttaatca ttaccgtgat aacgccatta cctacaaagc ccagcgcgac aaaaatgcca 1140
gagaactgaa gctggcgaac gcggcaatta ctgacatgca gatgcgtcag cgtgatgttg 1200
ctgcgctcga tgcaaaatac acgaaggagt tagctgatgc taaagctgaa aatgatgctc 1260
tgcgtgatga tgttgccgct ggtcgtcgtc ggttgcacat caaagcagtc tgtcagtcag 1320
tgcgtgaagc caccaccgcc tccggcgtgg ataatgcagc ctccccccga ctggcagaca 1380
ccgctgaacg ggattatttc accctcagag agaggctgat cactatgcaa aaacaactgg 1440
aaggaaccca gaagtatatt aatgagcagt gcagatagag ttgcccatat cgatgggcaa 1500
ctcatgcaat tattgtgagc aatacacacg cgcttccagc ggagtataaa tgcctaaagt 1560
aataaaaccg agcaatccat ttacgaatgt ttgctgggtt tctgttttaa caacattttc 1620
tgcgccgcca caaattttgg ctgcatcgac agttttcttc tgcccaattc cagaaacgaa 1680
gaaatgatgg gtgatggttt cctttggtgc tactgctgcc ggtttgtttt gaacagtaaa 1740
cgtctgttga gcacatcctg taataagcag ggccagcgca gtagcgagta gcattttttt 1800
catggtgtta ttcccgatgc tttttgaagt tcgcagaatc gtatgtgtag aaaattaaac 1860
aaaccctaaa caatgagttg aaatttcata ttgttaatat ttattaatgt atgtcaggtg 1920
cgatgaatcg tcattgtatt cccggattaa ctatgtccac agccctgacg gggaacttct 1980
ctgcgggagt gtccgggaat aattaaaacg atgcacacag ggtttagcgc gtacacgtat 2040
tgcattatgc caacgccccg gtgctgacac ggaagaaacc ggacgttatg atttagcgtg 2100
gaaagatttg tgtagtgttc tgaatgctct cagtaaatag taatgaatta tcaaaggtat 2160
agtaatatct tttatgttca tggatatttg taacccatcg gaaaactcct gctttagcaa 2220
gattttccct gtattgctga aatgtgattt ctcttgattt caacctatca taggacgttt 2280
ctataagatg cgtgtttctt gagaatttaa catttacaac ctttttaagt ccttttatta 2340
acacggtgtt atcgttttct aacacgatgt gaatattatc tgtggctaga tagtaaatat 2400
aatgtgagac gttgtgacgt tttagttcag aataaaacaa ttcacagtct aaatcttttc 2460
gcacttgatc gaatatttct ttaaaaatgg caacctgagc cattggtaaa accttccatg 2520
tgatacgagg gcgcgtagtt tgcattatcg tttttatcgt ttcaatctgg tctgacctcc 2580
ttgtgttttg ttgatgattt atgtcaaata ttaggaatgt tttcacttaa tagtattggt 2640
tgcgtaacaa agtgcggtcc tgctggcatt ctggagggaa atacaaccga cagatgtatg 2700
taaggccaac gtgctcaaat cttcatacag aaagatttga agtaatattt taaccgctag 2760
atgaagagca agcgcatgga gcgacaaaat gaataaagaa caatctgctg atgatccctc 2820
cgtggatctg attcgtgtaa aaaatatgct taatagcacc atttctatga gttaccctga 2880
tgttgtaatt gcatgtatag aacataaggt gtctctggaa gcattcagag caattgaggc 2940
agcgttggtg aagcacgata ataatatgaa ggattattcc ctggtggttg actgatcacc 3000
ataactgcta atcattcaaa ctatttagtc tgtgacagag ccaacacgca gtctgtcact 3060
gtcaggaaag tggtaaaact gcaactcaat tactgcaatg ccctcgtaat taagtgaatt 3120
tacaatatcg tcctgttcgg agggaagaac gcgggatgtt cattcttcat cacttttaat 3180
tgatgtatat gctctctttt ctgacgttag tctccgacgg caggcttcaa tgacccaggc 3240
tgagaaattc ccggaccctt tttgctcaag agcgatgtta atttgttcaa tcatttggtt 3300
aggaaagcgg atgttgcggg ttgttgttct gcgggttctg ttcttcgttg acatgaggtt 3360
gccccgtatt cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt taagttgatg 3420
cagatcaatt aatacgatac ctgcgtcata attgattatt tgacgtggtt tgatggcctc 3480
cacgcacgtt gtgatatgta gatgataatc attatcactt tacgggtcct ttccggtgaa 3540
aaaaaaggta ccaaaaaaaa catcgtcgtg agtagtgaac cgtaagc 3587
<210> 40
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 40
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60
acccgtaaag tgataatgat tatcatctac atatcacaac gtgcgtggag gccatcaaac 120
cacgtcaaat aatcaattat gacgcaggta tcgtattaat tgatctgcat caacttaacg 180
taaaaacaac ttcagacaat acaaatcagc gacactgaat acggggcaac ctcatgtcaa 240
cgaagaacag aacccgcaga acaacaaccc gcaacatccg ctttcctaac caaatgattg 300
aacaaattaa catcgctctt gagcaaaaag ggtccgggaa tttctcagcc tgggtcattg 360
aagcctgccg tcggagacta acgtcagaaa agagagcata tacatcaatt aaaagtgatg 420
aagaatgaac atcccgcgtt cttccctccg aacaggacga tattgtaaat tcacttaatt 480
acgagggcat tgcagtaatt gagttgcagt tttaccactt tcctgacagt gacagactgc 540
gtgttggctc tgtcacagac taaatagttt gaatgattag cagttatggt gatcagtcaa 600
ccaccaggga ataatccttc atattattat cgtgcttcac caacgctgcc tcaattgctc 660
tgaatgcttc cagagacacc ttatgttcta tacatgcaat tacaacatca gggtaactca 720
tagaaatggt gctattaagc atatttttta cacgaatcag atccacggag ggatcatcag 780
cagattgttc tttattcatt ttgtcgctcc atgcgcttgc tcttcatcta gcggttaaaa 840
tattacttca aatctttctg tatgaagatt tgagcacgtt ggccttacat acatctgtcg 900
gttgtatttc cctccagaat gccagcagga ccgcactttg ttacgcaacc aatactatta 960
agtgaaaaca ttcctaatat ttgacataaa tcatcaacaa aacacaagga ggtcagacca 1020
gattgaaacg ataaaaacga taatgcaaac tacgcgccct cgtatcacat ggaaggtttt 1080
accaatggct caggttgcca tttttaaaga aatattcgat caagtgcgaa aagatttaga 1140
ctgtgaattg ttttattctg aactaaaacg tcacaacgtc tcacattata tttactatct 1200
agccacagat aatattcaca tcgtgttaga aaacgataac accgtgttaa taaaaggact 1260
taaaaaggtt gtaaatgtta aattctcaag aaacacgcat cttatagaaa cgtcctatga 1320
taggttgaaa tcaagagaaa tcacatttca gcaatacagg gaaaatcttg ctaaagcagg 1380
agttttccga tgggttacaa atatccatga acataaaaga tattactata cctttgataa 1440
ttcattacta tttactgaga gcattcagaa cactacacaa atctttccac gctaaatcat 1500
aacgtccggt ttcttccgtg tcagcaccgg ggcgttggca taatgcaata cgtgtacgcg 1560
ctaaaccctg tgtgcatcgt tttaattatt cccggacact cccgcagaga agttccccgt 1620
cagggctgtg gacatagtta atccgggaat acaatgacga ttcatcgcac ctgacataca 1680
ttaataaata ttaacaatat gaaatttcaa ctcattgttt agggtttgtt taattttcta 1740
cacatacgat tctgcgaact tcaaaaagca tcgggaataa caccatgaaa aaaatgctac 1800
tcgctactgc gctggccctg cttattacag gatgtgctca acagacgttt actgttcaaa 1860
acaaaccggc agcagtagca ccaaaggaaa ccatcaccca tcatttcttc gtttctggaa 1920
ttgggcagaa gaaaactgtc gatgcagcca aaatttgtgg cggcgcagaa aatgttgtta 1980
aaacagaaac ccagcaaaca ttcgtaaatg gattgctcgg ttttattact ttaggcattt 2040
atactccgct ggaagcgcgt gtgtattgct cacaataatt gcatgagttg cccatcgata 2100
tgggcaactc tatctgcact gctcattaat atacttctgg gttccttcca gttgtttttg 2160
catagtgatc agcctctctc tgagggtgaa ataatcccgt tcagcggtgt ctgccagtcg 2220
gggggaggct gcattatcca cgccggaggc ggtggtggct tcacgcactg actgacagac 2280
tgctttgatg tgcaaccgac gacgaccagc ggcaacatca tcacgcagag catcattttc 2340
agctttagca tcagctaact ccttcgtgta ttttgcatcg agcgcagcaa catcacgctg 2400
acgcatctgc atgtcagtaa ttgccgcgtt cgccagcttc agttctctgg catttttgtc 2460
gcgctgggct ttgtaggtaa tggcgttatc acggtaatga ttaacagccc atgacaggca 2520
gacgatgatg cagataacca gagcggagat aatcgcggtg actctgctca tacatcaatc 2580
tctctgaccg ttccgcccgc ttctttgaat tttgcaatca ggctgtcagc cttatgctcg 2640
aactgaccat aaccagcgcc cggcagtgaa gcccagatat tgctgcaacg gtcgattgcc 2700
tgacggatat caccacgatc aatcataggt aaagcgccac gctccttaat ctgctgcaat 2760
gccacagcgt cctgactttt cggagagaag tctttcaggc caagctgctt gcggtaggca 2820
tcccaccaac gggaaagaag ctggtagcgt ccggcgcctg ttgatttgag ttttgggttt 2880
agcgtgacaa gtttgcgagg gtgatcggag taatcagtaa atagctctcc gcctacaatg 2940
acgtcataac catgatttct ggttttctga cgtccgttat cagttccctc cgaccacgcc 3000
agcatatcga ggaacgcctt acgttgatta ttgatttcta ccatcttcta ctccggcttt 3060
tttagcagcg aagcgtttga taagcgaacc aatcgagtca gtaccgatgt agccgataaa 3120
cacgctcgtt atataagcga gattgctact tagtccggcg aagtcgagaa ggtcacgaat 3180
gaactaggcg ataatggcgc acatcgttgc gtcgattact gtttttgtaa acgcaccgcc 3240
attatatctg ccgcgaaggt acgccattgc aaacgcaagg attgccccga tgccttgttc 3300
ctttgccgcg agaatggcgg ccaacaggtc atgtttttct ggcatcttca tgtcttaccc 3360
ccaataaggg gatttgctct atttaattag gaataaggtc gattactgat agaacaaatc 3420
caggctactg tgtttagtaa tcagatttgt tcgtgaccga tatgcacggg caaaacggca 3480
ggaggttgtt agcgcaaaaa aaaaattcca aaaaaaaaat tccaaaaaaa aaaagcgact 3540
aacaaacaca atctgatggc 3560
<210> 41
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 41
gcaatatcag caccaacaga aacaacctt 29
<210> 42
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> 实施例5中使用的序列。
<400> 42
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 60
tttttttttt ttttttggtt gtttctgttg gtgctgatat tgc 103
<210> 43
<211> 606
<212> DNA
<213> 人工序列
<220>
<223> 实施例5中使用的序列。
<400> 43
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgacgc tcagtaatgt gacgatagct gaaaactgta cgataaacgg tacgctgagg 120
gcggaaaaaa tcgtcgggga cattgtaaag gcggcgagcg cggcttttcc gcgccagcgt 180
gaaagcagtg tggactggcc gtcaggtacc cgtactgtca ccgtgaccga tgaccatcct 240
tttgatcgcc agatagtggt gcttccgctg acgtttcgcg gaagtaagcg tactgtcagc 300
ggcaggacaa cgtattcgat gtgttatctg aaagtactga tgaacggtgc ggtgatttat 360
gatggcgcgg cgaacgaggc ggtacaggtg ttctcccgta ttgttgacat gccagcgggt 420
cggggaaacg tgatcctgac gttcacgctt acgtccacac ggcattcggc agatattccg 480
ccgtatacgt ttgccagcga tgtgcaggtt atggtgatta agaaacaggc gctgggcatc 540
agcgtggtct gagtgtgaaa aaaaaggtac caaaaaaaac atcgtcgtga gtagtgaacc 600
gtaagc 606
<210> 44
<211> 606
<212> DNA
<213> 人工序列
<220>
<223> 实施例5中使用的序列。
<400> 44
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc acactcagac 60
cacgctgatg cccagcgcct gtttcttaat caccataacc tgcacatcgc tggcaaacgt 120
atacggcgga atatctgccg aatgccgtgt ggacgtaagc gtgaacgtca ggatcacgtt 180
tccccgaccc gctggcatgt caacaatacg ggagaacacc tgtaccgcct cgttcgccgc 240
gccatcataa atcaccgcac cgttcatcag tactttcaga taacacatcg aatacgttgt 300
cctgccgctg acagtacgct tacttccgcg aaacgtcagc ggaagcacca ctatctggcg 360
atcaaaagga tggtcatcgg tcacggtgac agtacgggta cctgacggcc agtccacact 420
gctttcacgc tggcgcggaa aagccgcgct cgccgccttt acaatgtccc cgacgatttt 480
ttccgccctc agcgtaccgt ttatcgtaca gttttcagct atcgtcacat tactgagcgt 540
caaaaaaaaa attccaaaaa aaaaattcca aaaaaaaaaa gcgactaaca aacacaatct 600
gatggc 606
<210> 45
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 实施例5中使用的序列。
<400> 45
gcaatatcag caccaacaga aacaacct 28
<210> 46
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 实施例5中使用的序列。
<400> 46
tttttttttt 10
<210> 47
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 实施例2中使用的序列。
<400> 47
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60
acccgtaaag tgataatgat tatcatctac atatcacaac gtgcgtggag gccatcaaac 120
cacgtcaaat aatcaattat gacgcaggta tcgtattaat tgatctgcat caacttaacg 180
taaaaacaac ttcagacaat acaaatcagc gacactgaat acggggcaac ctcatgtcaa 240
cgaagaacag aacccgcaga acaacaaccc gcaacatccg ctttcctaac caaatgattg 300
aacaaattaa catcgctctt gagcaaaaag ggtccgggaa tttctcagcc tgggtcattg 360
aagcctgccg tcggagacta acgtcagaaa agagagcata tacatcaatt aaaagtgatg 420
aagaatgaac atcccgcgtt cttccctccg aacaggacga tattgtaaat tcacttaatt 480
acgagggcat tgcagtaatt gagttgcagt tttaccactt tcctgacagt gacagactgc 540
gtgttggctc tgtcacagac taaatagttt gaatgattag cagttatggt gatcagtcaa 600
ccaccaggga ataatccttc atattattat cgtgcttcac caacgctgcc tcaattgctc 660
tgaatgcttc cagagacacc ttatgttcta tacatgcaat tacaacatca gggtaactca 720
tagaaatggt gctattaagc atatttttta cacgaatcag atccacggag ggatcatcag 780
cagattgttc tttattcatt ttgtcgctcc atgcgcttgc tcttcatcta gcggttaaaa 840
tattacttca aatctttctg tatgaagatt tgagcacgtt ggccttacat acatctgtcg 900
gttgtatttc cctccagaat gccagcagga ccgcactttg ttacgcaacc aatactatta 960
agtgaaaaca ttcctaatat ttgacataaa tcatcaacaa aacacaagga ggtcagacca 1020
gattgaaacg ataaaaacga taatgcaaac tacgcgccct cgtatcacat ggaaggtttt 1080
accaatggct caggttgcca tttttaaaga aatattcgat caagtgcgaa aagatttaga 1140
ctgtgaattg ttttattctg aactaaaacg tcacaacgtc tcacattata tttactatct 1200
agccacagat aatattcaca tcgtgttaga aaacgataac accgtgttaa taaaaggact 1260
taaaaaggtt gtaaatgtta aattctcaag aaacacgcat cttatagaaa cgtcctatga 1320
taggttgaaa tcaagagaaa tcacatttca gcaatacagg gaaaatcttg ctaaagcagg 1380
agttttccga tgggttacaa atatccatga acataaaaga tattactata cctttgataa 1440
ttcattacta tttactgaga gcattcagaa cactacacaa atctttccac gctaaatcat 1500
aacgtccggt ttcttccgtg tcagcaccgg ggcgttggca taatgcaata cgtgtacgcg 1560
ctaaaccctg tgtgcatcgt tttaattatt cccggacact cccgcagaga agttccccgt 1620
cagggctgtg gacatagtta atccgggaat acaatgacga ttcatcgcac ctgacataca 1680
ttaataaata ttaacaatat gaaatttcaa ctcattgttt agggtttgtt taattttcta 1740
cacatacgat tctgcgaact tcaaaaagca tcgggaataa caccatgaaa aaaatgctac 1800
tcgctactgc gctggccctg cttattacag gatgtgctca acagacgttt actgttcaaa 1860
acaaaccggc agcagtagca ccaaaggaaa ccatcaccca tcatttcttc gtttctggaa 1920
ttgggcagaa gaaaactgtc gatgcagcca aaatttgtgg cggcgcagaa aatgttgtta 1980
aaacagaaac ccagcaaaca ttcgtaaatg gattgctcgg ttttattact ttaggcattt 2040
atactccgct ggaagcgcgt gtgtattgct cacaataatt gcatgagttg cccatcgata 2100
tgggcaactc tatctgcact gctcattaat atacttctgg gttccttcca gttgtttttg 2160
catagtgatc agcctctctc tgagggtgaa ataatcccgt tcagcggtgt ctgccagtcg 2220
gggggaggct gcattatcca cgccggaggc ggtggtggct tcacgcactg actgacagac 2280
tgctttgatg tgcaaccgac gacgaccagc ggcaacatca tcacgcagag catcattttc 2340
agctttagca tcagctaact ccttcgtgta ttttgcatcg agcgcagcaa catcacgctg 2400
acgcatctgc atgtcagtaa ttgccgcgtt cgccagcttc agttctctgg catttttgtc 2460
gcgctgggct ttgtaggtaa tggcgttatc acggtaatga ttaacagccc atgacaggca 2520
gacgatgatg cagataacca gagcggagat aatcgcggtg actctgctca tacatcaatc 2580
tctctgaccg ttccgcccgc ttctttgaat tttgcaatca ggctgtcagc cttatgctcg 2640
aactgaccat aaccagcgcc cggcagtgaa gcccagatat tgctgcaacg gtcgattgcc 2700
tgacggatat caccacgatc aatcataggt aaagcgccac gctccttaat ctgctgcaat 2760
gccacagcgt cctgactttt cggagagaag tctttcaggc caagctgctt gcggtaggca 2820
tcccaccaac gggaaagaag ctggtagcgt ccggcgcctg ttgatttgag ttttgggttt 2880
agcgtgacaa gtttgcgagg gtgatcggag taatcagtaa atagctctcc gcctacaatg 2940
acgtcataac catgatttct ggttttctga cgtccgttat cagttccctc cgaccacgcc 3000
agcatatcga ggaacgcctt acgttgatta ttgatttcta ccatcttcta ctccggcttt 3060
tttagcagcg aagcgtttga taagcgaacc aatcgagtca gtaccgatgt agccgataaa 3120
cacgctcgtt atataagcga gattgctact tagtccggcg aagtcgagaa ggtcacgaat 3180
gaactaggcg ataatggcgc acatcgttgc gtcgattact gtttttgtaa acgcaccgcc 3240
attatatctg ccgcgaaggt acgccattgc aaacgcaagg attgccccga tgccttgttc 3300
ctttgccgcg agaatggcgg ccaacaggtc atgtttttct ggcatcttca tgtcttaccc 3360
ccaataaggg gatttgctct atttaattag gaataaggtc gattactgat agaacaaatc 3420
caggctactg tgtttagtaa tcagatttgt tcgtgaccga tatgcacggg caaaacggca 3480
ggaggttgtt agcgcaaaaa aaaaattcca aaaaaaaaat tccaaaaaaa aaaagcgact 3540
aacaaacaca atctgatggc 3560

Claims (48)

1.一种用于确定两个或更多个样品中两个或更多个分析物的存在,不存在或一个或多个特征的方法,包括:
(a)使用一个或多个锚将第一样品中的第一分析物偶联至膜;
(b)使所述第一分析物与存在于所述膜中的检测器相互作用,由此确定所述第一分析物的存在、不存在或一个或多个特征;
(c)使所述第一分析物与所述膜解偶联;
(d)使用一个或多个锚将第二样品中的第二分析物偶联至所述膜;和
(e)允许第二分析物与所述膜中的检测器相互作用,由此确定所述第二分析物的存在、不存在或一个或多个特征。
2.根据权利要求1所述的方法,其中(i)步骤(c)在步骤(d)之前执行,(ii)步骤(d)在步骤(c)之前执行,或(iii)步骤(c)和(d)同时执行。
3.根据权利要求1或2所述的方法,其中所述一个或多个锚包括多肽锚和/或疏水锚。
4.根据权利要求3所述的方法,其中所述疏水锚包括脂质、脂肪酸、固醇、碳纳米管或氨基酸。
5.根据前述权利要求中任一项所述的方法,其中步骤(c)包括通过从所述膜去除所述一个或多个锚而从所述膜解偶联所述第一分析物。
6.根据权利要求5所述的方法,其中步骤(c)包括使所述一个或多个锚与试剂接触,所述试剂对所述一个或多个锚具有比所述一个或多个锚对所述膜更高的亲和力。
7.根据权利要求6所述的方法,其中(i)所述一个或多个锚包括胆固醇,并且所述试剂是环糊精或其衍生物或脂质;(ii)所述一个或多个锚包括链霉亲和素、生物素或脱硫生物素,并且所述试剂是生物素、脱硫生物素或链霉亲和素;或(iii)所述一个或多个锚包括蛋白质,并且所述试剂是特异性结合所述蛋白质的抗体或其片段。
8.根据权利要求1至4中任一项所述的方法,其中步骤(c)包括使所述一个或多个锚与降低其偶联到所述膜的能力的试剂接触。
9.根据权利要求8的所述方法,其中(i)所述一个或多个锚包括胆固醇,并且所述试剂是胆固醇脱氢酶,(ii)所述一个或多个锚包括脂质,并且所述试剂是磷脂酶;或(iii)所述一个或多个锚包括蛋白质,并且所述试剂是蛋白酶或脲。
10.根据权利要求1至4中任一项所述的方法,其中步骤(c)包括通过从所述一个或多个锚分离所述第一分析物来使所述第一分析物从所述膜解偶联。
11.根据权利要求1至4中任一项所述的方法,其中步骤(c)包括通过将所述第一分析物和所述一个或多个锚与试剂接触来使所述第一分析物从所述膜解偶联,其中所述试剂与所述第一分析物竞争结合到所述一个或多个锚。
12.根据权利要求11所述的方法,其中所述试剂是与所述第一分析物竞争杂交到所述一个或多个锚的多核苷酸。
13.根据权利要求10至12中任一项所述的方法,其中步骤(c)包括(i)将所述第一分析物和所述一个或多个锚与脲、三(2-羧乙基)膦(TCEP),二硫苏糖醇(DTT)、链霉亲和素或生物素、UV光、酶或结合剂接触;(ii)加热所述第一分析物和一个或多个锚;或(iii)改变pH。
14.根据权利要求13所述的方法,其中所述酶是核酸外切酶、核酸内切酶或解旋酶。
15.根据权利要求13所述的方法,其中所述结合剂是酶、抗体或其片段或单链结合蛋白(SSB)。
16.根据权利要求10至15中任一项所述的方法,其中步骤(d)包括使用与所述第一分析物分离的所述一个或多个锚将所述第二分析物偶联至所述膜。
17.根据权利要求16所述的方法,其中步骤(c)和(d)包括通过使所述膜与所述第二分析物接触而使所述第一分析物与所述膜解偶联,使得所述第二分析物与所述第一分析物竞争结合到所述一个或多个锚并替换所述第一分析物。
18.根据权利要求10至15中任一项所述的方法,其中步骤(d)包括使用不同于与所述第一分析物分离的一个或多个锚的一个或多个锚将所述第二分析物偶联至所述膜。
19.根据前述权利要求中任一项所述的方法,其中在步骤(c)和(d)之间,所述方法包括从所述膜去除所述第一样品中的至少一些。
20.根据权利要求19所述的方法,其中所述方法包括从所述膜去除所有第一样品。
21.根据前述权利要求中任一项所述的方法,其中所述第一分析物和第二分析物是相同分析物的两个实例。
22.根据前述权利要求中任一项所述的方法,其中所述第一样品和所述第二样品是相同样品的两个实例。
23.根据前述权利要求中任一项所述的方法,其中所述膜是两亲性层或固态层。
24.根据前述权利要求中任一项所述的方法,其中用于将所述第一分析物和/或第二分析物偶联到所述膜的所述一个或多个锚包括接头。
25.根据前述权利要求中任一项所述的方法,其中所述第一分析物和/或第二分析物暂时或永久地偶联至所述膜。
26.根据前述权利要求中任一项所述的方法,其中所述检测器经由电装置或光学装置检测所述第一分析物和/或第二分析物。
27.根据前述权利要求中任一项所述的方法,其中所述检测器包括跨膜孔。
28.根据权利要求27所述的方法,其中所述跨膜孔是跨膜蛋白孔。
29.根据权利要求28所述的方法,其中所述跨膜蛋白孔来源于耻垢分枝杆菌孔蛋白(Msp)、α-溶血素(α-HL)或溶菌素。
30.根据权利要求27至29中任一项所述的方法,其中步骤(b)包括(i)允许所述第一分析物与所述检测器相互作用,和(ii)在所述相互作用期间测量通过所述检测器的电流,并由此确定所述第一分析物的存在、不存在或一个或多个特征,和/或步骤(e)包括(i)允许所述第二分析物与所述检测器相互作用,和(ii)在相互作用期间测量通过所述检测器的电流,并由此确定所述第二分析物的存在、不存在或一个或多个特征。
31.根据前述权利要求中任一项所述的方法,其中所述方法用于鉴定所述第一分析物和/或所述第二分析物。
32.根据前述权利要求中任一项所述的方法,其中所述第一分析物和/或所述第二分析物是聚合物。
33.根据前述权利要求中任一项所述的方法,其中所述第一分析物和/或所述第二分析物是多核苷酸。
34.根据权利要求33所述的方法,其中所述方法用于估计所述第一多核苷酸和/或所述第二多核苷酸的序列或测序所述第一多核苷酸和/或所述第二多核苷酸。
35.根据权利要求32或33所述的方法,其中步骤(b)包括使所述第一多核苷酸与多核苷酸结合蛋白相互作用,所述多核苷酸结合蛋白控制所述第一多核苷酸与所述膜中存在的检测器的相互作用,和/或步骤(e)包括使所述第二多核苷酸与多核苷酸结合蛋白相互作用,所述多核苷酸结合蛋白控制所述第二多核苷酸与所述膜中存在的检测器的相互作用。
36.根据权利要求34所述的方法,其中所述多核苷酸结合蛋白衍生自解旋酶。
37.一种表征两个或更多个样品中的两个或更多个多核苷酸的方法,包括:
(a)使用一个或多个锚将第一样品中的第一多核苷酸偶联至膜;
(b)使所述第一多核苷酸与跨膜孔接触,使得所述第一多核苷酸移动穿过所述孔;
(c)随着所述第一多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述第一多核苷酸的一个或多个特征,由此表征所述第一多核苷酸;
(d)使所述第一多核苷酸与所述膜解偶联;
(e)使用一个或多个锚将第二样品中的第二多核苷酸偶联至所述膜;
(f)使所述第二多核苷酸与跨膜孔接触,使得所述第二多核苷酸移动穿过所述孔;和
(g)随着所述第二多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述第二多核苷酸的一个或多个特征,由此表征所述第二多核苷酸。
38.根据权利要求37所述的方法,其中步骤(b)包括使所述第一多核昔酸与跨膜孔和多核昔酸结合蛋白接触,使得所述蛋白控制所述第一多核苷酸穿过所述孔的移动,和/或步骤(f)包括使所述第二多核苷酸与跨膜孔和多核苷酸结合蛋白接触,使得所述蛋白控制所述第二多核苷酸穿过所述孔的移动。
39.根据权利要求37或38所述的方法,其中所述一个或多个特征选自(i)所述第一和/或第二多核昔酸的长度,(ii)所述第一和/或第二多核苷酸的同一性,(iii)所述第一和/或第二多核昔酸的序列,(iv)所述第一和/或第二多核苷酸的二级结构和(v)所述第一和/或第二多核苷酸是否被修饰。
40.根据权利要求37至39中任一项所述的方法,其中步骤(d)的解偶联按权利要求5至18中任一项所定义的进行实施。
41.一种使用胆固醇使偶联到膜上的分析物与所述膜解偶联的方法,包括使所述分析物与环糊精或其衍生物接触,从而使所述分析物与所述膜解偶联。
42.根据权利要求41所述的方法,其中所述分析物是聚合物。
43.根据权利要求42所述的方法,其中所述聚合物是多核苷酸。
44.一种用于表征两个或更多个样品中的两个或更多个多核苷酸分析物的方法,包括:
(a)使用一个或多个锚将第一样品中的第一多核昔酸分析物偶联至膜;
(b)使所述第一多核苷酸分析物与跨膜孔、聚合酶和标记的核苷酸接触,使得当通过所述聚合酶将核苷酸添加到所述第一多核苷酸分析物时,磷酸盐标记的物质被顺序地释放,其中所述磷酸盐标记的物质含有对每个核昔酸特异的标记;
(c)使用所述跨膜孔检测所述磷酸盐标记的物质,由此表征所述第一多核苷酸分析物;
(d)使所述第一多核苷酸分析物与所述膜解偶联;
(d)使用一个或多个锚将第二样品中的第二多核苷酸分析物偶联至所述膜;
(e)使所述第二多核苷酸分析物与所述跨膜孔、聚合酶和标记的核苷酸接触,使得当通过所述聚合酶将核苷酸添加到所述第二多核苷酸分析物时,磷酸盐标记的物质被顺序地释放,其中所述磷酸盐标记的物质含有对每个核苷酸特异的标记;和
(c)使用所述跨膜孔检测所述磷酸盐标记的物质,从而表征所述第二多核苷酸分析物。
45.一种用于确定两个或更多个样品中两个或更多个分析物的存在、不存在或一个或多个特征的试剂盒,其包含(a)膜,(b)两个或更多个锚,其能够将所述两个或更多个分析物偶联到所述膜,和(c)能够使所述两个或更多个分析物中的至少一个从所述膜解偶联的一个或多个试剂。
46.根据权利要求45所述的试剂盒,其中所述两个或更多个锚包括多肽锚和/或疏水性锚。
47.根据权利要求45或46所述的试剂盒,其中所述试剂包括环糊精或其衍生物、链霉亲和素和/或生物素、抗体或其片段、胆固醇脱氢酶、磷脂酶、蛋白酶、脲、三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)、酶或结合剂。
48.根据权利要求45至47中任一项所述的试剂盒,其中所述试剂盒还包含检测器。
CN201580029651.6A 2014-04-04 2015-03-31 利用分子孔表征目标分子的方法 Pending CN106414773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310175646.2A CN116334198A (zh) 2014-04-04 2015-03-31 分析物的测定和表征方法及试剂盒

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB1406155.0A GB201406155D0 (en) 2014-04-04 2014-04-04 Method
GB1406155.0 2014-04-04
GBPCT/GB2014/052737 2014-09-10
PCT/GB2014/052737 WO2015110777A1 (en) 2014-01-22 2014-09-10 Method for controlling the movement of a polynucleotide through a transmembrane pore
PCT/GB2015/050992 WO2015150787A1 (en) 2014-04-04 2015-03-31 Method of target molecule characterisation using a molecular pore

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310175646.2A Division CN116334198A (zh) 2014-04-04 2015-03-31 分析物的测定和表征方法及试剂盒

Publications (1)

Publication Number Publication Date
CN106414773A true CN106414773A (zh) 2017-02-15

Family

ID=50776877

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310175646.2A Pending CN116334198A (zh) 2014-04-04 2015-03-31 分析物的测定和表征方法及试剂盒
CN201580029651.6A Pending CN106414773A (zh) 2014-04-04 2015-03-31 利用分子孔表征目标分子的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310175646.2A Pending CN116334198A (zh) 2014-04-04 2015-03-31 分析物的测定和表征方法及试剂盒

Country Status (5)

Country Link
US (3) US10774378B2 (zh)
EP (1) EP3126516B1 (zh)
CN (2) CN116334198A (zh)
GB (1) GB201406155D0 (zh)
WO (1) WO2015150787A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110954445A (zh) * 2019-10-31 2020-04-03 四川大学华西医院 一种活细胞生物传感器及其制备方法与应用
CN113930406A (zh) * 2021-12-17 2022-01-14 北京齐碳科技有限公司 一种Pif1-like解旋酶及其应用
WO2024138381A1 (zh) * 2022-12-27 2024-07-04 深圳华大生命科学研究院 解偶联试剂组合物、试剂盒及连续测序方法与应用

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10246741B2 (en) 2011-05-27 2019-04-02 Oxford Nanopore Technologies Ltd. Coupling method
AU2013246702B2 (en) 2012-04-10 2017-06-15 Oxford Nanopore Technologies Limited Mutant lysenin pores
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
EP3097210B2 (en) 2014-01-22 2022-04-20 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
CN106460061B (zh) 2014-04-04 2020-03-06 牛津纳米孔技术公司 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
CN106574300A (zh) 2014-05-02 2017-04-19 牛津纳米孔技术公司 改善目标多核苷酸相对于跨膜孔移动的方法
US10400014B2 (en) 2014-09-01 2019-09-03 Oxford Nanopore Technologies Ltd. Mutant CsgG pores
WO2016055778A1 (en) 2014-10-07 2016-04-14 Oxford Nanopore Technologies Limited Mutant pores
GB201418469D0 (en) 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Method
GB201502809D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Mutant pore
GB201502810D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Method
WO2016166232A1 (en) 2015-04-14 2016-10-20 Katholieke Universiteit Leuven Nanopores with internal protein adaptors
CN109072295B (zh) 2015-12-08 2022-05-31 鲁汶大学研究与发展中心 修饰的纳米孔,包含其的组合物及其应用
EP3423487B1 (en) 2016-03-02 2021-12-29 Oxford Nanopore Technologies plc Mutant pores
EP4397970A3 (en) 2016-04-06 2024-10-09 Oxford Nanopore Technologies PLC Mutant pore
GB201609221D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
GB201620450D0 (en) 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method
WO2018204250A1 (en) * 2017-05-01 2018-11-08 Achaemenid, Llc Electric shock guard for appliance
GB201707122D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Pore
GB201707140D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Method
EP3645552B1 (en) 2017-06-30 2023-06-28 Vib Vzw Novel protein pores
GB2589159B (en) 2017-12-29 2023-04-05 Clear Labs Inc Nucleic acid sequencing apparatus
CN112400017A (zh) * 2018-05-30 2021-02-23 Axo实验室股份有限公司 用于检测寡核苷酸缀合物的方法
GB201809323D0 (en) 2018-06-06 2018-07-25 Oxford Nanopore Tech Ltd Method
US11926819B2 (en) 2019-05-28 2024-03-12 The Regents Of The University Of California Methods of adding polymers to ribonucleic acids
CN113999291B (zh) * 2021-12-28 2022-04-15 北京齐碳科技有限公司 嵌入接头、锚定分子、分子膜、装置、方法及应用
GB202204919D0 (en) 2022-04-04 2022-05-18 Oxford Nanopore Tech Plc Method
CN117587110A (zh) * 2022-08-16 2024-02-23 北京齐碳科技有限公司 富集方法、表征分析物的方法及其装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100331194A1 (en) * 2009-04-10 2010-12-30 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
WO2013057495A2 (en) * 2011-10-21 2013-04-25 Oxford Nanopore Technologies Limited Enzyme method
WO2013098562A2 (en) * 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Enzyme method
CN103460040A (zh) * 2011-02-11 2013-12-18 牛津纳米孔技术有限公司 突变型孔
CN103695530A (zh) * 2008-07-07 2014-04-02 牛津纳米孔技术有限公司 酶-孔构建体

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2045640C (en) 1989-01-27 1999-01-05 Bruce Andrew Cornell Receptor membranes and ionophore gating
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
US5712126A (en) 1995-08-01 1998-01-27 Yale University Analysis of gene expression by display of 3-end restriction fragments of CDNA
AUPN980796A0 (en) 1996-05-13 1996-06-06 Australian Membrane And Biotechnology Research Institute Improved reservoir components
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
US7527787B2 (en) * 2005-10-19 2009-05-05 Ibc Pharmaceuticals, Inc. Multivalent immunoglobulin-based bioactive assemblies
EP1192453B1 (en) 1999-06-22 2012-02-15 President and Fellows of Harvard College Molecular and atomic scale evaluation of biopolymers
US6916488B1 (en) 1999-11-05 2005-07-12 Biocure, Inc. Amphiphilic polymeric vesicles
AU2001264623A1 (en) 2000-05-16 2001-11-26 Biocure, Inc. Membranes formed from amphiphilic copolymers
CA2344599C (en) 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
ATE529734T1 (de) 2005-04-06 2011-11-15 Harvard College Molekulare charakterisierung mit kohlenstoff- nanoröhrchen-steuerung
WO2007048459A1 (en) 2005-10-28 2007-05-03 Max-Planck Gesellschaft zur Förderung der Wissenschaften e.V. Cell-free in vitro transcription and translation of membrane proteins into tethered planar lipid layers
GB0523282D0 (en) 2005-11-15 2005-12-21 Isis Innovation Methods using pores
US8003319B2 (en) 2007-02-02 2011-08-23 International Business Machines Corporation Systems and methods for controlling position of charged polymer inside nanopore
AU2008217578A1 (en) 2007-02-20 2008-08-28 Oxford Nanopore Technologies Limited Lipid bilayer sensor system
AU2008236694B2 (en) 2007-04-04 2014-01-23 The Regents Of The University Of California Compositions, devices, systems, and methods for using a nanopore
EP2158476B8 (en) 2007-05-08 2019-10-09 Trustees of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
US8698481B2 (en) 2007-09-12 2014-04-15 President And Fellows Of Harvard College High-resolution molecular sensor
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
US8628940B2 (en) 2008-09-24 2014-01-14 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
WO2009151788A2 (en) 2008-04-22 2009-12-17 The Washington University Universal anchor peptide for nanoparticles
EP2281062B1 (en) 2008-04-24 2017-11-29 The Trustees of Columbia University in the City of New York Geometric patterns and lipid bilayers for dna molecule organization
AU2009269792A1 (en) 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Base-detecting pore
WO2010007537A1 (en) 2008-07-17 2010-01-21 Koninklijke Philips Electronics N.V. Nanopore device and a method for nucleic acid analysis
WO2010034018A2 (en) 2008-09-22 2010-03-25 University Of Washington Msp nanopores and related methods
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
CN102482330A (zh) 2009-01-30 2012-05-30 牛津纳米孔技术有限公司 酶突变体
BRPI1007214A8 (pt) 2009-01-30 2022-12-20 Oxford Nanopore Tech Ltd Adaptador para sequenciar ácidos nucleicos, par de adaptadores, kit, construto de ácido nucleico, e, métodos para preparar um adaptador, um construto de ácido nucleico, e um construto de dequência, e para sequenciar ácido nucleico de fita dupla.
GB0901588D0 (en) 2009-02-02 2009-03-11 Itis Holdings Plc Apparatus and methods for providing journey information
EP2422198B1 (en) 2009-04-20 2013-09-25 Oxford Nanopore Technologies Limited Lipid bilayer sensor array
KR101814056B1 (ko) 2009-12-01 2018-01-02 옥스포드 나노포어 테크놀로지즈 리미티드 생화학적 분석 기구
CA2790666C (en) 2010-02-23 2019-08-06 University Of Washington Analyte sequencing with nanopores
CN103154729B (zh) 2010-06-08 2015-01-07 哈佛大学校长及研究员协会 具有由石墨烯支持的人工脂质膜的纳米孔装置
US20140051068A1 (en) 2010-09-07 2014-02-20 The Regents Of The University Of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
LT3360963T (lt) * 2010-11-12 2020-02-25 Gen9, Inc. Nukleorūgščių sintezės būdai ir įrenginiai
US10246741B2 (en) 2011-05-27 2019-04-02 Oxford Nanopore Technologies Ltd. Coupling method
BR112014001699A2 (pt) 2011-07-25 2017-06-13 Oxford Nanopore Tech Ltd método para sequenciar de um polinucleotídeo alvo de filamento duplo, kit, métodos para preparar um polinucleotídeo alvo de filamento duplo para sequenciamento e para sequenciar um polinucleotídeo alvo de filamento duplo, e, aparelho
CA2849624C (en) 2011-09-23 2021-05-25 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
GB201120910D0 (en) 2011-12-06 2012-01-18 Cambridge Entpr Ltd Nanopore functionality control
EP2798083B1 (en) 2011-12-29 2017-08-09 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase
WO2013119784A1 (en) 2012-02-08 2013-08-15 Brown University Methods of sequencing nucleic acids using nanopores and active kinetic proofreading
AU2013246702B2 (en) 2012-04-10 2017-06-15 Oxford Nanopore Technologies Limited Mutant lysenin pores
US10808231B2 (en) 2012-07-19 2020-10-20 Oxford Nanopore Technologies Limited Modified helicases
EP2875152B1 (en) 2012-07-19 2019-10-09 Oxford Nanopore Technologies Limited Enzyme construct
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
CA2889664C (en) 2012-10-26 2020-12-29 Oxford Nanopore Technologies Limited Droplet interfaces
US9670526B2 (en) 2012-11-09 2017-06-06 Stratos Genomics, Inc. Concentrating a target molecule for sensing by a nanopore
CN105308062A (zh) 2013-02-20 2016-02-03 伊芙生物医学股份有限公司 用于基于纳米结构的核酸测序的方法和组合物
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
AU2014224432B2 (en) 2013-03-08 2019-10-24 Oxford Nanopore Technologies Limited Enzyme stalling method
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
US10724018B2 (en) 2013-10-18 2020-07-28 Oxford Nanopore Technologies Ltd. Modified helicases
CN109797199A (zh) 2013-10-23 2019-05-24 吉尼亚科技公司 使用纳米孔的高速分子感测
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
WO2015138405A2 (en) 2014-03-10 2015-09-17 The Board Of Trustees Of The University Of Illinois Detection and quantification of methylation in dna
CN106460061B (zh) 2014-04-04 2020-03-06 牛津纳米孔技术公司 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
US10400014B2 (en) 2014-09-01 2019-09-03 Oxford Nanopore Technologies Ltd. Mutant CsgG pores
GB201418469D0 (en) 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Method
US20190203288A1 (en) 2016-05-25 2019-07-04 Oxford Nanopore Technologies Ltd. Method
US11441118B2 (en) 2017-11-02 2022-09-13 The Board Of Trustees Of The University Of Illinois Nucleic acid and other compositions and methods for the modulation of cell membranes
GB201801768D0 (en) 2018-02-02 2018-03-21 Oxford Nanopore Tech Ltd Synthesis method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103695530A (zh) * 2008-07-07 2014-04-02 牛津纳米孔技术有限公司 酶-孔构建体
US20100331194A1 (en) * 2009-04-10 2010-12-30 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
CN103460040A (zh) * 2011-02-11 2013-12-18 牛津纳米孔技术有限公司 突变型孔
WO2013057495A2 (en) * 2011-10-21 2013-04-25 Oxford Nanopore Technologies Limited Enzyme method
WO2013098562A2 (en) * 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Enzyme method

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ERICA GOLEMIS编著: "《分子克隆手册 蛋白质-蛋白质相互作用》", 31 October 2004, 北京:中国农业出版社 *
M.HOFFMANN等: ""Molecular recognition in biotin-streptavidin systems and analogues at the air-water interface"", 《THIN SOLID FILMS》 *
OHVO H 等: ""Cyclodextrin-Mediated Removal of Sterols from Monolayers: Effects of Sterol Structure and Phospholipids on Desorption Rate"", 《BIOCHEMISTRY》 *
ZIDOVETZKI R等: ""Use of cyclodextrins to manipulate plasma membrane cholesterol content: Evidence, misconceptions and control strategies"", 《BIOCHIMICA ET BIOPHYSICA ACTA》 *
伊正君等: "《临床分子诊断学实验》", 30 June 2013, 武汉:华中科技大学出版社 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110954445A (zh) * 2019-10-31 2020-04-03 四川大学华西医院 一种活细胞生物传感器及其制备方法与应用
CN110954445B (zh) * 2019-10-31 2022-08-16 四川大学华西医院 一种活细胞生物传感器及其制备方法与应用
CN113930406A (zh) * 2021-12-17 2022-01-14 北京齐碳科技有限公司 一种Pif1-like解旋酶及其应用
CN113930406B (zh) * 2021-12-17 2022-04-08 北京齐碳科技有限公司 一种Pif1-like解旋酶及其应用
WO2024138381A1 (zh) * 2022-12-27 2024-07-04 深圳华大生命科学研究院 解偶联试剂组合物、试剂盒及连续测序方法与应用

Also Published As

Publication number Publication date
EP3126516B1 (en) 2019-10-30
US10774378B2 (en) 2020-09-15
GB201406155D0 (en) 2014-05-21
US11649490B2 (en) 2023-05-16
US20210087621A1 (en) 2021-03-25
WO2015150787A1 (en) 2015-10-08
US20180087101A9 (en) 2018-03-29
CN116334198A (zh) 2023-06-27
US20230374583A1 (en) 2023-11-23
EP3126516A1 (en) 2017-02-08
US20170022557A1 (en) 2017-01-26

Similar Documents

Publication Publication Date Title
CN106414773A (zh) 利用分子孔表征目标分子的方法
CN107002151B (zh) 向跨膜孔输送分析物的方法
US11236385B2 (en) Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
EP3097204B1 (en) Method for controlling the movement of a polynucleotide through a transmembrane pore
AU2018270075B2 (en) Transmembrane pore consisting of two CsgG pores
CN109312401B (zh) 连接的核酸的纳米孔测序方法
CN111534504B (zh) 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法
KR101963918B1 (ko) 커플링 방법
CN106459159A (zh) 突变孔
CN108779170A (zh) 突变孔
CN109196116A (zh) 方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: oxford

Applicant after: Oxford nanopore Technology Public Co.,Ltd.

Address before: Oxfordshire

Applicant before: OXFORD NANOPORE TECHNOLOGIES LTD.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170215

RJ01 Rejection of invention patent application after publication