[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN101365807A - 用于掺入核苷酸类似物的聚合酶 - Google Patents

用于掺入核苷酸类似物的聚合酶 Download PDF

Info

Publication number
CN101365807A
CN101365807A CNA2006800526063A CN200680052606A CN101365807A CN 101365807 A CN101365807 A CN 101365807A CN A2006800526063 A CNA2006800526063 A CN A2006800526063A CN 200680052606 A CN200680052606 A CN 200680052606A CN 101365807 A CN101365807 A CN 101365807A
Authority
CN
China
Prior art keywords
polymerase
template
mutation
nucleotide analog
polymerases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800526063A
Other languages
English (en)
Inventor
D·K·汉泽
G·奥托
D·墨菲
P·佩鲁索
T·法姆
D·R·兰克
P·米兹伊斯
F·C·克里斯蒂安
A·比比隆
I·帕克
S·克拉克
J·莱尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pacific Biosciences of California Inc
Original Assignee
Pacific Biosciences of California Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pacific Biosciences of California Inc filed Critical Pacific Biosciences of California Inc
Publication of CN101365807A publication Critical patent/CN101365807A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了含有具有改善核苷酸类似物进入活性位点区和在活性位点区与核苷酸类似物协调作用的特征的聚合酶的组合物。也提供了制备这种聚合酶和将这种聚合酶用于测序以及DNA复制和扩增的方法,以及聚合酶活性的动力学模型和使用此模型的计算机实现方法。

Description

用于掺入核苷酸类似物的聚合酶
相关申请的交叉参考
本申请是非临时专利申请,要求以下在先临时专利申请的优先权和权利:David K.Hanzel等于2005年12月22日提交的题为“POLYMERASES FORNUCLEOTIDE ANALOGUE INCORPORATION(用于掺入核苷酸类似物的聚合酶)”的USSN 60/753,670,将其全文纳入本文作参考用于所有目的。
在联邦资助的研究和开发下作出本发明的权利说明
本发明的一部分得到了政府资助,NHGRI资助号为R01 HG003710-01,因此政府可享有本发明的某些权利。
发明领域
本发明涉及具有改善核苷酸类似物进入活性位点区和在活性位点区与核苷酸类似物协调作用的特征的聚合酶。也描述了制备这种聚合酶和将这种聚合酶用于测序以及DNA复制和扩增的方法,以及聚合酶活性的动力学模型和使用此模型的计算机实现方法。
发明背景
DNA聚合酶能复制活生物体的基因组。除这种生物学中心作用外,DNA聚合酶也是生物技术中普遍采用的工具。它们广泛用于(例如)逆转录、扩增、标记和测序,这些技术是各种应用如测序、核酸扩增、克隆、蛋白质工程、诊断、分子药物和许多其它技术的核心技术。
因为DNA聚合酶的重要性,对它们进行了广泛研究。本研究关注的是,例如聚合酶之间的系统发生关系,聚合酶的结构,聚合酶的结构功能特征和聚合酶在DNA复制中的作用和其它基础生物学,以及在生物技术中使用DNA聚合酶的方式。关于聚合酶的综述,参见例如,Hübscher等(2002)EUKARYOTIC DNA POLYMERASES(真核DNA聚合酶)Annual Review of Biochemistry第71卷:133-163;Alba(2001)“Protein Family Review:ReplicativeDNA POLYMERASES”(蛋白质家族综述:复制性DNA聚合酶)Genome Biology2(1):综述3002.1-3002.4;Steitz(1999)“DNA POLYMERASES:structuraldiversity and common mechanisms”(DNA聚合酶:结构多样性和共同机制)J Biol Chem274:17395-17398和Burgers等(2001)“Eukaryotic DNA POLYMERASES:proposal for a revised nomenclature”(真核DNA聚合酶:提出了修订的命名法)J Biol Chem.276(47):43487-90。分析了许多聚合酶的晶体结构,它们常常共有相似的结构。已测定许多聚合酶的基本作用机制。
DNA技术的基本应用包括标记DNA聚合酶产生的DNA的各种标记方案。可用于微阵列技术、DNA测序、SNP检测、克隆、PCR分析和许多其它应用。常常用各种合成后杂交或化学标记方案进行标记,但已经用DNA聚合酶在各种应用中通过(例如)缺口平移、逆转录、随机引发、扩增、聚合酶链反应等直接掺入各种标记核苷酸。参见例如,Giller等(2003)“Incorporation ofreporter molecule-labeled nucleotides by DNA Polymerases(用DNA聚合酶掺入报道分子-标记的核苷酸).I.Chemical synthesis of various reporter group-labeled2′-deoxyribonucleoside-5′-triphosphate”(化学合成各种报道物基团标记的2′-脱氧核糖核苷-5′-三磷酸)Nucleic Acids Res.31(10):2630-2635;Augustin等(2001)“单分子测序的过程:酶学合成核苷酸-特异性标记的DNA”J.Biotechnol.,86:289-301;Tonon等(2000)“Spectral karyotyping combined with locus-specificFISH simultaneously defines gene and chromosomes involved in chromosomaltranslocations”(与基因座特异性FISH联用的光谱核型分析确定了参与染色体易位的基因和染色体)Gene Chromosom.Cancer27:418-423;Zhu和Waggoner(1997)“Molecular mechanism controlling the incorporation of fluorescentnucleotides into DNA by PCR.”(通过PCR控制将荧光核苷酸掺入DNA的分子机制)Cytometry,28:206-211.Yu等(1994)“Cyanine dye dUTP analogs forenzymatic labeling of DNA probes”(酶学标记DNA探针的花青染料dUTP类似物)Nucleic Acids Res.,22:3226-3232;Zhu等(1994)“Directly labeled DNAprobes using fluorescent nucleotides with different length linkers.”(用带有不同长度接头的荧光核苷酸直接标记的DNA探针)Nucleic Acids Res.22:3418-3422;Ried等(1992)“Simultaneous visualization of seven different DNA probes by in situhybridization using combinatorial fluorescence and digital imaging microscopy”(用组合的荧光和数字成像显微术通过原位杂交同时观察其中不同的DNA探针)Proc.Natl Acad.Sci.USA,89:1388-1392。
已经鉴定了与相应的野生型酶相比核苷酸类似物掺入特性改变的DNA聚合酶突变体。例如,VentA488L DNA聚合酶掺入某些非标准核苷酸的效率高于天然Vent DNA聚合酶。参见Gardner等(2004)“Comparative Kinetics ofNucleotide Analog Incorporation by Vent DNA POLYMERASES”(通过VentDNA聚合酶掺入核苷酸类似物的比较动力学)J.Biol.Chem.,279(12),11834-11842;Gardner和Jack“Determinants of nucleotide sugar recognition in anarchaeon DNA POLYMERASES”(古DNA聚合酶中识别核苷酸糖的决定簇)Nucleic Acids Research.27(12)2545-2553。预计A488突变体中改变的残基背离该酶的核苷酸结合位点。此位置上的松弛特异性模式与取代的氨基酸侧链大小粗略相关联,并且影响该酶掺入各种修饰的核苷酸糖。
在各种应用,例如需要进行核酸标记的应用,包括DNA扩增、测序、标记、检测、克隆等中,非常需要改善DNA聚合酶对标记核苷酸类似物的特异性、持续合成能力或其它特征的能力。本发明提供了对标记核苷酸类似物的特性改变的新型DNA聚合酶、制备这类聚合酶的方法、使用这类聚合酶的方法和通过完整阅读以下内容能够明白的许多其它特征。
发明概述
本发明包括在DNA扩增过程中将核苷酸类似物如磷酸类似物掺入生长的模板拷贝中的聚合酶。不受任何具体操作理论束缚,任选修饰这些聚合酶,以便修饰该聚合酶的活性位点以降低该类似物进入活性位点的空间抑制和/或提供核苷酸类似物一种或多种非天然特征的补充性。这类聚合酶特别适用于DNA扩增和/或测序应用,包括实时应用,如扩增或测序方案(包括通过聚合酶将类似物残基掺入DNA)。掺入的类似物残基可能与天然残基相同,例如,在掺入过程中通过聚合酶的作用去除该类似物的标记或其它部分,或者该类似物残基可具有使其区别于天然核苷酸残基的一种或多种特征。
因此,本发明包括含有重组DNA聚合酶的组合物。重组DNA聚合酶包括与野生型DNA聚合酶的野生型活性位点区同源的修饰活性位点区。相对于野生型活性位点区,修饰活性位点区包括一种或多种结构修饰,这种修饰能提高该酶对(例如)天然产生的核苷酸和/或核苷酸类似物的所需活性。在某些方面且不受具体操作理论的束缚,这类修饰包括降低天然核苷酸或核苷酸类似物进入修饰活性位点区的空间抑制和/或使活性位点区与天然核苷酸和/或核苷酸类似物的一种或多种非天然特征互补的修饰。与野生型聚合酶相比,重组DNA聚合酶对核苷酸类似物的特性发生改变。
任选修饰各种DNA聚合酶,以包含修饰的活性位点区。例如,重组DNA聚合酶任选与Φ29DNA聚合酶或其突变体、Taq聚合酶、外切核酸酶缺陷型Taq聚合酶、DNA Pol I聚合酶、T7聚合酶、RB69聚合酶、T5聚合酶或对应于DNA Pol I聚合酶克列诺片段的聚合酶同源。例如,重组DNA聚合酶可能与野生型或外切核酸酶缺陷型Φ29 DNA聚合酶同源,如美国专利5,001,050、5,198,543或5,576,204所述。相似地,重组DNA聚合酶可能与Φ29、B103、GA-1、PZA、Φ15、BS32、M2Y、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722或L17等同源。命名法也参见Meijer等(2001)“Φ29Family of Phages(Φ29噬菌体家族)”Microbiology and Molecular Biology Reviews,65(2):261-287。
修饰的活性位点区可包括各种不同修饰,以降低空间抑制和/或使该区域与核苷酸类似物的一种或多种非天然特征互补。例如,相对于野生型Φ29 DNA聚合酶,在活性位点内或附近的结构修饰选自:Δ505-525缺失、Δ505-525内的缺失、K135A突变、L384R突变与本文所述另一突变的组合(出现L384R突变时,通常与降低核苷酸类似物进入的空间抑制的一个或多个其它突变组合)、E375H突变、E375S突变、E375K突变、E375R突变、E375A突变、E375Q突变、E375W突变、E375Y突变、E375F突变、E486A突变、E486D突变、K512A突变和其组合。该聚合酶也可包含选自表8的其它突变或突变组合。
相对于野生型聚合酶,该聚合酶任选还包含一个或多个突变/缺失,以降低或消除内源性外切核酸酶活性。例如,相对于野生型Φ29 DNA聚合酶,任选使N62发生突变或缺失,以降低外切核酸酶活性;如,该聚合酶可包含N62D突变。降低外切核酸酶活性的其它示范性突变包括:D12A、T15I、E14I和/或D66A;因此,本发明聚合酶任选包含一个或多个这些突变。
该重组DNA聚合酶任选包含与相应DNA聚合酶如野生型或核酸酶缺陷型聚合酶外源或异源的其它特征。例如,该重组聚合酶任选包含一个或多个外源性亲和标签,如纯化或底物结合标签,如6His标签序列、GST标签、HA标签序列、多个6His标签序列、多个GST标签、多个HA标签序列、SNAP标签等。可将它们插入蛋白质的各种位置中,优选插入一个或多个末端,如蛋白质的C末端或N末端,更优选插入距蛋白质3D结构中活性位点最远的末端。
本发明的示范性聚合酶包括表3所示的聚合酶。
该组合物任选包含核苷酸类似物。示范性核苷酸类似物包括含有荧光团和/或染料部分的核苷酸类似物。例如,核苷酸类似物可以是标记的核苷酸,如碱基、糖和/或磷酸标记的核苷酸。该类似物可以是单脱氧或双脱氧的核苷酸类似物。
核苷酸类似物的一个示范性类别是磷酸标记的核苷酸类似物,包括单脱氧磷酸标记核苷酸类似物和/或双脱氧磷酸标记核苷酸类似物。例如,核苷酸类似物可以是含有3-6个磷酸基团的标记的核苷酸类似物(如该核苷酸类似物是三磷酸盐、四磷酸盐、五磷酸盐或六磷酸盐)。
例如,该组合物可包含下式所示的标记化合物:
式中B是核碱基(注意B任选包含标记);S选自糖部分、非环部分或碳环部分(注意S任选包含标记);L是任选的可检测标记;R1选自O和S;R2、R3和R4独立地选自O、NH、S、亚甲基、取代的亚甲基、C(O)、C(CH2)、CNH2、CH2CH2、C(OH)CH2R,其中R是4-吡啶或1-咪唑,限制条件是R4还可选自:
Figure A200680052606D00122
Figure A200680052606D00123
R5、R6、R7、R8、R11和R13当存在时各自独立地选自:O、BH3和S;R9、R10和R12独立地选自O、NH、S、亚甲基、取代的亚甲基、CNH2、CH2CH2、C(OH)CH2R,其中R是4-吡啶或1-咪唑。在一些情况下,膦酸类似物可用作类似物,例如R2、R3、R4、R9、R10或R12之一不是O时,例如,它们是甲基等。
与野生型聚合酶相比,重组DNA聚合酶对核苷酸类似物的特性改变。例如,改变的特性可以是,例如,Km、kcat、Vmax、核苷酸类似物(或天然产生的核苷酸)存在时重组聚合酶的持续合成能力(processivity)、核苷酸类似物存在时重组聚合酶的平均模板阅读长度、重组聚合酶对核苷酸类似物的特异性,核苷酸类似物结合速率、产物(焦磷酸、三磷酸等)释放速率和/或分支速率。在一个所需的实施方式中,修饰的特性是核苷酸类似物Km降低和/或对核苷酸类似物的kcat/Km或Vmax/Km提高。相似地,与野生型聚合酶相比,该重组聚合酶任选具有以下特性:核苷酸类似物结合速率提高、产物释放速率提高和/或分支速率降低。
同时,该重组DNA聚合酶可将天然核苷酸(如A、C、G和T)掺入生长的核酸拷贝中。例如,任选地,该重组聚合酶对天然核苷酸的比活至少约为相应野生型聚合酶的5%(如5%、10%、25%、50%、75%、100%或更高),在模板存在下对天然核苷酸的持续合成能力至少约为天然核苷酸存在下野生型聚合酶的5%(如5%、10%、25%、50%、75%、100%或更高)。任选地,该重组聚合酶对天然产生核苷酸的kcat/Km或Vmax/Km至少约为野生型聚合酶的5%(如约5%、10%、25%、50%、75%或100%或更高)。
本发明组合物中任选包含核苷酸类似物和DNA模板,例如,其中重组聚合酶根据模板DNA将核苷酸类似物掺入核酸拷贝中。模板DNA可以是线性或环状DNA,在某些测序应用中,最好是环状模板。因此,该组合物可存在于DNA扩增和/或测序系统中。任选地,在一类实施方式中,测序系统包括零模式波导管(Zero Mode Waveguide)。
制备和使用该组合物的方法也是本发明特征。例如,在一个方面,提供了制备DNA,例如含有一个或多个核苷酸类似物残基的DNA的方法。在这些方法中,提供了反应混合物。反应混合物一般包含可以至少部分复制模板的组分,如模板、核苷酸、聚合酶和与模板复合或整合以启动该聚合酶的复制起始部分。本文中复制起始部分是可用作启动聚合酶的位点的任何部分,如与模板、发夹或模板的其它自身互补区(如单链模板中的发夹结构)、末端蛋白等互补的单独寡核苷酸。该聚合酶是能够在模板依赖性聚合酶延伸反应中至少部分复制该模板的重组聚合酶(例如用复制起始部分作为起始位点)。一般地,所述一个或多个核苷酸包括核苷酸类似物。在优选方面,至少一个,优选两个或多个、三个或多个或者至少四个核苷酸是核苷酸类似物。重组DNA聚合酶含有与野生型DNA聚合酶的野生型活性位点同源的修饰活性位点(修饰时导致聚合酶活性改变的聚合酶区域)。如上述组合物内容中所述,相对于野生型活性位点,修饰的活性位点可包括提高该酶对一种或多种天然核苷酸和/或核苷酸类似物的活性的一个或多个结构修饰。在至少一个实施例中并且不受任何具体操作理论的束缚,对活性位点的修饰能降低对核苷酸类似物进入修饰活性位点的空间抑制和/或该修饰与该核酸类似物的一种或多种非天然特征互补。
使该混合物发生反应,以使重组聚合酶以模板依赖性方式复制至少一部分模板,而将至少一个核苷酸类似物残基掺入得到的DNA中。掺入类似物可导致将非标准残基掺入延伸的DNA中(例如作为标记的核苷酸残基),或者聚合酶的作用可修饰该类似物,以使掺入延伸DNA中的核苷酸类似物残基与标准核苷酸残基结构相同。例如,在后一实施方式中,通过聚合酶的作用切割各种标记,例如,随着核苷酸类似物掺入生长的DNA中,由核苷酸类似物切下本文中更详细讨论的某些磷酸标记(标记释放后一般会提供信号)。
在相关的方法类型中,提供含有模板、复制起始部分、模板依赖性重组聚合酶和一种或多种核苷酸的反应混合物。一种或多种核苷酸包括磷酸标记的核苷酸。用于核苷酸类似物的重组聚合酶的Km值低于该核苷酸类似物的相应的同源野生型聚合酶的Km。使该混合物发生反应,以使该聚合酶以模板依赖性方式至少部分复制模板,从而将至少一个核苷酸类似物残基掺入得到的DNA中。如前所述,一旦掺入后,该残基可能与天然核苷酸残基相同,或者可能与天然核苷酸残基不同。
在另一类制备DNA的相关方法中,提供了含有模板、与模板复合或整合的复制起始部分、在模板依赖性聚合酶反应中能够利用所述部分复制至少一部分所述模板的聚合酶以及一种或多种核苷酸的反应混合物。再一次地,所述一种或多种核苷酸一般包括标记的磷酸核苷酸类似物。在这类实施方式中,该聚合酶与Φ29 DNA聚合酶同源。该聚合酶对488dC4P、A568dC4P或二者的Km小于GST-N62D Φ29 DNA聚合酶对488dC4P、A568dC4P或二者的Km的75%。例如,对488dC4P、A568dC4P的Km可能约为GST-N62D Φ29 DNA聚合酶的40%或更低,或者例如约为15%或更低。使该混合物发生反应,以使该聚合酶复制至少一部分模板。
该方法所用的聚合酶可能是组合物中的任何上述聚合酶。该方法所用聚合酶的特性可以参照组合物中的特性。例如,该聚合酶对核苷酸类似物的kcat/Km任选高于野生型Φ29对核苷酸类似物的kcat/Km。相似地,该方法所用的核苷酸类似物可以是本文所述组合物中提及的任何核苷酸类似物。本文所述的重组聚合酶对核苷酸类似物的Km可能约为(例如)与重组聚合酶同源的天然产生聚合酶的Km的90%、80%、75%、60%、50%、40%、25%、15%、10%或5%以下。任选地,与相应野生型聚合酶相比重组聚合酶与核苷酸类似物的结合速率提高、产物释放速率提高和/或分支速率降低。
除使用本文组合物的方法外,本发明也包括制备该组合物的方法。例如,在一个方面,提供了制备重组DNA聚合酶的方法(如关于本文所述组合物的方法)。例如,该方法可包括利用任何可获得的晶体结构和分子建模软件或系统对第一种聚合酶进行结构建模。根据建模结果,在活性位点或其附近鉴定到影响核苷酸进入活性位点和/或核苷酸类似物在活性位点区结合的一种或多种空间抑制特征或互补特征。使所述第一种DNA聚合酶突变,以降低或消除至少一种空间抑制特征或加入互补特征。
所述方法还可包括筛选或其它方案,以确定与第一种DNA聚合酶相比得到的重组聚合酶对核苷酸类似物的活性是否改变。例如,可测定重组DNA聚合酶对核苷酸类似物的kcat、Km、Vmax或kcat/Km。另外,也可测定重组DNA聚合酶对天然核苷酸的kcat、Km、Vmax或kcat/Km(例如,当该聚合酶宜包含两种类似物和天然核苷酸掺入活性)。
可制备重组DNA聚合酶文库,并筛选这些特性。例如,使多个文库成员包含一种或多种空间抑制特征突变和/或突变,以便与核苷酸类似物的一种或多种非天然特征互补,然后筛选感兴趣特性。通常,可筛选该文库以鉴定至少一个具有感兴趣修饰活性的成员。
另一方面,本发明包括用于(例如)对酶动力学建模的计算机实现的方法。该方法包括(例如)在基于模板的聚合反应中确定不连续时间步骤中的多种聚合酶状态转变;确定各状态之间的多种状态转变速率(rate transition rate);根据给定的核酸模板序列、反应混合物中的核苷酸和聚合酶状态转变,产生可能状态的多维概率矩阵;并且将多维概率矩阵储存在计算机可读介质中。
该方法的各种特征可能不同。例如,聚合酶状态转变任选为用户可选择的。各状态之间的状态转变速率任选取决于核苷酸浓度、模板序列和聚合酶在模板上的位置。反应混合物中的核苷酸任选包括一种或多种核苷酸类似物。各状态之间的状态转变速率任选包括聚合酶使用核苷酸类似物期间聚合酶的构象转变速率,该速率被设定成等于天然核苷酸的构象转变速率。任选地,根据模板序列、标准化的概率状态矩阵和反应混合物中的核苷酸自动产生多维概率矩阵。任选地,通过假定所有状态转变中所有可能的沃森克里克碱基配对等同,简化了该概率矩阵。
相似地,任选根据概率矩阵的输出值产生第二试剂浓度矩阵,以计算由聚合酶在模板上的位置导致的试剂浓度改变。任选根据多种模板对概率矩阵矢量化,得到的矢量化概率矩阵可乘以多维概率矩阵,得到状态分布矩阵。可利用概率矩阵的指数时间因子计算模板序列内的重复序列。可利用连续模型或计数模型确定聚合酶核苷酸错配分数。
附图简要说明
图1是标记的N62D Φ29 DNA聚合酶的表达载体的示意图。
图2:图A代表在残基505-525周围区域中对Φ29样聚合酶进行序列比对的结果(Φ29 SEQ ID NO:35、B103 SEQ ID NO:36、PZA SEQ ID NO:37、M2 SEQ ID NO:38、G1 SEQ ID NO:39、cp-1 SEQ ID NO:40)。图B说明含有(上)和不含(下)残基505-525的Φ29的结构。显示从三种不同角度观察的结构图。
图3:图A代表在Φ29的E375周围区域对Φ29样聚合酶进行序列比对的结果(Φ29 SEQ ID NO:41、B103 SEQ ID NO:42、PZA SEQ ID NO:43、M2SEQ ID NO:44、G1SEQ ID NO:45、cp-1SEQ ID NO:46)。图B说明Φ29(上)和E375H突变体(下)的结构。显示从三种不同角度观察的结构图。
图4:图A代表在Φ29的E486周围区域对Φ29样聚合酶进行序列比对的结果(Φ29 SEQ ID NO:47、B103 SEQ ID NO:48、PZA SEQ ID NO:49、M2 SEQ ID NO:50、G1SEQ ID NO:51、cp-1SEQ ID NO:52)。图B说明Φ29(上)和E486A突变体(下)的结构。显示从三种不同角度观察的结构图。
图5:图A显示在Φ29的K512周围区域中对Φ29样聚合酶进行序列比对的结果(Φ29SEQ ID NO:53、B103SEQ ID NO:54、PZA SEQ ID NO:55、M2 SEQ ID NO:56、G1 SEQ ID NO:57、cp-1 SEQ ID NO:58)。图B说明Φ29(上)和K512A突变体(下)的结构。显示从三种不同角度观察的结构图。
图6:图A显示在Φ29的K135周围区域中对Φ29样聚合酶进行序列比对的结果(Φ29 SEQ ID NO:59、B103 SEQ ID NO:60、PZA SEQ ID NO:61、M2 SEQ ID NO:62、G1 SEQ ID NO:63、cp-1 SEQ ID NO:64)。图B说明了Φ29(上)和K135A突变体(下)的结构。显示从三种不同角度观察的结构图。
图7:图A示意性地描述了用于测定结合和产物释放速率的FRET停流试验。该试验的结果见图B-D,分别是Φ29 N62D(图B)、N62D:E375Y(图C)和N62D:E375W(图D)的结果。
图8:图A示意性地描述了用于测定分支速率的FRET停流试验。该试验的结果见图B-D,分别是Φ29 N62D(图B)、N62D:E375Y(图C)和N62D:E375W(图D)的结果。
图9描述了动力学矩阵跳跃大小与浓度降低的图。
发明详述
概述
各种技术均依赖将标记掺入核酸中,以观察实验结果。例如,一般通过标记产物核酸监测测序、核酸扩增和缺口平移反应的结果。这常常通过使标记共价或非共价地结合于产物核酸来实现,例如使标记探针结合于产物核酸。在其它方法中,在产物核酸合成期间将核苷酸类似物掺入产物核酸。这一般会发生在(例如)掺入测序法以及某些实时PCR(RT-PCR)和实时LCR反应(RT-LCR)中。可将类似物上存在的标记掺入DNA,或者可通过聚合酶的作用释放该标记。可监测标记的掺入或释放,以监测类似物残基掺入产物核酸中。
本发明提供了在DNA扩增期间将核苷酸类似物如染料标记的磷酸标记的类似物掺入生长的模板拷贝的新型聚合酶。修饰这些聚合酶,以改变该聚合酶的活性位点从而降低该类似物进入活性位点的空间进入抑制(有利于该核苷酸类似物进入该活性位点)和/或提供该核苷酸类似物一种或多种非天然特征的互补特征。
这些新聚合酶特别适用于DNA扩增(如RT-PCR和RT-LCR)和/或测序应用,例如用于包括将标记类似物掺入DNA复制子的扩增或测序方案中。
DNA聚合酶
通常可获得经修饰可与核苷酸类似物相互作用的DNA聚合酶,这些修饰包括降低进入活性位点的空间抑制作用,或加入类似物的补偿特征。近年来根据各种系统发生关系分为六种主要类型的DNA聚合酶,如大肠杆菌(E.coli)PolI(A类)、大肠杆菌Pol II(B类)、大肠杆菌Pol III(C类)、真核古细菌(Euryarchaeotic)Pol II(D类)、人Pol β(X类)和大肠杆菌UmuC/DinB和真核RAD30/干皮病色素变体(pigmentosum variant)(Y类)。近年来命名法的综述参见例如,Burgers等(2001)“Eukaryotic DNA POLYMERASES:proposal for a revisednomenclature”(真核DNA聚合酶:提出修订的命名法)J Biol Chem.276(47):43487-90。聚合酶的综述参见例如,Hübscher等(2002)Eukaryotic DNAPOLYMERASES(真核DNA聚合酶)Annual Review of Biochemistry第71卷:133-163;Alba(2001)“Protein Family Review:Replicative DNAPOLYMERASES”(蛋白质家族综述:复制性DNA聚合酶)Genome Biology2(1):综述3002.1-3002.4;和Steitz(1999)“DNA POLYMERASES:structural diversityand common mechanisms”(DNA聚合酶:结构多样性和共同机制)J Biol Chem274:17395-17398。已经确定了许多聚合酶的基本作用机制。公众可以获得几百种聚合酶的序列,已经测定了其中许多聚合酶的晶体结构,或者可根据与同源聚合酶的已解析晶体结构的相似性推知。例如,可获得Φ29的晶体结构。
以多种方式修饰了可获得的DNA聚合酶,(例如)以降低或消除外切核酸酶活性(许多天然DNA聚合酶具有校对外切核酸酶功能,会干扰(如)测序应用),以通过制备蛋白酶消化的酶片段如重组克列诺片段等简化生产。可按照本发明修饰这些可得的聚合酶,以降低对类似物进入活性位点的空间抑制,或者提供与类似物互补的特征。适用于修饰的许多这类聚合酶可用于(例如)测序、标记和扩增技术。例如,人DNA聚合酶β获自R&D系统公司(R&D systems)。DNA聚合酶I获自艾皮中心(Epicenter)、GE健康护理公司(GE Health Care)、英杰公司(Invitrogen)、新英格兰生物实验室公司(New England Biolabs)、普洛麦格公司(Promega)、罗氏应用科学公司(Roche Applied Science)、西格玛奥德里奇公司(Sigma Aldrich)和许多其它来源。DNA聚合酶I的克列诺片段的重组和蛋白酶消化形式可获自(如)安毕昂公司(Ambion)、企慕公司(Chimerx)、e酶有限公司(eEnzymeLLC)、GE健康护理公司、英杰公司、新英格兰生物实验室公司、普洛麦格公司、罗氏应用科学公司(RocheAppliedScience)、西格玛奥德里奇公司和许多其它来源。Φ29DNA聚合酶可获自(如)艾皮中心。聚A聚合酶、逆转录酶、测序酶、SP6DNA聚合酶、T4DNA聚合酶、T7DNA聚合酶和各种热稳定性DNA聚合酶(Taq、热启动、钛Taq等)可获自这些来源和其它来源。最近上式的DNA聚合酶包括获自新英格兰生物实验室公司的PhusionTM高保真DNA聚合酶;获自普洛麦格公司的
Figure A200680052606D00191
Flexi DNA聚合酶;艾皮中心的RepliPHITM Φ29 DNA聚合酶;获自司查塔基公司(Stratagene)的PfuUltraTM热启动DNA聚合酶;获自诺瓦基公司(Novagen)的KOD HiFi DNA聚合酶和许多其它酶。Biocompare.com对许多种不同的市售聚合酶进行了比较。
优选用作突变底物以降低空间抑制或掺入核苷酸类似物的互补特征的DNA聚合酶包括Taq聚合酶、外切核酸酶缺陷型Taq聚合酶、大肠杆菌DNA聚合酶1、克列诺片段、逆转录酶、Φ29相关聚合酶包括这类聚合酶的野生型Φ29聚合酶衍生物如外切核酸酶缺陷形式、T7DNA聚合酶、T5 DNA聚合酶、RB69聚合酶等。例如,重组DNA聚合酶可能与野生型或外切核酸酶缺陷型Φ29DNA聚合酶同源,如美国专利5,001,050、5,198,543或5,576,204所述。相似地,重组DNA聚合酶可能与Φ29、B103、GA-1、PZA、Φ15、BS32、M2Y、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722或L17等同源。
核苷酸类似物
如上所述,本发明各种聚合酶可将一种或多种核苷酸类似物掺入生长的寡核苷酸链中。掺入后,该类似物可能留下与生长寡核苷酸中的天然核苷酸相同或不同的残基(该聚合酶可掺入该类似物的任何非标准部分,或者可在掺入寡核苷酸的过程中将其切除)。本文中的“核苷酸类似物”是在具体应用中作用方式类似于天然产生的核苷三磷酸(“核苷酸”)的化合物,不指任何具体结构。核苷酸类似物是与标准天然产生的核苷酸不同,即与A、G、C、T或U不同的类似物,尽管掺入寡核苷酸后,该寡核苷酸中得到的残基可能与A、G、C、T或U残基相同(或不同)。
可获得许多核苷酸类似物。它们包括核心类似于天然产生的核苷酸的类似物结构,如与天然产生核苷或核苷酸相比,该核苷或核苷酸的磷酸、糖或碱基部分上存在一个或多个取代基的类似物。在一个实施方式中,相对于核苷三磷酸,核苷酸类似物可包括额外的一个或多个含磷酸基团。例如,含有(如)4-6个磷酸的各种核苷酸类似物的详情参见2005年9月29日提交的美国专利申请号11/241,809,将其全文纳入本文作参考用于所有目的。
例如,该类似物可包括具有下式所示的标记化合物:
Figure A200680052606D00201
式中B是核碱基(任选包含标记);S选自糖部分、非环部分或碳环部分(任选包含标记);L是任选的可检测标记;R1选自O和S;R2、R3和R4独立地选自O、NH、S、亚甲基、取代的亚甲基、C(O)、C(CH2)、CNH2、CH2CH2、C(OH)CH2R,其中R是4-吡啶或1-咪唑,限制条件是R4还可选自:
Figure A200680052606D00202
Figure A200680052606D00203
R5、R6、R7、R8、R11和R13当存在时各自独立地选自:O、BH3和S;R9、R10和R12独立地选自O、NH、S、亚甲基、取代的亚甲基、CNH2、CH2CH2、C(OH)CH2R,其中R是4-吡啶或1-咪唑。在一些情况下,膦酸类似物可用作类似物,例如,R2、R3、R4、R9、R10或R12之一不是O时,例如,它们是甲基等。参见例如,美国专利申请号11/241,809,上文中已经将其全文纳入本文作参考用于所有目的。
掺入类似物的碱基部分通常选自任何的天然或非天然核碱基或核碱基类似物,包括例如,通常在核酸中发现的嘌呤或嘧啶碱基和可得的核酸类似物,包括腺嘌呤、胸腺嘧啶、鸟嘌呤、胞苷、尿嘧啶,在一些情况下还包括肌苷。如上所述,碱基任选包含标记部分。方便起见,核苷酸和核苷酸类似物通常以其相对天然产生核苷酸的相似性命名。同样,在功能上类似于腺苷三磷酸的类似物在本文中通常可用速记字母A表示。同样,标准缩写T、G、C、U和I可用于表示一般用相同方式缩写的天然产生的核苷和核苷酸的类似物。在一些情况下,可以更普遍的方式使用碱基,例如任何嘌呤碱基能够与任何嘧啶碱基杂交,反之亦然。本发明所用的碱基部分包括本文所述的常规碱基,或者它们可包括在一个或多个侧基上被取代的这类碱基,或者其它荧光碱基或碱基类似物,如1,N6乙烯腺苷或吡咯C,其中额外的环结构使B基团既不是嘌呤也不是嘧啶。例如,在某些情况下,可能需要用标记基团或标记基团的组分,如供体或受体荧光团之一、或其它标记基团取代碱基部分的一个或多个侧基。标记的核碱基和标记这类基团的方法的离子参见例如,美国专利5,328,824和5,476,928,将其全部内容纳入本文用于所有目的。
在类似物中,S基团任选为提供适用于合成核酸链的主链的糖部分。例如,糖部分任选选自D-核糖基,2’或3’D-脱氧核糖基,2’,3’-D-双脱氧核糖基,2’,3’-D-双脱氢双脱氧核糖基,2’或3’烷氧基核糖基,2’或3’氨基核糖基,2’或3’巯基核糖基,2’或3’烷硫基核糖基(alkothioribosyl),无环、碳环或其它修饰的糖部分。可将各种碳环或非环部分作为“S”基团掺入,以取代糖部分,包括例如以公开的美国专利申请号2003/0124576所述的内容,上文中已经将其全文纳入本文作参考用于所有目的。
在大多数情况下,类似物中的含磷链(如常规NTP中的三磷酸)优选偶联于5’羟基,例如天然的核苷三磷酸。然而,在某些情况下,含磷链通过3’羟基连接于S基团。
L通常指可检测的标记基团,它通过R4(或者R10或R12)基团偶联于末端磷原子。本发明类似物中所用的标记基团可包含任何可检测标记。可检测标记通常指作为单独检测类似物化合物的基础的化学部分,它与不含这种标记基团的同一种化合物不同。标记的离子包括例如,光学标记,如给该类似物赋予可检测光学特性的标记;电化学标记,如给该类似物赋予可检测的电学或电化学特性的标记;物理标记,如给该类似物赋予不同的物理或空间特性的标记,如质量标签或分子体积标签。在某些情况下,可使用给本发明类似物赋予一种以上上述特性的单个标签或其组合。
任选地,掺入该类似物的标记基团包含光学检测部分,如发光、化学发光、荧光、荧光团、生色团和/或发色部分,优选荧光和/或荧光团标记。各种不同标记部分均可用于核苷酸类似物。这类基团包括荧光素标记、罗丹明标记、花青标记(即Cy3、Cy5等,通常获自GE健康护理公司(GE Healthcare)的安玛西亚生物科学部),Alexa荧光染料家族以及其它荧光和荧光团染料可获自分子探针公司/英杰公司(Molecular Probes/Invitrogen,Inc.),参见‘The Handbook—AGuide to Fluorescent Probes and Labeling Technologies(手册—荧光探针和标记技术的指南),第10版(2005)(获自英杰公司/分子探针公司(Invitrogen,Inc./Molecular Probes))。用于核苷多磷酸并且适用于本发明聚合酶掺入的核苷酸类似物的各种其它荧光和荧光团标记参见例如已公开的美国专利申请号2003/0124576,将其全部内容纳入本文作参考用于所有目的。
关于类似物和制备这种类似物的方法的其它详情可参见2005年9月29日提交的美国专利申请号11/241,809,将其全部内容纳入本文作参考用于所有目的。
因此,在一个说明性离子中,该类似物可以是含有(如)Alexa染料标记的磷酸类似物(如磷酸数多于核苷三磷酸的典型磷酸数的类似物)。例如,Alexa488染料可以标记在δ磷酸上(称为(例如)A488dC4P),或者可采用Alexa568或Alexa633染料(分别例如A568dC4P和A633dC4P),或者可采用Alexa546染料(如A546dG4P),或者可采用Alexa594染料(如A594dT4P)。相似地,为便于区分颜色,可将一对具有FRET(荧光共振能量转移)的荧光团标记在四磷酸类似物的δ磷酸上(称为(例如)FAM-amb-A532dG4P或FAM-amb-A594dT4P)。
修饰DNA聚合酶以降低位阻特征和/或加入互补特征
基于结构的重组聚合酶设计
可利用聚合酶的结构数据方便地将氨基酸残基鉴定为诱变候选物,以产生含有修饰的活性位点区的重组聚合酶。例如,对聚合酶的三维结构进行分析可鉴定在空间上阻止天然核苷酸或核苷酸类似物进入活性位点的残基或其类似物,或者可(例如)通过加入或改变电荷、疏水性、大小等进行突变而引入该类似物非天然特征的互补特征的残基。
已经通过X射线晶体法和核磁共振(NMR)谱图技术测定了大量DNA聚合酶的三维结构,包括结合有模板、核苷酸和/或核苷酸类似物的聚合酶结构。许多这类结构可从蛋白质数据银行(Protein Data Bank)免费下载获得,网址是www.rcsb.org/pdb。结构以及结构域和同源性信息也可由国家生物技术信息分子建模数据库中心(National Center for Biotechnology Information’s MolecularModeling DataBase)免费搜索下载获得,网址是www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml。可根据(例如)该聚合酶与结构已经测定的聚合酶的同源性建立其它聚合酶的结构模型。或者,可测定任选与核苷酸类似物等复合的给定聚合酶的结构。
晶体结构测定技术是众所周知的。参见例如,McPherson(1999)Crystallization of Biological Macromolecules(生物大分子的结晶)Cold SpringHarbor Laboratory(冷泉港实验室);Bergfors(1999)Protein Crystallization(蛋白质 结晶)International University Line;Mullin(1993)Crystallization(结晶)Butterwoth-Heinemann(BH出版社);Stout和Jensen(1989)X-ray structure determination:a practical guide,2nd Edition(X射线结构测定:实际指南,第2 版)Wiley Publishers(维利出版社),纽约;Ladd和Palmer(1993)Structure determination by X-ray crystallography,3rd Edition(用X射线晶体学测定结构, 第3版) Plenum Press(普来纳出版社),纽约;Blundell和Johnson(1976)Protein Crystallography(蛋白质晶体学) Academic Press(学术出版社),纽约;Glusker和Trueblood(1985)Crystal structure analysis:A primer,2nd Ed.(晶体结构分析: 引物,第2版) Oxford University Press(牛津大学出版社),纽约;International Tables for Crystallography(国际晶体学表),F卷.Crystallography of Biological Macromolecules(生物大分子的晶体学);McPherson(2002)Introduction to Macromolecular Crystallography(大分子晶体学简介)Wiley-Liss(威利李斯出版社);McRee和David(1999)Practical Protein Crystallography(实际蛋白质晶体 学),第二版 学术出版社;Drenth(1999)Principles of Protein X-Ray Crystallography(蛋白质X射线晶体学原理)(Springer Advanced Texts inChemistry(施普林格高级化学教科书))Springer-Verlag(施普林格出版社);Fanchon和Hendrickson(1991)Crystallographic Computing(晶体计算)第15章, 第5卷 IUCr/Oxford University Press(IUCr/牛津大学出版社);Murthy(1996)Crystallographic Methods and Protocols(晶体方法和标准操作)第5章HumanaPress(休曼出版社);Dauter等(2000)“Novel approach to phasing proteins:derivatization by short cryo-soaking with halides”(对蛋白质进行定相的新方法:用卤化物短时低温浸没来衍生化)Acta Cryst.D56:232-237;Dauter(2002)“Newapproaches to high-throughput phasing”(高通量定相的新方法)Curr.Opin.Structural Biol.12:674-678;Chen等(1991)“Crystal structure of a bovineneurophysin-II dipeptide complex at2.8  determined from the single-wavelengthanomalous scattering signal of an incorporated iodine atom”(由掺入碘原子的单波长不规则散布信号测定
Figure A200680052606D00241
的牛后叶激素运载蛋白II二肽复合物的晶体结构)Proc.Natl Acad.Sci.USA,88:4240-4244;和Gavira等(2002)“Ab initiocrystallographic structure determination of insulin from protein to electron densitywithout crystal handling”(在不进行晶体处理的情况下由蛋白质到电子密度的胰岛素从头晶体结构测定)Acta Cryst.D58:1147-1154。
此外,帮助收集数据、相测定、建模和提炼等的各种程序可由公共渠道获得。例子包括但不限于:HKL2000软件包(Otwinowski和Minor(1997)“Processing of X-ray Diffraction Data Collected in Oscillation Mode”(以振荡模式收集的X射线衍射数据的加工处理)Methods in Enzymology 276:307-326)、CCP4软件包(Collaborative Computational Project(计算机协作计划)(1994)“TheCCP4 suite:programs for protein crystallography”(CCP4套件:用于蛋白质结晶的程序)Acta Crystallogr D50:760-763)、SOLVE和RESOLVE(Terwilliger和Berendzen(1999)Acta Crystallogr D 55(第4部分):849-861)、SHELXS和SHELXD(Schneider和Sheldrick(2002)“Substructure solution with SHELXD”(用SHELXD解决亚结构问题)Acta Crystallogr D Biol Crystallogr 58:1772-1779)、Refmac5(Murshudov等(1997)“Refinement of Macromolecular Structures by theMaximum-Likelihood Method”(用最大概率法提炼大分子结构)Acta CrystallogrD 53:240-255)、PRODRG(van Aalten等(1996)“PRODRG,a program forgenerating molecular topologies and unique molecular descriptors from coordinatesof small molecule”(PRODRG,一种产生分子拓扑结构的程序和由小分子坐标进行描述的独特分子描述程序)J Comput Aided Mol Des 10:255-262)和O(Jones等(1991)“Improved methodsfor building protein models in electron density mapsand the location of errors in these models”(用电子密度图对蛋白质建模的改进方法和这些模型中的误差位置)Acta Crystallogr A 47(第2部分):110-119)。
相似地,文献中也已经描述了用NMR谱图测定结构的技术。参见例如,Cavanagh等(1995)Protein NMR Spectroscopy:Principles and Practice(蛋白质 NMR谱图:原理和实践),学术出版社;Levitt(2001)Spin Dynamics:Basics of Nuclear Magnetic Resonance(自选动力学:核磁共振基础),约翰韦利森公司(JohnWiley & Sons);Evans(1995)Biomolecular NMR Spectroscopy(生物分子NMR 谱图1,牛津大学出版社;Wüthrich(1986)NMR ofProteins and Nucleic Acids(蛋 白质和核酸的NMR)(贝克演讲系列(Baker Lecture Series)),科特维利科学公司(Kurt Wiley-Interscience);Neuhaus和Williamson(2000)The Nuclear Overhauser Effect in Structural and Conformational Analysis(结构和构象分析中的核奥弗豪 泽效应),第2版,维利VCH公司(Wiley-VCH);Macomber(1998)A Complete Introduction to Modern NMR Spectroscopy(现代NMR谱的完整介绍),维利科学公司;Downing(2004)Protein NMR Techniques(蛋白质NMR技术)(Methods inMolecular Biology(分子生物学方法)),第2版,Humana Press(休曼出版社);Clore和Gronenborn(1994)NMR of Proteins(蛋白质NMR)(Topics in Molecular andStructural Biology(分子和结构生物学论题)),CRC Press(CRC出版社);Reid(1997)Protein NMR Techniques(蛋白质NMR技术),休曼出版社;Krishna和Berliner(2003)Protein NMR for the Millenium(二十一世纪蛋白质NMR)(Biological Magnetic Resonance(生物磁共振)),Kluwer Academic Publishers(克鲁学术出版社);Kiihne和De Groot(2001)Perspectives on Solid State NMR in Biology(生物学中的固态NMR观点)(Focus on Structural Biology(结构生物学焦点),1),克鲁学术出版社;Jones等(1993)Spectroscopic Methods and Analyses: NMR,Mass Spectrometry and Related Techniques(谱图方法和分析:NMR、质 谱和相关技术)(Methods in Molecular Biology(分子生物学方法),第17卷),休曼出版社;Goto和Kay(2000)Curr.Opin.Struct.Biol.10:585;Gardner(1998)Annu.Rev.Biophys.Biomol.Struct.27:357;Wüthrich(2003)Angew.Chem.Int.Ed.42:3340;Bax(1994)Curr.Opin.Struct.Biol.4:738;Pervushin等(1997)Proc.Natl.Acad.Sci.U.S.A.94:12366;Fiaux等(2002)Nature 418:207;Fernandez和Wider(2003)Curr.Opin.Struct.Biol.13:570;Ellman等(1992)J.Am.Chem.Soc.114:7959;Wider(2000)BioTechniques 29:1278-1294;Pellecchia等(2002)Nature Rev.Drug Discov.(2002)1:211-219;Arora和Tamm(2001)Curr.Opin.Struct.Biol.11:540-547;Flaux等(2002)Nature 418:207-211;Pellecchia等(2001)J.Am.Chem.Soc.123:4633-4634;和Pervushin等(1997)Proc.Natl.Acad.Sci.USA 94:12366-12371。
如上所述,可通过X射线晶体学和NMR光谱直接测定给定核苷酸类似物掺入活性位点的聚合酶结构,或者可根据聚合酶的结构和/或结合有天然核苷酸的聚合酶的结构建立结构模型。可通过(例如)与其它聚合酶的同源性、检测聚合酶-模板或聚合酶-核苷酸共同复合物、生化分析突变聚合酶和/或其它方法鉴定该聚合酶的活性位点区。可根据(例如)以前测定的活性位点中另一核苷酸或核苷酸类似物的位置,设计该类似物非天然特征的位置(如连接于该核苷酸的含磷链中的其它磷酸或膦酸基团,如四、五或六磷酸基团、可检测标记基团如荧光染料等),建立核苷酸类似物在活性位点中的位置。
这种对活性位点中核苷酸类似物建立模型的方法可包括简单的目测聚合酶模型,例如,使用分子图像软件如PyMOL查看器(开放源代码,由互联网站www.pymol.org免费获得)或Insight II(购自Accelrys(安塞瑞斯公司)(www.accelrys.com/products/insight)。或者,对聚合酶或推定突变聚合酶活性位点中的核苷酸类似物建模可包括计算机实现的对接、分子动力学、自由能量最小化和/或类似计算方法。文献中详细描述了这类建模技术;参见例如,Babine和Abdel-Meguid(编)(2004)Protein Crystallography inDrugDesign(药物 设计中的蛋白质晶体学),Wiley-VCH(维利-VCH公司),Weinheim;Lyne(2002)“Structure-based virtual screening:An overview”(基于结构的虚拟筛选:概述)Drug       Discov.       Today        7      :      1047-1055      ;www.usm.maine.edu/~rhodes/SPVTut/index.html上的Molecular Modeling forBeginners(适合初学者的分子建模方法)和www.dddc.ac.cn/embo04上的Methodsfor Protein Simulations and Drug Design(蛋白质模拟和药物设计所用的方法);和其中的参考文献。帮助进行这种建模的软件可来自各种来源,例如CHARMm模拟软件包,获自哈佛大学或购自安塞瑞斯公司(www.accelrys.com);Discover模拟软件包(包含于Insight II中,同上)和Dynama(www.cs.gsu.edu/~cscrwh/progs/progs.html)。大量建模软件的列表也参见www.netsci.org/Resources/Software/Modeling/MMMD/top.html。
对聚合酶模型进行观测和/或计算分析可鉴定到活性位点区的相关特征,包括例如,可以在空间上抑制核苷酸类似物进入活性位点的残基(例如,当类似物结合于聚合酶时,不合需要地接近类似物中一个或多个原子的设计位置的残基)。这种残基可以(例如)缺失或用具有较小侧链的残基取代;例如,可利用具有相似特征但氨基酸侧链较短的残基、或者用丙氨酸方便地取代许多残基。相似地,可鉴定到通过改变引入所需的与核苷酸类似物的相互作用的残基。可利用与类似物非天然特征互补的残基,例如用可通过氢键结合于该类似物的残基(如丝氨酸、苏氨酸、组氨酸、天冬酰胺或谷氨酰胺)取代这类残基,这些残基包括例如,可与类似物上的疏水基团相互作用的疏水残基、可与类似物上基团发生有利的疏水作用的芳香残基(如荧光团)、可参与类似物中芳香基团的π-π或边-面堆积(edge-face stacking)作用的芳香残基、可参与类似物的阳离子-π相互作用的残基或者可与类似物上带相反电荷的部分(如其它磷酸基团)发生静电作用的带电残基(如天冬氨酸或谷氨酸,或者赖氨酸、精氨酸或组氨酸)。
这种基于结构的设计的一个具体例子是,检查Φ29聚合酶模型将Δ505-525结构域,残基K135、E486和K512鉴定为可能对类似物进入活性位点产生空间抑制,这表明E375突变成组氨酸、赖氨酸或精氨酸将引入与类似物上的非天然四磷酸互补的正电荷。相似地,检查该模型表明,E375突变成芳香残基如色氨酸、酪氨酸或苯丙氨酸将提高与类似物上荧光团的疏水相互作用。更详细的描述参见下述实施例2和3。
因此,除使用聚合酶和本文所述的其它组合物的方法以外,本发明还包括制备这些聚合酶的方法。如上所述,制备重组DNA聚合酶的方法可包括(例如)使用任何已知的晶体结构和分子建模软件或系统建立第一种聚合酶的模型。根据建模,例如,在活性位点中或其附近鉴定到影响核苷酸进入活性位点和/或核苷酸类似物在活性位点区内的结合的一种或多种空间抑制特征或互补特征。使第一种DNA聚合酶突变,以降低或去除至少一种空间抑制特征或加入互补特征。
活性位点区的突变
本发明任选使用各种类型的诱变,以修饰聚合酶产生包含互补特征的突变体或降低位阻特征,例如与上述聚合酶模型或模型预计相一致。通常,可利用任何可用的诱变方法来制备这类突变体。这些诱变方法任选包括,根据一种或多种感兴趣活性(例如,对核苷酸类似物的Km、Vmax、kcat等提高)选择突变的核酸和多肽。可使用的方法包括但不限于:定位点诱变、随机点诱变、体外或体内同源重组(DNA改组)、利用含尿嘧啶的模板诱变、寡核苷酸定向诱变、硫代磷酸酯-修饰的DNA诱变、利用缺口双链体DNA诱变、点错配修复、利用修复缺陷宿主菌株诱变、限制性选择和限制性纯化、缺失诱变、全基因合成诱变、简并PCR、双链断裂修复和本领域技术人员已知的许多其它方法。
任选地,可通过来自天然产生的聚合酶分子、或改变或突变的已知聚合酶的已知信息(如利用已有的外切核酸酶活性降低的突变聚合酶),如序列、序列比较、物理特性、晶体结构和/或上述类似方法指导诱变。然而,在另一类实施方式中,可以进行基本随机的修饰(如,经典DNA改组)。
关于突变形式的其它信息参见:Sambrook等,Molecular Cloning-A Laboratory Manual(分子克隆-实验室手册)(第3版),第1-3卷,冷泉港实验室出版社,冷泉港,纽约,2000(“Sambrook”);Current Protocols in Molecular Biology(新编分子生物学实验指南),F.M.Ausubel等编,Current Protocols(精编实验指南丛书),格林出版集团公司(Greene Publishing Associates,Inc.)和约翰维利出版公司(John Wiley & Sons,Inc.)的合资公司,(2006增刊)(“Ausubel”))和PCR Protocols A Guide to Methods and Applications(PCR方案:方法和应用指南)(Innis等编)学术出版社公司,加州圣地亚哥(1990)(Innis)。以下发表物和其中引用的参考文献提供了有关突变形式的其它详情:Arnold,Protein engineering for unusual environments(非常环境下的蛋白质工程),Current Opinion in Biotechnology4:450-455(1993);Bass等,Mutant Trprepressors with new DNA-binding specificities(具有新DNA结合特异性的突变Trp阻抑物),Science 242:240-245(1988);Botstein和Shortle,Strategies andapplications of in vitro mutagenesis(体外诱变的方案和应用),Science 229:1193-1201(1985);Carter等,Improved oligonucleotide site-directed mutagenesisusing M13 vector(用M13载体改进寡核苷酸定位诱变),Nucl.Acids Res.13:4431-4443(1985);Carter,Site-Directed Mutagenesis(定位诱变),Biochem.J.237:1-7(1986);Carter,Improved oligonucleotide-directed mutagenesis usingM13 vector(用M13载体改进寡核苷酸-定向诱变),Methods in Enzymol.154:382-403(1987);Dale等,Oligonucleotide-directedrandom mutagenesis using thephosphorothioate method(用硫代磷酸酯法进行寡核苷酸-定向随机诱变),Methods Mol.Biol.57:369-374(1996);Eghtedarzadeh和Henikoff,Use ofoligonucleotides to generate large deletions(利用寡核苷酸产生大缺失),Nucl. Acids Res.14:5115(1986);Fritz等,Oligonucleotide-directed construction ofmutation:a gapped duplex DNA procedure without enzymatic reactions in vitro(寡核苷酸-定向的突变构建:在体外没有酶反应的缺口双链体DNA法),Nucl. Acids Res.16:6987-6999(1988);
Figure A200680052606D00291
等,Oligonucleotide-directedmutagenesis by microscale′shot-gun′gene synthesis(通过微量级“鸟枪法”基因合成进行寡核苷酸定向诱变),Nucl.Acids Res.13:3305-3316(1985);Kunkel,The efficiency of Oligonucleotide directed mutagenesis(寡核苷酸定向诱变的效率),刊于Nucleic Acids and Molecular Biology(核酸和分子生物学)(Eckstein,F.和Lilley,D.M.J.编,施普林格出版社(Springer Verlag),柏林))(1987);Kunkel,Rapid and efficient site-specific mnutagenesis without phenotypic selection(不进行表型选择时快速和有效的定位诱变),Proc.Natl.Acad.Sci.USA82:488-492(1985);Kunkel等,Rapid and efficient site-specific mutagenesiswithout phenotypic selection(不进行表型选择时快速和有效的定位诱变),Methods in Enzymol.154,367-382(1987);Kramer等,The gapped duplex DNAapproach to Oligonucleotide-directed mutation construction(寡核苷酸定向突变构建的缺口双链体DNA法),Nucl.Acids Res.12:9441-9456(1984);Kramer和Fritz Oligonucleotide-directed construction of mutation via gapped duplex DNA(通过缺口双链体DNA进行寡核苷酸定向突变构建),Methods inEnzymol.154:350-367(1987);Kramer等,Point Mismatch Repair,Cell38:879-887(1984);Kramer等,Improved enzymatic in vitro reactions in the gapped duplexDNA approach to Oligonucleotide-directed construction of mutation(寡核苷酸定向突变构建的缺口双链体DNA法中改进的酶体外反应),Nucl.Acids Res.16:7207(1988);Ling等,Approaches to DNA mutagenesis:an overview(DNA诱变方法:概览),Anal Biochem.254(2):157-178(1997);Lorimer和Pastan Nucleic Acids Res.23,3067-8(1995);Mandecki,Oligonucleotide-directeddouble-strand break repair in plasmids of Escherichia coli:a method forsite-specific mutagenesis(大肠杆菌质粒中寡核苷酸定向的双链断裂修复:一种位点特异性诱变方法),Proc.Natl.Acad.Sci.USA,83:7177-7181(1986);Nakamaye和Eckstein,Inhibition of restriction endonuclease Nci I cleavage byphosphorothioate groups and its application to Oligonucleotide- directedmutagenesis(用硫代磷酸酯基团抑制限制性核酸内切酶NciI切割和它在寡核苷酸定向诱变中的应用),Nucl.Acids Res.14:9679-9698(1986);Nambiar等,Total synthesis and cloning of a gene coding for the ribonuclease S protein(编码核糖核酸酶S蛋白的基因的全合成和克隆),Science223:1299-1301(1984);Sakamar和Khorana,Total.synthesis and expression of agene for the a-subunit ofbovine rod outer segment guanine nucleotide-binding protein(transducin)(牛杆外节段鸟嘌呤核苷酸结合蛋白的α亚基基因的全合成和表达(转导蛋白)),Nucl. AcidsRes.14:6361-6372(1988);Sayers等,Y-TExonucleases inphosphorothioate-based Oligonucleotide-directed mutagenesis(基于硫代磷酸酯的寡核苷酸定向诱变中的Y-T外切核酸酶),Nucl.Acids Res.16:791-802(1988);Sayers等,Strand specific cleavage of phosphorothioate-containing DNAby reaction with restriction endonucleases in the presence of Ethidium bromide(在溴乙锭存在下通过限制性内切酶反应对含硫代磷酸酯的DNA进行链特异性切割),(1988)Nucl.Acids Res.16:803-814;Sieber等,Nature Biotechnology,19:456-460(2001);Smith,In vitro mutagenesis(体外诱变),Ann.Rev.Genet.19:423-462(1985);Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987);Stemmer,Nature 370,389-91(1994);Taylor等,The use of phosphorothioate-modified DNA in restriction enzyme reactions toprepare nicked DNA(在限制性酶反应中使用硫代磷酸酯修饰的DNA制备缺口DNA),Nucl.Acids Res.13:8749-8764(1985);Taylor等,The rapidgeneration of Oligonucleotide-directed mutations at high frequency usingphosphorothioate-modified DNA(用硫代磷酸酯修饰的DNA快速产生高频率的寡核苷酸定向突变),Nucl.Acids Res.13:8765-8787(1985);Wells等,Importance of hydrogen-bond formation in stabilizing the transition state ofsubtilisin(氢键形成在稳定枯草杆菌蛋白酶过渡状态中的重要性),Phil.Trans. R.Soc.Lond.A 317:415-423(1986);Wells等,Cassette mutagenesis:anefficient method for generation of multiple mutations at defined sites(盒式诱变:在确定位点产生多个突变的有效方法),Gene 34:315-323(1985);Zoller和Smith,Oligonucleotide-directed mutagenesis using M13-derived vectors:anefficient and general procedure for the production of point mutations in any DNAfragment(用M13衍生载体进行寡核苷酸定向诱变:在任意DNA片段中产生点突变的通用有效方法),Nucleic Acids Res.10:6487-6500(1982);Zoller和Smith,Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13vectors(克隆到M13载体中的DNA片段的寡核苷酸定向诱变),Methods in Enzymol.100:468-500(1983);和Zoller和Smith,Oligonucleotide-directedmutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template(寡核苷酸定向诱变:用两种寡核苷酸引物和单链DNA模板进行的简单方法),Methods in Enzymol.154:329-350(1987)。关于上述方法的其它详情可参见《酶学方法》(Methods in Enzymology)第154卷,它也描述了用于查找各种诱变方法中出现的问题的有用对照。
测定动力学参数
可筛选或检测本发明的聚合酶,以确定该聚合酶对核苷酸类似物的活性相对于第一种DNA聚合酶(如衍生出该重组聚合酶的相应野生型聚合酶)是否改变。例如,可测定重组DNA聚合酶对核苷酸类似物的kcat、Km、Vmax、kcat/Km、Vmax/Km、kpol、和/或Kd。另外,也可测定重组DNA聚合酶对天然核苷酸的kcat、Km、Vmax、Vmax/Km、kcat/Km、kpol和/或Kd(例如,聚合酶需要具有类似物和天然核苷酸掺入活性时)。
如本领域众所周知的那样,对服从简单米-曼氏动力学的酶而言,不难由不同底物浓度下测定的催化速率获得动力学参数。米-曼氏方程式V=Vmax[S]([S]+Km)-1将未合并的底物浓度([S],大致等于总的底物浓度)、最大速率(Vmax,酶被底物饱和时获得的速率)和米氏常数(Km,等于反应速率为半数最大值时的底物浓度)关联至反应速率(V)。
对许多酶而言,Km等于酶-底物复合物的解离常数,因此是酶-底物复合物强度的衡量。对这类酶而言,在Km的比较中,Km较低表明复合物的结合较强,而Km较高则表明复合物的结合较弱。kcat/Km之比有时称为特异性常数,代表底物与游离酶的组合的表观速率常数。特异性常数越高,酶结合底物和将其转化为产物的效率越高。
如果总酶浓度([ET],即活性位点浓度)已知,则可测定kcat(也称为酶周转数),因为Vmax=kcat[ET]。在总酶浓度难以测定的情况下,Vmax/Km之比常常用于衡量效率。例如,可由1/V对1/[S]的利-伯曲线(Lineweaver-Burk plot)测定Km和Vmax,其中y截距是1/Vmax,x截距是-1/Km,斜率是Km/Vmax,或者可由V对V/[S]的艾-霍曲线(Eadie-Hofstee plot)测定Km和Vmax,其中y截距是Vmax,x截距是Vmax/Km,斜率是-Km。软件包如KinetAsystTM或Enzfit(英国剑桥的生物软件公司(Biosoft,Cambridge,UK))可帮助由催化速率数据确定动力学参数。
对具有多种底物的酶如聚合酶而言,改变一种底物的浓度而保持其它底物适当过量(如有效恒定)浓度一般会产生正常的米-曼动力学。
在一个实施方式中,使用预稳态动力学时,速率kobs(dNTP掺入的一级速率常数观察值)的核苷酸浓度依赖性能够估计基态结合的Km和最大聚合速率(kpol)。用爆发试验(burst assay)测定kobs。用爆发方程拟合该试验的结果;产物=A[1-exp(-kobs*t)]+kss*t,其中A代表酶活性位点浓度的估计值,kss是稳态速率常数观察值,t是反应培育时间。dNTP结合于聚合酶-DNA复合物的Km和kpol的计算方法是:用方程式kobs=(kpol*[S])*(Km+[S])-1拟合kobs的dNTP浓度依赖性改变,其中[S]是底物浓度。任选由快速终止实验(也称为终止流动测定)获得结果,例如,根据Johnson(1986)“Rapid kinetic analysis of mechanochemicaladenosinetriphosphatases”(机械化学腺苷三磷酸酶的快速动力学分析)MethodsEnzymol.134:677-705,Patel等(1991)“Pre-steady-state kinetic analysis ofprocessive DNA replication including complete characterization of anexonuclease-deficient mutant”(包括外切核酸酶缺陷型突变体的完整表征在内的进行性DNA复制的预稳态动力学分析)Biochemistry 30(2):511-25以及Tsai和Johnson(2006)“A new paradigm for DNA Polymerase specificity”(DNA聚合酶特异性的新范例)Biochemistry 45(32):9675-87所述方法获得结果。
也可测定诸如重组聚合酶与核苷酸类似物的结合速率、重组聚合酶的产物释放速率或重组聚合酶的分支速率(“分支速率”是未掺入核苷酸或核苷酸类似物时核苷酸或核苷酸类似物与聚合酶活性位点的解离速率,其中掺入的核苷酸或核苷酸类似物将与模板中互补的核苷酸或核苷酸类似物发生正确的碱基配对)之类的参数,并任选将其与第一种聚合酶(如相应野生型聚合酶)作比较。参见例如,本文实施例3。
有关酶动力学的更充分的讨论参见例如,Berg,Tymoczko和Stryer(2002)Biochemistry(生物化学),第五版,W.H.Freeman;Creighton(1984)Proteins: Structures and Molecular Principles(蛋白质:结构和分子原理),W.H.Freeman;和Fersht(1985)Enzyme Structure and Mechanism(酶结构和机理),第二版,W.H.Freeman。
如上所述,相关DNA聚合酶含有与野生型DNA聚合酶的野生型活性位点区同源的改变的活性位点区,例如,其相对于野生型活性位点区包含一个或多个结构修饰,提高了该酶对一种或多种天然核苷酸和/或核苷酸类似物的相对活性,而对核苷酸类似物活性提高为优选目标。在至少一个方面,不想受任何具体操作理论的束缚,使修饰靶向降低核苷酸类似物进入修饰的活性位点的空间抑制和/或与核苷酸类似物的一种或多种非天然特征互补。重组聚合酶对核苷酸类似物的Km值一般低于相应的同源野生型聚合酶对该核苷酸类似物的Km
在一个方面,参照模型类似物或类似物组测得本发明酶的活性提高,并将该活性与给定的母体酶作比较。例如,在衍生自Φ29母体酶的酶的情况下,本发明改进的酶对给定类似物的Km低于母体酶,如野生型Φ29或N62D Φ29。通常,出于讨论目的,本发明改进的酶的例子的特征可以是对分别经过Φ29衍生酶合理的充分加工和合理的不充分加工的两种类似物A488dC4P和/或A568dC4P的Km较低,是N62D Φ29对相同类似物所具有的Km的约5%或更低至约90%或更低。例如,如下述实施例更详细地描述,例如,在表2中,His-375H-N62D Φ29的Km约为N62D Φ29对A488dC4P的Km的40%,而His-375S-N62D Φ29的Km约为N62D Φ29对A488dC4P的Km的75%。相似地,His-375H-N62D Φ29的Km约为N62D Φ29对A568dC4P的Km的15%,而His-375S-N62D Φ29的Km约为N62D Φ29对A568dC4P的Km的38%。虽然上述内容可用作鉴定工具,但它不应成为本发明的特别限制性反应。
筛选聚合酶
可利用筛选或其它方法测得聚合酶对核苷酸类似物的活性相对于第一种DNA聚合酶是否改变。例如,如上所述测定重组DNA聚合酶对核苷酸类似物的kcat、Km、Vmax或kcat/Km。另外,也可用相似方法测定重组DNA聚合酶对天然核苷酸的kcat、Km、Vmax或kcat/Km(例如,聚合酶需要具有类似物和天然核苷酸掺入活性时)。
在一个优选方面,可制备重组DNA聚合酶文库并筛选这些特性。例如,可制备多个文库成员,以包含一种或多种推定的空间抑制特征突变和/或推定产生该核苷酸类似物的一种或多种非天然特征的互补特征的突变,然后筛选感兴趣的特性。通常,筛选该文库后可鉴定到至少一个感兴趣活性改变的成员。
聚合酶文库的属性可以是物理性或逻辑性的。而且,可采用各种文库形式。例如,可将聚合酶固定于蛋白质阵列的固体表面。相似地,可构建聚合酶的液相阵列(如微孔板中的阵列),以便于对含有聚合酶的溶液进行高通量流体操作。也可在微孔板中、或在琼脂平板上构建表达重组聚合酶的液体、乳剂或凝胶相文库。可产生聚合酶或聚合酶结构域(如包含活性位点区)的噬菌体展示文库。制备和使用文库的说明书可参见例如本文引用的Ausubel和Berger。
为了产生文库(包括流体转移到微量滴定板中或由微量滴定板转移出流体),任选使用流体操作台。可购得进行这种转移的几种“现货供应”流体操作台,包括例如,凯里伯生物科学公司(马萨诸塞州霍普金顿(Hopkinton,MA))的Zymate系统和利用自动移液器的其它操作台,例如与平板移动的机器人联用(如,
Figure A200680052606D00351
机器人,用于各种实验室系统(例如获自加州富勒敦的贝克曼计数器公司(Beckman Coulter,Inc.,Fullerton,CA))。
在另一实施方式中,在微芯片中进行流体处理,例如,包括将材料由微孔板或其它孔经由芯片上的微通道转移到目的位点(微通道区域、孔、室等)。市售微流体系统包括获自惠普/安捷伦科技公司(Hewlett-Packard/AgilentTechnologies)的系统(如HP2100生物分析仪)和凯里伯高通量筛选系统。凯里伯高通量筛选系统提供了标准微孔文库形式和实验室芯片技术(Labchiptechnologies)之间的接口范例。而且,专利和技术文献包括许多微流体技术的例子,它们可以直接与流体处理的微孔板接口连接。
所需特性
根据应用,本发明聚合酶可具有对天然或核苷酸类似物的各种修饰特性,包括掺入碱基的速度提高、停留时间增加(或速度降低),持续合成能力较高等。例如,需要掺入较高水平的核苷酸类似物时,选择与相应的同源野生型聚合酶相比,对给定核苷酸类似物Km较低、Vmax较高和/或kcat较高的本发明聚合酶。在某些实施方式中,需要减慢或加快该聚合酶的核苷酸掺入总速度(如根据用于监测掺入的设备的分辨率),或者提高持续合成能力、特异性等。在某些实施方式中,与相应的同源野生型聚合酶相比,重组聚合酶核苷酸类似物结合速率提高、产物释放速率提高和/或分支速率降低。可筛选这些特征汇总的任何特征,以选择本发明聚合酶。
例如,本发明聚合酶一般可将天然核苷酸(如A、C、G和T)掺入生长的核酸拷贝中。例如,该重组聚合酶对天然核苷酸的比活任选为相应的同源野生型聚合酶的至少约5%(如5%、10%、25%、50%、75%、100%或更高),其在模板存在下对天然核苷酸的持续合成能力为天然核苷酸存在下野生型聚合酶持续合成能力的至少5%(如5%、10%、25%、50%、75%、100%或更高)。任选地,重组聚合酶对天然产生的核苷酸的kcat/Km或Vmax/Km为野生型聚合酶的至少约10%(如10%、25%、50%、75%或100%或更高)。
其它实施例详情
本文描述了修饰的活性位点区的许多具体例子。从这些聚合酶的三维结构来看,“活性位点区”是包含或接近活性位点的聚合酶部分(如距活性位点约2nm)。本文描述了Φ29 DNA聚合酶活性位点以内或附近的结构修饰的具体例子。例如,相对于野生型Φ29 DNA聚合酶,这些修饰可包括:Δ505-525缺失、Δ505-525结构域内的缺失、K135A突变、L384R突变(例如与本文所述的另一突变结合)、E375H突变、E375S突变、E375K突变、E375R突变、E375A突变、E375Q突变、E375W突变、E375Y突变、E375F突变、E486A突变、E486D突变、K512A突变、表8所列突变和其组合。例如,聚合酶可包含选自表8所列组合的突变组合。
相对于降低或消除内源性外切核酸酶活性的野生型聚合酶,聚合酶任选还包含一个或多个突变/缺失。例如,相对于野生型Φ29 DNA聚合酶,任选使N62发生突变或缺失,以降低外切核酸酶活性;例如,该聚合酶可包含N62D突变。降低外切核酸酶活性的其它示范性突变包括D12A、T15I、E14I和/或D66A;因此,本发明聚合酶任选包含一个或多个这些突变。
应理解,氨基酸残基的编号是相对于Φ29聚合酶的野生型序列而言的,在本发明分子内的实际位置可取决于该酶相对于野生型Φ29酶包含的各种修饰的特性,如在该分子末端或分子本身内部发生的分子缺失和/或添加。
亲和标签和其它任选的聚合酶特征
重组DNA聚合酶任选包含对该聚合酶而言外源或异源的其它特征。例如,该重组聚合酶任选包含一种或多种外源性亲和标签,如,纯化或底物结合标签,如6His标签序列、GST标签、HA标签序列、多个6His标签序列、多个GST标签、多个HA标签序列、SNAP标签等。任选包括了聚合酶与表面结合的这些和其它特征,以便在聚合酶结合于表面时定向和/或保护聚合酶活性位点。其它有用特征包括该酶的重组二聚体结构域,和(如)偶联于聚合酶活性位点远端的大外源多肽结构域。例如,对Φ29而言,活性位点位于该蛋白的C末端区域内,聚合酶偶联于表面时一般在N末端区域内加入表面结合元件(额外结构域、His标签等)以避免干扰活性位点。
通常,可加入聚合酶(通过重组或化学方法加入)的表面结合元件和纯化标签包括,例如,聚组氨酸标签、HIS-6标签、生物素、亲和素、GST序列、BiTag序列、S标签、SNAP标签、肠激酶位点、凝血酶位点、抗体或抗体结构域、抗体片段、抗原、受体、受体结构域、受体片段、配体、染料、受体、猝灭剂或其组合。
可加入多个表面结合域,以便相对于表面确定多肽的取向和/或提高聚合酶与表面的结合。通过在两个或多个位点上结合表面,通过两个或多个独立标签,使聚合酶相对于表面保持相对固定的取向。有关将聚合酶固定于表面的其它详情参见Hanzel等的美国专利申请60/753,446“PROTEIN ENGINEERINGSTRATEGIES TO OPTIMIZE ACTIVITY OF SURFACE ATTACHEDPROTEINS”(优化表面连接蛋白的活性的蛋白质工程方法)和Hanzel等的美国专利申请60/753,515“ACTIVE SURFACE COUPLED POLYMERASES”(活性表面偶联的聚合酶),它们均于2005年12月22日提交,纳入本文作参考用于所有目的;还可参见Hanzel等的律师案卷号105-00810US“ACTIVE SURFACECOUPLED POLYMERASES”(活性表面偶联的聚合酶),与本发明同时提交,纳入本文作参考用于所有目的。
提高DNA聚合酶掺入核苷酸类似物的能力的应用
任选利用本发明聚合酶、天然和/或核苷酸类似物和核酸模板(DNA或RNA)来拷贝模板核酸。即,使聚合酶、核苷酸类似物和任选的天然核苷酸和其它试剂、模板和复制起始部分的的混合物发生反应,以使聚合酶以模板依赖性方式延伸引物。所述部分可以是标准的寡核苷酸引物,或者是模板的一部分,例如,所述模板可以是自身引导的单链DNA、有缺口的双链DNA等。相似地,末端蛋白可用作起始部分。可将至少一个核苷酸类似物掺入DNA。模板DNA可以是线性或环状DNA,在某些应用中,宜为环状模板(如,滚圈复制或环状模板的测序)。任选地,该组合物可用于自动化DNA复制和/或测序系统。
通过本发明聚合酶掺入标记的核苷酸类似物特别可用于各种不同核酸分析,包括实时监测DNA聚合。标记本身可掺入,或者更优选地,在掺入过程中可释放。例如,可以在聚合酶掺入类似物的过程中监测标记的释放,以便实时监测类似物掺入。掺入的类似物部分可能与天然核苷酸相同,或者可包括类似物不同于天然核苷酸的特征。
通常,可利用标记的掺入或释放来表示生长核酸链的存在和组成,例如提供模板复制/扩增和/或模板序列的证据。通过掺入进行信号转导可能是检测由掺入类似物释放的标记基团的结果(如固相实验),或者可能在掺入反应后产生。例如,在FRET标记的情况下结合的标记被淬灭而游离标签未淬灭,所以掺入类似物释放标记基团时可产生荧光信号。或者,可用接近活性位点的FRET对成员之一标记该酶,掺入携带另一成员的类似物后会发生能量转移。在核酸测序应用中使用酶结合的FRET组分的描述参见例如,已公开的美国专利申请号2003-0044781,纳入本文作参考。
在感兴趣的一个反应实例中,聚合酶反应可被隔离能够有效观察单个聚合酶分子的极小观察体积内。结果是,掺入事件能够观察容易与非掺入核苷酸类似物区分开的掺入的核苷酸类似物。在优选方面,通过将聚合酶固定在光学限制区(optical confinement)内提供这种小观察体积,如零模式波导管。有关ZMW和它们在单分子分析、特别是核酸测序中的应用,参见例如,已公开的美国专利申请号2003/0044781和美国专利号6,917,726,将其全文纳入本文用于所有目的。
通常,在一种或多种核苷酸和/或一种或多种本发明核苷酸类似物的存在下使聚合酶与模板链复合。例如,在某些实施方式中,存在代表四种天然核苷酸A、T、G和C各自的类似化合物的标记类似物,例如单独的聚合酶反应如经典Sanger测序;或者这些类似物混合存在于一个反应中,例如多重测序法。当聚合反应过程中模板链中的一个特定碱基碰到聚合酶时,它与此核苷酸的互补类似物复合,并将该类似物掺入初始和生长的核酸链中。在一个方面,掺入可导致标记被释放,例如在多磷酸类似物中,在类似物的α和β磷原子之间切割,随后释放标记基团(或其部分)。通过类似物存在时间较长和复合物中的标记检测掺入事件,或者通过标记基团释放到周围介质中检测掺入事件。当不同标记基团用于各种类型的类似物如A、T、G或C时,鉴定掺入类似物的标记能够鉴定该类似物,从而测定当时加工的模板链中的互补核苷酸。连续的反应和监测使得能够实时监测聚合反应和测定模板核酸的序列。如上所述,在特别优选的方面,提供的聚合酶/模板复合物固定在能够观察单个复合物的光学限制区内,如零模式波导管。除了它们在测序中的应用外,本发明类似物也可用于各种其它基因型分析,例如用单碱基延伸法进行的SNP基因型分析、实时监测扩增如RT-PCR法等。
有关测序和核酸扩增的其它详情可参见Sambrook等,Molecular Cloning- A Laboratory Manual(分子克隆-实验室手册)(第3版),第1-3卷,纽约冷泉港的冷泉港实验室出版社,2000(“Sambrook”);Current Protocols in Molecular Biology(新编分子生物学实验指南),F.M.Ausubel等编,Current Protocols(精编实验指南丛书),格林出版集团公司(Greene Publishing Associates,Inc.)和约翰维利出版公司(John Wiley & Sons,Inc.)的合资公司,(2006增刊)(“Ausubel”))和PCR Protocols A Guide to Methods and Applications(PCR方案:方法和应用指南)(Innis等编)学术出版社公司,加州圣地亚哥(1990)(“Innis”)。
制备和分离重组聚合酶
通常,可通过克隆、重组、体外合成、体外扩增和/或其它可用方法制备编码本发明聚合酶的核酸。可利用各种重组方法表达编码本发明聚合酶,如突变聚合酶的表达载体,如果不受理论的束缚,所述聚合酶能降低本发明核苷酸类似物的位阻和/或引入互补特征。制备核酸、表达和分离表达产物的重组方法参见例如,Sambrook、Ausubel和Innis。
此外、可购得多种用于由细胞纯化质粒或其它相关核酸的试剂盒(参见例如,EasyPrepTM、FlexiPrepTM,均来自法玛西亚生物技术公司(PharmaciaBiotech);StrataCleanTM,来自司查塔基公司(Stratagene);和来自凯杰公司(Qiagen)的QIAprepTM)。任何分离和/或纯化的核酸均可经进一步操作而产生其它核酸、用于转染细胞、掺入相关载体以感染生物体以表达和/或进行类似操作。克隆载体一般含有转录和翻译终止子、转录和翻译起始序列一级用于调节特定靶核酸表达的启动子。载体任选包含含有至少一个独立终止子序列的遗传表达盒,能够在真核细胞、原核细胞或二者中复制表达盒的序列(如穿梭载体)以及原核和真核系统中的选择性标记。所述载体适用于复制和整合到原核生物、真核生物或二者中。参见Giliman和Smith,Gene 8:81(1979);Roberts,等,Nature,328:731(1987);Schneider,B.,等,Protein Expr.Purif.6435:10(1995);Ausubel,Sambrook,Berger(同上)。例如,ATCC提供了用于克隆的细菌和噬菌体目录,例如ATCC每年公布的The ATCC Catalogue of Bacteria andBacteriophage(ATCC细菌和噬菌体的目录)。用于测序、克隆以及分子生物学其它方面和基础理论考虑的其它基本方法也参见Watson等(1992)RecombinantDNA(重组DNA)第二版,Scientific American Books(科学美国丛书),NY。
此外,可获得可将各种非天然氨基酸掺入重组蛋白的正交组分系统(如本发明聚合酶)。简要说,构建包含正交tRNA(“OtRNA”;无法被细胞的内源性翻译机器识别的tRNA,如琥珀或4-碱基tRNA)和正交tRNA合成酶(“ORS”;这是不会使细胞的任何内源性tRNA发生氨酰基化,但可因选择子密码子使OtRNA氨酰基化的合成酶)的细胞或其它翻译体系(如体外翻译体系)。构建编码该酶的核酸,以便在OtRNA特异性识别的所选位点上包含选择子密码子。ORS将具有所需化学官能团的非天然氨基酸特异性掺入一个或多个所选位点(如活性位点远端位点)上。与氨基酸中常见的官能团(例如,掺入的酮基或其它官能团)相比,这种化学官能团是独特的。有关正交系统的其它信息可参见例如Wang等,(2001),Science 292:498-500;Chin等,(2002)Journal ofthe American Chemical Society 124:9026-9027;Chin和Schultz,(2002),ChemBioChem 11:1135-1137;Chin,等,(2002),PNAS United States of America99:11020-11024;和Wang和Schultz,(2002),Chem.Comm.,1-10。也参见题为“METHODS ANDCOMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNAAMINOACYL-tRNA SYNTHETASE PAIRS”(产生正交tRNA氨基酰基-tRNA合成酶对的方法和组合物)的国际公开号WO 2002/086075,题为“IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS”(体内掺入非天然氨基酸)的WO 2002/085923,题为“EXPANDING EUKARYOTIC GENETICCODE”(扩展真核遗传密码)的WO 2004/094593;2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO 2005/007870;和2004年7月7日提交的WO 2005/007624。
其它有用参考文献,例如有关细胞分离和培养(如用于后续核酸分离)的参考文献包括Freshney(1994)Culture of Animal Cells,A Manual of Basic Technique(动物细胞培养,基本技术手册),第三版,维利出版公司(Wiley-Liss),纽约和其中引用的参考文献;Payne等(1992)Plant Cell and Tissue Culture in Liquid Systems(液体体系中的植物细胞和组织培养)约翰韦利森公司(John Wiley & Sons,Inc.),纽约州纽约;Gamborg和Phillips(编)(1995)Plant Cell,Tissue and Organ Culture;Fundamental Methods Springer Lab Manual(植物细胞、组织和器官培养:基本方法施普林格实验室手册),施普林格出版社(Springer-Verlag)(柏林海登堡纽约)以及Atlas和Parks(编)The Handbook of Microbiological Media(微生物培养基手册)(1993)CRC Press(CRC出版社),Boca Raton,FL(佛罗里达州伯克莱屯)。
此外,基本上所有核酸均可来自商业来源,如欧普龙技术公司(OperonTechnologies Inc.)(加州阿拉米达(Alameda,CA))的定制或标准订购产品。
已知各种蛋白质分离和检测方法,它们可用于分离表达本发明重组聚合酶的细胞的重组培养物中的聚合酶。本领域熟知各种蛋白质分离和检测方法,包括例如以下文献所述的方法:R.Scopes,Protein Purification(蛋白质纯化),Springer-Verlag(施普林格出版社),纽约(1982);Deutscher,Methods in Enzymology(酶学方法)第182卷:Guide to Protein Purification(蛋白质纯化指 南),学术出版社,纽约(1990);Sandana(1997)Bioseparation ofProteins(蛋白质 的生物分离),学术出版社;Bollag等(1996)Protein Methods(蛋白质方法),第2 维利出版社(Wiley-Liss),纽约;Walker(1996)The Protein Protocols Handbook(蛋白质方法手册)休曼出版社,NJ,Harris和Angal(1990)Protein Purification ApDlications:A Practical Approach(蛋白质纯化应用:实践方法)IRLPress(IRI出版社),英国牛津(Oxford,Oxford,England);Harris和Angal Protein Purification Methods:A Practical ApDroach(蛋白质纯化方法:实践方法)IRLPress(IRI出版社),英国牛津(Oxford,Oxford,England);Scopes(1993)Protein Purification:Principles and Practice3 rd Edition(蛋白质纯化:原理和实践第3 版)施普林格出版社(Springer Verlag),纽约;Janson和Ryden(1998)Protein Purification:Principles,High Resolution Methods and Applications(蛋白质纯化: 原理、高分辨率方法和应用),第二版 Wiley-VCH,NY;和Walker(1998)Protein Protocols on CD-ROM(CD-ROM上的蛋白质方法)休曼出版社,NJ;和其中引用的参考文献。有关蛋白质纯化和检测方法的其它详情可参见Satinder Ahuja编,Handbook of Bioseparations(生物分离手册),学术出版社(2000)。
试剂盒
本发明也提供了例如用于测序、核酸扩增等目的的包含本发明的聚合酶和例如一种或多种核苷酸类似物的试剂盒。这类试剂盒可装有以能够使用的方式包装的本发明的聚合酶、一组本发明的不同核苷酸类似物,如与A、T、G和C相似的类似物,例如,其中至少一种类似物携带可检测部分,在优选方面一种以上类似物,在许多情况下各类似物均携带不同的可检测标记基团,任选在其它类似物存在下进行鉴定。根据所需应用,本发明试剂盒任选包含其它试剂,如天然核苷酸、对照模板和其它试剂,如包含(如)二价金属离子即Mg++、Mn++和/或Fe++的缓冲液和/或盐溶液,标准溶液如用于校准检测器的染料标准品。这类试剂盒一般也装有按照所需的应用方法如核酸测序、扩增等使用该化合物和其它试剂的说明书。
核酸和多肽的序列和变体
如本文所述,本发明提供了编码(例如)本文所述聚合酶的多核苷酸序列。具有位阻或互补特征的聚合酶序列的例子参见本文的表3。然而,本领域技术人员应立即理解,本发明不仅限于这些序列。例如,本领域技术人员应理解,本发明还提供具有本文所述功能的许多相关序列,如编码表3聚合酶的保守变体的多核苷酸和多肽。
因此,本发明提供了各种多肽(聚合酶)和多核苷酸(编码聚合酶的核酸)。本发明多核苷酸的例子包括,例如,含有表3所列核苷酸序列的多核苷酸或者与其多核苷酸序列互补或编码其多核苷酸序列的多核苷酸(如,其中给定序列是DNA,RNA是编码(如通过逆转录编码)DNA的序列的一个例子)。本发明多核苷酸也任选包含编码表3所列聚合酶的多核苷酸。由于遗传密码的简并性,许多多核苷酸等同地编码给定的聚合酶序列。相似地,在高度严谨条件下在基本上整个核酸长度上与上述多核苷酸杂交的人工核酸或重组核酸(不同于天然产生的多核苷酸)是本发明多核苷酸。在一个实施方式中,组合物包含本发明多肽和赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本发明也提供了对本发明多肽具有特异性免疫反应性(例如,特异性识别改变的位阻或核苷酸类似物互补特征)的抗体或抗血清。
在某些实施方式中、载体(如质粒、粘粒、噬菌体、病毒等)包含本发明多核苷酸。在一个实施方式中,载体是表达载体。在另一实施方式中,表达载体包含操作性连接于一种或多种本发明多核苷酸的启动子。在另一实施方式中,细胞包含的载体中含有本发明多核苷酸。
本领域技术人员也应理解,本发明包括许多公开序列的变体。例如,本发明包括产生功能相似序列的公开序列的保守变体。本发明包括核酸的多核苷酸序列变体,其中该变体与至少一种公开序列杂交。本发明还包括用(例如)标准序列比较技术测定的本文所述序列的独特亚序列。
保守变异
由于遗传密码的简并性,“沉默取代”(即不导致编码多肽改变的核酸序列的取代)是每一种编码氨基酸序列的核酸序列的隐含特征。相似地,氨基酸序列中一个或有限数量的氨基酸被特性非常相似的不同氨基酸取代的“保守氨基酸取代”也易于鉴定为与所述构建物高度相似。各公开序列的保守变异是本发明特征。
具体核酸序列的“保守变异”指编码相同或基本相同的氨基酸序列的核酸,或者该核酸不编码氨基酸序列时,指基本相同的序列。本领域技术人员认识到,能够改变、加入或缺失编码序列中的一个氨基酸或一小部分氨基酸(一般少于5%,更一般少于4%、2%或1%)的单独取代、缺失或加入是“保守修饰的变异”,其中所述改变导致发生化学相似氨基酸的氨基酸缺失、氨基酸加入或氨基酸取代,而保持了相关的位阻降低或核苷酸类似物互补特征(例如,保守取代可以是活性位点区远端残基的保守取代)。因此,本发明所列多肽序列的“保守变异”包括小百分数的取代,一般少于5%,更一般少于2%或1%的多肽序列氨基酸被相同保守取代基的氨基酸所取代。最后,加入不改变核酸分子的编码活性,如加入无功能或标记序列(核酸中的内含子、编码多肽中的聚His或相似序列等)是基本核酸或多肽的保守变异。
在一个方面,保守取代包括对应于氨基酸残基375的聚合酶氨基酸残基上的一个或多个残基缺失或取代。
本领域熟知提供功能相似氨基酸的保守取代表,其中用一个氨基酸残基来取代具有相似化学特性(如芳基侧链或带正电侧链)的另一氨基酸残基,因此基本不改变该多肽分子的功能特性。下标列出了包含化学性质相似的天然氨基酸的类群的例子,其中基团内的取代是“保守取代”。
表A
保守氨基酸取代
 
非极性和/或脂族侧链    极性、不带电侧链 芳族侧链 带正电侧链 带负电侧链
甘氨酸丙氨酸缬氨酸亮氨酸异亮氨酸脯氨酸   丝氨酸苏氨酸半胱氨酸甲硫氨酸天冬酰胺谷氨酰胺 苯丙氨酸酪氨酸色氨酸 赖氨酸精氨酸组氨酸 天冬氨酸甘氨酸
核酸杂交
可利用比较杂交鉴定本发明核酸,包括本发明核酸的保守变异。此外,在高、超高和超超高严谨条件下与表3所列核酸杂交的靶核酸是本发明特征,其中核酸不同于天然产生的Φ29或N62D突变体。这类核酸的例子包括与表3给定的核酸序列相比含有一个或数个沉默或保守性核酸取代的这类核酸。
受试核酸与探针核酸特异性杂交是指,相对于完美匹配的互补靶,受试核酸与至少50%的探针杂交,即信噪比至少为完美匹配探针与完美匹配互补靶结合条件下探针与靶杂交信噪比的一半,完美匹配探针与完美匹配互补靶杂交时的信噪比至少为与任何不匹配靶核酸杂交的观察值的约5倍-10倍。
当核酸结合时发生“杂交”,这通常在溶液中发生。由于各种良好表征的物理化学力,如氢键结合、溶剂排除、碱基堆积等,发生核酸杂交。核酸杂交的广泛指南参见Tijssen(1993)Laboratory Techniques in Biochemistry andMolecular Biology--Hybridization with Nucleic Acid Probes(生化和分子生物学中的实验室技术—与核酸探针杂交)第I部分第2章,“Overview of principles ofhybridization and the strategy of nucleic acid probe assays”(杂交原理和核酸探针实验方案概览)(艾斯维尔(Elsevier),纽约),以及Current Protocols in Molecular Riology(新编分子生物学实验指南),Ausubel等编,Current Protocols(精编实验指南丛书),格林出版集团公司(Greene Publishing Associates,Inc.)和约翰维利出版公司(John Wiley & Sons,Inc.)的合资公司,(2004增刊)(“Ausubel”);Hames和Higgins(1995)Gene Probes 1(基因探针 1)牛津大学出版集团IRL出版社,牛津,英国,(Hames和Higgins1)和Hames和Higgins(1995)Gene Probes 2(基 因探针2)牛津大学出版集团IRL出版社,牛津,英国(Hames和Higgins 2)提供了有关合成、标记、检测和定量测定DNA和RNA,包括寡核苷酸的详情。
用Southern或northern印迹在滤纸上与含有100个以上互补残基的互补核酸杂交的严谨杂交条件的例子是含有1mg肝素的50%福尔马林,42℃过夜进行该杂交。严谨洗涤条件的例子是0.2xSSC65℃洗涤15分钟(参见Sambrook,同上,有关SSC缓冲液的描述)。高度严谨洗涤之前常常进行低严谨洗涤,以去除背景探针信号。低严谨洗涤的例子是2x SSC,40℃洗涤15分钟。通常,信噪比为具体杂交实验中与无关探针的信噪比的5倍(或更高)表明检测到特定的杂交。
核酸杂交实验如Southern和northern杂交中“严谨的杂交洗涤条件”是序列依赖性,在不同环境参数下不同。核酸杂交的广泛指南参见Tijssen(1993),同上和Hames和Higgins,1和2。不难凭经验确定任何受试核酸的严谨杂交和洗涤条件。例如,在测定严谨的杂交和洗涤条件的过程中,逐步提高杂交和洗涤条件(如提高温度、降低盐浓度、提高去污剂浓度和/或提高杂交或洗涤溶液中有机溶剂如福尔马林的浓度),直到满足所选的组合标准。例如,在高度严谨的杂交和洗涤条件下,逐步提高杂交和洗涤条件,直到探针结合于完美匹配的互补靶点,信噪比至少为该探针与不匹配靶点的观察值的5倍。
选择“非常严谨的”条件,使其等于特定探针的热解链点(Tm)。Tm是50%受试序列与完美匹配探针杂交的温度(在确定的离子强度和pH下)。出于本发明目的,通常,选择“高度严谨的”杂交和洗涤条件,使其比特定序列在确定离子强度和pH下的Tm低约5℃。
“超高严谨性”杂交和洗涤条件是提高杂交和洗涤条件的严谨性,直到该探针与完美匹配的互补靶核酸的结合信噪比至少为该探针与任何不匹配靶核酸的结合信噪比的10倍时的条件。在这种条件下与探针杂交的信噪比至少为完美匹配互补靶核酸与该探针杂交的信噪比的1/2的靶核酸被称为在超高严谨性条件下与该探针结合。
相似地,可通过逐步提高相关杂交实验的杂交和/或洗涤条件来测定更高的严谨性水平。例如,提高杂交和洗涤条件的严谨性,直到探针与完美匹配互补靶核酸的结合信噪比至少为该探针与不匹配靶核酸杂交的信噪比的10倍、20倍、50倍、100倍或500倍或更高。在这种条件下与探针杂交的信噪比至少为完美匹配互补靶核酸与探针杂交的信噪比的1/2的靶核酸被称为在超超高严谨性条件下与探针杂交。
如果编码多肽基本相同,在严谨条件下不互相杂交的核酸仍然基本相同。当利用遗传密码所允许的最大密码子简并性产生核酸拷贝时,会发生这种情况。
独特亚序列
在某些方面,本发明提供了包含编码表3所列聚合酶的核酸中独特亚序列的核酸。与对应于野生型Φ29或其N62D突变体的核酸相比,该独特亚序列可能是独特的。可利用(如)设置为默认参数的BLAST进行比对。任何独特亚序列均可用作鉴定本发明核酸的探针。
相似地,本发明包括包含表3所列聚合酶中独特亚序列的多肽。在本文中,与(例如)野生型Φ29或其N62D突变体相比,该独特亚序列是独特的。
本发明也提供了在严谨条件下与独特的编码寡核苷酸杂交的靶核酸,所述独特的编码寡核苷酸编码选自表3所列序列的多肽中的独特亚序列,其中与对应于野生型Φ29或N62D突变体的多肽相比,独特亚序列是独特的(例如,通过(如)突变产生本发明聚合酶的母体序列)。如上所述测定独特序列。
序列比较、相同性和同源性
提到两种或多种核酸或多肽序列时,术语“相同”或“相同性百分数”指通过下述序列比较算法之一(或本领域技术人员可以获得的其它算法)或通过观测测定,比较和比对最大对应性时,两种或多种序列或亚序列相同或其中特定百分数的氨基酸残基或核苷酸相同。
提到两种核酸或多肽(如编码聚合酶的DNA或聚合酶的氨基酸序列)时,术语“基本相同”指通过序列比较算法或通过观测测定,比较和比对最大对应性时,两种或多种序列或亚序列中至少约60%、约80%、约90-95%、约98%、约99%或更多核苷酸或氨基酸残基相同。这类“基本相同的”序列一般被认为是“同源”序列,而不去追究真实的祖系。优选地,在长度至少约50个残基的区域上,更优选在至少约100残基的区域上“基本相同”,最优选地,在至少约150个残基的区域上,或是在所比较两条序列的全部长度上序列基本相同。
以天然或人工方式由共同的祖系蛋白质或蛋白质序列衍生时,成蛋白质和/或蛋白质序列“同源”。相似地,以天然或人工方式由共同的祖系核酸或核酸序列衍生时,称核酸和/或核酸序列同源。通常由两种或多种核酸或蛋白质(或其序列)之间的序列相似性推知同源性。用于建立同源性的序列间相似性的准确百分数随着所研究的核酸和蛋白质而变化,但通常利用在50、100、150或更多个残基上少至25%序列相似性建立同源性。也可利用较高的序列相似性水平,如30%、40%、50%、60%、70%、80%、90%、95%或99%或更高来建立同源性。本文描述了测定序列相似性百分数的方法(如使用默认参数的BLASTP和BLASTN),通常可以获得这些方法。
在序列比较和同源性测定中,一般将一个序列用作参比序列,将受试序列与其作比较。使用序列比较算法时,将受试和参比序列输入计算机,如果需要则指定亚序列坐标(coordinate),指定序列算法程序参数。然后,序列比较算法会根据指定的程序参数计算受试序列相对参比序列的序列相同性百分数。
可通过以下方法进行最优序列比对以便比较,这些方法包括例如:Smith和Waterman,Adv.App1.Math.2:482(1981)的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法,Pearson和Lipman,Proc.Nat’1.Acad.Sci.USA 85:2444(1988)的相似性搜索法,计算机运行威斯康星遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA(遗传学计算组,575Science Dr.,威斯康星州麦迪逊),或者观测法(通常参见Current Protocols in Molecular Biology(新编分子生物学实验指南),Ausubel等编,Current Protocols(精编实验指南丛书),格林出版集团公司(Greene Publishing Associates,Inc.)和约翰维利出版公司(John Wiley & Sons,Inc.)的合资公司,2004增刊)。
适用于测定序列相同性和序列相似性百分数的一个算法例子是BLAST算法,参见Altschul等,J.Mol.Biol.215:403-410(1990)。进行BLAST分析的软件可通过公共渠道由国立生物技术信息中心获得。这种算法包括先通过鉴定查询序列中长度为W的短字来鉴定高评分序列对(HSP),所述短字与数据库序列中相同长度的字比对时匹配或满足一些正值阈值评分T。T称为相邻字评分阈值(Altschul等,同上)。这些初始相邻字命中用作启动搜索的种子,以搜索含有它们的较长HSP。然后,沿各序列在两个方向上延伸该字命中,直到可提高累积比对评分。对核苷酸序列而言,用参数M(一对匹配残基的奖励评分;总是>0)和N(错配残基的罚分;总是<0)计算累积评分。对氨基酸序列而言,用评分矩阵计算累积评分。在下列情况下,字命中在各方向上的延伸中止:累积比对评分由其最大实现值降低X;由于一个或多个负评分残基比对的累积作用,累积评分接近零或以下;或者达到序列的任意末端。BLAST算法参数W、T和X决定了比对的灵敏度和速度。BLASTN程序(核苷酸序列)使用的默认参数为:字长(W)为11、预计值(E)为10、截止值为100,M=5,N=-4,比较两条链。就氨基酸序列而言,BLASTP使用的默认参数为:字长(W)为3、预计值(E)为10,BLOSUM62评分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci. USA 89:10915)。
除计算序列相同性百分数外,BLAST算法也对两种序列的相似性进行统计学分析(参见例如,Karlin和Altschul,Proc.Nat’1.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的相似性的一种衡量是最小总和概率(P(N)),最小总和概率表明了两种核苷酸或氨基酸序列之间偶然发生匹配的概率。例如,如果在受试核酸与参比核酸的比较中最小总和概率小于约0.1,更优选小于约0.01,最优选小于约0.001,则认为该核酸与参比序列相似。
建模动力学的计算机实现方法
在另一方面,本发明包括用于建立酶动力学模型的计算机实现方法。在这些方法中,定义了基于模板的聚合反应过程中独立时间步骤的多种聚合酶状态转变。在最小独立时间步骤中,按照建模的酶动力学特性禁止许多聚合酶状态转变。根据给定的核酸模板序列、反应混合物中的核苷酸和聚合酶状态转变,定义了多种状态间的状态转变速率,并且为最小独立时间步骤定义了可能状态转变的多维概率矩阵。将得到的多维概率矩阵储存于计算机可读介质中。
该方法的各种特征可以变化。例如,聚合酶状态转变任选为用户可选择的。状态转变速率任选取决于核苷酸浓度、聚合酶浓度、模板浓度、模板序列、聚合酶在模板上的位置、当前沃森克里克模板-核苷酸对的特征、前一沃森克里克模板-核苷酸对的特征或掺入核苷酸的特征。反应混合物中的核苷酸任选包含一个或多个核苷酸类似物。状态转变速率任选包括上述多维依赖性的每种组合之间的完全正交。任选地,根据模板序列、概率状态的标准化矩阵和反应混合物中的核苷酸自动产生多维概率矩阵。任选地,通过假定所有可能的沃森克里克碱基配对在所有状态转变中等效来简化概率矩阵。任选地,通过假定某些状态转变(如聚合酶沿DNA易位)在概率矩阵的不同维(如以前掺入的核苷酸的某些特征)之间等同,可进一步简化该概率矩阵。
相似地,任选产生第二种试剂浓度矩阵,以根据概率矩阵的输出值计算由于聚合酶在模板上的位置导致的试剂浓度改变。任选矢量化多个模板的概率矩阵,得到的矢量化概率矩阵可乘以多维概率矩阵,得到状态分布矩阵。概率矩阵的指数时间因子可用于计算该模板序列内的重复序列。可利用连续模型或计数模型确定聚合酶核苷酸错配分数。
实施例
应理解,本文所述的实施例和实施方式仅为说明目的,本领域技术人员通过这些内容会得到各种修改或改变的启示。因此,提供以下实施例仅为说明,而不限制本发明的权利要求范围。
下文列出了构建和鉴定具有修饰的活性位点区和修饰的核苷酸类似物特性的各种重组DNA聚合酶的一系列实验。
实施例1:表达重组聚合酶
构建表达Φ29聚合酶的载体,示意图见图1。将N62D突变引入野生型Φ29(SEQ ID NO:1)以降低外切核酸酶活性,加入GST(谷胱甘肽-S-转移酶)、His和S标签。得到的标记的N62D Φ29氨基酸序列表示为SEQ ID NO:2。载体序列表示为SEQ ID NO:14。标记的N62D Φ29聚合酶由载体序列的核苷酸4839-7428编码,聚合酶位于核苷酸5700-7428处,N62D突变在核苷酸5883-5885处。该载体的其它特征包括GST-His-S标签序列(核苷酸4838-5699)、核糖体结合位点(核苷酸4822-4829)、T7启动子(核苷酸4746-4758)和卡那霉素抗性标记(核苷酸563-1375的互补物)。
如果需要,容易将其它突变引入这种构建物,例如,以促进具有修饰的活性位点区的重组Φ29聚合酶表达。参见例如,SEQ ID NO:15-23。可以在大肠杆菌中表达重组蛋白,用GST、His和/或S标签和标准技术纯化。任选通过合适蛋白酶(如凝血酶或肠激酶)消化去除标签。
实施例2:示范性重组聚合酶
构建了具有修饰的活性位点区的各种重组Φ29聚合酶。如果不受任何距离机制的束缚,以下实施例说明了可降低核苷酸类似物进入修饰的活性位点区的空间抑制、通过提供互补特征调整额外的磷酸基团(如带正电的氨基酸侧链)和/或提高聚合酶掺入核苷酸类似物的能力的结构修饰。
图2A代表在位置用大括号表示的残基505-525周围区域中对Φ29样聚合酶进行序列比对的结果。用下划线表示与Φ29不同的氨基酸残基。在cp-1 DNA聚合酶(它类似于G1,与Φ29差异更大)中,该结构域大部分丢失。此外,在该结构域中的保守序列显然少于侧接序列中的保守序列。这些观察结果表明,去除该结构域不可能有害。
图2B的上面三幅图说明了Φ29聚合酶的结构(参见例如,Kamtekar等(2004)“Insights into strand displacement and processivity from the crystal structureof the protein-primed DNA polymerase of bacteriophage Φ29”(噬菌体Φ29的蛋白质-引导DNA聚合酶的晶体结构的链置换和持续合成能力透视)Mol.Cell16(4):609-618)。下面三幅图显示了残基505-525缺失的聚合酶,说明去除这个结构域打开了核苷酸结合口袋。参见例如,SEQ ID NO:12和13或33和34,它们用不同方式去除了这一结构域。
图3A显示代表在Φ29的E375周围区域对Φ29样聚合酶进行序列比对的结果。图B的上面三幅图说明了Φ29聚合酶的结构。位置375(箭头表示)上的谷氨酸位于接触进入dNTP的三磷酸部分的带正电残基(K371、K379、K383;用中等灰色和深灰色突出物表示)附近。如图B的下面三幅图所示,这种带负电的氨基酸(E)被带正电的氨基酸(H)取代,以与四磷酸核苷酸类似物中的额外磷酸相一致。此外,此位点上额外的正电荷可帮助调整三磷酸类似物。重组聚合酶的分析表明,E375H突变能提高该酶掺入磷酸标记的核苷酸类似物的动力学性能(参见以下实施例3)。也构建突变的E375S,以将中性残基引入此位置和/或,例如,以促进构象改变实现功能。也参见SEQ ID NO:4-7和25-28。
图4A代表在Φ29的E486周围区域对Φ29样聚合酶进行序列比对的结果。图B的上面三幅图说明了Φ29聚合酶的结构;用箭头表示E486的位置。如下面三幅图所示,用丙氨酸残基取代E486在活性位点区中接近催化羧酸基团(D249和D458,用白色表示)的位置产生更大空间,并去除负电荷。另一个例子是,用天冬氨酸残基取代E486能去除碳,降低对核苷酸类似物结合的空间干扰,同时保持负电荷。也参见SEQ ID NO:9-10和30-31。
图5A显示在Φ29的K512周围区域中对Φ29样聚合酶进行序列比对的结果。图B的上面三幅图说明了Φ29聚合酶的结构。K512(用箭头表示)由残基505-525结构域伸出,部分封闭了进入dNTP结合位点的开口。如下面三幅图所示,用丙氨酸残基取代K512能降低对核苷酸类似物进入活性位点区的空间抑制,为它们提供更多空间以进入结合口袋。也参见SEQ ID NO:11和32。
图6A显示在Φ29的K135周围区域中对Φ29样聚合酶进行序列比对的结果。图B的上面三幅图说明了Φ29聚合酶的结构。K135(用箭头表示)伸入进入dNTP结合位点的开口中。如下面三幅图所示,用丙氨酸残基取代K135能降低对核苷酸类似物进入活性位点区的空间抑制,为它们提供更多空间以进入结合口袋。也参见SEQ ID NO:3和24。
实施例3:重组聚合酶的筛选和鉴定
任选鉴定如实施例2所述或通过基本上任何其它合理或随机诱变方案产生的重组聚合酶,以确定它们对各种天然和/或核苷酸的特性。下面介绍一种用于鉴定重组聚合酶的示范性五步方案。
最初,评估重组聚合酶的蛋白质制备质量和基本催化活性。用天然核苷酸分析该聚合酶的活性,测定其比活(单位/毫克)。只选择有催化能力的突变体进行下一步骤。
在“陷阱”(未标记的竞争DNA或肝素)存在下进行的引物延伸反应中评估聚合酶的持续合成能力(解离/kb)。设计此持续合成能力实验以选择在连续聚合反应中保持用天然核苷酸合成长DNA产物(无聚合再启动)的能力的突变体。不选择持续合成能力显著降低的突变体进行下一步骤。
测定利用10μM四种类似物(A488dA4P、A633dC4P、A546dG4P和A594dT4P)和环状模板(AGTC,,主要由重复的AGTC基序组成的72聚环状模板)的聚合速率(碱基/分支)。
用环状模板(AGTC)测定聚合速率以及对A488dC4P和A568dC4P和一小组天然核苷酸(dATP、dGTP和dTTP)的Km,以鉴定最有希望的聚合酶突变体。在几种不同浓度的类似物A488dC4P(代表性的良好底物)和A568dC4P(代表性的不太优选的底物)存在下测定速度。
利用核苷酸类似物的引物延伸试验初步选择对末端磷酸标记的核苷酸类似物的动力学特性提高的聚合酶突变体,以测定该实验条件下该突变体对类似物的速率。一般进行两个独立实验,一个在10μM A488dC4P、20μM 3dNTP-dCTP和环状模板(AGTC)存在下进行,另一个在10μM A568dC4P、20μM3dNTP-dCTP和环状模板(AGTC)存在下进行。
任选检测该重组聚合酶的其它特征,包括例如:忠实性,保留时间(1/Vmax),外切核酸酶活性(如10μM时,通过延伸错配引物),活性分数(爆发频率),对dNTP、dN5P、仅含接头的类似物和/或FRET类似物的速率,Mg2+与Mn2+存在下的动力学(利用类似物的能力),对光损伤的敏感性,单链DNA结合,单体状态(如利用凝胶过滤或天然凝胶)和/或保存期限。
示范性重组Φ29聚合酶的蛋白质质量评估以及聚合速率和动力学常数测定的结果分别见表1和表2。
表1.初步鉴定
 
描述 浓度;纯化聚合酶产率 比活(单位/毫克)
His-K135A-N62D 3.7μM;1mg 12,454,000
His-E375H-N62D 7.4μM;1mg 10,945,000
His-E375S-N62D 109μM;7mg 10,961,000
His-E486A-N62D 40μM;3.5mg 4,133,000
His-E486D-N62D 36μM;3.1mg 11,634,000
His-K512A-N62D 34μM;10mg 16,073,000
His-NipTuck_1-N62D 32μM;2.5mg 12,400,000
His-NipTuck_2-N62D 4.4μM;0.3mg 7,960,000
表2.鉴定对天然核苷酸和核苷酸类似物的聚合速率
 
A B C D E F G H I J
GST-N62D 780 1200 20 1660 74 346 236 65 0.9799
His-N62D 750 1020 21 391 237 68 0.9754
His-K135A-N62D 840 880 24 292 154 43 0.9801
His-E375H-N62D 780 950 8 930 11 411 366 123 0.9510
His-E375S-N62D 940 1190 15 1300 28 420 332 74 0.9815
His-E486A-N62D 1690 303 118 15 0.9875
His-E486D-N62D 220 134 15 0.9885
His-K512A-N62D 1590(630) 359 196 34 0.9821
His-NipTuck_1-N62D 660 520 24 153 116 24 0.9585
His-NipTuck_2-N62D 540(1840) 147 129 28 0.9520
A列:描述。
B列:dTTP、dATP、dGTP(无G叉)V为20μM;通过三种天然核苷酸(dGTP、dTTP和dATP)的实验测定。
C列:A488dC4P,kel(bp/分);通过检测聚合速率的核苷酸类似物浓度依赖性测定。
D列:A488dC4P,Km;通过检测聚合速率的核苷酸类似物浓度依赖性测定。
E列:A568dC4P,kel;通过检测聚合速率的核苷酸类似物浓度依赖性测定。
F列:A568dC4P,Km;通过检测聚合速率的核苷酸类似物浓度依赖性测定。
G列:A488dC4P,V为10μM;通过一种低浓度(10μM)的类似物和三种天然核苷酸的实验测定。
H列:A568dC4P,V为10μM;通过一种低浓度(10μM)的类似物和三种天然核苷酸的实验测定。
I列:A488dA4P、A633dC4P、A546dG4P、A594dT4P,V为10μM;通过四种末端标记的核苷酸类似物的实验测定。
J列:持续合成能力(kb-1);通过持续合成能力试验测定。
一种低浓度(10μM)的类似物和三种天然核苷酸的实验
将Φ29 DNA聚合酶(母体酶或突变体)与DNA模板(72个核苷酸的环状DNA,主要包含重复序列AGTC)和退火的DNA引物预孵育。预孵育混合物包含10μM浓度的三种天然核苷酸(dTTP、dATP和dGTP)和末端标记的核苷酸类似物(A488dC4P或A568dC4P)。短暂预孵育后,用MnCl2启动该反应。用EDTA终止该反应,用琼脂糖凝胶电泳分离产物,用SYBR金(英杰公司)染色。测定用DNA聚合酶产生的DNA的平均长度,用于评估聚合速率。参见例如,表2,G和H列。
四种末端标记的核苷酸类似物的实验
该方法基本如上文题为“一种低浓度(10μM)的类似物和三种天然核苷酸的实验”的章节所述,例外是本实验中,所有核苷酸均被末端标记(A488dA4P、A633dC4P、A546dG4P、A594dT4P均为10μM)。参见例如,表2I列。
三种天然核苷酸(dGTP、dTTP和dATP)的实验
将Φ29DNA聚合酶(母体酶或变体)与DNA模板(环状DNA,主要包含重复序列CAT,无G残基)和退火的DNA引物一起预孵育;预孵育混合物包含三种天然核苷酸(dTTP、dATP和dGTP)。所有后续步骤基本如上文题为“一种低浓度(10μM)的类似物和三种天然核苷酸的实验”的章节所述,参见例如,表2B列。
聚合速率的核苷酸类似物浓度依赖性
将Φ29 DNA聚合酶(母体酶或变体)与DNA模板(主要包含重复序列AGTC的72个核苷酸的环状DNA)和退火的DNA引物一起预孵育。预孵育混合物也包含三种天然核苷酸(dTTP、dATP和dGTP各20μM)和各种浓度的末端标记类似物(A488dC4P或A568dC4P)。所有后续步骤基本如上文题为“一种低浓度(10μM)的类似物和三种天然核苷酸的实验”的章节所述。测定每种类似物浓度下DNA聚合酶产生的DNA产物的平均长度,用等式k=kel*[S]*(Kd+[S])-1拟合结果,其中k是聚合速率观察值,kel是饱和底物浓度下的聚合速率(kel衡量多个残基的掺入),[S]是底物浓度。参见例如,表2的C、D、E和F列。
持续合成能力
将Φ29 DNA聚合酶(母体酶或变体)与DNA模板(主要包含重复序列AGTC的72个核苷酸的环状DNA)和退火的DNA引物一起预孵育。短暂预孵育后,用含有MnCl2、dNTP和肝素的启动混合物启动该反应。该反应中包含肝素能防止聚合酶与模板/引物解离后再次启动聚合,因此所有产生的DNA产物均为连续聚合反应的结果。孵育20分钟后,用EDTA终止该反应,用琼脂糖凝胶电泳分离该产物,用SYBR金(英杰公司)染色。对DNA产物的分析基本如Bibillo A,Eickbush TH.J Biol Chem.2002年9月20日;277(38):34836-45(于2002年7月5日电子公开)所述。用单一指数方程A*exp(-Poff*kb)拟合该结果,其中A是振幅,Poff是成熟前聚合酶解离的概率,kb是DNA长度(1000个核苷酸)。不难用1.0减去Poff值计算链延伸概率(持续合成能力)。参见例如,表2J列。
示范性重组聚合酶的序列
野生型Φ29和示范性重组聚合酶的氨基酸和多核苷酸序列见表3。
表3.序列.
 
SEQIDNO: 注释 序列
1 野生型Φ29氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hnlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
2 N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealligfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgkl  
 
vegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
3 K135A-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki aadfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
4 E375H-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt shgaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
5 E375S-N62D氨基酸序列(标记的) mspilgywki kglv qptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdf       
 
idkwtyiktt ssgaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
6 E375K-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssqqei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt skgaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
7 E375R-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt srgaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
8 L384R-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfpt   
 
lslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak rmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
9 E486A-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahastfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
10 E486D-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahdstfkrak ylrqktyiqd iymkevdgklvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
11 K512A-N62D氨基酸序列(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdl   
 
kfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd iymkevdgalvegspddytd ikfsvkcagm tdkikkevtf enfkvgfsrk mkpkpvqvpggvvlvddtft ik                                       
12 NipTuck_1-N62D氨基酸序列(缺失残基505-525)(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd ikdgefsvkcagmtdkikke vtfenfkvgf srkmkpkpvq vpggvvlvdd tftik     
13 NipTuck2-N62D氨基酸序列(缺失残基505-525)(标记的) mspilgywki kglvqptrll leyleekyee hlyerdegdk wrnkkfelglefpnlpyyid gdvkltqsma iiryiadkhn mlggcpkera eismlegavldirygvsria yskdfetlkv dflsklpeml kmfedrlchk tylngdhvthpdfmlydald vvlymdpmcl dafpklvcfk krieaipqid kylksskyiawplqgwqatf gggdhppksd gstsgsghhh hhhsaglvpr gstaigmketaaakferqhm dspdlgtggg sgddddkspm gyrgsefmkh mprkmyscdfetttkvedcr vwaygymnie dhseykigns ldefmawvlk vqadlyfhdlkfdgafiinw lerngfkwsa dglpntynti isrmgqwymi diclgykgkrkihtviydsl kklpfpvkki akdfkltvlk gdidyhkerp vgykitpeeyayikndiqii aealliqfkq gldrmtagsd slkgfkdiit tkkfkkvfptlslgldkevr yayrggftwl ndrfkekeig egmvfdvnsl ypaqmysrllpygepivfeg kyvwdedypl hiqhircefe lkegyiptiq ikrsrfykgneylkssggei adlwlsnvdl elmkehydly nveyisglkf kattglfkdfidkwtyiktt segaikqlak lmlnslygkf asnpdvtgkv pylkengalgfrlgeeetkd pvytpmgvfi tawaryttit aaqacydrii ycdtdsihltgteipdvikd ivdpkklgyw ahestfkrak ylrqktyiqd idgfsvkcagmtdkikkevt fenfkvgfsr kmkpkpvqvp ggvvlvddtf tik       
14 N62D核苷酸序列-pET41N62D 1质粒     tggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgtt
 
ctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgaattaattcttagaaaaactcatcgagcatcaaatgaaactgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttctgtaatgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggtctgcgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataaggttatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagtttatgcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcactcgcatcaaccaaaccgttattcattcgtgattgcgcctgagcgagacgaaatacgcgatcgctgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgccagcgcatcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttttcccggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttgatggtcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacatcattggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccatacaatcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccatataaatcagcatccatgttggaatttaatcgcggcctagagcaagacgtttcccgttgaatatggctcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagctgcggtaaagctcatcagcgtggtcgtgaagcgattcacagatgtctgcctgttcatccgcgtccagctcgttgagtttctccagaagcgttaatgtctggcttctgataaagcgggccatgttaagggcggttttttcctgtttggtcactgatgcctccgtgtaagggggatttctgttcatgggggtaatgataccgatgaaacgagagaggatgctcacgatacgggttactgatgatgaacatgcccggttactggaacgttgtgagggtaaacaactggcggtatggatgcggcgggaccagagaaaaatcactcagggtcaatgccagcgcttcgttaatacagatgtaggtgttccacagggtagccagcagcatcctgcgatgcagatccggaacataatggtgcagggcgctgacttccgcgtttccagacttta
 
cgaaacacggaaaccgaagaccattcatgttgttgctcaggtcgcagacgttttgcagcagcagtcgcttcacgttcgctcgcgtatcggtgattcattctgctaaccagtaaggcaaccccgccagcctagccgggtcctcaacgacaggagcacgatcatgctagtcatgccccgcgcccaccggaaggagctgactgggttgaaggctctcaagggcatcggtcgagatcccggtgcctaatgagtgagctaacttacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgccagggtggtttttcttttcaccagtgagacgggcaacagctgattgcccttcaccgcctggccctgagagagttgcagcaagcggtccacgctggtttgccccagcaggcgaaaatcctgtttgatggtggttaacggcgggatataacatgagctgtcttcggtatcgtcgtatcccactaccgagatgtccgcaccaacgcgcagcccggactcggtaatggcgcgcattgcgcccagcgccatctgatcgttggcaaccagcatcgcagtgggaacgatgccctcattcagcatttgcatggtttgttgaaaaccggacatggcactccagtcgccttcccgttccgctatcggctgaatttgattgcgagtgagatatttatgccagccagccagacgcagacgcgccgagacagaacttaatgggcccgctaacagcgcgatttgctggtgacccaatgcgaccagatgctccacgcccagtcgcgtaccgtcttcatgggagaaaataatactgttgatgggtgtctggtcagagacatcaagaaataacgccggaacattagtgcaggcagcttccacagcaatggcatcctggtcatccagcggatagttaatgatcagcccactgacgcgttgcgcgagaagattgtgcaccgccgctttacaggcttcgacgccgcttcgttctaccatcgacaccaccacgctggcacccagttgatcggcgcgagatttaatcgccgcgacaatttgcgacggcgcgtgcagggccagactggaggtggcaacgccaatcagcaacgactgtttgcccgccagttgttgtgccacgcggttgggaatgtaattcagctccgccatcgccgcttccactttttcccgcgttttcgcagaaacgtggctggcctggttcaccacgcgggaaacggtctgataagagacaccggcatactctgcgacatcgtataacgttactggtttcacattcaccaccctgaattgactctcttccgggcgctatcatgccataccgcgaaaggttttgcgccattcgatggtgtccgggatctcgacgctctcccttatgcgactcctgcattaggaagcagcccagtagtaggttgaggccgttgagcaccgccgccgcaaggaatggtgcatgcaaggagatggcgcccaacagtcccccggccacggggcctgccaccatacccacgccgaaacaagcgctcatgagcccgaagtggcgagcccgatcttccccatcggtgatgtcggcgatataggcgccagcaaccgcacctgtggcgccggtgatgccggccacgatgcgtccggcgtagaggatcgagatcgatctcgatcccgcgaaattaatacgactcactataggggaattgtgagcggataacaattcccctctagaaataattttgtttaactttaagaaggagatatacatatgtcccctatactaggttattggaaaattaagggccttgtgcaacccactcgacttcttttggaatatcttgaagaaaaatatgaagagcatttgtatgagcgcgatgaaggtgataaatggcgaaacaaaaagtttgaattgggtttggagtttcccaatcttccttattatattgatggtgatgttaaattaacacagtctatggccatcatacgttatatagctgacaagcacaacatgttgggtggttgtccaaaagagcgtgcagagatttcaatgcttgaaggagcggttttggatattagatacggtgtttcgagaattgcatatagtaaagactttgaaactctcaaagttgattttcttagcaagctacctgaaatgctgaaaatgttcgaagatcgtttatgtcataaaacatatttaaatggtgatcatgtaacccatcctgacttcatgttgtatgacgctcttgatgttgttttatacatggacccaatgtgcctggatgcgttcccaaaattagtttgttttaaaaaacgtattgaagctatcccacaaattgataagtacttgaaatccagcaagtatatagcatggcctttgcagggctggcaagccacgtttggtggtggcgaccatcctccaaaatcggatggttcaactagtggttctggtcatcaccatcaccatcactccgcgggtctggtgccacgcggtagtactgcaattggtatgaaagaaaccgctgctgctaaattcgaacgccagcacatggacagcccagatctgggtaccggtggtggctccggtgatgacgacgacaagagtcccatgggatatcggggatccgaattca
 
tgaagcatatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatatggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataagaattctgtacaggccttggcgcgcctgcaggcgagctccgtcgacaagcttgcggccgcactcgagcaccaccaccaccaccaccaccactaattgattaatacctaggctgctaaacaaagcccgaaaggaagctgagttggctgctgccaccgctgagcaataactagcataaccccttggggcctctaaacgggtcttgaggggttttttgctgaaaggaggaactatatccggat                                 
15 K135A-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctgccgactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaa
 
acaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
16 E375H-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcacacggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
17 E375S-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcaagcggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
18 L384R-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaa
 
atgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaacggatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
19 E486A-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgccagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
20 E486D-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaaqaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgacagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtaagttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
21 K512A-N62D核苷 atgaagcacatgccgagaaagatgtatagttgtgatgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtt   
 
酸序列 tatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatctatatgaaagaagtagatggtgccttagtagaaggtagtccagatgattacactgatataaaatttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa                      
22 NipTuck1-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatcaaggatggagagtttagtgttaaatgtgcgggaatgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa   
23 NipTuck2-N62D核苷酸序列 atgaagcacatgccgagaaagatgtatagttgtgactttgagacaactactaaagtggaagactgtagggtatgggcgtatggttatatgaatatagaagatcacagtgagtacaaaataggtaatagcctggatgagtttatggcgtgggtgttgaaggtacaagctgatctatatttccatgatctcaaatttgacggagcttttatcattaactggttggaacgtaatggttttaagtggtcggctgacggattgccaaacacatataatacgatcatatctcgcatgggacaatggtacatgattgatatatgtttaggctacaaagggaaacgtaagatacatacagtgatatatgacagcttaaagaaactaccgtttcctgttaagaagatagctaaagactttaaactaactgttcttaaaggtgatattgattaccacaaagaaagaccagtcggctataagataacacccgaagaatacgcctatattaaaaacgatattcagattattgcggaagctctgttaattcagtttaagcaaggtttagaccggatgacagcaggcagtgacagtctaaaaggtttcaaggatattataaccactaagaaattcaaaaaggtgtttcctacattgagtcttggactcgataaggaagtgagatacgcctatagaggtggttttacatggttaaatgataggttcaaagaaaaagaaatcggagaaggcatggtcttcgatgttaatagtctatatcctgcacagatgtatagtcgtctccttccatacggtgaacctatagtattcgagggtaaatacgtttgggacgaagattacccactacacatacagcatatcagatgtgagttcgaattgaaagagggctatatacccactatacagataaaaagaagtaggttttataaaggtaatgagtacctaaaaagtagcggcggggagatagccgacctctggttgtcaaatgtagacctagaattaatgaaagaacactacgatttatataacgttgaatatatcagcggcttaaaatttaaagcaactacaggtttgtttaaagattttatagataaatggacgtacatcaagacgacatcagaaggagcgatcaagcaactagcaaaactgatgttaaacagtctatacggtaaattcgctagtaaccctgatgttacagggaaagtcccttatttaaaagagaatggggcgctaggtttcagacttggagaagaggaaacaaaagaccctgtttatacacctatgggcgttttcatcactgcatgggctagatacacgacaattacagcggcacaggcttgttatgatcggataatatactgtgatactgacagcatacatttaacgggtacagagatacctgatgtaataaaagatatagttgaccctaagaaattgggatactgggcacatgaaagtacattcaaaagagctaaatatctgagacagaagacctatatacaagacatcgacggctttagtgttaaatgtgcgggaa
 
tgactgacaagattaagaaagaggttacgtttgagaatttcaaagtcggattcagtcggaaaatgaagcctaagcctgtgcaagtgccgggcggggtggttctggttgatgacacattcacaatcaaataa         
24 K135A-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiaadfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
25 E375H-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttshgaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
26 E375S-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk qkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttssgaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
27 E375K-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttskgaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
 
28 E375R-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsrgaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
29 L384R-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq lakrmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
30 E486A-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahastfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
31 E486D-N62D氨基酸序列 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahdstfk rakylrqktyiqdiymkevd gklvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
32 K512A-N62D氨基 mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqw    
 
酸序列 ymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdiymkevd galvegspdd ytdikfsvkc agmtdkikke vtfenfkvgfsrkmkpkpvq vpggvvlvdd tftik                         
33 NipTuck_1-N62D氨基酸序列(缺失残基505-525) mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdikdgefs vkcagmtdki kkevtfenfk vgfsrkmkpk pvqvpggvvlvddtftik                                         
34 NipTuck_2-N62D氨基酸序列(缺失残基505-525) mkhmprkmys cdfetttkve dcrvwaygym niedhseyki gnsldefmawvlkvqadlyf hdlkfdgafi inwlerngfk wsadglpnty ntiisrmgqwymidiclgyk gkrkihtviy dslkklpfpv kkiakdfklt vlkgdidyhkerpvgykitp eeyayikndi qiiaealliq fkqgldrmta gsdslkgfkdiittkkfkkv fptlslgldk evryayrggf twlndrfkek eigegmvfdvnslypaqmys rllpygepiv fegkyvwded yplhiqhirc efelkegyiptiqikrsrfy kgneylkssg geiadlwlsn vdlelmkehy dlynveyisglkfkattglf kdfidkwtyi kttsegaikq laklmlnsly gkfasnpdvtgkvpylkeng algfrlgeee tkdpvytpmg vfitawaryt titaaqacydriiycdtdsi hltgteipdv ikdivdpkkl gywahestfk rakylrqktyiqdidgfsvk cagmtdkikk evtfenfkvg fsrkmkpkpv qvpggvvlvddtftik                                           
用核苷酸类似物鉴定重组聚合酶
测定示范性重组Φ29聚合酶和各种核苷酸类似物的Km和Vmax。结果见表4。
表4.对类似物的Km和Vmax
Figure A200680052606D00681
1Alexa633-O-dC4P(在本文中也称为A633dC4P)的测定值
2Alexa555-C2-dT4P的测定值。此类似物在δ磷酸和标记部分之间含有2-碳接头(“C2”),具有以下结构:
Figure A200680052606D00691
3Alexa555-C2-dTTP的测定值
4Alexa532-O-dG4P的测定值
用各种核苷酸和/或核苷酸类似物鉴定一组示范性重组Φ29聚合酶。结果见表5。
表5.筛选数据
Figure A200680052606D00692
1比例=1mM MnCl2时(5μM A633dC4P与20μM dA,dG,dTTP时的速率)/(25μMA633dC4P与20μM dA,dG,dTTP时的速率)。较高比例对应于较低Km
225μM A633dC4P与20μM dA,dG,dTTP时的速率
310μM Alexa488-O-dA4P、10μM FAM-Alexa532-O-dG4P、10μM FAM-Alexa594-O-dT4P、10μM Alexa633-O-dC4P与1mM MnCl2时的速率。能够衡量对四种核苷酸类似物的代表组的Km和Vmax
4背景突变(如果有)。重组聚合酶对应于野生型Φ29聚合酶加突变1加突变2。
5固定和/或纯化的标签
用FRET终止流动实验测定示范性重组Φ29聚合酶对核苷酸类似物A594-dT4P的结合和产物释放速率,如图7A所示。结果见图7,其中Φ29 N62D见图B,N62D:E375Y见图C,N62D:E375W见图D。产物释放速率见表6。
E375Y和E375W突变聚合酶的结合和产物释放速率提高,表明它们对类似物的利用优于母体酶。
表6.产物释放速率
 
产物释放速率
N62D 55s-1
N62D:E375Y 117s-1
N62D:E375W 76s-1
也用图8A所示的FRET终止流动实验测定了示范性重组Φ29聚合酶对核苷酸类似物Alexa568-dA4P(也称为A568-dA4P)的相对分支速率(不包括类似物的解离,即底物解离)。在这种技术中,采用含有与FRET相容的FRET供体染料的模板,核苷酸类似物上含有对应染料。引物的3’末端是双脱氧末端,以防止掺入。将该类似物与酶-模板-双脱氧引物复合物预混。在所述终止流动设备中,将这种复合物与过量的相应天然核苷酸(在本实施例中是天然dATP)快速混合,这种天然核苷酸用作“陷阱”以防止类似物解离后再次结合。检测供体染料荧光增加,以便监测类似物的解离/分支速率。
结果见图8,其中Φ29N62D见图B、N62D:E375Y见图C、N62D:E375W见图D。分支速率见表7。
表7.分支速率.
 
分支速率
N62D 90s-1
N62D:E375Y 31s-1
N62D:E375W 43s-1
其它示范性重组聚合酶
本发明聚合酶可包括Φ29聚合酶(或其同源物),包括单独的或是与其它突变(如本文所述其它突变)组合的表8所列的任何突变。例如,本发明聚合酶任选包括Φ29聚合酶(或其同源物),其含有表8所列的突变组合。
表8.示范性突变。
D12A E375W T372D
D12A E375W T372E
D12A E375W T372R K478D
D12A E375W T372R K478E
D12A E375W T372K K478D
D12A E375W T372K D478E
D12A E375W K135D
D12A E375W K135E
D12A E375W K512D
D12A E375W K512E
D12A E375W E408K
D12A E375W E408R
D12A E375W T368D L480K
D12A E375W T368E L480K
D12A D456N
N62D D456N
D12A D456A
N62D D456A
D12A D456S
N62D D456S
N62D E375M
N62D E375L
N62D E375I
N62D E375F
N62D E375D
D12A K512W
N62D K512W
D12A K512Y
N62D K512Y
D12A K512F
N62D K512F
D12A E375W K512L
N62D E375W K512L
D12A E375W K512Y
N62D E375W K512Y
D12A E375W K512F
N62D E375W K512F
D12A E375Y K512L
N62D E375Y K512L
D12A E375Y K512Y
N62D E375Y K512Y
D12A E375Y K512F
N62D E375Y K512F
D12A E375W K512H
N62D E375W K512H
D12A E375Y K512H
N62D E375Y K512H
D12A D510F
N62D D510F
D12A D510Y
N62D D510Y
D12A D510W
N62D D510W
D12A E375W D510F
N62D E375W D510F
D12A E375W D510Y
N62D E375W D510Y
D12A E375W D510W
N62D E375W D510W
D12A E375W D510W K512L
N62D E375W D510W K512L
D12A E375W D510W K512F
N62D E375W D510W K512F
D12A E375W D510H
N62D E375W D510H
D12A E375W D510H K512H
N62D E375W D510H K512H
D12A E375W D510H K512F
N62D E375W D510H K512F
D12A V509Y
N62D V509Y
D12A V509W
N62D V509W
D12A V509F
N62D V509F
D12A V514Y
N62D V514Y
D12A V514W
N62D V514W
D12A V514F
N62DV514F
D12S
D12N
D12Q
D12K
D12A
N62D Y254F
N62D Y254V
N62D Y254A
N62D Y390F
N62D Y390A
N62D S252A
N62D N387A
N62D K157E
N62D I242H
N62D Y259S
N62D G320C
N62D L328V
N62D T368M
N62D T368G
N62D Y369R
N62D Y369H
N62D Y369E
N62D I370V
N62D I370K
N62D K371Q
N62D T372N
N62D T372D
N62D T372R
N62D T372L
N62D T373A
N62D T373H
N62D  S374E
N62D I378K
N62D K379E
N62D K379T
N62D N387D
N62D Y405V
N62D L408D
N62D G413D
N62D D423V
N62D I442V
N62D Y449F
N62D D456V
N62D L480M
N62D V509K
N62D V509I
N62D D510A
N62D V514I
N62D V514K
N62D E515K
N62D D523T
N62D H149Y E375W M554S
M8S N62D M102S H116Y M188S E375W
N62D M97S E375W
M8S N62D M97S M102S M188S E375W M554S
M8A N62D M97A M102A M188A E375W M554A
曾经描述过Φ29聚合酶中的几处突变。N62D突变参见de Vega等(1996)“Primer-terminus stabilization at the3′-5′exonuclease active site of phi29 DNApolymerase.Involvement of two amino acid residues highly conserved inproofreading DNA polymerases”(
Figure A200680052606D0074134847QIETU
29 DNA聚合酶的3′-5′外切核酸酶活性位点上的引物末端稳定化.包括校正DNA聚合酶中高度保守的两个氨基酸残基)EMBO J.15(5):1182-92。D12A突变和位置E14、66、165、169、12和66以及14和66的突变参见Esteban等(1994)“3′-->5′exonuclease active site of phi 29DNA polymerase.Evidence favoring a metal ion-assisted reaction mechanism”(φ29DNA聚合酶的3′-->5′外切酶活性位点,有利于金属离子辅助反应机制的证据)JBiol Chem.269(50):31946-54。S252突变参见Blasco等(1993)“Phi 29 DNAexonuclease active site.Residue ASP249 of conserved amino acid motif‘Dx2SLYP’is critical for synthetic activities”(Φ29 DNA外切酶活性位点,保守氨基酸基序‘Dx2SLYP’的残基ASP249对合成活性至关重要)J Biol Chem.268(32):24106-13。Y254突变参见Blasco等(1992)“Phi 29 DNA polymeraseactive site.Mutants in conserved residues Tyr254and Tyr390 are affected in dNTPbinding”(φ29DNA聚合酶活性位点,保守残基Tyr254和Tyr390中的突变影响dNTP结合)J Biol Chem.267(27):19427-34。K371突变参见Truniger等(2002)“Positively charged residue of phi29 DNA polymerase,highly conserved in DNApolymerases from families A and B,is involved in binding the incomingnucleotide”(DNA聚合酶家族A和B中高度保守的φ29 DNA聚合酶的带正电残基参与结合进入的核苷酸)Nucleic Acids Res.30(7):1483-92。K379突变参见Truniger等(2004)“Two Positively Charged residues of 
Figure A200680052606D0074135033QIETU
29 DNA polymerase,Conserved in protein-primed DNA polymerases,are Involved in Stabilisation ofthe Incoming nucleotide”(在蛋白质引导的DNA聚合酶中保守的
Figure A200680052606D0074135033QIETU
29 DNA聚合酶的两个带正电残基参与了进入核苷酸的稳定化)Journal of Molecular Biology335(2):481-494。N387突变参见Blasco等(1993)“Phi29DNA polymerase activesite.The conserved amino acid motif‘Kx3NSxYG’is involved in template-primerbinding and dNTP selection”(Φ29 DNA聚合酶活性位点,保守的氨基酸基序‘Kx3NSxYG’参与了模板-引物结合和dNTP选择)J Biol Chem.268(22):16763-70。Y390突变参见Blasco等(1992)“Phi 29 DNA polymeraseactive site.Mutants inconserved residues Tyr254 and Tyr390 are affected indNTPbinding”(Φ29D NA聚合酶活性位点.保守残基Tyr254和Tyr390中的突变影响dNTP结合)J Biol Chem.267(27):19427-34。D456突变参见Bernad等(1990)“The highly conserved amino acid sequence motif Tyr-Gly-Asp-Thr-Asp-Ser inalpha-like DNA polymerases is required by phage phi29 DNA polymerase forprotein-primed initiation and polymerization”(蛋白质引导的启动和聚合所用的噬菌体φ29DNA聚合酶需要α样DNA聚合酶中高度保守的氨基酸序列基序Tyr-Gly-Asp-Thr-Asp-Ser)Proc Natl Acad Sci USA.87(12):4610-4。
实施例4:对DNA聚合酶的酶动力学进行建模和检测的计算框架,同时寻址所有动力学过程和自由变量。
聚合酶动力学状态转变储存于独立时间步骤的概率矩阵中。概率状态分布的向量可描述按照连续模型在许多聚合酶状态中找到特定聚合酶的概率。对状态分布向量和状态转变概率矩阵作线性代数乘法,得到聚合酶状态分布的新向量,描述了等于状态转变概率矩阵的独立时间步骤的时间通道的影响。
通过将状态转变概率矩阵提高到特定的指数幂(如100),我们模拟了特定数量的独立时间步骤(如100个时间步骤)的时间通道。我们用许多独立时间步骤模拟DNA聚合稳态模型。
转变速率是用户定义的。利用模板序列和硬编码的状态转变规则自动产生概率矩阵。各种参数,如试剂浓度、动力学速率值和概率矩阵组织可能与本实施例所描述的不同。
下面是稳态聚合酶动力学模型的例子。
Figure A200680052606D00761
Rp=C6K61-C1K16=C1K12-C2K21
         =C2K23-C3K32
         =C3K34-C4K43
         =C4K45
         =C5K56-C6K65
Rp=催化速率
C6=找到状态6的聚合酶的概率
K61=状态6的聚合酶转变为状态1的聚合酶的转变速率
kij=反应速率
Pij=kijΔt反应速率
Pij=i→j概率
*K54≈0作为焦磷酸的浓度
Rp=C6K61-C1K16=催化速率
Rp=(Rp)max@K61→∞,C6→0,作为提高至饱和的核苷酸浓度的条件以找到(Rp)max
Figure A200680052606D00771
Figure A200680052606D0077171322QIETU
*随着Δt↓,发现Rp的渐近线
大矩阵(Mega Matrix)
下面是用于捕获聚合酶-模板-dNTP系统的所有可能动力学状态的一个2-D矩阵:
Figure A200680052606D00773
Figure A200680052606D00774
*此结果是656-状态矩阵,其中状态如下:
 
1.      1      A   A   0   A  
2.      1      A   A   0   C  
3.      1      A   A   0   G  
4.      1      A   A   0   T  
5.      1      A   A   1   A  
6.      1      A   A   1   C  
7.      1      A   A   1   G  
8.      1      A   A   1   T  
9.      1      A   C   0   A  
                                   
                                   
                                   
                                   
652.   7*     T   G   X   T  
653.   7*     T   T   X   A  
654.   7*     T   T   X   C  
655.   7*     T   T   X   G  
656.   7*     T   T   X   T  
*在这种情况下,状态7是聚合酶与模板解离,可任选简化成从未发生。
在这种情况下,DNA模板是重复序列(ACGT)。对较长模板重复序列而言,状态成比例增加,直至较长模板重复序列不含原始模板序列。例如,以下序列产生的概率转变矩阵
...[ACGT]ACGT...
等于下述序列产生的矩阵
...[ACGTACGT]ACGT...。
然而,以下序列产生的概率转变矩阵
...[AACCGGTT]AACC...
可能不同,因为它含有原始矩阵中不允许的许多状态转变(如聚合酶由模板序列中的一个“A”转变至另一个“A”。而且,由于这种重复序列含有八个沃森克里克碱基,而非四个,可能产生1,312个状态,而非656个状态的矩阵。
一些状态不需要定义所有变量(见上表)。例如,尚未掺入状态6的核苷酸特征不会影响状态6的身份。
 
577. 6 A   X   X   A  
*两种状态的转变速率定义为:
 
562. 5 T   A   X   C  
P56TAxC=k56TAxC     *时间步骤
P56TaxC是聚合酶完成从状态5到状态6的转变的概率,其它核苷酸-模板条件被描述为“TAxC”。K56TaxC是这种转变的转变速率。
目前,在此种656个状态系统中,定义了1568种转变速率。可作出许多近似值,以减少使用者输入的数量。
在所有状态转变中,可等同地处理以下组合:
模板核苷酸:ACGT
            TGCA
同样,可以用相同方式处理所有错配
K12AT0A=k12xZ0Z
K12CG0T=k12xZ0Z
K12CT0T=k12xY0Z
K12CT1C=k12xY1Y
X=任何变量
Y=任何错配
Z=任何匹配
以此方式,将使用者输入选择降低至~100个独特转变速率变量。所有明确定义的速率由合适的用户输入自动指定。
建立大矩阵
Figure A200680052606D00791
为了通过将用户定义转变速率自动插入矩阵而进行对称利用,可改变656状态矩阵的组织:
Figure A200680052606D00792
这有两个优点:
(1.)对矩阵稍作修改便可延伸该模板。重复序列中的每个模板碱基带来额外的164个状态。以前,必须将新状态交织到矩阵中。
Figure A200680052606D00801
(2)该矩阵比以前的对称性更高,用自动化编码更容易构建该矩阵:
for ii=1:164
eval([‘...’]);
...
end%ii
七个“eval”语句(评估人工构建命令的函数)构建出七种聚合酶状态。
可进一步增强它,以便自动建立任何给定模板序列的矩阵。
产生状态转变概率矩阵的进一步自动化是通过建立浓度矩阵完成的,该浓度矩阵含有所有相关试剂(聚合酶、模板、核苷酸等)的浓度。这种浓度矩阵产生速率转变矩阵,以使(在线性浓度限度内)。
动力学矩阵=转变速率矩阵*浓度矩阵
状态转变概率矩阵=动力学矩阵*时间步骤
其中速率转变矩阵的各元素乘以其在浓度矩阵中相应的因变量。以此方式,我们捕获到浓度依赖性状态转变(如掺入核苷酸的速率取决于核苷酸浓度)。并非浓度依赖性的矩阵元素未改变。可以用定义动力学矩阵的非线性方程解决非线性浓度依赖性。
下面描述状态转变概率矩阵:
Figure A200680052606D00811
矩阵=零(656,656);
矩阵(1,[1,139,577])=[1-p12AA0A-p16AA0A,p12AA0A,p16AA0A];
矩阵(2,[2,130,578])=[1-p12AA0C-p16AA0C,p12AA0C,p16AA0C];
....
矩阵(129,[129,257,1])=[1-p23AA0A-p21AA0A,p23AA0A,p21AA0A];
....
矩阵(656,[656,580,576])=[1-p76TTxT-p75TTxT,p76TTxT,p75TTxT];
其中用用户定义的转变速率、浓度值和独立时间步骤计算插入矩阵中的各概率值。需要注意,一行中的第一个元素是不发生状态转变的概率,因此是100%与该特定状态的所有状态转变的概率之差。
提高模拟效率:
通过将状态转变概率矩阵提高到特定的指数幂(如100),我们模拟了特定数量的独立时间步骤(如100个时间步骤)的时间通道。
可通过同时使许多聚合酶-模板复合物矢量化进一步提高模拟效率。
Figure A200680052606D00812
速度限制:可通过观察pol在模板上的位置追踪DNA合成。
Figure A200680052606D00821
[1000]=“A”
[0100]=“C”
等等...
如果我们移动太快(即在指数转变矩阵中时间步骤太多),该聚合酶可能由“A”直接转变为“G”,使得难以明确这是正向还是反向转变。因此,设定误差限度(~1e-6),以定义该动力学矩阵的指数时间因子。设定速度限制,使得由“A”至“G”逆向转变的概率和由“A”至“T”的正向转变速率均不超过该误差速率限制。较长DNA重复序列使我们移动得更快,但太长的重复序列的计算强度较高。
该程序的其它应用可以是模拟试剂消耗速率。以非常大的步长移动时,沿模板模拟聚合酶移动。此方法只使用连续分布状态的一种模板(而非独立状态的1000+种模板)。这能追踪试剂随时间的消耗。
根据当前系统群体和转变速率常数确定试剂浓度改变:
d(dTAPo)每个pol=C1Δtk16AA0A+C2Δtk16AA0C+...C520Δtk16TT0T
-C145Δtk61AA0A-C146Δtk61AA0C-...=C1p61AA0A+C146p61AA0C+...
C145p61AA0A-C146p61AA0C-...
这些概率为动力学矩阵的1e-6秒时间步骤的概率:
1个循环中试剂dTAP(天然)的浓度改变(摩尔),实耗时间=步骤数*1e-6秒
[快速矩阵]=[动力学矩阵)^步骤数
速度限制: &Delta;C max C < 1 % ?
快速矩阵=动力学矩阵n
随着N变大,各循环中对浓度的调整变得大而不精确。用此设定动力学矩阵的指数时间因子。
见图9,它对动力学矩阵跳跃大小对浓度降低作图。
即使使步骤数=1e6,也可能得到“足够”准确的浓度曲线(参见随着步长减小的平滑性方法)。
得到的(4096 x 4096)双矩阵是合理的存储容量极限。
此程序的群体应用可以是用连续模型或计数模型估计聚合酶错配分数。目前,我们认为第2个前述模板-核苷酸对总是匹配。(这是为了使矩阵的大小减小4倍...误差应该很小,除非有大量外切核酸酶活性)。
因此,由含有以前错配的状态5发生的任何正向转变变成永久性错配(如果我们备份则不会发生这种情况)。
正向总转变速率=C5.*C6.-C6.*k65
反应=(错配速率)/(总速率)
C5代表所有矩阵状态的浓度,pol为状态5(参见第128页)
k56是正向转变的所有对应速率的完整组
正向错配转变=C5 (m).*k56 (m)-C6 (m).*k65 (m)
(在逆向转变中,我们从未终止于含有以前错配的pol状态5,见上)。
我们也可准备计数模型,对含有以前模板/核苷酸错配的聚合酶/模板复合物数量计数,也进行正向转变(产生永久性错配)和对所有聚合酶的错配求平均值,得到错配分数。这应该与上述连续模型估计值相同。
1)首先设定所有速率常数,使其等于T7聚合酶,如Patel等(1991)“Pre-Steady-State Kinetic Analysis of Processive DNA Replication Including CompleteCharacterization of an Exonuclease-Deficient Mutant”(进行性DNA复制的预稳态动力学分析,包括外切核酸酶缺陷型突变体的完整鉴定)Biochemistry30:511-525所述。
Figure A200680052606D00831
比速率常数等。
K61≥50μm-1s-1
K12=300μm-1s-1
K23≥9000μm-1s-1
K34=1200μm-1s-1
K645≥1000μm-1s-1
K16≥1000μm-1s-1
K21=100μm-1s-1
K32=18,000μm-1s-1
K43=18μm-1s-1
K54≥0.5μm-1s-1
(Vmax)天然=50 bps
(Vmax)类似物=5 bps
(km)天然=0.2μm
(km)类似物=6μm
2)使用dNTP饱和浓度(≥1mM)时,通过改变k12(主要)和其它速率常数(如果需要)设定Vmax=50 bps。将所有类似物转变速率保持为与天然dNTP转变速率相同。现在切断解离过程(速率→0)
3)使用类似物-dNTP饱和浓度(≥1mM)时,只通过改变对类似物的k45设定Vmax=5bp。
4)通过将天然dNTP浓度设定为0.2μm并改变k61(仅天然dNTP)使V=25bps,从而设定(km)天然=0.2μm。
5)通过将dNTP类似物浓度设定为6μm并改变k61(仅类似物)使V-2.5bps,从而设定(km)天然=6μm。
天然dNTP
k61=365μm-1s-1
k12=60μm-1s-1
k23=9000μm-1s-1
k34=1200μm-1s-1
k45=1000μm-1s-1
k56=500μm-1s-1
k16=10μm-1s-1
k21=100μm-1s-1
k32=1800μm-1s-1
k43=18μm-1s-1
k54=0.5μm-1s-1
k65=100μm-1s-1
dNTP类似物
k61=1.1μm-1s-1
k12=60μm-1s-1
k23=9000μm-1s-1
k34=5.5μm-1s-1
k45=5.5μm-1s-1
k56=500μm-1s-1
k16=10μm-1s-1
k21=100μm-1s-1
k32=1800μm-1s-1
k43=18μm-1s-1
k54=0.1μm-1s-1
k65=100μm-1s-1
通过进一步实验对所有速率进行校正。
pol_指数.m:根据DNA序列启动所有必要的矩阵指数列表和指针。
Pol_速率矩阵.m:将excel文件用作输入源,其含有所有独特速率常数的列表,根据DNA序列产生转变速率矩阵。
Pol_浓度矩阵.m:取试剂浓度,建立浓度矩阵,以使:
概率矩阵=时间步骤*速率矩阵*浓度矩阵
(对所有非对角线元素而言)
Pol_dntp_消耗.m:根据连续模型计算试剂消耗速率。
POL_dna.m:合并POL_DNA、POL_REAGENTS、POL_CURVEMAP的所有前述函数,
追踪所有前述消耗,
追踪DNA合成的长度分布,
追踪游离模板、完整dsDNA模板、目前研究的模板,
多种可能的浓度轮次
用户定义的重复DNA序列,有限长度模板
pol_金属.m:利用分拆的POL_DNA进行Mg+消耗实验的完整实施方式。
虽然出于阐明和理解的目的详细描述了上述发明,但是本领域普通技术人员通过阅读本公开应明白,可在不背离本发明真实范围的情况下作出各种形式和细节的改变。例如,可以各种组合方式使用上述所有技术和设备。将本申请引用的所有发表物、专利、专利申请和/或其它文献全文纳入本文作参考用于所有目的,就好像将各篇单独的发表物、专利、专利申请和/或其它文献单独和独立纳入作参考用于所有目的那样。

Claims (55)

1.一种包含重组DNA聚合酶的组合物,所述重组DNA聚合酶含有:
与野生型DNA聚合酶的野生型活性位点区同源的修饰活性位点区,相对于野生型活性位点区,所述修饰活性位点区包括一种或多种结构修饰,这类修饰能降低核苷酸类似物进入所述修饰活性位点区的空间抑制,或与所述核苷酸类似物的一种或多种非天然特征互补,其中,与野生型聚合酶相比所述重组DNA聚合酶对所述核苷酸类似物的特性发生改变。
2.如权利要求1所述的组合物,其特征在于,所述重组DNA聚合酶与下述聚合酶同源:Φ29DNA聚合酶、Taq聚合酶、外切核酸酶缺陷型Taq聚合酶、DNA Pol I聚合酶、T7聚合酶、T5聚合酶、RB69聚合酶、T5聚合酶或对应于DNA Pol I聚合酶克列诺片段的聚合酶。
3.如权利要求1所述的组合物,其特征在于,所述重组DNA聚合酶与野生型或外切核酸酶缺陷型Φ29 DNA聚合酶同源。
4.如权利要求1所述的组合物,其特征在于,所述重组DNA聚合酶与Φ29、B103、GA-1、PZA、Φ15、BS32、M2Y、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722或L17同源。
5.如权利要求3所述的组合物,其特征在于,相对于野生型或外切核酸酶缺陷型Φ29DNA聚合酶,所述重组DNA聚合酶的活性位点内或其附近包含结构修饰,所述结构修饰选自:残基505-525缺失、残基505-525内的缺失、K135A突变、E375H突变、E375S突变、E375K突变、E375R突变、E375A突变、E375Q突变、E375W突变、E375Y突变、E375F突变、E486A突变、E486D突变、K512A突变和其组合。
6.如权利要求5所述的组合物,其特征在于,所述重组DNA聚合酶还包含L384R突变。
7.如权利要求5所述的组合物,其特征在于,所述重组DNA聚合酶还包含选自表8的其它突变或突变组合。
8.如权利要求1所述的组合物,其特征在于,所述重组DNA聚合酶包含相对于野生型聚合酶降低所述重组聚合酶的外切核酸酶活性的结构修饰。
9.如权利要求8所述的组合物,其特征在于,所述聚合酶与Φ29 DNA聚合酶同源,所述结构修饰是导致外切核酸酶活性降低的氨基酸缺失或改变。
10.如权利要求9所述的组合物,其特征在于,相对于野生型Φ29 DNA聚合酶,所述改变对应于对N62的突变。
11.如权利要求1所述的组合物,其特征在于,所述重组DNA聚合酶含有一种或多种外源性亲和标记序列。
12.如权利要求11所述的组合物,其特征在于,所述亲和标记序列选自:6His标签序列、GST标签、HA标签序列、多个6 His标签序列、多个GST标签、多个HA标签序列和它们的组合。
13.如权利要求1所述的组合物,其特征在于,所述重组DNA聚合酶选自表3。
14.如权利要求1所述的组合物,其含有所述核苷酸类似物。
15.如权利要求14所述的组合物,其特征在于,所述核苷酸类似物含有荧光团或染料部分。
16.如权利要求14所述的组合物,其特征在于,所述核苷酸类似物是磷酸标记的核苷酸类似物。
17.如权利要求14所述的组合物,其特征在于,所述核苷酸类似物是单脱氧或双脱氧核苷酸类似物。
18.如权利要求14所述的组合物,其特征在于,所述核苷酸类似物是含有3-6个磷酸基团的标记的核苷酸类似物。
19.如权利要求14所述的组合物,其特征在于,所述核苷酸类似物是三磷酸盐、四磷酸盐、五磷酸盐或六磷酸盐。
20.如权利要求18所述的组合物,其特征在于,所述结构修饰包括加入结合所述核苷酸类似物磷酸残基的带正电的氨基酸残基。
21.如权利要求1所述的组合物,其特征在于,所述改变的特性选自:Km、kcat、Vmax、在核苷酸类似物存在下重组聚合酶的持续合成能力、在核苷酸类似物存在下重组聚合酶的平均模板阅读长度、重组聚合酶对核苷酸类似物的特异性、核苷酸类似物的结合速率、产物释放速率和分支速率。
22.如权利要求1所述的组合物,其特征在于,所述改变的特性包括对所述核苷酸类似物的Km降低。
23.如权利要求1所述的组合物,其特征在于,所述改变的特性包括对所述核苷酸类似物的kcat/Km或Vmax/Km升高。
24.如权利要求1所述的组合物,其特征在于,所述重组聚合酶对天然核苷酸的比活至少约为相应野生型聚合酶的5%,在模板存在下的持续合成能力至少为天然核苷酸存在下所述野生型聚合酶的5%。
25.如权利要求1所述的组合物,其特征在于,所述重组聚合酶对天然产生核苷酸的kcat/Km或Vmax/Km至少约为野生型聚合酶的5%。
26.如权利要求1所述的组合物,其特征在于,所述重组聚合酶对天然产生核苷酸的kcat/Km或Vmax/Km至少约为野生型聚合酶的25%。
27.如权利要求1所述的组合物,其包含所述核苷酸类似物和DNA模板,其中所述重组聚合酶根据模板DNA将所述核苷酸类似物掺入核酸拷贝中。
28.如权利要求27所述的组合物,其特征在于,所述模板是环状模板。
29.如权利要求1所述的组合物,其特征在于,所述组合物存在于DNA测序系统中。
30.如权利要求29所述的组合物,其特征在于,所述测序系统包括零模式波导管。
31.一种制备DNA的方法,所述方法包括:
提供含有模板、与所述模板复合或整合的复制起始部分、在模板依赖性聚合酶反应中能够利用所述部分复制至少一部分所述模板的聚合酶以及一种或多种核苷酸的反应混合物,其中所述一种或多种核苷酸包含核苷酸类似物,
其中所述重组DNA聚合酶包含与野生型DNA聚合酶的野生型活性位点同源的修饰活性位点,所述修饰活性位点相对于野生型活性位点包含一种或多种结构修饰,这类结构修饰降低核苷酸类似物进入所述修饰活性位点的空间抑制,或与所述核苷酸类似物的一种或多种非天然特征互补;和
使所述混合物发生反应,以使所述重组聚合酶以模板依赖性方式复制至少一部分模板。
32.一种制备DNA的方法,所述方法包括:
提供含有模板、与所述模板复合或整合的复制起始部分、在模板依赖性聚合酶反应中能够利用所述部分复制至少一部分所述模板的聚合酶以及一种或多种核苷酸的反应混合物,其中所述一种或多种核苷酸包含磷酸标记的核苷酸类似物,
其中所述重组聚合酶对所述核苷酸类似物的Km值低于相应的同源野生型聚合酶对所述核苷酸类似物的Km,和
使所述混合物发生反应,以使所述聚合酶以模板依赖性方式复制至少一部分模板,从而将至少一个核苷酸类似物残基掺入所得到的DNA中。
33.一种制备DNA的方法,所述方法包括:
提供含有模板、与所述模板复合或整合的复制起始部分、在模板依赖性聚合酶反应中能够利用所述部分复制至少一部分所述模板的聚合酶以及一种或多种核苷酸的反应混合物,其中所述一种或多种核苷酸包含磷酸标记的核苷酸类似物,
其中所述聚合酶与Φ29 DNA聚合酶同源,对A488dC4P、A568dC4P或二者的Km低于GST-N62D Φ29 DNA聚合酶突变体对A488dC4P、A568dC4P或二者Km的约75%;和
使所述混合物发生反应,以使所述聚合酶复制至少一部分模板。
34.如权利要求31、32或33所述的方法,其特征在于,所述复制起始部分包含寡核苷酸引物、所述模板中的自身互补区或结合所述模板的多肽。
35.如权利要求31、32或33所述的方法,其特征在于,所述聚合酶对所述类似物的Km低于相应野生型聚合酶Km的约75%。
36.如权利要求31、32或33所述的方法,其特征在于,所述聚合酶对所述类似物的Km低于相应野生型聚合酶Km的约40%。
37.如权利要求31、32或33所述的方法,其特征在于,所述聚合酶对所述类似物的Km低于相应野生型聚合酶Km的约15%。
38.如权利要求31、32或33所述的方法,其特征在于,所述聚合酶对所述核苷酸类似物的kcat/Km或Vmax/Km高于野生型Φ29对所述核苷酸类似物的kcat/Km或Vmax/Km
39.如权利要求31、32或33所述的方法,其特征在于,所述聚合酶是相对于野生型Φ29 DNA聚合酶含有结构修饰的重组DNA聚合酶,所述结构修饰选自:残基505-525缺失、残基505-525内的缺失、K135A突变、E375H突变、E375S突变、E375K突变、E375R突变、E375A突变、E375Q突变、E375W突变、E375Y突变、E375F突变、E486A突变、E486D突变、K512A突变和其组合。
40.一种制备重组DNA聚合酶的方法,所述方法包括:
建立第一种聚合酶的结构模型;
鉴定一种或多种影响核苷酸进入活性位点的空间抑制特征或活性位点处核苷酸类似物的互补特征;
使所述第一种DNA聚合酶突变,以降低或去除至少一种空间抑制特征或加入至少一种核苷酸类似物互补特征;和
确定与所述第一种DNA聚合酶相比,得到的重组聚合酶对核苷酸类似物的活性是否改变。
41.如权利要求40所述的方法,包括确定所述重组DNA聚合酶对所述核苷酸类似物的kcat、Km、Vmax或kcat/Km
42.如权利要求40所述的方法,包括确定所述重组DNA聚合酶对天然核苷酸的kcat、Km、Vmax或kcat/Km
43.如权利要求40所述的方法,包括制备重组DNA聚合酶文库,所述文库的多个成员包含一种或多种空间抑制特征突变或互补特征突变。
44.如权利要求43所述的方法,包括筛选所述文库以鉴定至少一个具有所述修饰活性的成员。
45.一种计算机实现方法,所述方法包括:
定义基于模板的聚合反应过程中独立时间步骤的多种聚合酶状态转变;
定义多种状态之间的转变速率;
根据给定核酸模板序列、反应混合物中的核苷酸和所述聚合酶状态转变产生可能状态的多维概率矩阵;和,
将所述多维概率矩阵储存于计算机可读介质中。
46.如权利要求45所述的方法,其特征在于,所述聚合酶状态转变是用户可选择的。
47.如权利要求45所述的方法,其特征在于,所述状态转变速率取决于核苷酸浓度、模板序列和聚合酶在所述模板上的位置。
48.如权利要求45所述的方法,其特征在于,所述反应混合物中的核苷酸包含一个或多个核苷酸类似物。
49.如权利要求45所述的方法,其特征在于,所述状态转变速率包括所述聚合酶利用所述核苷酸类似物时所述聚合酶的构象转变速率,所述速率被设定成等于天然核苷酸的构象转变速率。
50.如权利要求45所述的方法,其特征在于,根据所述模板序列、概率状态的标准化矩阵和反应混合物中的核苷酸自动产生多维概率矩阵。
51.如权利要求45所述的方法,其特征在于,通过假定所有可能的沃森克里克碱基配对在所有状态转变中等效来简化所述概率矩阵。
52.如权利要求45所述的方法,其特征在于,产生第二种试剂浓度矩阵,以根据所述概率矩阵的输出值计算由于聚合酶在模板上的位置导致的试剂浓度改变。
53.如权利要求45所述的方法,包括矢量化多个模板的所述概率矩阵,将得到的矢量化概率矩阵乘以所述多维概率矩阵,得到状态分布矩阵。
54.如权利要求45所述的方法,包括确定所述概率矩阵的指数时间因子,以计算所述模板序列内的重复序列。
55.如权利要求45所述的方法,包括利用连续模型或计数模型确定聚合酶核苷酸错配分数。
CNA2006800526063A 2005-12-22 2006-12-21 用于掺入核苷酸类似物的聚合酶 Pending CN101365807A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US75367005P 2005-12-22 2005-12-22
US60/753,670 2005-12-22

Publications (1)

Publication Number Publication Date
CN101365807A true CN101365807A (zh) 2009-02-11

Family

ID=38218682

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800526063A Pending CN101365807A (zh) 2005-12-22 2006-12-21 用于掺入核苷酸类似物的聚合酶

Country Status (8)

Country Link
US (6) US8921086B2 (zh)
EP (2) EP3056575B1 (zh)
JP (1) JP2009521227A (zh)
CN (1) CN101365807A (zh)
AU (1) AU2006330947B2 (zh)
CA (1) CA2633524A1 (zh)
ES (1) ES2648313T3 (zh)
WO (1) WO2007076057A2 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9759658B2 (en) 2014-08-08 2017-09-12 Quantum-Si Incorporated Integrated device for temporal binning of received photons
US9863880B2 (en) 2013-11-17 2018-01-09 Quantum-Si Incorporated Optical system and assay chip for probing, detecting and analyzing molecules
US9885657B2 (en) 2014-08-08 2018-02-06 Quantum-Si Incorporated Integrated device with external light source for probing detecting and analyzing molecules
US9921157B2 (en) 2014-08-08 2018-03-20 Quantum-Si Incorporated Optical system and assay chip for probing, detecting and analyzing molecules
CN110268055A (zh) * 2016-12-19 2019-09-20 宽腾矽公司 用于测序反应的聚合酶
CN110573616A (zh) * 2017-04-18 2019-12-13 深圳华大智造科技有限公司 Phi29 DNA 聚合酶及其编码基因与应用
CN110719955A (zh) * 2017-07-28 2020-01-21 深圳华大智造科技有限公司 提高了热稳定性的Phi29 DNA聚合酶突变体及其应用
CN113122517A (zh) * 2021-03-24 2021-07-16 深圳清华大学研究院 聚合酶突变体及其应用
CN113316635A (zh) * 2018-10-29 2021-08-27 科德克希思公司 工程化dna聚合酶变体
CN114891761A (zh) * 2022-03-25 2022-08-12 上海威高医疗技术发展有限公司 Tth DNA聚合酶突变体及其应用
US11959105B2 (en) 2019-06-28 2024-04-16 Quantum-Si Incorporated Polymerizing enzymes for sequencing reactions

Families Citing this family (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7763423B2 (en) * 2005-09-30 2010-07-27 Pacific Biosciences Of California, Inc. Substrates having low density reactive groups for monitoring enzyme activity
CN101365807A (zh) 2005-12-22 2009-02-11 加利福尼亚太平洋生物科学股份有限公司 用于掺入核苷酸类似物的聚合酶
US8936926B2 (en) 2005-12-22 2015-01-20 Pacific Biosciences Of California Active surface coupled polymerases
US8975216B2 (en) * 2006-03-30 2015-03-10 Pacific Biosciences Of California Articles having localized molecules disposed thereon and methods of producing same
US20080050747A1 (en) * 2006-03-30 2008-02-28 Pacific Biosciences Of California, Inc. Articles having localized molecules disposed thereon and methods of producing and using same
CN101495656B (zh) 2006-06-07 2017-02-08 纽约哥伦比亚大学理事会 采用带修饰的核苷酸通过纳米通道进行dna序列测定
WO2008051530A2 (en) * 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
WO2009036246A2 (en) * 2007-09-14 2009-03-19 Immunotope, Inc. Immunogens that induce cytotoxic t-lymphocytes and their use in prevention, treatment, and diagnosis of cancer
WO2009045344A2 (en) 2007-09-28 2009-04-09 Pacific Biosciences Of California, Inc. Error-free amplification of dna for clonal sequencing
AU2008331824B2 (en) * 2007-12-04 2014-07-24 Pacific Biosciences Of California, Inc. Alternate labeling strategies for single molecule sequencing
US8652781B2 (en) 2008-02-12 2014-02-18 Pacific Biosciences Of California, Inc. Cognate sampling kinetics
CA2718404C (en) 2008-03-13 2018-04-10 Pacific Biosciences Of California, Inc. Labeled reactants and their uses
US7973146B2 (en) 2008-03-26 2011-07-05 Pacific Biosciences Of California, Inc. Engineered fluorescent dye labeled nucleotide analogs for DNA sequencing
EP3269824A1 (en) 2008-03-28 2018-01-17 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US8906831B2 (en) 2008-03-31 2014-12-09 Pacific Biosciences Of California, Inc. Single molecule loading methods and compositions
US9127259B2 (en) 2008-03-31 2015-09-08 Pacific Biosciences Of California, Inc. Enzymes resistant to photodamage
US8999676B2 (en) 2008-03-31 2015-04-07 Pacific Biosciences Of California, Inc. Recombinant polymerases for improved single molecule sequencing
WO2009145828A2 (en) * 2008-03-31 2009-12-03 Pacific Biosciences Of California, Inc. Two slow-step polymerase enzyme systems and methods
US8420366B2 (en) * 2008-03-31 2013-04-16 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
EP2271751B1 (en) * 2008-03-31 2015-07-22 Pacific Biosciences of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US20100036110A1 (en) * 2008-08-08 2010-02-11 Xiaoliang Sunney Xie Methods and compositions for continuous single-molecule nucleic acid sequencing by synthesis with fluorogenic nucleotides
US20100227327A1 (en) * 2008-08-08 2010-09-09 Xiaoliang Sunney Xie Methods and compositions for continuous single-molecule nucleic acid sequencing by synthesis with fluorogenic nucleotides
WO2010027484A2 (en) * 2008-09-05 2010-03-11 Pacific Biosciences Of California, Inc. Engineering polymerases and reaction conditions for modified incorporation properties
WO2010062779A2 (en) * 2008-11-03 2010-06-03 Kapabiosystems Modified dna polymerases
ES2571446T3 (es) 2008-11-03 2016-05-25 Kapa Biosystems Inc ADN polimerasas quiméricas
US8252910B2 (en) 2008-11-19 2012-08-28 Pacific Biosciences Of California, Inc. Modular nucleotide compositions and uses therefor
AU2009325069B2 (en) 2008-12-11 2015-03-19 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
US20100255487A1 (en) 2009-03-27 2010-10-07 Life Technologies Corporation Methods and apparatus for single molecule sequencing using energy transfer detection
WO2010117420A2 (en) 2009-03-30 2010-10-14 Pacific Biosciences Of California, Inc. Fret-labeled compounds and uses therefor
WO2010141391A2 (en) 2009-06-05 2010-12-09 Life Technologies Corporation Mutant dna polymerases
US8501406B1 (en) 2009-07-14 2013-08-06 Pacific Biosciences Of California, Inc. Selectively functionalized arrays
WO2011014811A1 (en) 2009-07-31 2011-02-03 Ibis Biosciences, Inc. Capture primers and capture sequence linked solid supports for molecular diagnostic tests
US8911972B2 (en) 2009-12-16 2014-12-16 Pacific Biosciences Of California, Inc. Sequencing methods using enzyme conformation
US8324914B2 (en) 2010-02-08 2012-12-04 Genia Technologies, Inc. Systems and methods for characterizing a molecule
US9678055B2 (en) 2010-02-08 2017-06-13 Genia Technologies, Inc. Methods for forming a nanopore in a lipid bilayer
US9605307B2 (en) 2010-02-08 2017-03-28 Genia Technologies, Inc. Systems and methods for forming a nanopore in a lipid bilayer
US20110192723A1 (en) * 2010-02-08 2011-08-11 Genia Technologies, Inc. Systems and methods for manipulating a molecule in a nanopore
US20120202276A1 (en) 2010-02-26 2012-08-09 Life Technologies Corporation Modified Proteins and Methods of Making and Using Same
EP2539471B1 (en) * 2010-02-26 2014-08-06 Life Technologies Corporation Method for sequencing using a modified polymerase
WO2011139344A2 (en) 2010-04-28 2011-11-10 Pacific Biosciences Of California, Inc Nanoscale apertures having islands of functionality
US8986930B2 (en) 2010-07-12 2015-03-24 Pacific Biosciences Of California, Inc. Sequencing reactions with alkali metal cations for pulse width control
WO2012027623A2 (en) 2010-08-25 2012-03-01 Pacific Biosciences Of California, Inc. Cyanine dyes
US8936911B2 (en) 2010-09-22 2015-01-20 Pacific Biosciences Of California, Inc. Purified extended polymerase/template complex for sequencing
WO2012088339A2 (en) 2010-12-22 2012-06-28 Genia Technologies, Inc. Nanopore-based single dna molecule characterization using speed bumps
CN103502463B (zh) 2010-12-27 2016-03-16 艾比斯生物科学公司 核酸样品的制备方法及组合物
US9581563B2 (en) 2011-01-24 2017-02-28 Genia Technologies, Inc. System for communicating information from an array of sensors
US9110478B2 (en) 2011-01-27 2015-08-18 Genia Technologies, Inc. Temperature regulation of measurement arrays
EP2689028B1 (en) 2011-03-23 2017-08-30 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
CN103502474B (zh) * 2011-05-06 2016-03-16 凯杰有限公司 包含经由连接基连结的标记的寡核苷酸
WO2013022778A1 (en) 2011-08-05 2013-02-14 Ibis Biosciences, Inc. Nucleic acid sequencing by electrochemical detection
EP2742151B1 (en) 2011-08-10 2017-10-25 Life Technologies Corporation Polymerase compositions
US9347900B2 (en) 2011-10-14 2016-05-24 Pacific Biosciences Of California, Inc. Real-time redox sequencing
US9279154B2 (en) 2011-12-21 2016-03-08 Illumina, Inc. Apparatus and methods for kinetic analysis and determination of nucleic acid sequences
EP2872523B1 (en) 2011-12-30 2018-01-17 Abbott Molecular Inc. Microorganism nucleic acid purification from host samples
EP2802666B1 (en) 2012-01-13 2018-09-19 Data2Bio Genotyping by next-generation sequencing
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US8906660B2 (en) 2012-02-01 2014-12-09 Pacific Biosciences Of California, Inc. Recombinant polymerases with increased phototolerance
EP3590948A1 (en) 2012-02-15 2020-01-08 Pacific Biosciences of California, Inc. Polymerase enzyme substrates with protein shield
US8986629B2 (en) 2012-02-27 2015-03-24 Genia Technologies, Inc. Sensor circuit for controlling, detecting, and measuring a molecular complex
WO2013148400A1 (en) 2012-03-30 2013-10-03 Pacific Biosciences Of California, Inc. Methods and composition for sequencing modified nucleic acids
EP3438285B1 (en) 2012-05-02 2020-10-14 Ibis Biosciences, Inc. Dna sequencing
ES2683978T3 (es) 2012-05-02 2018-10-01 Ibis Biosciences, Inc. Secuenciación de ADN
ES2683707T3 (es) 2012-05-02 2018-09-27 Ibis Biosciences, Inc. Secuenciación de ADN
EP2850086B1 (en) 2012-05-18 2023-07-05 Pacific Biosciences Of California, Inc. Heteroarylcyanine dyes
US9315864B2 (en) 2012-05-18 2016-04-19 Pacific Biosciences Of California, Inc. Heteroarylcyanine dyes with sulfonic acid substituents
GB2559073A (en) 2012-06-08 2018-07-25 Pacific Biosciences California Inc Modified base detection with nanopore sequencing
CA2876095A1 (en) 2012-06-15 2013-12-19 Genia Technologies, Inc. Chip set-up and high-accuracy nucleic acid sequencing
EP2895620B1 (en) 2012-09-11 2017-08-02 Life Technologies Corporation Nucleic acid amplification
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
US9399766B2 (en) 2012-10-01 2016-07-26 Pacific Biosciences Of California, Inc. Recombinant polymerases for incorporation of protein shield nucleotide analogs
CA2887665A1 (en) 2012-10-16 2014-04-24 Abbott Molecular Inc. Methods and apparatus to sequence a nucleic acid
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
US9759711B2 (en) 2013-02-05 2017-09-12 Genia Technologies, Inc. Nanopore arrays
US9146248B2 (en) 2013-03-14 2015-09-29 Intelligent Bio-Systems, Inc. Apparatus and methods for purging flow cells in nucleic acid sequencing instruments
US10421996B2 (en) 2013-03-14 2019-09-24 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
US9591268B2 (en) 2013-03-15 2017-03-07 Qiagen Waltham, Inc. Flow cell alignment methods and systems
US9290800B2 (en) 2013-03-15 2016-03-22 Pacific Biosciences Of California, Inc. Targeted rolling circle amplification
US9422535B2 (en) 2013-04-25 2016-08-23 Thermo Fisher Scientific Baltics Uab phi29 DNA polymerase mutants having increased thermostability and processivity
US9708656B2 (en) 2013-05-06 2017-07-18 Pacific Biosciences Of California, Inc. Real-time electronic sequencing
US10036013B2 (en) 2013-08-19 2018-07-31 Abbott Molecular Inc. Next-generation sequencing libraries
US9657281B2 (en) 2013-09-30 2017-05-23 Life Technologies Corporation Polymerase compositions, methods of making and using same
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
US9322062B2 (en) 2013-10-23 2016-04-26 Genia Technologies, Inc. Process for biosensor well formation
CN105723222B (zh) 2013-10-23 2019-01-22 吉尼亚科技公司 使用纳米孔的高速分子感测
EP3083700B1 (en) 2013-12-17 2023-10-11 The Brigham and Women's Hospital, Inc. Detection of an antibody against a pathogen
CN114214314A (zh) 2014-06-24 2022-03-22 生物辐射实验室股份有限公司 数字式pcr条码化
US9765309B2 (en) 2014-06-27 2017-09-19 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
EP3161490B1 (en) 2014-06-27 2019-10-02 Abbott Laboratories Compositions and methods for detecting human pegivirus 2 (hpgv-2)
US10435685B2 (en) 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
EP3183367B1 (en) 2014-08-19 2019-06-26 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
CN107002293B (zh) 2014-09-17 2020-12-08 艾比斯生物科学公司 使用脉冲读数光学的通过合成测序
WO2016054096A1 (en) 2014-09-30 2016-04-07 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
WO2016153999A1 (en) 2015-03-25 2016-09-29 Life Technologies Corporation Modified nucleotides and uses thereof
CN114517189A (zh) 2014-11-14 2022-05-20 亿明达股份有限公司 聚合酶
EP3234115B1 (en) 2014-12-16 2020-07-22 Life Technologies Corporation Polymerase compositions and methods of making and using same
US10302972B2 (en) 2015-01-23 2019-05-28 Pacific Biosciences Of California, Inc. Waveguide transmission
WO2016154345A1 (en) 2015-03-24 2016-09-29 Pacific Biosciences Of California, Inc. Methods and compositions for single molecule composition loading
US10174363B2 (en) 2015-05-20 2019-01-08 Quantum-Si Incorporated Methods for nucleic acid sequencing
KR20180014159A (ko) * 2015-06-03 2018-02-07 일루미나, 인코포레이티드 나노기공에 인접한 중합효소에 고정된 테터를 이용하여 폴리뉴클레오타이드를 서열결정하기 위한 조성물, 시스템 및 방법
CN108139345B (zh) 2015-08-06 2021-04-20 加利福尼亚太平洋生物科学股份有限公司 用于选择性寻址稀疏布置的电子测量装置的系统和方法
US20170159115A1 (en) 2015-08-10 2017-06-08 Stratos Genomics, Inc. Single molecule nucleic acid sequencing with molecular sensor complexes
WO2017050723A1 (en) * 2015-09-22 2017-03-30 Genia Technologies, Inc. Pol7 polymerase variants
US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
EP3377648B1 (en) 2015-11-16 2021-01-06 Stratos Genomics, Inc. Dp04 polymerase variants
WO2017087696A1 (en) 2015-11-18 2017-05-26 Pacific Biosciences Of California, Inc. Methods and compositions for loading of polymerase complexes
CN108350491A (zh) 2015-11-18 2018-07-31 加利福尼亚太平洋生物科学股份有限公司 将核酸加载到基材上
CN108472121A (zh) 2015-11-20 2018-08-31 加利福尼亚太平洋生物科学股份有限公司 受保护的染料标记的试剂
WO2017087975A1 (en) 2015-11-20 2017-05-26 Pacific Biosciences Of California, Inc. Labeled nucleotide analogs, reaction mixtures, and methods and systems for sequencing
US10730030B2 (en) 2016-01-08 2020-08-04 Bio-Rad Laboratories, Inc. Multiple beads per droplet resolution
TWI734748B (zh) 2016-02-17 2021-08-01 美商太斯萊特健康股份有限公司 用於生命期成像及偵測應用之感測器及裝置
US10544457B2 (en) 2016-06-14 2020-01-28 Pacific Biosciences Of California, Inc. Methods and compositions for enriching compositions for polymerase enzyme complexes
WO2018015365A1 (en) 2016-07-18 2018-01-25 Roche Sequencing Solutions, Inc. Asymmetric templates and asymmetric method of nucleic acid sequencing
ES2875318T3 (es) 2016-07-18 2021-11-10 Hoffmann La Roche Procedimiento para generar colecciones de ADN circular monocatenario para secuenciación de molécula única
US10711300B2 (en) 2016-07-22 2020-07-14 Pacific Biosciences Of California, Inc. Methods and compositions for delivery of molecules and complexes to reaction sites
WO2018042251A1 (en) 2016-08-29 2018-03-08 Oslo Universitetssykehus Hf Chip-seq assays
CA3035033A1 (en) 2016-08-31 2018-03-08 Bioatla, Llc Conditionally active polypeptides and methods of generating them
WO2018118971A1 (en) 2016-12-19 2018-06-28 Bio-Rad Laboratories, Inc. Droplet tagging contiguity preserved tagmented dna
CN118099177A (zh) 2016-12-22 2024-05-28 宽腾矽公司 具有直接合并像素的整合式光电侦测器
CA3061651A1 (en) 2017-05-04 2018-11-08 Stratos Genomics, Inc. Dp04 polymerase variants
US20180363044A1 (en) * 2017-06-14 2018-12-20 Roche Molecular Systems, Inc. Compositions and methods for improving the thermal stability of nucleic acid amplification reagents
EP3642363A1 (en) 2017-06-20 2020-04-29 Bio-Rad Laboratories, Inc. Mda using bead oligonucleotide
CA3069983A1 (en) 2017-07-24 2019-01-31 Quantum-Si Incorporated Hand-held, massively-parallel, bio-optoelectronic instrument
CN111315895A (zh) 2017-09-14 2020-06-19 豪夫迈·罗氏有限公司 用于产生环状单链dna文库的新型方法
WO2019053215A1 (en) 2017-09-15 2019-03-21 F. Hoffmann-La Roche Ag HYBRIDIZATION-EXTENSION-LIGATURE STRATEGY TO GENERATE CIRCULAR SINGLE-STRAND DNA BANKS
EP3692166A1 (en) 2017-10-06 2020-08-12 H. Hoffnabb-La Roche Ag Circularization methods for single molecule sequencing sample preparation
US11162138B2 (en) 2017-10-30 2021-11-02 Pacific Biosciences Of California, Inc. Multi-amplitude modular labeled compounds
CN111295443B (zh) 2017-11-02 2024-04-16 生物辐射实验室股份有限公司 基于转座酶的基因组分析
CN111655846B (zh) 2017-12-11 2024-05-03 F·霍夫曼-罗氏股份公司 具有改进的精确度的dpo4聚合酶变体
CN111836904A (zh) 2017-12-21 2020-10-27 豪夫迈·罗氏有限公司 用于单向核酸测序的组合物和方法
CN111788485A (zh) 2017-12-22 2020-10-16 加利福尼亚太平洋生物科学股份有限公司 用于固定化的修饰型生物素结合蛋白
US20190241944A1 (en) 2018-01-31 2019-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for deconvoluting partition barcodes
US12054772B2 (en) 2018-03-13 2024-08-06 Sarmal, Inc. Methods for single molecule sequencing
US11512002B2 (en) 2018-04-18 2022-11-29 University Of Virginia Patent Foundation Silica materials and methods of making thereof
MX2020013788A (es) 2018-06-22 2021-03-02 Quantum Si Inc Fotodetector integrado con deposito de almacenamiento de carga con tiempo de deteccion variado.
US11332787B2 (en) 2018-06-29 2022-05-17 Pacific Biosciences Of California, Inc. Methods and compositions for delivery of molecules and complexes to reaction sites
US11479816B2 (en) 2018-08-20 2022-10-25 Bio-Rad Laboratories, Inc. Nucleotide sequence generation by barcode bead-colocalization in partitions
IL299237B1 (en) 2018-10-31 2024-08-01 Illumina Inc Polymerases, preparations and methods of use
AU2019391093A1 (en) 2018-12-05 2021-01-07 Illumina Cambridge Limited Polymerases, compositions, and methods of use
EP3674702A1 (en) 2018-12-27 2020-07-01 Imec VZW Method for sequencing a polynucleotide using a biofet
US12006535B2 (en) 2019-11-19 2024-06-11 Sarmal, Inc. Methods and devices for detecting SARS-COV-2
WO2021152586A1 (en) 2020-01-30 2021-08-05 Yeda Research And Development Co. Ltd. Methods of analyzing microbiome, immunoglobulin profile and physiological state
US20230095295A1 (en) * 2020-02-10 2023-03-30 BioSkryb Genomics, Inc. Phi29 mutants and use thereof
WO2021214766A1 (en) 2020-04-21 2021-10-28 Yeda Research And Development Co. Ltd. Methods of diagnosing viral infections and vaccines thereto
EP4166659A4 (en) * 2020-06-10 2024-11-13 Bgi Shenzhen STABLE PHI29 DNA POLYMERASE WITH HIGH ENZYME ACTIVITY AND ENCODING GENE AND APPLICATION THEREOF
US20220380838A1 (en) 2021-06-01 2022-12-01 10X Genomics, Inc. Methods and compositions for analyte detection and probe resolution
US20230041485A1 (en) 2021-07-30 2023-02-09 10X Genomics, Inc. Methods and compositions for synchronizing reactions in situ
US12077789B2 (en) 2021-08-14 2024-09-03 Illumina, Inc. Polymerases, compositions, and methods of use
CN114940979B (zh) * 2022-02-16 2024-01-23 杭州嵌化合生医药科技有限公司 一种利用遗传密码扩展提高阳离子-π相互作用的方法及应用
WO2023215603A1 (en) 2022-05-06 2023-11-09 10X Genomics, Inc. Methods and compositions for in situ analysis of v(d)j sequences
US20240084378A1 (en) 2022-05-11 2024-03-14 10X Genomics, Inc. Compositions and methods for in situ sequencing
WO2024015962A1 (en) 2022-07-15 2024-01-18 Pacific Biosciences Of California, Inc. Blocked asymmetric hairpin adaptors
US20240141427A1 (en) 2022-09-30 2024-05-02 Illumina, Inc. Polymerases, compositions, and methods of use
WO2024076991A2 (en) * 2022-10-03 2024-04-11 Singular Genomics Systems, Inc. Modified enzymes and uses thereof
US20240263219A1 (en) 2023-01-06 2024-08-08 10X Genomics, Inc. Methods and compositions for in situ analysis of variant sequences
WO2024163948A2 (en) 2023-02-03 2024-08-08 10X Genomics, Inc. In situ analysis of variant sequences in biological samples

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4711955A (en) 1981-04-17 1987-12-08 Yale University Modified nucleotides and methods of preparing and using same
US5001050A (en) 1989-03-24 1991-03-19 Consejo Superior Investigaciones Cientificas PHφ29 DNA polymerase
US5198543A (en) * 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
US5998580A (en) * 1995-10-13 1999-12-07 Fay; Frederick F. Photosensitive caged macromolecules
US6261797B1 (en) * 1996-01-29 2001-07-17 Stratagene Primer-mediated polynucleotide synthesis and manipulation techniques
AU721695B2 (en) * 1996-08-16 2000-07-13 Dong Wha Pharmaceutical Industrial Co., Ltd. HBV polymerase, RNase H enzyme derived from HBV polymerase, processes for preparation and uses for screening antiviral agents thereof
AU9312598A (en) * 1997-09-10 1999-03-29 Allegheny University Of The Health Sciences Inhibitors of collagen assembly
US6346379B1 (en) * 1997-09-11 2002-02-12 F. Hoffman-La Roche Ag Thermostable DNA polymerases incorporating nucleoside triphosphates labeled with fluorescein family dyes
US6077940A (en) * 1997-12-24 2000-06-20 Genentech, Inc. Free solution ligand interaction molecular separation method
DE19810879A1 (de) * 1998-03-13 1999-09-16 Roche Diagnostics Gmbh Polymerasenchimären
DK1159453T3 (da) 1999-03-10 2008-10-06 Asm Scient Inc Fremgangsmåde til direkte nukleinsyresekventering
US7056661B2 (en) * 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US20040018969A1 (en) * 2000-01-31 2004-01-29 Rosen Craig A. Nucleic acids, proteins, and antibodies
US20030140369A1 (en) * 2000-02-29 2003-07-24 Pioneer Hi-Bred International, Inc. Novel defense induced multi-drug resistance genes and uses thereof
DE60142228D1 (de) * 2000-03-27 2010-07-08 Univ Jefferson Zusammensetzungen und methoden zur identifizierung und zum targeting von krebszellen aus dem verdauungskanal
US6917726B2 (en) 2001-09-27 2005-07-12 Cornell Research Foundation, Inc. Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes
US20030036181A1 (en) * 2000-06-30 2003-02-20 Okkels Jens Sigurd Peptide extended glycosylated polypeptides
DE10034804A1 (de) * 2000-07-18 2002-01-31 Bayer Ag Verwendung von VLCFAE zum Identifizieren von herbizid wirksamen Verbindungen
WO2002029027A1 (en) 2000-10-04 2002-04-11 Ahram Biosystems Inc. Immobilized dna polymerase
DK2322631T3 (en) 2001-04-19 2015-01-12 Scripps Research Inst Methods and compositions for the production of orthogonal tRNA-aminoacyl-tRNA syntetasepar
WO2002086088A2 (en) 2001-04-24 2002-10-31 Li-Cor, Inc. Polymerases with charge-switch activity and methods of generating such polymerases
CA2457513C (en) 2001-08-29 2013-07-23 Amersham Biosciences Corp Labeled nucleoside polyphosphates
US20050187718A1 (en) * 2001-09-21 2005-08-25 Affinium Pharmaceuticals, Inc. Novel purified polypeptides from Streptococcus pneumoniae
EP2261371B1 (en) 2002-12-20 2015-07-22 QIAGEN GmbH Nucleic acid amplification
WO2004092331A2 (en) 2003-04-08 2004-10-28 Li-Cor, Inc. Composition and method for nucleic acid sequencing
CN101223272B (zh) 2003-04-17 2013-04-03 斯克利普斯研究院 扩展真核生物遗传密码
DE602004027770D1 (de) 2003-07-07 2010-07-29 Scripps Research Inst Zusammensetzungen aus orthogonalen Lysyl-TRNA- und Aminoacyl-TRNA-Synthetasepaaren und deren Verwendung
EP1658366A4 (en) 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
EP1704242A4 (en) 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
US7405281B2 (en) * 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CN101365807A (zh) 2005-12-22 2009-02-11 加利福尼亚太平洋生物科学股份有限公司 用于掺入核苷酸类似物的聚合酶
US20100260465A1 (en) 2005-12-22 2010-10-14 Pacific Biosciences Of California, Inc. Protein engineering strategies to optimize activity of surface attached proteins
US8936926B2 (en) 2005-12-22 2015-01-20 Pacific Biosciences Of California Active surface coupled polymerases
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8906660B2 (en) 2012-02-01 2014-12-09 Pacific Biosciences Of California, Inc. Recombinant polymerases with increased phototolerance
US9399766B2 (en) 2012-10-01 2016-07-26 Pacific Biosciences Of California, Inc. Recombinant polymerases for incorporation of protein shield nucleotide analogs

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9863880B2 (en) 2013-11-17 2018-01-09 Quantum-Si Incorporated Optical system and assay chip for probing, detecting and analyzing molecules
US9983135B2 (en) 2013-11-17 2018-05-29 Quantum-Si Incorporated Active-source-pixel, integrated device for rapid analysis of biological and chemical specimens
US10048208B2 (en) 2013-11-17 2018-08-14 Quantum-Si Incorporated Integrated device with external light source for probing detecting and analyzing molecules
US9885657B2 (en) 2014-08-08 2018-02-06 Quantum-Si Incorporated Integrated device with external light source for probing detecting and analyzing molecules
US9921157B2 (en) 2014-08-08 2018-03-20 Quantum-Si Incorporated Optical system and assay chip for probing, detecting and analyzing molecules
US9759658B2 (en) 2014-08-08 2017-09-12 Quantum-Si Incorporated Integrated device for temporal binning of received photons
CN110268055A (zh) * 2016-12-19 2019-09-20 宽腾矽公司 用于测序反应的聚合酶
CN110573616B (zh) * 2017-04-18 2023-09-05 深圳华大智造科技股份有限公司 Phi29 DNA聚合酶及其编码基因与应用
CN110573616A (zh) * 2017-04-18 2019-12-13 深圳华大智造科技有限公司 Phi29 DNA 聚合酶及其编码基因与应用
CN110719955A (zh) * 2017-07-28 2020-01-21 深圳华大智造科技有限公司 提高了热稳定性的Phi29 DNA聚合酶突变体及其应用
CN113316635A (zh) * 2018-10-29 2021-08-27 科德克希思公司 工程化dna聚合酶变体
US11959105B2 (en) 2019-06-28 2024-04-16 Quantum-Si Incorporated Polymerizing enzymes for sequencing reactions
CN113122517B (zh) * 2021-03-24 2023-02-14 深圳清华大学研究院 聚合酶突变体及其应用
CN113122517A (zh) * 2021-03-24 2021-07-16 深圳清华大学研究院 聚合酶突变体及其应用
CN114891761A (zh) * 2022-03-25 2022-08-12 上海威高医疗技术发展有限公司 Tth DNA聚合酶突变体及其应用
CN114891761B (zh) * 2022-03-25 2024-01-12 上海威高医疗技术发展有限公司 Tth DNA聚合酶突变体及其应用

Also Published As

Publication number Publication date
US8921086B2 (en) 2014-12-30
US9951321B2 (en) 2018-04-24
EP1963536B1 (en) 2016-05-04
AU2006330947B2 (en) 2012-04-12
US10717968B2 (en) 2020-07-21
US11299720B2 (en) 2022-04-12
US20150184239A1 (en) 2015-07-02
EP3056575B1 (en) 2017-10-11
EP1963536A2 (en) 2008-09-03
US20170152492A1 (en) 2017-06-01
US20070196846A1 (en) 2007-08-23
ES2648313T3 (es) 2017-12-29
US9556479B2 (en) 2017-01-31
WO2007076057A3 (en) 2008-06-26
CA2633524A1 (en) 2007-07-05
US20110059505A1 (en) 2011-03-10
US20210102181A1 (en) 2021-04-08
JP2009521227A (ja) 2009-06-04
EP3056575A1 (en) 2016-08-17
EP1963536A4 (en) 2010-03-03
WO2007076057A2 (en) 2007-07-05
US20180237757A1 (en) 2018-08-23
AU2006330947A1 (en) 2007-07-05

Similar Documents

Publication Publication Date Title
CN101365807A (zh) 用于掺入核苷酸类似物的聚合酶
US12018296B2 (en) Recombinant polymerases with increased phototolerance
US11746338B2 (en) Recombinant polymerases for improved single molecule sequencing
US20200277671A1 (en) Recombinant polymerases for incorporation of protein shield nucleotide analogs
EP2942404B1 (en) Generation of modified polymerases for improved accuracy in single molecule sequencing
US8343746B2 (en) Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US20140094374A1 (en) Recombinant Polymerases with Increased Readlength and Stability for Single-Molecule Sequencing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20090211