CN112513263A

CN112513263A - 产生折叶苔醇化合物的方法

Info

Publication number: CN112513263A
Application number: CN201980036141.XA
Authority: CN
Inventors: D·贝洛尔基; 何绣峰; 王祺; 张纪秀
Original assignee: Firmenich SA; Firmenich Aromatics China Co Ltd
Current assignee: Firmenich SA; Firmenich Aromatics China Co Ltd
Priority date: 2018-05-29
Filing date: 2019-05-28
Publication date: 2021-03-16
Also published as: WO2019229064A3; US11345907B2; EP3802804A2; WO2019229064A2; BR112020023411A2; US20210254039A1

Abstract

本申请涉及一种通过使至少一种多肽与法呢基二磷酸(FPP)与卤代酸脱卤酶样(HAD样)水解酶超家族的多肽接触来产生补身烷倍半萜例如折叶苔醇化合物和/或其衍生物的方法，该水解酶超家族可从鳞毛蕨属(Dryopteris)的植物，特别是香鳞毛蕨(Dryopteris fragrans)种的植物获得。该方法可以在体外或体内进行。还提供了在该方法中有用的多肽的氨基酸序列和编码该多肽的核酸。本发明进一步提供了宿主细胞或生物，其经遗传修饰以表达该多肽，并且可用于产生补身烷倍半萜例如折叶苔醇化合物。

Description

产生折叶苔醇化合物的方法

技术领域

本文提供了产生折叶苔醇(albicanol)和相关化合物如磷酸化的折叶苔醇化合物及其衍生物的生化方法，该方法包括使用具有折叶苔基二磷酸(albicanyl diphosphate)合酶活性的新型多肽。

背景技术

萜烯存在于大多数生物(微生物、动物和植物)中。这些化合物由称为异戊二烯单元的五碳单元构成并且通过存在于它们结构中的这些单元的数目进行分类。因此，单萜、倍半萜和二萜是分别含有10、15和20个碳原子的萜烯。例如，在植物界中广泛地存在有倍半萜。许多倍半萜分子因为它们的风味和芳香特性以及它们的美容、医疗和抗菌效果而众所周知。已经鉴定出许多倍半萜烃和倍半萜类化合物。已经开发了化学合成途径，但是仍然很复杂并且不总是具有成本效益。

萜烯的生物合成产生涉及称为萜合酶的酶。在植物界中存在多种倍半萜合酶，它们均使用相同的底物(法呢基二磷酸，FPP)，但是具有不同的产物构造。已经克隆了编码倍半萜合酶的基因和cDNA，并且表征了相应的重组酶。

倍半萜例如具有补身烷(drimane)结构的化合物，例如折叶苔醇化合物或补身醇化合物的许多主要来源是天然含有倍半萜的植物。然而，这些天然来源中倍半萜的含量可能较低。仍然需要发现新的萜合酶和更经济有效的方法来产生倍半萜，例如折叶苔醇化合物，其是制备高价值香料成分(例如Ambrox)的潜在基础材料。

发明内容

上述问题可以通过提供一类新型的显示出折叶苔基二磷酸合酶活性并从FPP产生具有出乎意料的高选择性的折叶苔基二磷酸的酶来解决。特别地，从蕨类香鳞毛蕨(Dryopteris fragrans)中鉴定出新的折叶苔基二磷酸合酶基因及其两种天然变体。

所述新型合酶(DfHAD)及其变体与真菌合酶CvTPS1和LoTPS1或其他双功能萜合酶仅具有≤23％的同源性，后者如本申请人先前所确定的并且在EP申请号17174399.0中描述(另请参见图9的比对)。但是，更重要的是，本发明的合酶也包含I类基序和II类基序。所述基序是萜合酶的特征，并且是EP申请申请号17174399.0中描述的折叶苔醇合酶的基本特征之一。I类主要存在于单萜或倍半萜合酶中，而II类主要存在于二萜合酶中。

由于本发明的蕨类植物DfHAD含有略微修饰的I类基序和略微修饰的II类基序，因此它们可以与较早描述的真菌折叶苔醇合酶进一步区分。

由于以下原因，本发明的折叶苔基二磷酸合酶及其变体也可以被认为是“卤代酸-脱卤酶样水解酶”(“HAD样水解酶”)：

在Pfam搜索中，可以鉴定出结构域E值小于0.005的位于(SEQ ID NO:2的)86至195位的卤代酸脱卤酶样水解酶结构域(HAD_2，PF13419.5)(“结构域1”)和位于(SEQ ID NO:2的)40至187位的卤代酸脱卤酶样水解酶结构域(PF00702.25)(“结构域3”)。在包含具有磷酸酶活性的酶的酶超家族中发现了这些HAD样水解酶结构域。这些结构域可以在DfHAD的N端半部分中找到。

通过Pfam搜索分析，使用blastp在NCBI中发现的最高同一性是属于真菌的蛋白质的29％(覆盖率达99％)，该蛋白质包含一个假定的HAD样结构域。

附图说明

图1：补身烷，(+)-折叶苔醇和(-)-补身醇的结构。

图2：从香鳞毛蕨(Dryopteris fragrans)叶中获得的二氯甲烷提取物的GC/MS色谱图(仅显示倍半萜的区域)。箭头表示折叶苔醇峰。

图3：图2中的折叶苔醇峰的质谱图

图4：大肠杆菌(表达DfHAD)肉汤提取物的GC/MS色谱图(仅显示倍半萜的区域)。箭头表示折叶苔醇峰。

图5：图4中的折叶苔醇峰的质谱图。

图6：转染的烟草叶二氯甲烷提取物的GC/MS色谱图(仅显示倍半萜的区域)。箭头表示折叶苔醇的峰。

图7：图6中的折叶苔醇峰的质谱图

图8：DfHAD体外生化测定的样品GC色谱图

图9：包含I类和II类基序的推定萜合酶的氨基酸序列比对：本发明的DfHAD(SEQID NO:2)DfHAD-9(V274A)(SEQ ID NO:6)DfHAD-8(K532R)(SEQ ID NO:4)；如先前所述的CvTps1，LoTps1，OCH93767.1，EMD37666.1，EMD37666-B，XP_001217376.1，OJJ98394.1，GAO87501.1，XP_008034151.1，XP_007369631.1，ACg006372，KIA75676.1，XP_001820867.2，CEN60542.1，XP_009547469.1，KLO09124.1和OJI95797.1。实线是Pfam结构域1，虚线是Pfam结构域3。框内是经修饰的I类和II类基序以及其他基序III和IV。

图10：DfHAD的I类和II类基序中的工程突变列表。

图11：来自大肠杆菌提取物的提取离子381.1237的倍半萜二磷酸(上部)和单磷酸酯301.1574(下部)的色谱图。

图12：来自与FPP混合的经纯化DfHAD样品的提取离子381.1237的倍半萜二磷酸酯(上部)和单磷酸酯301.1574(下部)的色谱图。

具体实施方式

所使用的缩写

bp 碱基对

BAP 细菌碱性磷酸酶

kb 千碱基

DNA 脱氧核糖核酸

cDNA 互补DNA

DTT 二硫苏糖醇

FPP 法呢基二磷酸

GC 气相色谱

HAD 卤代酸脱卤酶

MS 质谱仪/质谱法

MVA 甲羟戊酸

PCR 聚合酶链反应

RNA 核糖核酸

mRNA 信使核糖核酸

miRNA 微RNA

siRNA 小干扰RNA

rRNA 核糖体RNA

tRNA 转移RNA

定义

就本申请目的而言，“折叶苔醇”涉及(+)-折叶苔醇(CAS：54632-04-1)。

就本申请目的而言，“补身醇”涉及(-)-补身醇(CAS：468-68-8)。

就本申请目的而言，“Ambrox”涉及IUPAC名称：(-)-(3aR,5aS,9aS,9bR)-3a,6,6,9a-四甲基十二氢萘并[2,1-b]呋喃(CAS：6790-58-5)。

术语“双功能萜合酶”或“具有双功能萜合酶活性的多肽”涉及一种多肽，其包含I类和II类合酶基序并且具有质子化起始的环化和电离起始的环化催化活性的双功能萜活性。(J.Schrader&J.Bohlman.Biotechnology of isoprenoids.Adv.Biochem.Eng.Biot.,148,1-475.(DOI:10.1007/978-3-319-20107-8))双功能萜合酶属于卤代酸脱卤酶样(HAD样)水解酶超家族，其包含对应于Pfam结构域PF13419.5(结构域1)和PF00702.25(结构域3)的结构域。

术语“补身烷倍半萜”涉及具有如图1所示的补身烷样碳骨架结构的萜烯。

术语“I类合酶”涉及催化由离子化引发的反应的萜合酶，例如单萜和倍半萜合酶。

术语“I类合酶基序”涉及包含保守的DDxx(D/E)基序的萜合酶的活性位点。该I类基序的天冬氨酸残基结合例如与二磷酸基团的结合有关的二价金属离子(最通常为Mg²⁺)，并催化底物的烯丙基二磷酸键的离子化和裂解。

术语“经修饰的I类合酶基序”涉及包含保守的DSFDxx(D/E)(SEQ ID NO:11)，特别是DSFDSLE(SEQ ID NO:13)基序的萜合酶的活性位点。

术语“II类合酶”涉及催化由质子化引发的环化反应的萜合酶，所述环化反应例如通常涉及三萜和赖百当烷(labdane)二萜的生物合成。在II类萜合酶中，质子化引发的反应可涉及例如酸性氨基酸将质子提供给末端双键。

术语“II类合酶基序”涉及包含保守的DxDD或DxD(T/S)T基序的萜合酶的活性位点。

术语“经修饰的II类合酶基序”涉及包含保守的HDxD(T/S)(SEQ ID NO:12)，特别是HDLDT(SEQ ID NO:14)基序或者基序DLDTTS(SEQ ID NO:23)的萜合酶的活性位点。

术语“折叶苔基二磷酸合酶”或“具有折叶苔基二磷酸合酶活性的多肽”或“折叶苔基二磷酸合酶蛋白”或“具有产生折叶苔基二磷酸的能力”涉及一种多肽，其能够从无环萜烯焦磷酸酯，特别是法呢基二磷酸(FPP)开始，催化任何立体异构体或其混合物形式的折叶苔基二磷酸的合成。折叶苔基二磷酸可以是唯一的产品，或者可以是倍半萜混合物的一部分。所述混合物可以包含任何比例，特别是占主要比例，并且更特别地如下所定义的实质比例的折叶苔基单磷酸和/或折叶苔醇。

如下所述，在“标准条件”下确定“折叶苔基二磷酸合酶活性”：可以使用重组折叶苔基二磷酸合酶表达宿主细胞，经破坏的折叶苔基二磷酸合酶表达细胞，它们的级分或富集或纯化的折叶苔基二磷酸合酶的酶来确定它们，条件是在大约20至45℃，例如大约25至40℃，优选25至32℃的温度下，在pH值为6至11，优选为7至9的培养基或反应介质(优选经缓冲的)中，并在存在参考底物(尤其是FPP)的情况下，以1至100μM，优选5至50μM，尤其是30至40μM的初始浓度添加，或由细胞宿主内源产生。形成折叶苔基二磷酸的转化反应进行10分钟至5小时，优选约1至2小时。如果不存在内源性碱性磷酸酶，则将一种或多种外源性磷酸酶添加到反应混合物中，以转化由合酶形成的折叶苔基二磷酸。然后可以用常规方法，例如在用有机溶剂如乙酸乙酯萃取后确定折叶苔醇。合适的标准条件的特定例子在下文的实验部分如实施例5中应用，这些条件也应构成本发明总体公开的一部分。

术语“生物学功能”，“功能”，“生物学活性”或“活性”是指如本文所述的萜合酶催化形成如下物质的能力：折叶苔基二磷酸和/或折叶苔醇或化合物的混合物，其包含折叶苔基二磷酸，和/或折叶苔基单磷酸和/或折叶苔醇和/或一种或多种其他萜烯，特别是折叶苔基二磷酸。

术语“磷酸酶”或“具有磷酸酶活性”的多肽涉及一种多肽，其能够催化磷酸的酯裂解成磷酸根和相应的醇。取决于各自的最佳pH，该酶可以是碱性磷酸酶(E.C.3.1.3.1)或酸性磷酸酶(E.C.3.1.3.2)。特别地，根据本发明，可以应用不同来源，更特别是细菌来源的碱性磷酸酶。所应用的磷酸酶应该能够从相应的单磷酸酯或二磷酸酯产生补身烷的醇，例如折叶苔醇和/或补身醇。

术语“萜烯的混合物”或“倍半萜的混合物”是指萜烯或倍半萜的混合物，其包含折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇，并且还可以包含一种或多种另外的萜烯或一种或多种另外的倍半萜。

“甲羟戊酸途径”(也称为“异戊二烯途径”或“HMG-CoA还原酶途径”)是真核生物、古菌和某些细菌中必不可少的代谢途径。甲羟戊酸途径始于乙酰辅酶A，产生两个五碳结构单元，称为异戊烯基焦磷酸(IPP)和二甲基烯丙基焦磷酸(DMAPP)。关键酶是乙酰乙酰基-CoA硫解酶(atoB)，HMG-CoA合酶(mvaS)，HMG-CoA还原酶(mvaA)，甲羟戊酸激酶(MvaK1)，磷酸甲羟戊酸激酶(MvaK2)，甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基焦磷酸异构酶(idi)。将甲羟戊酸途径与酶活性结合以产生萜烯前体GPP、FPP或GGPP，特别是FPP合酶(ERG20)，允许重组细胞生产萜烯。

如本文所用，术语“宿主细胞”或“经转化的细胞”是指一种细胞(或生物)，其被改变以携带(harbor)至少一个核酸分子，例如，编码所需蛋白质或核酸序列的重组基因，其在转录时产生本发明的功能性多肽，即，一种折叶苔基二磷酸合酶蛋白，其可用于产生折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇或相应的含有折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇的萜烯混合物。宿主细胞特别是细菌细胞、真菌细胞或植物细胞或植物。宿主细胞可含有已整合到宿主细胞的核或细胞器基因组中的重组基因。或者，宿主可以在染色体外含有重组基因。

术语“生物”是指任何非人的多细胞或单细胞生物，例如植物或微生物。特别地，微生物是细菌、酵母、藻类或真菌。

术语“植物”可互换使用以包括植物细胞，包括植物原生质体，植物组织，产生再生植物或植物部分的植物细胞组织培养物，或植物器官诸如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。

当特定的生物或细胞天然地产生FPP或当其不天然地产生FPP但是用本文所述的核酸转化以产生FPP时意味着“能够产生FPP”。经转化以比天然存在的生物或细胞产生更高量的FPP的生物或细胞也被“能够产生FPP的生物或细胞”所涵盖。

当特定的生物或细胞天然地产生折叶苔基二磷酸时，或者当其不天然地生成折叶苔基二磷酸而是用本文所述的核酸转化以产生折叶苔基二磷酸时，则该特定的生物或细胞“能够产生折叶苔基二磷酸”。经转化以比天然存在的生物或细胞产生更高量的折叶苔基二磷酸的生物或细胞也被“能够产生折叶苔基二磷酸的生物或细胞”所涵盖。

当特定的生物或细胞天然地产生折叶苔醇时，或者当其不天然地生成折叶苔醇而是用本文所述的核酸转化以产生折叶苔基二磷酸，并且可选地用核酸进一步转化以产生酶活性，将折叶苔基二磷酸转化为折叶苔醇时，则该特定的生物或细胞“能够产生折叶苔醇”。经转化以比天然存在的生物或细胞产生更高量的折叶苔醇的生物或细胞也被“能够产生折叶苔醇的生物或细胞”所涵盖。

对于本文的说明书和所附权利要求，除非另有说明，否则“或”的使用意味着“和/或”。类似地，各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。

应进一步理解，在各种实施方案的描述使用术语“包含”的情况下，本领域技术人员将理解，在一些特定情况下，可以使用“基本上由……组成”或“由……组成”的语言来替代地描述实施方案。

本文所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含其他不同化合物(本发明化合物通常以其天然状态与其缔合)的状态，因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5％、1％、5％、10％或20％，或至少50％或75％。在一个实施方案中，这些术语是指本发明的化合物占给定样品质量按重量计至少95％、96％、97％、98％、99％或100％。如本文所用，当提及核酸或蛋白质时，核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”也指一种纯化或浓缩状态，其不同于天然存在于例如原核或真核环境中，例如在细菌或真菌细胞中，或哺乳动物特别是人体中的状态。任何纯化程度或浓度，只要大于天然存在的纯化或浓缩程度，包括(1)从其他相关结构或化合物中的纯化，或(2)与在所述原核或真核环境中通常不相关的结构或化合物的缔合，都在“分离的”含义内。根据本领域技术人员已知的各种方法和工艺，本文所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的，或如若不然与它们通常在性质上不相关的结构或化合物相缔合。

在本文提供的说明书和所附权利要求的上下文中，除非另有说明，否则“或”的使用意味着“和/或”。

类似地，各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。

术语“约”表示所述值的±25％的可能变化，特别是±15％、±10％、更特别是±5％、±2％或±1％。

术语“基本上”描述的值范围为约80至100％，例如85至99.9％，特别是90至99.9％，更特别是95至99.9％，或98至99.9％，尤其是99至99.9％。

“主要地”是指大于50％的范围内的比例，例如在51％至100％的范围内，特别是在75％至99.9％的范围内；尤其是85至98.5％，例如95至99％。

在本发明的上下文中，“主要产物”表示单一化合物或一组至少2种化合物，例如2、3、4、5或更多种，特别是2或3种化合物，该单一化合物或一组化合物“主要”是通过本文所述的反应制备的，并且基于由所述反应形成的产物的成分的总量，以主要比例包含在所述反应中。所述比例可以是摩尔比例，重量比例，或者优选基于色谱分析，由反应产物的相应色谱图计算的面积比例。

在本发明的上下文中，“副产物”表示单一化合物或一组至少2种化合物，例如2、3、4、5或更多种，特别是2或3种化合物，该单一化合物或一组化合物并非“主要”是通过本文所述的反应制备的。

由于酶促反应的可逆性，除非另有说明，否则本发明涉及在两个反应方向上本文所述的酶促或生物催化反应。

本文描述的多肽的“功能突变体”包括如下定义的此类多肽的“功能等同物”。

术语“立体异构体”特别包括构象异构体。

根据本发明，通常包括本文描述的化合物的所有“立体异构形式”，例如结构异构体，尤其是立体异构体及其混合物，例如旋光异构体或几何异构体，例如E和Z异构体，以及它们的组合。如果在一个分子中存在几个不对称中心，则本发明包括这些不对称中心的不同构象的所有组合，例如对映异构体对。

“立体选择性”描述了产生立体异构纯形式的化合物的特定立体异构体的能力或以本文所述的酶催化方法从多种立体异构体中特异性转化特定立体异构体的能力。更具体而言，这意味着本发明的产物相对于特定的立体异构体富集，或者离析物相对于特定的立体异构体可以贫化。这可以通过根据下式计算的纯度％ee参数进行量化：

％ee＝[X_A-X_B]/[X_A+X_B]*100，

其中X_A和X_B代表立体异构体A和B的摩尔比(Molenbruch)。

术语“有选择地转化”或“增加选择性”通常是指，在所述反应的整个过程期间(即在反应的起始和终止之间)，在所述反应的某个时间点，或在所述反应的“一段”期间，特定的立体异构形式例如E-形式的不饱和烃以比相应的其他立体异构体形式例如Z-形式更高的比例或量(以摩尔为基准对比)被转化。特别地，在“一段”期间可以观察到所述选择性对应于底物初始量的1至99％，2至95％，3至90％，5至85％，10至80％，15至75％，20至70％，25至65％，30至60％，或40至50％的转化率。所述更高的比例或量可以例如以以下方式表示：

-在整个反应过程或其所述一段期间观察到的较高的异构体最大收率；

-在确定的底物转化率值百分比下，较高的异构体相对含量；和/或

-在较高的转化率值百分比下，相同的异构体相对含量；

其中的每一种优选相对于参考方法来观察，所述参考方法在其他相同条件下用已知化学或生物化学方法进行。

根据本发明，通常包括本文描述的化合物的所有“异构体形式”，例如结构异构体，尤其是立体异构体及其混合物，例如旋光异构体或几何异构体，例如E和Z异构体，以及它们的组合。如果在一个分子中存在几个不对称中心，则本发明包括这些不对称中心的不同构象的所有组合，例如对映异构体对，或立体异构体形式的任何混合形式。

根据本发明的反应的“收率”和/或“转化率”是在例如4、6、8、10、12、16、20、24、36或48小时的规定时间段内(反应在该段时间内进行)确定的。特别地，反应在精确定义的条件下进行，例如在本文定义的“标准条件”下进行。

不同的收率参数(“收率”或YP/S；“比生产率收率”；或时空收率(STY))在本领域中是众所周知的，并且如文献所述进行测定。

“收率”和“YP/S”(均以所生产的产品质量/所消耗的材料质量表示)在本文中用作同义词。

比生产率收率(specific productivity-yield)描述了每小时每L发酵液每克生物质所生产的产物的量。用WCW表示的湿细胞重量描述了生化反应中具有生物活性的微生物的数量。该值以每g WCW每小时的产品g数给出(即g/gWCW^-1h^-1)。可替代地，生物质的数量也可以表示为干的细胞重量的量，表示为DCW。此外，通过测量600nm(OD₆₀₀)处的光密度和使用实验确定的相关因子分别估算相应的湿细胞或干的细胞重量，可以更轻松地确定生物质浓度。

术语“发酵产生”或“发酵”是指微生物(由所述微生物所包含或由其产生的酶活性辅助)在细胞培养物中利用添加到温育中的至少一种碳源产生化合物的能力。

术语“发酵液”应理解为是指一种液体，特别是水性溶液或水性/有机溶液，其基于发酵工艺并且未进行或进行了例如本文所述的后处理(work up)。

“酶催化”或“生物催化”方法是指所述方法在酶(包括本文所定义的酶突变体)的催化作用下进行。因此，该方法可以在分离形式的(纯化的、富集的)或粗制形式的所述酶的存在下，或者在细胞系统的存在下进行，所述细胞系统特别是包含活性形式的所述酶并具有如本文所公开的催化转化反应能力的天然或重组微生物细胞。

如果本公开涉及不同优先程度的特征、参数及其范围(包括上位的，非明确优选的特征、参数及其范围)，则除非另有说明，否则这些特征、参数和范围中的两个或更多个的任意组合与它们各自的优选程度无关地涵盖在本发明的公开内容中。

详细说明

a.本发明的特定实施方案

本发明具体涉及以下实施方案：

1.一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽，或其变体或突变体，其具有环萜合酶活性，其中所述多肽包含：

a.SEQ ID NO:11所示的经修饰的I类合酶基序(DSFDxx(D/E))，其对应于SEQ IDNO:2的序列位置174至180，其中x可以是任何天然存在的氨基酸残基，并且优选选自S和L，特别是SEQ ID NO:13的基序；和

b.经修饰的I类基序的C末端，SEQ ID NO:12所示的经修饰的II类合酶基序(HDxD(T/S)，其对应于SEQ ID NO:2的序列位置366至370，其中x可以是任何天然存在的氨基酸残基，并且优选代表L，特别是SEQ ID NO:14的基序；和

c.可选地，至少一种选自以下的其他序列基序：

i.SEQ ID NO:2的86至195位的部分序列；和

ii.SEQ ID NO:2的40至187位的部分序列。

在一个特定的实施方案中，提供了一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽，或其变体或突变体，其具有环萜合酶活性，其中所述多肽包含：

a.SEQ ID NO:13所示的经修饰的I类合酶基序，其对应于SEQ ID NO:2的序列位置174至180，和

b.经修饰的I类基序的C末端，SEQ ID NO:14所示的经修饰的II类合酶基序，期对应于SEQ ID NO:2的序列位置366至370，和

c.至少一种选自以下的其他序列基序：

i.SEQ ID NO:2的86至195位的部分序列；和

ii.SEQ ID NO:2的40至187位的部分序列。

在上述实施方案的替代方案中，所述经修饰的II类合酶基序也可以是SEQ ID NO:23的基序(即DLDTTS)，其对应于SEQ ID NO:2的序列位置367至372。

替代于或除了上述一个或多个序列基序之外，具有环萜合酶活性的卤代酸脱卤酶样(HAD样)水解酶超家族或其变体或突变体的分离的多肽还可包含：

-序列基序III：QCKSKGCW(SEQ ID NO:24)，其对应于SEQ ID NO:2的序列位置542至549，和/或

-序列基序IV：DGILQVYFDVERPRIDPVVVAN(SEQ ID NO:25)，其对应于SEQ ID NO:2的序列位置404至424。

序列基序III可以进一步修饰为基序：QCEDGGW(SEQ ID NO:27)，其中N端部分序列基序QCE可以修饰为：QCQ，QCK，QCA，QCD，QCG，QQN，QDE，QED或QET，并且独立于此，C末端部分序列基序“GGW”可以改变为GGF或GSW。

2.实施方案1的多肽，其具有特别是从作为底物的法呢基二磷酸(FPP)产生补身烷倍半萜和/或其磷酸酯衍生物，例如单磷酸酯，更特别是其二磷酸酯衍生物的能力。

3.实施方案2的多肽，其具有从作为底物的法呢基二磷酸(FPP)产生折叶苔基磷酸酯衍生物，例如单磷酸酯，更特别是折叶苔基二磷酸的能力。

4.一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽，其具有环萜合酶活性，其中所述多肽是包含SEQ ID NO:2的氨基酸序列的DfHAD，或其突变体或天然变体，其包含与SEQ ID NO:2具有至少40％，45％，50％，55％，60％，65％，70％，75％，80％，85％，90％，95％，96％，97％，98％或99％序列同一性的氨基酸序列，并保留所述萜合酶活性。

5.实施方案4的多肽，其具有特别是从作为底物的法呢基二磷酸(FPP)产生补身烷倍半萜和/或其磷酸酯衍生物，例如单磷酸酯，更特别是其二磷酸酯衍生物的能力。

6.实施方案5的多肽，其具有从作为底物的法呢基二磷酸(FPP)产生折叶苔基磷酸酯衍生物，例如单磷酸酯，更特别是折叶苔基二磷酸的能力。

7.前述实施方案之一的多肽，其是从鳞毛蕨属(Dryopteris)的植物，特别是香鳞毛蕨(Dryopteris fragrans)种的植物或其他植物或蕨类物种中分离的。

8.一种分离的多肽，其特别是实施方案1至4中任一项的DfHAD的天然变体，其选自：

a.DfHAD-9(V274A)，其在SEQ ID NO:2的274位或与SEQ ID NO:2具有至少40％，45％，50％，55％，60％，65％，70％，75％，80％，85％，90％，95％，96％，97％，98％或99％序列同一性的氨基酸序列中包含氨基酸取代(V274A)；和

b.DfHAD-8(K532R)，其在SEQ ID NO:2的532位或与SEQ ID NO:2具有至少40％，45％，50％，55％，60％，65％，70％，75％，80％，85％，90％，95％，96％，97％，98％或99％序列同一性的氨基酸序列中包含氨基酸取代(K532R)。

9.实施方案4至8中任一项的多肽，其进一步包含：

b.经修饰的I类合酶基序I的C端，SEQ ID NO:12所示的经修饰的II类合酶基序(HDxD(T/S)，其对应于SEQ ID NO:2的序列位置366至370，其中x可以是任何天然存在的氨基酸残基，并且优选代表L，特别是SEQ ID NO:14的基序；和

c.以及可选地，选自以下的至少一种其他序列基序：

i.SEQ ID NO:2的86至195位的部分序列；和

ii.SEQ ID NO:2的40至187位的部分序列。

在一个特定的实施方案中，提供了一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽，或其变体或突变体，其具有环萜合酶活性，其中所述多肽还包含：

a.SEQ ID NO:13所示的修饰的I类合酶基序，其对应于SEQ ID NO:2的序列位置174至180，和

c.至少一种选自以下的其他序列基序：

i.SEQ ID NO:2的86至195位的部分序列；和

ii.SEQ ID NO:2的40至187位的部分序列。

10.实施方案8和9之一的多肽，其选自：

a.DfHAD-9(V274A)，其包含SEQ ID NO:6的氨基酸序列；

b.DfHAD-8(K532R)，其包含SEQ ID NO:4的氨基酸序列；和

c.DfHAD-QW真菌，其包含SEQ ID NO:19的氨基酸序列。

11.前述实施方案中任一项的多肽，其催化(无环)法呢基二磷酸(特别是(2E,6E)-3,7,11-三甲基十二碳-2,6,10-三烯-1-焦磷酸；FPP)的转化生成折叶苔基磷酸酯衍生物，如单磷酸酯，更特别是折叶苔基二磷酸，优选选择性>50％。

12.前述实施方案中任一项的多肽，其

a.包含选自SEQ ID NO:2、4和6的氨基酸序列；或

b.由核酸分子编码，该核酸分子包含选自SEQ ID NO:1、3、5、7、8、9和10的编码核苷酸序列。

13.一种分离的核酸分子，其

a.包含编码前述实施方案中任一项所述多肽的核苷酸序列；或

b.包含选自SEQ ID NO:1、3、5、7、8、9和10的核苷酸序列，或与SEQ ID NO:1、3、5、7、8、9或10的核苷酸序列具有至少40％，45％，50％，55％，60％，65％，70％，75％，80％，85％，90％，95％，96％，97％，98％或99％的序列同一性，并编码具有萜合酶活性的卤代酸脱卤酶样(HAD样)水解酶超家族的多肽，该多肽特别是具有产生补身烷倍半萜和/或其磷酸酯衍生物，例如单磷酸酯，更特别是其二磷酸酯衍生物的能力，更特别是具有从作为底物的法呢基二磷酸(FPP)产生折叶苔基磷酸酯衍生物，例如单磷酸酯，更特别是折叶苔基二磷酸的能力，或

c.包含核苷酸序列，该核苷酸序列包含与b.的序列之一互补的序列；或

d.包含在严格条件下与a.、b.或c.的核苷酸序列杂交的核苷酸序列。

在一个特定的实施方案中，核酸可以天然存在于鳞毛蕨属(Dryopteris)的植物中，例如香鳞毛蕨(Dryopteris fragrans)种的植物或其他植物或蕨类物种中，或者通过修饰SEQ ID NO:1、3、5、7、8、9或10或其反向互补序列而获得。

在另一个实施方案中，核酸是从鳞毛蕨属(Dryopteris)，例如香鳞毛蕨(Dryopteris fragrans)种的植物分离的或衍生的。

14.一种表达构建体，其包含至少一种实施方案13的核酸分子。

15.一种载体，其包含至少一种实施方案13的核酸分子或至少一种实施方案14的表达构建体。

16.实施方案15的载体，其中该载体是原核、病毒或真核载体。

17.实施方案15或16的载体，其中该载体是表达载体。

18.实施方案15至17中任一项的载体，其是质粒载体。

19.一种重组宿主细胞或重组非人宿主生物，其包含：

a.至少一种实施方案13的分离的核酸分子，其可选地稳定地整合到基因组中；或

b.至少一种实施方案14的表达构建体，其可选地稳定地整合到基因组中；或

c.至少一种实施方案15至18中任一项的载体。

20.实施方案19的宿主细胞或宿主生物，其选自原核或真核微生物或衍生自它们的细胞。

21.实施方案20的宿主细胞或宿主生物，其选自细菌细胞、真菌细胞和植物细胞，或植物。

22.实施方案21的宿主细胞或宿主生物，其中所述真菌细胞是酵母细胞。

23.实施方案21的宿主细胞或宿主生物，其中所述细菌细胞选自埃希氏菌(Escherichia)属，特别是大肠杆菌(E.coli)种，并且所述酵母选自酵母(Saccharomyces)属或毕赤酵母(Pichia)属，特别是选自酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia pastoris)种

这些宿主细胞或生物中的某些不能天然产生FPP。为了适合于实施本文所述的实施方案的方法，天然地不产生无环萜焦磷酸酯前体例如FPP的生物或细胞被基因修饰以产生所述前体。例如，它们可以在用根据以上任何一个实施方案所述的核酸修饰之前或同时如此转化。转化生物以使其产生无环萜焦磷酸酯前体例如FPP的方法在现有技术中是已知的。例如，引入甲羟戊酸途径的酶活性是使生物产生FPP的合适策略。

24.一种产生至少一种根据实施方案1至12中任一项所述的催化活性多肽的方法，该方法包括：

a.培养实施方案19的非人宿主生物或宿主细胞以表达或过表达至少一种根据实施方案1至12中任一项所述的多肽；和

b.可选地，从步骤a中培养的非人类宿主细胞或生物中分离多肽。

25.实施方案24的方法，其还包括在步骤a)之前，用至少一种根据实施方案13的核酸，至少一种实施方案14的构建体或至少一种实施方案15至18中任一项的载体来转化非人宿主生物或细胞，使其表达或过表达根据实施方案1至12中任一项的多肽。

26.一种制备具有萜合酶活性的突变多肽的方法，该突变多肽特别是具有产生补身烷倍半萜和/或其磷酸酯衍生物的能力，例如单磷酸酯，更特别地其二磷酸酯衍生物的能力，以及更特别是具有从作为底物的法呢基二磷酸(FPP)产生折叶苔基磷酸酯衍生物，例如单磷酸酯，更特别是折叶苔基二磷酸的能力，该方法包括以下步骤：

a.选择根据实施方案13的核酸分子；

b.修饰所选择的核酸分子以获得至少一种突变核酸分子；

c.用该突变核酸序列转化宿主细胞或单细胞宿主生物以表达由该突变核酸序列编码的多肽；

d.筛选表达产物中至少一种包含萜合酶活性的突变体，该突变体特别是具有产生补身烷倍半萜和/或其磷酸酯衍生物的能力，例如单磷酸酯，更特别地其二磷酸酯衍生物的能力，以及更特别是具有从作为底物的法呢基二磷酸(FPP)产生折叶苔基磷酸酯衍生物，例如单磷酸酯，更特别是折叶苔基二磷酸的能力；和

e.可选地，如果多肽不具有所需的突变活性，则重复步骤a.到d.直至获得具有所需突变活性的多肽；和

f.可选地，如果在步骤d.中鉴定出具有所需突变活性的多肽，则分离在步骤c.中获得的相应突变核酸。

27.一种生产补身烷倍半萜特别是折叶苔醇的方法，包括：

a.使法呢基二磷酸(FPP)与实施方案1至12中任一项所定义的多肽，与根据实施方案24或25制备的多肽，或与根据实施方案26制备的突变多肽接触，从而获得至少一种磷酸酯，特别是补身烷倍半萜的二磷酸酯，特别是折叶苔基磷酸酯，更特别是折叶苔基二磷酸；

b.以化学或酶促方式裂解所述产物的磷酸酯部分，特别是二磷酸酯部分；和

c.可选地，分离出该补身烷倍半萜，特别是折叶苔醇。

在一个特定的实施方案中，可以通过施加磷酸酶，更特别地是酸或碱性磷酸酶，来酶解该磷酸酯部分。优选不同来源的碱性磷酸酶，如细菌酶。合适的磷酸酶是可商购的酶。

28.实施方式27的方法，其中，该补身烷倍半萜包含折叶苔醇，优选作为主要产物。

29.实施方案27和28中任一项的方法，其包括提供，特别是用至少一种实施方案13的核酸，至少一种实施方案14的构建体或至少一种实施方案15至16中任一项的载体来转化非人宿主生物或宿主细胞，使得其表达或过表达根据实施方案1至12中任一项的多肽。

30.实施方案27至29中任一项的方法，其中使FPP与非人宿主生物或宿主细胞接触，与其细胞裂解物，或与含有所述非人宿主生物宿主细胞的培养基接触，和/或与实施方案1至12中任一项所定义的多肽接触，该多肽从非人宿主生物或宿主细胞，细胞裂解物或培养基分离。

31.实施方案30的方法，其中所述补身烷倍半萜是由所述非人宿主生物或宿主细胞以发酵方式产生的。

32.实施方案30的方法，其中所述补身烷倍半萜是通过酶促方法产生的，包括用实施方案1至12中任一项的分离的多肽转化FPP，该步骤可选地在其他佐剂存在下进行。

33.实施方案1至12中任一项所定义的多肽在制备气味剂、调味剂或芳香剂成分特别是Ambrox中的用途。

34.根据实施方案27至32中任一项所制备的补身烷倍半萜在制备气味剂、调味剂或芳香剂成分特别是Ambrox中的用途。

35.一种产生Ambrox的方法，该方法包括：

a.通过实施方案27至32中任一项所述的实施方案中任一项的方法提供折叶苔醇，

b.可选地，分离步骤a.中产生的折叶苔醇；和

c.以本身已知的方式将折叶苔醇转化为Ambrox，例如在Tetrahedron:Asymmetry11(2000)1375-1388中报道的那样。

36.一种组合物，其包含根据实施方案34或35制备的物质。

37.根据实施方案36的组合物，其是从由以下构成的群组中选出的：

a.身体护理组合物

b.家庭护理组合物

c.芳香剂组合物。

除非另有说明，否则在“至少40％，45％，50％，55％，60％，65％，70％，75％，80％，85％，90％，95％，96％，97％，98％或99％序列同一性”的范围程度中，特别的值至少为60％，65％，70％，75％，80％，85％，90％，95％，96％，97％，98％或99％的序列同一性，而至少80％，85％，90％，95％，96％，97％，98％或99％序列同一性的值甚至是更特别。

b.根据本发明适用的多肽

在本文语境中，以下定义适用：

可以互换使用的通用术语“多肽”或“肽”是指天然的或合成的，连续的、肽方式连接的氨基酸残基的线性链或序列，其包含约10个至多于1000个残基。具有最多30个残基的短链多肽也被称为“寡肽”。

术语“蛋白(质)”是指由一种或多种多肽组成的大分子结构。其多肽的氨基酸序列代表蛋白质的“一级结构”。氨基酸序列还通过形成特殊的结构元素(例如在多肽链中形成的α-螺旋和β-折叠结构)来预先确定蛋白质的“二级结构”。多个这样的二级结构元件的排列定义了蛋白质的“三级结构”或空间排列。如果蛋白质包含多于一个的多肽链，则所述链在空间上排列形成蛋白质的“四级结构”。蛋白质正确的空间排列或“折叠”是蛋白质功能的前提。变性或展开会破坏蛋白质功能。如果这种破坏是可逆的，则可以通过重新折叠来恢复蛋白质功能。

本文所指的典型的蛋白质功能是“酶功能”，即蛋白质在底物例如化合物上充当生物催化剂，并催化所述底物向产物的转化。酶可以显示高或低程度的底物和/或产物特异性。

因此，本文中被称为具有特定“活性”的“多肽”隐含地是指正确折叠的蛋白质，其显示出所指示的活性，例如特定的酶活性。

因此，除非另有说明，否则术语“多肽”也涵盖术语“蛋白质”和“酶”。

类似地，术语“多肽片段”涵盖术语“蛋白质片段”和“酶片段”。

术语“分离的多肽”是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从其天然环境中取出的氨基酸序列。

“靶肽”是指一种氨基酸序列，其将蛋白质或多肽靶向细胞内细胞器(即，线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列，或者可以被用来替换天然靶向多肽。

本发明还涉及本文具体描述的多肽的“功能等同物”(也称为“类似物”或“功能突变”)。

例如，“功能等同物”是指一种多肽，其在用于确定酶促折叶苔基二磷酸合酶活性的测试中，显示与本文具体描述的多肽相比，至少高或低1至10％、或至少20％、或至少50％、或至少75％、或至少90％的折叶苔基二磷酸合酶活性。

根据本发明，“功能等同物”还涵盖特定的突变体，其在本文所述的氨基酸序列的至少一个序列位置中具有与具体陈述的氨基酸不同的氨基酸，但是仍然具有上述生物活性之一，例如酶活性。因此，“功能等同物”包括可通过一个或多个，例如1至20个、1至15个或5至10个氨基酸的添加、取代特别是保守取代、缺失和/或倒置而获得的突变体，其中所述变化可以在任何序列位置上发生，只要它们导致突变体具有本发明特性的概貌。还特别地提供功能等同性，如果活性模式与在突变体和未改变的多肽之间定性地重合，即，如果例如观察到与相同的激动剂或拮抗剂或底物的相互作用，但是速率不同(即，通过EC₅₀或IC₅₀值或任何本技术领域合适的其他参数来表示)。下表显示了合适的(保守)氨基酸取代的例子：

上述意义上的“功能等同物”也是本文所述多肽的“前体”，以及所述多肽的“功能衍生物”和“盐”。

在该情况下，“前体”是具有或不具有所期望生物活性的多肽的天然或合成前体。

表述“盐”是指根据本发明的蛋白质分子的羧基的盐以及氨基的酸加成的盐。羧基的盐可以已知的方式生产，包括无机盐，例如钠、钙、铵、铁和锌盐，以及与有机碱例如胺，如三乙醇胺、精氨酸、赖氨酸、哌啶等形成的盐。酸加成的盐，例如与无机酸例如盐酸或硫酸形成的盐，以及与有机酸例如乙酸和草酸形成的盐，也被本发明所涵盖。

根据本发明的多肽的“功能衍生物”还可以使用已知技术在功能性氨基酸侧基或它们的N末端或C末端产生。这样的衍生物包括例如：羧酸基的脂族酯，羧酸基的酰胺，它们可通过与氨或与伯或仲胺反应获得；游离氨基的N-酰基衍生物，其通过与酰基反应生成；或游离羟基的O-酰基衍生物，其通过与酰基反应生成。

“功能等同物”自然也包括可以从其他生物体获得的多肽以及天然存在的变体。例如，可以通过序列比较来确定同源序列区域的面积，并且等同的多肽可以基于本发明的具体参数来确定。

“功能等同物”还包含根据本发明的多肽的“片段”，例如单个结构域或序列基序，或N末端和/或C末端截短的形式，其可以显示或可以不显示期望的生物学功能。优选地，这样的“片段”至少定性地保持期望的生物学功能。

此外，“功能等同物”是融合蛋白，其具有本文所述的多肽序列之一或由其衍生的功能等同物，以及在功能性N-末端或C-末端缔合(即，没有融合蛋白部分的实质性相互功能受损)中具有至少一个另外的功能不同的异源序列。这些异源序列的非限制性例子是例如信号肽、组氨酸锚或酶。

根据本发明还包括的“功能等同物”是与具体公开的多肽的同源物。它们与具体公开的氨基酸序列具有至少60％，优选至少75％，特别是至少80或85％，例如90、91、92、93、94、95、96、97、98或99％的同源性(或同一性)，其通过Pearson and Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算。根据本发明的同源多肽的以百分比表示的同源性或同一性尤其是指基于本文具体描述的氨基酸序列之一的总长度，以氨基酸残基的百分比表示的同一性。

以百分比表示的同一性数据也可以借助于BLAST比对，算法blastp(蛋白质-蛋白质BLAST)或通过应用本文下面详述的Clustal设置来确定。

在可能的蛋白质糖基化的情况下，根据本发明的“功能等同物”包括本文所述的去糖基化或糖基化形式的多肽，以及可以通过改变糖基化模式获得的经修饰形式。

根据本发明的多肽的功能等同物或同源物可以通过诱变产生，例如通过点突变，延长或缩短蛋白质或如下文更详细描述。

根据本发明的多肽的功能等同物或同源物可以通过筛选突变体例如缩短的突变体的组合数据库来鉴定。例如，蛋白质变体的多样性数据库可以通过在核酸水平上的组合诱变，例如通过合成寡核苷酸混合物的酶促连接来产生。有许多方法可用于从简并寡核苷酸序列产生潜在同源物的数据库。简并基因序列的化学合成可以在自动DNA合成仪中进行，然后可以将合成基因连接在合适的表达载体中。简并基因组的使用使得可以提供混合物中的所有序列，其编码所需的潜在蛋白质序列集合。简并寡核苷酸的合成方法是本领域技术人员已知的。

在现有技术中，已知几种技术用于筛选通过点突变或缩短产生的组合数据库的基因产物，以及用于筛选具有选定性质的基因产物的cDNA文库。这些技术可以适用于快速筛选通过根据本发明的同源物的组合诱变产生的基因库。最常用于筛选大型基因库的基于高通量分析的技术包括在可复制的表达载体中克隆基因库，用所得载体数据库转化合适的细胞，以及在特定条件下表达组合基因，在所述条件下，所需活性的检测促进编码基因(其产物被检测)的载体的分离。递归整合诱变(REM)是一种提高数据库中功能突变体频率的技术，其可以与筛选测试结合使用，以鉴定同源物。

本文提供的实施方案提供了本文公开的多肽的直系同源物和旁系同源物，以及用于鉴定和分离此类直系同源物和旁系同源物的方法。术语“直系同源物”和“旁系同源物”的定义在下面给出，并适用于氨基酸和核酸序列。

c.根据本发明适用的编码核酸序列

在本文语境中，以下定义适用：

术语“核酸序列”、“核酸”、“核酸分子”和“多核苷酸”可互换使用，是指核苷酸的序列。核酸序列可以是任意长度的单链或双链脱氧核糖核苷酸或核糖核苷酸，并且包括基因的编码和非编码序列、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成的DNA和RNA序列、片段、引物和核酸探针。技术人员了解RNA的核酸序列与DNA序列相同，差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。术语“核苷酸序列”也应理解为包含单独的片段形式或作为较大核酸组分的多核苷酸分子或寡核苷酸分子。

“分离的核酸”或“分离的核酸序列”是指一种核酸或核酸序列，其所处的环境与天然产生的核酸或核酸序列所处的环境不同，并且可以包括基本上不含污染内源性物质的那些。

如本文使用的应用于核酸的术语“天然产生的”是指一种核酸，其在自然界的生物的细胞中发现，并且未经人类在实验室中进行有意的修饰。

多核苷酸或核酸序列的“片段”是指连续的核苷酸，其特别是本文一个实施方案的多核苷酸长度的至少15bp，至少30bp，至少40bp，至少50bp和/或至少60bp。特别地，多核苷酸的片段包含本文一个实施方案的多核苷酸的至少25个，更特别是至少50个，更特别是至少75个，更特别是至少100个，更特别是至少150个，更特别是至少200个，更特别是至少300个，更特别是至少400个，更特别是至少500个，更特别是至少600个，更特别是至少700个，更特别是至少800个，更特别是至少900个，更特别是至少1000个连续核苷酸。不受限制，本文的多核苷酸的片段可以用作PCR引物和/或探针，或用于反义基因沉默或RNAi。

如本文所用，术语“杂交”或在一定条件下杂交旨在描述杂交和洗涤的条件，在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70％、例如至少约80％、和例如至少约85％、90％或95％同一性的序列保持彼此结合。下文提供了低严格度、中等和高严格度杂交条件的定义。本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols in Molecular Biology,John Wiley&Sons,sections 2,4,and6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外，严格条件在Sambrook等人(1989,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring HarborPress,chapters 7,9,and 11)中描述。

“重组核酸序列”是通过使用实验室方法(例如分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列，由此创造出或修饰出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。

“重组DNA技术”是指用于制备重组核酸序列的分子生物学方法，例如描述于由Weigel和Glazebrook编辑的Laboratory Manuals，2002,Cold Spring Harbor Lab Press；和Sambrook等，1989Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press。

术语“基因”是指一种DNA序列，其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此，基因可以包含几个可操作地连接的序列，诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。

“多顺反子”是指可以在同一核酸分子内分别编码多于一个多肽的核酸分子，特别是mRNA。

“嵌合基因”是指通常不能在自然界的物种中发现的任何基因，特别是这样一种基因，其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如，启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体，其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义，由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。

“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列，其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号，例如AAUAAA或其变体。在转录终止后，mRNA转录物可以在多聚腺苷酸化信号的下游切去，并且可以添加poly(A)尾，其参与了mRNA向翻译位点例如细胞质的转运。

术语“引物”是指短的核酸序列，其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。

术语“可选择标记”是指在表达后能够被用来选择包括该可选择标记的一种或多种细胞的任何基因。以下描述了可选择标记的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂可选择标记可适用于不同的目标物种。

本发明还涉及编码如本文定义的多肽的核酸序列。

特别地，本发明还涉及编码上述多肽之一及其功能等同物的核酸序列(单链和双链DNA和RNA序列，例如cDNA、基因组DNA和mRNA)，其可以通过例如使用人工核苷酸类似物来获得。

本发明既涉及分离的核酸分子，其编码根据本发明的多肽或其生物学活性区段，又涉及核酸片段，其可用作例如鉴定或扩增根据本发明的编码核酸的杂交探针或引物。

本发明还涉及与本文具体公开的序列具有一定程度的“同一性”的核酸。两个核酸之间的“同一性”是指在每种情况下在核酸的整个长度上核苷酸的同一性。

两个核苷酸序列(同样适用于肽或氨基酸序列)之间的“同一性”是当产生这两个序列的比对时，核苷酸残基(或氨基酸残基)的数目的函数，或两个序列中相同的残基数目。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。

特别地，可使用可从National Center for Biotechnology Information(美国国家生物技术信息中心)(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的设定为默认参数的BLAST程序(Tatiana等，FEMS Microbiol Lett.,1999,174:247-250,1999)来获得蛋白或核酸序列的最佳比对并计算序列同一性的百分比。

在另一个例子中，同一性可以通过Informax公司(美国)的VectorNTI Suite 7.1程序使用Clustal方法(Higgins DG,Sharp PM.((1989)))通过以下设置来计算：

多重比对参数：

间隙开放扣分 10

间隙延伸扣分 10

间隙分离扣分范围 8

间隙分离扣分关

比对延迟的同一性百分比 40

残基特异性间隙关

亲水残基间隙关

过渡加权 0

成对比对参数：

FAST算法开

K-元组大小 1

间隙扣分 3

窗大小 5

最佳对角线数 5

或者，同一性可以根据Chenna et al.(2003)，网页：http://www.ebi.ac.uk/Tools/clustalw/index.html#的方法和以下设置来确定：

本文提及的所有核酸序列(单链和双链DNA和RNA序列，例如cDNA和mRNA)可以以已知方式通过化学合成从核苷酸结构单元产生，例如通过双螺旋的各个重叠的互补核酸结构单元的片段缩合来实现。寡核苷酸的化学合成例如可以通过磷酰胺法(Voet,Voet,2ndedition,Wiley Press,New York,pages 896-897)以已知的方式进行。合成寡核苷酸的积累，和借助于DNA聚合酶的Klenow片段和连接反应的空位的填补，以及一般的克隆技术描述于Sambrook et al.(1989)，请参阅下文。

另外，根据本发明的核酸分子可以另外包含来自编码遗传区域的3'和/或5'末端的非翻译序列。

本发明进一步涉及与具体描述的核苷酸序列或其区段互补的核酸分子。

根据本发明的核苷酸序列使得可以产生可用于鉴定和/或克隆其他细胞类型和生物体中的同源序列的探针和引物。此类探针或引物通常包含在“严格”条件下(如本文其他部分所定义)与根据本发明的核酸序列的有义链或相应的反义链的至少约12个，优选至少约25个，例如约40、50或75个连续核苷酸杂交的核苷酸序列区域。

“同源”序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。

“旁系同源物”或旁系同源序列来源于基因复制，其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物通常聚簇在一起并且通过在相关植物物种内基因的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中，共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。

“直系同源物”或直系同源序列是彼此相似的序列，因为它们发现于由共同的祖先传下的物种中。例如，已知具有共同祖先的植物物种含有许多具有相似序列和功能的酶。例如通过使用CLUSTAL或BLAST程序构建一个物种的基因族的系统发生树，技术人员能够鉴定直系同源序列并预测直系同源物的功能。一种用于鉴定或确认同源序列间的相似功能的方法是通过比较过表达或缺乏(在基因敲除/敲减中)相关多肽的宿主细胞或生物体(如植物或微生物)中的转录物概况。技术人员能够理解，具有相似转录物概况的基因(具有大于50％调控的共同转录物，或具有大于70％调控的共同转录物，或大于90％调控的共同转录物)会具有相似的功能。通过使宿主细胞，生物体例如植物或微生物产生萜合酶蛋白，本文所述序列的同源物、旁系同源物、直系同源物以及任何其他变体预期以类似的方式发挥作用。

“分离的”核酸分子与存在于核酸天然来源中的其他核酸分子分离，并且如果通过重组技术生产，则可以基本上不含其他细胞材料或培养基，或者如果通过化学合成，则可以不含化学前体或其他化学物质。

可以借助于分子生物学的标准技术和根据本发明提供的序列信息来分离根据本发明的核酸分子。例如，可以使用具体公开的完整序列之一或其片段作为杂交探针和标准杂交技术(例如，描述于Sambrook,(1989))从合适的cDNA文库中分离cDNA。

另外，包含所公开的序列之一或其片段的核酸分子可以使用基于该序列构建的寡核苷酸引物，通过聚合酶链反应来分离。以此方式扩增的核酸可以克隆到合适的载体中，并可以通过DNA测序来表征。根据本发明的寡核苷酸也可以通过标准的合成方法，例如使用自动DNA合成仪制备。

根据本发明的核酸序列或其衍生物，这些序列的同源物或部分可以例如通过常规的杂交技术或PCR技术从其他细菌中，例如通过基因组或cDNA文库分离出来。这些DNA序列在标准条件下与根据本发明的序列杂交。

“杂交”是指多核苷酸或寡核苷酸在标准条件下结合几乎互补的序列的能力，而在这些条件下非互补配对者之间不发生非特异性结合。为此，序列可以是90～100％互补的。能够彼此特异性结合的互补序列的性质被用于例如Northern印迹或Southern印迹或PCR或RT-PCR中的引物结合。

保守区的短寡核苷酸有利地用于杂交。然而，也可能使用更长的本发明核酸片段或完整序列进行杂交。这些“标准条件”取决于所使用的核酸(寡核苷酸，更长的片段或完整序列)或用于杂交的核酸类型(DNA或RNA)而有所不同。例如，DNA:DNA杂交种的解链温度比相同长度的DNA:RNA杂交种低约10℃。

例如，根据特定核酸的不同，标准条件是指温度在42至58℃，在浓度为0.1至5xSSC(1X SSC＝0.15M NaCl，15mM柠檬酸钠，pH 7.2)的缓冲水溶液中，或另外在50％甲酰胺(例如42℃，5x SSC，50％甲酰胺)的存在下。有利地，用于DNA:DNA杂交种的杂交条件是0.1×SSC，温度为约20℃至45℃，优选约30℃至45℃。对于DNA:RNA杂交种，杂交条件有利地为0.1×SSC，并且温度为约30℃至55℃，优选约45℃至55℃。这些所述的杂交温度是对于长度约100个核苷酸的核酸，以及在不存在甲酰胺的情况下G+C含量为50％的经计算的解链温度值的例子。DNA杂交的实验条件已在相关的遗传学教科书(例如Sambrook et al.,1989)中进行了描述，并且可以使用本领域技术人员已知的分子式来计算，例如取决于核酸的长度，杂交种的类型或G+C含量。本领域技术人员可以从以下教科书中获得有关杂交的更多信息：Ausubel et al.(eds),(1985),Brown(ed)(1991)。

“杂交”尤其可以在严格条件下进行。这样的杂交条件例如描述于Sambrook(1989)，或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。

如本文所用，术语“杂交或在一定条件下杂交”旨在描述杂交和洗涤的条件，在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70％，例如至少约80％和例如至少约85％、90％或95％同一性的序列保持彼此结合。本文提供了低严格度、中等和高严格度杂交条件的定义。

本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols inMolecular Biology,John Wiley&Sons,sections 2,4,and 6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外，严格条件在Sambrook等人(1989,Molecular Cloning:ALaboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)中描述。

如本文所用，所限定的低严格度条件如下。含有DNA的滤膜在含有35％甲酰胺，5xSSC，50mM Tris-HCl(pH 7.5)，5mM EDTA，0.1％PVP，0.1％Ficoll，1％BSA和500μg/ml变性鲑鱼精子DNA的溶液中于40℃预处理6小时。杂交在相同的溶液中进行，并进行以下修改：0.02％PVP，0.02％Ficoll，0.2％BSA，100μg/ml鲑鱼精子DNA，10％(wt/vol)硫酸葡聚糖，并使用5-20x10⁶ 32P标记的探针。将滤膜在杂交混合物中于40℃孵育18～20小时，然后于55℃洗涤1.5小时。在含有2x SSC，25mM Tris-HCl(pH 7.4)，5mM EDTA和0.1％SDS的溶液中。用新鲜溶液代替洗涤溶液，并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。

如本文所用，所限定的中等严格度条件如下。含有DNA的滤膜在含有35％甲酰胺，5x SSC，50mM Tris-HCl(pH 7.5)，5mM EDTA，0.1％PVP，0.1％Ficoll，1％BSA和500μg/ml变性鲑鱼精子DNA的溶液中于50℃预处理7小时。杂交在相同的溶液中进行，并进行以下修改：0.02％PVP，0.02％Ficoll，0.2％BSA，100μg/ml鲑鱼精子DNA，10％(wt/vol)硫酸葡聚糖，并使用5-20x10⁶ 32P标记的探针。将滤膜在杂交混合物中于50℃孵育30小时，然后于55℃洗涤1.5小时。在含有2x SSC，25mM Tris-HCl(pH 7.4)，5mM EDTA和0.1％SDS的溶液中。用新鲜溶液代替洗涤溶液，并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。

如本文所用，所限定的高严格度条件如下。含DNA的滤膜在由6x SSC，50mM Tris-HCl(pH 7.5)，1mM EDTA，0.02％PVP，0.02％Ficoll，0.02％BSA和500μg/ml变性鲑鱼精子DNA组成的缓冲液中于65℃下预杂交8小时至过夜。在含有100μg/ml变性鲑鱼精子DNA和5-20x10⁶ cpm 32P标记探针的预杂交混合物中，将滤膜在65℃下杂交48小时。滤膜在含有2xSSC，0.01％PVP，0.01％Ficoll和0.01％BSA的溶液中于37℃洗涤1小时。然后在0.1x SSC中于50℃洗涤45分钟。

如果上述条件不合适(例如，如用于种间杂交)，则可以使用本领域众所周知的其他低、中等和高严格度条件(例如，用于种间杂交)。

用于编码本发明多肽的核酸序列的检测试剂盒可以包括对编码该多肽的核酸序列具有特异性的引物和/或探针，以及使用该引物和/或探针来检测样品中编码该多肽的核酸序列的相关方案。此种检测试剂盒可用于确定植物、生物、微生物或细胞是否已被修饰，即是否已用编码多肽的序列转化。

为了测试根据本文一个实施方案的变体DNA序列的功能，将目标序列可操作地连接到可选择的或可筛选的标记基因，并且在使用微生物或原生质体进行的瞬时表达分析中或在稳定转化的植物中测试报告基因的表达。

本发明还涉及具体公开的或可衍生的核酸序列的衍生物。

因此，根据本发明的另外的核酸序列可以衍生自本文具体公开的序列，并且可以通过一个或几个(例如1至10个)核苷酸的一个或多个，例如1至20个，特别是1至15个或5至10个添加、取代、插入或缺失而与之不同，并且还编码具有所期望特性的多肽。

本发明还包括与具体陈述的序列相比，根据特定原始或宿主生物的密码子使用而包含所谓的沉默突变或已被改变的核酸序列。

根据本发明的特定实施方案，可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如，如果氨基酸由特定的密码子编码，则已知细菌表达系统可更有效地表达多肽。由于遗传密码的简并性，多于一个密码子可以编码相同的氨基酸序列，多个核酸序列能够编码相同的蛋白或多肽，所有这些DNA序列均被涵盖在本文一个实施方案中。在适当的情况下，编码本文所述多肽的核酸序列可以被优化以增加在宿主细胞中的表达。例如，可以使用宿主特异性的密码子合成本文一个实施方案的核酸以改善表达。

本发明还涵盖本文描述的序列的天然存在的变体，例如剪接变体或等位基因变体。

等位基因变体在所衍生的氨基酸水平上，具有在整个氨基酸范围至少60％的同源性，优选至少80％的同源性，非常特别优选至少90％的同源性(关于氨基酸水平的同源性，应参考以上对于多肽给出的详细信息)。有利地，同源性可以在序列的部分区域上更高。

本发明还涉及可通过保守核苷酸取代(即，由于其结果，所讨论的氨基酸被具有相同电荷、大小、极性和/或溶解度的氨基酸取代)获得的序列。

本发明还涉及通过序列多态性从具体公开的核酸衍生的分子。由于天然等位基因变异，这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位基因变体还可包括功能等同物。这些自然变异通常会在基因的核苷酸序列中产生1～5％的变化。所述多态性可以导致本文公开的多肽的氨基酸序列的改变。等位基因变体还可包括功能等同物。

此外，衍生物也应理解为根据本发明的核酸序列的同源物，例如动物、植物、真菌或细菌的同源物，缩短的序列，编码和非编码DNA序列的单链DNA或RNA。例如，在DNA水平上，同源物在本文具体公开的序列中给定的整个DNA区域中具有至少40％，优选至少60％，特别优选至少70％，非常特别优选至少80％的同源性。

此外，衍生物应理解为例如与启动子的融合体。尽管不损害启动子的功能或功效，添加至所述核苷酸序列的启动子可以通过至少一种核苷酸交换、至少一种插入、倒置和/或缺失来修饰。而且，启动子的功效可以通过改变它们的序列来增加，或者可以与更有效的启动子甚至是不同属的生物体的启动子完全交换。

d.功能性多肽突变体的产生

此外，本领域技术人员熟悉用于产生功能性突变体的方法，也就是说，一种核苷酸序列，其编码多肽，该多肽与本文公开的任何与氨基酸相关的SEQ ID NO具有至少40％，45％，50％，55％，60％，65％，70％，75％，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性；和/或由核酸分子编码，该核酸分子包含与本文公开的任何与核苷酸相关的SEQ ID NO具有至少70％序列同一性的核苷酸序列。

取决于所使用的技术，本领域技术人员可以将完全随机的或更有针对性的突变引入到基因或非编码核酸区域(例如对于调节表达很重要)中，并随后产生遗传文库。为此目的所需的分子生物学方法是技术人员已知的，例如描述于Sambrook and Russell,Molecular Cloning.3rd Edition,Cold Spring Harbor Laboratory Press 2001。

修饰基因并由此修饰由其编码的多肽的方法是本领域技术人员长期已知的，举例而言例如：

-位点特异性诱变，其中基因的单个或多个核苷酸以定向方式被替换(Trower MK(Ed.)1996；In vitro mutagenesis protocols.Humana Press,New Jersey)，

-饱和诱变，其中任何氨基酸的密码子都可以在基因的任何位点交换或添加(Kegler-Ebo DM,Docktor CM,DiMaio D(1994)Nucleic Acids Res 22:1593；BarettinoD,Feigenbutz M,Valcárel R,Stunnenberg HG(1994)Nucleic Acids Res 22:541；BarikS(1995)Mol Biotechnol 3:1)，

-易错聚合酶链反应，其中核苷酸序列被易错DNA聚合酶突变(Eckert KA,KunkelTA(1990)Nucleic Acids Res 18:3739)；

-SeSaM法(序列饱和法)，其中优选的交换被聚合酶阻止。Schenk et al.,Biospektrum,Vol.3,2006,277-279，

-突变株中的基因传代，其中例如由于DNA修复机制缺陷，核苷酸序列的突变率增加(Greener A,Callahan M,Jerpseth B(1996)An efficient random mutagenesistechnique using an E.coli mutator strain.In:Trower MK(Ed.)In vitromutagenesis protocols.Humana Press,New Jersey)，或

-DNA改组，其中形成并消化一组密切相关的基因，并将这些片段用作聚合酶链反应的模板，其中通过重复的链分离和重新结合，最终生成了全长的镶嵌基因(Stemmer WPC(1994)Nature 370:389；Stemmer WPC(1994)Proc Natl Acad Sci USA 91:10747)。

使用所谓的定向进化(尤其描述于Reetz MT and Jaeger K-E(1999),TopicsCurr Chem 200:31；Zhao H,Moore JC,Volkov AA,Arnold FH(1999),Methods foroptimizing industrial polypeptides by directed evolution,In:Demain AL,DaviesJE(Ed.)Manual of industrial microbiology and biotechnology.American Societyfor Microbiology)，熟练的工人可以以定向的方式大规模生产功能性突变体。为此，在第一步中，首先，例如使用上文给出的方法，产生各自多肽的基因文库。基因文库以合适的方式表达，例如通过细菌或噬菌体展示系统来表达。

表达功能性突变体的宿主生物的相关基因(其功能在很大程度上与所需的特性相对应)可以提交给另一个突变周期。突变和选择或筛选的步骤可以迭代地重复，直到本发明的功能性突变体具有足够程度的所需特性。使用该迭代过程，可以分阶段进行有限数量的突变，例如1、2、3、4或5个突变，并评估和选择它们对所研究活性的影响。然后可以以相同的方式将所选择的突变体进行进一步的突变步骤。这样，可以显著减少待研究的单个突变体的数量。

根据本发明的结果还提供了与相关多肽的结构和序列有关的重要信息，这是以靶向方式产生具有所需修饰特性的其他多肽所必需的。特别地，可以定义所谓的“热点”，即潜在地适合于通过引入靶向突变来修饰特性的序列区段。

也可以推导出有关氨基酸序列位置的信息，在该区域中可以发生可能对活性几乎没有影响的突变，并且可以将其指定为潜在的“沉默突变”。

e.表达本发明多肽的构建体

在本文语境中，以下定义适用：

“基因的表达”涵盖“异源表达”和“过表达”，并且涉及基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物中，以mRNA、多肽和/或酶活性水平测量的基因产物的产生超过了相似遗传背景的非转化细胞或生物中的产生水平。

如本文所用，“表达载体”是指这样一种核酸分子，其使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中。表达载体典型地包括正确转录核苷酸序列所需的序列。编码区通常编码目的蛋白，但是也可以编码RNA，例如反义RNA、siRNA等。

如本文所用，“表达载体”包括任何线性的或环状的重组载体，包括但不限于病毒载体、噬菌体和质粒。技术人员根据表达系统能够选择适合的载体。在一个实施方案中，表达载体包括本文实施方案的核酸，其可操作地连接到至少一个“调控序列”，其控制转录、翻译、起始和终止，例如转录启动子、操纵子或增强子，或mRNA核糖体结合位点，并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时，核苷酸序列是“可操作地连接的”。

如本文所用，“表达系统”涵盖在给定表达宿主的体内或体外共表达两种或更多种多肽所需的核酸分子的任何组合。各自的编码序列可以位于单个核酸分子或载体上，例如包含多个克隆位点的载体，或位于多顺反子核酸上，或者可以分布在两个或更多个物理上不同的载体上。

如本文所用，术语“进行扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法用于产生或检测天然表达的核酸的重组体，如下文详细描述的。例如，本发明提供用于扩增(例如，通过聚合酶链反应，PCR)天然表达的(例如，基因组DNA或mRNA)或本发明在体内、离体或体外的重组的核酸(例如cDNA)的方法和试剂(例如，特异性简并寡核苷酸引物对，寡聚dT引物)。

“调控序列”是指这样一种核酸序列，其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。

根据本发明，“启动子”、“具有启动子活性的核酸”或“启动子序列”应理解为是指这样一种核酸，当与要转录的核酸功能性连接时，其调节所述核酸的转录。“启动子”尤其是指一种核酸序列，其通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子，包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点，来控制编码序列的表达。术语启动子的含义还包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。

在本文语境中，“功能性”或“可操作地”连接被理解为例如指具有调控序列的核酸之一的顺序排列。例如，具有启动子活性的序列，和待转录的核酸序列以及可选的其他调控元件(例如确保核酸转录的核酸序列)和例如终止子，该顺序排列的方式为使得每个调控元件都能在核酸序列转录后执行其功能。这不一定需要化学意义上的直接连接。遗传控制序列，例如增强子序列，甚至可以从更远的位置甚至从其他DNA分子上对目标序列发挥作用。优选的排列是这样的，其中待转录的核酸序列位于启动子序列的下游(即3'端)，从而使两个序列共价连接在一起。启动子序列和待重组表达的核酸序列之间的距离可以小于200个碱基对，或小于100个碱基对或小于50个碱基对。

除启动子和终止子外，还可以提及以下作为其他调控元件的例子：靶向序列，增强子，聚腺苷酸化信号，选择标记，扩增信号，复制起点等。合适的调节序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。

术语“组成型启动子”是指不受调控的启动子，其允许其可操作地连接的核酸序列的持续转录。

如本文所用，术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时，那么该核酸是“可操作地连接”的。例如，如果启动子或者转录调控序列能够影响编码序列的转录，那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何，与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地，相关的核苷酸序列导致在细胞或生物体中产生如本文定义的一种或多种目的产物。特别地，核苷酸序列编码具有如本文定义的酶活性的多肽。

本文如上所述的核苷酸序列可以是“表达盒”的一部分。术语“表达盒”和“表达构建体”同义使用。(优选的重组)表达构建体包含这样的核苷酸序列，其编码根据本发明的多肽并且在调节核酸序列的遗传控制之下。

在根据本发明应用的方法中，表达盒可以是“表达载体”，特别是重组表达载体的一部分。

根据本发明，“表达单位”应理解为是指具有表达活性的核酸，其包含如本文所定义的启动子，并且在与待表达的核酸或基因功能性连接后调节表达，即所述核酸或所述基因的转录和翻译。因此在这方面也被称为“调节核酸序列”。除启动子外，还可以存在其他调节元件，例如增强子。

根据本发明，“表达盒”或“表达构建体”应理解为在功能上与要表达的核酸或要表达的基因连接的表达单元。因此，与表达单元相反，表达盒不仅包含调节转录和翻译的核酸序列，而且还包含由于转录和翻译而作为蛋白质表达的核酸序列。

在本发明的语境中，术语“表达”或“过表达”描述了微生物中一种或多种由相应DNA编码的多肽的细胞内活性的产生或增加。为此，例如可以将基因导入到生物体中，用另一个基因替代现有基因，增加基因的拷贝数，使用强启动子或使用编码具有高活性的相应多肽的基因。可选地，这些措施可以组合。

优选地，根据本发明的此类构建体包含各自编码序列5'上游的启动子和3'下游的终止子序列，以及可选地其他常见的调控元件，在每种情况下均与编码序列可操作地连接。

根据本发明的核酸构建体特别地包含编码多肽的序列，该多肽例如衍生自如本文所述的氨基酸相关的SEQ ID NO或其反向互补序列，或其衍生物和同源物，并且已经与一个或多个调节信号可操作地或功能性连接，用于有利地控制例如增加基因表达。

除了这些调控序列之外，这些序列的天然调控可能仍存在于实际的结构基因之前，并且可选地可能已经进行了遗传修饰，因此天然调控已被关闭，基因的表达得到了增强。然而，核酸构建体也可以具有更简单的构建，即，在编码序列之前没有插入额外的调节信号，并且具有调节作用的天然启动子尚未去除。相反，天然调节序列被突变，使得不再发生调节并且基因表达增加。

优选的核酸构建体有利地还包含与启动子功能性连接的一个或多个已经提及的“增强子”序列，该序列使得增强核酸序列的表达成为可能。还可以在DNA序列的3'末端插入其他有利的序列，例如其他调控元件或终止子。根据本发明的核酸的一个或多个拷贝可以存在于构建体中。在该构建体中，还可以可选地存在其他标记物，例如与营养缺陷性或抗生素抗性互补的基因，以便选择该构建体。

合适的调控序列的例子存在于启动子中，例如cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIq、T7、T5、T3、gal、trc、ara、rhaP(rhaP_BAD)SP6、lambda-P_R或lambda-P_L启动子中，它们有利地用于革兰氏阴性细菌中。其他有利的调节序列存在于例如革兰氏阳性启动子amy和SPO2中，酵母或真菌启动子ADC1、MFalpha、AC、P-60、CYC1、GAPDH、TEF、rp28、ADH中。人工启动子也可以用于调节。

为了在宿主生物体中表达，将核酸构建体有利地插入到载体，例如质粒或噬菌体中，这使得基因在宿主中的最佳表达成为可能。除了质粒和噬菌体，载体还应理解为是本领域技术人员已知的所有其他载体，即例如病毒，例如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、噬粒、粘粒和线性或环状DNA或人工染色体。这些载体能够在宿主生物体中自主复制或通过染色体复制。这些载体是本发明的进一步发展。二元或cpo整合载体也是适用的。

合适的质粒是例如在大肠杆菌pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III¹¹³-B1、λgt11或pBdCI中，在链霉菌pIJ101、pIJ364、pIJ702或pIJ361中，在芽孢杆菌pUB110、pC194或pBD214中，在棒状杆菌pSA77或pAJ667中，在真菌pALS1、pIL2或pBB116中，在酵母2alphaM、pAG-1、YEp6、YEp13或pEMBLYe23中，或在植物pLGV23、pGHlac+、pBIN19、pAK2004或pDH51中。上述质粒是可能的质粒的少量选择。其他质粒是技术人员众所周知的，并且可以在例如书籍Cloning Vectors(Eds.Pouwels P.H.et al.Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444 904018)中找到。

在载体的进一步开发中，包含本发明的核酸构建体或本发明的核酸的载体也可以有利地以线性DNA的形式引入到微生物中并通过异源或同源重组整合到宿主生物体的基因组中。该线性DNA可以由线性化的载体例如质粒组成，或者仅由本发明的核酸构建体或核酸组成。

为了在生物体中异源基因的最佳表达，有利的是修饰核酸序列以匹配生物体中使用的特定“密码子使用”。“密码子使用”可以通过对所讨论的生物体的其他已知基因的计算机评估来容易地确定。

根据本发明的表达盒通过将合适的启动子融合到合适的编码核苷酸序列和终止子或聚腺苷酸化信号来产生。为此目的使用常规的重组和克隆技术，例如描述于T.Maniatis,E.F.Fritsch and J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)和T.J.Silhavy,M.L.Berman and L.W.Enquist,Experiments with Gene Fusions,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1984)和Ausubel,F.M.et al.,Current Protocolsin Molecular Biology,Greene Publishing Assoc.and Wiley Interscience(1987)。

为了在合适的宿主生物体中表达，将重组核酸构建体或基因构建体有利地插入到宿主特异性载体中，这使得基因在宿主中的最佳表达成为可能。载体是技术人员众所周知的，并且可以在例如"cloning vectors"(Pouwels P.H.et al.,Ed.,Elsevier,Amsterdam-New York-Oxford,1985)中找到。

本文实施方案的替代实施方案提供了一种“改变宿主细胞中的基因表达”的方法。例如，在某些语境下(例如，暴露于一定温度或培养条件下)，在宿主细胞或宿主生物体中可以增强或过表达或诱导本文实施方案的多核苷酸。

本文提供的多核苷酸的表达的改变还会产生异位表达，其是在改变的以及在对照或野生型生物体中的一种不同的表达模式。表达的改变是由本文一个实施方案的多肽与外源性或内源性调节剂的接触而发生的或者是由于多肽的化学修饰导致的。该术语还指本文实施方案的多核苷酸的改变的表达模式，其被改变至低于检测水平或者完全被抑制活性。

在一个实施方案中，本文还提供了编码本文提供的多肽或变体多肽的分离的、重组的或合成的多核苷酸。

在一个实施方案中，多种编码多肽的核酸序列在单一宿主中共表达，特别是在不同启动子的控制下。在另一个实施方案中，多种编码多肽的核酸序列可以存在于单个转化载体上，或者可以使用分离的载体并选择包含两个嵌合基因的转化体同时进行共转化。类似地，一种或多种多肽编码基因可以与其他嵌合基因一起在单一植物、细胞、微生物或生物体中表达。

f.适用于本发明的宿主

取决于语境，术语“宿主”可以指野生型宿主或经遗传改变的重组宿主或两者。

原则上，所有的原核或真核生物都可以被认为是根据本发明的核酸或核酸构建体的宿主或重组宿主生物。

使用根据本发明的载体，可以生产重组宿主，其例如可以用至少一种根据本发明的载体转化，并可以用于生产gen据本发明的多肽。有利地，将如上所述的根据本发明的重组构建体引入到合适的宿主系统中并表达。优选地，使用本领域技术人员已知的普通克隆和转染方法，例如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等，以在各自的表达系统中表达所述核酸。合适的系统描述于Current Protocols in Molecular Biology,F.Ausubel et al.,Ed.,Wiley Interscience,New York 1997，或Sambrook etal.Molecular Cloning:A Laboratory Manual.2nd edition,Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989。

有利地，诸如细菌、真菌或酵母的微生物被用作宿主生物。有利地，使用革兰氏阳性或革兰氏阴性细菌，优选肠杆菌科(Enterobacteriaceae)，假单胞菌科(Pseudomonadaceae)，根瘤菌科(Rhizobiaceae)，链霉菌科(Streptomycetaceae)或诺卡氏菌科(Nocardiaceae)的细菌，特别优选埃希氏菌属(Escherichia)，假单胞菌属(Pseudomonas)，链霉菌属(Streptomyces)，诺卡氏菌(Nocardia)，伯克霍尔德氏菌属(Burkholderia)，沙门氏菌属(Salmonella)，农杆菌属(Agrobacterium)，艰难梭菌(Clostridium)或红球菌属(Rhodococcus)的细菌。大肠杆菌(Escherichia coli)属和种是非常特别优选的。此外，在α-变形菌(alpha-Proteobacteria)、β-变形菌(beta-Proteobacteria)或γ-变形菌(gamma-Proteobacteria)组中发现了其他有利的细菌。有利地，诸如酿酒酵母或毕赤酵母家族的酵母也是合适的宿主。

或者，整个植物或植物细胞可以用作天然或重组宿主。作为非限制性例子，可以提及以下植物或自其衍生的细胞：烟草属(Nicotiana)，特别是本氏烟草(Nicotianabenthamiana)和普通烟草(Nicotiana tabacum)(tobacco)；以及拟南芥属(Arabidopsis)，特别是阿拉伯芥(Arabidopsis thaliana)。

取决于宿主生物，根据本发明的方法中使用的生物以本领域技术人员已知的方式生长或培养。培养可以分批、半分批或连续进行。营养物可以在发酵开始时给予，也可以稍后，半连续或连续地提供。这也在下面更详细地描述。

g.根据本发明的多肽的重组生产

本发明进一步涉及重组生产根据本发明的多肽或其功能性生物学活性片段的方法，其中培养产生多肽的微生物，可选地通过施加至少一种诱导基因表达的诱导剂来诱导多肽的表达，并从培养物中分离这些多肽。如果需要，多肽也可以这种方式以工业规模生产。

根据本发明产生的微生物可以分批法或补料分批法或重复补料分批法连续或不连续培养。已知培养方法的概述可在Chmiel的教科书(Bioprozesstechnik 1.Einführungin die Bioverfahrenstechnik[Bioprocess technology 1.Introduction tobioprocess technology](Gustav Fischer Verlag,Stuttgart,1991))或在Storhas的教科书(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheralequipment](Vieweg Verlag,Braunschweig/Wiesbaden,1994))中找到。

所使用的培养基必须适当地满足各个菌株的要求。在美国细菌学学会(AmericanSociety for Bacteriology(Washington D.C.,USA,1981))的手册“Manual of Methodsfor General Bacteriology”中给出了各种微生物的培养基的描述。

可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。

优选的碳源是糖，例如单糖、二糖或多糖。很好的碳源是例如葡萄糖，果糖，甘露糖，半乳糖，核糖，山梨糖，核酮糖，乳糖，麦芽糖，蔗糖，棉子糖，淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产品添加到培养基中。添加不同碳源的混合物也是有利的。其他可能的碳源是油和脂，例如大豆油，葵花籽油，花生油和椰子油，脂肪酸例如棕榈酸，硬脂酸或亚油酸，醇例如甘油，甲醇或乙醇，和有机酸，例如乙酸或乳酸。

氮源通常是有机或无机氮化合物或包含这些化合物的材料。氮源的例子包括氨气或铵盐，例如硫酸铵，氯化铵，磷酸铵，碳酸铵或硝酸铵，硝酸盐，尿素，氨基酸或复合氮源，例如玉米浆，大豆粉，大豆蛋白，酵母提取物，肉提取物等。氮源可以单独使用或混合使用。

可以存在于培养基中的无机盐化合物包括钙，镁，钠，钴，钼，钾，锰，锌，铜和铁的氯化物、磷或硫酸盐。

无机含硫化合物，例如硫酸盐，亚硫酸盐，连二亚硫酸盐，四硫酸盐，硫代硫酸盐，硫化物，以及有机硫化合物，例如硫醇(mercaptans)和巯类(thiols)，可用作硫源。

磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可用作磷源。

可以将螯合剂添加到培养基中，以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚，例如儿茶酚或原儿茶酸酯，或有机酸，例如柠檬酸。

根据本发明使用的发酵培养基通常还包含其他生长因子，例如维生素或生长促进剂，其包括例如生物素，核黄素，硫胺素，叶酸，烟酸，泛酸和吡哆醇(pyridoxine)。生长因子和盐通常源自复杂培养基的成分，例如酵母提取物，糖蜜，玉米浆等。此外，可以将合适的前体添加到培养基中。化合物在培养基中的确切组成在很大程度上取决于相应的实验，并针对每种具体情况分别确定。有关培养基优化的信息可以在教科书"AppliedMicrobiol.Physiology,A Practical Approach"(Ed.P.M.Rhodes,P.F.Stanbury,IRLPress(1997)p.53-73,ISBN 0 19 963577 3)中找到。生长培养基也可以从商业供应商获得，例如Standard 1(Merck)或BHI(脑心浸液，DIFCO)等。

通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒，也可以根据需要单独消毒。培养基的所有成分都可以在培养开始时给予，也可以连续或分批添加。

培养物的温度通常在15℃至45℃之间，优选25℃至40℃，并且在实验过程中可以改变或保持恒定。介质的pH应在5至8.5的范围内，优选为7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠，氢氧化钾，氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性，可以向培养基中添加合适的选择性物质例如抗生素。为了维持有氧条件，将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常在20℃至45℃的范围内。继续培养直至形成最大量的所期望产物。通常会在10到160个小时内达到此目标。

然后将发酵液进一步处理。根据需要，可以通过分离技术，例如离心、过滤、倾析或这些方法的组合，将生物质完全或部分地从发酵液中除去，或者可以完全留在其中。

如果多肽没有在培养基中分泌，那么细胞也可以被裂解，并且可以通过用于分离蛋白质的已知方法从裂解物中获得产物。可以可选地通过高频超声，高压例如在高压细胞裂解机(French press)中，通过渗透，通过去污剂、裂解酶或有机溶剂的作用，通过均化器或通过上述几种方法的组合来破坏细胞。

可以通过已知的色谱技术，例如分子筛色谱(凝胶过滤)，例如Q-琼脂糖色谱，离子交换色谱和疏水色谱，以及其他常规技术，例如超滤、结晶、盐析、渗析和天然凝胶电泳来纯化多肽。合适的方法描述于例如Cooper,T.G.,Biochemische Arbeitsmethoden[Biochemical processes],Verlag Walter de Gruyter,Berlin,New York，或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。

为了分离重组蛋白，使用载体系统或寡核苷酸可能是有利的，所述载体系统或寡核苷酸通过限定的核苷酸序列延长cDNA，并因此编码改变的多肽或融合蛋白，其例如用于更容易的纯化。这种类型的合适修饰例如是充当锚的所谓“标签”，例如可以被识别为抗体抗原的被称为六-组氨酸锚或表位的修饰(例如，描述于Harlow,E.and Lane,D.,1988,Antibodies:A Laboratory Manual.Cold Spring Harbor(N.Y.)Press)。这些锚可以用于将蛋白质连接至固体载体，例如聚合物基质，其可以例如用作色谱柱中的填料，或者可以用于微量滴定板或其他载体上。

同时，这些锚也可用于识别蛋白质。为了识别蛋白质，还可以使用通常的标记物，例如荧光染料，酶标记物(与底物反应后形成可检测的反应产物)，或放射性标记物，单独使用或与锚结合使用以衍生化蛋白质。

h.多肽的固定化

根据本发明的酶或多肽可以在本文描述的方法中以游离形式或固定化而使用。固定化酶是固定在惰性载体上的酶。合适的载体材料和固定在其上的酶从EP-A-1149849，EP-A-1069183和DE-OS100193773以及从其中引用的参考文献中已知。在这方面，参考这些文件的全部公开内容。合适的载体材料包括例如粘土，粘土矿物，例如高岭石，硅藻土，珍珠岩，二氧化硅，氧化铝，碳酸钠，碳酸钙，纤维素粉末，阴离子交换剂材料，合成聚合物，例如聚苯乙烯，丙烯酸树脂，酚醛树脂，聚氨酯和聚烯烃，例如聚乙烯和聚丙烯。为了制备负载的酶，通常以细分的颗粒形式，优选多孔形式使用载体材料。载体材料的粒径通常不大于5mm，特别是不大于2mm(粒径分布曲线)。类似地，当使用脱氢酶作为全细胞催化剂时，可以选择游离形式或固定形式。载体材料例如为海藻酸钙和角叉菜胶。酶和细胞也可以直接与戊二醛交联(与CLEAs交联)。相应的和其他固定化技术描述于例如J.Lalonde and A.Margolin"Immobilization of Enzymes"in K.Drauz and H.Waldmann,Enzyme Catalysis inOrganic Synthesis 2002,Vol.III,991-1032,Wiley-VCH,Weinheim中。Rehm et al.(Ed.)Biotechnology,2nd Edn,Vol 3,Chapter 17,VCH,Weinheim给出了用于进行根据本发明的方法的生物转化和生物反应器的进一步信息。

i.本发明生物催化生产方法的反应条件

本发明的反应可以在体内或体外条件下进行。

存在于本发明的方法或上文定义的多步方法的单个步骤中的至少一种多肽/酶可以天然存在于活细胞中，或于收获的细胞(即在体内条件下)中，死细胞中，透化细胞中，粗细胞提取物中，纯化提取物中，或以基本纯净或完全纯净的形式(即在体外条件下)，重组产生一种或多种酶。所述至少一种酶可以以溶液形式存在或以固定在载体上的酶形式存在。一种或几种酶可以同时以可溶性和/或固定化形式存在。

根据本发明的方法可以在本领域技术人员已知的普通反应器中进行，并且可以在不同的规模范围内进行，例如从实验室规模(几毫升到几十升反应体积)到工业规模(几升到数千立方米反应体积)。如果多肽以通过无生命的、可选地透化的细胞包封的形式，以或多或少纯化的细胞提取物的形式或以纯化的形式使用，则可以使用化学反应器。化学反应器通常允许控制至少一种酶的量，至少一种底物的量，pH，温度和反应介质的循环。当活细胞中存在至少一种多肽/酶时，该过程将是发酵。在这种情况下，生物催化生产将在生物反应器(发酵罐)中进行，其中对于活细胞合适的生存条件必需的参数(例如，具有营养的培养基，温度，通气，有氧或无氧或其他气体，抗生素等)可以控制。本领域技术人员熟悉化学反应器或生物反应器，例如使用将化学或生物技术方法从实验室规模扩大到工业规模或优化工艺参数的程序，这些方法在文献中也有广泛描述(有关生物技术方法，请参见例如Cruegerund Crueger,Biotechnologie–Lehrbuch der angewandten Mikrobiologie,2.Ed.,R.Oldenbourg Verlag,München,Wien,1984)。

包含至少一种酶的细胞可以通过物理或机械方式例如超声或射频脉冲，高压细胞裂解机(French press)或化学方式例如在培养基中存在的低渗介质、裂解酶和去污剂或这些方法的组合来渗透。洗涤剂的例子是洋地黄毒苷，正十二烷基麦芽糖苷，辛基糖苷，

X-100，

20，脱氧胆酸盐，CHAPS(3-[(3-氯酰胺基丙基)二甲基铵]-1-丙烷磺酸盐)，

P40(乙基苯酚聚(乙二醇醚))等。

代替活细胞，也可以将含有所需生物催化剂的非活细胞的生物质应用于本发明的生物转化反应。

如果固定了至少一种酶，则将其如上所述连接至惰性载体。

转化反应可以分批、半分批或连续进行。反应物(和可选的营养物)可以在反应开始时提供，或者可以随后半连续或连续地提供。

根据特定的反应类型，本发明的反应可以在水性、水性-有机或非水性反应介质中进行。

水性或水性-有机介质可包含合适的缓冲液，以将pH值调整为5至11，例如6至10。

在水性-有机介质中，可以使用与水可混溶、部分混溶或不混溶的有机溶剂。合适的有机溶剂的非限制性例子在下面列出。进一步的例子是一元或多元，芳族或脂族醇，特别是多元脂族醇，如甘油。

非水介质可以包含基本上不含水，即，将包含少于约1重量％或0.5重量％的水。

生物催化方法也可以在有机非水介质中进行。作为合适的有机溶剂，可以提及具有例如5至8个碳原子的脂族烃，例如戊烷，环戊烷，己烷，环己烷，庚烷，辛烷或环辛烷；芳族烃，例如苯，甲苯，二甲苯，氯苯或二氯苯，脂族无环和醚，例如二乙醚，甲基叔丁基醚，乙基叔丁基醚，二丙基醚，二异丙醚，二丁基醚；或它们的混合物。

反应物/底物的浓度可以适应于最佳反应条件，这可以取决于所应用的特定酶。例如，初始底物浓度可以为0.1至0.5M，例如10至100mM。

反应温度可以适应于最佳反应条件，这可以取决于所应用的特定酶。例如，该反应可以在0至70℃的温度下进行，例如20至50或25至40℃。反应温度的例子是约30℃，约35℃，约37℃，约40℃，约45℃，约50℃，约55℃和约60℃。

该工艺可以继续进行直到在底物和随后的产物之间达到平衡为止，但是可以更早地停止。通常的工艺时间为1分钟至25小时，特别是10分钟至6小时，例如为1小时至4小时，特别是1.5小时至3.5小时。这些参数是合适的工艺条件的非限制性例子。

如果宿主是转基因植物，则可以提供最佳的生长条件，例如最佳的光照、水和营养条件。

k.产品分离

本发明的方法可以进一步包括回收终产物或中间产物的步骤，所述终产物或中间产物可选地为立体异构体或对映异构体的基本纯净的形式。术语“回收”包括从培养基或反应介质中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行，包括但不限于用常规树脂(例如，阴离子或阳离子交换树脂，非离子吸附树脂等)处理，用常规吸附剂(例如，活性炭，硅酸，硅胶，纤维素，氧化铝等)处理，pH值的改变，溶剂萃取(例如，使用常规溶剂，例如醇，乙酸乙酯，己烷等)，蒸馏，渗析，过滤，浓缩，结晶，重结晶，pH调节，冻干等。

经分离产物的身份和纯度可以通过已知技术确定，例如高效液相色谱(HPLC)，气相色谱(GC)，光谱学(例如IR，UV，NMR)，着色方法，TLC，NIRS，酶或微生物测定(参见例如：Patek et al.(1994)Appl.Environ.Microbiol.60:133-140；Malakhova et al.(1996)Biotekhnologiya 1127-32；und Schmidt et al.(1998)Bioprocess Engineer.19:67-70.Ullmann'sEncyclopedia of Industrial Chemistry(1996)Bd.A27,VCH:Weinheim,S.89-90,S.521-540,S.540-547,S.559-566,575-581und S.581-587；Michal,G(1999)Biochemical Pathways:An Atlas of Biochemistry and Molecular Biology,JohnWiley and Sons；Fallon,A.et al.(1987)Applications of HPLC in Biochemistry in:Laboratory Techniques in Biochemistry and Molecular Biology,Bd.17.)。

可以将本文所述的任何方法生产的环状萜烯化合物转化成衍生物，例如但不限于烃，酯，酰胺，糖苷，醚，环氧化物，醛，酮，醇，二醇，缩醛或缩酮。萜烯化合物衍生物可以通过化学方法获得，例如但不限于氧化，还原，烷基化，酰化和/或重排。或者，萜烯化合物衍生物可以通过使用生化方法通过使萜烯化合物与酶接触而获得，所述酶例如但不限于氧化还原酶，单加氧酶，双加氧酶，转移酶。可以使用分离的酶，来自裂解细胞的酶在体外进行生化转化，也可以使用全细胞或生物体在体内进行生化转化。

l.折叶苔基二磷酸和/或折叶苔醇的发酵产生

本发明还涉及发酵产生折叶苔基二磷酸和/或折叶苔醇的方法。

根据本发明使用的发酵可以例如在搅拌的发酵罐、鼓泡塔和回路反应器中进行。有关可能的方法类型的全面概述，包括搅拌器类型和几何设计，请参见“Chmiel:Bioprozesstechnik:Einfuhrung in die Bioverfahrenstechnik,Band 1”。在本发明的方法中，可用的典型变型是本领域技术人员已知的或例如在“Chmiel,Hammes and Bailey:Biochemical Engineering”中解释的以下变型，例如分批、补料分批，重复补料分批进行或连续发酵，有或没有回收生物质。取决于生产应变，可以进行空气，氧气，二氧化碳，氢气，氮气或适当的气体混合物的喷射，以实现良好的收率(YP/S)。

要使用的培养基必须以适当的方式满足特定菌株的要求。在美国细菌学学会(American Society for Bacteriology(Washington D.C.,USA,1981))的手册“Manual ofMethods for General Bacteriology”中给出了各种微生物的培养基的描述。

优选的碳源是糖，例如单糖、二糖或多糖。非常好的碳源是例如葡萄糖，果糖，甘露糖，半乳糖，核糖，山梨糖，核酮糖，乳糖，麦芽糖，蔗糖，棉子糖，淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产物添加到培养基中。添加各种碳源的混合物也是有利的。碳的其他可能来源是油和脂，例如大豆油，葵花籽油，花生油和椰子油，脂肪酸例如棕榈酸，硬脂酸或亚油酸，醇例如甘油，甲醇或乙醇，和有机酸，例如乙酸或乳酸。

氮源通常是有机或无机氮化合物或含有这些化合物的材料。氮源的例子包括氨气或铵盐，例如硫酸铵，氯化铵，磷酸铵，碳酸铵或硝酸铵，硝酸盐，尿素，氨基酸或复合氮源，例如玉米浆，大豆粉，大豆蛋白，酵母提取物，肉提取物等。氮源可以单独使用或混合使用。

可以存在于培养基中的无机盐化合物包括钙，镁，钠，钴，钼，钾，锰，锌，铜和铁的氯化物，磷酸盐或硫酸盐。

根据本发明使用的发酵培养基还可包含其他生长因子，例如维生素或生长促进剂，其包括例如生物素，核黄素，硫胺素，叶酸，烟酸，泛酸和吡哆醇。生长因子和盐通常来自培养基的复杂成分，例如酵母提取物，糖蜜，玉米浆等。另外，可以将合适的前体添加到培养基中。化合物在培养基中的精确组成在很大程度上取决于特定的实验，必须针对每种特定情况分别确定。有关培养基优化的信息可以在教科书"Applied Microbiol.Physiology,APractical Approach"(1997)中找到。生长培养基也可以从商业供应商那里获得，例如Standard 1(Merck)或BHI(脑心浸液，DIFCO)等。。

通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒，也可以根据需要单独消毒。培养基的所有成分都可以在生长开始时给予，或者可以选择连续添加或分批添加。

培养物的温度通常在15℃至45℃之间，优选25℃至40℃，并且可以在实验期间保持恒定或可以变化。介质的pH值应在5至8.5的范围内，优选7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠，氢氧化钾，氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性，可以向培养基中添加具有选择性作用的合适物质例如抗生素。为了维持有氧条件，将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常为20℃至45℃。继续培养直至形成最大量的所期望产物。通常会在1到160个小时内达到此目标。

本发明的方法可以进一步包括回收折叶苔基二磷酸和/或折叶苔醇的步骤。

术语“回收”包括从培养基中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行，包括但不限于用常规树脂(例如，阴离子或阳离子交换树脂，非离子吸附树脂等)处理，用常规吸附剂(例如，活性炭，硅酸，硅胶，纤维素，氧化铝等)处理，pH值的改变，溶剂萃取(例如，使用常规溶剂，例如醇，乙酸乙酯，己烷等)，蒸馏，渗析，过滤，浓缩，结晶，重结晶，pH调节，冻干等。

在预期的分离之前，可以除去发酵液的生物质。去除生物质的方法是本领域技术人员已知的，例如过滤、沉降和浮选。因此，可以例如通过离心机、分离器、倾析器、过滤器或在浮选设备中去除生物质。为了最大程度地回收有价值的产品，通常建议洗涤生物质，例如以渗滤的形式。方法的选择取决于发酵液中生物质的含量和生物质的性质，以及生物质与有价值产品的相互作用。

在一个实施方案中，可以将发酵液灭菌或巴氏灭菌。在另一个实施方案中，将发酵液浓缩。根据需要，该浓缩可以分批或连续进行。应该选择压力和温度范围，使得首先不会发生产品损坏，其次需要最小化设备和能源的使用。多级蒸发的压力和温度水平的熟练选择尤其可以节省能源。

以下实施例仅是说明性的，并不意味着限制本文所述的实施方案和权利要求书的范围。

在考虑了本文提供的公开内容之后，对于本领域技术人员而言将立即变得显而易见的多种可能的变型方案也落入本发明的范围内。

实验部分

现在将通过以下实施例更详细地描述本发明。

材料：

除非另有说明，否则本文使用的所有化学和生物化学材料以及微生物或细胞均为可商购的产品。

除非另有说明，否则重组蛋白是通过标准方法克隆和表达的，所述方法例如描述于Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular cloning:A LaboratoryManual,2^nd Edition,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989。

方法：

用于测定折叶苔基二磷酸合酶活性的标准测定法(体外)

合适的方法在下面的实施例5和实施例7中描述。(

气相色谱质谱法(GC-MS)

使用Agilent 6890系列气相色谱系统，配备有DB1-ms色谱柱，30m×0.25mm×0.25μm膜厚(P/N 122-0132,J&W scientific Inc.,Folsom,CA)，并连接至5975系列质谱仪。载气为氦气，流速为0.7mL/min。进样器以分流(1:25)模式进样，进样器温度设置为250℃。将烤箱温度从50℃(保持5分钟)编程为以5℃/min的速度加热至300℃，然后以50℃/min的速度至340℃，并保持3分钟。

实施例子1

植物材料的采购和叶片转录组测序。

来自鳞毛蕨属(Dryopteris)的植物材料是从中国北方收集的。为了确定香鳞毛蕨(Dryopteris fragrans)是否含有折叶苔醇，将其新鲜叶片用二氯甲烷萃取进行化学分析。提取物通过具有上述参数的GC/MS进行分析。产物的鉴定基于质谱和保留指数(图2和图3)。

样品ID为PNLI20141074和YGY-15-2706的香鳞毛蕨均用于转录组分析。香鳞毛蕨的总RNA使用来自QIAGEN的RNeasy Plant Mini Kit(50)74904来提取。

使用用于Illumina的

UltraTM RNA库制备试剂盒(NEB，美国)和TruSeqPE簇试剂盒(Illumina，美国)处理总RNA样品PNLI20141074，然后在Illumina Miseq测序仪上测序。生成了2088万个2x 350bp的配对末端读段。使用Trinity(http://trinityrnaseq.sf.net/)软件将这些读段组装在一起，获得了N50为1373的85753个重叠群。用EMBOSS软件(http://emboss.sourceforge.net/)分析重叠群，以获得蛋白质序列。使用来自现有技术[Y.Shinohara,S.Takahashi,H.Osada&Y.Koyama(2016)Identificationof a novel sesquiterpene biosynthetic machinery involved in astellolidebiosynthesis.Sci.Rep.6:32865(DOI:10.1038/srep32865).]的AstC的序列在香鳞毛蕨的蛋白质序列数据中搜索潜在的折叶苔醇合酶。这种方法提供了DfHAD，这是一种非典型的卤代酸-脱卤酶样水解酶的5'序列，通过CLC基因组学工作台分析，该蛋白在转录组中高度表达。

除PNLI20141074外，还使用

SMRTbell^TM模板制备试剂盒(PacBio，美国)和

DNA/聚合酶试剂盒(PacBio，美国)处理总RNA样品YGY-15-2706，然后在PacBioRS II测序仪上测序。产生了96万的平均长度2302bp的量。通过Smrtanalysis(v_2.3.0)(http://www.pacb.com)分析了这些读段，获得了N50为1448的24848个重叠群，其中包含DfHAD的3'序列。通过结合这两种方法，组装了DfHAD的推定全长，并将其用于基因克隆。

首先使用SMARTer^TM RACE cDNA扩增试剂盒(Clontech)将YGY-15-2706的总RNA样品反转录至cDNA。然后将产物用作基因克隆的模板。使用正向引物(5'-ATGGAGTTCTCTGCCTCTG-3')(SEQ ID NO:15)和反向引物(5'-GGTTTGGCTTATGGAAGGT-3')(SEQ ID NO:16)从cDNA扩增DfHAD及其变体DfHAD-8(K532R)和DfHAD-9(V274A)。如实施例2和3中所述评估DfHAD和DfHAD-8(K532R)和DfHAD-9(V274A)的酶活性。

实施例2

DfHAD在大肠杆菌表达系统中的功能性表达和表征。

通过遵循大肠杆菌的Genscript遗传密码子频率，优化了DfHAD及其变体DfHAD-8(K532R)和DfHAD-9(V274A)的序列。然后在体外合成它们，并将其亚克隆到pETDuet-1质粒(Novagen)或pJ401质粒(DNA 2.0)中，用于后续在大肠杆菌中表达。

将BL21(DE3)大肠杆菌细胞(Tiangen)与质粒pACYC-29258-4506共转化，该质粒包含编码异源甲羟戊酸途径的基因，以及质粒pETDuet-DfHAD或pETDuet-DfHAD-8(K532R)或pETDuet-DfHAD-9(V274A)。为了提高细胞的生产力，异源FPP合酶和来自完整异源甲羟戊酸(MVA)途径的酶在同一细胞中表达。包含FPP合酶基因和用于完整的MVA途径的基因的表达质粒的构建描述于专利WO2013064411或M.Schalk,L.Pastore,M.A.Mirata,S.Khim,M.Schouwey,F.Deguerry,V.Pineda,L.Rocci&L.Daviet(2012)Toward a biosyntheticroute to sclareol and amber odorants.J.Am.Chem.Soc.134,18900-3(DOI:10.1021/ja307404u)。简而言之，制备了表达质粒，其包含两个操纵子，所述操纵子由编码用于完整甲羟戊酸途径的酶的基因组成。第一个合成操纵子由大肠杆菌乙酰乙酰辅酶A硫解酶(atoB)，金黄色葡萄球菌HMG-CoA合酶(mvaS)，金黄色葡萄球菌HMG-CoA还原酶(mvaA)和酿酒酵母FPP合酶(ERG20)基因组成，其在体外(DNA2.0,Menlo Park,CA,USA)合成并连接到NcoI-BamHI消化的pACYCDuet-1载体(Invitrogen)中，产生pACYC-29258。从肺炎链球菌(ATCC BAA-334)的基因组DNA中扩增出含有甲羟戊酸激酶(MvaK1)，磷酸甲羟戊酸激酶(MvaK2)，甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基二磷酸异构酶(idi)的第二个操纵子，其连接到pACYC-29258的第二个多克隆位点，提供质粒pACYC-29258-4506。因此，该质粒包含编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。

将BL21(DE3)大肠杆菌细胞(Tiangen)与质粒pACYC/ScMVA共转化，该质粒包含编码异源甲羟戊酸途径的基因，以及质粒pETDuet-DfHAD或pETDuet-DfHAD-8(K532R)或pETDuet-DfHAD-9(V274A)。

为了构建pACYC/ScMVA质粒，我们将8个生物合成基因分为2个合成操纵子，称为“上”和“下”甲羟戊酸(MVA)途径。作为上MVA途径，我们创建了一个合成操纵子，该操纵子由atoB编码的来自大肠杆菌的乙酰乙酰-CoA硫解酶、分别由ERG13和ERG19编码的来自酿酒酵母的HMG-CoA合酶和截短形式的HMG-CoA还原酶组成。该操纵子将主要代谢物乙酰-CoA转化为(R)-甲羟戊酸酯。作为“下”甲羟戊酸途径，我们创建了第二个合成操纵子，其编码甲羟戊酸激酶(ERG12，酿酒酵母)、磷酸甲羟戊酸激酶(ERG8，酿酒酵母)、磷酸甲羟戊酸脱羧酶(MVD1，酿酒酵母)、二磷酸异戊烯酯异构酶(idi，大肠杆菌)和法呢基焦磷酸(FPP)合酶(IspA，大肠杆菌)。最后，将来自酿酒酵母的第二种FPP合酶(ERG20)引入到上途径操纵子中，以改善类异戊二烯C5单元(IPP和DMAPP)向法呢基焦磷酸(FPP)的转化。在细菌噬菌体T7启动子(pACYCDuet-1，Invitrogen)的控制下，将每个操纵子亚克隆到低拷贝表达质粒的多克隆位点之一。因此，该质粒包含编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。

在含有卡那霉素(最终浓度为50μg/mL)或氨苄青霉素(最终浓度为50μg/mL)(视情况选用)和氯霉素(最终浓度为35μg/mL)的LB琼脂平板上选择经共转化的细胞。使用单个菌落接种补充了相同抗生素的5mL液体LB培养基。将培养物在37℃下以200rpm振摇孵育过夜。第二天，将0.2mL过夜培养物接种到补充了相同抗生素和甘油(最终含量为3％w/v)的2mLTB培养基中。在37℃下孵育5小时并以200rpm振摇后，将培养物冷却至25℃，再以200rpm振摇1小时，然后将IPTG(最终0.1mM)添加到每个试管中，并覆盖以200μL的癸烷。将培养物在25℃以200rpm再孵育48小时。然后将培养物用1体积的乙酸乙酯萃取两次。将50μl的2mg/mL的异长叶烯作为内标添加到有机相中，然后通过GC/MS分析样品。GC/MS分析使用与实施例1中所述相同的系统。载气为氦气，流速恒定为0.7mL/min。进样器以分流(1:25)模式进样，进样器温度设置为250℃。将烤箱温度从50℃(保持5分钟)编程为以5℃/min的速度加热至300℃，然后以50℃/min的温度升至340℃，并保持3分钟。产品的鉴定基于质谱和保留指数。GC/MS分析表明，表达DfHAD、DfHAD-8(K532R)和DfHAD-9(V274A)的重组细胞产生的主要产物为折叶苔醇，滴度范围为0.2mg/L至3mg/L(图4和图5)。

实施例3

DfHAD在瞬时烟草表达系统中的功能性表达和表征。

将DfHAD整合到经修饰的二元载体pMTPS1中以形成pMTPS1-DfHAD。pMTPS1是基于商业质粒pCAMBIA2300(Cambia)的工程载体。将花椰菜花叶病毒(Cauliflower MosaicVirus)启动子(CaMV35S)插入到EcoRI和KpnI限制性酶切位点之间。将章鱼碱(octopine)合酶(OCS)终止子插入到PstI和HindIII之间。使用XhoI限制性内切酶通过密码子优化的原鸡(Gallus gallus)法呢基二磷酸合酶(GgFPS)替换pCAMBIA2300的转移DNA(T-Border)左右边界内的NPTII选择标记，然后进行方向确认；将由花椰菜花叶病毒35S启动子和终止子控制的番茄丛矮病毒病(Tomato bush stunt virus)的RNA沉默抑制剂P19的盒组装到HindIII位点中，以递送pMTPS1。最后，将密码子优化的DfHAD插入到SalI和PstI之间。由此形成二元载体pMTPS1，以产生底物法呢基焦磷酸(FPP)，然后将其转化为折叶苔醇。

将300ng质粒pMTPS1-DfHAD转化到根癌农杆菌(Agrobacterium tumefaciens)EHA105中。在含有卡那霉素(50μg/mL)和利福平(25μg/mL)的LB-琼脂糖平板上选择经转化的细胞，并在28℃下孵育2天。将单个菌落接种到具有相同抗生素的50mL LB中，并在28℃下在振荡器中以200rpm的速度孵育过夜。当OD600达到1.0时，将培养物在室温下以5000rpm离心10分钟。将细胞沉淀(pellet)重悬于20mL的MgSO₄(10mM)。再次离心该悬浮液，并用乙酰丁香酮(Acetosyringone)(AS)溶液(765μM)重悬该细胞沉淀，以将OD600调节至0.5。重悬液从烟草叶(本氏烟草，Nicotiana benthamiana)的背面渗透到细胞间空间中。该烟草植株先前已在28℃，12小时光照/12小时黑暗的光周期下生长4周。感染后三天，向受感染的叶子饲以甲羟戊酸(25mM)。8小时后，收获叶子样品，将约500～1000mg叶子称重到10mL Eppendorf管中，并立即在液氮中冷冻。将样品研磨成粉末，并用2mL含20μg/ml十二烷作为内标的乙酸乙酯萃取过夜。过滤每个样品，滤液用无水Na₂SO₄干燥，然后通过GC/MS分析。烟草样品用4ml乙酸乙酯萃取(加入了3.4ppm的十二烷)。通过具有上述参数的GC/MS分析提取物。此处以分流(1:5)模式进样，进样器温度设置为250℃。

在该烟草瞬时转化实验中，根据GC/MS分析中的质谱和保留指数，表达DfHAD的受感染植物产生折叶苔醇为主要峰(图6和图7)。在此实验中，折叶苔醇的收率是根据内标计算的，每克新鲜烟草叶中含有3.75μg的折叶苔醇。

实施例4

突变体DfHAD在大肠杆菌表达系统中的功能性表达和表征。

构建了一系列DfHAD突变体，以确认已鉴定的I类和II类基序对其萜合酶活性的重要性(参见图10的表)。将相应的基因插入到pJ401中，并如实施例2所述评估活性。

该实验中突出了非典型I类插入SF和非典型II类基序H的重要性：

-删除SF后活性损失90％

-当碱性残基H替换为酸性残基D时，活性损失47％

-删除SF并用D代替H时活性损失100％

可能更令人惊讶的是，用功能等同物D取代酸性残基E导致活性损失了85％。D到E和E到D的双重突变导致99％的活性损失。

实施例5

经纯化的DfHAD在体外系统中的表征。

为了纯化DfHAD以评估其体外活性，将其编码序列(针对大肠杆菌表达进行了优化)亚克隆到pGS-21a质粒(Genscript)中。将经表达的蛋白质与N末端6xHis-GST-tag(SEQID NO:18，由SEQ ID NO:17编码)融合。在BL21(DE3)大肠杆菌细胞中转化并在含有氨苄青霉素(最终浓度为50μg/mL)的LB-琼脂平板上进行选择后，将单个菌落接种到补充有相同抗生素的40mL LB培养基中，并将培养物在37℃下以180rpm孵育过夜。第二天，将5～10mL培养物接种到500mL含50mg/L氨苄青霉素的2X YT培养基中，并在37℃下以150rpm孵育约3小时(OD600＝0.7～1.2)。然后将培养物冷却至25℃保持1.5小时，并加入0.25mL的1M IPTG，然后在25℃下以150rpm孵育18小时。通过在4℃下以3500g离心15分钟来收获培养物，并用冷却的缓冲液A(50mM Na₂HPO₄，10mM咪唑，500mM NaCl，pH7.8)洗涤沉淀两次。将沉淀重悬于含有蛋白酶抑制剂的缓冲液A(不含SigmaFast EDTA，Sigma)中，并将体积调节至25mL。将25mg溶菌酶，25μL DNase I，125μL MgCl₂和60μL 0.2M PMSF添加到悬浮液中。在冰上孵育30分钟，然后进行超声处理(开启3秒，关闭12秒，总共3分钟，重复一次)后，通过在4℃和8000g下离心10分钟收集上清液。根据生产商对GST标签蛋白质的规程，在谷胱甘肽-琼脂糖(SigmaG4510)上通过分批方法纯化蛋白质。蛋白质的分子量通过SDS-PAGE估算，并与分子量标准(PAGE-MASTER Plus，Genescript)相比，相应于从DfHAD(65kDa)的氨基酸序列加上GST-Tag(21kDa)的氨基酸序列(即91kDa)计算的分子量。

为了进行DfHAD蛋白的体外生化测定，将1.5μM的纯化重组蛋白添加到2ml反应混合物中，该混合物在50mM Tris-HCl pH8.0缓冲液中包含10mM MgCl₂、5mM DTT和29μM FPP。将样品在30℃下以50rpm孵育2小时。然后将样品分成两部分，并在其中一个中加入20μL细菌碱性磷酸酶(BAP)(Sangon-B004081-100)，并在25℃下继续反应1小时。BAP酶E.C.3.1.3.1源自大肠杆菌，其序列信息可从Genbank登录号M13345获得。在相同条件下也运行不添加蛋白质的对照。为了进行GC/MS分析，将10μL的2mg/mL的异长叶烯(内标)添加到作为内标的0.5mL等分试样中。然后将反应物用0.25mL乙酸乙酯萃取，并如前所述进行GC/MS。

通过GC-MS分析后，如图8所示，我们无法检测到任何折叶苔醇。由于先前的体内测定成功，并且细菌提取物中含有来自大肠杆菌的磷酸酶，因此我们推测这可能是由于该酶形成了折叶苔基二磷酸而不是折叶苔醇，与AstC的催化性能相当。因此，我们在细菌碱性磷酸酶(BAP)存在的情况下进行了相同的实验(图8)。确实，添加这种商业磷酸酶使我们能够检测样品中的折叶苔醇，以及由FPP形成法尼醇，这表明通过质子化引发的机制形成了折叶苔基二磷酸。

实施例6

折叶苔基二磷酸和单磷酸的合成

这些合成基于以前的两篇出版物：Lira LM et al(2013),Tetrahedron Lett,54,1690-1692；Thulasiram HV et al(2006),J Org Chem,71,1739-1741。

折叶苔基二磷酸的制备

在室温下，向折叶苔醇(64mg，0.288mmol)在2,2,2-三氯乙腈(0.721ml，7.20mmol)中的溶液中添加0.70mL的TEAP(磷酸双三乙基铵，见注1)。以5分钟间隔添加两次0.720mL的TEAP。将所得混合物搅拌3小时。然后将其加载到硅胶柱上，先后用150mL的100％乙酸乙酯和90mL异丙醇:NH₄OH:H₂O(6.0:2.5:0.5)的混合物洗脱，分别得到级分1(废弃)和级分2。在减压下浓缩级分2，并用10mL的10％MeOH/H₂O混合物稀释。将得到的混合物上样至预先调节(见注2)的Waters SPE：Oasis MCX 6cc(500mg)LP萃取柱，先后用20mL的10％MeOH/H₂O洗脱，得到级分1和2，然后用20mL的50％MeOH/H₂O洗脱，得到级分3和4。合并级分3和4，并冻干，得到灰白色固体折叶苔基二磷酸(35mg，0.092mmol，31％)。

注：

1)通过将2mL磷酸在7.82mL乙腈中的0.91mL溶液和4.4mL三乙胺在4.0mL乙腈中的1.5mL溶液混合来制备TEAP(J Org Chem,71,1739-1741)。

2)该柱首先用5mL MeOH洗脱，然后再用5mL H₂O洗脱。

折叶苔基单磷酸的制备

将磷酸四丁基二氢铵(133mg，0.391mmol)添加到包含折叶苔醇(87mg，0.391mmol)和2,2,2-三氯乙腈(1ml，9.97mmol)的圆底烧瓶中。将所得混合物搅拌48小时。然后将其加载到硅胶柱上，先后用150mL乙酸乙酯和90mL异丙醇:NH₄OH:H₂O(6.0:2.5:0.5)混合物洗脱，分别得到级分1(丢弃)和2。在减压下浓缩级分2(直到剩余约12mL的液体)，加载到预先调节(见注1)的DOWEX50WX8-2柱上，并用100mL的0.025M NH₄HCO₃溶液洗涤。收集所得到的滤液并冻干，得到呈“粘性”白色固体的折叶苔基单磷酸(见注2)(9mg，0.025mmol，7％)。

注：

1)将一根色谱柱(高21厘米，直径3.5厘米)填充到5厘米深的Dowex 50WX8离子交换珠中，首先用NH₄OH/H₂O 3:1混合物(60mL，警告：放热)冲洗，然后用0.025M NH₄HCO₃溶液(120mL或直到滤液的pH在8.5至9.5之间)冲洗。

2)用14％的折叶苔基二磷酸污染。

实施例7

高分辨率质谱法检测作为DfHAD酶产物的折叶苔基二磷酸和单磷酸

从培养液中制备大肠杆菌提取物

通过大肠杆菌的遗传密码子频率来优化DfHAD的序列。然后在体外合成，并亚克隆到pETDuet-1质粒(Novagen)中，随后在大肠杆菌BL21(DE3)中表达。还用质粒pACYC/ScMVA(包含编码异源甲羟戊酸途径的基因)和质粒pETDuet-DfHAD共转化了大肠杆菌细胞(Tiangen)。在含有氨苄青霉素(最终浓度为50μg/mL)和氯霉素(最终浓度为34μg/mL)的LB琼脂平板上选择经共转化的细胞。使用单个菌落接种补充了相同抗生素的5mL液体LB培养基。将培养物在37℃下以200rpm振摇孵育过夜。第二天，将2mL过夜培养物接种到200mL补充有相同抗生素和甘油(最终浓度为3％w/v)的AM+5Y培养基中。在37℃下孵育5小时并以200rpm振摇后，将培养物冷却至25℃，再以200rpm振摇1小时，然后将IPTG(最终0.1mM)添加到每个烧瓶中。将培养物在25℃以200rpm再孵育48小时。

将培养物超声处理并离心。在上样至SPE色谱柱之前，先用氨水将培养上清液的pH调节至8.0。用10mL MeOH和15mL 10mM NH₄HCO₃调节Sep-Pak C18柱(6cc/500mg，Waters，MA)，并将40mL培养样品上样至SPE色谱柱。然后用3mL MeOH/10mM NH₄HCO₃(90/10，v/v)洗脱该柱。洗脱液用0.22μm亲水性PTFE注射器式过滤器过滤，用于UHPLC Q-Exactive MS分析。

分析方法：UHPLC Q-Exactive MS分析

分析中使用了Vanquish超高效液相色谱仪，其与Q Exactive plus混合四极杆-轨道质谱仪(Thermo Fisher Scientific)联用。

UHPLC在Luna 3μm C18(100mm×2mm)色谱柱(Phenomenex，美国)上进行，流速为0.3mL/min。流动相由A：5mM HCOONH₄(可通过氨水调节至pH 8.0)和B乙腈组成。用线性梯度洗脱：0～0.5分钟，15％B；0.5～7分钟，15％～80％B；7.01～10.5分钟，98％B，10.6～13.0分钟，98％～15％。柱温设定为35℃，进样量为1μL。Q-Exactive MS系统使用HESI源以负电离模式(ESI-)运行，并以目标SIM-ddMS²模式或目标SIM模式进行采集。HESI的参数如下：鞘气流量48，辅助气体流量11，喷雾电压3.8KV，毛细管温度320℃和辅助加热器温度300℃。目标SIM模式的参数如下：分辨率35,000，AGC目标5e4，最大IT 100毫秒，循环计数5，隔离窗口4.0m/z。倍半萜二磷酸和单磷酸的夹杂物质量设定为381.1237[M-H]^-和301.1574[M-H]^-。在dd-MS²的设置中，分辨率为17,500，步进nce为20、35、50。

通过EIC 381.1237或301.1574面积的计算将倍半萜单磷酸和二磷酸半定量。用EIC 381.1237面积和FPP标准浓度绘制FPP标准曲线。由于低浓度的FPP不稳定，因此在样品分析的同一天新鲜制备FPP标准溶液。

大肠杆菌提取物的分析结果

在表达大肠杆菌菌株的DfHAD的发酵中，通过准确的分子量、特征性碎片离子和合成标准品，鉴定出了折叶苔基二磷酸、折叶苔基单磷酸、FPP(法呢基二磷酸)和FMP(法呢基单磷酸)。折叶苔基二磷酸(52.7ng/mL)和FPP(48.3ng/mL)处于痕量水平，而折叶苔基单磷酸(2.9μg/mL)和FMP(4.8μg/mL)占主导，与折叶苔醇(2.1μg/mL)和法尼醇(10.5μg/mL)相似(图12)。

体外生化测定法检测折叶苔基二磷酸和单磷酸

为了纯化DfHAD，将其编码序列(针对大肠杆菌表达进行了优化)亚克隆到经修饰的质粒pGS-21a(Genscript)中。修饰质粒以允许基因在KpnI和NdeI限制性位点之间插入。将经表达的蛋白质与N末端6xHis-GST-tag融合。在BL21(DE3)大肠杆菌细胞中转化并在含有氨苄青霉素(最终浓度为50μg/mL)的LB琼脂平板上进行选择后，将单个菌落接种到补充有相同抗生素的40mL LB培养基中，并将培养物在37℃下以180rpm孵育过夜。第二天，将5～10mL培养物接种到500mL含50mg/L氨苄青霉素的2X YT培养基中，并在37℃下以150rpm孵育约3小时(OD600＝0.7～1.2)。然后将培养物冷却至25℃保持1.5小时，并加入0.25mL的1MIPTG，然后在25℃下以150rpm孵育18小时。通过在4℃下以3500g离心15分钟来收获培养物，并用冷却的缓冲液A(50mM Na₂HPO₄，10mM咪唑，500mM NaCl，pH7.8)洗涤沉淀两次。将沉淀重悬于含有蛋白酶抑制剂的缓冲液A(不含SigmaFast EDTA，Sigma)中，并将体积调节至25mL。将25mg溶菌酶，25μL DNase I，125μL MgCl₂和60μL 0.2M PMSF添加到悬浮液中。在冰上孵育30分钟，然后进行超声处理(开启3秒，关闭12秒，总共3分钟，重复一次)后，通过在4℃和8000g下离心10分钟收集上清液。根据生产商对GST标签蛋白质的规程，在谷胱甘肽-琼脂糖(Sigma G4510)上通过分批方法纯化蛋白质。

为了进行DfHAD蛋白的体外生化测定，将1.5μM的纯化重组蛋白添加到2ml反应混合物中，该混合物在50mM Tris-HCl pH 8.0缓冲液中含有10mM MgCl₂、5mM DTT和128μMFPP。将样品在30℃下以50rpm下孵育2小时。然后将样品分成两部分，并在其中一个中添加20μL细菌碱性磷酸酶(Sangon-B004081-100)，并在25℃下继续反应1小时。在相同条件下也运行不添加蛋白质的对照。

DfHAD体外测定的分析结果

体外测定中同时鉴定了折叶苔基二磷酸和折叶苔基单磷酸(图13)。观察到了20:1的折叶苔基二磷酸:折叶苔基单磷酸，以及FPP和法呢基单磷酸(FMP)，而未检测到折叶苔醇(表1)。倍半萜二磷酸例如折叶苔基二磷酸和FPP是不稳定的，并且容易降解为它们的单磷酸酯。体外生化测定中的折叶苔基单磷酸和FMP可能是它们各自的二磷酸酯前体的降解产物。

加入磷酸酶BAP后，未观察到倍半萜磷酸酯，而检测到折叶苔醇和法呢醇。因此，DfHAD的主要产物是折叶苔基二磷酸，而折叶苔醇是从折叶苔基二磷酸通过一种或两种磷酸酶产生的。

表1.倍半萜磷酸酯和倍半萜的浓度(μg/mL)

a：未检测到

实施例8

DfHAD酶突变体的制备及其体外活性的确定

天然DfHAD的氨基酸序列(SEQ ID NO:2)被修饰为特定的保守氨基酸序列基序，以确定这些基序对于酶活性的关键性。

为此，由商业供应商制备了SEQ ID NO:2的天然DfHAD酶的4种不同突变体的合成基因。基因在体外表达，然后如以上实施例2中所述测定活性。特别地，通过GC/MS确定折叶苔醇的浓度(mg/L/OD)。结果总结在随后的表2中。

表2：DfHAD酶突变体及其酶活性

天然基序：DSFDSLE(SEQ ID NO:13)；QCKSKGCW(SEQ ID NO:24)和DGILQVYFDVERPRIDPVVVAN(SEQ ID NO:25)

实验结果清楚地表明，每个上述序列基序对于相同的活性都是至关重要的。将经修饰的I类基序(SEQ ID NO:14)改变为SEQ ID NO:29可导致几乎完全的活性丧失。这种将天然合酶基序III(SEQ ID NO:24)改变为SEQ ID NO:26的方法显著降低了酶活性，而通过各自保守的真菌基序SEQ ID NO:27的交换导致酶活性加倍。突变天然合酶基序IV(SEQ IDNO:25)可能导致活性完全丧失。

本文交叉引用的文件的内容通过引用并入于此。

表3：本文所指的序列是：

NA＝核酸

AA＝氨基酸

序列

针对DfHAD的编码序列(SEQ ID NO:1)

ATGGAGTTCTCTGCCTCTGCTCCTCCTCCTAGGCTAGCCAGTGTCATAATATTGGAGCCTCTCGGCTTCCTCCTCACACCACACTACTCCTCTCAGCTTCCCAAAAAGCTGCTCCGTCGCCTGTTGTGCACTAGAATCTGGCACAGGTATCAGCGAGGCCGCCTTCGCCTGCGTGACGCTGCTATGCTGCTCGCCCAGCTCCCATTCCTAGCTGTGTCTGATCACCCCTGGGCTCTGGACAATCTCGCAAGCCTGCTCCGCCCCACAGCTGTGCGTGCGGTGCCATGGATGCTGCTGCTGCTCGACTTCCTACGAGACGAGCTCCATCTGAAGGTAGTCTGCGCGACCAACTCCTCCCCAGAAGAGCTGCAAGAGCTGCGCCACCAGTTTCCGGCCCTCTTTGCCAAGGTCGATGCCACCGTTTCTTCAGGCGAGGAGGGCGTGGGCAAGCCGTCCGTGCGCTTCCTGCAGGCTGCGTTGGACAAAGCCGGTGTCCACGCGCAGCAAACCTTGTATCTTGACTCTTTTGACAGCTTGGAGACCATCATGGCTGCACGCTCTCTTGGCATGCATGCACTATCTGTAGAGCCATGCCACATTGATGAGCTCACCGCCAGGGCCTCTTCCGGCCAGCTAAGAGATGCACAGCTTATAAGGCGTATTGTGTGCGCCATGCACGGGCCAGCAGTATCTGCAGTTGTGTCGGGCAGTATCACATCGTCCGGCCCACAGACAGCAAAGATCGAGGAATTGCCAACAGCTGCTGATAGTCATCTCCGCAGCGCAGCTCTCACTTCTGCTCAGCAGTTTTTCCTCAAAGTTATTGCTCCACATCGTCCTGAGAAGCCATTCGTCCAGCTTCCATCTCTCACCTCGGAGGGCATCCGAATATACGACACCTTTGCACAGTTTGTCATAGCCGACCTGCTCGACGACACCCGCTTCCTACCCATGCAATCTCCTCCTCCCAATGGGCTCATCACCTTTGTTAACCCAAGCGCGTACCTTGCTGATGATATAAAGAATGGCAACAGCCATATTGTCCCGGGTGTGCAATTTTACGCATCCGATGCGTGCACTCTCATCGACATCCCACATGACCTAGACACCACCTCCGTTGGCTTGTCAGTACTGCACAAGTTTGGAAAGGTGGACAAGGACACACTCAACAAAGTGCTAGACAGAATGCTCGAGCAAGTGAGTGAAGACGACGGCATTCTGCAGGTGTATTTTGATGTGGAGCGTCCGCGCATCGATCCAGTTGTGGTGGCAAACACGGTGTTTCTGTTCCACTTGGGAAAGAGAGGGCATGAGGTGGCGAGGAGTGAGAAGTTTGTGGAGAGTGTGCTGCTGCAGAGGGCATACGAAGAAGGGACGTTGTATTACAACCTGGGGGAAGCATTTTTGGTGAGTGTGGCGAGGCTGGTGCACGAGTTTAAGGAGCACTTTACAAGGAGCGGCATGAGGAGGGCACTGGAGGAGAGGCTAAGAGAGCGGGCAAGGGCGGGCATGCAAGAGAGGGATGATGCGCTGGCGCTAGCCATGCGCATTCGTGCATGCGCTTTGTGTGGCCTGGCCGGAGAGGGCCTCACAAAAGCAGCAGAGCAGGAGCTTTTGCGCCTGCAGTGCAAGTCCAAGGGCTGTTGGGGGTGCCACCCTTTCTATCGCAATGGCAGTAATGTGCTCAGCTGGATCGGCAGTGAGGCCCTTACCACTGCTTACGCTATTGCTGCGCTACAGCCCATTGATATTTAA

针对DfHAD的氨基酸序列(SEQ ID NO:2)

MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI

针对DfHAD-8(K532R)的编码序列(SEQ ID NO:3)

ATGGAGTTCTCTGCCTCTGCTCCTCCTCCTAGGCTAGCCAGTGTCATAATATTGGAGCCTCTCGGCTTCCTCCTCACACCACACTACTCCTCTCAGCTTCCCAAAAAGCTGCTCCGTCGCCTGTTGTGCACTAGAATCTGGCACAGGTATCAGCGAGGCCGCCTTCGCCTGCGTGACGCTGCTATGCTGCTCGCCCAGCTCCCATTCCTAGCTGTGTCTGATCACCCCTGGGCTCTGGACAATCTCGCAAGCCTGCTCCGCCCCACAGCTGTGCGTGCGGTGCCATGGATGCTGCTGCTGCTCGACTTCCTACGAGACGAGCTCCATCTGAAGGTAGTCTGCGCGACCAACTCCTCCCCAGAAGAGCTGCAAGAGCTGCGCCACCAGTTTCCGGCCCTCTTTGCCAAGGTCGATGCCACCGTTTCTTCAGGCGAGGAGGGCGTGGGCAAGCCGTCCGTGCGCTTCCTGCAGGCTGCGTTGGACAAAGCCGGTGTCCACGCGCAGCAAACCTTGTATCTTGACTCTTTTGACAGCTTGGAGACCATCATGGCTGCACGCTCTCTTGGCATGCATGCACTATCTGTAGAGCCATGCCACATTGATGAGCTCACCGCCAGGGCCTCTTCCGGCCAGCTAAGAGATGCACAGCTTATAAGGCGTATTGTGTGCGCCATGCACGGGCCAGCAGTATCTGCAGTTGTGTCGGGCAGTATCACATCGTCCGGCCCACAGACAGCAAAGATCGAGGAATTGCCAACAGCTGCTGATAGTCATCTCCGCAGCGCAGCTCTCACTTCTGCTCAGCAGTTTTTCCTCAAAGTTATTGCTCCACATCGTCCTGAGAAGCCATTCGTCCAGCTTCCATCTCTCACCTCGGAGGGCATCCGAATATACGACACCTTTGCACAGTTTGTCATAGCCGACCTGCTCGACGACACCCGCTTCCTACCCATGCAATCTCCTCCTCCCAATGGGCTCATCACCTTTGTTAACCCAAGCGCGTACCTTGCTGATGATATAAAGAATGGCAACAGCCATATTGTCCCGGGTGTGCAATTTTACGCATCCGATGCGTGCACTCTCATCGACATCCCACATGACCTAGACACCACCTCCGTTGGCTTGTCAGTACTGCACAAGTTTGGAAAGGTGGACAAGGACACACTCAACAAAGTGCTAGACAGAATGCTCGAGCAAGTGAGTGAAGACGACGGCATTCTGCAGGTGTATTTTGATGTGGAGCGTCCGCGCATCGATCCAGTTGTGGTGGCAAACACGGTGTTTCTGTTCCACTTGGGAAAGAGAGGGCATGAGGTGGCGAGGAGTGAGAAGTTTGTGGAGAGTGTGCTGCTGCAGAGGGCATACGAAGAAGGGACGTTGTATTACAACCTGGGGGAAGCATTTTTGGTGAGTGTGGCGAGGCTGGTGCACGAGTTTAAGGAGCACTTTACAAGGAGCGGCATGAGGAGGGCACTGGAGGAGAGGCTAAGAGAGCGGGCAAGGGCGGGCATGCAAGAGAGGGATGATGCGCTGGCGCTGGCCATGCGCATTCGTGCATGCGCTTTGTGTGGCCTGGCCGGAGAGGGCCTCACAAGAGCAGCAGAGCAGGAGCTACTGCGCCTGCAGTGCAAGTCCAAGGGCTGTTGGGGGTGCCACCCTTTCTATCGCAATGGCAGTAATGTGCTCAGCTGGATCGGCAGTGAGGCCCTTACCACTGCTTACGCTATTGCTGCGCTACAGCCCATTGATATTTAA

针对DfHAD-8(K532R)的氨基酸序列(SEQ ID NO:4)

MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTRAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI

针对DfHAD-9(V274A)的编码序列(SEQ ID NO:5)

ATGGAGTTCTCTGCCTCTGCTCCTCCTCCTAGGCTAGCCAGTGTCATAATATTGGAGCCTCTCGGCTTCCTCCTCACACCACACTACTCCTCTCAGCTTCCCAAAAAGCTGCTCCGTCGCCTGTTGTGCACTAGAATCTGGCACAGGTATCAGCGAGGCCGCCTTCGCCTGCGTGACGCTGCTATGCTGCTCGCCCAGCTCCCATTCCTAGCTGTGTCTGATCACCCCTGGGCTCTGGACAATCTCGCAAGCCTGCTCCGCCCCACAGCTGTGCGTGCGGTGCCATGGATGCTGCTGCTGCTCGACTTCCTACGAGACGAGCTCCATCTGAAGGTAGTCTGCGCGACCAACTCCTCCCCAGAAGAGCTGCAAGAGCTGCGCCACCAGTTTCCGGCCCTCTTTGCCAAGGTCGATGCCACCGTTTCTTCAGGCGAGGAGGGCGTGGGCAAGCCGTCCGTGCGCTTCCTGCAGGCTGCGTTGGACAAAGCCGGTGTCCACGCGCAGCAAACCTTGTATCTTGACTCTTTTGACAGCTTGGAGACCATCATGGCTGCACGCTCTCTTGGCATGCATGCACTATCTGTAGAGCCATGCCACATTGATGAGCTCACCGCCAGGGCCTCTTCCGGCCAGCTAAGAGATGCACAGCTTATAAGGCGTATTGTGTGCGCCATGCACGGGCCAGCAGTATCTGCAGTTGTGTCGGGCAGTATCACATCGTCCGGCCCACAGACAGCAAAGATCGAGGAATTGCCAACAGCTGCTGATAGTCATCTCCGCAGCGCAGCTCTCACTTCTGCTCAGCAGTTTTTCCTCAAAGCTATTGCTCCACATCGTCCTGAGAAGCCATTCGTCCAGCTTCCATCTCTCACCTCGGAGGGCATCCGAATATACGACACCTTTGCACAGTTTGTCATAGCCGACCTGCTCGACGACACCCGCTTCCTACCCATGCAATCTCCTCCTCCCAATGGGCTCATCACCTTTGTTAACCCAAGCGCGTACCTTGCTGATGATATAAAGAATGGCAACAGCCATATTGTCCCGGGTGTGCAATTTTACGCATCTGATGCGTGCACTCTCATCGACATCCCACATGACCTAGACACCACCTCCGTTGGCTTGTCAGTACTGCACAAGTTTGGAAAGGTGGACAAGGACACACTCAACAAAGTGCTAGACAGAATGCTGGAGCAAGTGAGTGAAGACGACGGCATTCTCCAGGTGTATTTTGATGTGGAGCGTCCGCGCATCGATCCAGTTGTGGTGGCAAACACGGTGTTTCTGTTCCACTTGGGAAAGAGAGGGCATGAGGTGGCGAGGAGTGAGAAGTTTGTGGAGAGTGTGCTGCTGCAGAGGGCATACGAAGAAGGGACGTTGTATTACAACCTGGGGGAAGCATTTTTGGTGAGTGTGGCGAGGCTGGTGCACGAGTTTAAGGAGCACTTTACAAGGAGCGGCATGAGGAGGGCACTGGAGGAGAGGCTAAGAGAGCGGGCAAGGGCGGGCATGCAAGAGAGGGATGATGCGCTGGCGCTGGCCATGCGCATTCGTGCATGCGCTTTGTGTGGCCTGGCCGGAGAGGGCCTCACAAAAGCAGCAGAGCAGGAGCTACTGCGCCTGCAGTGCAAGTCCAAGGGCTGTTGGGGGTGCCACCCTTTCTATCGCAATGGCAGTAATGTGCTCAGCTGGATCGGCAGTGAGGCCCTTACCACTGCTTACGCTATTGCTGCGCTACAGCCCATTGATATTTAA

针对DfHAD-9(V274A)的氨基酸序列(SEQ ID NO:6)

MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKAIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI

通过大肠杆菌的Genscript遗传密码子频率对DfHAD进行密码子优化的序列(SEQID NO:7)

ATGGAGTTCAGCGCGAGCGCTCCGCCGCCGCGTCTGGCGAGCGTGATCATTCTGGAACCGCTGGGTTTTCTGCTGACCCCGCACTACAGCAGCCAGCTGCCGAAGAAACTGCTGCGTCGTCTGCTGTGCACCCGTATCTGGCACCGTTATCAGCGTGGCCGTCTGCGTCTGCGTGACGCGGCGATGCTGCTGGCGCAACTGCCGTTCCTGGCGGTTAGCGACCACCCGTGGGCGCTGGATAACCTGGCGAGCCTGCTGCGTCCGACCGCGGTTCGTGCGGTGCCGTGGATGCTGCTGCTGCTGGACTTTCTGCGTGATGAGCTGCACCTGAAAGTGGTTTGCGCGACCAACAGCAGCCCGGAGGAACTGCAGGAACTGCGTCACCAATTCCCGGCGCTGTTTGCGAAGGTTGACGCGACCGTGAGCAGCGGCGAGGAAGGTGTTGGCAAACCGAGCGTGCGTTTCCTGCAAGCGGCGCTGGATAAGGCGGGCGTGCACGCGCAGCAAACCCTGTACCTGGACAGCTTTGATAGCCTGGAGACCATCATGGCGGCGCGTAGCCTGGGTATGCACGCGCTGAGCGTTGAGCCGTGCCACATTGACGAACTGACCGCGCGTGCGAGCAGCGGTCAGCTGCGTGATGCGCAACTGATCCGTCGTATTGTTTGCGCGATGCACGGTCCGGCTGTGAGCGCGGTGGTTAGCGGTAGCATCACCAGCAGCGGTCCGCAGACCGCGAAAATTGAGGAACTGCCGACCGCGGCGGACAGCCACCTGCGTAGCGCGGCGCTGACCAGCGCGCAGCAATTCTTTCTGAAAGTGATTGCGCCGCACCGTCCGGAGAAGCCGTTCGTTCAACTGCCGAGCCTGACCAGCGAAGGTATCCGTATTTATGACACCTTCGCGCAGTTTGTGATCGCGGATCTGCTGGACGATACCCGTTTCCTGCCGATGCAAAGCCCGCCGCCGAACGGCCTGATTACCTTTGTTAACCCGAGCGCGTACCTGGCGGACGATATCAAAAACGGTAACAGCCACATTGTTCCGGGCGTGCAGTTCTATGCGAGCGACGCGTGCACCCTGATCGATATTCCGCACGACCTGGATACCACCAGCGTTGGTCTGAGCGTGCTGCACAAGTTTGGCAAAGTTGACAAGGATACCCTGAACAAGGTGCTGGATCGTATGCTGGAGCAAGTTAGCGAAGACGATGGTATCCTGCAAGTTTACTTTGACGTGGAGCGTCCGCGTATTGATCCGGTGGTTGTGGCGAACACCGTGTTCCTGTTTCACCTGGGTAAACGTGGCCACGAAGTTGCGCGTAGCGAGAAGTTCGTTGAAAGCGTGCTGCTGCAGCGTGCGTACGAGGAAGGCACCCTGTACTATAACCTGGGCGAAGCGTTTCTGGTTAGCGTGGCGCGTCTGGTGCACGAGTTCAAAGAACACTTTACCCGTAGCGGTATGCGTCGTGCGCTGGAGGAACGTCTGCGTGAGCGTGCGCGTGCGGGTATGCAAGAACGTGACGATGCGCTGGCGCTGGCGATGCGTATCCGTGCGTGCGCGCTGTGCGGTCTGGCGGGCGAGGGTCTGACCAAGGCGGCGGAGCAGGAACTGCTGCGTCTGCAATGCAAGAGCAAAGGTTGCTGGGGCTGCCACCCGTTCTACCGTAACGGTAGCAACGTTCTGAGCTGGATCGGCAGCGAAGCGCTGACCACCGCGTATGCGATTGCGGCGCTGCAGCCGATCGACATTTAA

通过烟草的Genscript遗传密码子频率对DfHAD进行密码子优化的序列(SEQ IDNO:8)

ATGGAATTTTCTGCTTCAGCTCCACCTCCAAGACTTGCTTCAGTTATTATTCTTGAGCCTTTGGGATTTCTTTTGACTCCACATTACTCTTCACAATTGCCTAAGAAACTTTTGAGAAGGCTTTTGTGTACAAGAATTTGGCATAGGTACCAAAGGGGTAGGCTTAGATTGAGGGATGCTGCTATGCTTTTGGCTCAACTTCCATTTTTGGCTGTTTCAGATCATCCTTGGGCTCTTGATAATTTGGCTTCTCTTTTGAGACCAACTGCTGTTAGGGCTGTTCCTTGGATGCTTTTGCTTTTGGATTTTCTTAGAGATGAACTTCATTTGAAGGTTGTTTGCGCTACTAATTCTTCACCAGAAGAGCTTCAAGAGTTGAGGCATCAATTTCCTGCTTTGTTTGCTAAGGTTGATGCTACAGTTTCTTCAGGAGAAGAGGGAGTTGGTAAACCATCTGTTAGATTTCTTCAAGCTGCTTTGGATAAGGCTGGTGTTCATGCTCAACAAACTCTTTATTTGGATTCTTTCGATTCACTTGAAACAATTATGGCTGCTAGGTCATTGGGAATGCATGCTCTTTCTGTTGAACCATGTCATATTGATGAGTTGACTGCTAGAGCTTCTTCAGGACAATTGAGGGATGCTCAACTTATTAGAAGGATTGTTTGCGCTATGCATGGTCCTGCTGTTTCAGCTGTTGTTTCTGGATCAATTACTTCTTCAGGTCCACAAACAGCTAAAATTGAAGAGCTTCCTACTGCTGCTGATTCTCATTTGAGATCAGCTGCTCTTACATCTGCTCAACAATTTTTCCTTAAAGTTATTGCTCCACATAGACCTGAAAAGCCATTTGTTCAACTTCCTTCTTTGACTTCAGAGGGAATCAGGATCTATGATACATTCGCTCAATTCGTTATCGCTGATCTTTTGGATGATACTAGGTTTTTGCCAATGCAATCACCTCCACCTAATGGTCTTATCACATTCGTTAACCCTTCTGCTTATTTGGCTGATGATATTAAAAATGGTAACTCACATATTGTTCCAGGTGTTCAATTTTACGCTTCTGATGCTTGTACTTTGATTGATATTCCTCATGATCTTGATACTACATCTGTTGGACTTTCAGTTTTGCATAAGTTCGGTAAAGTTGATAAGGATACACTTAATAAGGTTTTGGATAGAATGCTTGAACAAGTTTCAGAGGATGATGGAATCCTTCAAGTTTACTTCGATGTTGAAAGACCTAGGATTGATCCAGTTGTTGTTGCTAACACTGTTTTTCTTTTCCATTTGGGAAAAAGAGGTCATGAGGTTGCTAGATCAGAAAAGTTTGTTGAGTCTGTTCTTTTGCAAAGAGCTTACGAAGAGGGAACTTTGTATTACAATCTTGGTGAAGCTTTTCTTGTTTCTGTTGCTAGACTTGTTCATGAGTTTAAGGAGCATTTTACAAGGTCTGGAATGAGAAGGGCTTTGGAAGAGAGACTTAGGGAAAGAGCTAGGGCTGGTATGCAAGAGAGAGATGATGCTCTTGCTTTGGCTATGAGAATTAGGGCTTGTGCTCTTTGCGGTTTGGCTGGAGAAGGTCTTACAAAGGCTGCTGAACAAGAGCTTTTGAGATTGCAATGCAAGTCTAAAGGATGTTGGGGTTGCCATCCATTCTACAGGAATGGTTCTAACGTTTTGTCATGGATTGGTTCTGAGGCTCTTACTACAGCTTACGCTATTGCTGCTCTTCAACCTATTGATATTTGA

通过大肠杆菌的Genscript遗传密码子频率对DfHAD-8(K532R)进行密码子优化的序列(SEQ ID NO:9)

ATGGAGTTCAGCGCGAGCGCTCCGCCGCCGCGTCTGGCGAGCGTGATCATTCTGGAACCGCTGGGTTTTCTGCTGACCCCGCACTACAGCAGCCAGCTGCCGAAGAAACTGCTGCGTCGTCTGCTGTGCACCCGTATCTGGCACCGTTATCAGCGTGGCCGTCTGCGTCTGCGTGACGCGGCGATGCTGCTGGCGCAACTGCCGTTCCTGGCGGTTAGCGACCACCCGTGGGCGCTGGATAACCTGGCGAGCCTGCTGCGTCCGACCGCGGTTCGTGCGGTGCCGTGGATGCTGCTGCTGCTGGACTTTCTGCGTGATGAGCTGCACCTGAAAGTGGTTTGCGCGACCAACAGCAGCCCGGAGGAACTGCAGGAACTGCGTCACCAATTCCCGGCGCTGTTTGCGAAGGTTGACGCGACCGTGAGCAGCGGCGAGGAAGGTGTTGGCAAACCGAGCGTGCGTTTCCTGCAAGCGGCGCTGGATAAGGCGGGCGTGCACGCGCAGCAAACCCTGTACCTGGACAGCTTTGATAGCCTGGAGACCATCATGGCGGCGCGTAGCCTGGGTATGCACGCGCTGAGCGTTGAGCCGTGCCACATTGACGAACTGACCGCGCGTGCGAGCAGCGGTCAGCTGCGTGATGCGCAACTGATCCGTCGTATTGTTTGCGCGATGCACGGTCCGGCTGTGAGCGCGGTGGTTAGCGGTAGCATCACCAGCAGCGGTCCGCAGACCGCGAAAATTGAGGAACTGCCGACCGCGGCGGACAGCCACCTGCGTAGCGCGGCGCTGACCAGCGCGCAGCAATTCTTTCTGAAAGTGATTGCGCCGCACCGTCCGGAGAAGCCGTTCGTTCAACTGCCGAGCCTGACCAGCGAAGGTATCCGTATTTATGACACCTTCGCGCAGTTTGTGATCGCGGATCTGCTGGACGATACCCGTTTCCTGCCGATGCAAAGCCCGCCGCCGAACGGCCTGATTACCTTTGTTAACCCGAGCGCGTACCTGGCGGACGATATCAAAAACGGTAACAGCCACATTGTTCCGGGCGTGCAGTTCTATGCGAGCGACGCGTGCACCCTGATCGATATTCCGCACGACCTGGATACCACCAGCGTTGGTCTGAGCGTGCTGCACAAGTTTGGCAAAGTTGACAAGGATACCCTGAACAAGGTGCTGGATCGTATGCTGGAGCAAGTTAGCGAAGACGATGGTATCCTGCAAGTTTACTTTGACGTGGAGCGTCCGCGTATTGATCCGGTGGTTGTGGCGAACACCGTGTTCCTGTTTCACCTGGGTAAACGTGGCCACGAAGTTGCGCGTAGCGAGAAGTTCGTTGAAAGCGTGCTGCTGCAGCGTGCGTACGAGGAAGGCACCCTGTACTATAACCTGGGCGAAGCGTTTCTGGTTAGCGTGGCGCGTCTGGTGCACGAGTTCAAAGAACACTTTACCCGTAGCGGTATGCGTCGTGCGCTGGAGGAACGTCTGCGTGAGCGTGCGCGTGCGGGTATGCAAGAACGTGACGATGCGCTGGCGCTGGCGATGCGTATCCGTGCGTGCGCGCTGTGCGGTCTGGCGGGCGAGGGTCTGACCCGGGCGGCGGAGCAGGAACTGCTGCGTCTGCAATGCAAGAGCAAAGGTTGCTGGGGCTGCCACCCGTTCTACCGTAACGGTAGCAACGTTCTGAGCTGGATCGGCAGCGAAGCGCTGACCACCGCGTATGCGATTGCGGCGCTGCAGCCGATCGACATTTAA

通过大肠杆菌的Genscript遗传密码子频率对DfHAD-9(V274A)进行密码子优化的序列(SEQ ID NO:10)

ATGGAGTTCAGCGCGAGCGCTCCGCCGCCGCGTCTGGCGAGCGTGATCATTCTGGAACCGCTGGGTTTTCTGCTGACCCCGCACTACAGCAGCCAGCTGCCGAAGAAACTGCTGCGTCGTCTGCTGTGCACCCGTATCTGGCACCGTTATCAGCGTGGCCGTCTGCGTCTGCGTGACGCGGCGATGCTGCTGGCGCAACTGCCGTTCCTGGCGGTTAGCGACCACCCGTGGGCGCTGGATAACCTGGCGAGCCTGCTGCGTCCGACCGCGGTTCGTGCGGTGCCGTGGATGCTGCTGCTGCTGGACTTTCTGCGTGATGAGCTGCACCTGAAAGTGGTTTGCGCGACCAACAGCAGCCCGGAGGAACTGCAGGAACTGCGTCACCAATTCCCGGCGCTGTTTGCGAAGGTTGACGCGACCGTGAGCAGCGGCGAGGAAGGTGTTGGCAAACCGAGCGTGCGTTTCCTGCAAGCGGCGCTGGATAAGGCGGGCGTGCACGCGCAGCAAACCCTGTACCTGGACAGCTTTGATAGCCTGGAGACCATCATGGCGGCGCGTAGCCTGGGTATGCACGCGCTGAGCGTTGAGCCGTGCCACATTGACGAACTGACCGCGCGTGCGAGCAGCGGTCAGCTGCGTGATGCGCAACTGATCCGTCGTATTGTTTGCGCGATGCACGGTCCGGCTGTGAGCGCGGTGGTTAGCGGTAGCATCACCAGCAGCGGTCCGCAGACCGCGAAAATTGAGGAACTGCCGACCGCGGCGGACAGCCACCTGCGTAGCGCGGCGCTGACCAGCGCGCAGCAATTCTTTCTGAAAGCGATTGCGCCGCACCGTCCGGAGAAGCCGTTCGTTCAACTGCCGAGCCTGACCAGCGAAGGTATCCGTATTTATGACACCTTCGCGCAGTTTGTGATCGCGGATCTGCTGGACGATACCCGTTTCCTGCCGATGCAAAGCCCGCCGCCGAACGGCCTGATTACCTTTGTTAACCCGAGCGCGTACCTGGCGGACGATATCAAAAACGGTAACAGCCACATTGTTCCGGGCGTGCAGTTCTATGCGAGCGACGCGTGCACCCTGATCGATATTCCGCACGACCTGGATACCACCAGCGTTGGTCTGAGCGTGCTGCACAAGTTTGGCAAAGTTGACAAGGATACCCTGAACAAGGTGCTGGATCGTATGCTGGAGCAAGTTAGCGAAGACGATGGTATCCTGCAAGTTTACTTTGACGTGGAGCGTCCGCGTATTGATCCGGTGGTTGTGGCGAACACCGTGTTCCTGTTTCACCTGGGTAAACGTGGCCACGAAGTTGCGCGTAGCGAGAAGTTCGTTGAAAGCGTGCTGCTGCAGCGTGCGTACGAGGAAGGCACCCTGTACTATAACCTGGGCGAAGCGTTTCTGGTTAGCGTGGCGCGTCTGGTGCACGAGTTCAAAGAACACTTTACCCGTAGCGGTATGCGTCGTGCGCTGGAGGAACGTCTGCGTGAGCGTGCGCGTGCGGGTATGCAAGAACGTGACGATGCGCTGGCGCTGGCGATGCGTATCCGTGCGTGCGCGCTGTGCGGTCTGGCGGGCGAGGGTCTGACCAAGGCGGCGGAGCAGGAACTGCTGCGTCTGCAATGCAAGAGCAAAGGTTGCTGGGGCTGCCACCCGTTCTACCGTAACGGTAGCAACGTTCTGAGCTGGATCGGCAGCGAAGCGCTGACCACCGCGTATGCGATTGCGGCGCTGCAGCCGATCGACATTTAA

经修饰的I类基序：DSFDxx(D/E)(SEQ ID NO:11)

经修饰的II类基序：HDxD(T/S)T(SEQ ID NO:12)

经修饰的I类基序：DSFDSLE(SEQ ID NO:13)

经修饰的II类基序：HDLDT(SEQ ID NO:14)

正向引物(5’-ATGGAGTTCTCTGCCTCTG-3’)(SEQ ID NO:15)

反向引物(5’-GGTTTGGCTTATGGAAGGT-3’).(SEQ ID NO:16)

通过大肠杆菌的Genscript遗传密码子频率对DfHAD-6His-GST进行密码子优化的

序列(SEQ ID NO:17)

ATGTCTGGTTCTCATCATCATCATCATCATAGCAGCGGTATGTCCCCTATACTAGGTTATTGGAAAATTAAGGGCCTTGTGCAACCCACTCGACTTCTTTTGGAATATCTTGAAGAAAAATATGAAGAGCATTTGTATGAGCGCGATGAAGGTGATAAATGGCGAAACAAAAAGTTTGAATTGGGTTTGGAGTTTCCCAATCTTCCTTATTATATTGATGGTGATGTTAAATTAACACAGTCTATGGCCATCATACGTTATATAGCTGACAAGCACAACATGTTGGGTGGTTGTCCAAAAGAGCGTGCAGAGATTTCAATGCTTGAAGGAGCGGTTTTGGATATTAGATACGGTGTTTCGAGAATTGCATATAGTAAAGACTTTGAAACTCTCAAAGTTGATTTTCTTAGCAAGCTACCTGAAATGCTGAAAATGTTCGAAGATCGTTTATGTCATAAAACATATTTAAATGGTGATCATGTAACCCATCCTGACTTCATGTTGTATGACGCTCTTGATGTTGTTTTATACATGGACCCAATGTGCCTGGATGCGTTCCCAAAATTAGTTTGTTTTAAAAAACGTATTGAAGCTATCCCACAAATTGATAAGTACTTGAAATCCAGCAAGTATATAGCATGGCCTTTGCAGGGCTGGCAAGCCACGTTTGGTGGTGGCGACCATCCTCCAAAATCGGATCTGGGCCACACAGGCCATAGATCTGACGACGACGACAAGCATATGGAGTTCAGCGCGAGCGCTCCGCCGCCGCGTCTGGCGAGCGTGATCATTCTGGAACCGCTGGGTTTTCTGCTGACCCCGCACTACAGCAGCCAGCTGCCGAAGAAACTGCTGCGTCGTCTGCTGTGCACCCGTATCTGGCACCGTTATCAGCGTGGCCGTCTGCGTCTGCGTGACGCGGCGATGCTGCTGGCGCAACTGCCGTTCCTGGCGGTTAGCGACCACCCGTGGGCGCTGGATAACCTGGCGAGCCTGCTGCGTCCGACCGCGGTTCGTGCGGTGCCGTGGATGCTGCTGCTGCTGGACTTTCTGCGTGATGAGCTGCACCTGAAAGTGGTTTGCGCGACCAACAGCAGCCCGGAGGAACTGCAGGAACTGCGTCACCAATTCCCGGCGCTGTTTGCGAAGGTTGACGCGACCGTGAGCAGCGGCGAGGAAGGTGTTGGCAAACCGAGCGTGCGTTTCCTGCAAGCGGCGCTGGATAAGGCGGGCGTGCACGCGCAGCAAACCCTGTACCTGGACAGCTTTGATAGCCTGGAGACCATCATGGCGGCGCGTAGCCTGGGTATGCACGCGCTGAGCGTTGAGCCGTGCCACATTGACGAACTGACCGCGCGTGCGAGCAGCGGTCAGCTGCGTGATGCGCAACTGATCCGTCGTATTGTTTGCGCGATGCACGGTCCGGCTGTGAGCGCGGTGGTTAGCGGTAGCATCACCAGCAGCGGTCCGCAGACCGCGAAAATTGAGGAACTGCCGACCGCGGCGGACAGCCACCTGCGTAGCGCGGCGCTGACCAGCGCGCAGCAATTCTTTCTGAAAGTGATTGCGCCGCACCGTCCGGAGAAGCCGTTCGTTCAACTGCCGAGCCTGACCAGCGAAGGTATCCGTATTTATGACACCTTCGCGCAGTTTGTGATCGCGGATCTGCTGGACGATACCCGTTTCCTGCCGATGCAAAGCCCGCCGCCGAACGGCCTGATTACCTTTGTTAACCCGAGCGCGTACCTGGCGGACGATATCAAAAACGGTAACAGCCACATTGTTCCGGGCGTGCAGTTCTATGCGAGCGACGCGTGCACCCTGATCGATATTCCGCACGACCTGGATACCACCAGCGTTGGTCTGAGCGTGCTGCACAAGTTTGGCAAAGTTGACAAGGATACCCTGAACAAGGTGCTGGATCGTATGCTGGAGCAAGTTAGCGAAGACGATGGTATCCTGCAAGTTTACTTTGACGTGGAGCGTCCGCGTATTGATCCGGTGGTTGTGGCGAACACCGTGTTCCTGTTTCACCTGGGTAAACGTGGCCACGAAGTTGCGCGTAGCGAGAAGTTCGTTGAAAGCGTGCTGCTGCAGCGTGCGTACGAGGAAGGCACCCTGTACTATAACCTGGGCGAAGCGTTTCTGGTTAGCGTGGCGCGTCTGGTGCACGAGTTCAAAGAACACTTTACCCGTAGCGGTATGCGTCGTGCGCTGGAGGAACGTCTGCGTGAGCGTGCGCGTGCGGGTATGCAAGAACGTGACGATGCGCTGGCGCTGGCGATGCGTATCCGTGCGTGCGCGCTGTGCGGTCTGGCGGGCGAGGGTCTGACCAAGGCGGCGGAGCAGGAACTGCTGCGTCTGCAATGCAAGAGCAAAGGTTGCTGGGGCTGCCACCCGTTCTACCGTAACGGTAGCAACGTTCTGAGCTGGATCGGCAGCGAAGCGCTGACCACCGCGTATGCGATTGCGGCGCTGCAGCCGATCGACATTTAA

针对DfHAD-6His–GST的氨基酸序列(SEQ ID NO:18)

MSGSHHHHHHSSGMSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGDVKLTQSMAIIRYIADKHNMLGGCPKERAEISMLEGAVLDIRYGVSRIAYSKDFETLKVDFLSKLPEMLKMFEDRLCHKTYLNGDHVTHPDFMLYDALDVVLYMDPMCLDAFPKLVCFKKRIEAIPQIDKYLKSSKYIAWPLQGWQATFGGGDHPPKSDLGHTGHRSDDDDKHMEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI

针对突变体DfHAD-QW真菌的氨基酸序列(SEQ ID NO:19)

MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCEDGGWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI*

针对突变体DfHADQW mut的氨基酸序列(SEQ ID NO:20)

MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCAAAGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI*

针对突变体DfHAD-SEQ64基序的氨基酸序列(SEQ ID NO:21)MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDPLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI*

针对突变体DfHAD-MOS基序的氨基酸序列(SEQ ID NO:22)

MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVAAAVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI*

替代的II类基序：DLDTTS(SEQ ID NO:23)

基序III：QCKSKGCW(SEQ ID NO:24)

基序IV：DGILQVYFDVERPRIDPVVVAN(SEQ ID NO:25)

经修饰的基序III：QCAAAGCW(SEQ ID NO:26)

经修饰的基序III：QCEDGGW(SEQ ID NO:27)

经修饰的基序IV：DGILQVAAAVERPRIDPVVVAN(SEQ ID NO:28)

经修饰的I类基序突变的：DSFDPLE(SEQ ID NO:29)。

序列表

<110> 弗门尼舍有限公司（Firmenich SA）

<120> 折叶苔醇合酶

<130> 10860/WO

<160> 29

<170> PatentIn version 3.5

<210> 1

<211> 1755

<212> DNA

<213> DfHAD_香鳞毛蕨(Dryopteris fragrans)

<220>

<221> CDS

<222> (1)..(1755)

<400> 1

atg gag ttc tct gcc tct gct cct cct cct agg cta gcc agt gtc ata 48

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

ata ttg gag cct ctc ggc ttc ctc ctc aca cca cac tac tcc tct cag 96

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

ctt ccc aaa aag ctg ctc cgt cgc ctg ttg tgc act aga atc tgg cac 144

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

agg tat cag cga ggc cgc ctt cgc ctg cgt gac gct gct atg ctg ctc 192

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

gcc cag ctc cca ttc cta gct gtg tct gat cac ccc tgg gct ctg gac 240

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

aat ctc gca agc ctg ctc cgc ccc aca gct gtg cgt gcg gtg cca tgg 288

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

atg ctg ctg ctg ctc gac ttc cta cga gac gag ctc cat ctg aag gta 336

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

gtc tgc gcg acc aac tcc tcc cca gaa gag ctg caa gag ctg cgc cac 384

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

cag ttt ccg gcc ctc ttt gcc aag gtc gat gcc acc gtt tct tca ggc 432

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

gag gag ggc gtg ggc aag ccg tcc gtg cgc ttc ctg cag gct gcg ttg 480

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

gac aaa gcc ggt gtc cac gcg cag caa acc ttg tat ctt gac tct ttt 528

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

gac agc ttg gag acc atc atg gct gca cgc tct ctt ggc atg cat gca 576

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

cta tct gta gag cca tgc cac att gat gag ctc acc gcc agg gcc tct 624

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

tcc ggc cag cta aga gat gca cag ctt ata agg cgt att gtg tgc gcc 672

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

atg cac ggg cca gca gta tct gca gtt gtg tcg ggc agt atc aca tcg 720

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

tcc ggc cca cag aca gca aag atc gag gaa ttg cca aca gct gct gat 768

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

agt cat ctc cgc agc gca gct ctc act tct gct cag cag ttt ttc ctc 816

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

aaa gtt att gct cca cat cgt cct gag aag cca ttc gtc cag ctt cca 864

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

tct ctc acc tcg gag ggc atc cga ata tac gac acc ttt gca cag ttt 912

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

gtc ata gcc gac ctg ctc gac gac acc cgc ttc cta ccc atg caa tct 960

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

cct cct ccc aat ggg ctc atc acc ttt gtt aac cca agc gcg tac ctt 1008

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

gct gat gat ata aag aat ggc aac agc cat att gtc ccg ggt gtg caa 1056

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

ttt tac gca tcc gat gcg tgc act ctc atc gac atc cca cat gac cta 1104

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

gac acc acc tcc gtt ggc ttg tca gta ctg cac aag ttt gga aag gtg 1152

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

gac aag gac aca ctc aac aaa gtg cta gac aga atg ctc gag caa gtg 1200

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

agt gaa gac gac ggc att ctg cag gtg tat ttt gat gtg gag cgt ccg 1248

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

cgc atc gat cca gtt gtg gtg gca aac acg gtg ttt ctg ttc cac ttg 1296

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

gga aag aga ggg cat gag gtg gcg agg agt gag aag ttt gtg gag agt 1344

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

gtg ctg ctg cag agg gca tac gaa gaa ggg acg ttg tat tac aac ctg 1392

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

ggg gaa gca ttt ttg gtg agt gtg gcg agg ctg gtg cac gag ttt aag 1440

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

gag cac ttt aca agg agc ggc atg agg agg gca ctg gag gag agg cta 1488

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

aga gag cgg gca agg gcg ggc atg caa gag agg gat gat gcg ctg gcg 1536

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

cta gcc atg cgc att cgt gca tgc gct ttg tgt ggc ctg gcc gga gag 1584

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

ggc ctc aca aaa gca gca gag cag gag ctt ttg cgc ctg cag tgc aag 1632

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

tcc aag ggc tgt tgg ggg tgc cac cct ttc tat cgc aat ggc agt aat 1680

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

gtg ctc agc tgg atc ggc agt gag gcc ctt acc act gct tac gct att 1728

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

gct gcg cta cag ccc att gat att taa 1755

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 2

<211> 584

<212> PRT

<213> DfHAD_香鳞毛蕨(Dryopteris fragrans)

<400> 2

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 3

<211> 1755

<212> DNA

<213> DfHAD-8(K532R)_香鳞毛蕨(Dryopteris fragrans)

<220>

<221> CDS

<222> (1)..(1755)

<400> 3

atg gag ttc tct gcc tct gct cct cct cct agg cta gcc agt gtc ata 48

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

ata ttg gag cct ctc ggc ttc ctc ctc aca cca cac tac tcc tct cag 96

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

ctt ccc aaa aag ctg ctc cgt cgc ctg ttg tgc act aga atc tgg cac 144

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

agg tat cag cga ggc cgc ctt cgc ctg cgt gac gct gct atg ctg ctc 192

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

gcc cag ctc cca ttc cta gct gtg tct gat cac ccc tgg gct ctg gac 240

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

aat ctc gca agc ctg ctc cgc ccc aca gct gtg cgt gcg gtg cca tgg 288

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

atg ctg ctg ctg ctc gac ttc cta cga gac gag ctc cat ctg aag gta 336

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

gtc tgc gcg acc aac tcc tcc cca gaa gag ctg caa gag ctg cgc cac 384

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

cag ttt ccg gcc ctc ttt gcc aag gtc gat gcc acc gtt tct tca ggc 432

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

gag gag ggc gtg ggc aag ccg tcc gtg cgc ttc ctg cag gct gcg ttg 480

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

gac aaa gcc ggt gtc cac gcg cag caa acc ttg tat ctt gac tct ttt 528

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

gac agc ttg gag acc atc atg gct gca cgc tct ctt ggc atg cat gca 576

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

cta tct gta gag cca tgc cac att gat gag ctc acc gcc agg gcc tct 624

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

tcc ggc cag cta aga gat gca cag ctt ata agg cgt att gtg tgc gcc 672

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

atg cac ggg cca gca gta tct gca gtt gtg tcg ggc agt atc aca tcg 720

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

tcc ggc cca cag aca gca aag atc gag gaa ttg cca aca gct gct gat 768

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

agt cat ctc cgc agc gca gct ctc act tct gct cag cag ttt ttc ctc 816

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

aaa gtt att gct cca cat cgt cct gag aag cca ttc gtc cag ctt cca 864

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

tct ctc acc tcg gag ggc atc cga ata tac gac acc ttt gca cag ttt 912

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

gtc ata gcc gac ctg ctc gac gac acc cgc ttc cta ccc atg caa tct 960

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

cct cct ccc aat ggg ctc atc acc ttt gtt aac cca agc gcg tac ctt 1008

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

gct gat gat ata aag aat ggc aac agc cat att gtc ccg ggt gtg caa 1056

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

ttt tac gca tcc gat gcg tgc act ctc atc gac atc cca cat gac cta 1104

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

gac acc acc tcc gtt ggc ttg tca gta ctg cac aag ttt gga aag gtg 1152

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

gac aag gac aca ctc aac aaa gtg cta gac aga atg ctc gag caa gtg 1200

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

agt gaa gac gac ggc att ctg cag gtg tat ttt gat gtg gag cgt ccg 1248

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

cgc atc gat cca gtt gtg gtg gca aac acg gtg ttt ctg ttc cac ttg 1296

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

gga aag aga ggg cat gag gtg gcg agg agt gag aag ttt gtg gag agt 1344

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

gtg ctg ctg cag agg gca tac gaa gaa ggg acg ttg tat tac aac ctg 1392

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

ggg gaa gca ttt ttg gtg agt gtg gcg agg ctg gtg cac gag ttt aag 1440

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

gag cac ttt aca agg agc ggc atg agg agg gca ctg gag gag agg cta 1488

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

aga gag cgg gca agg gcg ggc atg caa gag agg gat gat gcg ctg gcg 1536

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

ctg gcc atg cgc att cgt gca tgc gct ttg tgt ggc ctg gcc gga gag 1584

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

ggc ctc aca aga gca gca gag cag gag cta ctg cgc ctg cag tgc aag 1632

Gly Leu Thr Arg Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

tcc aag ggc tgt tgg ggg tgc cac cct ttc tat cgc aat ggc agt aat 1680

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

gtg ctc agc tgg atc ggc agt gag gcc ctt acc act gct tac gct att 1728

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

gct gcg cta cag ccc att gat att taa 1755

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 4

<211> 584

<212> PRT

<213> DfHAD-8(K532R)_香鳞毛蕨(Dryopteris fragrans)

<400> 4

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Arg Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 5

<211> 1755

<212> DNA

<213> DfHAD-9(V274A)_香鳞毛蕨(Dryopteris fragrans)

<220>

<221> CDS

<222> (1)..(1755)

<400> 5

atg gag ttc tct gcc tct gct cct cct cct agg cta gcc agt gtc ata 48

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

ata ttg gag cct ctc ggc ttc ctc ctc aca cca cac tac tcc tct cag 96

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

ctt ccc aaa aag ctg ctc cgt cgc ctg ttg tgc act aga atc tgg cac 144

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

agg tat cag cga ggc cgc ctt cgc ctg cgt gac gct gct atg ctg ctc 192

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

gcc cag ctc cca ttc cta gct gtg tct gat cac ccc tgg gct ctg gac 240

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

aat ctc gca agc ctg ctc cgc ccc aca gct gtg cgt gcg gtg cca tgg 288

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

atg ctg ctg ctg ctc gac ttc cta cga gac gag ctc cat ctg aag gta 336

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

gtc tgc gcg acc aac tcc tcc cca gaa gag ctg caa gag ctg cgc cac 384

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

cag ttt ccg gcc ctc ttt gcc aag gtc gat gcc acc gtt tct tca ggc 432

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

gag gag ggc gtg ggc aag ccg tcc gtg cgc ttc ctg cag gct gcg ttg 480

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

gac aaa gcc ggt gtc cac gcg cag caa acc ttg tat ctt gac tct ttt 528

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

gac agc ttg gag acc atc atg gct gca cgc tct ctt ggc atg cat gca 576

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

cta tct gta gag cca tgc cac att gat gag ctc acc gcc agg gcc tct 624

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

tcc ggc cag cta aga gat gca cag ctt ata agg cgt att gtg tgc gcc 672

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

atg cac ggg cca gca gta tct gca gtt gtg tcg ggc agt atc aca tcg 720

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

tcc ggc cca cag aca gca aag atc gag gaa ttg cca aca gct gct gat 768

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

agt cat ctc cgc agc gca gct ctc act tct gct cag cag ttt ttc ctc 816

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

aaa gct att gct cca cat cgt cct gag aag cca ttc gtc cag ctt cca 864

Lys Ala Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

tct ctc acc tcg gag ggc atc cga ata tac gac acc ttt gca cag ttt 912

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

gtc ata gcc gac ctg ctc gac gac acc cgc ttc cta ccc atg caa tct 960

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

cct cct ccc aat ggg ctc atc acc ttt gtt aac cca agc gcg tac ctt 1008

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

gct gat gat ata aag aat ggc aac agc cat att gtc ccg ggt gtg caa 1056

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

ttt tac gca tct gat gcg tgc act ctc atc gac atc cca cat gac cta 1104

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

gac acc acc tcc gtt ggc ttg tca gta ctg cac aag ttt gga aag gtg 1152

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

gac aag gac aca ctc aac aaa gtg cta gac aga atg ctg gag caa gtg 1200

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

agt gaa gac gac ggc att ctc cag gtg tat ttt gat gtg gag cgt ccg 1248

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

cgc atc gat cca gtt gtg gtg gca aac acg gtg ttt ctg ttc cac ttg 1296

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

gga aag aga ggg cat gag gtg gcg agg agt gag aag ttt gtg gag agt 1344

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

gtg ctg ctg cag agg gca tac gaa gaa ggg acg ttg tat tac aac ctg 1392

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

ggg gaa gca ttt ttg gtg agt gtg gcg agg ctg gtg cac gag ttt aag 1440

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

gag cac ttt aca agg agc ggc atg agg agg gca ctg gag gag agg cta 1488

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

aga gag cgg gca agg gcg ggc atg caa gag agg gat gat gcg ctg gcg 1536

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

ctg gcc atg cgc att cgt gca tgc gct ttg tgt ggc ctg gcc gga gag 1584

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

ggc ctc aca aaa gca gca gag cag gag cta ctg cgc ctg cag tgc aag 1632

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

tcc aag ggc tgt tgg ggg tgc cac cct ttc tat cgc aat ggc agt aat 1680

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

gtg ctc agc tgg atc ggc agt gag gcc ctt acc act gct tac gct att 1728

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

gct gcg cta cag ccc att gat att taa 1755

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 6

<211> 584

<212> PRT

<213> DfHAD-9(V274A)_香鳞毛蕨(Dryopteris fragrans)

<400> 6

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Ala Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 7

<211> 1755

<212> DNA

<213> 通过大肠杆菌的Genscript遗传密码子频率对DfHAD进行密码子优化的序列

<400> 7

atggagttca gcgcgagcgc tccgccgccg cgtctggcga gcgtgatcat tctggaaccg 60

ctgggttttc tgctgacccc gcactacagc agccagctgc cgaagaaact gctgcgtcgt 120

ctgctgtgca cccgtatctg gcaccgttat cagcgtggcc gtctgcgtct gcgtgacgcg 180

gcgatgctgc tggcgcaact gccgttcctg gcggttagcg accacccgtg ggcgctggat 240

aacctggcga gcctgctgcg tccgaccgcg gttcgtgcgg tgccgtggat gctgctgctg 300

ctggactttc tgcgtgatga gctgcacctg aaagtggttt gcgcgaccaa cagcagcccg 360

gaggaactgc aggaactgcg tcaccaattc ccggcgctgt ttgcgaaggt tgacgcgacc 420

gtgagcagcg gcgaggaagg tgttggcaaa ccgagcgtgc gtttcctgca agcggcgctg 480

gataaggcgg gcgtgcacgc gcagcaaacc ctgtacctgg acagctttga tagcctggag 540

accatcatgg cggcgcgtag cctgggtatg cacgcgctga gcgttgagcc gtgccacatt 600

gacgaactga ccgcgcgtgc gagcagcggt cagctgcgtg atgcgcaact gatccgtcgt 660

attgtttgcg cgatgcacgg tccggctgtg agcgcggtgg ttagcggtag catcaccagc 720

agcggtccgc agaccgcgaa aattgaggaa ctgccgaccg cggcggacag ccacctgcgt 780

agcgcggcgc tgaccagcgc gcagcaattc tttctgaaag tgattgcgcc gcaccgtccg 840

gagaagccgt tcgttcaact gccgagcctg accagcgaag gtatccgtat ttatgacacc 900

ttcgcgcagt ttgtgatcgc ggatctgctg gacgataccc gtttcctgcc gatgcaaagc 960

ccgccgccga acggcctgat tacctttgtt aacccgagcg cgtacctggc ggacgatatc 1020

aaaaacggta acagccacat tgttccgggc gtgcagttct atgcgagcga cgcgtgcacc 1080

ctgatcgata ttccgcacga cctggatacc accagcgttg gtctgagcgt gctgcacaag 1140

tttggcaaag ttgacaagga taccctgaac aaggtgctgg atcgtatgct ggagcaagtt 1200

agcgaagacg atggtatcct gcaagtttac tttgacgtgg agcgtccgcg tattgatccg 1260

gtggttgtgg cgaacaccgt gttcctgttt cacctgggta aacgtggcca cgaagttgcg 1320

cgtagcgaga agttcgttga aagcgtgctg ctgcagcgtg cgtacgagga aggcaccctg 1380

tactataacc tgggcgaagc gtttctggtt agcgtggcgc gtctggtgca cgagttcaaa 1440

gaacacttta cccgtagcgg tatgcgtcgt gcgctggagg aacgtctgcg tgagcgtgcg 1500

cgtgcgggta tgcaagaacg tgacgatgcg ctggcgctgg cgatgcgtat ccgtgcgtgc 1560

gcgctgtgcg gtctggcggg cgagggtctg accaaggcgg cggagcagga actgctgcgt 1620

ctgcaatgca agagcaaagg ttgctggggc tgccacccgt tctaccgtaa cggtagcaac 1680

gttctgagct ggatcggcag cgaagcgctg accaccgcgt atgcgattgc ggcgctgcag 1740

ccgatcgaca tttaa 1755

<210> 8

<211> 1755

<212> DNA

<213> 通过烟草的Genscript遗传密码子频率对DfHAD进行密码子优化的序列

<400> 8

atggaatttt ctgcttcagc tccacctcca agacttgctt cagttattat tcttgagcct 60

ttgggatttc ttttgactcc acattactct tcacaattgc ctaagaaact tttgagaagg 120

cttttgtgta caagaatttg gcataggtac caaaggggta ggcttagatt gagggatgct 180

gctatgcttt tggctcaact tccatttttg gctgtttcag atcatccttg ggctcttgat 240

aatttggctt ctcttttgag accaactgct gttagggctg ttccttggat gcttttgctt 300

ttggattttc ttagagatga acttcatttg aaggttgttt gcgctactaa ttcttcacca 360

gaagagcttc aagagttgag gcatcaattt cctgctttgt ttgctaaggt tgatgctaca 420

gtttcttcag gagaagaggg agttggtaaa ccatctgtta gatttcttca agctgctttg 480

gataaggctg gtgttcatgc tcaacaaact ctttatttgg attctttcga ttcacttgaa 540

acaattatgg ctgctaggtc attgggaatg catgctcttt ctgttgaacc atgtcatatt 600

gatgagttga ctgctagagc ttcttcagga caattgaggg atgctcaact tattagaagg 660

attgtttgcg ctatgcatgg tcctgctgtt tcagctgttg tttctggatc aattacttct 720

tcaggtccac aaacagctaa aattgaagag cttcctactg ctgctgattc tcatttgaga 780

tcagctgctc ttacatctgc tcaacaattt ttccttaaag ttattgctcc acatagacct 840

gaaaagccat ttgttcaact tccttctttg acttcagagg gaatcaggat ctatgataca 900

ttcgctcaat tcgttatcgc tgatcttttg gatgatacta ggtttttgcc aatgcaatca 960

cctccaccta atggtcttat cacattcgtt aacccttctg cttatttggc tgatgatatt 1020

aaaaatggta actcacatat tgttccaggt gttcaatttt acgcttctga tgcttgtact 1080

ttgattgata ttcctcatga tcttgatact acatctgttg gactttcagt tttgcataag 1140

ttcggtaaag ttgataagga tacacttaat aaggttttgg atagaatgct tgaacaagtt 1200

tcagaggatg atggaatcct tcaagtttac ttcgatgttg aaagacctag gattgatcca 1260

gttgttgttg ctaacactgt ttttcttttc catttgggaa aaagaggtca tgaggttgct 1320

agatcagaaa agtttgttga gtctgttctt ttgcaaagag cttacgaaga gggaactttg 1380

tattacaatc ttggtgaagc ttttcttgtt tctgttgcta gacttgttca tgagtttaag 1440

gagcatttta caaggtctgg aatgagaagg gctttggaag agagacttag ggaaagagct 1500

agggctggta tgcaagagag agatgatgct cttgctttgg ctatgagaat tagggcttgt 1560

gctctttgcg gtttggctgg agaaggtctt acaaaggctg ctgaacaaga gcttttgaga 1620

ttgcaatgca agtctaaagg atgttggggt tgccatccat tctacaggaa tggttctaac 1680

gttttgtcat ggattggttc tgaggctctt actacagctt acgctattgc tgctcttcaa 1740

cctattgata tttga 1755

<210> 9

<211> 1755

<212> DNA

<213> 通过大肠杆菌的Genscript遗传密码子频率对DfHAD-8(K532R)进行密码子优化的序列

<400> 9

atggagttca gcgcgagcgc tccgccgccg cgtctggcga gcgtgatcat tctggaaccg 60

ctgggttttc tgctgacccc gcactacagc agccagctgc cgaagaaact gctgcgtcgt 120

ctgctgtgca cccgtatctg gcaccgttat cagcgtggcc gtctgcgtct gcgtgacgcg 180

gcgatgctgc tggcgcaact gccgttcctg gcggttagcg accacccgtg ggcgctggat 240

aacctggcga gcctgctgcg tccgaccgcg gttcgtgcgg tgccgtggat gctgctgctg 300

ctggactttc tgcgtgatga gctgcacctg aaagtggttt gcgcgaccaa cagcagcccg 360

gaggaactgc aggaactgcg tcaccaattc ccggcgctgt ttgcgaaggt tgacgcgacc 420

gtgagcagcg gcgaggaagg tgttggcaaa ccgagcgtgc gtttcctgca agcggcgctg 480

gataaggcgg gcgtgcacgc gcagcaaacc ctgtacctgg acagctttga tagcctggag 540

accatcatgg cggcgcgtag cctgggtatg cacgcgctga gcgttgagcc gtgccacatt 600

gacgaactga ccgcgcgtgc gagcagcggt cagctgcgtg atgcgcaact gatccgtcgt 660

attgtttgcg cgatgcacgg tccggctgtg agcgcggtgg ttagcggtag catcaccagc 720

agcggtccgc agaccgcgaa aattgaggaa ctgccgaccg cggcggacag ccacctgcgt 780

agcgcggcgc tgaccagcgc gcagcaattc tttctgaaag tgattgcgcc gcaccgtccg 840

gagaagccgt tcgttcaact gccgagcctg accagcgaag gtatccgtat ttatgacacc 900

ttcgcgcagt ttgtgatcgc ggatctgctg gacgataccc gtttcctgcc gatgcaaagc 960

ccgccgccga acggcctgat tacctttgtt aacccgagcg cgtacctggc ggacgatatc 1020

aaaaacggta acagccacat tgttccgggc gtgcagttct atgcgagcga cgcgtgcacc 1080

ctgatcgata ttccgcacga cctggatacc accagcgttg gtctgagcgt gctgcacaag 1140

tttggcaaag ttgacaagga taccctgaac aaggtgctgg atcgtatgct ggagcaagtt 1200

agcgaagacg atggtatcct gcaagtttac tttgacgtgg agcgtccgcg tattgatccg 1260

gtggttgtgg cgaacaccgt gttcctgttt cacctgggta aacgtggcca cgaagttgcg 1320

cgtagcgaga agttcgttga aagcgtgctg ctgcagcgtg cgtacgagga aggcaccctg 1380

tactataacc tgggcgaagc gtttctggtt agcgtggcgc gtctggtgca cgagttcaaa 1440

gaacacttta cccgtagcgg tatgcgtcgt gcgctggagg aacgtctgcg tgagcgtgcg 1500

cgtgcgggta tgcaagaacg tgacgatgcg ctggcgctgg cgatgcgtat ccgtgcgtgc 1560

gcgctgtgcg gtctggcggg cgagggtctg acccgggcgg cggagcagga actgctgcgt 1620

ctgcaatgca agagcaaagg ttgctggggc tgccacccgt tctaccgtaa cggtagcaac 1680

gttctgagct ggatcggcag cgaagcgctg accaccgcgt atgcgattgc ggcgctgcag 1740

ccgatcgaca tttaa 1755

<210> 10

<211> 1755

<212> DNA

<213> 通过大肠杆菌的Genscript遗传密码子频率对DfHAD-9(V274A)进行密码子优化的序列

<400> 10

atggagttca gcgcgagcgc tccgccgccg cgtctggcga gcgtgatcat tctggaaccg 60

ctgggttttc tgctgacccc gcactacagc agccagctgc cgaagaaact gctgcgtcgt 120

ctgctgtgca cccgtatctg gcaccgttat cagcgtggcc gtctgcgtct gcgtgacgcg 180

gcgatgctgc tggcgcaact gccgttcctg gcggttagcg accacccgtg ggcgctggat 240

aacctggcga gcctgctgcg tccgaccgcg gttcgtgcgg tgccgtggat gctgctgctg 300

ctggactttc tgcgtgatga gctgcacctg aaagtggttt gcgcgaccaa cagcagcccg 360

gaggaactgc aggaactgcg tcaccaattc ccggcgctgt ttgcgaaggt tgacgcgacc 420

gtgagcagcg gcgaggaagg tgttggcaaa ccgagcgtgc gtttcctgca agcggcgctg 480

gataaggcgg gcgtgcacgc gcagcaaacc ctgtacctgg acagctttga tagcctggag 540

accatcatgg cggcgcgtag cctgggtatg cacgcgctga gcgttgagcc gtgccacatt 600

gacgaactga ccgcgcgtgc gagcagcggt cagctgcgtg atgcgcaact gatccgtcgt 660

attgtttgcg cgatgcacgg tccggctgtg agcgcggtgg ttagcggtag catcaccagc 720

agcggtccgc agaccgcgaa aattgaggaa ctgccgaccg cggcggacag ccacctgcgt 780

agcgcggcgc tgaccagcgc gcagcaattc tttctgaaag cgattgcgcc gcaccgtccg 840

gagaagccgt tcgttcaact gccgagcctg accagcgaag gtatccgtat ttatgacacc 900

ttcgcgcagt ttgtgatcgc ggatctgctg gacgataccc gtttcctgcc gatgcaaagc 960

ccgccgccga acggcctgat tacctttgtt aacccgagcg cgtacctggc ggacgatatc 1020

aaaaacggta acagccacat tgttccgggc gtgcagttct atgcgagcga cgcgtgcacc 1080

ctgatcgata ttccgcacga cctggatacc accagcgttg gtctgagcgt gctgcacaag 1140

tttggcaaag ttgacaagga taccctgaac aaggtgctgg atcgtatgct ggagcaagtt 1200

agcgaagacg atggtatcct gcaagtttac tttgacgtgg agcgtccgcg tattgatccg 1260

gtggttgtgg cgaacaccgt gttcctgttt cacctgggta aacgtggcca cgaagttgcg 1320

cgtagcgaga agttcgttga aagcgtgctg ctgcagcgtg cgtacgagga aggcaccctg 1380

tactataacc tgggcgaagc gtttctggtt agcgtggcgc gtctggtgca cgagttcaaa 1440

gaacacttta cccgtagcgg tatgcgtcgt gcgctggagg aacgtctgcg tgagcgtgcg 1500

cgtgcgggta tgcaagaacg tgacgatgcg ctggcgctgg cgatgcgtat ccgtgcgtgc 1560

gcgctgtgcg gtctggcggg cgagggtctg accaaggcgg cggagcagga actgctgcgt 1620

ctgcaatgca agagcaaagg ttgctggggc tgccacccgt tctaccgtaa cggtagcaac 1680

gttctgagct ggatcggcag cgaagcgctg accaccgcgt atgcgattgc ggcgctgcag 1740

ccgatcgaca tttaa 1755

<210> 11

<211> 7

<212> PRT

<213> 经修饰的I类基序：DSFDxx(D/E)

<220>

<221> MISC_FEATURE

<222> (5)..(6)

<223> Xaa可以是任何天然的氨基酸

<220>

<221> MISC_FEATURE

<222> (7)..(7)

<223> Xaa可以是D或E

<400> 11

Asp Ser Phe Asp Xaa Xaa Xaa

1 5

<210> 12

<211> 6

<212> PRT

<213> 经修饰的II类基序：HDxD(T/S)T

<220>

<221> MISC_FEATURE

<222> (3)..(3)

<223> Xaa可以是任何天然的氨基酸

<220>

<221> MISC_FEATURE

<222> (5)..(5)

<223> Xaa可以是T或S

<400> 12

His Asp Xaa Asp Xaa Thr

1 5

<210> 13

<211> 7

<212> PRT

<213> 经修饰的I类基序：DSFDSLE

<400> 13

Asp Ser Phe Asp Ser Leu Glu

1 5

<210> 14

<211> 5

<212> PRT

<213> 经修饰的II类基序：HDLDT

<400> 14

His Asp Leu Asp Thr

1 5

<210> 15

<211> 19

<212> DNA

<213> 正向引物 5' - 3'

<400> 15

atggagttct ctgcctctg 19

<210> 16

<211> 19

<212> DNA

<213> 反向引物 5' - 3'

<400> 16

ggtttggctt atggaaggt 19

<210> 17

<211> 2496

<212> DNA

<213> 通过大肠杆菌的Genscript遗传密码子频率对DfHAD-6His-GST进行密码子优化的序列

<220>

<221> CDS

<222> (1)..(2496)

<400> 17

atg tct ggt tct cat cat cat cat cat cat agc agc ggt atg tcc cct 48

Met Ser Gly Ser His His His His His His Ser Ser Gly Met Ser Pro

1 5 10 15

ata cta ggt tat tgg aaa att aag ggc ctt gtg caa ccc act cga ctt 96

Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu

20 25 30

ctt ttg gaa tat ctt gaa gaa aaa tat gaa gag cat ttg tat gag cgc 144

Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg

35 40 45

gat gaa ggt gat aaa tgg cga aac aaa aag ttt gaa ttg ggt ttg gag 192

Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu

50 55 60

ttt ccc aat ctt cct tat tat att gat ggt gat gtt aaa tta aca cag 240

Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln

65 70 75 80

tct atg gcc atc ata cgt tat ata gct gac aag cac aac atg ttg ggt 288

Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly

85 90 95

ggt tgt cca aaa gag cgt gca gag att tca atg ctt gaa gga gcg gtt 336

Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val

100 105 110

ttg gat att aga tac ggt gtt tcg aga att gca tat agt aaa gac ttt 384

Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe

115 120 125

gaa act ctc aaa gtt gat ttt ctt agc aag cta cct gaa atg ctg aaa 432

Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys

130 135 140

atg ttc gaa gat cgt tta tgt cat aaa aca tat tta aat ggt gat cat 480

Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His

145 150 155 160

gta acc cat cct gac ttc atg ttg tat gac gct ctt gat gtt gtt tta 528

Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu

165 170 175

tac atg gac cca atg tgc ctg gat gcg ttc cca aaa tta gtt tgt ttt 576

Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe

180 185 190

aaa aaa cgt att gaa gct atc cca caa att gat aag tac ttg aaa tcc 624

Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser

195 200 205

agc aag tat ata gca tgg cct ttg cag ggc tgg caa gcc acg ttt ggt 672

Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly

210 215 220

ggt ggc gac cat cct cca aaa tcg gat ctg ggc cac aca ggc cat aga 720

Gly Gly Asp His Pro Pro Lys Ser Asp Leu Gly His Thr Gly His Arg

225 230 235 240

tct gac gac gac gac aag cat atg gag ttc agc gcg agc gct ccg ccg 768

Ser Asp Asp Asp Asp Lys His Met Glu Phe Ser Ala Ser Ala Pro Pro

245 250 255

ccg cgt ctg gcg agc gtg atc att ctg gaa ccg ctg ggt ttt ctg ctg 816

Pro Arg Leu Ala Ser Val Ile Ile Leu Glu Pro Leu Gly Phe Leu Leu

260 265 270

acc ccg cac tac agc agc cag ctg ccg aag aaa ctg ctg cgt cgt ctg 864

Thr Pro His Tyr Ser Ser Gln Leu Pro Lys Lys Leu Leu Arg Arg Leu

275 280 285

ctg tgc acc cgt atc tgg cac cgt tat cag cgt ggc cgt ctg cgt ctg 912

Leu Cys Thr Arg Ile Trp His Arg Tyr Gln Arg Gly Arg Leu Arg Leu

290 295 300

cgt gac gcg gcg atg ctg ctg gcg caa ctg ccg ttc ctg gcg gtt agc 960

Arg Asp Ala Ala Met Leu Leu Ala Gln Leu Pro Phe Leu Ala Val Ser

305 310 315 320

gac cac ccg tgg gcg ctg gat aac ctg gcg agc ctg ctg cgt ccg acc 1008

Asp His Pro Trp Ala Leu Asp Asn Leu Ala Ser Leu Leu Arg Pro Thr

325 330 335

gcg gtt cgt gcg gtg ccg tgg atg ctg ctg ctg ctg gac ttt ctg cgt 1056

Ala Val Arg Ala Val Pro Trp Met Leu Leu Leu Leu Asp Phe Leu Arg

340 345 350

gat gag ctg cac ctg aaa gtg gtt tgc gcg acc aac agc agc ccg gag 1104

Asp Glu Leu His Leu Lys Val Val Cys Ala Thr Asn Ser Ser Pro Glu

355 360 365

gaa ctg cag gaa ctg cgt cac caa ttc ccg gcg ctg ttt gcg aag gtt 1152

Glu Leu Gln Glu Leu Arg His Gln Phe Pro Ala Leu Phe Ala Lys Val

370 375 380

gac gcg acc gtg agc agc ggc gag gaa ggt gtt ggc aaa ccg agc gtg 1200

Asp Ala Thr Val Ser Ser Gly Glu Glu Gly Val Gly Lys Pro Ser Val

385 390 395 400

cgt ttc ctg caa gcg gcg ctg gat aag gcg ggc gtg cac gcg cag caa 1248

Arg Phe Leu Gln Ala Ala Leu Asp Lys Ala Gly Val His Ala Gln Gln

405 410 415

acc ctg tac ctg gac agc ttt gat agc ctg gag acc atc atg gcg gcg 1296

Thr Leu Tyr Leu Asp Ser Phe Asp Ser Leu Glu Thr Ile Met Ala Ala

420 425 430

cgt agc ctg ggt atg cac gcg ctg agc gtt gag ccg tgc cac att gac 1344

Arg Ser Leu Gly Met His Ala Leu Ser Val Glu Pro Cys His Ile Asp

435 440 445

gaa ctg acc gcg cgt gcg agc agc ggt cag ctg cgt gat gcg caa ctg 1392

Glu Leu Thr Ala Arg Ala Ser Ser Gly Gln Leu Arg Asp Ala Gln Leu

450 455 460

atc cgt cgt att gtt tgc gcg atg cac ggt ccg gct gtg agc gcg gtg 1440

Ile Arg Arg Ile Val Cys Ala Met His Gly Pro Ala Val Ser Ala Val

465 470 475 480

gtt agc ggt agc atc acc agc agc ggt ccg cag acc gcg aaa att gag 1488

Val Ser Gly Ser Ile Thr Ser Ser Gly Pro Gln Thr Ala Lys Ile Glu

485 490 495

gaa ctg ccg acc gcg gcg gac agc cac ctg cgt agc gcg gcg ctg acc 1536

Glu Leu Pro Thr Ala Ala Asp Ser His Leu Arg Ser Ala Ala Leu Thr

500 505 510

agc gcg cag caa ttc ttt ctg aaa gtg att gcg ccg cac cgt ccg gag 1584

Ser Ala Gln Gln Phe Phe Leu Lys Val Ile Ala Pro His Arg Pro Glu

515 520 525

aag ccg ttc gtt caa ctg ccg agc ctg acc agc gaa ggt atc cgt att 1632

Lys Pro Phe Val Gln Leu Pro Ser Leu Thr Ser Glu Gly Ile Arg Ile

530 535 540

tat gac acc ttc gcg cag ttt gtg atc gcg gat ctg ctg gac gat acc 1680

Tyr Asp Thr Phe Ala Gln Phe Val Ile Ala Asp Leu Leu Asp Asp Thr

545 550 555 560

cgt ttc ctg ccg atg caa agc ccg ccg ccg aac ggc ctg att acc ttt 1728

Arg Phe Leu Pro Met Gln Ser Pro Pro Pro Asn Gly Leu Ile Thr Phe

565 570 575

gtt aac ccg agc gcg tac ctg gcg gac gat atc aaa aac ggt aac agc 1776

Val Asn Pro Ser Ala Tyr Leu Ala Asp Asp Ile Lys Asn Gly Asn Ser

580 585 590

cac att gtt ccg ggc gtg cag ttc tat gcg agc gac gcg tgc acc ctg 1824

His Ile Val Pro Gly Val Gln Phe Tyr Ala Ser Asp Ala Cys Thr Leu

595 600 605

atc gat att ccg cac gac ctg gat acc acc agc gtt ggt ctg agc gtg 1872

Ile Asp Ile Pro His Asp Leu Asp Thr Thr Ser Val Gly Leu Ser Val

610 615 620

ctg cac aag ttt ggc aaa gtt gac aag gat acc ctg aac aag gtg ctg 1920

Leu His Lys Phe Gly Lys Val Asp Lys Asp Thr Leu Asn Lys Val Leu

625 630 635 640

gat cgt atg ctg gag caa gtt agc gaa gac gat ggt atc ctg caa gtt 1968

Asp Arg Met Leu Glu Gln Val Ser Glu Asp Asp Gly Ile Leu Gln Val

645 650 655

tac ttt gac gtg gag cgt ccg cgt att gat ccg gtg gtt gtg gcg aac 2016

Tyr Phe Asp Val Glu Arg Pro Arg Ile Asp Pro Val Val Val Ala Asn

660 665 670

acc gtg ttc ctg ttt cac ctg ggt aaa cgt ggc cac gaa gtt gcg cgt 2064

Thr Val Phe Leu Phe His Leu Gly Lys Arg Gly His Glu Val Ala Arg

675 680 685

agc gag aag ttc gtt gaa agc gtg ctg ctg cag cgt gcg tac gag gaa 2112

Ser Glu Lys Phe Val Glu Ser Val Leu Leu Gln Arg Ala Tyr Glu Glu

690 695 700

ggc acc ctg tac tat aac ctg ggc gaa gcg ttt ctg gtt agc gtg gcg 2160

Gly Thr Leu Tyr Tyr Asn Leu Gly Glu Ala Phe Leu Val Ser Val Ala

705 710 715 720

cgt ctg gtg cac gag ttc aaa gaa cac ttt acc cgt agc ggt atg cgt 2208

Arg Leu Val His Glu Phe Lys Glu His Phe Thr Arg Ser Gly Met Arg

725 730 735

cgt gcg ctg gag gaa cgt ctg cgt gag cgt gcg cgt gcg ggt atg caa 2256

Arg Ala Leu Glu Glu Arg Leu Arg Glu Arg Ala Arg Ala Gly Met Gln

740 745 750

gaa cgt gac gat gcg ctg gcg ctg gcg atg cgt atc cgt gcg tgc gcg 2304

Glu Arg Asp Asp Ala Leu Ala Leu Ala Met Arg Ile Arg Ala Cys Ala

755 760 765

ctg tgc ggt ctg gcg ggc gag ggt ctg acc aag gcg gcg gag cag gaa 2352

Leu Cys Gly Leu Ala Gly Glu Gly Leu Thr Lys Ala Ala Glu Gln Glu

770 775 780

ctg ctg cgt ctg caa tgc aag agc aaa ggt tgc tgg ggc tgc cac ccg 2400

Leu Leu Arg Leu Gln Cys Lys Ser Lys Gly Cys Trp Gly Cys His Pro

785 790 795 800

ttc tac cgt aac ggt agc aac gtt ctg agc tgg atc ggc agc gaa gcg 2448

Phe Tyr Arg Asn Gly Ser Asn Val Leu Ser Trp Ile Gly Ser Glu Ala

805 810 815

ctg acc acc gcg tat gcg att gcg gcg ctg cag ccg atc gac att taa 2496

Leu Thr Thr Ala Tyr Ala Ile Ala Ala Leu Gln Pro Ile Asp Ile

820 825 830

<210> 18

<211> 831

<212> PRT

<400> 18

Met Ser Gly Ser His His His His His His Ser Ser Gly Met Ser Pro

1 5 10 15

Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu

20 25 30

Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg

35 40 45

Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu

50 55 60

Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln

65 70 75 80

Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly

85 90 95

Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val

100 105 110

Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe

115 120 125

Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys

130 135 140

Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His

145 150 155 160

Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu

165 170 175

Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe

180 185 190

Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser

195 200 205

Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly

210 215 220

Gly Gly Asp His Pro Pro Lys Ser Asp Leu Gly His Thr Gly His Arg

225 230 235 240

Ser Asp Asp Asp Asp Lys His Met Glu Phe Ser Ala Ser Ala Pro Pro

245 250 255

Pro Arg Leu Ala Ser Val Ile Ile Leu Glu Pro Leu Gly Phe Leu Leu

260 265 270

Thr Pro His Tyr Ser Ser Gln Leu Pro Lys Lys Leu Leu Arg Arg Leu

275 280 285

Leu Cys Thr Arg Ile Trp His Arg Tyr Gln Arg Gly Arg Leu Arg Leu

290 295 300

Arg Asp Ala Ala Met Leu Leu Ala Gln Leu Pro Phe Leu Ala Val Ser

305 310 315 320

Asp His Pro Trp Ala Leu Asp Asn Leu Ala Ser Leu Leu Arg Pro Thr

325 330 335

Ala Val Arg Ala Val Pro Trp Met Leu Leu Leu Leu Asp Phe Leu Arg

340 345 350

Asp Glu Leu His Leu Lys Val Val Cys Ala Thr Asn Ser Ser Pro Glu

355 360 365

Glu Leu Gln Glu Leu Arg His Gln Phe Pro Ala Leu Phe Ala Lys Val

370 375 380

Asp Ala Thr Val Ser Ser Gly Glu Glu Gly Val Gly Lys Pro Ser Val

385 390 395 400

Arg Phe Leu Gln Ala Ala Leu Asp Lys Ala Gly Val His Ala Gln Gln

405 410 415

Thr Leu Tyr Leu Asp Ser Phe Asp Ser Leu Glu Thr Ile Met Ala Ala

420 425 430

Arg Ser Leu Gly Met His Ala Leu Ser Val Glu Pro Cys His Ile Asp

435 440 445

Glu Leu Thr Ala Arg Ala Ser Ser Gly Gln Leu Arg Asp Ala Gln Leu

450 455 460

Ile Arg Arg Ile Val Cys Ala Met His Gly Pro Ala Val Ser Ala Val

465 470 475 480

Val Ser Gly Ser Ile Thr Ser Ser Gly Pro Gln Thr Ala Lys Ile Glu

485 490 495

Glu Leu Pro Thr Ala Ala Asp Ser His Leu Arg Ser Ala Ala Leu Thr

500 505 510

Ser Ala Gln Gln Phe Phe Leu Lys Val Ile Ala Pro His Arg Pro Glu

515 520 525

Lys Pro Phe Val Gln Leu Pro Ser Leu Thr Ser Glu Gly Ile Arg Ile

530 535 540

Tyr Asp Thr Phe Ala Gln Phe Val Ile Ala Asp Leu Leu Asp Asp Thr

545 550 555 560

Arg Phe Leu Pro Met Gln Ser Pro Pro Pro Asn Gly Leu Ile Thr Phe

565 570 575

Val Asn Pro Ser Ala Tyr Leu Ala Asp Asp Ile Lys Asn Gly Asn Ser

580 585 590

His Ile Val Pro Gly Val Gln Phe Tyr Ala Ser Asp Ala Cys Thr Leu

595 600 605

Ile Asp Ile Pro His Asp Leu Asp Thr Thr Ser Val Gly Leu Ser Val

610 615 620

Leu His Lys Phe Gly Lys Val Asp Lys Asp Thr Leu Asn Lys Val Leu

625 630 635 640

Asp Arg Met Leu Glu Gln Val Ser Glu Asp Asp Gly Ile Leu Gln Val

645 650 655

Tyr Phe Asp Val Glu Arg Pro Arg Ile Asp Pro Val Val Val Ala Asn

660 665 670

Thr Val Phe Leu Phe His Leu Gly Lys Arg Gly His Glu Val Ala Arg

675 680 685

Ser Glu Lys Phe Val Glu Ser Val Leu Leu Gln Arg Ala Tyr Glu Glu

690 695 700

Gly Thr Leu Tyr Tyr Asn Leu Gly Glu Ala Phe Leu Val Ser Val Ala

705 710 715 720

Arg Leu Val His Glu Phe Lys Glu His Phe Thr Arg Ser Gly Met Arg

725 730 735

Arg Ala Leu Glu Glu Arg Leu Arg Glu Arg Ala Arg Ala Gly Met Gln

740 745 750

Glu Arg Asp Asp Ala Leu Ala Leu Ala Met Arg Ile Arg Ala Cys Ala

755 760 765

Leu Cys Gly Leu Ala Gly Glu Gly Leu Thr Lys Ala Ala Glu Gln Glu

770 775 780

Leu Leu Arg Leu Gln Cys Lys Ser Lys Gly Cys Trp Gly Cys His Pro

785 790 795 800

Phe Tyr Arg Asn Gly Ser Asn Val Leu Ser Trp Ile Gly Ser Glu Ala

805 810 815

Leu Thr Thr Ala Tyr Ala Ile Ala Ala Leu Gln Pro Ile Asp Ile

820 825 830

<210> 19

<211> 583

<212> PRT

<213> DfHAD-QW真菌

<400> 19

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Glu

530 535 540

Asp Gly Gly Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn Val

545 550 555 560

Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile Ala

565 570 575

Ala Leu Gln Pro Ile Asp Ile

580

<210> 20

<211> 584

<212> PRT

<213> DfHAD-QW mut

<400> 20

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Ala

530 535 540

Ala Ala Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 21

<211> 584

<212> PRT

<213> DfHAD-SEQ64基序

<400> 21

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Pro Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 22

<211> 584

<212> PRT

<213> DfHAD-MOS基序

<400> 22

Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile

1 5 10 15

Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln

20 25 30

Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His

35 40 45

Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu

50 55 60

Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp

65 70 75 80

Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp

85 90 95

Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val

100 105 110

Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His

115 120 125

Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly

130 135 140

Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu

145 150 155 160

Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe

165 170 175

Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala

180 185 190

Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser

195 200 205

Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala

210 215 220

Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser

225 230 235 240

Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp

245 250 255

Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu

260 265 270

Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro

275 280 285

Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe

290 295 300

Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser

305 310 315 320

Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu

325 330 335

Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln

340 345 350

Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu

355 360 365

Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val

370 375 380

Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val

385 390 395 400

Ser Glu Asp Asp Gly Ile Leu Gln Val Ala Ala Ala Val Glu Arg Pro

405 410 415

Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu

420 425 430

Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser

435 440 445

Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu

450 455 460

Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys

465 470 475 480

Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu

485 490 495

Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala

500 505 510

Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu

515 520 525

Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys

530 535 540

Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn

545 550 555 560

Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile

565 570 575

Ala Ala Leu Gln Pro Ile Asp Ile

580

<210> 23

<211> 6

<212> PRT

<213> 替代的II类基序：DLDTTS

<400> 23

Asp Leu Asp Thr Thr Ser

1 5

<210> 24

<211> 8

<212> PRT

<213> 基序III：QCKSKGCW

<400> 24

Gln Cys Lys Ser Lys Gly Cys Trp

1 5

<210> 25

<211> 22

<212> PRT

<213> 基序IV：DGILQVYFDVERPRIDPVVVAN

<400> 25

Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro Arg Ile Asp

1 5 10 15

Pro Val Val Val Ala Asn

20

<210> 26

<211> 8

<212> PRT

<213> 经修饰的基序III

<400> 26

Gln Cys Ala Ala Ala Gly Cys Trp

1 5

<210> 27

<211> 7

<212> PRT

<213> 经修饰的基序III

<400> 27

Gln Cys Glu Asp Gly Gly Trp

1 5

<210> 28

<211> 22

<212> PRT

<213> 经修饰的基序IV

<400> 28

Asp Gly Ile Leu Gln Val Ala Ala Ala Val Glu Arg Pro Arg Ile Asp

1 5 10 15

Pro Val Val Val Ala Asn

20

<210> 29

<211> 7

<212> PRT

<213> 经修饰的I类基序-突变的

<400> 29

Asp Ser Phe Asp Pro Leu Glu

1 5

Claims

1.一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽，其具有萜合酶活性，其中所述多肽是包含氨基酸序列SEQ ID NO:2的DfHAD，或其突变体或天然变体，包含与SEQ IDNO:2具有至少40％序列同一性的氨基酸序列，并保留所述萜合酶活性。

2.权利要求1所述的多肽，其具有产生补身烷倍半萜和/或其二磷酸酯衍生物的能力。

3.权利要求2所述的多肽，其具有从作为底物的法呢基二磷酸(FPP)产生折叶苔基二磷酸的能力。

4.一种分离的多肽，其是权利要求1至3中任一项的DfHAD的(天然)变体，其选自：

a.DfHAD-9(V274A)，其在SEQ ID NO:2的274位或与SEQ ID NO:2具有至少40％序列同一性的氨基酸序列中包含氨基酸取代V274A；和

b.DfHAD-8(K532R)，其在SEQ ID NO:2的532位或与SEQ ID NO:2具有至少40％序列同一性的氨基酸序列中包含氨基酸取代K532R。

5.权利要求1至4中任一项所述的多肽，其进一步包含：

a.SEQ ID NO:13所示的经修饰的I类合酶基序(DSFDSLE)；

b.SEQ ID NO:14所示的经修饰的II类合酶基序(HDLDT)；和

c.至少一种选自以下的其他序列基序：

i.SEQ ID NO:2的86至195位的部分序列；和

ii.SEQ ID NO:2的40至187位的部分序列。

6.权利要求4和5之一所述的多肽，其选自：

a.SEQ ID NO:6的氨基酸序列的DfHAD-9(V274A)；和

b.SEQ ID NO:4的氨基酸序列的DfHAD-8(K532R)。

7.一种分离的核酸分子，其

a.包含编码前述权利要求中任一项所述多肽的核苷酸序列；或

b.包含选自SEQ ID NO:1、3、5、7、8、9和10的核苷酸序列，或与SEQ ID NO:1、3、5、7、8、9或10的核苷酸序列具有至少40％的序列同一性，并编码具有萜合酶活性的卤代酸脱卤酶样(HAD样)水解酶超家族的多肽，或

8.一种表达构建体，其包含至少一种权利要求7的核酸分子。

9.一种载体，其包含至少一种权利要求7的核酸分子或至少一种权利要求8的表达构建体。

10.一种重组宿主细胞或重组非人宿主生物，其包含：

a.至少一种权利要求7的分离的核酸分子，其可选地稳定地整合到基因组中；或

b.至少一种权利要求8的表达构建体，其可选地稳定地整合到基因组中；或

c.至少一种权利要求10的载体。

11.一种产生至少一种根据权利要求1至6中任一项所述的催化活性多肽的方法，该方法包括：

a.培养权利要求10的非人宿主生物或宿主细胞以表达或过表达至少一种权利要求1至6中任一项所述的多肽；和

b.可选地，从步骤a.中培养的非人宿主细胞或生物中分离该多肽。

12.一种制备具有萜合酶活性，特别是折叶苔基二磷酸合酶活性的突变多肽的方法，该方法包括以下步骤：

a.选择根据权利要求7所述的核酸分子；

b.修饰所选择的核酸分子以获得至少一种突变核酸分子；

d.筛选表达产物中至少一种包含萜合酶活性，特别是折叶苔基二磷酸合酶活性的突变体；和，

13.一种产生补身烷倍半萜特别是折叶苔醇的方法，包括：

a.使法呢基二磷酸(FPP)与权利要求1至6中任一项所定义的多肽，与根据权利要求11制备的多肽，或与根据权利要求12制备的突变多肽接触，从而获得至少一种补身烷倍半萜的二磷酸酯，特别是折叶苔基二磷酸；

b.以化学或酶促方式裂解所述产物的二磷酸酯部分；和

c.可选地，分离出该补身烷倍半萜，特别是折叶苔醇。

14.权利要求1至6中任一项所定义的多肽在制备气味剂、调味剂或芳香剂成分特别是Ambrox中的用途。

15.一种产生Ambrox的方法，该方法包括：

a.通过权利要求13中描述的方法提供折叶苔醇

b.可选地，分离步骤a.中产生的折叶苔醇；和

c.以本身已知的方式将折叶苔醇转化为Ambrox。