CN111527203B

CN111527203B - 细胞色素p450单加氧酶催化的倍半萜的氧化

Info

Publication number: CN111527203B
Application number: CN201980007013.2A
Authority: CN
Inventors: M·沙尔克; L·洛奇; F·德古利
Original assignee: Firmenich SA
Current assignee: Firmenich SA
Priority date: 2018-01-18
Filing date: 2019-01-16
Publication date: 2024-09-06
Anticipated expiration: 2039-01-16
Also published as: US20230151393A1; MX2020005258A; CN111527203A; JP7431733B2; EP3697898A1; BR112020010924A2; JP2021511008A; WO2019141739A1

Abstract

本发明提供了能够氧化萜烯分子的细胞色素P450的核酸和氨基酸序列。还提供了氧化萜烯分子的方法，包括使细胞色素P450与打算被氧化的萜烯分子接触。特别地，所述方法可以在体外或体内进行以产生氧化的萜烯分子，其可以用于不同的技术领域，例如香料和调味料。本发明还提供了含有核酸的表达载体。用该核酸转化的非人宿主生物或细胞也是本发明的目的。

Description

细胞色素P450单加氧酶催化的倍半萜的氧化

技术领域

本发明提供了一种氧化倍半萜分子的方法，该方法包括使某些细胞色素P450单加氧酶与待被氧化的倍半萜分子接触。还提供了能够氧化倍半萜分子的新型细胞色素P450单加氧酶，相应的编码序列，表达载体，可用于产生所述新型酶及其突变体的重组非人宿主生物。

背景技术

萜烯存在于大多数生物体(微生物、动物和植物)中。这些化合物由称为异戊二烯单元的五碳单元组成，并根据其结构中存在的这些单元的数量进行分类。因此，单萜、倍半萜和二萜分别是含有10、15和20个碳原子的萜。例如，二萜广泛存在于植物界，并且已经描述了超过2500种二萜结构(Connolly and Hill,Dictionary of terpenoids,1991,Chapman&Hall,London)。从香根草植物根中提取的香根草油是许多处于不同氧化阶段(醇、酮、醛和羧酸)的双环和三环倍半萜的重要来源(另见M.Maffei,Vetriveria,2002)。萜烯分子及其氧化衍生物由于其风味和香气特性以及它们的化妆品、药物和抗菌作用而受到人们的关注已有数千年。通过诸如水蒸气蒸馏或溶剂萃取的不同方式获得的植物提取物用作萜烯分子的氧化衍生物的来源。或者，植物提取物中发现的或通过生物合成方法获得的萜烯分子使用化学和酶促方法来氧化。

萜烯的酶促氧化通常涉及称为细胞色素P450(P450s)的酶，该酶通常能够催化疏水性底物(例如萜烯分子)转化为亲水性更高的底物。细胞色素P450酶形成细菌、古菌和真核生物中发现的血红素蛋白的超家族。在最常见的活性之一中，细胞色素P450充当单加氧酶，将分子氧的一个氧原子插入到底物分子中，而将另一个氧原子还原为水。

该催化反应需要两个电子来激活分子氧。真核生物的P450使用NADPH作为外部还原剂和电子源。这两个电子一次转移到细胞色素P450活性位点，这种转移需要一种电子供体蛋白，即细胞色素P450还原酶(CPR)。一种CPR并不特异于一种细胞色素P450。CPR是给定生物体中多种P450的电子供体蛋白。另外，来自一种生物体的CPR可以充当来自其他生物体的P450的电子供体蛋白。在某些情况下，P450还可与细胞色素b5蛋白偶联，后者可充当电子供体蛋白或可提高电子从CPR转移到P450的效率。在真核细胞中，特别是在植物中，P450和CPR通常是膜结合蛋白，并与内质网有关。这些蛋白质通过N末端跨膜螺旋锚定在膜上。

许多P450具有低的底物特异性，因此能够催化许多不同结构例如不同的萜烯分子的氧化。这些酶大多数对给定的底物具有特定的区域选择性和立体选择性，但它们通常会从特定的底物中产生几种产物的混合物。此类P450通常参与分子(例如异种生物)的分解和解毒，并且通常存在于细菌和动物中。另一方面，参与生物合成途径的P450通常表现出对某些类型底物的特异性以及区域和立体选择性。大多数植物P450就是这种情况。

在自然界特别是植物中可以发现大量的P450。一个植物基因组可以包含数百个编码P450的基因。已经表征了许多植物P450，但是考虑到植物中存在的P450数量非常多，其大多数功能仍然未知。

因此，期望寻找新的细胞色素P450，其能够催化有价值的含氧化合物(例如氧化的倍半萜)的酶促生产，其否则将只能通过困难而昂贵的从香根草油等天然油中进行的经典分离步骤来获得。

还需要鉴定本身已知的P450酶在此类酶促生产中的适用性。

本发明的一个特别的目的是提供酶催化的方法来制备氧化的倍半萜萜烯，特别是异朱栾倍半萜醇(isovalencenol)、异努特卡醇(isonootkatol)和/或子杂烯醇(zizaenol)，以及它们的进一步氧化的衍生物，它们可用作香料和/或芳香成分。

进一步的目的是提供新型细胞色素P450酶，其能够氧化倍半萜分子，特别是异朱栾倍半萜(isovalencene)和/或子杂烯(zizaene)和/或朱栾倍半萜(valencene)和/或香根螺-1(10),7(11)-二烯(spirovetiva-1(10),7(11)-diene)。

WO 2013/064411描述了来自香根草(Vetiveria zizanoides)的两种细胞色素P450酶VzCP521-11和VzCP521-16的分离、表征和用途。其中报道了(+)子杂烯通过氧化特别是在(+)子杂烯的C12位上的氧化，生物转化为客烯醇(khusimol)。没有报道异朱栾倍半萜的生物转化以及子杂烯向子杂烯醇的转化。

早些时候，2017年7月19日提交的尚未公开的PCT/EP2017/068268公开了一种来自香根草及其变体的细胞色素P450酶。描述了通过用VzCP8201 P450酶在异朱栾倍半萜的C12位的氧化，以及随后通过大肠杆菌背景酶活性进行的酯化反应将异朱栾倍半萜生物转化为异朱栾倍半萜醇。对于所述P450酶没有描述子杂烯的生物转化。

所使用的缩写

Bp 碱基对

CoA 辅酶A

DMAPP 二甲基烯丙基焦磷酸

DNA 脱氧核糖核酸

cDNA 互补DNA

CPR 细胞色素P450还原酶

EDTA 乙二胺四乙酸

FAD 黄素腺嘌呤二核苷酸

FMN 黄素单核苷酸

FPP 法呢基焦磷酸

GPP 香叶基焦磷酸

GGPP 香叶基香叶基焦磷酸

GC 气相色谱

HMG 羟甲基戊二酰

IPP 异戊烯基焦磷酸

IPTG 异丙基-D-硫代半乳糖苷

LB 溶源性肉汤

MS 质谱

NADP 烟酰胺腺嘌呤二核苷酸磷酸

NADPH 烟酰胺腺嘌呤二核苷酸磷酸，还原形式

P450 细胞色素P450

PCR 聚合酶链反应

RMCE 重组酶介导的盒交换

RT-PCR 逆转录-聚合酶链反应

RNA 核糖核酸

mRNA 信使核糖核酸

RBS 核糖体结合位点。

VzZs 来自香根草的子杂烯合酶

VzCp 来自香根草的细胞色素P450

VzTps 来自香根草的萜烯合酶

VzTrspt 来自香根草的转录物

发明内容

上述问题出人意料地通过如下方式解决了：

-提供一种新型的细胞色素P450单加氧酶(VzCP7186；SEQ ID NO:20)，其具有氧化(+)子杂烯的C3位以形成子杂烯醇的能力，并且具有氧化异朱栾倍半萜的C12位成为异朱栾倍半萜醇的能力；

-提供一种将(+)子杂烯氧化为子杂烯醇的方法，其通过施加从VzCP7186(包含SEQID NO:20)、VzCP521-11(包含SEQ ID NO:21)和VzCP8201(包含SEQ ID NO:19)中选出的一种或多种细胞色素P450酶，来氧化子杂烯的C3位；

-提供一种将异朱栾倍半萜氧化为异朱栾倍半萜醇、异努特卡醇或包含其的混合物的方法，其通过施加从VzCP7186(SEQ ID NO:20)和VzCP521-11(SEQ ID NO:21)中选出的一种或多种细胞色素P450酶，可选地与VzCP8201(SEQ ID NO:19)组合来进行。尽管VzCP7186(SEQ ID NO:20)本身并且可选地与VzCP8201(SEQ ID NO:19)组合，可特异性地在C12位置上氧化异朱栾倍半萜，但酶VzCP521-11(SEQ ID NO:21)具有氧化异朱栾倍半萜的C2和C12位置的能力，如下所述；

-将上述反应与进一步的化学或酶促氧化步骤结合，可从子杂烯获得子杂烯酮和/或表-子杂烯酮；并且可从异朱栾倍半萜获得异努特卡酮和/或异朱栾倍半萜基酯；和

-提供萜烯合酶，特别是异朱栾倍半萜合酶(SEQ ID NO:3)和子杂烯合酶(SEQ IDNO:33、38或42)与本文所述的相应细胞色素P450酶的合适组合。

附图说明

图1A-D.VzTps1718的主要产物的结构和名称，VzCP521-11、VzCP7186和VzCP8201的氧化产物以及衍生物的例子。

图2.工程菌细胞中重组VzTps1718酶体内产生的倍半萜的GC-MS分析。标出了与鉴定出的产物相对应的峰：异朱栾倍半萜(化合物1)，香根螺-1(10),7(11)-二烯(化合物2)和朱栾倍半萜(化合物3)。标记为MW 204和MW 222的峰分别对应于倍半萜烃和倍半萜醇，其各自的结构尚未确定。FOH：通过大肠杆菌内源性酶活性将FPP水解产生的法呢醇。

图3A-B.VzTps1718产品混合物中化合物1(图2)的质谱图(A)和异朱栾倍半萜真实标准品的质谱图(B)。

图4A-B.VzTps1718产品混合物中化合物2(图2)的质谱图(A)和香根螺-1(10),7(11)-二烯真实标准品的质谱图(B)。

图5A-B.VzTps1718产品混合物中化合物3(图2)的质谱图(A)和(+)-朱栾倍半萜真实标准品的质谱图(B)。

图6A-C.大肠杆菌细胞产生的倍半萜化合物的GC-MS分析，工程改造为单独产生重组VzTps1718倍半萜合酶(A)，以及功能性VzCP8201细胞色素P450酶(B)或功能性VzCP7186细胞色素P450酶(C)。标有星号的峰对应于细胞色素P450酶通过倍半萜烃氧化产生的已氧化的化合物。显示了鉴定为异朱栾倍半萜醇和乙酸异朱栾倍半萜基酯的峰。所有其他峰是由VzTps1718倍半萜合酶产生的倍半萜化合物。

图7A-B.图6B和6C中保留时间为13.02分钟的峰的质谱图(A)和真实异朱栾倍半萜醇标准品的质谱图(B)。

图8A-B.图6B和6C中保留时间为14.25分钟的峰的质谱图(A)和真实乙酸异朱栾倍半萜基酯标准品的质谱图(B)。

图9A-B.大肠杆菌细胞产生的倍半萜化合物的GC-MS分析，工程改造为单独产生重组VzTps1718倍半萜合酶(A)，以及功能性VzCP521-11细胞色素P450酶(B)。标有星号的峰对应于细胞色素P450酶通过倍半萜烃氧化产生的已氧化的化合物。显示了鉴定为异努特卡醇、异朱栾倍半萜醇和乙酸异朱栾倍半萜基酯的峰。所有其他峰是由VzTps1718倍半萜合酶产生的倍半萜化合物。

图10A-B.图9B中保留时间为13.2分钟的峰的质谱图(A)和真实异努特卡醇标准品的质谱图(B)。

图11A-C.大肠杆菌细胞产生的倍半萜化合物的GC-MS分析，工程改造为产生重组VzTps1718倍半萜合酶以及功能性VzCP8201细胞色素P450酶(A)，以及功能性VzCP7186细胞色素P450酶(B)或以及功能性VzCP8201和VzCP7186细胞色素P450酶(C)。标有星号的峰对应于细胞色素P450酶通过倍半萜烃氧化产生的已氧化的化合物。

图12A-B.香根草(+)-子杂烯合酶(VzZS)和细胞色素-P450单加氧酶产生的倍半萜化合物的结构。

图13A-C.在工程细菌细胞中表达的重组子杂烯合酶(A)VsZS1、(B)VzZS2和(C)VzZS2-Nter2在体内产生的倍半萜的GC-MS总离子色谱图。显示了对应于子杂烯的峰。在重组酶的次要产物中也检测到了α-柏木萜烯(funebrene)、β-柏木萜烯和前体子杂烯(prezizaene)(分别为标记为1、2和3)。IS，内标。

图14A-C.表达子杂烯合酶和功能性VzCP8201细胞色素P450酶(A)、功能性VzCP7186细胞色素P450酶(B)或功能性VzCP521-11细胞色素P450酶(C)的大肠杆菌细胞产生的倍半萜的GC-MS总离子色谱图。标出了鉴定为α-子杂烯醇和客烯醇(khusimol)的峰。

图15A-B.图14中保留时间为12.03分钟的峰的质谱图(A)，以及真实α-子杂烯醇标准品的质谱图(B)。

图16A-B.图14C中保留时间为12.8分钟的峰的质谱图和真实客烯醇标准品的质谱图。

图17A-C.表达子杂烯合酶并与功能性VzCP8201细胞色素P450酶(A)结合或与功能性VzCP7186(B)结合或与VzCP8201和VzCP7186细胞色素P450酶(C)结合的大肠杆菌细胞产生的倍半萜的GC-MS总离子色谱图。标出了鉴定为α-子杂烯醇和子杂烯酮的峰。

图18A-B.图17C中保留时间为11.96分钟的峰的质谱图(A)和真实子杂烯酮标准品的质谱图(B)。

图19.本发明的异朱栾倍半萜氧化顺序的示意图。示出了根据优选实施方案的反应方案，其说明了各个反应步骤的主要产物。

图20.本发明的子杂烯氧化顺序的示意图。示出了根据优选实施方案的反应方案，其说明了各个反应步骤的主要产物。

图21A-C.由表达不同的子杂烯合酶：(A)VzZS1、(B)VzZS2和(C)VzZS2-Nter2的工程化酿酒酵母细胞从体内构建的质粒产生的倍半萜的GC-MS色谱图。显示了内标(IS)的峰和鉴定为子杂烯的峰。

图22.表达VzZS2子杂烯合酶和VzCP521-11细胞色素P450的工程化酿酒酵母菌株YST124产生的氧化的倍半萜的GC-MS分析。显示了鉴定为法尼醇、子杂烯酮、子杂烯醇和客烯醇的峰。

具体实施方式

具体定义

如本申请中所意图的，本申请中列举的所有化合物均通过图1和图12所示的它们的结构式的方式定义。

出于本发明的目的，“细胞色素P450”或“具有细胞色素P450活性的多肽”或“细胞色素P450氧化活性”旨在一种多肽，其能够催化萜烯分子氧化形成已氧化的化合物例如醇、醛、酮或羧酸。根据一个特定的实施方案，细胞色素P450充当“细胞色素P450单加氧酶”，即通过在每个催化循环中向化合物(例如特别是萜烯，更特别是倍半萜化合物)中添加仅一个氧原子来显示“细胞色素P450单加氧酶活性”。可以通过进行如实验部分中详述的酶测定来简单地确认多肽催化特定萜烯特别是倍半萜的氧化的能力。

在本发明的上下文中，“细胞色素P450氧化活性”或“细胞色素P450单加氧酶活性”应理解为酶催化从单萜、倍半萜或二萜底物中选出的萜烯底物的氧化反应的能力，该萜烯底物更特别地为至少一种倍半萜底物，优选选自子杂烯和异朱栾倍半萜，或两种底物的组合。在第一形态中，应理解为描述了酶催化子杂烯的C3位上的氧化反应，特别是形成子杂烯醇的能力。特别地，子杂烯醇被形成为“主要产物”。在第二形态中，还应理解为描述酶催化异朱栾倍半萜的C2和/或C12位的氧化反应，特别是形成异朱栾倍半萜醇和/或异努特卡醇作为“主要产物”的能力。在第三形态中，应理解为描述根据上述形态一和二的酶活性。

根据本发明，“萜烯合酶”涵盖由从GPP、FPP或GGPP中选出的非环萜烯前体，特别是FPP，形成至少一种直链的，特别是至少一种单环或多环萜烯的能力。在第一个特定的实施方案中，本发明的萜烯合酶包括将FPP转化为异朱栾倍半萜，或包括异朱栾倍半萜和可选的香根螺-1(10),7(11)-二烯和朱栾倍半萜的倍半萜混合物的能力。在第二个特定的实施方案中，本发明的萜烯合酶包括将FPP转化成子杂烯或包括子杂烯的倍半萜混合物的能力。

如本文下文在实施例中更详细地描述，“倍半萜氧化活性”在“标准条件”下确定：它们可以通过如下方式确定，使用所培养的重组细胞色素P450表达宿主细胞，破坏的细胞色素P450表达细胞，这些的级分或富集或纯化的细胞色素P450酶，在pH为6至11，优选6至8的范围内的培养基或反应介质中，优选经缓冲的，在分子氧存在下，在约20至45℃，优选约25至40℃，例如35至38℃的温度下，并且在存在参考底物(此处为子杂烯和/或异朱栾倍半萜)的情况下，以1至10mg/ml，优选3至7mg/ml的初始浓度添加，或由宿主细胞内源性产生。

如下所述，“萜烯合酶活性”在“标准条件”下确定：它们可以通过如下方式确定，使用重组萜烯合酶表达宿主细胞，破坏的萜烯合酶表达细胞，这些的级分或富集或纯化的萜烯合酶，在pH为6至11，优选6至8的范围内的培养基或反应介质中，优选经缓冲的，在约20至45℃，优选约25至40℃，例如35至38℃的温度下，并且在存在参考底物(此处特别是FPP)的情况下，以1至10mg/ml，优选3至7mg/ml的初始浓度添加，或由宿主细胞内源性产生。

“甲羟戊酸途径”(也称为“异戊二烯途径”或“HMG-CoA还原酶途径”)是真核生物、古菌和某些细菌中必不可少的代谢途径。甲羟戊酸途径始于乙酰辅酶A，产生两个五碳结构单元，称为异戊烯基焦磷酸(IPP)和二甲基烯丙基焦磷酸(DMAPP)。关键酶是乙酰乙酰基-CoA硫解酶(atoB)，HMG-CoA合酶(mvaS)，HMG-CoA还原酶(mvaA)，甲羟戊酸激酶(MvaK1)，磷酸甲羟戊酸激酶(MvaK2)，甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基焦磷酸异构酶(idi)。将甲羟戊酸途径与酶活性结合以产生萜烯前体GPP、FPP或GGPP，特别是FPP合酶(ERG20)，允许重组细胞生产萜烯。

术语“生物学功能”、“功能”、“生物活性”或“活性”是指如本文所定义的萜烯合酶或萜烯氧化酶催化从相应底物形成萜烯或已氧化的萜烯的能力。

如本文所用，术语“宿主细胞”或“经转化的细胞”是指原核或真核细胞或生物，其被改变以携带(harbor)至少一个核酸分子，例如，编码所需蛋白质或核酸序列的重组基因，其在转录时产生如本文所述使用的多肽。宿主细胞特别是细菌细胞、真菌细胞或植物细胞。宿主细胞可含有已整合到宿主细胞的核或细胞器基因组中的重组基因。或者，宿主可以在染色体外含有重组基因。

“同源”序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。

“旁系同源物”或旁系同源序列来源于基因复制，其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物典型地聚簇在一起并且通过基因在相关植物物种内的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中，共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。

“直系同源物”或直系同源序列是彼此相似的序列，因为它们发现于由共同的祖先传下的物种中。例如，已知具有共同祖先的植物物种含有许多具有相似序列和功能的酶。例如通过使用CLUSTAL或BLAST程序构建一个物种的基因族的系统发生树，技术人员能够鉴定直系同源序列并预测直系同源的功能。一种用于鉴定或确认同源序列间的相似功能的方法是通过比较过表达或缺乏(在基因敲除/敲减中)相关多肽的宿主细胞或生物体(如植物或微生物)中的转录物概况。技术人员能够理解，具有相似转录物概况的基因(具有大于50％调控的共同转录物，或具有大于70％调控的共同转录物，或大于90％调控的共同转录物)会具有相似的功能。本文所述序列的同源物、旁系同源物、直系同源物以及任何其他变体预期以类似的方式发挥作用。

术语“植物”可互换使用以包括植物细胞，包括植物原生质体、植物组织、产生再生植物或植物部分的植物细胞组织培养物、或植物器官诸如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。

当特定的宿主天然地产生萜烯或已氧化的萜烯，或者当其天然不产生所述萜烯而是在用本文所述的核酸转化之前或与所述核酸一起进行转化以产生所述萜烯或已氧化的萜烯时，意味着“能够产生”萜烯或已氧化的萜烯。经转化以比天然存在的宿主产生更高量的萜烯或已氧化的萜烯的宿主也被“能够产生萜烯或已氧化的萜烯的宿主”或“能够产生萜烯或已氧化的萜烯的生物体或细胞”所涵盖。

本文所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含本发明化合物通常与其天然状态相关的其他不同化合物的状态，因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5％、1％、5％、10％或20％，或至少50％或75％。在一个实施方案中，这些术语是指本发明的化合物占给定样品质量按重量计至少95％、96％、97％、98％、99％或100％。如本文所用，当提及核酸或蛋白质时，核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”，也指一种纯化或浓缩状态，其不同于天然存在于例如原核或真核环境中，例如在细菌或真菌细胞中，或哺乳动物特别是人体中的状态。任何纯化程度或浓度，只要大于天然存在的纯化或浓缩程度，包括(1)从其他相关结构或化合物中的纯化，或(2)与在所述原核或真核环境中通常不相关的结构或化合物的缔合，都在“分离的”含义内。根据本领域技术人员已知的各种方法和工艺，本文所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的，或如若不然与它们通常在性质上不相关的结构或化合物相缔合。

在本文提供的说明书和所附权利要求的上下文中，除非另有说明，否则“或”的使用意味着“和/或”。

类似地，各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。

应进一步理解，在各种实施方案的描述使用术语“包含”的情况下，本领域技术人员将理解，在一些特定情况下，可以使用“基本上由……组成”或“由……组成”的语言来替代地描述实施方案。

术语“约”表示所述值的±25％的可能变化，特别是±15％、±10％、更特别是±5％、±2％或±1％。

术语“基本上”描述的值范围为约80至100％，例如85至99.9％，特别是90至99.9％，更特别是95至99.9％，或98至99.9％，尤其是99至99.9％。

“主要地”是指大于50％的范围内的比例，例如在51％至100％的范围内，特别是在75％至99.9％的范围内；尤其是85至98.5％，例如95至99％。

在本发明的上下文中，“主要产物”表示单一化合物或一组至少2种化合物，例如2、3、4、5或更多种，特别是2或3种化合物，该单一化合物或一组化合物“主要”是通过本文所述的反应制备的，并且基于由所述反应形成的产物的成分的总量，以主要比例包含在所述反应中。所述比例可以是摩尔比例，重量比例，或者优选基于色谱分析，由反应产物的相应色谱图计算的面积比例。

在本发明的上下文中，“副产物”表示单一化合物或一组至少2种化合物，例如2、3、4、5或更多种，特别是2或3种化合物，该单一化合物或一组化合物并非“主要”是通过本文所述的反应制备的。

由于酶促反应的可逆性，除非另有说明，否则本发明涉及在两个反应方向上本文所述的酶促或生物催化反应。

本文描述的多肽的“功能突变体”包括如下定义的此类多肽的“功能等同物”。

术语“立体异构体”特别包括构象异构体。

根据本发明，通常包括本文描述的化合物的所有“立体异构形式”，例如结构异构体，尤其是立体异构体及其混合物，例如旋光异构体或几何异构体，例如E和Z异构体，以及它们的组合。如果在一个分子中存在几个不对称中心，则本发明包括这些不对称中心的不同构象的所有组合，例如对映异构体对。

“立体选择性”描述了产生立体异构纯形式的化合物的特定立体异构体的能力或以本文所述的酶催化方法从多种立体异构体中特异性转化特定立体异构体的能力。更具体而言，这意味着本发明的产物相对于特定的立体异构体富集，或者离析物相对于特定的立体异构体可以贫化。这可以通过根据下式计算的纯度％ee参数进行量化：

％ee＝[X_A-X_B]/[X_A+X_B]*100，

其中X_A和X_B代表立体异构体A和B的摩尔比。

根据本发明的反应的“收率”和/或“转化率”是在例如4、6、8、10、12、16、20、24、36或48小时的规定时间段内(反应在该段时间内进行)确定的。特别地，反应在精确定义的条件下进行，例如在本文定义的“标准条件”下进行。

不同的收率参数(“收率”或YP/S；“比生产率收率”；或时空收率(STY))在本领域中是众所周知的，并且如文献所述进行测定。

“收率”和“YP/S”(均以所生产的产品质量/所消耗的材料质量表示)在本文中用作同义词。

除非另有说明，否则“萜烯”涵盖单萜、倍半萜和二萜。具体的萜烯是倍半萜烯，例如异朱栾倍半萜和子杂烯(zizaene)。

比生产率收率(specific productivity-yield)描述了每小时每L发酵液(或培养基)每克生物质所生产的产物(如萜烯或已氧化的萜烯)的量。用WCW表示的湿细胞重量描述了生化反应中具有生物活性的微生物的数量。该值以每g WCW每小时的产品g数给出(即g/gWCW^-1h^-1)。

术语“发酵产生”或“发酵”是指微生物(由所述微生物所包含或由其产生的酶活性辅助)在细胞培养物中利用添加到温育中的至少一种营养源(例如包含碳源的)产生化合物的能力。

术语“发酵液”应理解为是指一种液体，特别是水性溶液或水性/有机溶液，其基于发酵工艺并且未进行或进行了例如本文所述的后处理(work up)。

“酶催化”或“生物催化”方法是指所述方法在酶(包括本文所定义的酶突变体)的催化作用下进行。因此，该方法可以在分离形式的(纯化的、富集的)或粗制形式的所述酶的存在下，或者在细胞系统的存在下进行，所述细胞系统特别是包含活性形式的所述酶并具有如本文所公开的催化转化反应能力的天然或重组微生物细胞。

术语“选择性转化”或“提高选择性”通常是指在所述反应的整个过程中(即在反应的起始和终止之间)，在所述反应的某个时间点，或在所述反应的一个“期间”，将特定的立体异构形式，例如烃的(+)-形式以比相应的(-)-形式高的比例或量(相比于摩尔基准)进行转化。特别地，所述选择性可以在一个“期间”被观察为对应于底物初始量的1至99％，2至95％，3至90％，5至85％，10至80％，15至75％，20至70％，25至65％，30至60％，或40至50％的转化率。所述较高的比例或数量可以例如表示为：

-在整个反应过程或其所述期间观察到的较高的异构体最大收率；

-在确定的底物转化率值百分比下，较高的异构体相对含量；和/或

-在较高的转化率值百分比下，相同的异构体相对含量；

其中的每一种优选相对于参考方法来观察，所述参考方法在其他相同条件下用已知化学或生物化学方法进行。

通常根据本发明还包括本文所述化合物的所有“异构体形式”，例如结构异构体，尤其是立体异构体及其混合物，例如旋光异构体或几何异构体，例如E和Z异构体，以及它们的组合。如果在一个分子中存在多个不对称中心，则本发明包括这些不对称中心的不同构像的所有组合，例如对映异构体对，或立体异构形式的任何混合形式。

如果本公开涉及不同优先程度的特征、参数及其范围(包括上位的，非明确优选的特征、参数及其范围)，则除非另有说明，否则这些特征、参数和范围中的两个或更多个的任意组合与它们各自的优选程度无关地涵盖在本发明的公开内容中。

详细说明

a.本发明的特定实施方案

本发明具体涉及以下实施方案：

a1.子杂烯的氧化

1.一种生产氧化的子杂烯化合物的方法，该方法包括：

a.使子杂烯或含子杂烯的组合物与具有细胞色素P450单加氧酶活性的多肽接触，该多肽选自：

i.VzCP8201，其包含与SEQ ID NO:19具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

ii.VzCP521-11，其包含与SEQ ID NO:21具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

iii.VzCP7186，其包含与SEQ ID NO:20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

iv.或至少两种所述多肽的组合；

从而获得至少一种子杂烯的氧化产物，特别是通过将子杂烯转化为子杂烯醇，优选包含α-和/或β-子杂烯醇，特别是α-子杂烯醇(即(+)-子杂烯醇)，或含有这种子杂烯醇的氧化产物，尤其是主要含有这种子杂烯醇的氧化产物；和

b.可选地，将步骤a中获得的子杂烯氧化产物，如子杂烯醇，特别是α-子杂烯醇分离。

步骤b可以在有或没有事先分离出前一步骤的一种或多种氧化产物的情况下进行。

除非另有说明，“子杂烯醇(zizaenol)”包括α-和/或β-子杂烯醇，可选地与任何其他子杂烯酮(zizaenone)前体组合。

“子杂烯的氧化产物”或“包含子杂烯醇的氧化产物”包括α-和/或β-子杂烯醇，可选地与另外的氧化产物组合：结构上不同的醇，如客烯醇，任何其他的子杂烯酮前体；和/或其进一步的氧化产物，如子杂烯酮；和/或前述子杂烯氧化产物的任何异构体，例如表-子杂烯酮。所述其他氧化产物可以作为主要产物或特别是作为副产物获得。

如将在下面进一步详细解释的，上述方法可以在体外(in vitro)以及体内(invivo)进行。

2.实施方案1的方法，其中步骤a在含有至少一种所述具有细胞色素P450单加氧酶活性的多肽的细胞培养物中，在分子氧的存在下，在体内进行；或在分子氧和至少一种分离形式的所述具有细胞色素P450单加氧酶活性的多肽的存在下，在液体培养基或反应介质中在体外(in vitro)进行。

3.实施方案1和2中任一项的方法，其中步骤a通过在子杂烯或含子杂烯的组合物的存在下，在有助于子杂烯氧化的条件下，培养重组非人宿主生物或细胞(其表达至少一种所述具有细胞色素P450单加氧酶活性的多肽)来体内进行，特别是培养重组宿主(其经转化以表达至少一种所述具有细胞色素P450单加氧酶活性的多肽)来体内进行。

4.前述实施方案中任一项的方法，其中步骤a中的子杂烯的转化在具有P450还原酶(CPR)活性的多肽存在下；并且可选地在添加的氧化还原等同物，特别是NAD(P)H的存在下进行。

为了具有催化活性，必须将上述P450与P450还原酶(CPR)结合使用，该酶能够将电子从NADPH(烟酰胺腺嘌呤二核苷酸磷酸，还原形式)转移到P450活性位点，从而重构P450活性。CPR必须为了在体外和体内都进行该方法而存在。当该方法在体内进行时，CPR可以天然存在于宿主生物或细胞中，或者可以在转化以表达本发明的多肽之前、同时或之后，将该生物或细胞转化以表达CPR。在本发明的一个优选实施方案中，用同时包含本发明的P450多肽和CPR的融合多肽来转化宿主细胞或生物。在另一个优选的实施方案中，CPR是植物CPR。最优选地，其衍生自胡椒薄荷(Mentha piperita)CPR。

当该方法在体外进行时，待与萜烯化合物和CPR接触的细胞色素P450可以通过使用标准蛋白质或酶提取技术从表达它的任何生物中提取来获得。如果宿主生物是将本发明的多肽释放到培养基中的单细胞生物或细胞，例如当不存在膜锚时，则可以简单地从培养基中，例如通过离心，可选地随后通过洗涤步骤和重新悬浮在合适的缓冲溶液中收集多肽。如果生物或细胞在其细胞内积累多肽，则可以通过破坏或裂解细胞并进一步从细胞裂解物中提取多肽来获得多肽。当P450和CPR包含膜锚定序列时，例如植物中的天然P450和CPR，它们与膜相关，因此位于细胞裂解液的膜部分中。通过使用已知方法对粗细胞裂解液进行离心分离，可以轻松地将膜级分(微粒体)与其他蛋白质级分分离。

对于体外方法，P450和CPR可以以分离的形式或作为蛋白质提取物的一部分独立提供，并悬浮在最佳pH值的缓冲溶液中。如果合适的话，可以添加盐，DTT，NADPH，NADH，FAD，FMN和其他种类的酶促辅因子以优化酶活性。进一步的实施例中更详细地描述了合适的条件。

5.实施方案4的方法，其中所述CPR包含与SEQ ID NO:23具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在本文任何实施方案的一个特定形态中，CPR由核酸编码，该核酸包含与SEQ IDNO:22具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

6.前述实施方案之一的方法，还包括在步骤a之前，在具有子杂烯合酶活性的多肽存在下，将法呢基焦磷酸(FPP)环化。

7.实施方案6的方法，其中所述具有子杂烯合酶活性的多肽包含与SEQ ID NO:33、38或42具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

8.前述实施方案之一的方法，其通过在细胞培养物中施加内源性产生FPP的宿主或经遗传修饰以产生FPP或经遗传修饰以增加量(相对于未修饰的宿主)产生FPP的宿主来进行。

9.实施方案8的方法，其中所述宿主被遗传修饰以产生增加量的FPP，特别是经遗传修饰以表达催化甲羟戊酸代谢途径的酶集合(包括乙酰乙酰基-CoA硫解酶(atoB)，HMG-CoA合酶(mvaS)，HMG-CoA还原酶(mvaA)，甲羟戊酸激酶(MvaK1)，磷酸甲羟戊酸激酶(MvaK2)，甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基焦磷酸异构酶(idi))。

10.前述实施方案之一的方法，还包括作为步骤c，将子杂烯醇特别是(+)-子杂烯醇转化为子杂烯酮，或转化为包含子杂烯酮和表子杂烯酮的混合物。

步骤c可以在有或没有事先分离出前一步骤的一种或多种反应产物的情况下进行。

11.实施方案10的方法，其中步骤c包括化学氧化或生物化学氧化；所述生物化学氧化可在细胞培养物中在体内进行，或在液体反应介质中在体外进行，并且在至少一种具有子杂烯醇氧化活性的多肽的存在下，特别是在具有子杂烯醇脱氢活性的多肽的存在下，并且可选地在添加的氧化还原等同物特别是NAD(P)H，以及可选的基于合适的酶的辅因子再生系统的存在下。

12.实施方案11的方法，其中步骤c通过在子杂烯醇特别是(+)-子杂烯醇，或包含子杂烯醇的组合物，如主要含有子杂烯醇，特别是α-子杂烯醇的反应产物的存在下，在有助于子杂烯醇氧化(脱氢)的条件下，培养非人宿主生物特别是重组宿主，或细胞来进行，其表达，特别是经遗传修饰以表达，更特别是经转化以表达至少一种具有子杂烯醇脱氢活性的多肽。

13.前述实施方案之一的方法，其中所述具有细胞色素P450单加氧酶活性的多肽选自：

i.VzCP8201，其包含与SEQ ID NO:19具有至少70％序列同一性的氨基酸序列，其在N末端延伸了至少一个氨基酸残基，

ii.VzCP521-11，其包含与SEQ ID NO:21具有至少70％序列同一性的氨基酸序列，其在N末端延伸了至少一个氨基酸残基；和

iii.VzCP7186，其包含与SEQ ID NO:20具有至少70％序列同一性的氨基酸序列，其在N-末端延伸了至少一个氨基酸残基。

例如，多肽可以被单个天然氨基酸残基，特别是甲硫氨酸残基，或含有1至50，1至40，1至30，1至25，特别是5至25或15至25个连续的氨基酸残基的任何序列延伸。该序列可能具有不同的功能；例如，它可以充当膜锚定序列，可以改善蛋白质表达或可以改善酶的功能。

14.实施方案13的方法，其中所述具有细胞色素P450单加氧酶活性的多肽选自：

i.VzCP8201，其包含与SEQ ID NO:19具有至少70％序列同一性的氨基酸序列，其在N-末端延伸了甲硫氨酸或其天然或合成膜锚定序列，

ii.VzCP521-11，其包含与SEQ ID NO:21具有至少70％序列同一性的氨基酸序列，其在N-末端延伸了甲硫氨酸或其天然或合成膜锚定序列；和

iii.VzCP7186，其包含与SEQ ID NO:20具有至少70％序列同一性的氨基酸序列，其在N-末端延伸了甲硫氨酸或其天然或合成膜锚定序列。

特别地，各自的天然锚定序列可以从本文公开的各自的全长序列中获得。也可以用作锚定序列的人工N-末端序列可以容易地合成。例如，可以提及这样的N末端肽，其包含氨基酸序列SEQ ID NO:24，或者与其具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％序列同一性的功能上等效的序列或类似物序列。

15.实施方案14的方法，其中所述具有细胞色素P450单加氧酶活性的多肽选自：

i.VzCP8201，其包含与SEQ ID NO:7或10具有至少70％序列同一性的氨基酸序列；

ii.VzCP521-11，其包含与SEQ ID NO:18具有至少70％序列同一性的氨基酸序列；和

iii.VzCP7186，其包含与SEQ ID NO:13具有至少70％序列同一性的氨基酸序列。

a2.异朱栾倍半萜的氧化

16.一种生产氧化的异朱栾倍半萜化合物的方法，该方法包括：

a.使异朱栾倍半萜或含异朱栾倍半萜的组合物与具有细胞色素P450单加氧酶活性的多肽接触，所述多肽选自：

i.VzCP521-11，其包含与SEQ ID NO:21具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

ii.VzCP7186，其包含与SEQ ID NO:20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

iii.或至少两种所述多肽的组合；

iv.或i.、ii.或iii.与VzCP8201的组合，该VzCP8201包含与SEQ ID NO:19具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

从而将异朱栾倍半萜转化为至少一种氧化产物，特别是通过将异朱栾倍半萜转化为异朱栾倍半萜醇或含有异朱栾倍半萜醇的氧化产物，特别是主要含有异朱栾倍半萜醇的氧化产物；或将异朱栾倍半萜转化为异努特卡醇或包含异努特卡醇的氧化产物，特别是主要包含异努特卡醇的氧化产物；或将异朱栾倍半萜转化为包含异朱栾倍半萜醇和异努特卡醇的混合物或转化为主要包含异朱栾倍半萜醇和异努特卡醇的氧化产物；或如果获得异朱栾倍半萜醇，则氧化产物还可包含异朱栾倍半萜基酯；

和

b.可选地，将步骤a中获得的至少一种氧化产物分离。

步骤b可以在有或没有事先分离出前一步骤的一种或多种反应产物的情况下进行。

特别地，“异朱栾倍半萜的氧化产物”包括异朱栾倍半萜醇和/或异努特卡醇作为主要产物；以及可选地作为另外的主要或副产物，特别是作为副产物的其一种或多种进一步的氧化产物，如异努特卡酮和/或异朱栾倍半萜基酯。其还可包含非氧化的化合物，例如香根螺-1(10),7(11)-二烯，(+)-朱栾倍半萜，尤其是其相应的氧化产物，例如努特卡醇，努特卡酮，β-岩兰烯醇和β-岩兰烯酮(另请参见图1)。

如将在下面进一步详细解释的，上述方法可以在体外以及体内进行。

在该实施方案的一个特定形态中，作为主要产品，制备了异努特卡醇与异朱栾倍半萜醇和可选的异朱栾倍半萜基酯的组合。更特别地，该转化是通过应用选自以下的P450单加氧酶进行的：

a)VzCP521-11，其包含与SEQ ID NO:21具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列；

b)a)与VzCP8201的组合，该VzCP8201包含与SEQ ID NO:19具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

c)a)与VzCP7186的组合，该VzCP7186包含与SEQ ID NO:20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，

d)a)与VzCP8201和VzCP7186的组合物，该VzCP8201包含与SEQ ID NO:19具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列；该VzCP7186包含与SEQ ID NO:20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

异朱栾倍半萜基酯可以在形成酯的酶活性例如酯酶或脂肪酶或酰基转移酶活性的存在下产生。可以将所述酯酶活性添加到含有异朱栾倍半萜醇的反应混合物中，或者可以通过内源存在的酶活性来催化所述转化，如果所述方法是通过使用宿主体系在体内进行的话。异朱栾倍半萜基酯优选选自羧酸酯，特别是饱和的短链羧酸酯，更特别是C₂-C₄羧酸酯，特别是乙酸异朱栾倍半萜基酯。

在该实施方案的另一个特定形态中，主要产物是异朱栾倍半萜醇，可选地与异朱栾倍半萜基酯组合。更特别地，该转化是通过应用选自以下的P450单加氧酶进行的：

a)VzCP7186，其包含与SEQ ID NO:20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，或

b)a)与VzCP8201的组合，该VzCP8201包含与SEQ ID NO:19具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

异朱栾倍半萜基酯可以在例如酯酶、脂肪酶、酰基转移酶或乙酰转移酶的酶活性的存在下产生。可以将所述酶活性添加到含有异朱栾倍半萜醇的反应混合物中，或者可以通过内源存在的酶活性来催化所述转化，如果所述方法是通过使用宿主体系在体内进行的话。异朱栾倍半萜基酯优选选自羧酸酯，特别是饱和的短链羧酸酯，更特别是C₂-C₄羧酸酯，特别是乙酸异朱栾倍半萜基酯。

17.实施方案16的方法，其中步骤a在含有至少一种所述具有细胞色素P450单加氧酶活性的多肽的细胞培养物中，在分子氧的存在下，在体内进行；或在分子氧和至少一种分离形式的所述具有细胞色素P450单加氧酶活性的多肽的存在下，在液体反应介质中在体外进行。

18.实施方案16和17中任一项的方法，其中步骤a通过在异朱栾倍半萜或含有异朱栾倍半萜的组合物的存在下，在有助于异朱栾倍半萜氧化的条件下，培养重组非人宿主生物或细胞(其表达至少一种所述具有细胞色素P450单加氧酶活性的多肽)，特别是培养重组细胞，其经转化以表达至少一种所述具有细胞色素P450单加氧酶活性的多肽。

19.实施方案16至18之一的方法，其中步骤a中的异朱栾倍半萜的转化在具有P450还原酶(CPR)活性的多肽存在下，并且可选地在添加的氧化还原等同物，特别是NAD(P)H的存在下进行。

为了具有催化活性，必须将上述P450与P450还原酶(CPR)结合使用，该酶能够将电子从NADPH(烟酰胺腺嘌呤二核苷酸磷酸，还原形式)转移到P450活性位点，从而重构P450活性。CPR必须为了在体外和体内都进行该方法而存在。当在体内进行该方法时，CPR可以天然存在于宿主生物或细胞中，或者可以在转化以表达本发明的细胞色素P450多肽之前、同时或之后，将该生物或细胞转化以表达CPR。在本发明的一个优选实施方案中，用同时包含本发明的多肽和CPR的融合多肽来转化宿主细胞或生物。在另一个优选的实施方案中，CPR是植物CPR。最优选地，其衍生自胡椒薄荷(Mentha piperita)CPR。

20.实施方案19的方法，其中所述CPR包含与SEQ ID NO:23具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

21.实施方案16至20之一的方法，还包括在步骤a之前，在具有异朱栾倍半萜合酶活性的多肽存在下，将法呢基焦磷酸(FPP)环化。

22.实施方案21的方法，其中所述具有异朱栾倍半萜合酶活性的多肽包含与SEQID NO:3具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

23.实施方案16至22之一的方法，其通过在细胞培养物中施加内源性产生FPP的宿主或经遗传修饰以产生FPP或经遗传修饰以增加量(相对于未修饰的宿主)产生FPP的宿主来进行。

24.实施方案23的方法，其中所述宿主被遗传修饰以产生增加量的FPP，特别是经遗传修饰以表达催化甲羟戊酸代谢途径的酶集合(包括乙酰乙酰基-CoA硫解酶(atoB)，HMG-CoA合酶(mvaS)，HMG-CoA还原酶(mvaA)，甲羟戊酸激酶(MvaK1)，磷酸甲羟戊酸激酶(MvaK2)，甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基焦磷酸异构酶(idi))。

25.实施方案16至4之一的方法，还包括作为步骤c的以化学或生物化学的方式修饰异朱栾倍半萜醇的方法。

26.实施方案25的方法，包括：

a.作为步骤c1.，将异朱栾倍半萜醇酯化为异朱栾倍半萜基羧酸酯；和/或

b.作为步骤c2.，将异努特卡醇氧化为异努特卡酮。

27.实施方案26的方法，其中，

a.步骤c1.包括化学酯化或生物化学酯化，所述生物化学酯化可在细胞培养物中在体内进行，或在液体反应介质中在体外进行，并且在至少一种具有异朱栾倍半萜醇酯化活性的多肽的存在下，特别是在存在具有酯酶、脂肪酶、酰基转移酶或乙酰转移酶活性的多肽的存在下；

b.步骤c2.包括化学氧化或生物化学氧化，所述生物化学氧化可在细胞培养物中在体内进行，或在液体反应介质中在体外进行，并且在至少一种具有异努特卡醇氧化活性的多肽的存在下，特别是在具有异努特卡醇脱氢活性的多肽的存在下，并且可选地在添加的氧化还原等同物特别是NAD(P)H，以及可选的基于合适的酶的辅因子再生系统的存在下。

28.实施方案27的方法，其中，

i.步骤c1.通过在异朱栾倍半萜醇或含有异朱栾倍半萜醇的组合物，如主要含有异朱栾倍半萜醇的反应产物的存在下，在有助于异朱栾倍半萜醇酯化的条件下，培养非人宿主生物特别是重组宿主或细胞来进行，其表达，特别是经遗传修饰以表达，并且更特别是经转化以表达至少一种具有异朱栾倍半萜醇酯化活性的多肽；或者

ii.步骤c2.通过在异努特卡醇或含有异努特卡醇的组合物，如主要含有异努特卡醇的反应产物的存在下，在有助于异努特卡醇氧化(脱氢)的条件下，培养非人宿主生物特别是重组宿主或细胞来进行，其表达，特别是经遗传修饰以表达，并且更特别是经转化以表达至少一种具有异努特卡醇氧化活性的多肽。

29.实施方案16至28之一的方法，其中所述具有细胞色素P450单加氧酶活性的多肽选自：

30.实施方案29的方法，其中所述具有细胞色素P450单加氧酶活性的多肽选自：

31.实施方案30的方法，其中所述具有细胞色素P450单加氧酶活性的多肽选自：

异努特卡醇可以容易地被氧化为相应的酮，例如通过生物化学或化学方法(例如，参见Oxidation of Alcohols to Aldehydes and Ketones,G.Tojo和M.Fernadez的BasicReactions in Organic Synthesis(2007))以产生异努特卡酮，主要香根草油成分的一种。类似地，可以从β-岩兰烯醇获得β-岩兰烯酮，从努特卡醇获得努特卡酮。

a3.新型细胞色素P450酶

32.一种多肽，其包含与SEQ ID NO:20(VzCP7186)具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的氨基酸序列，并具有细胞色素P450单加氧酶活性，特别是具有将子杂烯转化为子杂烯醇，特别是α-子杂烯醇(即(+)-子杂烯醇)，或转化为主要包含子杂烯醇，特别是α-子杂烯醇的反应产物的能力，和/或具有将异朱栾倍半萜转化为异朱栾倍半萜醇或主要包含异朱栾倍半萜醇的反应产物的能力。

33.实施方案32的多肽，其进一步包含膜锚定序列。

34.实施方案32或33的多肽，其从如下多肽中选出：包含从SEQ ID NO:13和15中选出的氨基酸序列的多肽，或包含与SEQ ID NO:13或15具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽。

35.一种核酸，其编码实施方案32至34中任一项的多肽。

36.实施方案35的核酸，其包含编码核苷酸序列，该序列编码与SEQ ID NO:13、15或20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的多肽；或其互补序列。

37.一种表达载体，其包含实施方案35和36中任一项的编码核酸。

38.实施方案37的表达载体，其为病毒载体、噬菌体或质粒的形式。

39.实施方案37或38的表达载体，其中该编码核酸与至少一种调控序列连接，该调控序列例如控制转录，翻译起始或终止，例如转录启动子、操纵子或增强子或mRNA核糖体结合位点，并且可选地包括至少一个选择标记。

40.非人宿主生物或细胞，其携带(harbor)有根据实施方案35和36中任一项的至少一种核酸。

41.实施方案40的非人宿主生物，其中所述非人宿主生物是真核生物或原核生物，特别是植物、细菌或真菌，特别是酵母。

42.实施方案41的非人宿主生物，其中所述细菌是埃希氏菌(Escherichia)属，特别是大肠杆菌(E.coli)，并且所述酵母是酵母(Saccharomyces)属，特别是酿酒酵母(S.cerevisiae)。

43.实施方案40的非人宿主细胞，其是植物细胞。

44.一种生产根据实施方案32至34中任一项的至少一种多肽的方法，该方法包括：

a)培养非人宿主生物或细胞，该非人宿主生物或细胞携带有根据实施方案35和36中任一项的至少一种核酸并且表达或过表达根据实施方案32至34中任一项的至少一种多肽；

b.可选地，从步骤a.中培养的非人宿主生物或细胞中分离所述多肽。

根据一个优选的实施方案，所述方法还包括在步骤a)之前，用根据本发明的至少一种核酸转化非人宿主生物或细胞，以使其表达或过表达根据本发明的多肽。非人宿主生物或细胞的基因转移(例如通过转化)和培养可以如本文关于体内生产氧化的萜烯的方法所述那样进行。

步骤b)可以通过使用本领域众所周知的任何技术从生物或细胞中分离出特定的多肽来进行。

45.实施方案44的方法，其还包括在步骤a.之前，向非人宿主生物或细胞提供根据实施方案35和36中任一项的至少一种核酸，以使其表达或过表达根据实施方案32至24中任一项的多肽。

46.一种制备能够氧化萜烯化合物的突变多肽的方法，该方法包括以下步骤：

a.选择根据实施方案35和36中任一项的核酸；

b.修饰所选择的核酸以获得至少一种突变体核酸；

c.向宿主细胞或单细胞生物提供该突变核酸的序列，以表达由该突变核酸的序列编码的多肽；

d.筛选出至少一种具有将萜烯化合物氧化的活性的突变多肽；

e.可选地，如果该突变多肽不具有期望的活性，则重复处理步骤a.至d.直至获得具有所需活性的多肽；和，

f.可选地，如果在步骤d.或e.中鉴定出具有所需活性的突变多肽，则分离相应的突变核酸。

在步骤(b)中，可以例如通过随机诱变、位点特异性诱变或DNA改组来产生大量的突变核酸序列。下文更详细描述。

因此，可以将编码包含SEQ ID NO:13或15的多肽或其互补序列的核酸与编码细胞色素P450的任何其他核酸(例如，其从除香根草(Vetiveria zizanioides(L.)Nash)之外的生物体中分离)重组。因此，可以获得并分离突变体核酸，其可以根据例如本发明实施例中公开的标准程序用于转化宿主细胞。

在步骤(d)中，针对至少一种经修饰的细胞色素P450活性，筛选在步骤(c)中获得的多肽。所期望的经修饰的细胞色素P450活性(可以针对其来筛选经表达的多肽)的例子包括增强或降低的酶活性，其通过K_M或V_max值，经修饰的区域化学或立体化学以及经改变的底物利用率或产物分布来量度。可以根据本领域技术人员熟悉的程序和本实施例中公开的方法进行酶活性的筛选。

步骤(e)提供重复处理步骤(a)～(d)，其可以优选地并行进行。因此，通过产生大量的突变核酸，可以同时用不同的突变核酸来转化许多宿主细胞，从而允许随后筛选提高数量的多肽。因此，技术人员可以酌情增加获得所期望的变体多肽的机会。在上述每个实施方案中，序列同一性的程度相对于各自SEQ ID NO的序列彼此独立地优选为至少90％、更优选至少95％、甚至更优选至少98％。根据一个更优选的实施方案，所提到的多肽包含各自SEQ ID NO的序列。甚至更优选地，其由各自SEQ ID NO的序列组成。

47.一种制备经氧化的萜烯的方法，该方法包括：

a.使至少一种萜烯底物多肽接触，该多肽为实施方案32至34中任一项所定义的具有细胞色素P450单加氧酶活性的多肽，或者该多肽由实施方案35和36中任一项所述的核酸编码，

从而将至少一种萜烯转化为至少一种氧化产物；和

b.可选地，将步骤a中获得的至少一种氧化产物分离。

在本发明的上述实施方案中，细胞色素P450的序列也可以包含膜锚定序列。除非另有说明，同一性百分比优选是指提供P450活性的多肽的所述部分。在真核生物中，P450单加氧酶是膜结合蛋白，这些蛋白的N端序列构成了这些酶的膜定位所必需的膜锚。通常由富含脯氨酸的结构域界定的蛋白质的这一部分对于控制酶活性的特异性不是必需的。因此可以通过缺失、插入或突变来修饰该区域，而不影响催化活性。然而，已证明对真核P450(包括植物P450)的N端区域的特异性修饰在微生物中表达时对功能重组蛋白的水平具有积极作用(Halkier et al(1995)Arch.Biochem.Biophys.322,369-377；Haudenschield et al(2000)Arch.Biochem.Biophys.379,127-136)。因此，基于这些先前的观察，可以将膜的锚定区域重新设计以获得适合于生物(多肽在其中表达)的锚定序列，并且为常见类型的宿主生物设计的序列是本领域技术人员已知的。任何合适的锚定序列都可以与本发明的多肽组合使用。

本文所用的P450酶和萜烯合酶优选地是由从香根草(Vetiveria zizanioides(L.)Nash)分离的核酸编码的。

对于P450酶，已知它们可以催化醇在相同碳原子上的连续氧化成为相应的醛、酮和/或羧酸。因此，在以上实施方案中，可以通过相同的P450酶或通过另一种子杂烯醇氧化活性将子杂烯醇氧化为子杂烯酮或其他相应的氧化产物。此外，在以上实施方案中，异朱栾倍半萜醇或异努特卡醇至其他异朱栾倍半萜醇氧化产物(醛或酮)或至异努特卡酮或其他相应的氧化产物的氧化可以由相同的P450酶或另一异朱栾倍半萜醇或异努特卡醇的氧化活性来催化。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有细胞色素P450单加氧酶活性的VzCP8201多肽包含与SEQ ID NO:7、SEQ ID NO:10或SEQ IDNO:19具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有细胞色素P450单加氧酶活性的VzCP8201多肽由核酸编码，该核酸包含与SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9或SEQ ID NO:55具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有细胞色素P450单加氧酶活性的VzCP521-11多肽包含与SEQ ID NO:18或SEQ ID NO:21具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有细胞色素P450单加氧酶活性的VzCP521-11多肽由核酸编码，该核酸包含与SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:54具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有细胞色素P450单加氧酶活性的VzCP7186多肽包含与SEQ ID NO:13、SEQ ID NO:15或SEQ IDNO:20具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有细胞色素P450单加氧酶活性的VzCP7186多肽由核酸编码，该核酸包含与SEQ ID NO:11、SEQID NO:12或SEQ ID NO:14具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有子杂烯合酶活性的多肽是VzZS1，其(a)包含与SEQ ID NO:33具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，或(b)由核酸编码，该核酸包含与SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、或SEQ ID NO:51具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有子杂烯合酶活性的多肽是VzZS2，其(a)包含与SEQ ID NO:38具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，或(b)由核酸编码，该核酸包含与SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:52具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，具有子杂烯合酶活性的多肽是VzZS2-Nter2，其(a)包含与SEQ ID NO:42具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列，或(b)由核酸编码，该核酸包含与SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41或SEQ ID NO:53具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在本文的任何实施方案的一个特定形态中，包括方法、载体或非人宿主生物，CPR由核酸编码，该核酸包含与SEQ ID NO:22具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

b.根据本发明适用的多肽

在本文语境中，以下定义适用：

术语“多肽”是指连续聚合的氨基酸残基，例如至少15个残基，至少30个残基，至少50个残基的氨基酸序列。在本文的一些实施方案中，多肽包含作为酶、或其片段、或其变体或突变体的氨基酸序列。

术语“蛋白”是指任何长度的氨基酸序列，其中氨基酸通过共价肽键连接，并且包括寡肽、肽、多肽和全长蛋白，不管天然生成的还是合成的。

术语“分离的”多肽是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从其天然环境中取出的氨基酸序列。

“靶肽”是指一种氨基酸序列，其将蛋白质或多肽靶向细胞内细胞器(即，线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列，或者可以被用来替换天然靶向多肽。

“膜锚肽”是指对于这些酶的膜定位必不可少的真核细胞色素P450的N-末端部分。

本发明还涉及本文具体描述的多肽的“功能等同物”(也称为“类似物”或“功能突变”或“变体”)。

例如，“功能等同物”是指一种多肽，其在用于确定本文所指的酶的酶活性(例如异朱栾倍半萜或子杂烯氧化活性或子杂烯合酶活性或异朱栾倍半萜合酶活性)的测试中，显示与本文具体描述的特定多肽的活性相比，至少高或低1至10％、或至少20％、或至少50％、或至少75％、或至少90％的活性。

本发明的多肽的此类“功能等同物”或“变体”可用于例如获得所期望的增强或降低的酶活性，经修饰的区域化学或立体化学，或经改变的底物利用率或产物分布，增加的对底物的亲和力，对于生产一种或多种所期望化合物的提高的特异性，增加的酶反应速度，在特定环境(pH、温度、溶剂等)中更高的活性或稳定性，或在所期望的表达系统中的提高的表达水平。变体或突变体可以通过本领域已知的任何方法来制备。天然多肽的变体和衍生物可通过分离其他或相同植物系或物种的天然存在的变体或变体的核苷酸序列，或通过对编码本发明多肽的核苷酸序列的突变进行人工编程而获得。天然氨基酸序列的改变可以通过许多常规方法中的任何一种来完成(见下文)。

根据本发明，“功能等同物”还涵盖特定的突变体，其在本文所述的氨基酸序列的至少一个序列位置中具有与具体陈述的氨基酸不同的氨基酸，但是仍然具有上述生物活性之一，例如酶活性，如异朱栾倍半萜氧化活性，子杂烯氧化活性，子杂烯合酶活性或异朱栾倍半萜合酶活性。因此，“功能等同物”包括可通过一个或多个，例如1至20个、1至15个或5至10个氨基酸的添加、取代特别是保守取代、缺失和/或倒置而获得的突变体，其中所述变化可以在任何序列位置上发生，只要它们导致突变体具有本发明特性的概貌。还特别地提供功能等同性，如果活性模式与在突变体和未改变的多肽之间定性地重合，即，如果例如观察到与相同的激动剂或拮抗剂或底物的相互作用，但是速率不同(即，通过EC50或IC50值或任何本技术领域合适的其他参数来表示)。下表显示了合适的(保守)氨基酸取代的例子：

这种取代的效果可以使用取代打分矩阵来计算，例如，Altschul,(J.Mol.Biol.219:555-65,1991)所讨论的PAM-120、PAM-200和PAM-250。其他这类保守性取代，例如，具有相似的疏水特性的整个区域的取代是众所周知的。本发明的多肽也可以进行非保守取代，以便产生更多样化的变体，条件是此类变体保留了所期望的酶活性。变体也可以通过编码变体多肽的核酸序列中(多个)核苷酸的取代、缺失和插入来生产。

上述意义上的“功能等同物”也是本文所述多肽的“前体”，以及所述多肽的“功能衍生物”和“盐”。

在该情况下，“前体”是具有或不具有所期望生物活性的多肽的天然或合成前体。

表述“盐”是指根据本发明的蛋白质分子的羧基的盐以及氨基的酸加成的盐。羧基的盐可以已知的方式生产，包括无机盐，例如钠、钙、铵、铁和锌盐，以及与有机碱例如胺，如三乙醇胺、精氨酸、赖氨酸、哌啶等形成的盐。酸加成的盐，例如与无机酸例如盐酸或硫酸形成的盐，以及与有机酸例如乙酸和草酸形成的盐，也被本发明所涵盖。

根据本发明的多肽的“功能衍生物”还可以使用已知技术在功能性氨基酸侧基或它们的N末端或C末端产生。这样的衍生物包括例如：羧酸基的脂族酯，羧酸基的酰胺，它们可通过与氨或与伯或仲胺反应获得；游离氨基的N-酰基衍生物，其通过与酰基反应生成；或游离羟基的O-酰基衍生物，其通过与酰基反应生成。

“功能等同物”自然也包括可以从其他生物体获得的多肽以及天然存在的变体。例如，可以通过序列比较来确定同源序列区域的面积，并且等同的多肽可以基于本发明的具体参数来确定。

“功能等同物”还包含根据本发明的多肽的“片段”，例如单个结构域或序列基序，或N末端和/或C末端截短的形式，其可以显示或可以不显示期望的生物学功能。优选地，这样的“片段”至少定性地保持期望的生物学功能。

此外，“功能等同物”是融合蛋白，其具有本文所述的多肽序列之一或由其衍生的功能等同物，以及在功能性N-末端或C-末端缔合(即，没有融合蛋白部分的实质性相互功能受损)中具有至少一个另外的功能不同的异源序列。此类融合多肽可用于增强目的多肽的表达，可用于蛋白质的纯化或在所需环境或表达系统中改善多肽的酶促活性。这些异源序列的非限制性例子是例如信号肽、组氨酸锚、膜锚或其他酶。

根据本发明还包括的“功能等同物”是与具体公开的多肽的同源物。它们与具体公开的氨基酸序列具有至少60％，优选至少75％，特别是至少80或85％，例如90、91、92、93、94、95、96、97、98或99％的同源性(或同一性)，其通过Pearson and Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算。根据本发明的同源多肽的以百分比表示的同源性或同一性尤其是指基于本文具体描述的氨基酸序列之一的总长度，以氨基酸残基的百分比表示的同一性。

以百分比表示的同一性数据也可以借助于BLAST比对，算法blastp(蛋白质-蛋白质BLAST)或通过应用本文下面详述的Clustal设置来确定。

在可能的蛋白质糖基化的情况下，根据本发明的“功能等同物”包括本文所述的去糖基化或糖基化形式的多肽，以及可以通过改变糖基化模式获得的经修饰形式的多肽。

根据本发明的多肽的功能等同物或同源物可以通过诱变产生，例如通过点突变，延长或缩短蛋白质或如下文更详细描述。

根据本发明的多肽的此类功能等同物或同源物可以通过筛选突变体例如缩短的突变体的组合数据库来鉴定。例如，蛋白质变体的多样性数据库可以通过在核酸水平上的组合诱变，例如通过合成寡核苷酸混合物的酶促连接来产生。有许多方法可用于从简并寡核苷酸序列产生潜在同源物的数据库。简并基因序列的化学合成可以在自动DNA合成仪中进行，然后可以将合成基因连接在合适的表达载体中。简并基因组的使用使得可以提供混合物中的所有序列，其编码所需的潜在蛋白质序列集合。简并寡核苷酸的合成方法是本领域技术人员已知的。

在现有技术中，已知几种技术用于筛选通过点突变或缩短产生的组合数据库的基因产物，以及用于筛选具有选定性质的基因产物的cDNA文库。这些技术可以适用于快速筛选通过根据本发明的同源物的组合诱变产生的基因库。最常用于筛选大型基因库的基于高通量分析的技术包括在可复制的表达载体中克隆基因库，用所得载体数据库转化合适的细胞，以及在特定条件下表达组合基因，在所述条件下，所需活性的检测促进编码基因(其产物被检测)的载体的分离。递归整合诱变(REM)是一种提高数据库中功能突变体频率的技术，其可以与筛选测试结合使用，以鉴定同源物。

本文提供的实施方案提供了本文公开的多肽的直系同源物和旁系同源物，以及用于鉴定和分离此类直系同源物和旁系同源物的方法。

c.根据本发明适用的编码核酸序列

在本文语境中，以下定义适用：

术语“核酸序列”、“核酸”、“核酸分子”和“多核苷酸”可互换使用，是指核苷酸的序列。核酸序列可以是任意长度的单链或双链脱氧核糖核苷酸或核糖核苷酸，并且包括基因的编码和非编码序列、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成的DNA和RNA序列、片段、引物和核酸探针。技术人员了解RNA的核酸序列与DNA序列相同，差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。术语“核苷酸序列”也应理解为包含单独的片段形式或作为较大核酸组分的多核苷酸分子或寡核苷酸分子。

“分离的核酸”或“分离的核酸序列”是指一种核酸或核酸序列，其所处的环境与天然产生的核酸或核酸序列所处的环境不同，并且可以包括基本上不含污染内源性物质的那些。如本文使用的应用于核酸的术语“天然产生的”是指一种核酸，其在自然界的生物的细胞中发现，并且未经人类在实验室中进行有意的修饰。

多核苷酸或核酸序列的“片段”是指连续的核苷酸，其特别是本文一个实施方案的多核苷酸长度的至少15bp，至少30bp，至少40bp，至少50bp和/或至少60bp。特别地，多核苷酸的片段包含本文一个实施方案的多核苷酸的至少25个，更特别是至少50个，更特别是至少75个，更特别是至少100个，更特别是至少150个，更特别是至少200个，更特别是至少300个，更特别是至少400个，更特别是至少500个，更特别是至少600个，更特别是至少700个，更特别是至少800个，更特别是至少900个，更特别是至少1000个连续核苷酸。不受限制，本文的多核苷酸的片段可以用作PCR引物和/或探针，或用于反义基因沉默或RNAi。

如本文所用，术语“杂交”或在一定条件下杂交旨在描述杂交和洗涤的条件，在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70％、例如至少约80％、和例如至少约85％、90％或95％同一性的序列保持彼此结合。下文提供了低严格度、中等和高严格度杂交条件的定义。本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols in Molecular Biology,John Wiley&Sons,sections 2,4,and6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外，严格条件在Sambrook等人(1989,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring HarborPress,chapters 7,9,and 11)中描述。

“重组核酸序列”是通过使用实验室方法(例如分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列，由此创造出或修饰出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。

“重组DNA技术”是指用于制备重组核酸序列的分子生物学方法，例如描述于由Weigel和Glazebrook编辑的Laboratory Manuals，2002,Cold Spring Harbor Lab Press；和Sambrook等，1989Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press。

术语“基因”是指一种DNA序列，其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此，基因可以包含几个可操作地连接的序列，诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。

“多顺反子”是指可以在同一核酸分子内分别编码两个或更多个多肽的核酸分子，特别是mRNA。多顺反子核酸含有多于一个的开放阅读框(ORF)，每个ORF的信息都翻译成多肽。多顺反子核酸中的ORF序列被非编码序列分开，该非编码序列通常包括用于翻译起始的核糖体结合位点(RBS)。

“嵌合基因”是指通常不能在自然界的物种中发现的任何基因，特别是这样一种基因，其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如，启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体，其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义，由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。

“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列，其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号，例如AAUAAA或其变体。在转录终止后，mRNA转录物可以在多聚腺苷酸化信号的下游切去，并且可以添加poly(A)尾，其参与了mRNA向翻译位点例如细胞质的转运。

术语“引物”是指短的核酸序列，其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。

术语“可选择标记”是指在表达后能够被用来选择包括该可选择标记的一种或多种细胞的任何基因。以下描述了可选择标记的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂可选择标记可适用于不同的目标物种。

如果没有另外说明，术语“经转化的”必须在本发明的语境中作扩大理解，因为它是指对宿主进行基因工程改造以包含任何上述实施方案中所需要的每个核酸的一个、两个或多个拷贝的事实。优选地，术语“经转化的”涉及这样的宿主，其异源表达由用来转化它们的核酸编码的多肽，以及过表达所述多肽。因此，在一个实施方案中，本发明提供了一种经转化的生物，其中该多肽以比未经转化的相同生物更高的量表达。

在一个实施方案中，将经转化的DNA整合到非人宿主生物体和/或细胞的染色体中，从而产生稳定的重组系统。本领域已知的任何染色体整合方法可用于本发明的实践，包括但不限于重组酶介导的盒交换(RMCE)，病毒位点特异性染色体插入，腺病毒和原核注射。本发明还涉及编码如本文定义的多肽的核酸序列。特别地，本发明还涉及编码上述多肽之一及其功能等同物的核酸序列(单链和双链DNA和RNA序列，例如cDNA、基因组DNA和mRNA)，其可以通过例如使用人工核苷酸类似物来获得。

本发明既涉及分离的核酸分子，其编码根据本发明的多肽或其生物学活性区段，又涉及核酸片段，其可用作例如鉴定或扩增根据本发明的编码核酸的杂交探针或引物。

本发明还涉及与本文具体公开的序列具有一定程度的“同一性”的核酸。两个核酸之间的“同一性”是指在每种情况下在核酸的整个长度上核苷酸的同一性。

两个核苷酸序列(同样适用于肽或氨基酸序列)之间的“同一性”是当产生这两个序列的比对时，核苷酸残基(或氨基酸残基)的数目的函数，或两个序列中相同的残基数目。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。

特别地，可使用可从National Center for Biotechnology Information(美国国家生物技术信息中心)(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的设定为默认参数的BLAST程序(Tatiana等，FEMS Microbiol Lett.,1999,174:247-250,1999)来获得蛋白或核酸序列的最佳比对并计算序列同一性的百分比。

在另一个例子中，同一性可以通过Informax公司(美国)的Vector NTI Suite 7.1程序使用Clustal方法(Higgins DG,Sharp PM.((1989)))通过以下设置来计算：

多重比对参数：

成对比对参数：

或者，同一性可以根据Chenna et al.(2003)，网页：http://www.ebi.ac.uk/Tools/clustalw/index.html#的方法和以下设置来确定：

本文提及的所有核酸序列(单链和双链DNA和RNA序列，例如cDNA和mRNA)可以以已知方式通过化学合成从核苷酸结构单元产生，例如通过双螺旋的各个重叠的互补核酸结构单元的片段缩合来实现。寡核苷酸的化学合成例如可以通过磷酰胺法(Voet,Voet,2ndedition,Wiley Press,New York,pages 896-897)以已知的方式进行。合成寡核苷酸的积累，和借助于DNA聚合酶的Klenow片段和连接反应的空位的填补，以及一般的克隆技术描述于Sambrook et al.(1989)，请参阅下文。

另外，根据本发明的核酸分子可以另外包含来自编码遗传区域的3'和/或5'末端的非翻译序列。

本发明进一步涉及与具体描述的核苷酸序列或其区段互补的核酸分子。

根据本发明的核苷酸序列使得可以产生可用于鉴定和/或克隆其他细胞类型和生物体中的同源序列的探针和引物。此类探针或引物通常包含在“严格”条件下(如本文其他部分所定义)与根据本发明的核酸序列的有义链或相应的反义链的至少约12个，优选至少约25个，例如约40、50或75个连续核苷酸杂交的核苷酸序列区域。

“分离的”核酸分子与存在于核酸天然来源中的其他核酸分子分离，并且如果通过重组技术生产，则可以基本上不含其他细胞材料或培养基，或者如果通过化学合成，则可以不含化学前体或其他化学物质。

可以借助于分子生物学的标准技术和根据本发明提供的序列信息来分离根据本发明的核酸分子。例如，可以使用具体公开的完整序列之一或其片段作为杂交探针和标准杂交技术(例如，描述于Sambrook,(1989))从合适的cDNA文库中分离cDNA。

另外，包含所公开的序列之一或其片段的核酸分子可以使用基于该序列构建的寡核苷酸引物，通过聚合酶链反应来分离。以此方式扩增的核酸可以克隆到合适的载体中，并可以通过DNA测序来表征。根据本发明的寡核苷酸也可以通过标准的合成方法，例如使用自动DNA合成仪制备。

根据本发明的核酸序列或其衍生物，这些序列的同源物或部分可以例如通过常规的杂交技术或PCR技术从其他细菌中，例如通过基因组或cDNA文库分离出来。这些DNA序列在标准条件下与根据本发明的序列杂交。

“杂交”是指多核苷酸或寡核苷酸在标准条件下结合几乎互补的序列的能力，而在这些条件下非互补配对者之间不发生非特异性结合。为此，序列可以是90～100％互补的。能够彼此特异性结合的互补序列的性质被用于例如Northern印迹或Southern印迹或PCR或RT-PCR中的引物结合。

保守区的短寡核苷酸有利地用于杂交。然而，也可能使用更长的本发明核酸片段或完整序列进行杂交。这些“标准条件”取决于所使用的核酸(寡核苷酸，更长的片段或完整序列)或用于杂交的核酸类型(DNA或RNA)而有所不同。例如，DNA:DNA杂交种的解链温度比相同长度的DNA:RNA杂交种低约10℃。

例如，根据特定核酸的不同，标准条件是指温度在42至58℃，在浓度为0.1至5xSSC(1X SSC＝0.15M NaCl，15mM柠檬酸钠，pH 7.2)的缓冲水溶液中，或另外在50％甲酰胺(例如42℃，5x SSC，50％甲酰胺)的存在下。有利地，用于DNA:DNA杂交种的杂交条件是0.1×SSC，温度为约20℃至45℃，优选约30℃至45℃。对于DNA:RNA杂交种，杂交条件有利地为0.1×SSC，并且温度为约30℃至55℃，优选约45℃至55℃。这些所述的杂交温度是对于长度约100个核苷酸的核酸，以及在不存在甲酰胺的情况下G+C含量为50％的经计算的解链温度值的例子。DNA杂交的实验条件已在相关的遗传学教科书(例如Sambrook et al.,1989)中进行了描述，并且可以使用本领域技术人员已知的分子式来计算，例如取决于核酸的长度，杂交种的类型或G+C含量。本领域技术人员可以从以下教科书中获得有关杂交的更多信息：Ausubel et al.(eds),(1985),Brown(ed)(1991)。

“杂交”尤其可以在严格条件下进行。这样的杂交条件例如描述于Sambrook(1989)，或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。

如本文所用，术语“杂交或在一定条件下杂交”旨在描述杂交和洗涤的条件，在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70％，例如至少约80％和例如至少约85％、90％或95％同一性的序列保持彼此结合。本文提供了低严格度、中等和高严格度杂交条件的定义。

本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols inMolecular Biology,John Wiley&Sons,sections 2,4,and 6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外，严格条件在Sambrook等人(1989,Molecular Cloning:ALaboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)中描述。

如本文所用，所限定的低严格度条件如下。含有DNA的滤膜在含有35％甲酰胺，5xSSC，50mM Tris-HCl(pH 7.5)，5mM EDTA，0.1％PVP，0.1％Ficoll，1％BSA和500μg/ml变性鲑鱼精子DNA的溶液中于40℃预处理6小时。杂交在相同的溶液中进行，并进行以下修改：0.02％PVP，0.02％Ficoll，0.2％BSA，100μg/ml鲑鱼精子DNA，10％(wt/vol)硫酸葡聚糖，并使用5-20x10⁶ 32P标记的探针。将滤膜在杂交混合物中于40℃孵育18～20小时，然后于55℃洗涤1.5小时。在含有2x SSC，25mM Tris-HCl(pH 7.4)，5mM EDTA和0.1％SDS的溶液中。用新鲜溶液代替洗涤溶液，并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。

如本文所用，所限定的中等严格度条件如下。含有DNA的滤膜在含有35％甲酰胺，5x SSC，50mM Tris-HCl(pH 7.5)，5mM EDTA，0.1％PVP，0.1％Ficoll，1％BSA和500μg/ml变性鲑鱼精子DNA的溶液中于50℃预处理7小时。杂交在相同的溶液中进行，并进行以下修改：0.02％PVP，0.02％Ficoll，0.2％BSA，100μg/ml鲑鱼精子DNA，10％(wt/vol)硫酸葡聚糖，并使用5-20x10⁶ 32P标记的探针。将滤膜在杂交混合物中于50℃孵育30小时，然后于55℃洗涤1.5小时。在含有2x SSC，25mM Tris-HCl(pH 7.4)，5mM EDTA和0.1％SDS的溶液中。用新鲜溶液代替洗涤溶液，并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。

如本文所用，所限定的高严格度条件如下。含DNA的滤膜在由6x SSC，50mM Tris-HCl(pH 7.5)，1mM EDTA，0.02％PVP，0.02％Ficoll，0.02％BSA和500μg/ml变性鲑鱼精子DNA组成的缓冲液中于65℃下预杂交8小时至过夜。在含有100μg/ml变性鲑鱼精子DNA和5-20x10⁶ cpm 32P标记探针的预杂交混合物中，将滤膜在65℃下杂交48小时。滤膜在含有2xSSC，0.01％PVP，0.01％Ficoll和0.01％BSA的溶液中于37℃洗涤1小时。然后在0.1x SSC中于50℃洗涤45分钟。

如果上述条件不合适(例如，如用于种间杂交)，则可以使用本领域众所周知的其他低、中等和高严格度条件(例如，用于种间杂交)。

用于编码本发明多肽的核酸序列的检测试剂盒可以包括对编码该多肽的核酸序列具有特异性的引物和/或探针，以及使用该引物和/或探针来检测样品中编码该多肽的核酸序列的相关方案。此种检测试剂盒可用于确定植物、生物、微生物或细胞是否已被修饰，即是否已用编码多肽的序列转化。

为了测试根据本文一个实施方案的变体DNA序列的功能，将目标序列可操作地连接到可选择的或可筛选的标记基因，并且在使用微生物或原生质体进行的瞬时表达分析中或在稳定转化的植物中测试报告基因的表达。

本发明还涉及具体公开的或可衍生的核酸序列的衍生物。

因此，根据本发明的另外的核酸序列可以衍生自本文具体公开的序列，并且可以通过一个或几个(例如1至10个)核苷酸的一个或多个，例如1至20个，特别是1至15个或5至10个添加、取代、插入或缺失而与之不同，并且还编码具有所期望特性的多肽。

本发明还包括与具体陈述的序列相比，根据特定原始或宿主生物的密码子使用而包含所谓的沉默突变或已被改变的核酸序列。

根据本发明的特定实施方案，可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如，如果氨基酸由特定的密码子编码，则已知细菌表达系统可更有效地表达多肽。由于遗传密码的简并性，多于一个密码子可以编码相同的氨基酸序列，多个核酸序列能够编码相同的蛋白或多肽，所有这些DNA序列均被涵盖在本文实施方案中。在适当的情况下，编码本文所述多肽的核酸序列可以被优化以增加在宿主细胞中的表达。例如，可以使用宿主特异性的密码子合成本文实施方案的核苷酸以改善表达。

本发明还涵盖本文描述的序列的天然存在的变体，例如剪接变体或等位基因变体。

等位基因变体在所衍生的氨基酸水平上，具有至少60％的同源性，优选至少80％的同源性，非常特别优选在整个氨基酸范围至少90％的同源性(关于氨基酸水平的同源性，应参考以上对于多肽给出的详细信息)。有利地，同源性可以在序列的部分区域上更高。

本发明还涉及可通过保守核苷酸取代(即，所讨论的氨基酸被具有相同电荷、大小、极性和/或溶解度的氨基酸取代)获得的序列。

本发明还涉及通过序列多态性从具体公开的核酸衍生的分子。由于天然等位基因变异，这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位基因变体还可包括功能等同物。这些自然变异通常会在基因的核苷酸序列中产生1～5％的变化。所述多态性可以导致本文公开的多肽的氨基酸序列的改变。等位基因变体还可包括功能等同物。

此外，衍生物也应理解为根据本发明的核酸序列的同源物，例如动物、植物、真菌或细菌的同源物，缩短的序列，编码和非编码DNA序列的单链DNA或RNA。例如，在DNA水平上，同源物在本文具体公开的序列中给定的整个DNA区域中具有至少40％，优选至少60％，特别优选至少70％，非常特别优选至少80％的同源性。

此外，衍生物应理解为例如与启动子的融合体。尽管不损害启动子的功能或功效，添加至所述核苷酸序列的启动子可以通过至少一种核苷酸交换、至少一种插入、倒位和/或缺失来修饰。而且，启动子的功效可以通过改变它们的序列来增加，或者可以与更有效的启动子甚至是不同属的生物体的启动子完全交换。

d.功能性多肽突变体的产生

本领域技术人员熟悉用于产生功能性突变体的方法，也就是说，一种核苷酸序列，其编码多肽，该多肽与本文公开的任何与氨基酸相关的SEQ ID NO具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性；和/或由核酸分子编码，该核酸分子包含与本文公开的任何与核苷酸相关的SEQ ID NO具有至少70％序列同一性的核苷酸序列。

取决于所使用的技术，本领域技术人员可以将完全随机的或更有针对性的突变引入到基因或非编码核酸区域(例如对于调节表达很重要)中，并随后产生遗传文库。为此目的所需的分子生物学方法是技术人员已知的，例如描述于Sambrook and Russell,Molecular Cloning.3rd Edition,Cold Spring Harbor Laboratory Press 2001。

修饰基因并由此修饰由其编码的多肽的方法是本领域技术人员长期已知的，举例而言例如：

-位点特异性诱变，其中基因的单个或多个核苷酸以定向方式被替换(Trower MK(Ed.)1996；In vitro mutagenesis protocols.Humana Press,New Jersey)，

-饱和诱变，其中任何氨基酸的密码子都可以在基因的任何位点交换或添加(Kegler-Ebo DM,Docktor CM,DiMaio D(1994)Nucleic Acids Res22:1593；Barettino D,Feigenbutz M,Valcárel R,Stunnenberg HG(1994)Nucleic Acids Res 22:541；Barik S(1995)Mol Biotechnol 3:1)，

-易错聚合酶链反应，其中核苷酸序列被易错DNA聚合酶突变(Eckert KA,KunkelTA(1990)Nucleic Acids Res 18:3739)；

-SeSaM法(序列饱和法)，其中优选的交换被聚合酶阻止。Schenk et al.,Biospektrum,Vol.3,2006,277-279，

-突变株中的基因传代，其中例如由于DNA修复机制缺陷，核苷酸序列的突变率增加(Greener A,Callahan M,Jerpseth B(1996)An efficient random mutagenesistechnique using an E.coli mutator strain.In:Trower MK(Ed.)In vitromutagenesis protocols.Humana Press,New Jersey)，或

-DNA改组，其中形成并消化一组密切相关的基因，并将这些片段用作聚合酶链反应的模板，其中通过重复的链分离和重新结合，最终生成了全长的镶嵌基因(Stemmer WPC(1994)Nature 370:389；Stemmer WPC(1994)Proc Natl Acad Sci USA 91:10747)。

使用所谓的定向进化(尤其描述于Reetz MT and Jaeger K-E(1999),TopicsCurr Chem 200:31；Zhao H,Moore JC,Volkov AA,Arnold FH(1999),Methods foroptimizing industrial polypeptides by directed evolution,In:Demain AL,DaviesJE(Ed.)Manual of industrial microbiology and biotechnology.American Societyfor Microbiology)，熟练的工人可以以定向的方式大规模生产功能性突变体。为此，在第一步中，首先，例如使用上文给出的方法，产生各自多肽的基因文库。基因文库以合适的方式表达，例如通过细菌或噬菌体展示系统来表达。

表达功能性突变体的宿主生物的相关基因(其功能在很大程度上与所需的特性相对应)可以提交给另一个突变周期。突变和选择或筛选的步骤可以迭代地重复，直到本发明的功能性突变体具有足够程度的所需特性。使用该迭代过程，可以分阶段进行有限数量的突变，例如1、2、3、4或5个突变，并评估和选择它们对所研究活性的影响。然后可以以相同的方式将所选择的突变体进行进一步的突变步骤。这样，可以显著减少待研究的单个突变体的数量。

根据本发明的结果还提供了与相关多肽的结构和序列有关的重要信息，这是以靶向方式产生具有所需修饰特性的其他多肽所必需的。特别地，可以定义所谓的“热点”，即潜在地适合于通过引入靶向突变来修饰特性的序列区段。

也可以推导出有关氨基酸序列位置的信息，在该区域中可以发生可能对活性几乎没有影响的突变，并且可以将其指定为潜在的“沉默突变”。

e.表达本发明多肽的构建体

在本文语境中，以下定义适用：

“基因的表达”涵盖“异源表达”和“过表达”，并且涉及基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物体中，以mRNA、多肽和/或酶活性水平测量的基因产物的产生超过了相似遗传背景的非转化细胞或生物体中的产生水平。

如本文所用，“表达载体”是指这样一种核酸分子，其使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中。表达载体典型地包括正确转录核苷酸序列所需的序列。编码区通常编码目的蛋白，但是也可以编码RNA，例如反义RNA、siRNA等。

如本文所用，“表达载体”包括任何线性的或环状的重组载体，包括但不限于病毒载体、噬菌体和质粒。技术人员根据表达系统能够选择适合的载体。在一个实施方案中，表达载体包括本文实施方案的核酸，其可操作地连接到至少一个“调控序列”，其控制转录、翻译、起始和终止，例如转录启动子、操纵子或增强子，或mRNA核糖体结合位点，并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时，核苷酸序列是“可操作地连接的”。

如本文所用，“表达系统”涵盖共表达两个或更多个多肽所需的核酸分子的任何组合。各自的编码序列可以位于单个核酸分子或载体上，例如包含多于一个启动子序列的载体，或位于多顺反子核酸上，或者可以分布在两个或更多个物理上不同的载体上。

如本文所用，术语“进行扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法用于产生或检测天然表达的核酸的重组体，如下文详细描述的。例如，本发明提供用于扩增(例如，通过聚合酶链反应，PCR)天然表达的(例如，基因组DNA或mRNA)或本发明在体内、离体或体外的重组的核酸(例如cDNA)的方法和试剂(例如，特异性简并寡核苷酸引物对，寡聚dT引物)。

“调控序列”是指这样一种核酸序列，其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。

根据本发明，“启动子”、“具有启动子活性的核酸”或“启动子序列”应理解为是指这样一种核酸，当与要转录的核酸功能性连接时，其调节所述核酸的转录。“启动子”尤其是指一种核酸序列，其通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子，包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点，来控制编码序列的表达。术语启动子的含义还包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。

在本文语境中，“功能性”或“可操作地”连接被理解为例如指具有调控序列的核酸之一的顺序排列。例如，具有启动子活性的序列，和待转录的核酸序列以及可选的其他调控元件(例如确保核酸转录的核酸序列)和例如终止子，该顺序排列的方式为使得每个调控元件都能在核酸序列转录后执行其功能。这不一定需要化学意义上的直接连接。遗传控制序列，例如增强子序列，甚至可以从更远的位置甚至从其他DNA分子上对目标序列发挥作用。优选的排列是这样的，其中待转录的核酸序列位于启动子序列的下游(即3'端)，从而使两个序列共价连接在一起。启动子序列和待重组表达的核酸序列之间的距离可以小于200个碱基对，或小于100个碱基对或小于50个碱基对。

除启动子和终止子外，还可以提及以下作为其他调控元件的例子：靶向序列，增强子，聚腺苷酸化信号，选择标记，扩增信号，复制起点等。合适的调节序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。

术语“组成型启动子”是指不受调控的启动子，其允许其可操作地连接的核酸序列的持续转录。

如本文所用，术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时，那么该核酸是“可操作地连接”的。例如，如果启动子或者转录调控序列能够影响编码序列的转录，那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何，与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地，相关的核苷酸序列导致在细胞或生物体中产生本文所述的萜烯化合物。

如上所述的核苷酸序列可以是“表达盒”的一部分。术语“表达盒”和“表达构建体”同义使用。(优选的重组)表达构建体包含这样的核苷酸序列，其编码根据本发明的多肽并且在调节核酸序列的遗传控制之下。

在根据本发明应用的方法中，表达盒可以是“表达载体”，特别是重组表达载体的一部分。

根据本发明，“表达单位”应理解为是指具有表达活性的核酸，其包含如本文所定义的启动子，并且在与待表达的核酸或基因功能性连接后调节表达，即所述核酸或所述基因的转录和翻译。因此在这方面也被称为“调节核酸序列”。除启动子外，还可以存在其他调节元件，例如增强子。

根据本发明，“表达盒”或“表达构建体”应理解为在功能上与要表达的核酸或要表达的基因连接的表达单元。因此，与表达单元相反，表达盒不仅包含调节转录和翻译的核酸序列，而且还包含由于转录和翻译而作为蛋白质表达的核酸序列。

在本发明的语境中，术语“表达”或“过表达”描述了微生物中一种或多种由相应DNA编码的多肽的细胞内活性的产生或增加。为此，例如可以将基因导入到生物体中，用另一个基因替代现有基因，增加基因的拷贝数，使用强启动子或使用编码具有高活性的相应多肽的基因。可选地，这些措施可以组合。

优选地，根据本发明的此类构建体包含各自编码序列5'上游的启动子和3'下游的终止子序列，以及可选地其他常见的调控元件，在每种情况下均与编码序列可操作地连接。

根据本发明的核酸构建体特别地包含编码多肽的序列，该多肽例如衍生自如本文所述的氨基酸相关的SEQ ID NO或其反向互补序列，或其衍生物和同源物，并且已经与一个或多个调节信号可操作地或功能性连接，用于有利地控制例如增加基因表达。

除了这些调控序列之外，这些序列的天然调控可能仍存在于实际的结构基因之前，并且可选地可能已经进行了遗传修饰，因此天然调控已被关闭，基因的表达得到了增强。然而，核酸构建体也可以具有更简单的构建，即，在编码序列之前没有插入额外的调节信号，并且具有调节作用的天然启动子尚未去除。相反，天然调节序列被突变，使得不再发生调节并且基因表达增加。

优选的核酸构建体有利地还包含与启动子功能性连接的一个或多个已经提及的“增强子”序列，该序列使得增强核酸序列的表达成为可能。还可以在DNA序列的3'末端插入其他有利的序列，例如其他调控元件或终止子。根据本发明的核酸的一个或多个拷贝可以存在于构建体中。在该构建体中，还可以可选地存在其他标记物，例如与营养缺陷性或抗生素抗性互补的基因，以便选择该构建体。

合适的调控序列的例子存在于启动子中，例如cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIq、T7、T5、T3、gal、trc、ara、rhaP(rhaP_BAD)SP6、lambda-P_R或lambda-P_L启动子中，它们有利地用于革兰氏阴性细菌中。其他有利的调节序列存在于例如革兰氏阳性启动子amy和SPO2中，酵母或真菌启动子ADC1、MFalpha、AC、P-60、CYC1、GAPDH、TEF、rp28、ADH中。人工启动子也可以用于调节。

为了在宿主生物体中表达，将核酸构建体有利地插入到载体，例如质粒或噬菌体中，这使得基因在宿主中的最佳表达成为可能。除了质粒和噬菌体，载体还应理解为是本领域技术人员已知的所有其他载体，即例如病毒，例如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、噬粒、粘粒和线性或环状DNA或人工染色体。这些载体能够在宿主生物体中自主复制或通过染色体复制。这些载体是本发明的进一步发展。二元或cpo整合载体也是适用的。

合适的质粒是例如在大肠杆菌pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III¹¹³-B1、λgt11或pBdCI中，在链霉菌pIJ101、pIJ364、pIJ702或pIJ361中，在芽孢杆菌pUB110、pC194或pBD214中，在棒状杆菌pSA77或pAJ667中，在真菌pALS1、pIL2或pBB116中，在酵母2alphaM、pAG-1、YEp6、YEp13或pEMBLYe23中，或在植物pLGV23、pGHlac+、pBIN19、pAK2004或pDH51中。上述质粒是可能的质粒的少量选择。其他质粒是技术人员众所周知的，并且可以在例如书籍Cloning Vectors(Eds.Pouwels P.H.et al.Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444 904018)中找到。

在载体的进一步开发中，包含本发明的核酸构建体或本发明的核酸的载体也可以有利地以线性DNA的形式引入到微生物中并通过异源或同源重组整合到宿主生物体的基因组中。该线性DNA可以由线性化的载体例如质粒组成，或者仅由本发明的核酸构建体或核酸组成。

为了在生物体中异源基因的最佳表达，有利的是修饰核酸序列以匹配生物体中使用的特定“密码子使用”。“密码子使用”可以通过对所讨论的生物体的其他已知基因的计算机评估来容易地确定。

根据本发明的表达盒通过将合适的启动子融合到合适的编码核苷酸序列和终止子或聚腺苷酸化信号来产生。为此目的使用常规的重组和克隆技术，例如描述于T.Maniatis,E.F.Fritsch and J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)和T.J.Silhavy,M.L.Berman and L.W.Enquist,Experiments with Gene Fusions,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1984)和Ausubel,F.M.et al.,Current Protocolsin Molecular Biology,Greene Publishing Assoc.and Wiley Interscience(1987)。

为了在合适的宿主生物体中表达，将重组核酸构建体或基因构建体有利地插入到宿主特异性载体中，这使得基因在宿主中的最佳表达成为可能。载体是技术人员众所周知的，并且可以在例如"cloning vectors"(Pouwels P.H.et al.,Ed.,Elsevier,Amsterdam-New York-Oxford,1985)中找到。

本文实施方案的替代实施方案提供了一种“改变宿主细胞中的基因表达”的方法。例如，在某些语境下(例如，暴露于一定温度或培养条件下)，在宿主细胞或宿主生物体中可以增强或过表达或诱导本文实施方案的多核苷酸。

本文提供的多核苷酸的表达的改变还会产生异位表达，其是在改变的以及在对照或野生型生物体中的一种不同的表达模式。表达的改变是由本文实施方案的多肽与外源性或内源性调节剂的接触而发生的或者是由于多肽的化学修饰导致的。该术语还指本文实施方案的多核苷酸的改变的表达模式，其被改变至低于检测水平或者完全被抑制活性。

在一个实施方案中，本文还提供了编码本文提供的多肽或变体多肽的分离的、重组的或合成的多核苷酸。

在一个实施方案中，多种编码多肽的核酸序列在单一宿主中共表达，特别是在不同启动子的控制下。在另一个实施方案中，多种编码多肽的核酸序列可以存在于单个转化载体上，或者可以使用分离的载体并选择包含两个嵌合基因的转化体同时进行共转化。类似地，一种或多种多肽编码基因可以与其他嵌合基因一起在单一植物、细胞、微生物或生物体中表达。

f.适用于本发明的宿主

取决于语境，术语“宿主”(或“宿主细胞或生物”)可以指野生型宿主或经遗传改变的重组宿主或两者。“宿主生物”包括任何原核或真核生物，包括植物、真菌、原核生物或更高等真核的培养物，如哺乳动物宿主。微生物特别包括原核生物、真菌和酵母。

使用本发明的载体，可以生产重组宿主，其例如可以用至少一种本发明的载体转化，并可以用于生产本发明的多肽或进行本文所定义的酶催化的转化反应。有利地，将如上所述的根据本发明的重组构建体引入到合适的宿主系统中并表达。优选地，使用本领域技术人员已知的普通克隆和转染方法，例如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等，以在各自的表达系统中表达所述核酸。为了产生转基因植物，例如，当前的方法包括：植物原生质体的电穿孔，脂质体介导的转化，农杆菌介导的转化，聚乙二醇介导的转化，粒子轰击，植物细胞的显微注射以及使用病毒的转化。

合适的系统描述于Current Protocols in Molecular Biology,F.Ausubel etal.,Ed.,Wiley Interscience,New York 1997，或Sambrook et al.Molecular Cloning:ALaboratory Manual.2nd edition,Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,1989。技术人员可以使用特别是高等植物和/或植物细胞的克隆和表达载体。参见例如Schardl et al.Gene 61:1-11,1987.

原则上，所有的原核或真核生物，包括植物、真菌、原核生物或高等真核的培养物，如哺乳动物宿主，都可以被认为是根据本发明的核酸或核酸构建体的重组宿主生物。有利地，诸如细菌、真菌/酵母的微生物被用作宿主生物。有利地，使用革兰氏阳性或革兰氏阴性细菌，优选肠杆菌科(Enterobacteriaceae)，假单胞菌科(Pseudomonadaceae)，根瘤菌科(Rhizobiaceae)，链霉菌科(Streptomycetaceae)或诺卡氏菌科(Nocardiaceae)的细菌，特别优选埃希氏菌属(Escherichia)，假单胞菌属(Pseudomonas)，链霉菌属(Streptomyces)，诺卡氏菌(Nocardia)，伯克霍尔德氏菌属(Burkholderia)，沙门氏菌属(Salmonella)，农杆菌属(Agrobacterium)，艰难梭菌(Clostridium)或红球菌属(Rhodococcus)的细菌。大肠杆菌(Escherichia coli)属和种是非常特别优选的。此外，在α-变形菌(alpha-Proteobacteria)、β-变形菌(beta-Proteobacteria)或γ-变形菌(gamma-Proteobacteria)组中发现了其他有利的细菌。

取决于宿主生物，根据本发明的方法中使用的生物以本领域技术人员已知的方式生长或培养。培养可以分批、半分批或连续进行。营养物可以在发酵开始时给予，也可以稍后，半连续或连续地提供。这也在下面更详细地描述。

如上所述，根据本发明，宿主生物或细胞可用于重组生产新多肽以及生产氧化的萜烯化合物的方法。

为了在体内进行经氧化萜烯的产生，宿主在有利于产生经氧化萜烯的条件下培养。这样的条件是导致宿主生物或细胞生长的任何条件。优选地，设计这样的条件用于宿主的最佳生长。因此，如果宿主是转基因植物，则提供了最佳的生长条件，例如最佳的光照、水和营养条件。如果宿主是单细胞生物，则有助于产生经氧化萜烯的条件可以包括向宿主的培养基中添加合适的辅因子。另外，可以选择培养基，以使萜烯的氧化最大化。最佳的培养条件是本领域技术人员已知的，并且不是本发明特有的。合适条件的例子在以下实施例中更详细地描述。

适合在体内进行本发明方法的非人宿主可以是任何非人多细胞或单细胞生物。在一个优选的实施方案中，用于在体内进行本发明的非人宿主是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别有用的植物是天然产生大量萜烯的植物。在一个更优选的实施方案中，植物选自茄科(Solanaceae)、禾本科(Poaceae)、十字花科(Brassicaceae)、碟形花科(Fabaceae)、锦葵科(Malvaceae)、菊科(Asteraceae)或唇形科(Lamiaceae)。例如，该植物选自烟草属(Nicotiana)、茄属(Solanum)、高粱属(Sorghum)、拟南芥属(Arabidopsis)、芸苔属(Brassica(油菜(rape)))、苜蓿属(Medicago(紫花)苜蓿)、棉属(Gossypium(棉花))、蒿属(Artemisia)、鼠尾草属(Salvia)和薄荷属(Minta)。优选，该植物属于烟草(Nicotiana tabacum)种。

在一个更优选的实施方案中，用于在体内进行本发明方法的宿主是微生物。可以使用任何微生物，但是根据甚至更优选的实施方案，所述微生物是细菌或真菌。优选地，所述真菌是酵母。最优选地，所述细菌是大肠杆菌(E.coli)，并且所述酵母是酿酒酵母(Saccharomyces cerevisiae)。

这些生物中有几种不会产生天然待氧化的萜烯。为了适于实施本发明的方法，必须将这些生物转化以产生所述萜烯。如上所述，它们可以在用根据以上任何一个实施方案所述的核酸转化之前、同时或之后如此转化。转化生物例如微生物以使其表达萜烯合酶的方法是本领域已知的。这样的方法可以例如在WO 2010/134004中找到，其描述了用子杂烯合酶，即能够催化从法呢基焦磷酸生产子杂烯的酶，转化多种宿主生物和细胞。特别地，它们可以有利地用至少一种编码参与无环萜烯前体的产生代谢的多肽的基因进一步转化，所述无环萜烯前体例如香叶基焦磷酸或香叶基香叶基焦磷酸，特别是法呢基焦磷酸。这样的多肽包括例如MEP途径的酶、MVA途径的酶和/或异戊二烯基转移酶。如本发明的任何实施方案中所述，用本发明的多肽和CPR或用包含两者的融合多肽转化能够产生萜烯化合物的生物或细胞足以使萜烯的氧化发生。然而，用至少一种涉及无环萜烯前体和/或异戊烯基焦磷酸(IPP)或二甲基烯丙基焦磷酸(DMAPP)生产的酶的进一步转化具有增加可被氧化的萜烯量的优点。

在特定的实施方案中，根据本发明的任何实施方案，此类宿主异源表达或过表达多肽。

根据一个优选的实施方案，如果宿主表达萜烯氧化酶，如本文所定义的细胞色素P450酶，则其还表达P450还原酶(CPR)，如上所述。CPR可以天然存在于宿主生物或细胞中，或者可以在经转化以表达细胞色素P450之前、同时或之后转化该生物或细胞以表达CPR。在本发明的一个优选的实施方案中，转化宿主细胞或生物体以表达同时包含细胞色素P450和CPR的融合多肽。

在另一个优选的实施方案中，宿主能够产生待氧化的萜烯。当宿主表达能够催化所述萜烯形成的萜合酶时就是这种情况。

在另一个实施方案中，可以将待氧化的萜烯化合物添加到所述宿主的培养基中。萜烯化合物将渗透穿过宿主的膜，因此可用于与所述宿主表达的本发明的P450反应。

g.根据本发明的多肽的重组生产

本发明进一步涉及重组生产根据本发明的多肽或其功能性生物学活性片段的方法，其中培养产生多肽的微生物，可选地诱导多肽的表达，并从培养物中分离这些多肽。如果需要，多肽也可以这种方式以工业规模生产。

根据本发明产生的微生物可以分批法或补料分批法或重复补料分批法连续或不连续培养。已知培养方法的概述可在Chmiel的教科书(Bioprozesstechnik 1.Einführungin die Bioverfahrenstechnik[Bioprocess technology 1.Introduction tobioprocess technology](Gustav Fischer Verlag,Stuttgart,1991))或在Storhas的教科书(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheralequipment](Vieweg Verlag,Braunschweig/Wiesbaden,1994))中找到。

所使用的培养基必须适当地满足各个菌株的要求。在美国细菌学学会(AmericanSociety for Bacteriology(Washington D.C.,USA,1981))的手册“Manual of Methodsfor General Bacteriology”中给出了各种微生物的培养基的描述。

可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。

优选的碳源是糖，例如单糖、二糖或多糖。很好的碳源是例如葡萄糖，果糖，甘露糖，半乳糖，核糖，山梨糖，核酮糖，乳糖，麦芽糖，蔗糖，棉子糖，淀粉或纤维素。糖也可以通过麦芽提取物、复杂的化合物(例如糖蜜)或糖精制的其他副产品添加到培养基中。添加不同碳源的混合物也是有利的。其他可能的碳源是油和脂，例如大豆油，葵花籽油，花生油和椰子油，脂肪酸例如棕榈酸，硬脂酸或亚油酸，醇例如甘油，甲醇或乙醇，和有机酸，例如乙酸或乳酸。

氮源通常是有机或无机氮化合物或包含这些化合物的材料。氮源的例子包括氨气或铵盐，例如硫酸铵，氯化铵，磷酸铵，碳酸铵或硝酸铵，硝酸盐，尿素，氨基酸或复合氮源，例如玉米浆，大豆粉，大豆蛋白，酵母提取物，肉提取物等。氮源可以单独使用或混合使用。

可以存在于培养基中的无机盐化合物包括钙，镁，钠，钴，钼，钾，锰，锌，铜和铁的氯化物、磷或硫酸盐。

无机含硫化合物，例如硫酸盐，亚硫酸盐，连二亚硫酸盐，四硫酸盐，硫代硫酸盐，硫化物，以及有机硫化合物，例如硫醇(mercaptans)和巯类(thiols)，可用作硫源。

磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可用作磷源。

可以将螯合剂添加到培养基中，以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚，例如儿茶酚或原儿茶酸酯，或有机酸，例如柠檬酸。也可以添加EDTA。

根据本发明使用的发酵培养基通常还包含其他生长因子，例如维生素或生长促进剂，其包括例如生物素，核黄素，硫胺素，叶酸，烟酸，泛酸和吡哆醇(pyridoxine)。生长因子和盐通常源自复杂培养基的成分，例如酵母提取物，麦芽提取物，糖蜜，玉米浆等。此外，可以将合适的前体添加到培养基中。化合物在培养基中的确切组成在很大程度上取决于相应的实验，并针对每种具体情况分别确定。有关培养基优化的信息可以在教科书"AppliedMicrobiol.Physiology,A Practical Approach"(Ed.P.M.Rhodes,P.F.Stanbury,IRLPress(1997)p.53-73,ISBN0 19 963577 3)中找到。生长培养基也可以从商业供应商获得，例如Standard 1(Merck)或BHI(脑心浸液，DIFCO)等。

通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒，也可以根据需要单独消毒。培养基的所有成分都可以在培养开始时给予，也可以连续或分批添加。

培养物的温度通常在15℃至45℃之间，优选25℃至40℃，并且在实验过程中可以改变或保持恒定。介质的pH应在5至8.5的范围内，优选为7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠，氢氧化钾，氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性，可以向培养基中添加合适的选择性物质例如抗生素。为了维持有氧条件，将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常在20℃至45℃的范围内。继续培养直至形成最大量的所期望产物。通常会在10到160个小时内达到此目标。

然后将发酵液进一步处理。根据需要，可以通过分离技术，例如离心、过滤、倾析或这些方法的组合，将生物质完全或部分地从发酵液中除去，或者可以完全留在其中。

如果多肽没有在培养基中分泌，那么细胞也可以被裂解，并且可以通过用于分离蛋白质的已知方法从裂解物中获得产物。可以可选地通过高频超声，高压例如在高压细胞裂解机(French press)中，通过渗透，通过去污剂、裂解酶或有机溶剂的作用，通过均化器或通过上述几种方法的组合来破坏细胞。

可以通过已知的色谱技术，例如分子筛色谱(凝胶过滤)，例如Q-琼脂糖色谱，离子交换色谱和疏水色谱，以及其他常规技术，例如超滤、结晶、盐析、渗析和天然凝胶电泳来纯化多肽。合适的方法描述于例如Cooper,T.G.,Biochemische Arbeitsmethoden[Biochemical processes],Verlag Walter de Gruyter,Berlin,New York，或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。

为了分离重组蛋白，使用载体系统或寡核苷酸可能是有利的，所述载体系统或寡核苷酸通过限定的核苷酸序列延长cDNA，并因此编码改变的多肽或融合蛋白，其例如用于更容易的纯化。这种类型的合适修饰例如是充当锚的所谓“标签”，例如可以被识别为抗体抗原的被称为六-组氨酸锚或表位的修饰(例如，描述于Harlow,E.and Lane,D.,1988,Antibodies:A Laboratory Manual.Cold Spring Harbor(N.Y.)Press)。这些锚可以用于将蛋白质连接至固体载体，例如聚合物基质，其可以例如用作色谱柱中的填料，或者可以用于微量滴定板或其他载体上。

同时，这些锚也可用于识别蛋白质。为了识别蛋白质，还可以使用通常的标记物，例如荧光染料，酶标记物(与底物反应后形成可检测的反应产物)，或放射性标记物，单独使用或与锚结合使用以衍生化蛋白质。

h.多肽的固定化

根据本发明的酶或多肽可以在本文描述的方法中以游离形式或固定化而使用。固定化酶是固定在惰性载体上的酶。合适的载体材料和固定在其上的酶从EP-A-1149849，EP-A-1069183和DE-OS100193773以及从其中引用的参考文献中已知。在这方面，参考这些文件的全部公开内容。合适的载体材料包括例如粘土，粘土矿物，例如高岭石，硅藻土，珍珠岩，二氧化硅，氧化铝，碳酸钠，碳酸钙，纤维素粉末，阴离子交换剂材料，合成聚合物，例如聚苯乙烯，丙烯酸树脂，酚醛树脂，聚氨酯和聚烯烃，例如聚乙烯和聚丙烯。为了制备负载的酶，通常以细分的颗粒形式，优选多孔形式使用载体材料。载体材料的粒径通常不大于5mm，特别是不大于2mm(粒径分布曲线)。类似地，当使用脱氢酶作为全细胞催化剂时，可以选择游离形式或固定形式。载体材料例如为海藻酸钙和角叉菜胶。酶和细胞也可以直接与戊二醛交联(与CLEAs交联)。相应的和其他固定化技术描述于例如J.Lalonde and A.Margolin"Immobilization of Enzymes"in K.Drauz and H.Waldmann,Enzyme Catalysis inOrganic Synthesis 2002,Vol.III,991-1032,Wiley-VCH,Weinheim中。Rehm et al.(Ed.)Biotechnology,2nd Edn,Vol 3,Chapter 17,VCH,Weinheim给出了用于进行根据本发明的方法的生物转化和生物反应器的进一步信息。

i.本发明生物催化生产方法的反应条件

存在于本发明的方法或上文定义的多步方法的单个步骤中的至少一种多肽/酶可以呈现为天然活细胞或重组产生一种或多种酶的活细胞，收获的细胞，死细胞，透化细胞，粗细胞提取物，纯化提取物或基本纯净或完全纯净的形式。所述至少一种酶可以以溶液形式存在或以固定在载体上的酶形式存在。一种或几种酶可以同时以可溶性和/或固定化形式存在。

根据本发明的方法可以在本领域技术人员已知的普通反应器中进行，并且可以在不同的规模范围内进行，例如从实验室规模(几毫升到几十升反应体积)到工业规模(几升到数千立方米反应体积)。如果多肽以通过无生命的、可选地透化的细胞包封的形式，以或多或少纯化的细胞提取物的形式或以纯化的形式使用，则可以使用化学反应器。化学反应器通常允许控制至少一种酶的量，至少一种底物的量，pH，温度和反应介质的循环。当活细胞中存在至少一种多肽/酶时，该过程将是发酵。在这种情况下，生物催化生产将在生物反应器(发酵罐)中进行，其中对于活细胞合适的生存条件必需的参数(例如，具有营养的培养基，温度，pH，搅拌，充气，有氧或无氧或其他气体，抗生素等)可以控制。本领域技术人员熟悉化学反应器或生物反应器，例如使用将化学或生物技术方法从实验室规模扩大到工业规模或优化工艺参数的程序，这些方法在文献中也有广泛描述(有关生物技术方法，请参见例如Crueger und Crueger,Biotechnologie–Lehrbuch der angewandten Mikrobiologie,2.Ed.,R.Oldenbourg Verlag,München,Wien,1984)。

包含至少一种酶的细胞可以通过物理或机械方式例如超声或射频脉冲，高压细胞裂解机(French press)或化学方式例如在培养基中存在的低渗介质、裂解酶和去污剂或这些方法的组合来渗透。洗涤剂的例子是洋地黄毒苷，正十二烷基麦芽糖苷，辛基糖苷，X-100，20，脱氧胆酸盐，CHAPS(3-[(3-氯酰胺基丙基)二甲基铵]-1-丙烷磺酸盐)，P40(乙基苯酚聚(乙二醇醚))等。

如果固定了至少一种酶，则将其如上所述连接至惰性载体。

转化反应可以分批、半分批或连续进行。反应物(和可选的营养物)可以在反应开始时提供，或者可以随后半连续或连续地提供。

根据特定的反应类型，本发明的反应可以在水性、水性-有机或非水性反应介质中进行。

水性或水性-有机介质可包含合适的缓冲液，以将pH值调整为5至11，例如6至10。

在水性-有机介质中，可以使用与水可混溶、部分混溶或不混溶的有机溶剂。合适的有机溶剂的非限制性例子在下面列出。进一步的例子是一元或多元，芳族或脂族醇，特别是多元脂族醇，如甘油。

非水介质可以包含基本上不含水，即，将包含少于约1重量％或0.5重量％的水。

生物催化方法也可以在有机非水介质中进行。作为合适的有机溶剂，可以提及具有例如5至8个碳原子的脂族烃，例如戊烷，环戊烷，己烷，环己烷，庚烷，辛烷或环辛烷；芳族烃，例如苯，甲苯，二甲苯，氯苯或二氯苯，脂族无环和醚，例如二乙醚，甲基叔丁基醚，乙基叔丁基醚，二丙基醚，二异丙醚，二丁基醚；或它们的混合物。

反应物/底物的浓度可以适应于最佳反应条件，这可以取决于所应用的特定酶。例如，初始底物浓度可以为0.1至0.5M，例如10至100mM。

反应温度可以适应于最佳反应条件，这可以取决于所应用的特定酶。例如，该反应可以在0至70℃的温度下进行，例如20至50或25至40℃。反应温度的例子是约30℃，约35℃，约37℃，约40℃，约45℃，约50℃，约55℃和约60℃。

该工艺可以继续进行直到在底物和随后的产物之间达到平衡为止，但是可以更早地停止。通常的工艺时间为1分钟至25小时，特别是10分钟至6小时，例如为1小时至4小时，特别是1.5小时至3.5小时。

如果宿主是转基因植物，则可以提供最佳的生长条件，例如最佳的光照、水、pH和营养条件。

k.经氧化萜烯的体内发酵生产

本发明还涉及发酵生产如本文所定义的经氧化萜烯的方法。

根据本发明使用的发酵可以例如在搅拌的发酵罐、鼓泡塔和回路反应器中进行。有关可能的方法类型的全面概述，包括搅拌器类型和几何设计，请参见“Chmiel:Bioprozesstechnik:Einfuhrung in die Bioverfahrenstechnik,Band 1”。在本发明的方法中，可用的典型变型是本领域技术人员已知的或例如在“Chmiel,Hammes and Bailey:Biochemical Engineering”中解释的以下变型，例如分批、补料分批，重复补料分批进行或连续发酵，有或没有回收生物质。取决于生产应变，可以进行空气，氧气，二氧化碳，氢气，氮气或适当的气体混合物的喷射，以实现良好的收率(YP/S)。

要使用的培养基必须以适当的方式满足特定菌株的要求。在美国细菌学学会(American Society for Bacteriology(Washington D.C.,USA,1981))的手册“Manual ofMethods for General Bacteriology”中给出了各种微生物的培养基的描述。

优选的碳源是糖，例如单糖、二糖或多糖。非常好的碳源是例如葡萄糖，果糖，甘露糖，半乳糖，核糖，山梨糖，核酮糖，乳糖，麦芽糖，蔗糖，棉子糖，淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产物添加到培养基中。添加各种碳源的混合物也是有利的。碳的其他可能来源是油和脂，例如大豆油，葵花籽油，花生油和椰子油，脂肪酸例如棕榈酸，硬脂酸或亚油酸，醇例如甘油，甲醇或乙醇，和有机酸，例如乙酸或乳酸。

氮源通常是有机或无机氮化合物或含有这些化合物的材料。氮源的例子包括氨气或铵盐，例如硫酸铵，氯化铵，磷酸铵，碳酸铵或硝酸铵，硝酸盐，尿素，氨基酸或复合氮源，例如玉米浆，大豆粉，大豆蛋白，酵母提取物，肉提取物等。氮源可以单独使用或混合使用。

可以存在于培养基中的无机盐化合物包括钙，镁，钠，钴，钼，钾，锰，锌，铜和铁的氯化物，磷酸盐或硫酸盐。

可以将螯合剂添加到培养基中，以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚，例如儿茶酚或原儿茶酸酯，或有机酸，例如柠檬酸。

根据本发明使用的发酵培养基还可包含其他生长因子，例如维生素或生长促进剂，其包括例如生物素，核黄素，硫胺素，叶酸，烟酸，泛酸和吡哆醇。生长因子和盐通常来自培养基的复杂成分，例如酵母提取物，糖蜜，玉米浆等。另外，可以将合适的前体添加到培养基中。化合物在培养基中的精确组成在很大程度上取决于特定的实验，必须针对每种特定情况分别确定。有关培养基优化的信息可以在教科书"Applied Microbiol.Physiology,APractical Approach"(1997)中找到。生长培养基也可以从商业供应商那里获得，例如Standard 1(Merck)或BHI(脑心浸液，DIFCO)等。。

通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒，也可以根据需要单独消毒。培养基的所有成分都可以在生长开始时给予，或者可以选择连续添加或分批添加。

培养物的温度通常在15℃至45℃之间，优选25℃至40℃，并且可以在实验期间保持恒定或可以变化。介质的pH值应在5至8.5的范围内，优选7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠，氢氧化钾，氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性，可以向培养基中添加具有选择性作用的合适物质例如抗生素。为了维持有氧条件，将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常为20℃至45℃。继续培养直至形成最大量的所期望产物。通常会在1到160个小时内达到此目标。

如果不是在发酵过程中固有产生的，则待转化的底物的浓度应调整到例如0.1至50mg/L的范围内。

本发明的方法可以进一步包括回收这种经氧化萜烯的步骤。

术语“回收”包括从培养基中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行，包括但不限于用常规树脂(例如，阴离子或阳离子交换树脂，非离子吸附树脂等)处理，用常规吸附剂(例如，活性炭，硅酸，硅胶，纤维素，氧化铝等)处理，pH值的改变，溶剂萃取(例如，使用常规溶剂，例如醇，乙酸乙酯，己烷等)，蒸馏，渗析，过滤，浓缩，结晶，重结晶，pH调节，冻干等。

在预期的分离之前，可以除去发酵液的生物质。去除生物质的方法是本领域技术人员已知的，例如过滤、沉降和浮选。因此，可以例如通过离心机、分离器、倾析器、过滤器或在浮选设备中去除生物质。为了最大程度地回收有价值的产品，通常建议洗涤生物质，例如以渗滤的形式。方法的选择取决于发酵液中生物质的含量和生物质的性质，以及生物质与有价值产品的相互作用。

在一个实施方案中，可以将发酵液灭菌或巴氏灭菌。在另一个实施方案中，将发酵液浓缩。根据需要，该浓缩可以分批或连续进行。应该选择压力和温度范围，使得首先不会发生产品损坏，其次需要最小化设备和能源的使用。多级蒸发的压力和温度水平的熟练选择尤其可以节省能源。

l.产品分离

本发明的方法可以进一步包括回收终产物或中间产物的步骤，所述终产物或中间产物可选地为立体异构体或对映异构体的基本纯净的形式。术语“回收”包括从培养基或反应介质中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行，包括但不限于用常规树脂(例如，阴离子或阳离子交换树脂，非离子吸附树脂等)处理，用常规吸附剂(例如，活性炭，硅酸，硅胶，纤维素，氧化铝等)处理，pH值的改变，溶剂萃取(例如，使用常规溶剂，例如醇，乙酸乙酯，己烷等)，蒸馏，渗析，过滤，浓缩，结晶，重结晶，pH调节，冻干等。

经分离产物的身份和纯度可以通过已知技术确定，例如高效液相色谱(HPLC)，气相色谱(GC)，光谱学(例如IR，UV，NMR)，着色方法，TLC，NIRS，酶或微生物测定(参见例如：Patek et al.(1994)Appl.Environ.Microbiol.60:133-140；Malakhova et al.(1996)Biotekhnologiya 1127-32；und Schmidt et al.(1998)Bioprocess Engineer.19:67-70.Ullmann's Encyclopedia of Industrial Chemistry(1996)Bd.A27,VCH:Weinheim,S.89-90,S.521-540,S.540-547,S.559-566,575-581und S.581-587；Michal,G(1999)Biochemical Pathways:An Atlas of Biochemistry and Molecular Biology,JohnWiley and Sons；Fallon,A.et al.(1987)Applications of HPLC in Biochemistry in:Laboratory Techniques in Biochemistry and Molecular Biology,Bd.17.)。

本申请中提及的所有出版物均通过引用并入本文，以公开和描述与引用出版物有关的方法和/或材料。

以下实施例仅是说明性的，并不意味着限制发明的摘要、说明书或权利要求书中所阐述的发明范围。

在考虑了本文提供的公开内容之后，对于本领域技术人员而言将立即变得显而易见的多种可能的变型方案也落入本发明的范围内。

实验部分

现在将通过以下实施例更详细地描述本发明。

材料：

除非另有说明，否则本文使用的所有化学和生物化学材料以及微生物或细胞均为可商购的产品。

除非另有说明，否则重组蛋白是通过标准方法克隆和表达的，所述方法例如描述于Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular cloning:A LaboratoryManual,2^nd Edition,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989。

方法：

所应用的酶法测定(标准)(使用大肠杆菌细胞培养物体内生产萜烯化合物)

使用经一种或多种表达质粒转化的KRX大肠杆菌细胞(Promega)，该质粒带有编码酶的核酸序列，可增加萜烯前体的细胞内池，并带有一种或多种编码萜烯生物合酶的核酸序列，以用于生产萜烯化合物。在补充有适当抗生素的LB琼脂平板上选择经转化的细胞，并将来自单个菌落的细胞用于接种5mL补充有相同抗生素的液体LB培养基。将培养物在37℃下孵育过夜。第二天，用0.2mL过夜培养物接种补充有相同抗生素的2mL TB培养基。在37℃下孵育6小时后，将培养物冷却至20℃，并将0.1mM IPTG和0.02％鼠李糖添加到每个试管中。将培养物在20℃下孵育48小时。然后将培养物用2体积的MTBE萃取两次，将有机相浓缩至500μL，并通过GC-MS分析。

气相色谱质谱法(GC-MS)

气相色谱质谱法(GC-MS)使用与Agilent 5975质量检测器连接的Agilent 6890系列GC系统进行。GC配备了0.25mm内径30m的DB-1MS毛细管柱(Agilent)。载气为氦气，流速为1mL/min。入口温度设定为250℃。初始烘箱温度为80℃，然后以10℃/min的温度梯度升至220℃，然后以30℃/min的第二温度梯度升至280℃。产品的鉴定基于质谱和保留指数与真实标准品和内部质谱数据库的比较。

1.实施例-异朱栾倍半萜的氧合

实施例1：植物材料和总RNA提取。

香根草(Vetiveria zizanoides)植物是从植物苗圃(Austral Plants Company，Les Avirons，法国留尼汪岛)获得的。将这些植物种植在温室(Lullier农学研究站，瑞士日内瓦)的盆中，并通过分成六个月至一年龄的团块进行无性繁殖。为了收获根，将植物从盆中移出并用自来水冲洗。

为了提取RNA，将几种植物的根合并在一起，包括幼株(繁殖后4至6个月)，具有发达密实根系的老植物(繁殖后1至2年)和从盆中取出后室温下干燥24到36小时的幼株。从植物的地上部分切下根，并在液氮中冷冻。首先使用Waring Blendor(Waring Laboratory，Torrington，USA)在液氮中将根粗切碎，然后使用研钵和研杵将其研磨成细粉。按照Kolosova等(Kolosova N,Miller B,Ralph S,Ellis BE,Douglas C,Ritland K,andBohlmann J,Isolation of high-quality RNA from gymnosperm and angiospermtrees.J.Biotechniques,36(5),821-4,2004)中描述的程序提取总RNA并进行以下修改。体积为20mL的提取缓冲液用于2克研磨的组织，提取缓冲液中补充有2％(w/v)的PVP(聚乙烯吡咯烷酮，Sigma-Aldrich)。对于CTAB(十六烷基三甲基溴化铵，Sigma-Aldrich)提取步骤，将核酸沉淀(pellet)重悬于2mL TE缓冲液(10mM Tris-HCl，pH 8，1mM EDTA)中，并用2mL5M NaCl和1ml10％CTAB进行提取。为了沉淀异丙醇，将核酸沉淀溶解在500μL TE中。将最终的RNA沉淀重悬于50μL水中。

实施例2：转录组测序。

使用Illumina技术对香根草根转录组进行测序。所有测序步骤均由Fasteris SA(Plan-les-Ouates,CH-1228,Switzerland)进行。使用TruSeq Stranded mRNA文库制备试剂盒(Illumina Inc.)来制备mRNA文库。对片段化和大小选择进行调整以选择和纯化长度为500至550bp的DNA片段。使用MiSeq Reagent Kit V3(Illumina Inc.)在MiSeq测序仪上进行DNA测序。一个完整的流动池用于文库的测序，并进行2X300次测序循环。该测序提供了17,453,393个2X300的重叠配对读数(总共10.5兆个碱基)。

首先使用FastqJoin对配对读数进行预处理，以在重叠末端连接配对末端读数。在该步骤中，可以连接58.3％的配对末端读数，并获得8.5百万个平均大小为430个碱基的连接读数。然后使用CLC Genombic Workbench 7(CLC bio)的CLC bio de novo组装工具组装这些新读数以及未连接的配对末端读数。最后，组装的香根草根转录组含有333,633个独特的重叠群(contig)序列，平均长度为577个碱基，最大长度为15,800个碱基，N50为546个碱基。

实施例3：从香根草根转录组分离编码萜烯合酶的cDNA。

使用tBlastn算法(Altschul等,J.Mol.Biol.215,403-410,1990)搜索转录组数据，并使用从相同植物中分离并已描述(WO2010134004和WO2006134523)的已知倍半萜合酶的氨基酸序列作为查询。使用该方法，获得了新的倍半萜编码序列。该cDNA(VzTps1718)(SEQ ID NO:1)长1835个碱基对，并且包含编码567个氨基酸长度的蛋白质(SEQ ID NO:3)的开放阅读框(SEQ ID NO:2)。

对VzTps1718的DNA序列进行密码子优化(SEQ ID NO:4)，在体外合成并克隆到pJ401表达质粒(ATUM，Newark，CA，美国)中。pJ401-VzTps1718表达构建体可用于在大肠杆菌细胞中产生倍半萜化合物。为了提高细胞的生产力，异源FPP合酶和来自完整异源甲羟戊酸(MVA)途径的酶在同一细胞中表达。包含FPP合酶基因和用于完整的MVA途径的基因的表达质粒的构建描述于专利WO2013064411或Schalk等人(2013)J.Am.Chem.Soc.134,18900-18903。简而言之，制备了表达质粒，其包含两个操纵子，所述操纵子由编码用于完整甲羟戊酸途径的酶的基因组成。第一个合成操纵子由大肠杆菌乙酰乙酰辅酶A硫解酶(atoB)，金黄色葡萄球菌HMG-CoA合酶(mvaS)，金黄色葡萄球菌HMG-CoA还原酶(mvaA)和酿酒酵母FPP合酶(ERG20)基因组成，其在体外(ATUM，Newark，CA，美国)合成并连接到NcoI-BamHI消化的pACYCDuet-1载体(Invitrogen)中，产生pACYC-29258。从肺炎链球菌(ATCC BAA-334)的基因组DNA中扩增出含有甲羟戊酸激酶(MvaK1)，磷酸甲羟戊酸激酶(MvaK2)，甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基二磷酸异构酶(idi)的第二个操纵子，其连接到pACYC-29258的第二个多克隆位点，提供质粒pACYC-29258-4506。因此，该质粒包含编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。

将KRX大肠杆菌细胞(Promega)与质粒pACYC-29258-4506和质粒pJ401-VzTps1718共转化，并在卡那霉素(50μg/mL)和氯霉素(34μg/mL)LBagar平板上选择经转化的细胞。如方法部分所述，通过工程细胞进行萜烯化合物的生产和鉴定。在这些条件下，VzTps1718酶(SEQ ID NO:3)显示出倍半萜合酶活性，并将FPP转化为几种萜烯产物，包括倍半萜烃和氧化的倍半萜(图2)。主要产品是倍半萜，具有艾里莫芬烷(eremophilane)、香根螺烷(vetispirane)和桉叶烷(eudesmane)骨架。在这些产品中，可以根据保留指数和质谱的重合性鉴定出一些化合物(图3至5)：异朱栾倍半萜(化合物1)，香根螺-1(10),7(11)-二烯(化合物2)和朱栾倍半萜(化合物3)(参见图1)。用VzTps1718获得的产物混合物的相对组成在下面的表1中进行了详细说明。对于鉴定出的倍半萜产品香根螺-1(10),7(11)-二烯、异朱栾倍半萜和朱栾倍半萜，产物混合物中的相对丰度为14.7％、39.0％和5.1％。

表1.用重组VzTps1718倍半萜合酶体内获得的产物混合物的组成。

产生这种产物混合物的倍半萜合酶或产生化合物1或化合物2的合酶以前是未知的。VzTps1718产物的氧化衍生物，尤其是醇、酮、醛和羧酸是香根草油的已知成分，其中一些衍生物有助于典型的复杂香根草气味。

实施例4：从香根草根转录组中鉴定编码细胞色素P450的cDNA。

为了生产由VzTps1718酶产生的倍半萜烃的氧化衍生物，选择了许多细胞色素P450酶，所有这些酶均来自香根草的根。

使用tBlastn算法(Altschul等，J.Mol.Biol.215,403-410,1990)搜索香根草根转录组数据的细胞色素P450编码序列，并使用具有萜烯羟化酶活性的已知细胞色素P450的氨基酸序列(例如WO2013064411的SEQ ID NO:1和2)作为查询。分离了几种编码细胞色素P450的转录物。转录物VzTrspt-9_Locus_8201-12(SEQ ID NO:5)包含1521个碱基对(SEQ IDNO:6)的开放阅读框，并编码506个氨基酸的蛋白质VzCP8201-12(SEQ ID NO:7)，显示与细胞色素P450氨基酸序列具有同源性。最接近的可公开获得的序列是来自高梁(Sorghumbicolor)的推定细胞色素P450蛋白(例如NCBI登录号XP_002466860.1或XP_002466859.2，标注为二萜羟化酶的序列)，与VzCP8201-12相比具有小于84％的序列同一性。

还选择了另一个转录物VzTrsp7_contig_7186(SEQ ID NO:11)，其包含1521个(SEQ ID NO:12)的开放阅读框，并编码506个氨基酸的假定细胞色素P450蛋白VzCP7186(SEQ ID NO:13)。公共序列数据库中最接近的序列是来自高梁(Sorghum bicolor)的登录号XP_002466859.2的序列，具有86％的序列同一性。

选择了第三种细胞色素P450酶，即SEQ ID NO:16编码的VzCP521-11(WO2013064411)(SEQ ID NO:18)。该细胞色素P450酶先前显示对各种倍半萜具有萜烯羟化酶活性。

实施例5：细胞色素P450异源表达的DNA序列优化。

来自植物的细胞色素P450是具有N末端锚定肽的膜结合蛋白。细胞色素P450的膜锚定序列和催化结构域通常由富含脯氨酸的区域界定。VzCP8201、VzCP7186和VzCP521-11(分别为SEQ ID NO:19、20和21)的催化部分具有蛋白质的酶促活性。N末端膜锚定肽参与细胞色素P450酶与膜的缔合。因此，可以在不改变酶催化活性的情况下修饰N末端序列。修饰P450编码cDNA的5'端以改变膜锚定肽的氨基酸序列可以改善酶在微生物宿主细胞中的表达。

因此，设计了编码全长VzCP 8201-12(SEQ ID NO:7)蛋白的cDNA(SEQ ID NO:8)序列，其密码子用于在细菌中最佳表达，并且设计了第二个cDNA(SEQ ID NO:9)，其编码VzCP8201-12的N末端修饰变体(命名为VzCP8201bov，SEQ ID NO:10)。该修饰包括缺失前20个N末端氨基酸并用MALLLAVFLGLSCLLLLSLW肽(SEQ ID NO:24)取代。合成这两个cDNA并亚克隆到pCWori表达质粒(Barnes,H.J.Method Enzymol.272,3-14；(1996))中，分别提供pCWori-VzCP8201-12和pCWori-VzCP8201Bov质粒。

对于VzCP7186，设计了对N末端区域氨基酸序列进行类似修饰的变体(VzCP7186op，SEQ ID NO:15)，以将前20个氨基酸替换为MALLLAVFLGLSCLLLLSLW序列(SEQID NO:24)，并用针对大肠杆菌表达的密码子使用优化(SEQ ID NO:14)合成了新的cDNA，并将其克隆到pJ401质粒(ATUM，Newark，CA，USA)中。

对于VzCP521-11，保留野生型氨基酸序列(SEQ ID NO:18)在大肠杆菌中的异源表达，仅用密码子优化的序列(SEQ ID NO:17)合成cDNA并克隆到pJ401质粒(ATUM，Newark，CA，USA)中。

为了对香根草P450酶进行功能表征，蛋白质在大肠杆菌细胞中异源表达。要重建植物P450的活性，必须存在第二种膜蛋白。该蛋白是一种P450还原酶(CPR)，参与电子从辅因子NADPH(还原的烟酰胺腺嘌呤二核苷酸磷酸)到P450活性位点的转移。已经显示，来自一种植物的CPR可以补充来自另一种植物的细胞色素P450酶的活性(Jensen和Moller(2010)Photochemistry 71，132-141)。已经报道了来自不同植物来源的几种编码CPR的DNA序列。我们选择了先前从胡椒薄荷(Mentha piperita)分离的CPR(CPRm，未公开数据，SEQ ID NO:23)优化了全长cDNA(SEQ ID NO:22)的密码子使用，并将其克隆到了pACYCDuet-1表达质粒(Novagen)的NcoI和HindIII限制性酶切位点，提供质粒pACYC-CPRm。

实施例6：构建用于共表达细胞色素P450、细胞色素P450还原酶和萜烯合酶的表达质粒。

构建包含pCWori+质粒的质粒(Barnes H.J(1996)Method Enzymol.272,3-14)，该质粒含有由P450、CPR和编码cDNA的萜烯合酶组成的合成操纵子。设计该构建体以在每个cDNA的上游插入一个核糖体结合位点(RBS)。实施例5中描述的pCWori-VzCP8201Bov质粒包含编码VzCP8201Bov的cDNA(SEQ ID NO:9)，其被设计为包括在编码VzCP8201Bov的cDNA上游的NdeI识别序列和编码VzCP8201Bov的cDNA下游的多接头DNA序列(GTCGACAATTAACCATGGTTAATTAAGCTTATATATG GTACCATATATGAATTCATTAATCTCGAG(SEQ ID NO:25)，包含SalI，NcoI，HindIII，KpnI，EcoRI和XhoI识别序列，将优化的CPRm cDNA修饰为在5'末端在起始密码子之前添加26bp的延伸，其含有间隔区序列，SalI识别序列和RBS序列(GTCGACAATTAGGTAAAAAATAAACC(SEQ ID NO:26)，并在3'端添加HindIII识别序列。将优化后的CPRm cDNA(SEQ ID NO:22)亚克隆到pCWori-VzCP8201Bov质粒的SalI和HindIII位点之间，提供pCWori-VzCP8201Bov-CPRm质粒。克隆到pJ401质粒(DNA2.0，Menlo Park，CA，USA)中的优化后的VzTps1718的cDNA序列(SEQ ID NO:4)包含由HindIII识别序列和RBS序列组成的5'非编码序列(AAGCTTAAGGAGGTAAAAA)(SEQ ID NO:27)以及由KpnI、EcoRI和XhoI识别位点组成的3'非编码序列(GGTACCATATATGAATTCATTAATCTCGAG)(SEQ ID NO:28)。使用HindIII和XhoI限制酶来消化VzTps1718-pJ401质粒的插入片段，并将其亚克隆到pCWori-VzCP8201Bov-CPRm质粒的相同限制酶识别位点之间。所得的质粒pCWori:VzCP8201Bov:CPRm:VzTps1718因此包含一个操纵子，该操纵子包括编码VzCP8201Bov的cDNA，编码CPRm的cDNA和编码VzTps1718的cDNA。

通过消化/连接，使用NdeI和HindIII限制酶，将编码N末端修饰的VzCP7186蛋白(SEQ ID NO:15)的优化的cDNA(SEQ ID NO:14)从原始pJ401质粒(实施例5)转移到pCWori:VzCP8201Bov:CPRm:VzTps1718中。因此，新质粒pCWori:VzCp7186:CPRm:VzTps1718包含一个操纵子，包括编码VzCP7186opt的cDNA、编码CPRm的cDNA和编码VzTps1718的cDNA。

类似地，通过将来自pJ401质粒的VzCP521-11优化的cDNA亚克隆到NdeI和HindIII消化的pCWori:VzCP8201Bov:CPRm:VzTps1718质粒中，构建了pCWori:VzCP521-11:CPRm:VzTps1718质粒。

最后，构建了一个多顺反子质粒，将编码VzCP8201的cDNA的一个副本和编码VzCP7186的cDNA的一个副本与CPR和萜烯合酶编码cDNA结合。使用引物Inf8201-7186-Fw(TAATTTTATTCCGAACTAAGTCGAAGGAGGTAATATGGCGTTGCTGTTGGCTGTTTTTCTGG)(SEQ ID NO:29)和Inf8201-7186-Rev(ATTTTTTACCTAATTGTCGACTTAGTTCGGAATAAAGTTATTGTACGGAC)(SEQID NO:30)扩增VzCP7186 cDNA。将扩增的DNA片段克隆到用SalI限制酶线性化的pCWori:VzCP8201Bov:CPRm:VzTps1718质粒中。使用技术(Clontech，Takara BioEurope)进行克隆反应。因此，所得质粒pCWori:VzCP8201:VzCP7186:CPRm:VzTps1718在单个操纵子中包含编码VzCP8201、VzCP7186、CPRm和VzTps1718的cDNA。

实施例7.使用VzTps1718和细胞色素P450酶的体内生产氧化倍半萜烯化合物。

用实施例6中所述的四个pCWori质粒之一和携带完整甲羟戊酸途径的质粒pACYC-29258-4506(实施例3)将KRX大肠杆菌细胞(Promega)共转化。培养经转化的细胞，并按照实验部分所述评估萜烯化合物的产生，不同的是向培养基中添加了75μg/L的δ-氨基乙酰丙酸(Sigma)。

图6显示了使用经工程改造以单独或与VzCP8201或VzCP7186细胞色素P450酶一起产生重组VzTps1718倍半萜合酶的大肠杆菌细胞形成的产物的GC-MS分析。在这种生物转化过程中形成了几种氧化的倍半萜化合物，包括异朱栾倍半萜醇(图7)和乙酸异朱栾倍半萜基酯(图8)。异朱栾倍半萜醇产物通过VzCP8201或VzCP7186氧化异朱栾倍半萜而形成。乙酸异朱栾倍半萜基酯产物通过背景大肠杆菌酶活性通过异朱栾倍半萜醇的乙酰化而形成。图6还显示，由VzCP8201和VzCp7186催化的羟化反应的选择性相似。

图9显示了使用经工程改造以生产重组VzTps1718倍半萜合酶和VzCP521-11细胞色素P450酶的大肠杆菌细胞形成的产物的GC-MS分析。在这种生物转化过程中形成了几种氧化的倍半萜化合物。使用VzCP8201或VzCP7186还可观察到其中一些产品，特别是异朱栾倍半萜醇和乙酸异朱栾倍半萜醇酯。在VzCP521-11的主要氧化产物中，可以通过将质谱与真实标准品进行匹配来观察到异努特卡醇(图10)。异努特卡醇可以很容易地被氧化成相应的酮，例如可以通过生物化学或化学方法将其氧化为相应的酮(Oxidation of Alcoholsto Aldehydes and Ketones,G.Tojo和M.Fernadez的Basic Reactions in OrganicSynthesis(2007))以生产α-岩兰烯酮，香根草油的主要成分之一。

图11显示了使用经工程改造产生重组VzTps1718倍半萜合酶以及VzCP8201和VzCP7186细胞色素P450酶的大肠杆菌细胞形成的产物的GC-MS分析。分析显示氧化的倍半萜的量增加，并且氧化的倍半萜与未氧化的倍半萜的比例增加。

2.实施例-子杂烯的氧合

实施例8：子杂烯合酶变体的鉴定。

在WO2010134004中描述了具有子杂烯合酶活性的萜烯合酶。使用tBlastn算法(Altschul等,J.Mol.Biol.215,403-410,1990)并使用WO2010134004的氨基酸序列SEQ IDNo 1作为查询来搜索新的转录组数据。该方法允许鉴定两个新的cDNA(VzTrspt_4_contig_995(SEQ ID NO:35)；具有全长cDNA的开放阅读框如SEQ ID NO:36所示)和VzTrspt_10_contig_49(SEQ ID NO:39；具有全长cDNA的开放阅读框如SEQ ID NO:40所示)，其编码了子杂烯合酶VzZS2(SEQ ID NO:38)和VzZS2-Nter2(分别为SEQ ID NO:42)的变体。这两个变体分别与先前鉴定的子杂烯合酶(VzZS1，SEQ ID NO 33)相差12和17个氨基酸。编码VzZS1的相应全长cDNA(包括非编码区)显示在SEQ ID NO:31中，开放阅读框显示在SEQ ID NO:32中。

合成了编码VzZS2(SEQ ID NO:37)和VzZS2-Nter2(SEQ ID NO:41)以及VzZS1(WO2010134004的SEQ ID NO:1)(此处VzZS1氨基酸序列＝SEQ ID NO:33；密码子优化的cDNA＝SEQ ID NO:34)的密码子优化DNA，并将其克隆到pJ401表达质粒(ATUM，Newark，CA，USA)中。使用这三种表达质粒，按照方法部分中所述的程序，用于转化大肠杆菌细胞并生产倍半萜烯化合物，不同之处在于，对于GC-MS分析，烤箱温度最初设定为100℃1分钟，然后在以12℃/min的速度升至240℃，然后以50℃/min的速度升至300℃。

在这些条件下，所有三种重组蛋白均产生了子杂烯(图12)作为主要产物。与先前确定的合酶(VzZS1)相比，VzZS2和VzZS2-Nter2产生的子杂烯的量分别高38％和42％(图13)。

实施例9：构建用于共表达细胞色素P450、细胞色素P450还原酶和子杂烯合酶的表达质粒。

克隆到pJ401质粒(DNA2.0，Menlo Park，CA，USA)中的VzZS2-Nter2的优化cDNA序列包含由HindIII识别序列和RBS序列组成的5'非编码序列(AAGCTTAAGGAGGTAAAAA SEQ IDNO:27)和由KpnI、EcoRI和XhoI识别位点(GGTACCATATATGAATTCATTAATCTCGAG(SEQ ID NO:28)组成的3'非编码序列。使用HindIII和XhoI限制性酶切出VzZS2-Nter2-pJ401质粒的插入片段，并亚克隆到实施例6中所述的三个三顺反子质粒中的每一个的相同限制酶识别位点之间以替换萜烯合酶编码cDNA。产生了三个新质粒pCWori:VzCP8201Bov:CPRm:VzZS2-Nter2，pCWori:VzCp7186:CPRm:VzZS2-Nter2和pCWori:VzCp521-11:CPRm:VzZS2-Nter2，每个携带一个CPRm编码cDNA，一个子杂烯合酶编码cDNA以及三个细胞色素P450编码cDNA之一。

实施例10：使用VzZS2-Nter2和细胞色素P450酶体内产生氧化的倍半萜化合物。

将KRX大肠杆菌细胞(Promega)与实施例9中所述的一种pCWori质粒和携带完整甲羟戊酸途径的质粒pACYC-29258-4506(实施例3)共转化，并按照方法部分中所述评估经转化的细胞产生的萜烯化合物。

图14显示了使用经工程改造产生具有VzCP8201、VzCP7186或VzCP521-11细胞色素P450酶的重组子杂烯合酶(VzZS2-Nter2)的大肠杆菌细胞形成的产物的GC-MS分析。三种细胞色素P450酶均会产生α-子杂烯醇(图15)。使用VzCP521-11，除α-子杂烯醇外，还生产了次要产品客烯醇(图16)。

实施例11：在同一细胞中共表达子杂烯合酶、VzCP8201细胞色素P450和VzCP7186 细胞色素P450。

构建了一个多顺反子质粒，将编码VzCP8201的cDNA的一个副本和编码VzCP7186的cDNA的一个副本与CPR和编码子杂烯合酶的cDNA结合。使用引物Inf8201-7186-Fw(TAATTTTATTCCGAACTAAGTCGAAGGAGGTAATATGGCGTTGCTGTTGGCTGTTTTTCTGG)(SEQ ID NO:29)和Inf8201-7186-Rev(ATTTTTTACCTAATTGTCGACTTAGTTCGGAATAAAGTTATTGTACGGAC)(SEQ IDNO:30)扩增VzCP7186 cDNA。将扩增的DNA片段克隆到用SalI限制性酶线性化的pCWori:VzCP8201Bov:CPRm:VzZS2-Nter2质粒中。使用技术(Clontech，Takara BioEurope)进行克隆反应。因此，所得质粒pCWori:VzCP8201:VzCP7186:CPRm:VzZS2-Nter2在单个操纵子中包含编码VzCP8201、VzCP7186、CPRm和VzZS2-Nter2的cDNA。

图17C显示了与仅包含VzCP8201或VzCP7186的细胞(图17A和17B)相比，使用经工程改造以生产重组子杂烯合酶以及VzCP8201和VzCP7186细胞色素P450酶的大肠杆菌细胞形成的产物的GC-MS分析。分析表明，共表达VzCP8201和VzCP7186细胞色素P450酶的细胞中产生的α-子杂烯醇的量增加。在这些条件下，还检测到了子杂烯醇的氧化衍生物子杂烯酮(图17C和图18)。

实施例12：使用子杂烯合酶的变体在酿酒酵母细胞中体内生产子杂烯。

为了生产子杂烯，将编码三种不同的子杂烯合酶：VzZS1(SEQ ID NO:33)，VzZS2(SEQ ID NO:38)和VzZS2-Nter2(SEQ ID NO:42)的基因在具有增加的内源性法呢基焦磷酸(FPP)水平的工程酿酒酵母细胞中表达。

与Paddon et al.,Nature,2013,496:528-532中的描述类似地，为了增加酿酒酵母细胞中内源性法呢基焦磷酸(FPP)库的水平，所有参与甲羟戊酸途径的酵母内源基因的额外副本，从编码乙酰辅酶A C-乙酰基转移酶的ERG10到编码FPP合成酶的ERG20，在半乳糖诱导型启动子的控制下整合到酿酒酵母菌株CEN.PK2-1C(Euroscarf，Frankfurt，Germany)的基因组中。简要地说，三个盒分别整合在LEU2、TRP1和URA3基因座中。第一个盒包含在GAL10/GAL1双向启动子控制下的ERG20基因和一个截短的HMG1(tHMG1，如Donald et al.,Proc Natl Acad Sci USA,1997,109:E111-8所述)，和同样在GAL10/GAL1启动子控制下的ERG19和ERG13基因，该盒的侧翼为两个100个核苷酸区域，分别对应于LEU2的上游和下游部分。第二个盒中，基因IDI1和tHMG1在GAL10/GAL1启动子的控制下，而基因ERG13在GAL7启动子区域的控制下，该盒的侧翼为两个100个核苷酸区域，分别对应于TRP1的上游和下游部分。第三个盒具有ERG10、ERG12、tHMG1和ERG8基因，均在GAL10/GAL1启动子的控制下，该盒的侧翼为两个100个核苷酸的区域，分别对应于URA3的上游和下游部分。三个盒中的所有基因都包含其自身终止子区域的200个核苷酸。而且，在ERG9启动子区域上游，整合了如Griggs and Johnston,Proc Natl Acad Sci USA,1991,88:8597-8601中所描述的，在其自身启动子的突变形式的控制下的GAL4的额外拷贝。另外，通过启动子交换修饰了ERG9的表达。使用含有带有其自身的启动子和终止子的HIS3基因的盒删除GAL7、GAL10和GAL1基因。将所得菌株与菌株CEN.PK2-1D(Euroscarf，Frankfurt，Germany)交配，获得称为YST045的二倍体菌株，其根据Solis-Escalante et al.,FEMS Yeast Res,2015,15:2诱导芽孢形成。孢子分离是通过将asci重悬于200μL、0.5M山梨糖醇和2μL的zymolyase(1000U mL^-1，Zymoresearch，Irvine，CA)中并在37℃孵育20分钟而实现的。然后将混合物铺板在含有20g/L蛋白、10g/L酵母提取物和20g/L琼脂的培养基上，分离出一种发芽的孢子，称为YST075。

为了在YST075中表达VzZS1、VzZS2和VzZS2-Nter2，使用酵母内源同源重组体内构建了一组质粒，如Kuijpers et al.,Microb Cell Fact.,2013,12:47中所述。质粒由用于酿酒酵母共转化的五个DNA片段组成。这些片段是：

a)LEU2酵母标记，使用引物5'AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCGCGCCATTCGACTACGTCGTAAGGCC-3'(SEQ ID NO:43)和5'TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTTGCTGACCATCGACGGTCGAGGAGAACTT-3'(SEQ ID NO:44)通过PCR用质粒PESC-LEU(Agilent Technologies,California,USA)作为模板构建；

b)AmpR大肠杆菌标记，使用引物5’-TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG-3’(SEQ ID NO:45)和5’-AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAG TCCGCACTTTGCCAATGCCAAAAATGTGCGCGGAACCCCTA-3’(SEQ ID NO:46)通过PCR用质粒pESC-URA作为模板构建；

c)酵母复制起点，使用引物5’-TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGGTACGCGTTCCTGAACGAAGCATCTGTGCTTCA-3’(SEQ ID NO:5y)和5’-CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT-3’(SEQ ID NO:48)通过PCR用pESC-URA作为模板获得；

d)大肠杆菌复制起点，使用引物5’-ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG-3’(SEQ ID NO:49)和5’-CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA-3’(SEQ ID NO:50)通过PCR用质粒PESC-URA作为模板获得；

e)由片段“d”的最后60个核苷酸，酵母基因PGK1的终止密码子下游200个核苷酸，为在酿酒酵母中表达而密码子优化的测试子杂烯合酶编码基因之一(分别为VzZS1，VzZS2和VzZS2-Nter2的SEQ ID NO:51，SEQ ID NO:52，SEQ ID NO:53)，酵母启动子GAL1和对应于片段“a”开始的60个核苷酸组成的片段，这些片段是通过DNA合成(ATUM,Menlo Park,CA94025)和PCR重叠延伸(Yolov and Shabarova,Nucleic Acids Res.1990,18(13):3983-6)获得的。

用体内质粒组装所需的片段转化YST075。按照Gietz and Woods,MethodsEnzymol.,2002,350:87–96中所述，用乙酸锂方案进行酵母转化。将转化混合物铺板在含有6.7g/L无氨基酸的酵母氮碱(BD Difco，New Jersey，USA)，1.6g/L不含亮氨酸的滴注补充物(Sigma Aldrich，Missouri，USA)，20g/L葡萄糖和20g/L琼脂的SmLeu培养基上。将板在30℃下温育3至4天。如Westfall et al.,Proc Natl Acad Sci USA,2012,109:E111-118中所述，使用单个菌落在含有培养基的玻璃管中生产子杂烯，并用十二烷作为有机覆盖物。将培养物在30℃下孵育3至4天。使用GC-MS分析和内标物鉴定并量化了子杂烯的生成。

在这些培养条件下，所有测试的子杂烯合酶均产生了子杂烯作为主要产物。与先前鉴定的合酶VzZS1(WO2010134004的SEQ ID NO:1)相比，VzZS2和VzZS2-Nter2产生了286％和42.3％量的子杂烯(图21)。VzZS2给出了最高的子杂烯产量。

实施例13：使用子杂烯合酶和细胞色素P450酶在酿酒酵母细胞中体内产生氧化的倍半萜化合物。

为了生产氧化的倍半萜化合物，在工程酿酒酵母细胞中表达了编码子杂烯合酶VzZS1、VzZS2和VzZS2-Nter2的基因，以及编码细胞色素P450的VzCP521-11(SEQ ID NO 54)和VzCP8201(SEQ ID NO 55)的基因。对所有基因进行密码子优化以使其在酿酒酵母中表达。

将编码细胞色素还原酶AaCPR和细胞色素b5 CYB5的基因的密码子优化版本(黄花蒿(Artemisia annua)形式，GenBank登录号JF951732和JQ582841；描述于Paddon et al.,Nature,2013,496:528-532)整合到YST075的基因组中。编码AaCPR和CYB5的基因的表达分别在GAL3和GAL7基因的启动子区域的控制下。产生的菌株称为YST091。

为了在YST091中表达不同的测试基因，如Kuijpers et al.,Microb Cell Fact.,2013,12:47所述，使用酵母内源同源重组在体内构建了一组六个质粒。质粒由五个DNA片段组成，类似于实施例12中所述，不同之处在于片段“e”包含一种测试子杂烯合酶和一种测试细胞色素P450，两者均受双向GAL10/GAL1启动子调控。用体内质粒组装所需的片段转化YST091，并如实施例12所述使用深孔板代替玻璃管进行测试。深孔板包含Westfall etal.,Proc Natl Acad Sci USA,2012,109:E111-118中所述的介质和石蜡油(SigmaAldrich,Missouri,USA)作为有机覆盖层。将深孔板在30℃下孵育3至4天。为了通过酵母细胞提取所产生的分子，将包含内标的乙酸乙酯添加到每个孔中。使用GC-MS分析鉴定了子杂烯和子杂烯醇的产量，并通过GC-FID进行了定量。

在这些培养条件下，当VzCP8201在酵母细胞中表达时，未鉴定出氧化的子杂烯。相反，子杂烯合酶和P450 VzCP521-11的三种组合导致子杂烯和子杂烯醇的生产。使用携带编码VzZS2和VzCP521-11的基因的质粒获得的子杂烯醇含量最高，而其他两种组合VzZS1/VzCP521-11和VzZS2-Nter2/VzCP521-11分别产生53％和11％的最大量的子杂烯醇。

为了构建稳定的酵母菌株，借助LEU2和TRP1标记，在两个连续重组事件中，将包含编码VzZS2和VzCP521-11的基因的质粒片段的DNA片段两次整合到YST091的基因组中。另外，使用URA3标记基因，用仅包含编码VzCP521-11的基因的DNA片段在GAL10启动子的控制下进行第三次整合。所得菌株称为YST124。

类似于Westfall et al.,Proc Natl Acad Sci USA,2012,109:E111-118中所述，评估YST124产生的氧化的倍半萜。图22显示了在YST124培养物中形成的氧化的倍半萜的GC-MS分析，不仅形成了子杂氮烯醇，而且还形成了子杂烯酮，以及少量的客烯醇。

NA＝核酸

AA＝氨基酸。

序列表

SEQ ID NO:1

VzTps1718野生型cDNA序列，包括3’和5’非编码区:

ACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCGGAGTGAAGTTGAGCAGCTAACTTCACGACTCGTTTGCAGGCTAGCTCGCAACAGAATAGAGAGTGTTACTGCTGGTATATATATATATATATATATGGCTGCGAGCATTACTGTCGCCGCCGCACATGGGCCTCCTGCTGCAATCCCAGAGACCAAACGCAGCACTGTAGACGACGTTCCTTTCCAATCCTCTGTGTGGGGCGACTACTTTGTAAACTACACACCTCCTGCATCACAGAGGTCGGAGGAATGGATGAGGGAGAGGGTTGATGAACTCAGGGGTGAAGTGCGCCGGAAGTTCAAAACGACGATGAGCATGGCCGAGACGATGGTGCTGGTGGACACACTGGAGCGCCTCGCCATCGACGGCCATTTCCGCAAGGATATTGACTTGGCGTTGAGCCAAATCCACATGGAGGGGAAGCCGGCCGGTATTAGCAGCTCCAACAAGCTTTACATCGTCGCCCTGGGATTCCGCTTGCTTAGGCAACATGGCTTCTGGGTATCCGCAGACGTGTTTGACAAGTTTAGGGATAGCACGGGCAAGCTTAGCAAGGGTCTGAGCGGCGACGTGAAGGGTCTGCTGAGCCTATACAACGCGGCTCACATGGCGGTTCCCGGCGAGAAAAGCCTGGACGAAGCCATCGACTTCACAAGGCGCTGCCTCGAGTCTGCCAAGGACAGGCTCGTGGCGCCGATGTCGGTGCAGGTGTCGCGCGCCCTCAGCATTCCTCTCCCCCGCTACCTGCCGCGGCTAGAGGCCATGCACTACATCTCAGAGTATGGGCAGGAGGAGGACCATGACGCCAAGATCCTGGAGCTTGCGAGGCTGGACTATGCCCTTGTCCAGTCTCTCTATCTCAAGGAGCTCAGGGAGCTCACCTTGTGGTGGAAGGAGCTGTATCACAGCGTGAATCTGCCCAACACACGGGACCGCATCGTGGAGATGTACTTCTTTGCATTTGGTATGCTGCAGACGGAGGAGTACTCTCGGGCGCGCCTGATTGATAGCAAGATAATTGCACTGGTCAGCCTGATGGATGACATTTACGACGAACACGCTAGCTTTGAGGAAGCCCAAAAATTCAATGAAGCCATACAGAGATGGAATGAAAGTGCGGTCTCAGACCTACCAGAATACATGCGCATGCTATACACCCAAATACTAAGCACCTTCGCCAAATTTGAGGAAGTTTTGGGGCCCAACGAAAAGTACCGCGTGTCTTACGCCAAAGAGGCGTACAAATTGCAGTCGATGTATTACTTTCTGGAGAACAAATGGTGTCACGAGAACCACATGCCAAGCTTCGGAGAGCACATACATCTTTCTTCCATGTCGGCAGGCTTGCAGGTGTTGATCGTTGGGGCATGGATAGGCGCCCACCACGCCATTGCCAAGGAGTCACTAGAGTGGGCAATCACCTACCCTGAAGTCTTCCGGGCAGCAGGAGATGTTGGCCGTCTCCTCAACGATATCGCTTCATTTAAGAAGAGGAAAAACAGCAAGGACGCGCCCAACGCGCTGGAGTGCTACGTCAGAGAACATGGCGTCACGGGGGAGGAAGCTGCGGCCGCGTGTGCAGCCATTGTAGAGCTCGGGTGGAGGAAGATCAACAGGGCCCGTATGGAGATACATCCTATGCTGGTACCCGCGGCACAAATGGATGCGAAAATCAACCTGACCAGGGTGTGCGAGATTTTATACTACCGTGGTATGGATGGCTACACCTTTGGAAGCGACCTCCGGGATGTCATCACTTCTCTCTTCATCAAGCCGGCGGCCGGGGGCCCTGCATAATT

SEQ ID NO:2

VzTps1718野生型cDNA开放阅读框序列:

ATGGCTGCGAGCATTACTGTCGCCGCCGCACATGGGCCTCCTGCTGCAATCCCAGAGACCAAACGCAGCACTGTAGACGACGTTCCTTTCCAATCCTCTGTGTGGGGCGACTACTTTGTAAACTACACACCTCCTGCATCACAGAGGTCGGAGGAATGGATGAGGGAGAGGGTTGATGAACTCAGGGGTGAAGTGCGCCGGAAGTTCAAAACGACGATGAGCATGGCCGAGACGATGGTGCTGGTGGACACACTGGAGCGCCTCGCCATCGACGGCCATTTCCGCAAGGATATTGACTTGGCGTTGAGCCAAATCCACATGGAGGGGAAGCCGGCCGGTATTAGCAGCTCCAACAAGCTTTACATCGTCGCCCTGGGATTCCGCTTGCTTAGGCAACATGGCTTCTGGGTATCCGCAGACGTGTTTGACAAGTTTAGGGATAGCACGGGCAAGCTTAGCAAGGGTCTGAGCGGCGACGTGAAGGGTCTGCTGAGCCTATACAACGCGGCTCACATGGCGGTTCCCGGCGAGAAAAGCCTGGACGAAGCCATCGACTTCACAAGGCGCTGCCTCGAGTCTGCCAAGGACAGGCTCGTGGCGCCGATGTCGGTGCAGGTGTCGCGCGCCCTCAGCATTCCTCTCCCCCGCTACCTGCCGCGGCTAGAGGCCATGCACTACATCTCAGAGTATGGGCAGGAGGAGGACCATGACGCCAAGATCCTGGAGCTTGCGAGGCTGGACTATGCCCTTGTCCAGTCTCTCTATCTCAAGGAGCTCAGGGAGCTCACCTTGTGGTGGAAGGAGCTGTATCACAGCGTGAATCTGCCCAACACACGGGACCGCATCGTGGAGATGTACTTCTTTGCATTTGGTATGCTGCAGACGGAGGAGTACTCTCGGGCGCGCCTGATTGATAGCAAGATAATTGCACTGGTCAGCCTGATGGATGACATTTACGACGAACACGCTAGCTTTGAGGAAGCCCAAAAATTCAATGAAGCCATACAGAGATGGAATGAAAGTGCGGTCTCAGACCTACCAGAATACATGCGCATGCTATACACCCAAATACTAAGCACCTTCGCCAAATTTGAGGAAGTTTTGGGGCCCAACGAAAAGTACCGCGTGTCTTACGCCAAAGAGGCGTACAAATTGCAGTCGATGTATTACTTTCTGGAGAACAAATGGTGTCACGAGAACCACATGCCAAGCTTCGGAGAGCACATACATCTTTCTTCCATGTCGGCAGGCTTGCAGGTGTTGATCGTTGGGGCATGGATAGGCGCCCACCACGCCATTGCCAAGGAGTCACTAGAGTGGGCAATCACCTACCCTGAAGTCTTCCGGGCAGCAGGAGATGTTGGCCGTCTCCTCAACGATATCGCTTCATTTAAGAAGAGGAAAAACAGCAAGGACGCGCCCAACGCGCTGGAGTGCTACGTCAGAGAACATGGCGTCACGGGGGAGGAAGCTGCGGCCGCGTGTGCAGCCATTGTAGAGCTCGGGTGGAGGAAGATCAACAGGGCCCGTATGGAGATACATCCTATGCTGGTACCCGCGGCACAAATGGATGCGAAAATCAACCTGACCAGGGTGTGCGAGATTTTATACTACCGTGGTATGGATGGCTACACCTTTGGAAGCGACCTCCGGGATGTCATCACTTCTCTCTTCATCAAGCCGGCGGCCGGGGGCCCTGCATAA

SEQ ID NO:3

VzTps1718的全长氨基酸序列:

MAASITVAAAHGPPAAIPETKRSTVDDVPFQSSVWGDYFVNYTPPASQRSEEWMRERVDELRGEVRRKFKTTMSMAETMVLVDTLERLAIDGHFRKDIDLALSQIHMEGKPAGISSSNKLYIVALGFRLLRQHGFWVSADVFDKFRDSTGKLSKGLSGDVKGLLSLYNAAHMAVPGEKSLDEAIDFTRRCLESAKDRLVAPMSVQVSRALSIPLPRYLPRLEAMHYISEYGQEEDHDAKILELARLDYALVQSLYLKELRELTLWWKELYHSVNLPNTRDRIVEMYFFAFGMLQTEEYSRARLIDSKIIALVSLMDDIYDEHASFEEAQKFNEAIQRWNESAVSDLPEYMRMLYTQILSTFAKFEEVLGPNEKYRVSYAKEAYKLQSMYYFLENKWCHENHMPSFGEHIHLSSMSAGLQVLIVGAWIGAHHAIAKESLEWAITYPEVFRAAGDVGRLLNDIASFKKRKNSKDAPNALECYVREHGVTGEEAAAACAAIVELGWRKINRARMEIHPMLVPAAQMDAKINLTRVCEILYYRGMDGYTFGSDLRDVITSLFIKPAAGGPA

SEQ ID NO:4

VzTps1718密码子优化的cDNA序列

ATGGCAGCAAGCATCACGGTCGCCGCAGCACACGGTCCGCCAGCAGCAATCCCGGAAACCAAACGCAGCACCGTGGATGACGTTCCATTTCAATCCTCGGTGTGGGGCGACTACTTCGTCAACTATACGCCGCCGGCGAGCCAGCGTTCCGAAGAGTGGATGCGTGAACGCGTTGACGAACTGCGTGGCGAAGTGCGTCGTAAGTTCAAGACTACCATGAGCATGGCTGAAACCATGGTTCTGGTTGATACCCTGGAGCGCCTTGCAATCGATGGTCATTTTCGTAAAGATATTGACCTGGCACTGAGCCAGATCCACATGGAGGGTAAACCGGCGGGTATTAGCTCGTCTAACAAGCTGTATATCGTTGCGCTGGGCTTTCGTTTGTTGCGTCAGCACGGTTTCTGGGTGAGCGCCGATGTTTTCGATAAATTTCGTGATAGCACGGGCAAACTGTCCAAGGGCCTGAGCGGCGACGTCAAGGGCCTGCTGTCACTGTATAATGCCGCACACATGGCTGTCCCGGGTGAGAAATCTCTGGATGAAGCGATTGACTTTACGCGTCGCTGCCTGGAAAGCGCCAAAGATCGTTTGGTGGCCCCGATGAGCGTCCAGGTTAGCCGCGCCCTGAGCATCCCGCTGCCGCGTTATCTGCCGCGCCTGGAAGCGATGCATTACATCAGCGAGTATGGTCAAGAGGAAGATCACGACGCTAAGATCCTGGAATTGGCGCGCCTGGACTACGCGCTGGTCCAAAGCCTGTACCTGAAAGAACTGCGCGAGCTGACCCTGTGGTGGAAAGAACTGTACCACTCCGTTAATCTGCCGAACACCCGTGACCGCATCGTCGAGATGTATTTCTTTGCGTTTGGTATGTTGCAGACCGAAGAGTACTCTCGTGCTCGCCTGATCGATAGCAAGATTATCGCCCTGGTGAGCCTGATGGATGACATTTATGATGAGCATGCCAGCTTCGAGGAAGCTCAAAAGTTTAACGAAGCAATCCAACGTTGGAATGAAAGCGCGGTTAGCGACTTGCCGGAGTATATGCGCATGCTGTACACCCAAATCCTGAGCACCTTCGCGAAGTTTGAAGAGGTTCTGGGTCCGAACGAAAAATATCGCGTGAGCTATGCGAAAGAGGCGTACAAGCTGCAATCCATGTACTATTTCCTGGAGAACAAATGGTGTCATGAGAATCACATGCCGAGCTTCGGTGAGCACATTCACCTGAGCTCCATGTCCGCGGGTTTGCAAGTGTTGATTGTGGGTGCTTGGATCGGCGCACATCATGCCATTGCAAAAGAGAGCCTGGAGTGGGCGATTACCTACCCTGAAGTTTTTCGTGCCGCGGGCGATGTGGGTCGTCTGTTGAATGACATTGCAAGCTTCAAAAAGCGTAAGAACTCTAAAGACGCCCCGAACGCGCTGGAGTGTTATGTCCGTGAACACGGCGTGACTGGCGAAGAAGCGGCAGCTGCCTGCGCAGCTATTGTTGAGCTGGGTTGGCGTAAGATCAACCGTGCGCGCATGGAAATCCATCCGATGCTGGTCCCGGCGGCGCAGATGGACGCGAAAATCAATTTGACCCGTGTGTGCGAGATCCTGTACTACCGTGGCATGGATGGTTACACCTTCGGTAGCGATTTACGCGATGTGATTACGAGCCTCTTC

ATTAAGCCTGCGGCTGGCGGCCCGGCGTAA

SEQ ID NO:5

VzTrspt-9_Locus_8201-12，全长转录物，含有5’和3非翻译序列

GATCGTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAAAAATGGACTTTCTCAGAATCCCGTTTCTTGTAGCCTTCGTCTTCCTCGCCGTCCTTCTCAGGCTCATCCGGAGCTACATCACATCCTCAGCTCTTCGCCTGCCACCGGGGCCATGGCAGCTGCCGCTCATCGGCAGCCTGCACCACCTCCTGCTGTCGCGCTTCAGCGACCTCCCTCACCGGGCTTTGCGCGAGATGTCCGGCACCTACGGGCCCCTCATGCTGCTCCGCTTCGGCTCCGTGCCCACGCTGGTGGTCTCCTCCGCCGAGGCTGCCCGGGAGGTGATGAGGACCCACGACCTCGCCTTCTGCGACCGCCACCTCGGCGTCACTCTCGACATCGTCACCTGCGGCGGCAAGGACATCATCTGCTCCCCCTACAACGCCCACTGGCGCGAGCTCCGTAAGCTGTGCATGGTCGAGATCTTGAGCCAGCGGCGCGTGCTCTCGTTCCGGAGCATCCGGGAAGAGGAGGTGGCGAGCCTCGTCCGCTCCATCTCCGACGAGTGCGGCGGTGGCCAGCAGCCCGTCAACCTCACTGAAGGGATAAGCCGCATGATAAACGACGTCGCCGCGCGCACGGTCGTCGGCGACCGGTGCAAGTACCAGGATGAATACATGCATGAGCTGGACGAAGTGGTGCGGCTGGCCGGCGGGTTCAACCTGGCGGACCTGTACCCGTCCTCGCGGCTGGTACGGCGGTTCAGCGCCGCCGCGAGGGACGCGAGGAGGTGCCAGAGGAACATGTACCGTATCATCCAGAGCATCATCCAGGAGCGTGAAGCCATGCCGACGCCAGAGCGAGACGAGGAGGACCTCCTCGGCGTCCTCCTCAGGCTGCAGAGAGAAGGTGGCCTGCAGTTTGCTCTCACCAATGAGATAGTCAGCACCGTCATTTACGATATTTTTTCTGCTGGTAGTGAAACATCATCAACTGTTCTAGTATGGGCAATGTCGGAGCTTGTTAAGAATCCACAAGTCATGCGTAAGGCCCAGTCAGAGGTGAGGGATACCTTCAAAGGAAACAACAAGATAACTGAAAGTGATTTGATCAAGTTAAGATATCTACAACTGGTGATCAAGGAGACTTTACGGTTGCATGCTCCGGTACCACTCTTGCTCCCTCGAGAATGCCGTGAGTCATGTCAGATTATGGGTTACGATGTGCTAAAGGGAACCAAGGTATTTGTGAATGCTTGGGCAATAGCAAGGGACACGGGATTATGGTGTGATGGAGAGGAATTTAGGCCAGAAAGGTTTGAAAGTAGCAATATTGATTTCAGGGGTAATGACTTTGAGTTCACACCGTTTGGGGCAGGCAGGAGAGTATGCCCTGGCATCACACTTGGACTGGCCAACCTAGAACTAGCGCTTGCTAGCCTTCTTTATCATTTTGATTGGGATCTGCCCAATGGTGCCAGGTTGGAAGATCTTGATATGGCAGAGGCCTTTGGTATAACGTTAAAAAGGAAGTCCATGCTCTGGCTCAAGGCCAAACCTTACAATAATTTTATACCAAATTAATCAGGTGATTTGTGATGTGAACTATCCCGGTTGCTACTTAGTTTATTATACCCAGAAAGAGTGTGATGGTAATTGTACTATCAATCTTTACTGCAGAACAGTAAATATATCCAGAGTTGGTTCTATGCTTCTGTTATAATGTTTCATCACTCTGTATTAAGTGTGTAGTTATCTGTTTGTTTACTTTTTTTGTAATGATTAAACGATTATCTAATGAGAGTACAAGAATCAAATGAGACTGGTCTAAAAAAAA

SEQ ID NO:6

VzCp8201-12野生型cDNA序列，仅开放阅读框。

ATGGACTTTCTCAGAATCCCGTTTCTTGTAGCCTTCGTCTTCCTCGCCGTCCTTCTCAGGCTCATCCGGAGCTACATCACATCCTCAGCTCTTCGCCTGCCACCGGGGCCATGGCAGCTGCCGCTCATCGGCAGCCTGCACCACCTCCTGCTGTCGCGCTTCAGCGACCTCCCTCACCGGGCTTTGCGCGAGATGTCCGGCACCTACGGGCCCCTCATGCTGCTCCGCTTCGGCTCCGTGCCCACGCTGGTGGTCTCCTCCGCCGAGGCTGCCCGGGAGGTGATGAGGACCCACGACCTCGCCTTCTGCGACCGCCACCTCGGCGTCACTCTCGACATCGTCACCTGCGGCGGCAAGGACATCATCTGCTCCCCCTACAACGCCCACTGGCGCGAGCTCCGTAAGCTGTGCATGGTCGAGATCTTGAGCCAGCGGCGCGTGCTCTCGTTCCGGAGCATCCGGGAAGAGGAGGTGGCGAGCCTCGTCCGCTCCATCTCCGACGAGTGCGGCGGTGGCCAGCAGCCCGTCAACCTCACTGAAGGGATAAGCCGCATGATAAACGACGTCGCCGCGCGCACGGTCGTCGGCGACCGGTGCAAGTACCAGGATGAATACATGCATGAGCTGGACGAAGTGGTGCGGCTGGCCGGCGGGTTCAACCTGGCGGACCTGTACCCGTCCTCGCGGCTGGTACGGCGGTTCAGCGCCGCCGCGAGGGACGCGAGGAGGTGCCAGAGGAACATGTACCGTATCATCCAGAGCATCATCCAGGAGCGTGAAGCCATGCCGACGCCAGAGCGAGACGAGGAGGACCTCCTCGGCGTCCTCCTCAGGCTGCAGAGAGAAGGTGGCCTGCAGTTTGCTCTCACCAATGAGATAGTCAGCACCGTCATTTACGATATTTTTTCTGCTGGTAGTGAAACATCATCAACTGTTCTAGTATGGGCAATGTCGGAGCTTGTTAAGAATCCACAAGTCATGCGTAAGGCCCAGTCAGAGGTGAGGGATACCTTCAAAGGAAACAACAAGATAACTGAAAGTGATTTGATCAAGTTAAGATATCTACAACTGGTGATCAAGGAGACTTTACGGTTGCATGCTCCGGTACCACTCTTGCTCCCTCGAGAATGCCGTGAGTCATGTCAGATTATGGGTTACGATGTGCTAAAGGGAACCAAGGTATTTGTGAATGCTTGGGCAATAGCAAGGGACACGGGATTATGGTGTGATGGAGAGGAATTTAGGCCAGAAAGGTTTGAAAGTAGCAATATTGATTTCAGGGGTAATGACTTTGAGTTCACACCGTTTGGGGCAGGCAGGAGAGTATGCCCTGGCATCACACTTGGACTGGCCAACCTAGAACTAGCGCTTGCTAGCCTTCTTTATCATTTTGATTGGGATCTGCCCAATGGTGCCAGGTTGGAAGATCTTGATATGGCAGAGGCCTTTGGTATAACGTTAAAAAGGAAGTCCATGCTCTGGCTCAAGGCCAAACCTTACAATAATTTTATACCAAATTAA

SEQ ID NO:7

VzCP8201-12，野生型氨基酸序列。

MDFLRIPFLVAFVFLAVLLRLIRSYITSSALRLPPGPWQLPLIGSLHHLLLSRFSDLPHRALREMSGTYGPLMLLRFGSVPTLVVSSAEAAREVMRTHDLAFCDRHLGVTLDIVTCGGKDIICSPYNAHWRELRKLCMVEILSQRRVLSFRSIREEEVASLVRSISDECGGGQQPVNLTEGISRMINDVAARTVVGDRCKYQDEYMHELDEVVRLAGGFNLADLYPSSRLVRRFSAAARDARRCQRNMYRIIQSIIQEREAMPTPERDEEDLLGVLLRLQREGGLQFALTNEIVSTVIYDIFSAGSETSSTVLVWAMSELVKNPQVMRKAQSEVRDTFKGNNKITESDLIKLRYLQLVIKETLRLHAPVPLLLPRECRESCQIMGYDVLKGTKVFVNAWAIARDTGLWCDGEEFRPERFESSNIDFRGNDFEFTPFGAGRRVCPGITLGLANLELALASLLYHFDWDLPNGARLEDLDMAEAFGITLKRKSMLWLKAKPYNNFIPN

SEQ ID NO:8

VzCP8201-228093，编码VzCP8201-12的经优化的DNA序列，包括位于5’端的NdeI和位于3’端的多接头。

ATGGCACTGTTGTTGGCTGTTTTTTTGGGTTTGAGCTGTTTGTTGCTGTTGAGCTTGTGGCGTCTGATCCGCAGCTACATTACTTCCAGCGCGCTGCGCCTGCCGCCGGGTCCGTGGCAGCTGCCTCTGATTGGCAGCCTGCACCACTTGCTGCTGAGCCGCTTCAGCGACTTGCCGCATCGCGCGCTGAGAGAGATGAGCGGCACCTACGGTCCGCTGATGCTGCTGCGTTTCGGTAGCGTCCCGACCCTGGTTGTCTCTAGCGCGGAAGCGGCTCGTGAAGTCATGCGTACCCACGATCTGGCGTTTTGCGATCGTCACCTGGGTGTGACGCTGGACATCGTAACCTGTGGTGGCAAAGACATCATCTGCAGCCCATACAACGCTCATTGGCGTGAGCTGCGCAAGCTGTGCATGGTTGAAATCCTGAGCCAGCGCCGTGTGCTGAGCTTCCGTTCGATTCGTGAAGAAGAGGTCGCGAGCCTGGTGCGTTCCATTAGCGATGAGTGTGGTGGCGGCCAGCAACCAGTTAACCTGACCGAAGGCATCTCTCGCATGATTAATGACGTCGCCGCACGTACCGTGGTCGGTGACCGCTGCAAGTACCAAGACGAGTACATGCATGAACTGGACGAAGTTGTTCGTCTGGCGGGTGGCTTCAACCTGGCCGATCTGTATCCGAGCTCACGTCTGGTTCGTCGTTTTTCCGCAGCTGCGCGTGACGCGCGTCGCTGTCAGCGTAACATGTACCGCATTATTCAATCTATCATCCAAGAGCGTGAGGCAATGCCGACGCCTGAGCGCGACGAAGAAGATCTTCTGGGTGTCCTGCTGCGTCTGCAGCGCGAGGGTGGTCTGCAGTTTGCGCTGACGAACGAAATTGTTTCGACCGTGATTTACGATATCTTCAGCGCCGGTAGCGAAACCTCCAGCACGGTGTTGGTGTGGGCAATGTCTGAACTGGTCAAAAATCCGCAAGTGATGCGCAAAGCGCAAAGCGAAGTTCGTGACACTTTCAAAGGTAACAATAAGATTACCGAGAGCGACCTGATTAAGCTGCGCTATCTGCAACTGGTTATCAAAGAAACCCTGCGCCTGCACGCACCGGTGCCGCTGCTGCTGCCGCGTGAGTGCCGTGAATCCTGTCAGATCATGGGCTATGACGTTCTGAAGGGTACGAAAGTGTTCGTTAATGCCTGGGCGATTGCACGTGATACGGGTCTGTGGTGCGACGGCGAAGAGTTCCGTCCGGAGCGTTTCGAGTCCAGCAATATCGATTTTCGTGGTAATGATTTTGAGTTCACGCCGTTCGGTGCGGGCCGTCGTGTCTGCCCAGGCATCACCCTGGGCCTGGCCAACTTAGAACTGGCCCTCGCGAGCTTGTTATATCACTTTGACTGGGATCTGCCGAACGGCGCGCGCCTGGAAGATCTGGACATGGCCGAGGCATTTGGTATCACGCTGAAGCGCAAGAGCATGCTGTGGCTGAAAGCAAAACCGTACAATAATTTTATTCCGAACTAA

SEQ ID NO:9

VzCP8201-228092，编码VzCP8201-12-bov的经优化的DNA序列，包括位于5’端的NdeI和位于3’端的多接头。

SEQ ID NO:10

VzCP8201-12-bov，VzCP8201-12的N末端变体的氨基酸序列。

MALLLAVFLGLSCLLLLSLWRLIRSYITSSALRLPPGPWQLPLIGSLHHLLLSRFSDLPHRALREMSGTYGPLMLLRFGSVPTLVVSSAEAAREVMRTHDLAFCDRHLGVTLDIVTCGGKDIICSPYNAHWRELRKLCMVEILSQRRVLSFRSIREEEVASLVRSISDECGGGQQPVNLTEGISRMINDVAARTVVGDRCKYQDEYMHELDEVVRLAGGFNLADLYPSSRLVRRFSAAARDARRCQRNMYRIIQSIIQEREAMPTPERDEEDLLGVLLRLQREGGLQFALTNEIVSTVIYDIFSAGSETSSTVLVWAMSELVKNPQVMRKAQSEVRDTFKGNNKITESDLIKLRYLQLVIKETLRLHAPVPLLLPRECRESCQIMGYDVLKGTKVFVNAWAIARDTGLWCDGEEFRPERFESSNIDFRGNDFEFTPFGAGRRVCPGITLGLANLELALASLLYHFDWDLPNGARLEDLDMAEAFGITLKRKSMLWLKAKPYNNFIPN

SEQ ID NO:11

VzTrspt7_contig_7186，全长转录物，含有5’和3非翻译序列

TGGTCACGTAGTTGCCTGCAAAATTGTCCCATCCCCTGGCAAAAAATGGACATTATCAGTATCCCGTTTCTTGTAGCCTTCGTCTTCCTCCTCGCCGTCCTTCTCAGGCTCATCCGGAGCTACATCACATCCTCAGCGCTTCGCCTGCCACCGGGGCCATGGCAGCTGCCGCTCATCGGCAGCCTGCACCACCTCCTGCTGTCGCGCTTCAGCGACCTGCCTCACCGGGCGCTGCGCGAGATGTCCGGCGCCTACGGTCCCCTCATGCTCCTCCGCTTCGGCGCCGTGCCCACGCTGGTGGCCTCCTCCGCCGAGGCTGCCCGGGAGGTGATGAGGACCCACGACCTCGCCTTCTGCAACCGCCATCTCGGCGTCACCTTCGACACCATCACCTGCGGCGGCAAGGACATCATCGGCTCCCCCTACAACGCCCAGTGGCGCGAGCTCCGCAAGCTGTGCATGCTCGAGATCTTCAGCCAGCGGCGCGTGCTCTCGTTCCGGAGCATCCGGGAAGAGGAGGTGGCGAACCTCGTCCGCTCCATCTCCGACGAGTGCGGCGGTGGCCGGCAGCCCGTCAACCTCACCGAGGGGATCTGCCGCATGATCAACGACGTCGCCGCGCGCACGGCCGTCGGTGACCGGTGCAGGTACCGGGACGAGTACATGCACGAGCTGGACGAAGTGGTGCGGCTGGTGAGCGGGTTCAACCTGGCGGACCTGTACCCGTCCTCGTGGCTGGTGCGGCGGTTCAGCGCCGCCGCGAGGGACGCGAGGAGGTGCCAGAGGAACATGTACCGCATCATCCAGAGCATCATCGAGGAACGTGAAGCCATGCCGACGCCAGAGCGAGACGAGGACCTTCTGGGTGTCCTCCTGAGGCTGCAGAAGGAAGGTGGCCTGCAGTTCGCCCTCACCAACGAGATTGTCAGCACCGTCATTTTCGACATTTTCTCTGCTGGGAGTGAGACATCATCAACCGTTCTAGTATGGGCAATGTCAGAACTTGTTAAGAACCCGCAGGTCATGCATAAGGCCCGGTCAGAGGTGAGGGAGACCTTCAGAGGACAAGACAAGATAAGTGAAGATGATCTGGTCAAGTTAAGATATCTACAACTGGTGATAAAGGAGACTTTACGGCTGCATGCTCCAGTACCACTCTTGCTCCCTCGAGAATGTCGTGAGTCATGTCAGGTTATGGGTTACGACGTGCCAAAGGGAACCAAGGTGTTTGTGAATGTTTGGGCAATAGCAAGGGACGTGAAACTGTGGCATGATGCGGAGGTATTCAAACCAGAAAGATTTGAAAGTAGCAGTATCGATTTTAGGGGTAATGACTTTGAGTTCACTCCATTCGGGGCAGGCAGGAGAATGTGCCCTGGCGTTACACTCGGACTGGCCAACCTAGAGCTGGCACTTGCTAGCCTTCTTTACCATTTTGATTGGGATCTGCCGGATGGCATCGGGTTAGAAGAACTCGATATGTCAGAGACCTCTGGTATAACGTTAAGAAAGAAGTCCATGCTCTGGCTCAAGGCTAGACCTTACAATAATTTTATACCAAATTAATCAGGTGCTCTGTGTTGTGAACTATGTCCTGTTCCTGTTACTACTTAATTTGTACCAGAAAGAGTGTGATTATAATTGTCATATCAATCTGTACTGCATGATAATAAATATATGCATAGTTTGTATATACTATGCTTGTGTTATACTGTTT

SEQ ID NO:12

VzTrspt7_contig_7186野生型cDNA序列，仅开放阅读框。

ATGGACATTATCAGTATCCCGTTTCTTGTAGCCTTCGTCTTCCTCCTCGCCGTCCTTCTCAGGCTCATCCGGAGCTACATCACATCCTCAGCGCTTCGCCTGCCACCGGGGCCATGGCAGCTGCCGCTCATCGGCAGCCTGCACCACCTCCTGCTGTCGCGCTTCAGCGACCTGCCTCACCGGGCGCTGCGCGAGATGTCCGGCGCCTACGGTCCCCTCATGCTCCTCCGCTTCGGCGCCGTGCCCACGCTGGTGGCCTCCTCCGCCGAGGCTGCCCGGGAGGTGATGAGGACCCACGACCTCGCCTTCTGCAACCGCCATCTCGGCGTCACCTTCGACACCATCACCTGCGGCGGCAAGGACATCATCGGCTCCCCCTACAACGCCCAGTGGCGCGAGCTCCGCAAGCTGTGCATGCTCGAGATCTTCAGCCAGCGGCGCGTGCTCTCGTTCCGGAGCATCCGGGAAGAGGAGGTGGCGAACCTCGTCCGCTCCATCTCCGACGAGTGCGGCGGTGGCCGGCAGCCCGTCAACCTCACCGAGGGGATCTGCCGCATGATCAACGACGTCGCCGCGCGCACGGCCGTCGGTGACCGGTGCAGGTACCGGGACGAGTACATGCACGAGCTGGACGAAGTGGTGCGGCTGGTGAGCGGGTTCAACCTGGCGGACCTGTACCCGTCCTCGTGGCTGGTGCGGCGGTTCAGCGCCGCCGCGAGGGACGCGAGGAGGTGCCAGAGGAACATGTACCGCATCATCCAGAGCATCATCGAGGAACGTGAAGCCATGCCGACGCCAGAGCGAGACGAGGACCTTCTGGGTGTCCTCCTGAGGCTGCAGAAGGAAGGTGGCCTGCAGTTCGCCCTCACCAACGAGATTGTCAGCACCGTCATTTTCGACATTTTCTCTGCTGGGAGTGAGACATCATCAACCGTTCTAGTATGGGCAATGTCAGAACTTGTTAAGAACCCGCAGGTCATGCATAAGGCCCGGTCAGAGGTGAGGGAGACCTTCAGAGGACAAGACAAGATAAGTGAAGATGATCTGGTCAAGTTAAGATATCTACAACTGGTGATAAAGGAGACTTTACGGCTGCATGCTCCAGTACCACTCTTGCTCCCTCGAGAATGTCGTGAGTCATGTCAGGTTATGGGTTACGACGTGCCAAAGGGAACCAAGGTGTTTGTGAATGTTTGGGCAATAGCAAGGGACGTGAAACTGTGGCATGATGCGGAGGTATTCAAACCAGAAAGATTTGAAAGTAGCAGTATCGATTTTAGGGGTAATGACTTTGAGTTCACTCCATTCGGGGCAGGCAGGAGAATGTGCCCTGGCGTTACACTCGGACTGGCCAACCTAGAGCTGGCACTTGCTAGCCTTCTTTACCATTTTGATTGGGATCTGCCGGATGGCATCGGGTTAGAAGAACTCGATATGTCAGAGACCTCTGGTATAACGTTAAGAAAGAAGTCCATGCTCTGGCTCAAGGCTAGACCTTACAATAATTTTATACCAAATTAA

SEQ ID NO:13

VzCP7186，野生型氨基酸序列。

MDIISIPFLVAFVFLLAVLLRLIRSYITSSALRLPPGPWQLPLIGSLHHLLLSRFSDLPHRALREMSGAYGPLMLLRFGAVPTLVASSAEAAREVMRTHDLAFCNRHLGVTFDTITCGGKDIIGSPYNAQWRELRKLCMLEIFSQRRVLSFRSIREEEVANLVRSISDECGGGRQPVNLTEGICRMINDVAARTAVGDRCRYRDEYMHELDEVVRLVSGFNLADLYPSSWLVRRFSAAARDARRCQRNMYRIIQSIIEEREAMPTPERDEDLLGVLLRLQKEGGLQFALTNEIVSTVIFDIFSAGSETSSTVLVWAMSELVKNPQVMHKARSEVRETFRGQDKISEDDLVKLRYLQLVIKETLRLHAPVPLLLPRECRESCQVMGYDVPKGTKVFVNVWAIARDVKLWHDAEVFKPERFESSSIDFRGNDFEFTPFGAGRRMCPGVTLGLANLELALASLLYHFDWDLPDGIGLEELDMSETSGITLRKKSMLWLKARPYNNFIPN

SEQ ID NO:14

编码VzCP7186的N末端变体的经优化的cDNA。

ATGGCGTTGCTGTTGGCTGTTTTTCTGGGTTTGTCGTGTTTGTTGTTGTTGTCACTGTGGCGCTTGATCCGTAGCTATATCACTAGCAGCGCGTTGCGTCTGCCTCCGGGTCCTTGGCAGCTGCCGCTGATTGGTAGCCTGCACCATTTGCTGCTGAGCCGTTTCAGCGATCTGCCGCACCGTGCGTTGCGCGAGATGAGCGGTGCCTATGGCCCGCTGATGCTGTTACGTTTTGGTGCAGTGCCGACCCTGGTGGCAAGCAGCGCAGAAGCAGCGCGCGAGGTGATGCGCACCCATGACCTGGCCTTCTGCAATCGTCACCTGGGTGTCACCTTTGACACCATCACCTGTGGTGGCAAAGACATTATCGGTAGCCCATATAACGCACAATGGCGCGAGCTGCGCAAGCTGTGTATGCTGGAGATCTTCAGCCAACGTCGTGTGCTGAGCTTCCGTAGCATTCGCGAGGAGGAAGTGGCCAACCTGGTCCGCAGCATTAGCGACGAATGCGGTGGTGGCCGTCAACCGGTCAATCTGACCGAGGGTATCTGTCGCATGATCAACGACGTGGCTGCGCGTACTGCAGTCGGCGACCGTTGCCGTTACCGTGATGAGTACATGCACGAACTGGATGAAGTTGTCCGCCTGGTTAGCGGCTTCAACCTGGCGGATCTGTACCCGTCCTCTTGGCTGGTTCGTCGTTTCTCGGCAGCTGCTCGTGACGCGCGCAGATGCCAGCGTAATATGTATCGTATCATTCAGAGCATTATTGAAGAACGTGAGGCAATGCCGACGCCGGAACGTGACGAGGATTTGCTGGGTGTGCTGCTGCGCCTGCAGAAGGAGGGTGGCTTGCAGTTCGCGCTGACCAACGAAATCGTCAGCACGGTTATCTTTGACATCTTTTCTGCGGGTAGCGAGACTAGCAGCACGGTGCTGGTCTGGGCCATGAGCGAACTGGTTAAAAATCCTCAAGTTATGCATAAGGCACGCTCTGAGGTGCGCGAAACGTTTCGTGGCCAAGACAAAATCTCCGAGGACGATCTCGTCAAGCTGCGTTATTTGCAACTTGTTATTAAGGAAACCCTGCGTCTGCATGCGCCGGTTCCGTTACTGCTGCCACGCGAGTGTCGTGAGAGCTGCCAAGTGATGGGTTACGATGTGCCAAAAGGCACCAAAGTGTTCGTTAACGTCTGGGCGATTGCCCGCGACGTCAAACTGTGGCACGATGCAGAGGTCTTTAAACCGGAGCGTTTCGAGAGCTCTAGCATCGATTTTCGTGGCAATGATTTCGAGTTCACGCCGTTTGGCGCTGGTCGTCGTATGTGCCCGGGTGTCACCCTGGGTCTGGCCAATCTGGAACTGGCCTTGGCGTCCCTTCTGTACCACTTCGATTGGGATCTCCCGGACGGCATCGGTCTGGAAGAACTGGACATGAGCGAAACCTCCGGTATCACGCTGCGTAAAAAGAGCATGCTGTGGCTGAAGGCGCGTCCGTACAATAACTTTATTCCGAACTAA

SEQ ID NO:15

VzCP7186的N末端变体＝VzCP7186op

MALLLAVFLGLSCLLLLSLWRLIRSYITSSALRLPPGPWQLPLIGSLHHLLLSRFSDLPHRALREMSGAYGPLMLLRFGAVPTLVASSAEAAREVMRTHDLAFCNRHLGVTFDTITCGGKDIIGSPYNAQWRELRKLCMLEIFSQRRVLSFRSIREEEVANLVRSISDECGGGRQPVNLTEGICRMINDVAARTAVGDRCRYRDEYMHELDEVVRLVSGFNLADLYPSSWLVRRFSAAARDARRCQRNMYRIIQSIIEEREAMPTPERDEDLLGVLLRLQKEGGLQFALTNEIVSTVIFDIFSAGSETSSTVLVWAMSELVKNPQVMHKARSEVRETFRGQDKISEDDLVKLRYLQLVIKETLRLHAPVPLLLPRECRESCQVMGYDVPKGTKVFVNVWAIARDVKLWHDAEVFKPERFESSSIDFRGNDFEFTPFGAGRRMCPGVTLGLANLELALASLLYHFDWDLPDGIGLEELDMSETSGITLRKKSMLWLKARPYNNFIPN*

SEQ ID NO:16

VzCP521-11野生型cDNA开放阅读框序列:

ATGGAGGACACTAAGATCCTCGTCGCCGCGGTGTCCGTGTGCGTGCTTCTTGTGGTCCTCTCCAAGCTCAAGAAGTCCCTGCTGCCCGGCGCGAAACCAAAGCTTAACCTGCCCCCGGGGCCATGGACGCTGCCGGTGATCGGCAGCCTCCACCACGTGATCACCTACCCCAACCTCCACCGCGCACTGCACGGGCTGGCGCAGAAGTACGGTCCGGTGATGATGTTCCGGCTCGGCGAGGTGCCAATGATGGTGGTGTCGTCGCCGGCGGCCGCGCAGGAGGCCCTCAAGACGAACGACATCGCCTTCGCCGACCGGTACACCAACGCCACCATCGGCGCGCTCACCTTCCATGGCGAGGACATGGCGTTCGCGCCCTACGGCGAGCGGTGGCGCCAGCTCCGCAAGATCTGCGTGCTGGAGCTGCTCAGCGCCGCCCGGGTGCAGTCGTTCCGCCACATCCGGGCGGAGGAGGTGTCGCGGCTCGTCGGGAAACTCGCCGCGTCCGCCGCCGCCGGCGAAGCTGTCCACCTCAACAAGATTGTCGCGAAGTTCGTCAACGACACCATCGTGAGGGAGGCGGTCGGCAGCGGGAGCAAGCACCAGGACGAGTACCTCAACTCCATCGACGTAGCCCTCCGGCAGACAATGGGGGTCGCCCTCGCCGACCTCTTCCCGTCTTCGAGGCTCATACAGATGATTGACACGGCACCCCGGAAGGTGCTCGCGGCCCGGAACAACATGGAGCGCATCCTCGAGGAAATCATCAACGAGACCAAGGAAGCCATGGACCGCGGCGACGGCCAGAAGAAGGTGGAGGGCATCCTCGGTGTCCTGCTGAGGCTCCAGAAGGAAGGCAGCACGCCGGTCCCGCTCACCAACGAGGTCATCGTTACGGTGATGTTTGACATGTTTGGCGCTGGCAGCGACACCTCGTCGACCTTGCTGACCTGGTGCATGATGGAGCTAGTCCGGTCACCGCCGACGATGGCCAAAGTGCAAGACGAGGTGCGAGAGGCCTTCAAAGGGAAGAAGGAGAGCACCATCATCACTGAAGACGACCTCAAGGGGCTCACCTACCTCAAGCAAGTGATCAAGGAGGCCCTGAGGATGCACCCTCCGGTGCCCCTCCTGCTTCCAAGGAAGTGTCGCGAGACGTGCAAGGTCATGGGCTACGACATTCCCAAGGGCACGGTAGTGTTCGCTAACGCATGGGCAATCGGCAGGGATCCCAAGTATTGGGAGGATCCAGAGGAGTTCAAGCCAGAGCGATTCGACAAGAGCAATGTGGACTACAAGGGAACAAACTTTGAGTACCTGCCGTTTGGATCTGGCCGTCGGATTTGTCCCGGCATAAACCTAGGCTTGTGCAACATTGAGCTCGCGTTGGCGAGCCTTCTATATCACTTTGACTGGAAGCTGCCGAACGGAATGGAGCCCAAAGACATAGATATGGGAGAGGCTCAAGGGTTAATCGCCAGTAAGAAAACAAACCTAACCCTGCACCCTGTGACTCGCATTGCTCCGGCCGGTTTTAATTAA

SEQ ID NO:17

编码VzCP521-11的经优化的cDNA序列。

ATGGAAGATACTAAAATTCTGGTCGCGGCTGTCTCTGTTTGTGTGCTGTTGGTGGTTCTTAGCAAACTGAAGAAGTCCCTGCTGCCGGGTGCTAAACCGAAATTGAATCTGCCTCCGGGTCCGTGGACGCTGCCTGTGATTGGCAGCCTGCACCATGTTATCACCTATCCTAACTTGCATCGTGCGCTGCACGGTCTGGCTCAGAAGTATGGTCCGGTCATGATGTTCCGTTTGGGTGAGGTGCCGATGATGGTCGTTTCCAGCCCGGCTGCAGCTCAAGAGGCTTTGAAAACGAATGACATTGCATTTGCGGATCGTTATACCAACGCGACGATCGGTGCCCTGACCTTTCACGGCGAGGACATGGCATTCGCACCGTACGGCGAGCGTTGGCGTCAACTGCGCAAGATCTGCGTTCTGGAGCTGCTGTCCGCAGCCCGTGTCCAGAGCTTTCGTCACATCCGTGCGGAGGAGGTCAGCCGTCTGGTTGGTAAATTGGCTGCCAGCGCCGCAGCAGGTGAGGCGGTTCACCTGAACAAGATTGTTGCGAAATTCGTCAATGATACGATTGTTCGTGAAGCCGTGGGTAGCGGCTCTAAACACCAAGATGAGTACCTGAATAGCATTGATGTTGCGCTGCGCCAAACGATGGGCGTGGCACTGGCCGACCTGTTCCCGAGCTCTCGCCTGATCCAGATGATCGATACCGCACCGCGCAAAGTTCTGGCCGCGCGTAACAATATGGAACGTATCCTGGAAGAGATCATTAACGAAACCAAAGAGGCAATGGATCGTGGTGACGGCCAGAAGAAAGTCGAGGGCATTCTGGGCGTCTTGCTGCGTCTGCAGAAAGAGGGTAGCACCCCGGTGCCGCTGACCAATGAGGTGATCGTTACCGTCATGTTCGATATGTTCGGCGCGGGCAGCGACACGAGCAGCACCCTGTTGACCTGGTGCATGATGGAATTGGTTCGTAGCCCACCAACAATGGCAAAGGTCCAAGACGAAGTGCGTGAGGCATTTAAAGGCAAGAAAGAAAGCACCATCATCACCGAGGATGACTTGAAGGGCCTGACCTACCTGAAGCAGGTCATCAAAGAGGCACTGCGCATGCACCCTCCGGTGCCGTTGCTGCTGCCGCGCAAATGCCGCGAAACCTGCAAAGTTATGGGCTATGACATCCCGAAAGGTACGGTGGTTTTTGCAAATGCCTGGGCGATTGGTCGCGATCCGAAGTATTGGGAAGACCCGGAGGAGTTCAAACCTGAACGTTTCGATAAGAGCAACGTTGACTACAAAGGTACTAACTTCGAGTATCTGCCGTTCGGTTCGGGTCGTCGCATTTGCCCGGGTATCAACTTGGGTCTGTGTAACATTGAGCTGGCCTTGGCTTCCCTGTTGTATCATTTCGATTGGAAACTGCCGAATGGCATGGAGCCGAAGGACATTGACATGGGTGAGGCACAAGGCCTGATCGCATCCAAAAAGACGAATTTGACGCTGCACCCGGTTACTCGTATCGCTCCGGCAGGTTTTAATTGA

SEQ ID NO:18

VzCP521-11，氨基酸序列。

MEDTKILVAAVSVCVLLVVLSKLKKSLLPGAKPKLNLPPGPWTLPVIGSLHHVITYPNLHRALHGLAQKYGPVMMFRLGEVPMMVVSSPAAAQEALKTNDIAFADRYTNATIGALTFHGEDMAFAPYGERWRQLRKICVLELLSAARVQSFRHIRAEEVSRLVGKLAASAAAGEAVHLNKIVAKFVNDTIVREAVGSGSKHQDEYLNSIDVALRQTMGVALADLFPSSRLIQMIDTAPRKVLAARNNMERILEEIINETKEAMDRGDGQKKVEGILGVLLRLQKEGSTPVPLTNEVIVTVMFDMFGAGSDTSSTLLTWCMMELVRSPPTMAKVQDEVREAFKGKKESTIITEDDLKGLTYLKQVIKEALRMHPPVPLLLPRKCRETCKVMGYDIPKGTVVFANAWAIGRDPKYWEDPEEFKPERFDKSNVDYKGTNFEYLPFGSGRRICPGINLGLCNIELALASLLYHFDWKLPNGMEPKDIDMGEAQGLIASKKTNLTLHPVTRIAPAGFN

SEQ ID NO:19

VzCP8201的催化结构域。

WQLPLIGSLHHLLLSRFSDLPHRALREMSGTYGPLMLLRFGSVPTLVVSSAEAAREVMRTHDLAFCDRHLGVTLDIVTCGGKDIICSPYNAHWRELRKLCMVEILSQRRVLSFRSIREEEVASLVRSISDECGGGQQPVNLTEGISRMINDVAARTVVGDRCKYQDEYMHELDEVVRLAGGFNLADLYPSSRLVRRFSAAARDARRCQRNMYRIIQSIIQEREAMPTPERDEEDLLGVLLRLQREGGLQFALTNEIVSTVIYDIFSAGSETSSTVLVWAMSELVKNPQVMRKAQSEVRDTFKGNNKITESDLIKLRYLQLVIKETLRLHAPVPLLLPRECRESCQIMGYDVLKGTKVFVNAWAIARDTGLWCDGEEFRPERFESSNIDFRGNDFEFTPFGAGRRVCPGITLGLANLELALASLLYHFDWDLPNGARLEDLDMAEAFGITLKRKSMLWLKAKPYNNFIPN

SEQ ID NO:20

VzCP7186的催化结构域。

WQLPLIGSLHHLLLSRFSDLPHRALREMSGAYGPLMLLRFGAVPTLVASSAEAAREVMRTHDLAFCNRHLGVTFDTITCGGKDIIGSPYNAQWRELRKLCMLEIFSQRRVLSFRSIREEEVANLVRSISDECGGGRQPVNLTEGICRMINDVAARTAVGDRCRYRDEYMHELDEVVRLVSGFNLADLYPSSWLVRRFSAAARDARRCQRNMYRIIQSIIEEREAMPTPERDEDLLGVLLRLQKEGGLQFALTNEIVSTVIFDIFSAGSETSSTVLVWAMSELVKNPQVMHKARSEVRETFRGQDKISEDDLVKLRYLQLVIKETLRLHAPVPLLLPRECRESCQVMGYDVPKGTKVFVNVWAIARDVKLWHDAEVFKPERFESSSIDFRGNDFEFTPFGAGRRMCPGVTLGLANLELALASLLYHFDWDLPDGIGLEELDMSETSGITLRKKSMLWLKARPYNNFIPN

SEQ ID NO:21

VzCP521-11的催化结构域

WTLPVIGSLHHVITYPNLHRALHGLAQKYGPVMMFRLGEVPMMVVSSPAAAQEALKTNDIAFADRYTNATIGALTFHGEDMAFAPYGERWRQLRKICVLELLSAARVQSFRHIRAEEVSRLVGKLAASAAAGEAVHLNKIVAKFVNDTIVREAVGSGSKHQDEYLNSIDVALRQTMGVALADLFPSSRLIQMIDTAPRKVLAARNNMERILEEIINETKEAMDRGDGQKKVEGILGVLLRLQKEGSTPVPLTNEVIVTVMFDMFGAGSDTSSTLLTWCMMELVRSPPTMAKVQDEVREAFKGKKESTIITEDDLKGLTYLKQVIKEALRMHPPVPLLLPRKCRETCKVMGYDIPKGTVVFANAWAIGRDPKYWEDPEEFKPERFDKSNVDYKGTNFEYLPFGSGRRICPGINLGLCNIELALASLLYHFDWKLPNGMEPKDIDMGEAQGLIASKKTNLTLHPVTRIAPAGFN

SEQ ID NO:23

来自胡椒薄荷(Mentha piperita)(CPRm)氨基酸序列的P450还原酶

MEPSSQKLSPLEFVAAILKGDYSSGQVEGGPPPGLAAMLMENKDLVMVLTTSVAVLIGCVVVLAWRRAAGSGKYKQPELPKLVVPKAAEPEEAEDDKTKISVFFGTQTGTAEGFAKAFVEEAKARYQQARFKVIDLDDYAADDDEYEEKLKKENLAFFFLASYGDGEPTDNAARFYKWFTEGKDRGEWLNNLQYGVFGLGNRQYEHFNKIAIVVDDLIFEQGGKKLVPVGLGDDDQCIEDDFAAWRELVWPELDKLLRNEDDATVATPYSAAVLQYRVVFHDHIDGLISENGSPNGHANGNTVYDAQHPCRSNVAVKKELHTPASDRSCTHLEFNISGTGLMYETGDHVGVYCENLLETVEEAEKLLNLSPQTYFSVHTDNEDGTPLSGSSLPPPFPPCTLRTALTKYADLTSAPKKSVLVALAEYASDQGEADRLRFLASPSGKEEYAQYILASQRTLLEVMAEFPSAKPPLGVFFAGVAPRLQPRFYSISSSPKIAPFRIHVTCALVYDKSPTGRVHKGICSTWMKNAVPLEESNDCSWAPIFVRNSNFKLPTDPKVPIIMIGPGTGLAPFRGFLQERLALKESGAELGPAILFFGCRNRKMDFIYEDELNDFVKAGVVSELIVAFSREGPMKEYVQHKMSQRASDVWNIISDGGYVYVCGDAKGMARDVHRTLHTIAQEQGSMSSSEAEGMVKNLQTTGRYLRDVW

SEQ ID NO:22

来自胡椒薄荷(Mentha piperita)DNA序列的P450还原酶

ATGGAACCTAGCTCTCAGAAACTGTCTCCGTTGGAATTTGTTGCTGCTATCCTGAAGGGCGACTACAGCAGCGGTCAGGTTGAAGGTGGTCCACCGCCAGGTCTGGCAGCTATGTTGATGGAAAATAAGGATTTGGTGATGGTTCTGACGACGTCCGTGGCAGTCCTGATCGGCTGTGTCGTGGTCCTGGCATGGCGTCGTGCGGCAGGTAGCGGTAAGTACAAGCAACCTGAACTGCCTAAACTGGTGGTCCCGAAAGCAGCCGAACCGGAGGAGGCAGAGGATGATAAAACCAAGATCAGCGTGTTTTTCGGCACCCAAACCGGTACGGCAGAAGGTTTCGCGAAGGCTTTTGTTGAAGAGGCCAAGGCGCGTTATCAGCAGGCCCGTTTCAAAGTTATCGACCTGGACGACTATGCGGCAGACGATGACGAGTACGAAGAGAAACTGAAGAAGGAAAACTTGGCATTCTTCTTCTTGGCGTCCTACGGTGACGGCGAGCCGACGGACAACGCGGCACGCTTTTACAAATGGTTTACGGAGGGTAAGGACCGTGGTGAATGGCTGAACAATCTGCAGTACGGCGTTTTTGGTCTGGGTAACCGTCAATATGAGCATTTCAATAAGATCGCCATTGTCGTCGATGATCTGATCTTCGAGCAAGGTGGCAAGAAGCTGGTTCCGGTGGGTCTGGGTGACGATGACCAGTGCATTGAGGATGATTTTGCGGCGTGGCGTGAACTGGTCTGGCCGGAACTGGATAAACTGCTGCGTAACGAAGACGACGCTACCGTGGCAACCCCGTACAGCGCCGCTGTGCTGCAATACCGCGTGGTTTTCCACGATCACATTGACGGCCTGATTAGCGAAAACGGTAGCCCGAACGGTCATGCTAATGGCAATACCGTGTACGATGCGCAACACCCGTGCCGTAGCAACGTCGCGGTCAAGAAGGAATTGCATACTCCGGCGAGCGATCGCAGCTGCACCCACCTGGAATTTAACATTAGCGGTACCGGCCTGATGTACGAGACGGGTGACCACGTCGGTGTGTATTGCGAGAACCTGTTGGAAACCGTGGAGGAGGCCGAGAAGTTGTTGAACCTGAGCCCGCAGACGTACTTCTCCGTTCACACCGACAACGAGGACGGTACGCCGTTGAGCGGCAGCAGCCTGCCGCCACCGTTTCCGCCGTGCACCTTGCGCACGGCATTGACCAAATACGCAGACTTGACTTCTGCACCGAAAAAGTCGGTGCTGGTGGCGCTGGCCGAGTACGCATCTGACCAGGGTGAAGCGGATCGTTTGCGTTTCTTGGCGAGCCCGAGCGGCAAAGAGGAATATGCACAGTACATCTTGGCAAGCCAGCGCACGCTGCTGGAGGTCATGGCGGAGTTCCCGTCGGCGAAACCGCCGCTGGGTGTCTTTTTCGCGGGTGTCGCTCCGCGCCTGCAGCCGCGTTTCTATTCCATTAGCTCTAGCCCGAAGATCGCACCGTTCCGTATTCACGTGACCTGCGCCCTGGTTTATGACAAATCCCCTACCGGTCGCGTTCATAAGGGCATCTGTAGCACGTGGATGAAAAATGCGGTCCCGCTGGAAGAAAGCAACGATTGTTCCTGGGCTCCGATCTTCGTCCGCAACAGCAACTTCAAGCTGCCGACCGACCCGAAGGTTCCGATTATCATGATTGGTCCGGGTACCGGTCTGGCCCCTTTTCGTGGCTTTTTGCAAGAGCGCTTGGCGTTGAAAGAGAGCGGTGCTGAATTGGGTCCGGCGATCTTGTTCTTTGGTTGCCGTAACCGTAAAATGGACTTTATTTACGAGGATGAACTGAATGATTTCGTCAAAGCGGGCGTTGTCAGCGAGCTGATCGTCGCTTTTAGCCGCGAAGGCCCGATGAAAGAATACGTGCAACACAAAATGAGCCAACGTGCCTCCGATGTGTGGAACATCATTAGCGACGGTGGTTATGTTTATGTTTGCGGTGACGCGAAGGGTATGGCTCGTGATGTTCACCGTACCCTGCATACCATCGCACAGGAGCAAGGTAGCATGTCCAGCTCGGAGGCCGAAGGTATGGTCAAAAACCTGCAAACCACCGGTCGTTACCTGCGTGATGTGTGGTAA

SEQ ID NO:24

20个氨基酸替换肽:

MALLLAVFLGLSCLLLLSLW

SEQ ID NO:25

多接头DNA序列

GTCGACAATTAACCATGGTTAATTAAGCTTATATATGGTACCATATATGAATTCATTAATCTCGAG

SEQ ID NO:26

26bp的延伸序列

GTCGACAATTAGGTAAAAAATAAACC

SEQ ID NO:27

5’非编码序列

AAGCTTAAGGAGGTAAAAA SEQ ID NO:

SEQ ID NO:28

3’非编码序列

GGTACCATATATGAATTCATTAATCTCGAG(SEQ ID NO:

SEQ ID NO:29

引物Inf8201-7186-Fw

TAATTTTATTCCGAACTAAGTCGAAGGAGGTAATATGGCGTTGCTGTTGGCTGTTTTTCTGG

SEQ ID NO:30

引物Inf8201-7186-Rev

ATTTTTTACCTAATTGTCGACTTAGTTCGGAATAAAGTTATTGTACGGAC

SEQ ID NO:31

Vzctg306，编码VzZS1的全长cDNA，包括非编码区

gaagcaaagccatctgccgtgctatcactctagcaaattatactgagtggataaacttaataccacaccagacgttttgcattcATGGCGACGACTGCCGCCTTCTGCCTCACCACCACTCCGATCGGCGAGCCAGTCTGTCGCCGGCAGTACCTCCCAACCGTCTGGGGCAGCTTCTTCCTCACCTACCAGCCATGCACGCCGGAAGAGGTCCAGTCCATGGAGGAGAGGGCTCTGGCCAAGAAGACGGAGGTGGGGCGCATGTTGCAGGAGGTCGCCGCCTCCAGTAACCTCGCACGGAAGCTGGGCCTTGTCGATGAGCTAGAGCGGCTCGGGGTGGACTATCACTACAAGACGGAGATCAACGACTTGCTGGGTGCCATTTATAATGGCAAGGACGACGATAATGGAGGTTCTGATGACGACCTCTATATCACATCGCTTAAGTTCTATCTGCTCAGGAAGCATGGGTACGCTTTATCTTCAGATGTGTTTCTGAAGTTCAGAGATGAGCAAGGAAATATTTCAAGTGATGATGTGAAATGCCTGATCATGTTGTATGATGCCTCACATTTGAGGATTCATGAGGAGAAAATTCTTGACAACATCAACAGTTTCACCAAGAGCTGCCTCCAATCAGTTTTAGAAACAAATTTGGAACCGGCTCTCCAAGAGGAGGTGCGGTGCACATTGGAGACACCTCGATTCAGAAGGGTTGAGAGAATCGAAGCGAAACGCTTTATCTCAGCGTACGAAAAGAACATAGCACGAGATGACGCCCTACTAGAGTTTGCAAGGCTGGACTACAATATCGTGCAAATTCTCTACTGCAAGGAGCTGAAAGAACTTACAGTATGGTGGAAGGAGTTCCATTCACGGACAAATCTGACATTTGCACGAGATAGAATTGTGGAGATGTATTTCTGGGTCATGGCAATTATTTACGAGCCTTGTTACTCGTATTCACGGATATGGGTTACAAAAATGTTTCTATCCGTGGCATTGTTGGATGACATCTATGACAATTATACGAGCACAGAGGAGAGCAATATCTTTACTACGGCCATGGAAAGGTGGGATGTGAAGGCCACCGAACAACTGCCAGCAAACATGAGGACATTCTACGATTACTTAATTTGTACAACAGATGAGGTCGTAGAAGAATTGAAACTTCAGAATAATAAGAATGCTGAATTAGTCAAGAAAGTGCTGATTGACGCCGCTAAATGCTACCATTCGGAGGTCAAATGGCGTGATGACCACTACGTCCCTAATGATGTTGGAGAGCACCTGCAGCTTTCAATGCGAAGCATTGCAGCTATGCACTCCATCAACTTTGTCTTCATTTCACTGGGAGCTGTGTGTACTAGGGAGGCGGTTGAGTGTGCTTTCACTTATCCAAAAATTATTAGAGGTATATGTGTTCACGCACGTATTAGTAACGATATCGCGTCACATGAGCGAGAACAAGCTTCGGAGCATATGGCATCAACGTTGCAAACTTGCATGAAGCAGTATGGGATTACAGTAGAGGAAGCTGCTGAAAAGCTCAGAGTAATAAACGAGGAGTCATGGATGGACATCGTTGAGGAATGCCTTTATAAGGACCAGTATCCCCTGGCGCTTTCGGAGAGGGTGGTGGCTTTTGCACAATCAATATGTTTCATGTACAATGGTGTAGATAAATACACCATACCATCAAAACTCAAGGACAGTCTAGACTCATTGTACGTCAATTTGATTCCAGTTTGAcgacatcgcatcaagtattaattctaggcttaatataatgccagtaaacatcatatgtaagggatatttactttcgtgaatccaaataatttgaggggtcctgtgttcctcttaccaaggatatgtcatcaagttgaaaaatatagccagcaaaaaaaaaaaaaaaaaaaaaa

SEQ ID NO:32

VzCtg306-ORF，编码VzZS1的全长cDNA，仅开放阅读框

ATGGCGACGACTGCCGCCTTCTGCCTCACCACCACTCCGATCGGCGAGCCAGTCTGTCGCCGGCAGTACCTCCCAACCGTCTGGGGCAGCTTCTTCCTCACCTACCAGCCATGCACGCCGGAAGAGGTCCAGTCCATGGAGGAGAGGGCTCTGGCCAAGAAGACGGAGGTGGGGCGCATGTTGCAGGAGGTCGCCGCCTCCAGTAACCTCGCACGGAAGCTGGGCCTTGTCGATGAGCTAGAGCGGCTCGGGGTGGACTATCACTACAAGACGGAGATCAACGACTTGCTGGGTGCCATTTATAATGGCAAGGACGACGATAATGGAGGTTCTGATGACGACCTCTATATCACATCGCTTAAGTTCTATCTGCTCAGGAAGCATGGGTACGCTTTATCTTCAGATGTGTTTCTGAAGTTCAGAGATGAGCAAGGAAATATTTCAAGTGATGATGTGAAATGCCTGATCATGTTGTATGATGCCTCACATTTGAGGATTCATGAGGAGAAAATTCTTGACAACATCAACAGTTTCACCAAGAGCTGCCTCCAATCAGTTTTAGAAACAAATTTGGAACCGGCTCTCCAAGAGGAGGTGCGGTGCACATTGGAGACACCTCGATTCAGAAGGGTTGAGAGAATCGAAGCGAAACGCTTTATCTCAGCGTACGAAAAGAACATAGCACGAGATGACGCCCTACTAGAGTTTGCAAGGCTGGACTACAATATCGTGCAAATTCTCTACTGCAAGGAGCTGAAAGAACTTACAGTATGGTGGAAGGAGTTCCATTCACGGACAAATCTGACATTTGCACGAGATAGAATTGTGGAGATGTATTTCTGGGTCATGGCAATTATTTACGAGCCTTGTTACTCGTATTCACGGATATGGGTTACAAAAATGTTTCTATCCGTGGCATTGTTGGATGACATCTATGACAATTATACGAGCACAGAGGAGAGCAATATCTTTACTACGGCCATGGAAAGGTGGGATGTGAAGGCCACCGAACAACTGCCAGCAAACATGAGGACATTCTACGATTACTTAATTTGTACAACAGATGAGGTCGTAGAAGAATTGAAACTTCAGAATAATAAGAATGCTGAATTAGTCAAGAAAGTGCTGATTGACGCCGCTAAATGCTACCATTCGGAGGTCAAATGGCGTGATGACCACTACGTCCCTAATGATGTTGGAGAGCACCTGCAGCTTTCAATGCGAAGCATTGCAGCTATGCACTCCATCAACTTTGTCTTCATTTCACTGGGAGCTGTGTGTACTAGGGAGGCGGTTGAGTGTGCTTTCACTTATCCAAAAATTATTAGAGGTATATGTGTTCACGCACGTATTAGTAACGATATCGCGTCACATGAGCGAGAACAAGCTTCGGAGCATATGGCATCAACGTTGCAAACTTGCATGAAGCAGTATGGGATTACAGTAGAGGAAGCTGCTGAAAAGCTCAGAGTAATAAACGAGGAGTCATGGATGGACATCGTTGAGGAATGCCTTTATAAGGACCAGTATCCCCTGGCGCTTTCGGAGAGGGTGGTGGCTTTTGCACAATCAATATGTTTCATGTACAATGGTGTAGATAAATACACCATACCATCAAAACTCAAGGACAGTCTAGACTCATTGTACGTCAATTTGATTCCAGTTTGA

SEQ ID NO:33

VzZs1，氨基酸序列

MATTAAFCLTTTPIGEPVCRRQYLPTVWGSFFLTYQPCTPEEVQSMEERALAKKTEVGRMLQEVAASSNLARKLGLVDELERLGVDYHYKTEINDLLGAIYNGKDDDNGGSDDDLYITSLKFYLLRKHGYALSSDVFLKFRDEQGNISSDDVKCLIMLYDASHLRIHEEKILDNINSFTKSCLQSVLETNLEPALQEEVRCTLETPRFRRVERIEAKRFISAYEKNIARDDALLEFARLDYNIVQILYCKELKELTVWWKEFHSRTNLTFARDRIVEMYFWVMAIIYEPCYSYSRIWVTKMFLSVALLDDIYDNYTSTEESNIFTTAMERWDVKATEQLPANMRTFYDYLICTTDEVVEELKLQNNKNAELVKKVLIDAAKCYHSEVKWRDDHYVPNDVGEHLQLSMRSIAAMHSINFVFISLGAVCTREAVECAFTYPKIIRGICVHARISNDIASHEREQASEHMASTLQTCMKQYGITVEEAAEKLRVINEESWMDIVEECLYKDQYPLALSERVVAFAQSICFMYNGVDKYTIPSKLKDSLDSLYVNLIPV

SEQ ID NO:34

编码VzZS1的经密码子优化的cDNA

ATGGCCACGACCGCAGCATTCTGCCTGACCACTACCCCGATCGGCGAACCAGTATGCCGCCGTCAATACTTGCCGACCGTGTGGGGTAGCTTTTTCCTGACCTATCAGCCGTGTACCCCGGAAGAGGTGCAGAGCATGGAAGAGCGTGCGCTGGCTAAAAAGACCGAGGTGGGTCGCATGCTGCAAGAGGTCGCAGCAAGCAGCAACCTGGCACGTAAACTGGGTTTGGTCGATGAACTGGAGCGTCTGGGTGTGGATTATCACTACAAGACGGAGATCAATGACCTGCTGGGCGCCATTTACAATGGTAAGGACGATGACAACGGCGGCAGCGACGACGACCTGTATATCACCAGCCTGAAATTCTACCTGCTGCGCAAGCATGGCTATGCGTTGAGCAGCGATGTGTTCTTGAAATTCCGTGACGAACAGGGTAATATCTCTAGCGACGATGTAAAGTGCCTGATCATGCTGTACGACGCAAGCCACCTGCGCATCCACGAAGAAAAGATTCTGGATAACATTAACAGCTTTACCAAATCCTGTCTGCAAAGCGTGTTGGAAACGAATCTGGAGCCGGCACTGCAAGAAGAAGTCCGCTGCACGCTGGAAACCCCTCGCTTCCGTCGCGTTGAGCGCATCGAAGCGAAGCGTTTCATCAGCGCGTATGAGAAGAATATCGCCCGTGACGACGCGCTGCTGGAGTTTGCGCGTCTGGACTACAACATCGTTCAGATTCTGTACTGTAAAGAACTGAAAGAGCTGACGGTGTGGTGGAAAGAATTTCATAGCCGTACTAATCTGACCTTTGCCCGCGATCGTATCGTCGAGATGTATTTCTGGGTGATGGCGATCATTTATGAGCCGTGTTACAGCTACAGCCGCATCTGGGTTACGAAAATGTTCCTGTCCGTTGCACTGTTGGATGACATTTACGACAACTACACCAGCACCGAAGAGTCCAACATCTTTACGACCGCGATGGAGCGTTGGGACGTTAAGGCGACGGAGCAGCTGCCGGCGAATATGCGTACCTTTTATGATTACTTGATTTGCACGACGGATGAGGTCGTTGAAGAGCTGAAATTGCAAAACAACAAGAATGCCGAGCTGGTTAAGAAAGTTCTGATTGACGCGGCCAAATGTTACCATAGCGAGGTCAAATGGCGTGACGATCACTACGTCCCGAATGATGTCGGCGAGCACTTGCAGCTGAGCATGCGTTCTATTGCGGCTATGCACTCCATCAACTTTGTGTTCATCTCTCTGGGTGCGGTCTGTACCCGTGAGGCCGTGGAATGCGCGTTTACCTATCCGAAGATTATTCGTGGTATTTGCGTGCATGCGCGTATTTCGAACGATATTGCGAGCCATGAACGCGAGCAAGCGTCTGAACACATGGCTTCGACCCTGCAAACTTGCATGAAACAGTACGGTATTACGGTCGAAGAGGCAGCCGAGAAGTTGCGTGTTATCAATGAAGAGAGCTGGATGGATATTGTGGAAGAGTGTCTGTACAAAGACCAGTATCCGCTGGCTCTGAGCGAGCGTGTTGTTGCATTCGCGCAGAGCATTTGCTTCATGTATAATGGTGTTGATAAGTATACCATCCCGAGCAAGCTGAAGGATAGCCTGGACTCGCTGTACGTGAACCTGATTCCGGTTTAAGGTACCATATATGAATTCATTAA

SEQ ID NO:35

VzTrspt_4_contig_995，编码VzZS2的全长cDNA，包括非编码区

GCATTCATGGCGACAACTGCCGCCTTCTGCCTCACCACCACTCCGATCGGCGAGCCGGTCTGTCGCCGGCAGTACCTCCCAAGCGTCTGGGGCAACTTCTTCCTCACCTACCAGCCATGCACGCCCGAAGAGGTCCAGTCCATGGAGGAGAGGGCTCTGGCCAAGAAGACGGAGGTGGGGCGCATGTTGCAGGAGGTCGCCGCCTCCGGTGACCTCGCACGGAAGCTGGGCCTTGTCGATGAGCTAGAGCGGCTCGGGGTGGACTATCATTACAAGACGGAGATCAACGACTTGCTGGGTGCCATTTATAATGGCAAGGACGACGATAATGGAGGTTCTGATGACGACCTCTATATCACATCGCTTAAGTTCTATCTGCTCAGGAAGCATGGGTACGCTTTACCTTCAGATGTGTTTCTGAAGTTCAGAGATGAGCAAGGAAATATTTCAAGTGATGATGTGAAATGCCTGATCATGTTGTATGATGCCTCACATTTGAGGATTCATGAGGAGAAAATTCTTGACAACATCAACAGTTTCACCAAGAGCTGCCTCCAATCAGTTTTAGAAACAAATTTGGAACCGGCTCTCCAAGAGGAGGTGCGGTGCACATTGGAGACACCTCGATTCAGAAGGGTTGAGAGAATCGAAGCGAGACGGTTTATCTCAGCGTACGAAAAGAACATAGCACGAGATGACGCCCTACTAGAGTTTGCAAAGCTGGACTACAATATCGTGCAAATTCTCTACTGCAAGGAGCTGAAAGAACTTACAGTATGGTGGAAGGAGTTCCACTCACAGACAAATCTGACATTTGCACGAGATAGAATTGTGGAGATGTATTTCTGGGTCATGGCAATTATTTATGAGCCTTGTTACTCATATTCACGGATATGGGTTACAAAAATGTTTCTATCCGTGGCATTGTTGGATGACATCTATGACAATTATACGAGCACAGAGGAGAGCAATATCTTTACTACGGCCATGGAAAGGTGGGATGCGAAGGCCACTGAACAACTGCCAGCAAACATGAGGACATTCTACGATTACTTAATTTGTACAACAGATGAGGTCGTAGAAGAATTGAAACTTCAGAATAATAAGAATGCTGAATTAGTCAAGAAAGTGCTGATTGACGCTGCTAAATGCTACCATTCGGAGGTCAAATGGCGTGATGACCACTACGTCCCTAATGATGTTGGAGAGCACCTGCAGCTTTCAATGCGAAGCATTGCAGCTATGCACTCCATCAACTTTATCTTCATTTCACTGGGAGCTGTGTGTACTAGGGAGGCGGTTGAGTGTGCTTTCACTTATCCAAAAATTATTAGAGGTATATGTGTTCACGCACGTATTAGTAACGATATCGCGTCACATGAGCGAGAACAAGCTTCGGAGCATATGGCATCAACGTTGCAAACTTGCATGAAGCAGTATGGGATTACAGTAGAGGAAGCTGCTGAAAAGCTCAGAGTAATAAACGAGGAGTCATGGATGAACATCGTTGAGGAATGCCTTTATAAGGACCAGTATCCCCTGGCGCTTTCGGAGAGGGTGGTGGCCTTTGCACAATCAATATGTTTCATGTACAATGGTGTAGATAAATACACCATACCATCAAAACTCAAGGACAGTCTAGACTCATTGTACGTCAATTTGATTTCAGTTTGACGACATCGCATCAAGTATTAATTCTAGGCTTAATATAATGCCAGTAAACATCATATGTAAGGGATATTTACTTTCGTGAATCCAAATAATTTGAGAGGTCCTGTGTTCCTCTTACCAAGGATATGTCATCAAGTTGAAAAATATAGCCATCACTCTCTCGTTGCTTCATTTCAATATGAACATATATA

SEQ ID NO:36

VzTrspt_4_contig_995，编码VzZS2的全长cDNA，仅开放阅读框

ATGGCGACAACTGCCGCCTTCTGCCTCACCACCACTCCGATCGGCGAGCCGGTCTGTCGCCGGCAGTACCTCCCAAGCGTCTGGGGCAACTTCTTCCTCACCTACCAGCCATGCACGCCCGAAGAGGTCCAGTCCATGGAGGAGAGGGCTCTGGCCAAGAAGACGGAGGTGGGGCGCATGTTGCAGGAGGTCGCCGCCTCCGGTGACCTCGCACGGAAGCTGGGCCTTGTCGATGAGCTAGAGCGGCTCGGGGTGGACTATCATTACAAGACGGAGATCAACGACTTGCTGGGTGCCATTTATAATGGCAAGGACGACGATAATGGAGGTTCTGATGACGACCTCTATATCACATCGCTTAAGTTCTATCTGCTCAGGAAGCATGGGTACGCTTTACCTTCAGATGTGTTTCTGAAGTTCAGAGATGAGCAAGGAAATATTTCAAGTGATGATGTGAAATGCCTGATCATGTTGTATGATGCCTCACATTTGAGGATTCATGAGGAGAAAATTCTTGACAACATCAACAGTTTCACCAAGAGCTGCCTCCAATCAGTTTTAGAAACAAATTTGGAACCGGCTCTCCAAGAGGAGGTGCGGTGCACATTGGAGACACCTCGATTCAGAAGGGTTGAGAGAATCGAAGCGAGACGGTTTATCTCAGCGTACGAAAAGAACATAGCACGAGATGACGCCCTACTAGAGTTTGCAAAGCTGGACTACAATATCGTGCAAATTCTCTACTGCAAGGAGCTGAAAGAACTTACAGTATGGTGGAAGGAGTTCCACTCACAGACAAATCTGACATTTGCACGAGATAGAATTGTGGAGATGTATTTCTGGGTCATGGCAATTATTTATGAGCCTTGTTACTCATATTCACGGATATGGGTTACAAAAATGTTTCTATCCGTGGCATTGTTGGATGACATCTATGACAATTATACGAGCACAGAGGAGAGCAATATCTTTACTACGGCCATGGAAAGGTGGGATGCGAAGGCCACTGAACAACTGCCAGCAAACATGAGGACATTCTACGATTACTTAATTTGTACAACAGATGAGGTCGTAGAAGAATTGAAACTTCAGAATAATAAGAATGCTGAATTAGTCAAGAAAGTGCTGATTGACGCTGCTAAATGCTACCATTCGGAGGTCAAATGGCGTGATGACCACTACGTCCCTAATGATGTTGGAGAGCACCTGCAGCTTTCAATGCGAAGCATTGCAGCTATGCACTCCATCAACTTTATCTTCATTTCACTGGGAGCTGTGTGTACTAGGGAGGCGGTTGAGTGTGCTTTCACTTATCCAAAAATTATTAGAGGTATATGTGTTCACGCACGTATTAGTAACGATATCGCGTCACATGAGCGAGAACAAGCTTCGGAGCATATGGCATCAACGTTGCAAACTTGCATGAAGCAGTATGGGATTACAGTAGAGGAAGCTGCTGAAAAGCTCAGAGTAATAAACGAGGAGTCATGGATGAACATCGTTGAGGAATGCCTTTATAAGGACCAGTATCCCCTGGCGCTTTCGGAGAGGGTGGTGGCCTTTGCACAATCAATATGTTTCATGTACAATGGTGTAGATAAATACACCATACCATCAAAACTCAAGGACAGTCTAGACTCATTGTACGTCAATTTGATTTCAGTTTGA

SEQ ID NO:37

编码VzZS2的经密码子优化的cDNA

ATGGCCACGACCGCAGCATTCTGCCTGACCACTACCCCGATCGGCGAACCAGTATGCCGCCGTCAATACTTGCCGAGCGTGTGGGGTAACTTTTTCCTGACCTATCAGCCGTGTACCCCGGAAGAGGTGCAGAGCATGGAAGAGCGTGCGCTGGCTAAAAAGACCGAGGTGGGTCGCATGCTGCAAGAGGTCGCAGCAAGCGGCGATCTGGCACGTAAACTGGGTTTGGTCGATGAACTGGAGCGTCTGGGTGTGGATTATCACTACAAGACGGAGATCAATGACCTGCTGGGCGCCATTTACAATGGTAAGGACGATGACAACGGCGGCAGCGACGACGACCTGTATATCACCAGCCTGAAATTCTACCTGCTGCGCAAGCATGGCTATGCGTTGCCAAGCGATGTGTTCTTGAAATTCCGTGACGAACAGGGTAATATCTCTAGCGACGATGTAAAGTGCCTGATCATGCTGTACGACGCAAGCCACCTGCGCATCCACGAAGAAAAGATTCTGGATAACATTAACAGCTTTACCAAATCCTGTCTGCAAAGCGTGTTGGAAACGAATCTGGAGCCGGCACTGCAAGAAGAAGTCCGCTGCACGCTGGAAACCCCTCGCTTCCGTCGCGTTGAGCGCATCGAAGCGCGTCGTTTCATCAGCGCGTATGAGAAGAATATCGCCCGTGACGACGCGCTGCTGGAGTTTGCGAAACTGGACTACAACATCGTTCAGATTCTGTACTGTAAAGAACTGAAAGAGCTGACGGTGTGGTGGAAAGAATTTCATAGCCAAACTAATCTGACCTTTGCCCGCGATCGTATCGTCGAGATGTATTTCTGGGTGATGGCGATCATTTATGAGCCGTGTTACAGCTACAGCCGCATCTGGGTTACGAAAATGTTCCTGTCCGTTGCACTGTTGGATGACATTTACGACAACTACACCAGCACCGAAGAGTCCAACATCTTTACGACCGCGATGGAGCGTTGGGACGCTAAGGCGACGGAGCAGCTGCCGGCGAATATGCGTACCTTTTATGATTACTTGATTTGCACGACGGATGAGGTCGTTGAAGAGCTGAAATTGCAAAACAACAAGAATGCCGAGCTGGTTAAGAAAGTTCTGATTGACGCGGCCAAATGTTACCATAGCGAGGTCAAATGGCGTGACGATCACTACGTCCCGAATGATGTCGGCGAGCACTTGCAGCTGAGCATGCGTTCTATTGCGGCTATGCACTCCATCAACTTTATCTTCATCTCTCTGGGTGCGGTCTGTACCCGTGAGGCCGTGGAATGCGCGTTTACCTATCCGAAGATTATTCGTGGTATTTGCGTGCATGCGCGTATTTCGAACGATATTGCGAGCCATGAACGCGAGCAAGCGTCTGAACACATGGCTTCGACCCTGCAAACTTGCATGAAACAGTACGGTATTACGGTCGAAGAGGCAGCCGAGAAGTTGCGTGTTATCAATGAAGAGAGCTGGATGAACATTGTGGAAGAGTGTCTGTACAAAGACCAGTATCCGCTGGCTCTGAGCGAGCGTGTTGTTGCATTCGCGCAGAGCATTTGCTTCATGTATAATGGTGTTGATAAGTATACCATCCCGAGCAAGCTGAAGGATAGCCTGGACTCGCTGTACGTGAACCTGATTTCAGTTTAA

SEQ ID NO:38

VzZS2–氨基酸序列

MATTAAFCLTTTPIGEPVCRRQYLPSVWGNFFLTYQPCTPEEVQSMEERALAKKTEVGRMLQEVAASGDLARKLGLVDELERLGVDYHYKTEINDLLGAIYNGKDDDNGGSDDDLYITSLKFYLLRKHGYALPSDVFLKFRDEQGNISSDDVKCLIMLYDASHLRIHEEKILDNINSFTKSCLQSVLETNLEPALQEEVRCTLETPRFRRVERIEARRFISAYEKNIARDDALLEFAKLDYNIVQILYCKELKELTVWWKEFHSQTNLTFARDRIVEMYFWVMAIIYEPCYSYSRIWVTKMFLSVALLDDIYDNYTSTEESNIFTTAMERWDAKATEQLPANMRTFYDYLICTTDEVVEELKLQNNKNAELVKKVLIDAAKCYHSEVKWRDDHYVPNDVGEHLQLSMRSIAAMHSINFIFISLGAVCTREAVECAFTYPKIIRGICVHARISNDIASHEREQASEHMASTLQTCMKQYGITVEEAAEKLRVINEESWMNIVEECLYKDQYPLALSERVVAFAQSICFMYNGVDKYTIPSKLKDSLDSLYVNLISV

SEQ ID NO:39

VzTrspt_10_contig_49，编码VzZS2-Nter2的全长cDNA，包括非编码区

CTGCCGTGCTATCACTCTAGCAAATTATACTGAGTGGATCAACTTACCACACCAGACGTTTGCATTCATGGCGACAACTGCCACCTTCTGCCTCACCATCACTCCGATCGGCAAGCCGGACTGTCGCCGGAAGTACCTCCCAAGCGTCTGGGGCAACTTCTTCCTCACCTACCAGCCATGCACGCCCGAAGAGGTCCAGTCCATGGAGGAGAGGGCTCTGGCCAAGAAGACGGAGGTGGGGCGCATGTTGCAGGAGGTCGCCGCCTCCGGTGACCTCGCACGGAAGCTGGGCCTTGTCGATGAGCTAGAGCGGCTCGGGGTGGACTATCATTACAAGACGGAGATCAACGACTTGCTGGGTGCCATTTATAATGGCAAGGACGACGATAATGGAGGTTCTGATGACGACCTCTATATCACATCGCTTAAGTTCTATCTGCTCAGGAAGCATGGGTACGCTTTACCTTCAGATGTGTTTCTGAAGTTCAGAGATGAGCAAGGAAATATTTCAAGTGATGATGTGAAATGCCTGATCATGTTGTATGATGCCTCACATTTGAGGATTCATGAGGAGAAAATTCTTGACAACATCAACAGTTTCACCAAGAGCTGCCTCCAATCAGTTTTAGAAACAAATTTGGAACCGGCTCTCCAAGAGGAGGTGCGGTGCACATTGGAGACACCTCGATTCAGAAGGGTTGAGAGAATCGAAGCGAGACGGTTTATCTCAGCGTACGAAAAGAACATAGCACGAGATGACGCCCTACTAGAGTTTGCAAAGCTGGACTACAATATCGTGCAAATTCTCTACTGCAAGGAGCTGAAAGAACTTACAGTATGGTGGAAGGAGTTCCACTCACAGACAAATCTGACATTTGCACGAGATAGAATTGTGGAGATGTATTTCTGGGTCATGGCAATTATTTATGAGCCTTGTTACTCATATTCACGGATATGGGTTACAAAAATGTTTCTATCCGTGGCATTGTTGGATGACATCTATGACAATTATACGAGCACAGAGGAGAGCAATATCTTTACTACGGCCATGGAAAGGTGGGATGCGAAGGCCACTGAACAACTGCCAGCAAACATGAGGACATTCTACGATTACTTAATTTGTACAACAGATGAGGTCGTAGAAGAATTGAAACTTCAGAATAATAAGAATGCTGAATTAGTCAAGAAAGTGCTGATTGACGCTGCTAAATGCTACCATTCGGAGGTCAAATGGCGTGATGACCACTACGTCCCTAATGATGTTGGAGAGCACCTGCAGCTTTCAATGCGAAGCATTGCAGCTATGCACTCCATCAACTTTATCTTCATTTCACTGGGAGCTGTGTGTACTAGGGAGGCGGTTGAGTGTGCTTTCACTTATCCAAAAATTATTAGAGGTATATGTGTTCACGCACGTATTAGTAACGATATCGCGTCACATGAGCGAGAACAAGCTTCGGAGCATATGGCATCAACGTTGCAAACTTGCATGAAGCAGTATGGGATTACAGTAGAGGAAGCTGCTGAAAAGCTCAGAGTAATAAACGAGGAGTCATGGATGAACATCGTTGAGGAATGCCTTTATAAGGACCAGTATCCCCTGGCGCTTTCGGAGAGGGTGGTGGCCTTTGCACAATCAATATGTTTCATGTACAATGGTGTAGATAAATACACCATACCATCAAAACTCAAGGACAGTCTAGACTCATTGTACGTCAATTTGATTTCAGTTTGACGACATCGCATCAAGTATTAATTCTAGGCTT

SEQ ID NO:40

VzTrspt_10_contig_49，编码VzZS2-Nter2的全长cDNA，仅开放阅读框ATGGCGACAACTGCCACCTTCTGCCTCACCATCACTCCGATCGGCAAGCCGGACTGTCGCCGGAAGTACCTCCCAAGCGTCTGGGGCAACTTCTTCCTCACCTACCAGCCATGCACGCCCGAAGAGGTCCAGTCCATGGAGGAGAGGGCTCTGGCCAAGAAGACGGAGGTGGGGCGCATGTTGCAGGAGGTCGCCGCCTCCGGTGACCTCGCACGGAAGCTGGGCCTTGTCGATGAGCTAGAGCGGCTCGGGGTGGACTATCATTACAAGACGGAGATCAACGACTTGCTGGGTGCCATTTATAATGGCAAGGACGACGATAATGGAGGTTCTGATGACGACCTCTATATCACATCGCTTAAGTTCTATCTGCTCAGGAAGCATGGGTACGCTTTACCTTCAGATGTGTTTCTGAAGTTCAGAGATGAGCAAGGAAATATTTCAAGTGATGATGTGAAATGCCTGATCATGTTGTATGATGCCTCACATTTGAGGATTCATGAGGAGAAAATTCTTGACAACATCAACAGTTTCACCAAGAGCTGCCTCCAATCAGTTTTAGAAACAAATTTGGAACCGGCTCTCCAAGAGGAGGTGCGGTGCACATTGGAGACACCTCGATTCAGAAGGGTTGAGAGAATCGAAGCGAGACGGTTTATCTCAGCGTACGAAAAGAACATAGCACGAGATGACGCCCTACTAGAGTTTGCAAAGCTGGACTACAATATCGTGCAAATTCTCTACTGCAAGGAGCTGAAAGAACTTACAGTATGGTGGAAGGAGTTCCACTCACAGACAAATCTGACATTTGCACGAGATAGAATTGTGGAGATGTATTTCTGGGTCATGGCAATTATTTATGAGCCTTGTTACTCATATTCACGGATATGGGTTACAAAAATGTTTCTATCCGTGGCATTGTTGGATGACATCTATGACAATTATACGAGCACAGAGGAGAGCAATATCTTTACTACGGCCATGGAAAGGTGGGATGCGAAGGCCACTGAACAACTGCCAGCAAACATGAGGACATTCTACGATTACTTAATTTGTACAACAGATGAGGTCGTAGAAGAATTGAAACTTCAGAATAATAAGAATGCTGAATTAGTCAAGAAAGTGCTGATTGACGCTGCTAAATGCTACCATTCGGAGGTCAAATGGCGTGATGACCACTACGTCCCTAATGATGTTGGAGAGCACCTGCAGCTTTCAATGCGAAGCATTGCAGCTATGCACTCCATCAACTTTATCTTCATTTCACTGGGAGCTGTGTGTACTAGGGAGGCGGTTGAGTGTGCTTTCACTTATCCAAAAATTATTAGAGGTATATGTGTTCACGCACGTATTAGTAACGATATCGCGTCACATGAGCGAGAACAAGCTTCGGAGCATATGGCATCAACGTTGCAAACTTGCATGAAGCAGTATGGGATTACAGTAGAGGAAGCTGCTGAAAAGCTCAGAGTAATAAACGAGGAGTCATGGATGAACATCGTTGAGGAATGCCTTTATAAGGACCAGTATCCCCTGGCGCTTTCGGAGAGGGTGGTGGCCTTTGCACAATCAATATGTTTCATGTACAATGGTGTAGATAAATACACCATACCATCAAAACTCAAGGACAGTCTAGACTCATTGTACGTCAATTTGATTTCAGTTTG

SEQ ID NO:41

编码VzZS2-Nter2 SR opt的经密码子优化的cDNA

ATGGCTACGACCGCAACTTTCTGTCTGACTATTACGCCTATCGGTAAACCAGATTGTCGCCGTAAGTATTTACCGAGCGTGTGGGGTAACTTCTTCCTGACTTATCAGCCGTGCACCCCGGAAGAGGTGCAGAGCATGGAGGAACGCGCGCTGGCAAAGAAAACCGAGGTTGGCCGTATGCTGCAGGAAGTGGCAGCTAGCGGTGATCTGGCACGTAAACTGGGCCTGGTAGATGAACTGGAGCGTCTGGGTGTTGACTATCACTATAAGACCGAAATCAATGACTTACTGGGTGCGATTTATAACGGCAAAGACGATGACAACGGCGGCTCTGACGATGACTTGTACATTACGTCGCTGAAATTCTACCTGTTGCGCAAACACGGTTACGCGTTGCCGTCCGATGTTTTTCTGAAGTTCCGTGATGAACAGGGTAATATTTCTAGCGATGACGTTAAATGTCTGATCATGCTGTATGATGCATCCCATCTGCGCATTCACGAAGAAAAGATCCTGGATAACATTAACAGCTTTACCAAAAGCTGTCTGCAAAGCGTGCTGGAAACGAATCTGGAGCCGGCACTGCAAGAAGAGGTGCGTTGCACGCTGGAAACCCCGCGTTTTCGTCGCGTTGAGCGCATCGAAGCGCGTCGTTTCATCAGCGCCTATGAGAAGAACATTGCGCGTGATGACGCACTGCTGGAATTTGCGAAATTGGATTACAATATTGTCCAAATCCTGTACTGCAAAGAACTGAAAGAACTGACCGTCTGGTGGAAAGAGTTCCACAGCCAGACTAACCTGACCTTCGCTCGCGACCGTATCGTCGAGATGTATTTTTGGGTCATGGCCATTATCTACGAGCCGTGCTACAGCTACAGCCGTATCTGGGTCACCAAAATGTTCCTGTCTGTCGCGCTGCTGGATGATATTTACGACAACTATACCAGCACCGAAGAGTCCAACATCTTCACGACCGCGATGGAACGTTGGGACGCGAAGGCAACCGAGCAACTGCCGGCCAATATGCGCACCTTCTACGATTATTTGATTTGTACCACCGACGAAGTTGTCGAAGAACTGAAGTTGCAGAACAATAAAAATGCCGAATTGGTTAAAAAAGTGCTGATTGATGCCGCCAAGTGCTACCATAGCGAAGTTAAGTGGCGTGATGATCATTATGTTCCGAATGACGTCGGCGAGCATTTGCAACTGTCCATGCGCAGCATCGCGGCGATGCACAGCATTAACTTTATCTTTATCAGCCTGGGCGCTGTCTGCACGCGTGAAGCTGTTGAGTGCGCGTTTACCTATCCAAAGATTATTCGTGGTATCTGCGTTCACGCGCGTATTTCGAATGACATCGCAAGCCATGAGCGTGAGCAAGCGAGCGAGCACATGGCATCTACGCTGCAGACGTGTATGAAACAGTACGGTATTACGGTTGAAGAGGCCGCGGAAAAGCTGCGCGTGATCAACGAAGAGAGCTGGATGAATATCGTTGAGGAATGCCTGTATAAAGACCAGTACCCGCTGGCGCTGAGCGAGCGCGTGGTGGCGTTTGCCCAGAGCATTTGTTTTATGTACAATGGTGTGGACAAGTACACCATTCCGTCCAAGCTGAAAGACAGCCTGGATAGCCTGTACGTGAACCTGATCTCAGTGTAA

SEQ ID NO:42

VzZS2-Nter2–氨基酸序列

MATTATFCLTITPIGKPDCRRKYLPSVWGNFFLTYQPCTPEEVQSMEERALAKKTEVGRMLQEVAASGDLARKLGLVDELERLGVDYHYKTEINDLLGAIYNGKDDDNGGSDDDLYITSLKFYLLRKHGYALPSDVFLKFRDEQGNISSDDVKCLIMLYDASHLRIHEEKILDNINSFTKSCLQSVLETNLEPALQEEVRCTLETPRFRRVERIEARRFISAYEKNIARDDALLEFAKLDYNIVQILYCKELKELTVWWKEFHSQTNLTFARDRIVEMYFWVMAIIYEPCYSYSRIWVTKMFLSVALLDDIYDNYTSTEESNIFTTAMERWDAKATEQLPANMRTFYDYLICTTDEVVEELKLQNNKNAELVKKVLIDAAKCYHSEVKWRDDHYVPNDVGEHLQLSMRSIAAMHSINFIFISLGAVCTREAVECAFTYPKIIRGICVHARISNDIASHEREQASEHMASTLQTCMKQYGITVEEAAEKLRVINEESWMNIVEECLYKDQYPLALSERVVAFAQSICFMYNGVDKYTIPSKLKDSLDSLYVNLISV

SEQ ID NO:43

用于LEU2标记PCR的引物

AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCGCGCCATTCGACTACGTCGTAAGGCC

SEQ ID NO:44

用于LEU2标记PCR的引物

TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTTGCTGACCATCGACGGTCGAGGAGAACTT

SEQ ID NO:45

用于AmpR，大肠杆菌标记PCR的引物

TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG

SEQ ID NO:46

用于AmpR，大肠杆菌标记PCR的引物

AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACTTTGCCAATGCCAAAAATGTGCGCGGAACCCCTA

SEQ ID NO:47

用于酵母复制起点PCR的引物

TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGGTACGCGTTCCTGAACGAAGCATCTGTGCTTCA

SEQ ID NO:48

用于酵母复制起点PCR的引物

CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT

SEQ ID NO:49

用于大肠杆菌复制起点PCR的引物

ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG

SEQ ID NO:50

用于大肠杆菌复制起点PCR的引物

CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA

SEQ ID NO:51

为酿酒酵母而密码子优化的VzZS1 DNA。

ATGGCTACTACTGCTGCTTTCTGTTTGACTACTACTCCAATCGGTGAACCAGTTTGTAGAAGACAATACTTGCCAACTGTTTGGGGTTCTTTCTTCTTGACTTACCAACCATGTACTCCAGAAGAAGTTCAATCTATGGAAGAAAGAGCTTTGGCTAAGAAGACTGAAGTTGGTAGAATGTTGCAAGAAGTTGCTGCTTCTTCTAACTTGGCTAGAAAGTTGGGTTTGGTTGACGAATTGGAAAGATTGGGTGTTGACTACCACTACAAGACTGAAATCAACGACTTGTTGGGTGCTATCTACAACGGTAAGGACGACGACAACGGTGGTTCTGACGACGACTTGTACATCACTTCTTTGAAGTTCTACTTGTTGAGAAAGCACGGTTACGCTTTGTCTTCTGACGTTTTCTTGAAGTTCAGAGACGAACAAGGTAACATCTCTTCTGACGACGTTAAGTGTTTGATCATGTTGTACGACGCTTCTCACTTGAGAATCCACGAAGAAAAGATCTTGGACAACATCAACTCTTTCACTAAGTCTTGTTTGCAATCTGTTTTGGAAACTAACTTGGAACCAGCTTTGCAAGAAGAAGTTAGATGTACTTTGGAAACTCCAAGATTCAGAAGAGTTGAAAGAATCGAAGCTAAGAGATTCATCTCTGCTTACGAAAAGAACATCGCTAGAGACGACGCTTTGTTGGAATTCGCTAGATTGGACTACAACATCGTTCAAATCTTGTACTGTAAGGAATTGAAGGAATTGACTGTTTGGTGGAAGGAATTCCACTCTAGAACTAACTTGACTTTCGCTAGAGACAGAATCGTTGAAATGTACTTCTGGGTTATGGCTATCATCTACGAACCATGTTACTCTTACTCTAGAATCTGGGTTACTAAGATGTTCTTGTCTGTTGCTTTGTTGGACGACATCTACGACAACTACACTTCTACTGAAGAATCTAACATCTTCACTACTGCTATGGAAAGATGGGACGTTAAGGCTACTGAACAATTGCCAGCTAACATGAGAACTTTCTACGACTACTTGATCTGTACTACTGACGAAGTTGTTGAAGAATTGAAGTTGCAAAACAACAAGAACGCTGAATTGGTTAAGAAGGTTTTGATCGACGCTGCTAAGTGTTACCACTCTGAAGTTAAGTGGAGAGACGACCACTACGTTCCAAACGACGTTGGTGAACACTTGCAATTGTCTATGAGATCTATCGCTGCTATGCACTCTATCAACTTCGTTTTCATCTCTTTGGGTGCTGTTTGTACTAGAGAAGCTGTTGAATGTGCTTTCACTTACCCAAAGATCATCAGAGGTATCTGTGTTCACGCTAGAATCTCTAACGACATCGCTTCTCACGAAAGAGAACAAGCTTCTGAACACATGGCTTCTACTTTGCAAACTTGTATGAAGCAATACGGTATCACTGTTGAAGAAGCTGCTGAAAAGTTGAGAGTTATCAACGAAGAATCTTGGATGGACATCGTTGAAGAATGTTTGTACAAGGACCAATACCCATTGGCTTTGTCTGAAAGAGTTGTTGCTTTCGCTCAATCTATCTGTTTCATGTACAACGGTGTTGACAAGTACACTATCCCATCTAAGTTGAAGGACTCTTTGGACTCTTTGTACGTTAACTTGATCCCAGTTTAA

SEQ ID NO:52

为酿酒酵母而密码子优化的VzZS2 DNA。

ATGGCTACTACTGCTGCTTTCTGTTTGACTACTACTCCAATCGGTGAACCAGTTTGTAGAAGACAATACTTGCCATCTGTTTGGGGTAACTTCTTCTTGACTTACCAACCATGTACTCCAGAAGAAGTTCAATCTATGGAAGAAAGAGCTTTGGCTAAGAAGACTGAAGTTGGTAGAATGTTGCAAGAAGTTGCTGCTTCTGGTGACTTGGCTAGAAAGTTGGGTTTGGTTGACGAATTGGAAAGATTGGGTGTTGACTACCACTACAAGACTGAAATCAACGACTTGTTGGGTGCTATCTACAACGGTAAGGACGACGACAACGGTGGTTCTGACGACGACTTGTACATCACTTCTTTGAAGTTCTACTTGTTGAGAAAGCACGGTTACGCTTTGCCATCTGACGTTTTCTTGAAGTTCAGAGACGAACAAGGTAACATCTCTTCTGACGACGTTAAGTGTTTGATCATGTTGTACGACGCTTCTCACTTGAGAATCCACGAAGAAAAGATCTTGGACAACATCAACTCTTTCACTAAGTCTTGTTTGCAATCTGTTTTGGAAACTAACTTGGAACCAGCTTTGCAAGAAGAAGTTAGATGTACTTTGGAAACTCCAAGATTCAGAAGAGTTGAAAGAATCGAAGCTAGAAGATTCATCTCTGCTTACGAAAAGAACATCGCTAGAGACGACGCTTTGTTGGAATTCGCTAAGTTGGACTACAACATCGTTCAAATCTTGTACTGTAAGGAATTGAAGGAATTGACTGTTTGGTGGAAGGAATTCCACTCTCAAACTAACTTGACTTTCGCTAGAGACAGAATCGTTGAAATGTACTTCTGGGTTATGGCTATCATCTACGAACCATGTTACTCTTACTCTAGAATCTGGGTTACTAAGATGTTCTTGTCTGTTGCTTTGTTGGACGACATCTACGACAACTACACTTCTACTGAAGAATCTAACATCTTCACTACTGCTATGGAAAGATGGGACGCTAAGGCTACTGAACAATTGCCAGCTAACATGAGAACTTTCTACGACTACTTGATCTGTACTACTGACGAAGTTGTTGAAGAATTGAAGTTGCAAAACAACAAGAACGCTGAATTGGTTAAGAAGGTTTTGATCGACGCTGCTAAGTGTTACCACTCTGAAGTTAAGTGGAGAGACGACCACTACGTTCCAAACGACGTTGGTGAACACTTGCAATTGTCTATGAGATCTATCGCTGCTATGCACTCTATCAACTTCATCTTCATCTCTTTGGGTGCTGTTTGTACTAGAGAAGCTGTTGAATGTGCTTTCACTTACCCAAAGATCATCAGAGGTATCTGTGTTCACGCTAGAATCTCTAACGACATCGCTTCTCACGAAAGAGAACAAGCTTCTGAACACATGGCTTCTACTTTGCAAACTTGTATGAAGCAATACGGTATCACTGTTGAAGAAGCTGCTGAAAAGTTGAGAGTTATCAACGAAGAATCTTGGATGAACATCGTTGAAGAATGTTTGTACAAGGACCAATACCCATTGGCTTTGTCTGAAAGAGTTGTTGCTTTCGCTCAATCTATCTGTTTCATGTACAACGGTGTTGACAAGTACACTATCCCATCTAAGTTGAAGGACTCTTTGGACTCTTTGTACGTTAACTTGATCTCTGTTTAA

SEQ ID NO:53

为酿酒酵母而密码子优化的VzZS2-Nter2 DNA。

ATGGCTACTACTGCTACTTTCTGTTTGACTATCACTCCAATCGGTAAGCCAGACTGTAGAAGAAAGTACTTGCCATCTGTTTGGGGTAACTTCTTCTTGACTTACCAACCATGTACTCCAGAAGAAGTTCAATCTATGGAAGAAAGAGCTTTGGCTAAGAAGACTGAAGTTGGTAGAATGTTGCAAGAAGTTGCTGCTTCTGGTGACTTGGCTAGAAAGTTGGGTTTGGTTGACGAATTGGAAAGATTGGGTGTTGACTACCACTACAAGACTGAAATCAACGACTTGTTGGGTGCTATCTACAACGGTAAGGACGACGACAACGGTGGTTCTGACGACGACTTGTACATCACTTCTTTGAAGTTCTACTTGTTGAGAAAGCACGGTTACGCTTTGCCATCTGACGTTTTCTTGAAGTTCAGAGACGAACAAGGTAACATCTCTTCTGACGACGTTAAGTGTTTGATCATGTTGTACGACGCTTCTCACTTGAGAATCCACGAAGAAAAGATCTTGGACAACATCAACTCTTTCACTAAGTCTTGTTTGCAATCTGTTTTGGAAACTAACTTGGAACCAGCTTTGCAAGAAGAAGTTAGATGTACTTTGGAAACTCCAAGATTCAGAAGAGTTGAAAGAATCGAAGCTAGAAGATTCATCTCTGCTTACGAAAAGAACATCGCTAGAGACGACGCTTTGTTGGAATTCGCTAAGTTGGACTACAACATCGTTCAAATCTTGTACTGTAAGGAATTGAAGGAATTGACTGTTTGGTGGAAGGAATTCCACTCTCAAACTAACTTGACTTTCGCTAGAGACAGAATCGTTGAAATGTACTTCTGGGTTATGGCTATCATCTACGAACCATGTTACTCTTACTCTAGAATCTGGGTTACTAAGATGTTCTTGTCTGTTGCTTTGTTGGACGACATCTACGACAACTACACTTCTACTGAAGAATCTAACATCTTCACTACTGCTATGGAAAGATGGGACGCTAAGGCTACTGAACAATTGCCAGCTAACATGAGAACTTTCTACGACTACTTGATCTGTACTACTGACGAAGTTGTTGAAGAATTGAAGTTGCAAAACAACAAGAACGCTGAATTGGTTAAGAAGGTTTTGATCGACGCTGCTAAGTGTTACCACTCTGAAGTTAAGTGGAGAGACGACCACTACGTTCCAAACGACGTTGGTGAACACTTGCAATTGTCTATGAGATCTATCGCTGCTATGCACTCTATCAACTTCATCTTCATCTCTTTGGGTGCTGTTTGTACTAGAGAAGCTGTTGAATGTGCTTTCACTTACCCAAAGATCATCAGAGGTATCTGTGTTCACGCTAGAATCTCTAACGACATCGCTTCTCACGAAAGAGAACAAGCTTCTGAACACATGGCTTCTACTTTGCAAACTTGTATGAAGCAATACGGTATCACTGTTGAAGAAGCTGCTGAAAAGTTGAGAGTTATCAACGAAGAATCTTGGATGAACATCGTTGAAGAATGTTTGTACAAGGACCAATACCCATTGGCTTTGTCTGAAAGAGTTGTTGCTTTCGCTCAATCTATCTGTTTCATGTACAACGGTGTTGACAAGTACACTATCCCATCTAAGTTGAAGGACTCTTTGGACTCTTTGTACGTTAACTTGATCTCTGTTTAA

SEQ ID NO:54

为酿酒酵母而密码子优化的VzCP521-11DNA。

ATGGAAGACACTAAGATCTTGGTTGCTGCTGTTTCTGTTTGTGTTTTGTTGGTTGTTTTGTCTAAGTTGAAGAAGTCTTTGTTGCCAGGTGCTAAGCCAAAGTTGAACTTGCCACCAGGTCCATGGACTTTGCCAGTTATCGGTTCTTTGCACCACGTTATCACTTACCCAAACTTGCACAGAGCTTTGCACGGTTTGGCTCAAAAGTACGGTCCAGTTATGATGTTCAGATTGGGTGAAGTTCCAATGATGGTTGTTTCTTCTCCAGCTGCTGCTCAAGAAGCTTTGAAGACTAACGACATCGCTTTCGCTGACAGATACACTAACGCTACTATCGGTGCTTTGACTTTCCACGGTGAAGACATGGCTTTCGCTCCATACGGTGAAAGATGGAGACAATTGAGAAAGATCTGTGTTTTGGAATTGTTGTCTGCTGCTAGAGTTCAATCTTTCAGACACATCAGAGCTGAAGAAGTTTCTAGATTGGTTGGTAAGTTGGCTGCTTCTGCTGCTGCTGGTGAAGCTGTTCACTTGAACAAGATCGTTGCTAAGTTCGTTAACGACACTATCGTTAGAGAAGCTGTTGGTTCTGGTTCTAAGCACCAAGACGAATACTTGAACTCTATCGACGTTGCTTTGAGACAAACTATGGGTGTTGCTTTGGCTGACTTGTTCCCATCTTCTAGATTGATCCAAATGATCGACACTGCTCCAAGAAAGGTTTTGGCTGCTAGAAACAACATGGAAAGAATCTTGGAAGAAATCATCAACGAAACTAAGGAAGCTATGGACAGAGGTGACGGTCAAAAGAAGGTTGAAGGTATCTTGGGTGTTTTGTTGAGATTGCAAAAGGAAGGTTCTACTCCAGTTCCATTGACTAACGAAGTTATCGTTACTGTTATGTTCGACATGTTCGGTGCTGGTTCTGACACTTCTTCTACTTTGTTGACTTGGTGTATGATGGAATTGGTTAGATCTCCACCAACTATGGCTAAGGTTCAAGACGAAGTTAGAGAAGCTTTCAAGGGTAAGAAGGAATCTACTATCATCACTGAAGACGACTTGAAGGGTTTGACTTACTTGAAGCAAGTTATCAAGGAAGCTTTGAGAATGCACCCACCAGTTCCATTGTTGTTGCCAAGAAAGTGTAGAGAAACTTGTAAGGTTATGGGTTACGACATCCCAAAGGGTACTGTTGTTTTCGCTAACGCTTGGGCTATCGGTAGAGACCCAAAGTACTGGGAAGACCCAGAAGAATTCAAGCCAGAAAGATTCGACAAGTCTAACGTTGACTACAAGGGTACTAACTTCGAATACTTGCCATTCGGTTCTGGTAGAAGAATCTGTCCAGGTATCAACTTGGGTTTGTGTAACATCGAATTGGCTTTGGCTTCTTTGTTGTACCACTTCGACTGGAAGTTGCCAAACGGTATGGAACCAAAGGACATCGACATGGGTGAAGCTCAAGGTTTGATCGCTTCTAAGAAGACTAACTTGACTTTGCACCCAGTTACTAGAATCGCTCCAGCTGGTTTCAACTAA

SEQ ID NO:55

为酿酒酵母而密码子优化的VzCP8201 DNA。

ATGGACTTCTTGAGAATCCCATTCTTGGTTGCTTTCGTTTTCTTGGCTGTTTTGTTGAGATTGATCAGATCTTACATCACTTCTTCTGCTTTGAGATTGCCACCAGGTCCATGGCAATTGCCATTGATCGGTTCTTTGCACCACTTGTTGTTGTCTAGATTCTCTGACTTGCCACACAGAGCTTTGAGAGAAATGTCTGGTACTTACGGTCCATTGATGTTGTTGAGATTCGGTTCTGTTCCAACTTTGGTTGTTTCTTCTGCTGAAGCTGCTAGAGAAGTTATGAGAACTCACGACTTGGCTTTCTGTGACAGACACTTGGGTGTTACTTTGGACATCGTTACTTGTGGTGGTAAGGACATCATCTGTTCTCCATACAACGCTCACTGGAGAGAATTGAGAAAGTTGTGTATGGTTGAAATCTTGTCTCAAAGAAGAGTTTTGTCTTTCAGATCTATCAGAGAAGAAGAAGTTGCTTCTTTGGTTAGATCTATCTCTGACGAATGTGGTGGTGGTCAACAACCAGTTAACTTGACTGAAGGTATCTCTAGAATGATCAACGACGTTGCTGCTAGAACTGTTGTTGGTGACAGATGTAAGTACCAAGACGAATACATGCACGAATTGGACGAAGTTGTTAGATTGGCTGGTGGTTTCAACTTGGCTGACTTGTACCCATCTTCTAGATTGGTTAGAAGATTCTCTGCTGCTGCTAGAGACGCTAGAAGATGTCAAAGAAACATGTACAGAATCATCCAATCTATCATCCAAGAAAGAGAAGCTATGCCAACTCCAGAAAGAGACGAAGAAGACTTGTTGGGTGTTTTGTTGAGATTGCAAAGAGAAGGTGGTTTGCAATTCGCTTTGACTAACGAAATCGTTTCTACTGTTATCTACGACATCTTCTCTGCTGGTTCTGAAACTTCTTCTACTGTTTTGGTTTGGGCTATGTCTGAATTGGTTAAGAACCCACAAGTTATGAGAAAGGCTCAATCTGAAGTTAGAGACACTTTCAAGGGTAACAACAAGATCACTGAATCTGACTTGATCAAGTTGAGATACTTGCAATTGGTTATCAAGGAAACTTTGAGATTGCACGCTCCAGTTCCATTGTTGTTGCCAAGAGAATGTAGAGAATCTTGTCAAATCATGGGTTACGACGTTTTGAAGGGTACTAAGGTTTTCGTTAACGCTTGGGCTATCGCTAGAGACACTGGTTTGTGGTGTGACGGTGAAGAATTCAGACCAGAAAGATTCGAATCTTCTAACATCGACTTCAGAGGTAACGACTTCGAATTCACTCCATTCGGTGCTGGTAGAAGAGTTTGTCCAGGTATCACTTTGGGTTTGGCTAACTTGGAATTGGCTTTGGCTTCTTTGTTGTACCACTTCGACTGGGACTTGCCAAACGGTGCTAGATTGGAAGACTTGGACATGGCTGAAGCTTTCGGTATCACTTTGAAGAGAAAGTCTATGTTGTGGTTGAAGGCTAAGCCATACAACAACTTCATCCCAAACTAA。

序列表

<110> Firmenich SA

Schalk, Michel

Rocci, Letizia

Deguerry, Fabienne

<120> 细胞色素P450单加氧酶催化的倍半萜的氧化

<130> 10660/WO

<150> EP18152363.0

<151> 2018-01-18

<160> 55

<170> PatentIn version 3.5

<210> 1

<211> 1835

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTps1718野生型cDNA

<400> 1

actggagttc agacgtgtgc tcttccgatc tatcggagtg aagttgagca gctaacttca 60

cgactcgttt gcaggctagc tcgcaacaga atagagagtg ttactgctgg tatatatata 120

tatatatata tggctgcgag cattactgtc gccgccgcac atgggcctcc tgctgcaatc 180

ccagagacca aacgcagcac tgtagacgac gttcctttcc aatcctctgt gtggggcgac 240

tactttgtaa actacacacc tcctgcatca cagaggtcgg aggaatggat gagggagagg 300

gttgatgaac tcaggggtga agtgcgccgg aagttcaaaa cgacgatgag catggccgag 360

acgatggtgc tggtggacac actggagcgc ctcgccatcg acggccattt ccgcaaggat 420

attgacttgg cgttgagcca aatccacatg gaggggaagc cggccggtat tagcagctcc 480

aacaagcttt acatcgtcgc cctgggattc cgcttgctta ggcaacatgg cttctgggta 540

tccgcagacg tgtttgacaa gtttagggat agcacgggca agcttagcaa gggtctgagc 600

ggcgacgtga agggtctgct gagcctatac aacgcggctc acatggcggt tcccggcgag 660

aaaagcctgg acgaagccat cgacttcaca aggcgctgcc tcgagtctgc caaggacagg 720

ctcgtggcgc cgatgtcggt gcaggtgtcg cgcgccctca gcattcctct cccccgctac 780

ctgccgcggc tagaggccat gcactacatc tcagagtatg ggcaggagga ggaccatgac 840

gccaagatcc tggagcttgc gaggctggac tatgcccttg tccagtctct ctatctcaag 900

gagctcaggg agctcacctt gtggtggaag gagctgtatc acagcgtgaa tctgcccaac 960

acacgggacc gcatcgtgga gatgtacttc tttgcatttg gtatgctgca gacggaggag 1020

tactctcggg cgcgcctgat tgatagcaag ataattgcac tggtcagcct gatggatgac 1080

atttacgacg aacacgctag ctttgaggaa gcccaaaaat tcaatgaagc catacagaga 1140

tggaatgaaa gtgcggtctc agacctacca gaatacatgc gcatgctata cacccaaata 1200

ctaagcacct tcgccaaatt tgaggaagtt ttggggccca acgaaaagta ccgcgtgtct 1260

tacgccaaag aggcgtacaa attgcagtcg atgtattact ttctggagaa caaatggtgt 1320

cacgagaacc acatgccaag cttcggagag cacatacatc tttcttccat gtcggcaggc 1380

ttgcaggtgt tgatcgttgg ggcatggata ggcgcccacc acgccattgc caaggagtca 1440

ctagagtggg caatcaccta ccctgaagtc ttccgggcag caggagatgt tggccgtctc 1500

ctcaacgata tcgcttcatt taagaagagg aaaaacagca aggacgcgcc caacgcgctg 1560

gagtgctacg tcagagaaca tggcgtcacg ggggaggaag ctgcggccgc gtgtgcagcc 1620

attgtagagc tcgggtggag gaagatcaac agggcccgta tggagataca tcctatgctg 1680

gtacccgcgg cacaaatgga tgcgaaaatc aacctgacca gggtgtgcga gattttatac 1740

taccgtggta tggatggcta cacctttgga agcgacctcc gggatgtcat cacttctctc 1800

ttcatcaagc cggcggccgg gggccctgca taatt 1835

<210> 2

<211> 1704

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTps1718野生型cDNA (开放阅读框序列)

<220>

<221> CDS

<222> (1)..(1704)

<400> 2

atg gct gcg agc att act gtc gcc gcc gca cat ggg cct cct gct gca 48

Met Ala Ala Ser Ile Thr Val Ala Ala Ala His Gly Pro Pro Ala Ala

1 5 10 15

atc cca gag acc aaa cgc agc act gta gac gac gtt cct ttc caa tcc 96

Ile Pro Glu Thr Lys Arg Ser Thr Val Asp Asp Val Pro Phe Gln Ser

20 25 30

tct gtg tgg ggc gac tac ttt gta aac tac aca cct cct gca tca cag 144

Ser Val Trp Gly Asp Tyr Phe Val Asn Tyr Thr Pro Pro Ala Ser Gln

35 40 45

agg tcg gag gaa tgg atg agg gag agg gtt gat gaa ctc agg ggt gaa 192

Arg Ser Glu Glu Trp Met Arg Glu Arg Val Asp Glu Leu Arg Gly Glu

50 55 60

gtg cgc cgg aag ttc aaa acg acg atg agc atg gcc gag acg atg gtg 240

Val Arg Arg Lys Phe Lys Thr Thr Met Ser Met Ala Glu Thr Met Val

65 70 75 80

ctg gtg gac aca ctg gag cgc ctc gcc atc gac ggc cat ttc cgc aag 288

Leu Val Asp Thr Leu Glu Arg Leu Ala Ile Asp Gly His Phe Arg Lys

85 90 95

gat att gac ttg gcg ttg agc caa atc cac atg gag ggg aag ccg gcc 336

Asp Ile Asp Leu Ala Leu Ser Gln Ile His Met Glu Gly Lys Pro Ala

100 105 110

ggt att agc agc tcc aac aag ctt tac atc gtc gcc ctg gga ttc cgc 384

Gly Ile Ser Ser Ser Asn Lys Leu Tyr Ile Val Ala Leu Gly Phe Arg

115 120 125

ttg ctt agg caa cat ggc ttc tgg gta tcc gca gac gtg ttt gac aag 432

Leu Leu Arg Gln His Gly Phe Trp Val Ser Ala Asp Val Phe Asp Lys

130 135 140

ttt agg gat agc acg ggc aag ctt agc aag ggt ctg agc ggc gac gtg 480

Phe Arg Asp Ser Thr Gly Lys Leu Ser Lys Gly Leu Ser Gly Asp Val

145 150 155 160

aag ggt ctg ctg agc cta tac aac gcg gct cac atg gcg gtt ccc ggc 528

Lys Gly Leu Leu Ser Leu Tyr Asn Ala Ala His Met Ala Val Pro Gly

165 170 175

gag aaa agc ctg gac gaa gcc atc gac ttc aca agg cgc tgc ctc gag 576

Glu Lys Ser Leu Asp Glu Ala Ile Asp Phe Thr Arg Arg Cys Leu Glu

180 185 190

tct gcc aag gac agg ctc gtg gcg ccg atg tcg gtg cag gtg tcg cgc 624

Ser Ala Lys Asp Arg Leu Val Ala Pro Met Ser Val Gln Val Ser Arg

195 200 205

gcc ctc agc att cct ctc ccc cgc tac ctg ccg cgg cta gag gcc atg 672

Ala Leu Ser Ile Pro Leu Pro Arg Tyr Leu Pro Arg Leu Glu Ala Met

210 215 220

cac tac atc tca gag tat ggg cag gag gag gac cat gac gcc aag atc 720

His Tyr Ile Ser Glu Tyr Gly Gln Glu Glu Asp His Asp Ala Lys Ile

225 230 235 240

ctg gag ctt gcg agg ctg gac tat gcc ctt gtc cag tct ctc tat ctc 768

Leu Glu Leu Ala Arg Leu Asp Tyr Ala Leu Val Gln Ser Leu Tyr Leu

245 250 255

aag gag ctc agg gag ctc acc ttg tgg tgg aag gag ctg tat cac agc 816

Lys Glu Leu Arg Glu Leu Thr Leu Trp Trp Lys Glu Leu Tyr His Ser

260 265 270

gtg aat ctg ccc aac aca cgg gac cgc atc gtg gag atg tac ttc ttt 864

Val Asn Leu Pro Asn Thr Arg Asp Arg Ile Val Glu Met Tyr Phe Phe

275 280 285

gca ttt ggt atg ctg cag acg gag gag tac tct cgg gcg cgc ctg att 912

Ala Phe Gly Met Leu Gln Thr Glu Glu Tyr Ser Arg Ala Arg Leu Ile

290 295 300

gat agc aag ata att gca ctg gtc agc ctg atg gat gac att tac gac 960

Asp Ser Lys Ile Ile Ala Leu Val Ser Leu Met Asp Asp Ile Tyr Asp

305 310 315 320

gaa cac gct agc ttt gag gaa gcc caa aaa ttc aat gaa gcc ata cag 1008

Glu His Ala Ser Phe Glu Glu Ala Gln Lys Phe Asn Glu Ala Ile Gln

325 330 335

aga tgg aat gaa agt gcg gtc tca gac cta cca gaa tac atg cgc atg 1056

Arg Trp Asn Glu Ser Ala Val Ser Asp Leu Pro Glu Tyr Met Arg Met

340 345 350

cta tac acc caa ata cta agc acc ttc gcc aaa ttt gag gaa gtt ttg 1104

Leu Tyr Thr Gln Ile Leu Ser Thr Phe Ala Lys Phe Glu Glu Val Leu

355 360 365

ggg ccc aac gaa aag tac cgc gtg tct tac gcc aaa gag gcg tac aaa 1152

Gly Pro Asn Glu Lys Tyr Arg Val Ser Tyr Ala Lys Glu Ala Tyr Lys

370 375 380

ttg cag tcg atg tat tac ttt ctg gag aac aaa tgg tgt cac gag aac 1200

Leu Gln Ser Met Tyr Tyr Phe Leu Glu Asn Lys Trp Cys His Glu Asn

385 390 395 400

cac atg cca agc ttc gga gag cac ata cat ctt tct tcc atg tcg gca 1248

His Met Pro Ser Phe Gly Glu His Ile His Leu Ser Ser Met Ser Ala

405 410 415

ggc ttg cag gtg ttg atc gtt ggg gca tgg ata ggc gcc cac cac gcc 1296

Gly Leu Gln Val Leu Ile Val Gly Ala Trp Ile Gly Ala His His Ala

420 425 430

att gcc aag gag tca cta gag tgg gca atc acc tac cct gaa gtc ttc 1344

Ile Ala Lys Glu Ser Leu Glu Trp Ala Ile Thr Tyr Pro Glu Val Phe

435 440 445

cgg gca gca gga gat gtt ggc cgt ctc ctc aac gat atc gct tca ttt 1392

Arg Ala Ala Gly Asp Val Gly Arg Leu Leu Asn Asp Ile Ala Ser Phe

450 455 460

aag aag agg aaa aac agc aag gac gcg ccc aac gcg ctg gag tgc tac 1440

Lys Lys Arg Lys Asn Ser Lys Asp Ala Pro Asn Ala Leu Glu Cys Tyr

465 470 475 480

gtc aga gaa cat ggc gtc acg ggg gag gaa gct gcg gcc gcg tgt gca 1488

Val Arg Glu His Gly Val Thr Gly Glu Glu Ala Ala Ala Ala Cys Ala

485 490 495

gcc att gta gag ctc ggg tgg agg aag atc aac agg gcc cgt atg gag 1536

Ala Ile Val Glu Leu Gly Trp Arg Lys Ile Asn Arg Ala Arg Met Glu

500 505 510

ata cat cct atg ctg gta ccc gcg gca caa atg gat gcg aaa atc aac 1584

Ile His Pro Met Leu Val Pro Ala Ala Gln Met Asp Ala Lys Ile Asn

515 520 525

ctg acc agg gtg tgc gag att tta tac tac cgt ggt atg gat ggc tac 1632

Leu Thr Arg Val Cys Glu Ile Leu Tyr Tyr Arg Gly Met Asp Gly Tyr

530 535 540

acc ttt gga agc gac ctc cgg gat gtc atc act tct ctc ttc atc aag 1680

Thr Phe Gly Ser Asp Leu Arg Asp Val Ile Thr Ser Leu Phe Ile Lys

545 550 555 560

ccg gcg gcc ggg ggc cct gca taa 1704

Pro Ala Ala Gly Gly Pro Ala

565

<210> 3

<211> 567

<212> PRT

<400> 3

Met Ala Ala Ser Ile Thr Val Ala Ala Ala His Gly Pro Pro Ala Ala

1 5 10 15

Ile Pro Glu Thr Lys Arg Ser Thr Val Asp Asp Val Pro Phe Gln Ser

20 25 30

Ser Val Trp Gly Asp Tyr Phe Val Asn Tyr Thr Pro Pro Ala Ser Gln

35 40 45

Arg Ser Glu Glu Trp Met Arg Glu Arg Val Asp Glu Leu Arg Gly Glu

50 55 60

Val Arg Arg Lys Phe Lys Thr Thr Met Ser Met Ala Glu Thr Met Val

65 70 75 80

Leu Val Asp Thr Leu Glu Arg Leu Ala Ile Asp Gly His Phe Arg Lys

85 90 95

Asp Ile Asp Leu Ala Leu Ser Gln Ile His Met Glu Gly Lys Pro Ala

100 105 110

Gly Ile Ser Ser Ser Asn Lys Leu Tyr Ile Val Ala Leu Gly Phe Arg

115 120 125

Leu Leu Arg Gln His Gly Phe Trp Val Ser Ala Asp Val Phe Asp Lys

130 135 140

Phe Arg Asp Ser Thr Gly Lys Leu Ser Lys Gly Leu Ser Gly Asp Val

145 150 155 160

Lys Gly Leu Leu Ser Leu Tyr Asn Ala Ala His Met Ala Val Pro Gly

165 170 175

Glu Lys Ser Leu Asp Glu Ala Ile Asp Phe Thr Arg Arg Cys Leu Glu

180 185 190

Ser Ala Lys Asp Arg Leu Val Ala Pro Met Ser Val Gln Val Ser Arg

195 200 205

Ala Leu Ser Ile Pro Leu Pro Arg Tyr Leu Pro Arg Leu Glu Ala Met

210 215 220

His Tyr Ile Ser Glu Tyr Gly Gln Glu Glu Asp His Asp Ala Lys Ile

225 230 235 240

Leu Glu Leu Ala Arg Leu Asp Tyr Ala Leu Val Gln Ser Leu Tyr Leu

245 250 255

Lys Glu Leu Arg Glu Leu Thr Leu Trp Trp Lys Glu Leu Tyr His Ser

260 265 270

Val Asn Leu Pro Asn Thr Arg Asp Arg Ile Val Glu Met Tyr Phe Phe

275 280 285

Ala Phe Gly Met Leu Gln Thr Glu Glu Tyr Ser Arg Ala Arg Leu Ile

290 295 300

Asp Ser Lys Ile Ile Ala Leu Val Ser Leu Met Asp Asp Ile Tyr Asp

305 310 315 320

Glu His Ala Ser Phe Glu Glu Ala Gln Lys Phe Asn Glu Ala Ile Gln

325 330 335

Arg Trp Asn Glu Ser Ala Val Ser Asp Leu Pro Glu Tyr Met Arg Met

340 345 350

Leu Tyr Thr Gln Ile Leu Ser Thr Phe Ala Lys Phe Glu Glu Val Leu

355 360 365

Gly Pro Asn Glu Lys Tyr Arg Val Ser Tyr Ala Lys Glu Ala Tyr Lys

370 375 380

Leu Gln Ser Met Tyr Tyr Phe Leu Glu Asn Lys Trp Cys His Glu Asn

385 390 395 400

His Met Pro Ser Phe Gly Glu His Ile His Leu Ser Ser Met Ser Ala

405 410 415

Gly Leu Gln Val Leu Ile Val Gly Ala Trp Ile Gly Ala His His Ala

420 425 430

Ile Ala Lys Glu Ser Leu Glu Trp Ala Ile Thr Tyr Pro Glu Val Phe

435 440 445

Arg Ala Ala Gly Asp Val Gly Arg Leu Leu Asn Asp Ile Ala Ser Phe

450 455 460

Lys Lys Arg Lys Asn Ser Lys Asp Ala Pro Asn Ala Leu Glu Cys Tyr

465 470 475 480

Val Arg Glu His Gly Val Thr Gly Glu Glu Ala Ala Ala Ala Cys Ala

485 490 495

Ala Ile Val Glu Leu Gly Trp Arg Lys Ile Asn Arg Ala Arg Met Glu

500 505 510

Ile His Pro Met Leu Val Pro Ala Ala Gln Met Asp Ala Lys Ile Asn

515 520 525

Leu Thr Arg Val Cys Glu Ile Leu Tyr Tyr Arg Gly Met Asp Gly Tyr

530 535 540

Thr Phe Gly Ser Asp Leu Arg Asp Val Ile Thr Ser Leu Phe Ile Lys

545 550 555 560

Pro Ala Ala Gly Gly Pro Ala

565

<210> 4

<211> 1704

<212> DNA

<213> VzTps1718密码子优化的cDNA序列

<400> 4

atggcagcaa gcatcacggt cgccgcagca cacggtccgc cagcagcaat cccggaaacc 60

aaacgcagca ccgtggatga cgttccattt caatcctcgg tgtggggcga ctacttcgtc 120

aactatacgc cgccggcgag ccagcgttcc gaagagtgga tgcgtgaacg cgttgacgaa 180

ctgcgtggcg aagtgcgtcg taagttcaag actaccatga gcatggctga aaccatggtt 240

ctggttgata ccctggagcg ccttgcaatc gatggtcatt ttcgtaaaga tattgacctg 300

gcactgagcc agatccacat ggagggtaaa ccggcgggta ttagctcgtc taacaagctg 360

tatatcgttg cgctgggctt tcgtttgttg cgtcagcacg gtttctgggt gagcgccgat 420

gttttcgata aatttcgtga tagcacgggc aaactgtcca agggcctgag cggcgacgtc 480

aagggcctgc tgtcactgta taatgccgca cacatggctg tcccgggtga gaaatctctg 540

gatgaagcga ttgactttac gcgtcgctgc ctggaaagcg ccaaagatcg tttggtggcc 600

ccgatgagcg tccaggttag ccgcgccctg agcatcccgc tgccgcgtta tctgccgcgc 660

ctggaagcga tgcattacat cagcgagtat ggtcaagagg aagatcacga cgctaagatc 720

ctggaattgg cgcgcctgga ctacgcgctg gtccaaagcc tgtacctgaa agaactgcgc 780

gagctgaccc tgtggtggaa agaactgtac cactccgtta atctgccgaa cacccgtgac 840

cgcatcgtcg agatgtattt ctttgcgttt ggtatgttgc agaccgaaga gtactctcgt 900

gctcgcctga tcgatagcaa gattatcgcc ctggtgagcc tgatggatga catttatgat 960

gagcatgcca gcttcgagga agctcaaaag tttaacgaag caatccaacg ttggaatgaa 1020

agcgcggtta gcgacttgcc ggagtatatg cgcatgctgt acacccaaat cctgagcacc 1080

ttcgcgaagt ttgaagaggt tctgggtccg aacgaaaaat atcgcgtgag ctatgcgaaa 1140

gaggcgtaca agctgcaatc catgtactat ttcctggaga acaaatggtg tcatgagaat 1200

cacatgccga gcttcggtga gcacattcac ctgagctcca tgtccgcggg tttgcaagtg 1260

ttgattgtgg gtgcttggat cggcgcacat catgccattg caaaagagag cctggagtgg 1320

gcgattacct accctgaagt ttttcgtgcc gcgggcgatg tgggtcgtct gttgaatgac 1380

attgcaagct tcaaaaagcg taagaactct aaagacgccc cgaacgcgct ggagtgttat 1440

gtccgtgaac acggcgtgac tggcgaagaa gcggcagctg cctgcgcagc tattgttgag 1500

ctgggttggc gtaagatcaa ccgtgcgcgc atggaaatcc atccgatgct ggtcccggcg 1560

gcgcagatgg acgcgaaaat caatttgacc cgtgtgtgcg agatcctgta ctaccgtggc 1620

atggatggtt acaccttcgg tagcgattta cgcgatgtga ttacgagcct cttcattaag 1680

cctgcggctg gcggcccggc gtaa 1704

<210> 5

<211> 1825

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt-9_Locus_8201-12, 全长转录物，含有5’和3非翻译序列

<400> 5

gatcgtttca cgtgactgga gttcagacgt gtgctcttcc gatctcaaaa aatggacttt 60

ctcagaatcc cgtttcttgt agccttcgtc ttcctcgccg tccttctcag gctcatccgg 120

agctacatca catcctcagc tcttcgcctg ccaccggggc catggcagct gccgctcatc 180

ggcagcctgc accacctcct gctgtcgcgc ttcagcgacc tccctcaccg ggctttgcgc 240

gagatgtccg gcacctacgg gcccctcatg ctgctccgct tcggctccgt gcccacgctg 300

gtggtctcct ccgccgaggc tgcccgggag gtgatgagga cccacgacct cgccttctgc 360

gaccgccacc tcggcgtcac tctcgacatc gtcacctgcg gcggcaagga catcatctgc 420

tccccctaca acgcccactg gcgcgagctc cgtaagctgt gcatggtcga gatcttgagc 480

cagcggcgcg tgctctcgtt ccggagcatc cgggaagagg aggtggcgag cctcgtccgc 540

tccatctccg acgagtgcgg cggtggccag cagcccgtca acctcactga agggataagc 600

cgcatgataa acgacgtcgc cgcgcgcacg gtcgtcggcg accggtgcaa gtaccaggat 660

gaatacatgc atgagctgga cgaagtggtg cggctggccg gcgggttcaa cctggcggac 720

ctgtacccgt cctcgcggct ggtacggcgg ttcagcgccg ccgcgaggga cgcgaggagg 780

tgccagagga acatgtaccg tatcatccag agcatcatcc aggagcgtga agccatgccg 840

acgccagagc gagacgagga ggacctcctc ggcgtcctcc tcaggctgca gagagaaggt 900

ggcctgcagt ttgctctcac caatgagata gtcagcaccg tcatttacga tattttttct 960

gctggtagtg aaacatcatc aactgttcta gtatgggcaa tgtcggagct tgttaagaat 1020

ccacaagtca tgcgtaaggc ccagtcagag gtgagggata ccttcaaagg aaacaacaag 1080

ataactgaaa gtgatttgat caagttaaga tatctacaac tggtgatcaa ggagacttta 1140

cggttgcatg ctccggtacc actcttgctc cctcgagaat gccgtgagtc atgtcagatt 1200

atgggttacg atgtgctaaa gggaaccaag gtatttgtga atgcttgggc aatagcaagg 1260

gacacgggat tatggtgtga tggagaggaa tttaggccag aaaggtttga aagtagcaat 1320

attgatttca ggggtaatga ctttgagttc acaccgtttg gggcaggcag gagagtatgc 1380

cctggcatca cacttggact ggccaaccta gaactagcgc ttgctagcct tctttatcat 1440

tttgattggg atctgcccaa tggtgccagg ttggaagatc ttgatatggc agaggccttt 1500

ggtataacgt taaaaaggaa gtccatgctc tggctcaagg ccaaacctta caataatttt 1560

ataccaaatt aatcaggtga tttgtgatgt gaactatccc ggttgctact tagtttatta 1620

tacccagaaa gagtgtgatg gtaattgtac tatcaatctt tactgcagaa cagtaaatat 1680

atccagagtt ggttctatgc ttctgttata atgtttcatc actctgtatt aagtgtgtag 1740

ttatctgttt gtttactttt tttgtaatga ttaaacgatt atctaatgag agtacaagaa 1800

tcaaatgaga ctggtctaaa aaaaa 1825

<210> 6

<211> 1521

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzCp8201-12野生型cDNA序列，仅开放阅读框

<220>

<221> CDS

<222> (1)..(1521)

<400> 6

atg gac ttt ctc aga atc ccg ttt ctt gta gcc ttc gtc ttc ctc gcc 48

Met Asp Phe Leu Arg Ile Pro Phe Leu Val Ala Phe Val Phe Leu Ala

1 5 10 15

gtc ctt ctc agg ctc atc cgg agc tac atc aca tcc tca gct ctt cgc 96

Val Leu Leu Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu Arg

20 25 30

ctg cca ccg ggg cca tgg cag ctg ccg ctc atc ggc agc ctg cac cac 144

Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His His

35 40 45

ctc ctg ctg tcg cgc ttc agc gac ctc cct cac cgg gct ttg cgc gag 192

Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg Glu

50 55 60

atg tcc ggc acc tac ggg ccc ctc atg ctg ctc cgc ttc ggc tcc gtg 240

Met Ser Gly Thr Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ser Val

65 70 75 80

ccc acg ctg gtg gtc tcc tcc gcc gag gct gcc cgg gag gtg atg agg 288

Pro Thr Leu Val Val Ser Ser Ala Glu Ala Ala Arg Glu Val Met Arg

85 90 95

acc cac gac ctc gcc ttc tgc gac cgc cac ctc ggc gtc act ctc gac 336

Thr His Asp Leu Ala Phe Cys Asp Arg His Leu Gly Val Thr Leu Asp

100 105 110

atc gtc acc tgc ggc ggc aag gac atc atc tgc tcc ccc tac aac gcc 384

Ile Val Thr Cys Gly Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn Ala

115 120 125

cac tgg cgc gag ctc cgt aag ctg tgc atg gtc gag atc ttg agc cag 432

His Trp Arg Glu Leu Arg Lys Leu Cys Met Val Glu Ile Leu Ser Gln

130 135 140

cgg cgc gtg ctc tcg ttc cgg agc atc cgg gaa gag gag gtg gcg agc 480

Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala Ser

145 150 155 160

ctc gtc cgc tcc atc tcc gac gag tgc ggc ggt ggc cag cag ccc gtc 528

Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro Val

165 170 175

aac ctc act gaa ggg ata agc cgc atg ata aac gac gtc gcc gcg cgc 576

Asn Leu Thr Glu Gly Ile Ser Arg Met Ile Asn Asp Val Ala Ala Arg

180 185 190

acg gtc gtc ggc gac cgg tgc aag tac cag gat gaa tac atg cat gag 624

Thr Val Val Gly Asp Arg Cys Lys Tyr Gln Asp Glu Tyr Met His Glu

195 200 205

ctg gac gaa gtg gtg cgg ctg gcc ggc ggg ttc aac ctg gcg gac ctg 672

Leu Asp Glu Val Val Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp Leu

210 215 220

tac ccg tcc tcg cgg ctg gta cgg cgg ttc agc gcc gcc gcg agg gac 720

Tyr Pro Ser Ser Arg Leu Val Arg Arg Phe Ser Ala Ala Ala Arg Asp

225 230 235 240

gcg agg agg tgc cag agg aac atg tac cgt atc atc cag agc atc atc 768

Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile Ile

245 250 255

cag gag cgt gaa gcc atg ccg acg cca gag cga gac gag gag gac ctc 816

Gln Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Glu Asp Leu

260 265 270

ctc ggc gtc ctc ctc agg ctg cag aga gaa ggt ggc ctg cag ttt gct 864

Leu Gly Val Leu Leu Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe Ala

275 280 285

ctc acc aat gag ata gtc agc acc gtc att tac gat att ttt tct gct 912

Leu Thr Asn Glu Ile Val Ser Thr Val Ile Tyr Asp Ile Phe Ser Ala

290 295 300

ggt agt gaa aca tca tca act gtt cta gta tgg gca atg tcg gag ctt 960

Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu

305 310 315 320

gtt aag aat cca caa gtc atg cgt aag gcc cag tca gag gtg agg gat 1008

Val Lys Asn Pro Gln Val Met Arg Lys Ala Gln Ser Glu Val Arg Asp

325 330 335

acc ttc aaa gga aac aac aag ata act gaa agt gat ttg atc aag tta 1056

Thr Phe Lys Gly Asn Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys Leu

340 345 350

aga tat cta caa ctg gtg atc aag gag act tta cgg ttg cat gct ccg 1104

Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro

355 360 365

gta cca ctc ttg ctc cct cga gaa tgc cgt gag tca tgt cag att atg 1152

Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile Met

370 375 380

ggt tac gat gtg cta aag gga acc aag gta ttt gtg aat gct tgg gca 1200

Gly Tyr Asp Val Leu Lys Gly Thr Lys Val Phe Val Asn Ala Trp Ala

385 390 395 400

ata gca agg gac acg gga tta tgg tgt gat gga gag gaa ttt agg cca 1248

Ile Ala Arg Asp Thr Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg Pro

405 410 415

gaa agg ttt gaa agt agc aat att gat ttc agg ggt aat gac ttt gag 1296

Glu Arg Phe Glu Ser Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe Glu

420 425 430

ttc aca ccg ttt ggg gca ggc agg aga gta tgc cct ggc atc aca ctt 1344

Phe Thr Pro Phe Gly Ala Gly Arg Arg Val Cys Pro Gly Ile Thr Leu

435 440 445

gga ctg gcc aac cta gaa cta gcg ctt gct agc ctt ctt tat cat ttt 1392

Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe

450 455 460

gat tgg gat ctg ccc aat ggt gcc agg ttg gaa gat ctt gat atg gca 1440

Asp Trp Asp Leu Pro Asn Gly Ala Arg Leu Glu Asp Leu Asp Met Ala

465 470 475 480

gag gcc ttt ggt ata acg tta aaa agg aag tcc atg ctc tgg ctc aag 1488

Glu Ala Phe Gly Ile Thr Leu Lys Arg Lys Ser Met Leu Trp Leu Lys

485 490 495

gcc aaa cct tac aat aat ttt ata cca aat taa 1521

Ala Lys Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 7

<211> 506

<212> PRT

<400> 7

Met Asp Phe Leu Arg Ile Pro Phe Leu Val Ala Phe Val Phe Leu Ala

1 5 10 15

Val Leu Leu Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu Arg

20 25 30

Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His His

35 40 45

Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg Glu

50 55 60

Met Ser Gly Thr Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ser Val

65 70 75 80

Pro Thr Leu Val Val Ser Ser Ala Glu Ala Ala Arg Glu Val Met Arg

85 90 95

Thr His Asp Leu Ala Phe Cys Asp Arg His Leu Gly Val Thr Leu Asp

100 105 110

Ile Val Thr Cys Gly Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn Ala

115 120 125

His Trp Arg Glu Leu Arg Lys Leu Cys Met Val Glu Ile Leu Ser Gln

130 135 140

Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala Ser

145 150 155 160

Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro Val

165 170 175

Asn Leu Thr Glu Gly Ile Ser Arg Met Ile Asn Asp Val Ala Ala Arg

180 185 190

Thr Val Val Gly Asp Arg Cys Lys Tyr Gln Asp Glu Tyr Met His Glu

195 200 205

Leu Asp Glu Val Val Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp Leu

210 215 220

Tyr Pro Ser Ser Arg Leu Val Arg Arg Phe Ser Ala Ala Ala Arg Asp

225 230 235 240

Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile Ile

245 250 255

Gln Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Glu Asp Leu

260 265 270

Leu Gly Val Leu Leu Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe Ala

275 280 285

Leu Thr Asn Glu Ile Val Ser Thr Val Ile Tyr Asp Ile Phe Ser Ala

290 295 300

Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu

305 310 315 320

Val Lys Asn Pro Gln Val Met Arg Lys Ala Gln Ser Glu Val Arg Asp

325 330 335

Thr Phe Lys Gly Asn Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys Leu

340 345 350

Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro

355 360 365

Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile Met

370 375 380

Gly Tyr Asp Val Leu Lys Gly Thr Lys Val Phe Val Asn Ala Trp Ala

385 390 395 400

Ile Ala Arg Asp Thr Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg Pro

405 410 415

Glu Arg Phe Glu Ser Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe Glu

420 425 430

Phe Thr Pro Phe Gly Ala Gly Arg Arg Val Cys Pro Gly Ile Thr Leu

435 440 445

Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe

450 455 460

Asp Trp Asp Leu Pro Asn Gly Ala Arg Leu Glu Asp Leu Asp Met Ala

465 470 475 480

Glu Ala Phe Gly Ile Thr Leu Lys Arg Lys Ser Met Leu Trp Leu Lys

485 490 495

Ala Lys Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 8

<211> 1524

<212> DNA

<213> VzCP8201-228093, 经优化的DNA, 编码VzCP8201-12, 包括位于5'端的NdeI和位于3'端的多接头

<400> 8

atggcactgt tgttggctgt ttttttgggt ttgagctgtt tgttgctgtt gagcttgtgg 60

cgtctgatcc gcagctacat tacttccagc gcgctgcgcc tgccgccggg tccgtggcag 120

ctgcctctga ttggcagcct gcaccacttg ctgctgagcc gcttcagcga cttgccgcat 180

cgcgcgctga gagagatgag cggcacctac ggtccgctga tgctgctgcg tttcggtagc 240

gtcccgaccc tggttgtctc tagcgcggaa gcggctcgtg aagtcatgcg tacccacgat 300

ctggcgtttt gcgatcgtca cctgggtgtg acgctggaca tcgtaacctg tggtggcaaa 360

gacatcatct gcagcccata caacgctcat tggcgtgagc tgcgcaagct gtgcatggtt 420

gaaatcctga gccagcgccg tgtgctgagc ttccgttcga ttcgtgaaga agaggtcgcg 480

agcctggtgc gttccattag cgatgagtgt ggtggcggcc agcaaccagt taacctgacc 540

gaaggcatct ctcgcatgat taatgacgtc gccgcacgta ccgtggtcgg tgaccgctgc 600

aagtaccaag acgagtacat gcatgaactg gacgaagttg ttcgtctggc gggtggcttc 660

aacctggccg atctgtatcc gagctcacgt ctggttcgtc gtttttccgc agctgcgcgt 720

gacgcgcgtc gctgtcagcg taacatgtac cgcattattc aatctatcat ccaagagcgt 780

gaggcaatgc cgacgcctga gcgcgacgaa gaagatcttc tgggtgtcct gctgcgtctg 840

cagcgcgagg gtggtctgca gtttgcgctg acgaacgaaa ttgtttcgac cgtgatttac 900

gatatcttca gcgccggtag cgaaacctcc agcacggtgt tggtgtgggc aatgtctgaa 960

ctggtcaaaa atccgcaagt gatgcgcaaa gcgcaaagcg aagttcgtga cactttcaaa 1020

ggtaacaata agattaccga gagcgacctg attaagctgc gctatctgca actggttatc 1080

aaagaaaccc tgcgcctgca cgcaccggtg ccgctgctgc tgccgcgtga gtgccgtgaa 1140

tcctgtcaga tcatgggcta tgacgttctg aagggtacga aagtgttcgt taatgcctgg 1200

gcgattgcac gtgatacggg tctgtggtgc gacggcgaag agttccgtcc ggagcgtttc 1260

gagtccagca atatcgattt tcgtggtaat gattttgagt tcacgccgtt cggtgcgggc 1320

cgtcgtgtct gcccaggcat caccctgggc ctggccaact tagaactggc cctcgcgagc 1380

ttgttatatc actttgactg ggatctgccg aacggcgcgc gcctggaaga tctggacatg 1440

gccgaggcat ttggtatcac gctgaagcgc aagagcatgc tgtggctgaa agcaaaaccg 1500

tacaataatt ttattccgaa ctaa 1524

<210> 9

<211> 1524

<212> DNA

<213> VzCP8201-228092, 编码VzCP8201-12-bov的经优化的DNA序列, 包括位于5'端的NdeI和位于3'端的多接头

<220>

<221> CDS

<222> (1)..(1524)

<400> 9

atg gca ctg ttg ttg gct gtt ttt ttg ggt ttg agc tgt ttg ttg ctg 48

Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu

1 5 10 15

ttg agc ttg tgg cgt ctg atc cgc agc tac att act tcc agc gcg ctg 96

Leu Ser Leu Trp Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu

20 25 30

cgc ctg ccg ccg ggt ccg tgg cag ctg cct ctg att ggc agc ctg cac 144

Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His

35 40 45

cac ttg ctg ctg agc cgc ttc agc gac ttg ccg cat cgc gcg ctg aga 192

His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg

50 55 60

gag atg agc ggc acc tac ggt ccg ctg atg ctg ctg cgt ttc ggt agc 240

Glu Met Ser Gly Thr Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ser

65 70 75 80

gtc ccg acc ctg gtt gtc tct agc gcg gaa gcg gct cgt gaa gtc atg 288

Val Pro Thr Leu Val Val Ser Ser Ala Glu Ala Ala Arg Glu Val Met

85 90 95

cgt acc cac gat ctg gcg ttt tgc gat cgt cac ctg ggt gtg acg ctg 336

Arg Thr His Asp Leu Ala Phe Cys Asp Arg His Leu Gly Val Thr Leu

100 105 110

gac atc gta acc tgt ggt ggc aaa gac atc atc tgc agc cca tac aac 384

Asp Ile Val Thr Cys Gly Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn

115 120 125

gct cat tgg cgt gag ctg cgc aag ctg tgc atg gtt gaa atc ctg agc 432

Ala His Trp Arg Glu Leu Arg Lys Leu Cys Met Val Glu Ile Leu Ser

130 135 140

cag cgc cgt gtg ctg agc ttc cgt tcg att cgt gaa gaa gag gtc gcg 480

Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala

145 150 155 160

agc ctg gtg cgt tcc att agc gat gag tgt ggt ggc ggc cag caa cca 528

Ser Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro

165 170 175

gtt aac ctg acc gaa ggc atc tct cgc atg att aat gac gtc gcc gca 576

Val Asn Leu Thr Glu Gly Ile Ser Arg Met Ile Asn Asp Val Ala Ala

180 185 190

cgt acc gtg gtc ggt gac cgc tgc aag tac caa gac gag tac atg cat 624

Arg Thr Val Val Gly Asp Arg Cys Lys Tyr Gln Asp Glu Tyr Met His

195 200 205

gaa ctg gac gaa gtt gtt cgt ctg gcg ggt ggc ttc aac ctg gcc gat 672

Glu Leu Asp Glu Val Val Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp

210 215 220

ctg tat ccg agc tca cgt ctg gtt cgt cgt ttt tcc gca gct gcg cgt 720

Leu Tyr Pro Ser Ser Arg Leu Val Arg Arg Phe Ser Ala Ala Ala Arg

225 230 235 240

gac gcg cgt cgc tgt cag cgt aac atg tac cgc att att caa tct atc 768

Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile

245 250 255

atc caa gag cgt gag gca atg ccg acg cct gag cgc gac gaa gaa gat 816

Ile Gln Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Glu Asp

260 265 270

ctt ctg ggt gtc ctg ctg cgt ctg cag cgc gag ggt ggt ctg cag ttt 864

Leu Leu Gly Val Leu Leu Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe

275 280 285

gcg ctg acg aac gaa att gtt tcg acc gtg att tac gat atc ttc agc 912

Ala Leu Thr Asn Glu Ile Val Ser Thr Val Ile Tyr Asp Ile Phe Ser

290 295 300

gcc ggt agc gaa acc tcc agc acg gtg ttg gtg tgg gca atg tct gaa 960

Ala Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu

305 310 315 320

ctg gtc aaa aat ccg caa gtg atg cgc aaa gcg caa agc gaa gtt cgt 1008

Leu Val Lys Asn Pro Gln Val Met Arg Lys Ala Gln Ser Glu Val Arg

325 330 335

gac act ttc aaa ggt aac aat aag att acc gag agc gac ctg att aag 1056

Asp Thr Phe Lys Gly Asn Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys

340 345 350

ctg cgc tat ctg caa ctg gtt atc aaa gaa acc ctg cgc ctg cac gca 1104

Leu Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala

355 360 365

ccg gtg ccg ctg ctg ctg ccg cgt gag tgc cgt gaa tcc tgt cag atc 1152

Pro Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile

370 375 380

atg ggc tat gac gtt ctg aag ggt acg aaa gtg ttc gtt aat gcc tgg 1200

Met Gly Tyr Asp Val Leu Lys Gly Thr Lys Val Phe Val Asn Ala Trp

385 390 395 400

gcg att gca cgt gat acg ggt ctg tgg tgc gac ggc gaa gag ttc cgt 1248

Ala Ile Ala Arg Asp Thr Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg

405 410 415

ccg gag cgt ttc gag tcc agc aat atc gat ttt cgt ggt aat gat ttt 1296

Pro Glu Arg Phe Glu Ser Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe

420 425 430

gag ttc acg ccg ttc ggt gcg ggc cgt cgt gtc tgc cca ggc atc acc 1344

Glu Phe Thr Pro Phe Gly Ala Gly Arg Arg Val Cys Pro Gly Ile Thr

435 440 445

ctg ggc ctg gcc aac tta gaa ctg gcc ctc gcg agc ttg tta tat cac 1392

Leu Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His

450 455 460

ttt gac tgg gat ctg ccg aac ggc gcg cgc ctg gaa gat ctg gac atg 1440

Phe Asp Trp Asp Leu Pro Asn Gly Ala Arg Leu Glu Asp Leu Asp Met

465 470 475 480

gcc gag gca ttt ggt atc acg ctg aag cgc aag agc atg ctg tgg ctg 1488

Ala Glu Ala Phe Gly Ile Thr Leu Lys Arg Lys Ser Met Leu Trp Leu

485 490 495

aaa gca aaa ccg tac aat aat ttt att ccg aac taa 1524

Lys Ala Lys Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 10

<211> 507

<212> PRT

<400> 10

Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu

1 5 10 15

Leu Ser Leu Trp Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu

20 25 30

Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His

35 40 45

His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg

50 55 60

Glu Met Ser Gly Thr Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ser

65 70 75 80

Val Pro Thr Leu Val Val Ser Ser Ala Glu Ala Ala Arg Glu Val Met

85 90 95

Arg Thr His Asp Leu Ala Phe Cys Asp Arg His Leu Gly Val Thr Leu

100 105 110

Asp Ile Val Thr Cys Gly Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn

115 120 125

Ala His Trp Arg Glu Leu Arg Lys Leu Cys Met Val Glu Ile Leu Ser

130 135 140

Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala

145 150 155 160

Ser Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro

165 170 175

Val Asn Leu Thr Glu Gly Ile Ser Arg Met Ile Asn Asp Val Ala Ala

180 185 190

Arg Thr Val Val Gly Asp Arg Cys Lys Tyr Gln Asp Glu Tyr Met His

195 200 205

Glu Leu Asp Glu Val Val Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp

210 215 220

Leu Tyr Pro Ser Ser Arg Leu Val Arg Arg Phe Ser Ala Ala Ala Arg

225 230 235 240

Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile

245 250 255

Ile Gln Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Glu Asp

260 265 270

Leu Leu Gly Val Leu Leu Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe

275 280 285

Ala Leu Thr Asn Glu Ile Val Ser Thr Val Ile Tyr Asp Ile Phe Ser

290 295 300

Ala Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu

305 310 315 320

Leu Val Lys Asn Pro Gln Val Met Arg Lys Ala Gln Ser Glu Val Arg

325 330 335

Asp Thr Phe Lys Gly Asn Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys

340 345 350

Leu Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala

355 360 365

Pro Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile

370 375 380

Met Gly Tyr Asp Val Leu Lys Gly Thr Lys Val Phe Val Asn Ala Trp

385 390 395 400

Ala Ile Ala Arg Asp Thr Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg

405 410 415

Pro Glu Arg Phe Glu Ser Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe

420 425 430

Glu Phe Thr Pro Phe Gly Ala Gly Arg Arg Val Cys Pro Gly Ile Thr

435 440 445

Leu Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His

450 455 460

Phe Asp Trp Asp Leu Pro Asn Gly Ala Arg Leu Glu Asp Leu Asp Met

465 470 475 480

Ala Glu Ala Phe Gly Ile Thr Leu Lys Arg Lys Ser Met Leu Trp Leu

485 490 495

Lys Ala Lys Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 11

<211> 1717

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt7_contig_7186, 全长转录物，含有5'和3非翻译序列

<400> 11

tggtcacgta gttgcctgca aaattgtccc atcccctggc aaaaaatgga cattatcagt 60

atcccgtttc ttgtagcctt cgtcttcctc ctcgccgtcc ttctcaggct catccggagc 120

tacatcacat cctcagcgct tcgcctgcca ccggggccat ggcagctgcc gctcatcggc 180

agcctgcacc acctcctgct gtcgcgcttc agcgacctgc ctcaccgggc gctgcgcgag 240

atgtccggcg cctacggtcc cctcatgctc ctccgcttcg gcgccgtgcc cacgctggtg 300

gcctcctccg ccgaggctgc ccgggaggtg atgaggaccc acgacctcgc cttctgcaac 360

cgccatctcg gcgtcacctt cgacaccatc acctgcggcg gcaaggacat catcggctcc 420

ccctacaacg cccagtggcg cgagctccgc aagctgtgca tgctcgagat cttcagccag 480

cggcgcgtgc tctcgttccg gagcatccgg gaagaggagg tggcgaacct cgtccgctcc 540

atctccgacg agtgcggcgg tggccggcag cccgtcaacc tcaccgaggg gatctgccgc 600

atgatcaacg acgtcgccgc gcgcacggcc gtcggtgacc ggtgcaggta ccgggacgag 660

tacatgcacg agctggacga agtggtgcgg ctggtgagcg ggttcaacct ggcggacctg 720

tacccgtcct cgtggctggt gcggcggttc agcgccgccg cgagggacgc gaggaggtgc 780

cagaggaaca tgtaccgcat catccagagc atcatcgagg aacgtgaagc catgccgacg 840

ccagagcgag acgaggacct tctgggtgtc ctcctgaggc tgcagaagga aggtggcctg 900

cagttcgccc tcaccaacga gattgtcagc accgtcattt tcgacatttt ctctgctggg 960

agtgagacat catcaaccgt tctagtatgg gcaatgtcag aacttgttaa gaacccgcag 1020

gtcatgcata aggcccggtc agaggtgagg gagaccttca gaggacaaga caagataagt 1080

gaagatgatc tggtcaagtt aagatatcta caactggtga taaaggagac tttacggctg 1140

catgctccag taccactctt gctccctcga gaatgtcgtg agtcatgtca ggttatgggt 1200

tacgacgtgc caaagggaac caaggtgttt gtgaatgttt gggcaatagc aagggacgtg 1260

aaactgtggc atgatgcgga ggtattcaaa ccagaaagat ttgaaagtag cagtatcgat 1320

tttaggggta atgactttga gttcactcca ttcggggcag gcaggagaat gtgccctggc 1380

gttacactcg gactggccaa cctagagctg gcacttgcta gccttcttta ccattttgat 1440

tgggatctgc cggatggcat cgggttagaa gaactcgata tgtcagagac ctctggtata 1500

acgttaagaa agaagtccat gctctggctc aaggctagac cttacaataa ttttatacca 1560

aattaatcag gtgctctgtg ttgtgaacta tgtcctgttc ctgttactac ttaatttgta 1620

ccagaaagag tgtgattata attgtcatat caatctgtac tgcatgataa taaatatatg 1680

catagtttgt atatactatg cttgtgttat actgttt 1717

<210> 12

<211> 1521

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt7_contig_7186野生型cDNA (仅开放阅读框)

<220>

<221> CDS

<222> (1)..(1521)

<400> 12

atg gac att atc agt atc ccg ttt ctt gta gcc ttc gtc ttc ctc ctc 48

Met Asp Ile Ile Ser Ile Pro Phe Leu Val Ala Phe Val Phe Leu Leu

1 5 10 15

gcc gtc ctt ctc agg ctc atc cgg agc tac atc aca tcc tca gcg ctt 96

Ala Val Leu Leu Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu

20 25 30

cgc ctg cca ccg ggg cca tgg cag ctg ccg ctc atc ggc agc ctg cac 144

Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His

35 40 45

cac ctc ctg ctg tcg cgc ttc agc gac ctg cct cac cgg gcg ctg cgc 192

His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg

50 55 60

gag atg tcc ggc gcc tac ggt ccc ctc atg ctc ctc cgc ttc ggc gcc 240

Glu Met Ser Gly Ala Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ala

65 70 75 80

gtg ccc acg ctg gtg gcc tcc tcc gcc gag gct gcc cgg gag gtg atg 288

Val Pro Thr Leu Val Ala Ser Ser Ala Glu Ala Ala Arg Glu Val Met

85 90 95

agg acc cac gac ctc gcc ttc tgc aac cgc cat ctc ggc gtc acc ttc 336

Arg Thr His Asp Leu Ala Phe Cys Asn Arg His Leu Gly Val Thr Phe

100 105 110

gac acc atc acc tgc ggc ggc aag gac atc atc ggc tcc ccc tac aac 384

Asp Thr Ile Thr Cys Gly Gly Lys Asp Ile Ile Gly Ser Pro Tyr Asn

115 120 125

gcc cag tgg cgc gag ctc cgc aag ctg tgc atg ctc gag atc ttc agc 432

Ala Gln Trp Arg Glu Leu Arg Lys Leu Cys Met Leu Glu Ile Phe Ser

130 135 140

cag cgg cgc gtg ctc tcg ttc cgg agc atc cgg gaa gag gag gtg gcg 480

Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala

145 150 155 160

aac ctc gtc cgc tcc atc tcc gac gag tgc ggc ggt ggc cgg cag ccc 528

Asn Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Arg Gln Pro

165 170 175

gtc aac ctc acc gag ggg atc tgc cgc atg atc aac gac gtc gcc gcg 576

Val Asn Leu Thr Glu Gly Ile Cys Arg Met Ile Asn Asp Val Ala Ala

180 185 190

cgc acg gcc gtc ggt gac cgg tgc agg tac cgg gac gag tac atg cac 624

Arg Thr Ala Val Gly Asp Arg Cys Arg Tyr Arg Asp Glu Tyr Met His

195 200 205

gag ctg gac gaa gtg gtg cgg ctg gtg agc ggg ttc aac ctg gcg gac 672

Glu Leu Asp Glu Val Val Arg Leu Val Ser Gly Phe Asn Leu Ala Asp

210 215 220

ctg tac ccg tcc tcg tgg ctg gtg cgg cgg ttc agc gcc gcc gcg agg 720

Leu Tyr Pro Ser Ser Trp Leu Val Arg Arg Phe Ser Ala Ala Ala Arg

225 230 235 240

gac gcg agg agg tgc cag agg aac atg tac cgc atc atc cag agc atc 768

Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile

245 250 255

atc gag gaa cgt gaa gcc atg ccg acg cca gag cga gac gag gac ctt 816

Ile Glu Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Asp Leu

260 265 270

ctg ggt gtc ctc ctg agg ctg cag aag gaa ggt ggc ctg cag ttc gcc 864

Leu Gly Val Leu Leu Arg Leu Gln Lys Glu Gly Gly Leu Gln Phe Ala

275 280 285

ctc acc aac gag att gtc agc acc gtc att ttc gac att ttc tct gct 912

Leu Thr Asn Glu Ile Val Ser Thr Val Ile Phe Asp Ile Phe Ser Ala

290 295 300

ggg agt gag aca tca tca acc gtt cta gta tgg gca atg tca gaa ctt 960

Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu

305 310 315 320

gtt aag aac ccg cag gtc atg cat aag gcc cgg tca gag gtg agg gag 1008

Val Lys Asn Pro Gln Val Met His Lys Ala Arg Ser Glu Val Arg Glu

325 330 335

acc ttc aga gga caa gac aag ata agt gaa gat gat ctg gtc aag tta 1056

Thr Phe Arg Gly Gln Asp Lys Ile Ser Glu Asp Asp Leu Val Lys Leu

340 345 350

aga tat cta caa ctg gtg ata aag gag act tta cgg ctg cat gct cca 1104

Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro

355 360 365

gta cca ctc ttg ctc cct cga gaa tgt cgt gag tca tgt cag gtt atg 1152

Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Val Met

370 375 380

ggt tac gac gtg cca aag gga acc aag gtg ttt gtg aat gtt tgg gca 1200

Gly Tyr Asp Val Pro Lys Gly Thr Lys Val Phe Val Asn Val Trp Ala

385 390 395 400

ata gca agg gac gtg aaa ctg tgg cat gat gcg gag gta ttc aaa cca 1248

Ile Ala Arg Asp Val Lys Leu Trp His Asp Ala Glu Val Phe Lys Pro

405 410 415

gaa aga ttt gaa agt agc agt atc gat ttt agg ggt aat gac ttt gag 1296

Glu Arg Phe Glu Ser Ser Ser Ile Asp Phe Arg Gly Asn Asp Phe Glu

420 425 430

ttc act cca ttc ggg gca ggc agg aga atg tgc cct ggc gtt aca ctc 1344

Phe Thr Pro Phe Gly Ala Gly Arg Arg Met Cys Pro Gly Val Thr Leu

435 440 445

gga ctg gcc aac cta gag ctg gca ctt gct agc ctt ctt tac cat ttt 1392

Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe

450 455 460

gat tgg gat ctg ccg gat ggc atc ggg tta gaa gaa ctc gat atg tca 1440

Asp Trp Asp Leu Pro Asp Gly Ile Gly Leu Glu Glu Leu Asp Met Ser

465 470 475 480

gag acc tct ggt ata acg tta aga aag aag tcc atg ctc tgg ctc aag 1488

Glu Thr Ser Gly Ile Thr Leu Arg Lys Lys Ser Met Leu Trp Leu Lys

485 490 495

gct aga cct tac aat aat ttt ata cca aat taa 1521

Ala Arg Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 13

<211> 506

<212> PRT

<400> 13

Met Asp Ile Ile Ser Ile Pro Phe Leu Val Ala Phe Val Phe Leu Leu

1 5 10 15

Ala Val Leu Leu Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu

20 25 30

Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His

35 40 45

His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg

50 55 60

Glu Met Ser Gly Ala Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ala

65 70 75 80

Val Pro Thr Leu Val Ala Ser Ser Ala Glu Ala Ala Arg Glu Val Met

85 90 95

Arg Thr His Asp Leu Ala Phe Cys Asn Arg His Leu Gly Val Thr Phe

100 105 110

Asp Thr Ile Thr Cys Gly Gly Lys Asp Ile Ile Gly Ser Pro Tyr Asn

115 120 125

Ala Gln Trp Arg Glu Leu Arg Lys Leu Cys Met Leu Glu Ile Phe Ser

130 135 140

Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala

145 150 155 160

Asn Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Arg Gln Pro

165 170 175

Val Asn Leu Thr Glu Gly Ile Cys Arg Met Ile Asn Asp Val Ala Ala

180 185 190

Arg Thr Ala Val Gly Asp Arg Cys Arg Tyr Arg Asp Glu Tyr Met His

195 200 205

Glu Leu Asp Glu Val Val Arg Leu Val Ser Gly Phe Asn Leu Ala Asp

210 215 220

Leu Tyr Pro Ser Ser Trp Leu Val Arg Arg Phe Ser Ala Ala Ala Arg

225 230 235 240

Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile

245 250 255

Ile Glu Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Asp Leu

260 265 270

Leu Gly Val Leu Leu Arg Leu Gln Lys Glu Gly Gly Leu Gln Phe Ala

275 280 285

Leu Thr Asn Glu Ile Val Ser Thr Val Ile Phe Asp Ile Phe Ser Ala

290 295 300

Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu

305 310 315 320

Val Lys Asn Pro Gln Val Met His Lys Ala Arg Ser Glu Val Arg Glu

325 330 335

Thr Phe Arg Gly Gln Asp Lys Ile Ser Glu Asp Asp Leu Val Lys Leu

340 345 350

Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro

355 360 365

Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Val Met

370 375 380

Gly Tyr Asp Val Pro Lys Gly Thr Lys Val Phe Val Asn Val Trp Ala

385 390 395 400

Ile Ala Arg Asp Val Lys Leu Trp His Asp Ala Glu Val Phe Lys Pro

405 410 415

Glu Arg Phe Glu Ser Ser Ser Ile Asp Phe Arg Gly Asn Asp Phe Glu

420 425 430

Phe Thr Pro Phe Gly Ala Gly Arg Arg Met Cys Pro Gly Val Thr Leu

435 440 445

Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe

450 455 460

Asp Trp Asp Leu Pro Asp Gly Ile Gly Leu Glu Glu Leu Asp Met Ser

465 470 475 480

Glu Thr Ser Gly Ile Thr Leu Arg Lys Lys Ser Met Leu Trp Leu Lys

485 490 495

Ala Arg Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 14

<211> 1521

<212> DNA

<213> 编码VzCP7186的N末端变体的经优化的cDNA

<220>

<221> CDS

<222> (1)..(1521)

<400> 14

atg gcg ttg ctg ttg gct gtt ttt ctg ggt ttg tcg tgt ttg ttg ttg 48

Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu

1 5 10 15

ttg tca ctg tgg cgc ttg atc cgt agc tat atc act agc agc gcg ttg 96

Leu Ser Leu Trp Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu

20 25 30

cgt ctg cct ccg ggt cct tgg cag ctg ccg ctg att ggt agc ctg cac 144

Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His

35 40 45

cat ttg ctg ctg agc cgt ttc agc gat ctg ccg cac cgt gcg ttg cgc 192

His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg

50 55 60

gag atg agc ggt gcc tat ggc ccg ctg atg ctg tta cgt ttt ggt gca 240

Glu Met Ser Gly Ala Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ala

65 70 75 80

gtg ccg acc ctg gtg gca agc agc gca gaa gca gcg cgc gag gtg atg 288

Val Pro Thr Leu Val Ala Ser Ser Ala Glu Ala Ala Arg Glu Val Met

85 90 95

cgc acc cat gac ctg gcc ttc tgc aat cgt cac ctg ggt gtc acc ttt 336

Arg Thr His Asp Leu Ala Phe Cys Asn Arg His Leu Gly Val Thr Phe

100 105 110

gac acc atc acc tgt ggt ggc aaa gac att atc ggt agc cca tat aac 384

Asp Thr Ile Thr Cys Gly Gly Lys Asp Ile Ile Gly Ser Pro Tyr Asn

115 120 125

gca caa tgg cgc gag ctg cgc aag ctg tgt atg ctg gag atc ttc agc 432

Ala Gln Trp Arg Glu Leu Arg Lys Leu Cys Met Leu Glu Ile Phe Ser

130 135 140

caa cgt cgt gtg ctg agc ttc cgt agc att cgc gag gag gaa gtg gcc 480

Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala

145 150 155 160

aac ctg gtc cgc agc att agc gac gaa tgc ggt ggt ggc cgt caa ccg 528

Asn Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Arg Gln Pro

165 170 175

gtc aat ctg acc gag ggt atc tgt cgc atg atc aac gac gtg gct gcg 576

Val Asn Leu Thr Glu Gly Ile Cys Arg Met Ile Asn Asp Val Ala Ala

180 185 190

cgt act gca gtc ggc gac cgt tgc cgt tac cgt gat gag tac atg cac 624

Arg Thr Ala Val Gly Asp Arg Cys Arg Tyr Arg Asp Glu Tyr Met His

195 200 205

gaa ctg gat gaa gtt gtc cgc ctg gtt agc ggc ttc aac ctg gcg gat 672

Glu Leu Asp Glu Val Val Arg Leu Val Ser Gly Phe Asn Leu Ala Asp

210 215 220

ctg tac ccg tcc tct tgg ctg gtt cgt cgt ttc tcg gca gct gct cgt 720

Leu Tyr Pro Ser Ser Trp Leu Val Arg Arg Phe Ser Ala Ala Ala Arg

225 230 235 240

gac gcg cgc aga tgc cag cgt aat atg tat cgt atc att cag agc att 768

Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile

245 250 255

att gaa gaa cgt gag gca atg ccg acg ccg gaa cgt gac gag gat ttg 816

Ile Glu Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Asp Leu

260 265 270

ctg ggt gtg ctg ctg cgc ctg cag aag gag ggt ggc ttg cag ttc gcg 864

Leu Gly Val Leu Leu Arg Leu Gln Lys Glu Gly Gly Leu Gln Phe Ala

275 280 285

ctg acc aac gaa atc gtc agc acg gtt atc ttt gac atc ttt tct gcg 912

Leu Thr Asn Glu Ile Val Ser Thr Val Ile Phe Asp Ile Phe Ser Ala

290 295 300

ggt agc gag act agc agc acg gtg ctg gtc tgg gcc atg agc gaa ctg 960

Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu

305 310 315 320

gtt aaa aat cct caa gtt atg cat aag gca cgc tct gag gtg cgc gaa 1008

Val Lys Asn Pro Gln Val Met His Lys Ala Arg Ser Glu Val Arg Glu

325 330 335

acg ttt cgt ggc caa gac aaa atc tcc gag gac gat ctc gtc aag ctg 1056

Thr Phe Arg Gly Gln Asp Lys Ile Ser Glu Asp Asp Leu Val Lys Leu

340 345 350

cgt tat ttg caa ctt gtt att aag gaa acc ctg cgt ctg cat gcg ccg 1104

Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro

355 360 365

gtt ccg tta ctg ctg cca cgc gag tgt cgt gag agc tgc caa gtg atg 1152

Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Val Met

370 375 380

ggt tac gat gtg cca aaa ggc acc aaa gtg ttc gtt aac gtc tgg gcg 1200

Gly Tyr Asp Val Pro Lys Gly Thr Lys Val Phe Val Asn Val Trp Ala

385 390 395 400

att gcc cgc gac gtc aaa ctg tgg cac gat gca gag gtc ttt aaa ccg 1248

Ile Ala Arg Asp Val Lys Leu Trp His Asp Ala Glu Val Phe Lys Pro

405 410 415

gag cgt ttc gag agc tct agc atc gat ttt cgt ggc aat gat ttc gag 1296

Glu Arg Phe Glu Ser Ser Ser Ile Asp Phe Arg Gly Asn Asp Phe Glu

420 425 430

ttc acg ccg ttt ggc gct ggt cgt cgt atg tgc ccg ggt gtc acc ctg 1344

Phe Thr Pro Phe Gly Ala Gly Arg Arg Met Cys Pro Gly Val Thr Leu

435 440 445

ggt ctg gcc aat ctg gaa ctg gcc ttg gcg tcc ctt ctg tac cac ttc 1392

Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe

450 455 460

gat tgg gat ctc ccg gac ggc atc ggt ctg gaa gaa ctg gac atg agc 1440

Asp Trp Asp Leu Pro Asp Gly Ile Gly Leu Glu Glu Leu Asp Met Ser

465 470 475 480

gaa acc tcc ggt atc acg ctg cgt aaa aag agc atg ctg tgg ctg aag 1488

Glu Thr Ser Gly Ile Thr Leu Arg Lys Lys Ser Met Leu Trp Leu Lys

485 490 495

gcg cgt ccg tac aat aac ttt att ccg aac taa 1521

Ala Arg Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 15

<211> 506

<212> PRT

<213> 编码VzCP7186的N末端变体的经优化的cDNA

<400> 15

Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu

1 5 10 15

Leu Ser Leu Trp Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu

20 25 30

Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His

35 40 45

His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg

50 55 60

Glu Met Ser Gly Ala Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ala

65 70 75 80

Val Pro Thr Leu Val Ala Ser Ser Ala Glu Ala Ala Arg Glu Val Met

85 90 95

Arg Thr His Asp Leu Ala Phe Cys Asn Arg His Leu Gly Val Thr Phe

100 105 110

Asp Thr Ile Thr Cys Gly Gly Lys Asp Ile Ile Gly Ser Pro Tyr Asn

115 120 125

Ala Gln Trp Arg Glu Leu Arg Lys Leu Cys Met Leu Glu Ile Phe Ser

130 135 140

Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala

145 150 155 160

Asn Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Arg Gln Pro

165 170 175

Val Asn Leu Thr Glu Gly Ile Cys Arg Met Ile Asn Asp Val Ala Ala

180 185 190

Arg Thr Ala Val Gly Asp Arg Cys Arg Tyr Arg Asp Glu Tyr Met His

195 200 205

Glu Leu Asp Glu Val Val Arg Leu Val Ser Gly Phe Asn Leu Ala Asp

210 215 220

Leu Tyr Pro Ser Ser Trp Leu Val Arg Arg Phe Ser Ala Ala Ala Arg

225 230 235 240

Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile

245 250 255

Ile Glu Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Asp Leu

260 265 270

Leu Gly Val Leu Leu Arg Leu Gln Lys Glu Gly Gly Leu Gln Phe Ala

275 280 285

Leu Thr Asn Glu Ile Val Ser Thr Val Ile Phe Asp Ile Phe Ser Ala

290 295 300

Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu

305 310 315 320

Val Lys Asn Pro Gln Val Met His Lys Ala Arg Ser Glu Val Arg Glu

325 330 335

Thr Phe Arg Gly Gln Asp Lys Ile Ser Glu Asp Asp Leu Val Lys Leu

340 345 350

Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro

355 360 365

Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Val Met

370 375 380

Gly Tyr Asp Val Pro Lys Gly Thr Lys Val Phe Val Asn Val Trp Ala

385 390 395 400

Ile Ala Arg Asp Val Lys Leu Trp His Asp Ala Glu Val Phe Lys Pro

405 410 415

Glu Arg Phe Glu Ser Ser Ser Ile Asp Phe Arg Gly Asn Asp Phe Glu

420 425 430

Phe Thr Pro Phe Gly Ala Gly Arg Arg Met Cys Pro Gly Val Thr Leu

435 440 445

Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe

450 455 460

Asp Trp Asp Leu Pro Asp Gly Ile Gly Leu Glu Glu Leu Asp Met Ser

465 470 475 480

Glu Thr Ser Gly Ile Thr Leu Arg Lys Lys Ser Met Leu Trp Leu Lys

485 490 495

Ala Arg Pro Tyr Asn Asn Phe Ile Pro Asn

500 505

<210> 16

<211> 1542

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzCP521-11野生型cDNA开放阅读框序列

<400> 16

atggaggaca ctaagatcct cgtcgccgcg gtgtccgtgt gcgtgcttct tgtggtcctc 60

tccaagctca agaagtccct gctgcccggc gcgaaaccaa agcttaacct gcccccgggg 120

ccatggacgc tgccggtgat cggcagcctc caccacgtga tcacctaccc caacctccac 180

cgcgcactgc acgggctggc gcagaagtac ggtccggtga tgatgttccg gctcggcgag 240

gtgccaatga tggtggtgtc gtcgccggcg gccgcgcagg aggccctcaa gacgaacgac 300

atcgccttcg ccgaccggta caccaacgcc accatcggcg cgctcacctt ccatggcgag 360

gacatggcgt tcgcgcccta cggcgagcgg tggcgccagc tccgcaagat ctgcgtgctg 420

gagctgctca gcgccgcccg ggtgcagtcg ttccgccaca tccgggcgga ggaggtgtcg 480

cggctcgtcg ggaaactcgc cgcgtccgcc gccgccggcg aagctgtcca cctcaacaag 540

attgtcgcga agttcgtcaa cgacaccatc gtgagggagg cggtcggcag cgggagcaag 600

caccaggacg agtacctcaa ctccatcgac gtagccctcc ggcagacaat gggggtcgcc 660

ctcgccgacc tcttcccgtc ttcgaggctc atacagatga ttgacacggc accccggaag 720

gtgctcgcgg cccggaacaa catggagcgc atcctcgagg aaatcatcaa cgagaccaag 780

gaagccatgg accgcggcga cggccagaag aaggtggagg gcatcctcgg tgtcctgctg 840

aggctccaga aggaaggcag cacgccggtc ccgctcacca acgaggtcat cgttacggtg 900

atgtttgaca tgtttggcgc tggcagcgac acctcgtcga ccttgctgac ctggtgcatg 960

atggagctag tccggtcacc gccgacgatg gccaaagtgc aagacgaggt gcgagaggcc 1020

ttcaaaggga agaaggagag caccatcatc actgaagacg acctcaaggg gctcacctac 1080

ctcaagcaag tgatcaagga ggccctgagg atgcaccctc cggtgcccct cctgcttcca 1140

aggaagtgtc gcgagacgtg caaggtcatg ggctacgaca ttcccaaggg cacggtagtg 1200

ttcgctaacg catgggcaat cggcagggat cccaagtatt gggaggatcc agaggagttc 1260

aagccagagc gattcgacaa gagcaatgtg gactacaagg gaacaaactt tgagtacctg 1320

ccgtttggat ctggccgtcg gatttgtccc ggcataaacc taggcttgtg caacattgag 1380

ctcgcgttgg cgagccttct atatcacttt gactggaagc tgccgaacgg aatggagccc 1440

aaagacatag atatgggaga ggctcaaggg ttaatcgcca gtaagaaaac aaacctaacc 1500

ctgcaccctg tgactcgcat tgctccggcc ggttttaatt aa 1542

<210> 17

<211> 1542

<212> DNA

<213> 编码VzCP521-11的经优化的cDNA序列

<220>

<221> CDS

<222> (1)..(1542)

<400> 17

atg gaa gat act aaa att ctg gtc gcg gct gtc tct gtt tgt gtg ctg 48

Met Glu Asp Thr Lys Ile Leu Val Ala Ala Val Ser Val Cys Val Leu

1 5 10 15

ttg gtg gtt ctt agc aaa ctg aag aag tcc ctg ctg ccg ggt gct aaa 96

Leu Val Val Leu Ser Lys Leu Lys Lys Ser Leu Leu Pro Gly Ala Lys

20 25 30

ccg aaa ttg aat ctg cct ccg ggt ccg tgg acg ctg cct gtg att ggc 144

Pro Lys Leu Asn Leu Pro Pro Gly Pro Trp Thr Leu Pro Val Ile Gly

35 40 45

agc ctg cac cat gtt atc acc tat cct aac ttg cat cgt gcg ctg cac 192

Ser Leu His His Val Ile Thr Tyr Pro Asn Leu His Arg Ala Leu His

50 55 60

ggt ctg gct cag aag tat ggt ccg gtc atg atg ttc cgt ttg ggt gag 240

Gly Leu Ala Gln Lys Tyr Gly Pro Val Met Met Phe Arg Leu Gly Glu

65 70 75 80

gtg ccg atg atg gtc gtt tcc agc ccg gct gca gct caa gag gct ttg 288

Val Pro Met Met Val Val Ser Ser Pro Ala Ala Ala Gln Glu Ala Leu

85 90 95

aaa acg aat gac att gca ttt gcg gat cgt tat acc aac gcg acg atc 336

Lys Thr Asn Asp Ile Ala Phe Ala Asp Arg Tyr Thr Asn Ala Thr Ile

100 105 110

ggt gcc ctg acc ttt cac ggc gag gac atg gca ttc gca ccg tac ggc 384

Gly Ala Leu Thr Phe His Gly Glu Asp Met Ala Phe Ala Pro Tyr Gly

115 120 125

gag cgt tgg cgt caa ctg cgc aag atc tgc gtt ctg gag ctg ctg tcc 432

Glu Arg Trp Arg Gln Leu Arg Lys Ile Cys Val Leu Glu Leu Leu Ser

130 135 140

gca gcc cgt gtc cag agc ttt cgt cac atc cgt gcg gag gag gtc agc 480

Ala Ala Arg Val Gln Ser Phe Arg His Ile Arg Ala Glu Glu Val Ser

145 150 155 160

cgt ctg gtt ggt aaa ttg gct gcc agc gcc gca gca ggt gag gcg gtt 528

Arg Leu Val Gly Lys Leu Ala Ala Ser Ala Ala Ala Gly Glu Ala Val

165 170 175

cac ctg aac aag att gtt gcg aaa ttc gtc aat gat acg att gtt cgt 576

His Leu Asn Lys Ile Val Ala Lys Phe Val Asn Asp Thr Ile Val Arg

180 185 190

gaa gcc gtg ggt agc ggc tct aaa cac caa gat gag tac ctg aat agc 624

Glu Ala Val Gly Ser Gly Ser Lys His Gln Asp Glu Tyr Leu Asn Ser

195 200 205

att gat gtt gcg ctg cgc caa acg atg ggc gtg gca ctg gcc gac ctg 672

Ile Asp Val Ala Leu Arg Gln Thr Met Gly Val Ala Leu Ala Asp Leu

210 215 220

ttc ccg agc tct cgc ctg atc cag atg atc gat acc gca ccg cgc aaa 720

Phe Pro Ser Ser Arg Leu Ile Gln Met Ile Asp Thr Ala Pro Arg Lys

225 230 235 240

gtt ctg gcc gcg cgt aac aat atg gaa cgt atc ctg gaa gag atc att 768

Val Leu Ala Ala Arg Asn Asn Met Glu Arg Ile Leu Glu Glu Ile Ile

245 250 255

aac gaa acc aaa gag gca atg gat cgt ggt gac ggc cag aag aaa gtc 816

Asn Glu Thr Lys Glu Ala Met Asp Arg Gly Asp Gly Gln Lys Lys Val

260 265 270

gag ggc att ctg ggc gtc ttg ctg cgt ctg cag aaa gag ggt agc acc 864

Glu Gly Ile Leu Gly Val Leu Leu Arg Leu Gln Lys Glu Gly Ser Thr

275 280 285

ccg gtg ccg ctg acc aat gag gtg atc gtt acc gtc atg ttc gat atg 912

Pro Val Pro Leu Thr Asn Glu Val Ile Val Thr Val Met Phe Asp Met

290 295 300

ttc ggc gcg ggc agc gac acg agc agc acc ctg ttg acc tgg tgc atg 960

Phe Gly Ala Gly Ser Asp Thr Ser Ser Thr Leu Leu Thr Trp Cys Met

305 310 315 320

atg gaa ttg gtt cgt agc cca cca aca atg gca aag gtc caa gac gaa 1008

Met Glu Leu Val Arg Ser Pro Pro Thr Met Ala Lys Val Gln Asp Glu

325 330 335

gtg cgt gag gca ttt aaa ggc aag aaa gaa agc acc atc atc acc gag 1056

Val Arg Glu Ala Phe Lys Gly Lys Lys Glu Ser Thr Ile Ile Thr Glu

340 345 350

gat gac ttg aag ggc ctg acc tac ctg aag cag gtc atc aaa gag gca 1104

Asp Asp Leu Lys Gly Leu Thr Tyr Leu Lys Gln Val Ile Lys Glu Ala

355 360 365

ctg cgc atg cac cct ccg gtg ccg ttg ctg ctg ccg cgc aaa tgc cgc 1152

Leu Arg Met His Pro Pro Val Pro Leu Leu Leu Pro Arg Lys Cys Arg

370 375 380

gaa acc tgc aaa gtt atg ggc tat gac atc ccg aaa ggt acg gtg gtt 1200

Glu Thr Cys Lys Val Met Gly Tyr Asp Ile Pro Lys Gly Thr Val Val

385 390 395 400

ttt gca aat gcc tgg gcg att ggt cgc gat ccg aag tat tgg gaa gac 1248

Phe Ala Asn Ala Trp Ala Ile Gly Arg Asp Pro Lys Tyr Trp Glu Asp

405 410 415

ccg gag gag ttc aaa cct gaa cgt ttc gat aag agc aac gtt gac tac 1296

Pro Glu Glu Phe Lys Pro Glu Arg Phe Asp Lys Ser Asn Val Asp Tyr

420 425 430

aaa ggt act aac ttc gag tat ctg ccg ttc ggt tcg ggt cgt cgc att 1344

Lys Gly Thr Asn Phe Glu Tyr Leu Pro Phe Gly Ser Gly Arg Arg Ile

435 440 445

tgc ccg ggt atc aac ttg ggt ctg tgt aac att gag ctg gcc ttg gct 1392

Cys Pro Gly Ile Asn Leu Gly Leu Cys Asn Ile Glu Leu Ala Leu Ala

450 455 460

tcc ctg ttg tat cat ttc gat tgg aaa ctg ccg aat ggc atg gag ccg 1440

Ser Leu Leu Tyr His Phe Asp Trp Lys Leu Pro Asn Gly Met Glu Pro

465 470 475 480

aag gac att gac atg ggt gag gca caa ggc ctg atc gca tcc aaa aag 1488

Lys Asp Ile Asp Met Gly Glu Ala Gln Gly Leu Ile Ala Ser Lys Lys

485 490 495

acg aat ttg acg ctg cac ccg gtt act cgt atc gct ccg gca ggt ttt 1536

Thr Asn Leu Thr Leu His Pro Val Thr Arg Ile Ala Pro Ala Gly Phe

500 505 510

aat tga 1542

Asn

<210> 18

<211> 513

<212> PRT

<213> 编码VzCP521-11的经优化的cDNA序列

<400> 18

Met Glu Asp Thr Lys Ile Leu Val Ala Ala Val Ser Val Cys Val Leu

1 5 10 15

Leu Val Val Leu Ser Lys Leu Lys Lys Ser Leu Leu Pro Gly Ala Lys

20 25 30

Pro Lys Leu Asn Leu Pro Pro Gly Pro Trp Thr Leu Pro Val Ile Gly

35 40 45

Ser Leu His His Val Ile Thr Tyr Pro Asn Leu His Arg Ala Leu His

50 55 60

Gly Leu Ala Gln Lys Tyr Gly Pro Val Met Met Phe Arg Leu Gly Glu

65 70 75 80

Val Pro Met Met Val Val Ser Ser Pro Ala Ala Ala Gln Glu Ala Leu

85 90 95

Lys Thr Asn Asp Ile Ala Phe Ala Asp Arg Tyr Thr Asn Ala Thr Ile

100 105 110

Gly Ala Leu Thr Phe His Gly Glu Asp Met Ala Phe Ala Pro Tyr Gly

115 120 125

Glu Arg Trp Arg Gln Leu Arg Lys Ile Cys Val Leu Glu Leu Leu Ser

130 135 140

Ala Ala Arg Val Gln Ser Phe Arg His Ile Arg Ala Glu Glu Val Ser

145 150 155 160

Arg Leu Val Gly Lys Leu Ala Ala Ser Ala Ala Ala Gly Glu Ala Val

165 170 175

His Leu Asn Lys Ile Val Ala Lys Phe Val Asn Asp Thr Ile Val Arg

180 185 190

Glu Ala Val Gly Ser Gly Ser Lys His Gln Asp Glu Tyr Leu Asn Ser

195 200 205

Ile Asp Val Ala Leu Arg Gln Thr Met Gly Val Ala Leu Ala Asp Leu

210 215 220

Phe Pro Ser Ser Arg Leu Ile Gln Met Ile Asp Thr Ala Pro Arg Lys

225 230 235 240

Val Leu Ala Ala Arg Asn Asn Met Glu Arg Ile Leu Glu Glu Ile Ile

245 250 255

Asn Glu Thr Lys Glu Ala Met Asp Arg Gly Asp Gly Gln Lys Lys Val

260 265 270

Glu Gly Ile Leu Gly Val Leu Leu Arg Leu Gln Lys Glu Gly Ser Thr

275 280 285

Pro Val Pro Leu Thr Asn Glu Val Ile Val Thr Val Met Phe Asp Met

290 295 300

Phe Gly Ala Gly Ser Asp Thr Ser Ser Thr Leu Leu Thr Trp Cys Met

305 310 315 320

Met Glu Leu Val Arg Ser Pro Pro Thr Met Ala Lys Val Gln Asp Glu

325 330 335

Val Arg Glu Ala Phe Lys Gly Lys Lys Glu Ser Thr Ile Ile Thr Glu

340 345 350

Asp Asp Leu Lys Gly Leu Thr Tyr Leu Lys Gln Val Ile Lys Glu Ala

355 360 365

Leu Arg Met His Pro Pro Val Pro Leu Leu Leu Pro Arg Lys Cys Arg

370 375 380

Glu Thr Cys Lys Val Met Gly Tyr Asp Ile Pro Lys Gly Thr Val Val

385 390 395 400

Phe Ala Asn Ala Trp Ala Ile Gly Arg Asp Pro Lys Tyr Trp Glu Asp

405 410 415

Pro Glu Glu Phe Lys Pro Glu Arg Phe Asp Lys Ser Asn Val Asp Tyr

420 425 430

Lys Gly Thr Asn Phe Glu Tyr Leu Pro Phe Gly Ser Gly Arg Arg Ile

435 440 445

Cys Pro Gly Ile Asn Leu Gly Leu Cys Asn Ile Glu Leu Ala Leu Ala

450 455 460

Ser Leu Leu Tyr His Phe Asp Trp Lys Leu Pro Asn Gly Met Glu Pro

465 470 475 480

Lys Asp Ile Asp Met Gly Glu Ala Gln Gly Leu Ile Ala Ser Lys Lys

485 490 495

Thr Asn Leu Thr Leu His Pro Val Thr Arg Ile Ala Pro Ala Gly Phe

500 505 510

Asn

<210> 19

<211> 469

<212> PRT

<213> 香根草(Vetiveria zizanoides)_VzCP8201的催化结构域

<400> 19

Trp Gln Leu Pro Leu Ile Gly Ser Leu His His Leu Leu Leu Ser Arg

1 5 10 15

Phe Ser Asp Leu Pro His Arg Ala Leu Arg Glu Met Ser Gly Thr Tyr

20 25 30

Gly Pro Leu Met Leu Leu Arg Phe Gly Ser Val Pro Thr Leu Val Val

35 40 45

Ser Ser Ala Glu Ala Ala Arg Glu Val Met Arg Thr His Asp Leu Ala

50 55 60

Phe Cys Asp Arg His Leu Gly Val Thr Leu Asp Ile Val Thr Cys Gly

65 70 75 80

Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn Ala His Trp Arg Glu Leu

85 90 95

Arg Lys Leu Cys Met Val Glu Ile Leu Ser Gln Arg Arg Val Leu Ser

100 105 110

Phe Arg Ser Ile Arg Glu Glu Glu Val Ala Ser Leu Val Arg Ser Ile

115 120 125

Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro Val Asn Leu Thr Glu Gly

130 135 140

Ile Ser Arg Met Ile Asn Asp Val Ala Ala Arg Thr Val Val Gly Asp

145 150 155 160

Arg Cys Lys Tyr Gln Asp Glu Tyr Met His Glu Leu Asp Glu Val Val

165 170 175

Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp Leu Tyr Pro Ser Ser Arg

180 185 190

Leu Val Arg Arg Phe Ser Ala Ala Ala Arg Asp Ala Arg Arg Cys Gln

195 200 205

Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile Ile Gln Glu Arg Glu Ala

210 215 220

Met Pro Thr Pro Glu Arg Asp Glu Glu Asp Leu Leu Gly Val Leu Leu

225 230 235 240

Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe Ala Leu Thr Asn Glu Ile

245 250 255

Val Ser Thr Val Ile Tyr Asp Ile Phe Ser Ala Gly Ser Glu Thr Ser

260 265 270

Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu Val Lys Asn Pro Gln

275 280 285

Val Met Arg Lys Ala Gln Ser Glu Val Arg Asp Thr Phe Lys Gly Asn

290 295 300

Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys Leu Arg Tyr Leu Gln Leu

305 310 315 320

Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro Val Pro Leu Leu Leu

325 330 335

Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile Met Gly Tyr Asp Val Leu

340 345 350

Lys Gly Thr Lys Val Phe Val Asn Ala Trp Ala Ile Ala Arg Asp Thr

355 360 365

Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg Pro Glu Arg Phe Glu Ser

370 375 380

Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe Glu Phe Thr Pro Phe Gly

385 390 395 400

Ala Gly Arg Arg Val Cys Pro Gly Ile Thr Leu Gly Leu Ala Asn Leu

405 410 415

Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe Asp Trp Asp Leu Pro

420 425 430

Asn Gly Ala Arg Leu Glu Asp Leu Asp Met Ala Glu Ala Phe Gly Ile

435 440 445

Thr Leu Lys Arg Lys Ser Met Leu Trp Leu Lys Ala Lys Pro Tyr Asn

450 455 460

Asn Phe Ile Pro Asn

465

<210> 20

<211> 468

<212> PRT

<213> 香根草(Vetiveria zizanoides)_VzCP7186的催化结构域

<400> 20

Trp Gln Leu Pro Leu Ile Gly Ser Leu His His Leu Leu Leu Ser Arg

1 5 10 15

Phe Ser Asp Leu Pro His Arg Ala Leu Arg Glu Met Ser Gly Ala Tyr

20 25 30

Gly Pro Leu Met Leu Leu Arg Phe Gly Ala Val Pro Thr Leu Val Ala

35 40 45

Ser Ser Ala Glu Ala Ala Arg Glu Val Met Arg Thr His Asp Leu Ala

50 55 60

Phe Cys Asn Arg His Leu Gly Val Thr Phe Asp Thr Ile Thr Cys Gly

65 70 75 80

Gly Lys Asp Ile Ile Gly Ser Pro Tyr Asn Ala Gln Trp Arg Glu Leu

85 90 95

Arg Lys Leu Cys Met Leu Glu Ile Phe Ser Gln Arg Arg Val Leu Ser

100 105 110

Phe Arg Ser Ile Arg Glu Glu Glu Val Ala Asn Leu Val Arg Ser Ile

115 120 125

Ser Asp Glu Cys Gly Gly Gly Arg Gln Pro Val Asn Leu Thr Glu Gly

130 135 140

Ile Cys Arg Met Ile Asn Asp Val Ala Ala Arg Thr Ala Val Gly Asp

145 150 155 160

Arg Cys Arg Tyr Arg Asp Glu Tyr Met His Glu Leu Asp Glu Val Val

165 170 175

Arg Leu Val Ser Gly Phe Asn Leu Ala Asp Leu Tyr Pro Ser Ser Trp

180 185 190

Leu Val Arg Arg Phe Ser Ala Ala Ala Arg Asp Ala Arg Arg Cys Gln

195 200 205

Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile Ile Glu Glu Arg Glu Ala

210 215 220

Met Pro Thr Pro Glu Arg Asp Glu Asp Leu Leu Gly Val Leu Leu Arg

225 230 235 240

Leu Gln Lys Glu Gly Gly Leu Gln Phe Ala Leu Thr Asn Glu Ile Val

245 250 255

Ser Thr Val Ile Phe Asp Ile Phe Ser Ala Gly Ser Glu Thr Ser Ser

260 265 270

Thr Val Leu Val Trp Ala Met Ser Glu Leu Val Lys Asn Pro Gln Val

275 280 285

Met His Lys Ala Arg Ser Glu Val Arg Glu Thr Phe Arg Gly Gln Asp

290 295 300

Lys Ile Ser Glu Asp Asp Leu Val Lys Leu Arg Tyr Leu Gln Leu Val

305 310 315 320

Ile Lys Glu Thr Leu Arg Leu His Ala Pro Val Pro Leu Leu Leu Pro

325 330 335

Arg Glu Cys Arg Glu Ser Cys Gln Val Met Gly Tyr Asp Val Pro Lys

340 345 350

Gly Thr Lys Val Phe Val Asn Val Trp Ala Ile Ala Arg Asp Val Lys

355 360 365

Leu Trp His Asp Ala Glu Val Phe Lys Pro Glu Arg Phe Glu Ser Ser

370 375 380

Ser Ile Asp Phe Arg Gly Asn Asp Phe Glu Phe Thr Pro Phe Gly Ala

385 390 395 400

Gly Arg Arg Met Cys Pro Gly Val Thr Leu Gly Leu Ala Asn Leu Glu

405 410 415

Leu Ala Leu Ala Ser Leu Leu Tyr His Phe Asp Trp Asp Leu Pro Asp

420 425 430

Gly Ile Gly Leu Glu Glu Leu Asp Met Ser Glu Thr Ser Gly Ile Thr

435 440 445

Leu Arg Lys Lys Ser Met Leu Trp Leu Lys Ala Arg Pro Tyr Asn Asn

450 455 460

Phe Ile Pro Asn

465

<210> 21

<211> 472

<212> PRT

<213> 香根草(Vetiveria zizanoides)_VzCP521-11的催化结构域

<400> 21

Trp Thr Leu Pro Val Ile Gly Ser Leu His His Val Ile Thr Tyr Pro

1 5 10 15

Asn Leu His Arg Ala Leu His Gly Leu Ala Gln Lys Tyr Gly Pro Val

20 25 30

Met Met Phe Arg Leu Gly Glu Val Pro Met Met Val Val Ser Ser Pro

35 40 45

Ala Ala Ala Gln Glu Ala Leu Lys Thr Asn Asp Ile Ala Phe Ala Asp

50 55 60

Arg Tyr Thr Asn Ala Thr Ile Gly Ala Leu Thr Phe His Gly Glu Asp

65 70 75 80

Met Ala Phe Ala Pro Tyr Gly Glu Arg Trp Arg Gln Leu Arg Lys Ile

85 90 95

Cys Val Leu Glu Leu Leu Ser Ala Ala Arg Val Gln Ser Phe Arg His

100 105 110

Ile Arg Ala Glu Glu Val Ser Arg Leu Val Gly Lys Leu Ala Ala Ser

115 120 125

Ala Ala Ala Gly Glu Ala Val His Leu Asn Lys Ile Val Ala Lys Phe

130 135 140

Val Asn Asp Thr Ile Val Arg Glu Ala Val Gly Ser Gly Ser Lys His

145 150 155 160

Gln Asp Glu Tyr Leu Asn Ser Ile Asp Val Ala Leu Arg Gln Thr Met

165 170 175

Gly Val Ala Leu Ala Asp Leu Phe Pro Ser Ser Arg Leu Ile Gln Met

180 185 190

Ile Asp Thr Ala Pro Arg Lys Val Leu Ala Ala Arg Asn Asn Met Glu

195 200 205

Arg Ile Leu Glu Glu Ile Ile Asn Glu Thr Lys Glu Ala Met Asp Arg

210 215 220

Gly Asp Gly Gln Lys Lys Val Glu Gly Ile Leu Gly Val Leu Leu Arg

225 230 235 240

Leu Gln Lys Glu Gly Ser Thr Pro Val Pro Leu Thr Asn Glu Val Ile

245 250 255

Val Thr Val Met Phe Asp Met Phe Gly Ala Gly Ser Asp Thr Ser Ser

260 265 270

Thr Leu Leu Thr Trp Cys Met Met Glu Leu Val Arg Ser Pro Pro Thr

275 280 285

Met Ala Lys Val Gln Asp Glu Val Arg Glu Ala Phe Lys Gly Lys Lys

290 295 300

Glu Ser Thr Ile Ile Thr Glu Asp Asp Leu Lys Gly Leu Thr Tyr Leu

305 310 315 320

Lys Gln Val Ile Lys Glu Ala Leu Arg Met His Pro Pro Val Pro Leu

325 330 335

Leu Leu Pro Arg Lys Cys Arg Glu Thr Cys Lys Val Met Gly Tyr Asp

340 345 350

Ile Pro Lys Gly Thr Val Val Phe Ala Asn Ala Trp Ala Ile Gly Arg

355 360 365

Asp Pro Lys Tyr Trp Glu Asp Pro Glu Glu Phe Lys Pro Glu Arg Phe

370 375 380

Asp Lys Ser Asn Val Asp Tyr Lys Gly Thr Asn Phe Glu Tyr Leu Pro

385 390 395 400

Phe Gly Ser Gly Arg Arg Ile Cys Pro Gly Ile Asn Leu Gly Leu Cys

405 410 415

Asn Ile Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe Asp Trp Lys

420 425 430

Leu Pro Asn Gly Met Glu Pro Lys Asp Ile Asp Met Gly Glu Ala Gln

435 440 445

Gly Leu Ile Ala Ser Lys Lys Thr Asn Leu Thr Leu His Pro Val Thr

450 455 460

Arg Ile Ala Pro Ala Gly Phe Asn

465 470

<210> 22

<211> 2130

<212> DNA

<213> 胡椒薄荷(Mentha piperita)_P450还原酶 (CPRm)

<220>

<221> CDS

<222> (1)..(2130)

<400> 22

atg gaa cct agc tct cag aaa ctg tct ccg ttg gaa ttt gtt gct gct 48

Met Glu Pro Ser Ser Gln Lys Leu Ser Pro Leu Glu Phe Val Ala Ala

1 5 10 15

atc ctg aag ggc gac tac agc agc ggt cag gtt gaa ggt ggt cca ccg 96

Ile Leu Lys Gly Asp Tyr Ser Ser Gly Gln Val Glu Gly Gly Pro Pro

20 25 30

cca ggt ctg gca gct atg ttg atg gaa aat aag gat ttg gtg atg gtt 144

Pro Gly Leu Ala Ala Met Leu Met Glu Asn Lys Asp Leu Val Met Val

35 40 45

ctg acg acg tcc gtg gca gtc ctg atc ggc tgt gtc gtg gtc ctg gca 192

Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys Val Val Val Leu Ala

50 55 60

tgg cgt cgt gcg gca ggt agc ggt aag tac aag caa cct gaa ctg cct 240

Trp Arg Arg Ala Ala Gly Ser Gly Lys Tyr Lys Gln Pro Glu Leu Pro

65 70 75 80

aaa ctg gtg gtc ccg aaa gca gcc gaa ccg gag gag gca gag gat gat 288

Lys Leu Val Val Pro Lys Ala Ala Glu Pro Glu Glu Ala Glu Asp Asp

85 90 95

aaa acc aag atc agc gtg ttt ttc ggc acc caa acc ggt acg gca gaa 336

Lys Thr Lys Ile Ser Val Phe Phe Gly Thr Gln Thr Gly Thr Ala Glu

100 105 110

ggt ttc gcg aag gct ttt gtt gaa gag gcc aag gcg cgt tat cag cag 384

Gly Phe Ala Lys Ala Phe Val Glu Glu Ala Lys Ala Arg Tyr Gln Gln

115 120 125

gcc cgt ttc aaa gtt atc gac ctg gac gac tat gcg gca gac gat gac 432

Ala Arg Phe Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp Asp Asp

130 135 140

gag tac gaa gag aaa ctg aag aag gaa aac ttg gca ttc ttc ttc ttg 480

Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asn Leu Ala Phe Phe Phe Leu

145 150 155 160

gcg tcc tac ggt gac ggc gag ccg acg gac aac gcg gca cgc ttt tac 528

Ala Ser Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr

165 170 175

aaa tgg ttt acg gag ggt aag gac cgt ggt gaa tgg ctg aac aat ctg 576

Lys Trp Phe Thr Glu Gly Lys Asp Arg Gly Glu Trp Leu Asn Asn Leu

180 185 190

cag tac ggc gtt ttt ggt ctg ggt aac cgt caa tat gag cat ttc aat 624

Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr Glu His Phe Asn

195 200 205

aag atc gcc att gtc gtc gat gat ctg atc ttc gag caa ggt ggc aag 672

Lys Ile Ala Ile Val Val Asp Asp Leu Ile Phe Glu Gln Gly Gly Lys

210 215 220

aag ctg gtt ccg gtg ggt ctg ggt gac gat gac cag tgc att gag gat 720

Lys Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln Cys Ile Glu Asp

225 230 235 240

gat ttt gcg gcg tgg cgt gaa ctg gtc tgg ccg gaa ctg gat aaa ctg 768

Asp Phe Ala Ala Trp Arg Glu Leu Val Trp Pro Glu Leu Asp Lys Leu

245 250 255

ctg cgt aac gaa gac gac gct acc gtg gca acc ccg tac agc gcc gct 816

Leu Arg Asn Glu Asp Asp Ala Thr Val Ala Thr Pro Tyr Ser Ala Ala

260 265 270

gtg ctg caa tac cgc gtg gtt ttc cac gat cac att gac ggc ctg att 864

Val Leu Gln Tyr Arg Val Val Phe His Asp His Ile Asp Gly Leu Ile

275 280 285

agc gaa aac ggt agc ccg aac ggt cat gct aat ggc aat acc gtg tac 912

Ser Glu Asn Gly Ser Pro Asn Gly His Ala Asn Gly Asn Thr Val Tyr

290 295 300

gat gcg caa cac ccg tgc cgt agc aac gtc gcg gtc aag aag gaa ttg 960

Asp Ala Gln His Pro Cys Arg Ser Asn Val Ala Val Lys Lys Glu Leu

305 310 315 320

cat act ccg gcg agc gat cgc agc tgc acc cac ctg gaa ttt aac att 1008

His Thr Pro Ala Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asn Ile

325 330 335

agc ggt acc ggc ctg atg tac gag acg ggt gac cac gtc ggt gtg tat 1056

Ser Gly Thr Gly Leu Met Tyr Glu Thr Gly Asp His Val Gly Val Tyr

340 345 350

tgc gag aac ctg ttg gaa acc gtg gag gag gcc gag aag ttg ttg aac 1104

Cys Glu Asn Leu Leu Glu Thr Val Glu Glu Ala Glu Lys Leu Leu Asn

355 360 365

ctg agc ccg cag acg tac ttc tcc gtt cac acc gac aac gag gac ggt 1152

Leu Ser Pro Gln Thr Tyr Phe Ser Val His Thr Asp Asn Glu Asp Gly

370 375 380

acg ccg ttg agc ggc agc agc ctg ccg cca ccg ttt ccg ccg tgc acc 1200

Thr Pro Leu Ser Gly Ser Ser Leu Pro Pro Pro Phe Pro Pro Cys Thr

385 390 395 400

ttg cgc acg gca ttg acc aaa tac gca gac ttg act tct gca ccg aaa 1248

Leu Arg Thr Ala Leu Thr Lys Tyr Ala Asp Leu Thr Ser Ala Pro Lys

405 410 415

aag tcg gtg ctg gtg gcg ctg gcc gag tac gca tct gac cag ggt gaa 1296

Lys Ser Val Leu Val Ala Leu Ala Glu Tyr Ala Ser Asp Gln Gly Glu

420 425 430

gcg gat cgt ttg cgt ttc ttg gcg agc ccg agc ggc aaa gag gaa tat 1344

Ala Asp Arg Leu Arg Phe Leu Ala Ser Pro Ser Gly Lys Glu Glu Tyr

435 440 445

gca cag tac atc ttg gca agc cag cgc acg ctg ctg gag gtc atg gcg 1392

Ala Gln Tyr Ile Leu Ala Ser Gln Arg Thr Leu Leu Glu Val Met Ala

450 455 460

gag ttc ccg tcg gcg aaa ccg ccg ctg ggt gtc ttt ttc gcg ggt gtc 1440

Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Gly Val

465 470 475 480

gct ccg cgc ctg cag ccg cgt ttc tat tcc att agc tct agc ccg aag 1488

Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser Ser Pro Lys

485 490 495

atc gca ccg ttc cgt att cac gtg acc tgc gcc ctg gtt tat gac aaa 1536

Ile Ala Pro Phe Arg Ile His Val Thr Cys Ala Leu Val Tyr Asp Lys

500 505 510

tcc cct acc ggt cgc gtt cat aag ggc atc tgt agc acg tgg atg aaa 1584

Ser Pro Thr Gly Arg Val His Lys Gly Ile Cys Ser Thr Trp Met Lys

515 520 525

aat gcg gtc ccg ctg gaa gaa agc aac gat tgt tcc tgg gct ccg atc 1632

Asn Ala Val Pro Leu Glu Glu Ser Asn Asp Cys Ser Trp Ala Pro Ile

530 535 540

ttc gtc cgc aac agc aac ttc aag ctg ccg acc gac ccg aag gtt ccg 1680

Phe Val Arg Asn Ser Asn Phe Lys Leu Pro Thr Asp Pro Lys Val Pro

545 550 555 560

att atc atg att ggt ccg ggt acc ggt ctg gcc cct ttt cgt ggc ttt 1728

Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe

565 570 575

ttg caa gag cgc ttg gcg ttg aaa gag agc ggt gct gaa ttg ggt ccg 1776

Leu Gln Glu Arg Leu Ala Leu Lys Glu Ser Gly Ala Glu Leu Gly Pro

580 585 590

gcg atc ttg ttc ttt ggt tgc cgt aac cgt aaa atg gac ttt att tac 1824

Ala Ile Leu Phe Phe Gly Cys Arg Asn Arg Lys Met Asp Phe Ile Tyr

595 600 605

gag gat gaa ctg aat gat ttc gtc aaa gcg ggc gtt gtc agc gag ctg 1872

Glu Asp Glu Leu Asn Asp Phe Val Lys Ala Gly Val Val Ser Glu Leu

610 615 620

atc gtc gct ttt agc cgc gaa ggc ccg atg aaa gaa tac gtg caa cac 1920

Ile Val Ala Phe Ser Arg Glu Gly Pro Met Lys Glu Tyr Val Gln His

625 630 635 640

aaa atg agc caa cgt gcc tcc gat gtg tgg aac atc att agc gac ggt 1968

Lys Met Ser Gln Arg Ala Ser Asp Val Trp Asn Ile Ile Ser Asp Gly

645 650 655

ggt tat gtt tat gtt tgc ggt gac gcg aag ggt atg gct cgt gat gtt 2016

Gly Tyr Val Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val

660 665 670

cac cgt acc ctg cat acc atc gca cag gag caa ggt agc atg tcc agc 2064

His Arg Thr Leu His Thr Ile Ala Gln Glu Gln Gly Ser Met Ser Ser

675 680 685

tcg gag gcc gaa ggt atg gtc aaa aac ctg caa acc acc ggt cgt tac 2112

Ser Glu Ala Glu Gly Met Val Lys Asn Leu Gln Thr Thr Gly Arg Tyr

690 695 700

ctg cgt gat gtg tgg taa 2130

Leu Arg Asp Val Trp

705

<210> 23

<211> 709

<212> PRT

<213> 胡椒薄荷(Mentha piperita)_P450还原酶 (CPRm)

<400> 23

Met Glu Pro Ser Ser Gln Lys Leu Ser Pro Leu Glu Phe Val Ala Ala

1 5 10 15

Ile Leu Lys Gly Asp Tyr Ser Ser Gly Gln Val Glu Gly Gly Pro Pro

20 25 30

Pro Gly Leu Ala Ala Met Leu Met Glu Asn Lys Asp Leu Val Met Val

35 40 45

Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys Val Val Val Leu Ala

50 55 60

Trp Arg Arg Ala Ala Gly Ser Gly Lys Tyr Lys Gln Pro Glu Leu Pro

65 70 75 80

Lys Leu Val Val Pro Lys Ala Ala Glu Pro Glu Glu Ala Glu Asp Asp

85 90 95

Lys Thr Lys Ile Ser Val Phe Phe Gly Thr Gln Thr Gly Thr Ala Glu

100 105 110

Gly Phe Ala Lys Ala Phe Val Glu Glu Ala Lys Ala Arg Tyr Gln Gln

115 120 125

Ala Arg Phe Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp Asp Asp

130 135 140

Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asn Leu Ala Phe Phe Phe Leu

145 150 155 160

Ala Ser Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr

165 170 175

Lys Trp Phe Thr Glu Gly Lys Asp Arg Gly Glu Trp Leu Asn Asn Leu

180 185 190

Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr Glu His Phe Asn

195 200 205

Lys Ile Ala Ile Val Val Asp Asp Leu Ile Phe Glu Gln Gly Gly Lys

210 215 220

Lys Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln Cys Ile Glu Asp

225 230 235 240

Asp Phe Ala Ala Trp Arg Glu Leu Val Trp Pro Glu Leu Asp Lys Leu

245 250 255

Leu Arg Asn Glu Asp Asp Ala Thr Val Ala Thr Pro Tyr Ser Ala Ala

260 265 270

Val Leu Gln Tyr Arg Val Val Phe His Asp His Ile Asp Gly Leu Ile

275 280 285

Ser Glu Asn Gly Ser Pro Asn Gly His Ala Asn Gly Asn Thr Val Tyr

290 295 300

Asp Ala Gln His Pro Cys Arg Ser Asn Val Ala Val Lys Lys Glu Leu

305 310 315 320

His Thr Pro Ala Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asn Ile

325 330 335

Ser Gly Thr Gly Leu Met Tyr Glu Thr Gly Asp His Val Gly Val Tyr

340 345 350

Cys Glu Asn Leu Leu Glu Thr Val Glu Glu Ala Glu Lys Leu Leu Asn

355 360 365

Leu Ser Pro Gln Thr Tyr Phe Ser Val His Thr Asp Asn Glu Asp Gly

370 375 380

Thr Pro Leu Ser Gly Ser Ser Leu Pro Pro Pro Phe Pro Pro Cys Thr

385 390 395 400

Leu Arg Thr Ala Leu Thr Lys Tyr Ala Asp Leu Thr Ser Ala Pro Lys

405 410 415

Lys Ser Val Leu Val Ala Leu Ala Glu Tyr Ala Ser Asp Gln Gly Glu

420 425 430

Ala Asp Arg Leu Arg Phe Leu Ala Ser Pro Ser Gly Lys Glu Glu Tyr

435 440 445

Ala Gln Tyr Ile Leu Ala Ser Gln Arg Thr Leu Leu Glu Val Met Ala

450 455 460

Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Gly Val

465 470 475 480

Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser Ser Pro Lys

485 490 495

Ile Ala Pro Phe Arg Ile His Val Thr Cys Ala Leu Val Tyr Asp Lys

500 505 510

Ser Pro Thr Gly Arg Val His Lys Gly Ile Cys Ser Thr Trp Met Lys

515 520 525

Asn Ala Val Pro Leu Glu Glu Ser Asn Asp Cys Ser Trp Ala Pro Ile

530 535 540

Phe Val Arg Asn Ser Asn Phe Lys Leu Pro Thr Asp Pro Lys Val Pro

545 550 555 560

Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe

565 570 575

Leu Gln Glu Arg Leu Ala Leu Lys Glu Ser Gly Ala Glu Leu Gly Pro

580 585 590

Ala Ile Leu Phe Phe Gly Cys Arg Asn Arg Lys Met Asp Phe Ile Tyr

595 600 605

Glu Asp Glu Leu Asn Asp Phe Val Lys Ala Gly Val Val Ser Glu Leu

610 615 620

Ile Val Ala Phe Ser Arg Glu Gly Pro Met Lys Glu Tyr Val Gln His

625 630 635 640

Lys Met Ser Gln Arg Ala Ser Asp Val Trp Asn Ile Ile Ser Asp Gly

645 650 655

Gly Tyr Val Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val

660 665 670

His Arg Thr Leu His Thr Ile Ala Gln Glu Gln Gly Ser Met Ser Ser

675 680 685

Ser Glu Ala Glu Gly Met Val Lys Asn Leu Gln Thr Thr Gly Arg Tyr

690 695 700

Leu Arg Asp Val Trp

705

<210> 24

<211> 20

<212> PRT

<213> N-末端替换肽

<400> 24

Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu

1 5 10 15

Leu Ser Leu Trp

20

<210> 25

<211> 66

<212> DNA

<213> 多接头

<400> 25

gtcgacaatt aaccatggtt aattaagctt atatatggta ccatatatga attcattaat 60

ctcgag 66

<210> 26

<211> 26

<212> DNA

<213> 延伸序列

<400> 26

gtcgacaatt aggtaaaaaa taaacc 26

<210> 27

<211> 19

<212> DNA

<213> 5'非编码序列

<400> 27

aagcttaagg aggtaaaaa 19

<210> 28

<211> 30

<212> DNA

<213> 3'非编码序列

<400> 28

ggtaccatat atgaattcat taatctcgag 30

<210> 29

<211> 62

<212> DNA

<213> 引物Inf8201-7186-Fw

<400> 29

taattttatt ccgaactaag tcgaaggagg taatatggcg ttgctgttgg ctgtttttct 60

gg 62

<210> 30

<211> 50

<212> DNA

<213> 引物Inf8201-7186-Rev

<400> 30

attttttacc taattgtcga cttagttcgg aataaagtta ttgtacggac 50

<210> 31

<211> 1925

<212> DNA

<213> 香根草(Vetiveria zizanoides)_Vzctg306, 编码VzZS1的全长cDNA，包括非编码区

<400> 31

gaagcaaagc catctgccgt gctatcactc tagcaaatta tactgagtgg ataaacttaa 60

taccacacca gacgttttgc attcatggcg acgactgccg ccttctgcct caccaccact 120

ccgatcggcg agccagtctg tcgccggcag tacctcccaa ccgtctgggg cagcttcttc 180

ctcacctacc agccatgcac gccggaagag gtccagtcca tggaggagag ggctctggcc 240

aagaagacgg aggtggggcg catgttgcag gaggtcgccg cctccagtaa cctcgcacgg 300

aagctgggcc ttgtcgatga gctagagcgg ctcggggtgg actatcacta caagacggag 360

atcaacgact tgctgggtgc catttataat ggcaaggacg acgataatgg aggttctgat 420

gacgacctct atatcacatc gcttaagttc tatctgctca ggaagcatgg gtacgcttta 480

tcttcagatg tgtttctgaa gttcagagat gagcaaggaa atatttcaag tgatgatgtg 540

aaatgcctga tcatgttgta tgatgcctca catttgagga ttcatgagga gaaaattctt 600

gacaacatca acagtttcac caagagctgc ctccaatcag ttttagaaac aaatttggaa 660

ccggctctcc aagaggaggt gcggtgcaca ttggagacac ctcgattcag aagggttgag 720

agaatcgaag cgaaacgctt tatctcagcg tacgaaaaga acatagcacg agatgacgcc 780

ctactagagt ttgcaaggct ggactacaat atcgtgcaaa ttctctactg caaggagctg 840

aaagaactta cagtatggtg gaaggagttc cattcacgga caaatctgac atttgcacga 900

gatagaattg tggagatgta tttctgggtc atggcaatta tttacgagcc ttgttactcg 960

tattcacgga tatgggttac aaaaatgttt ctatccgtgg cattgttgga tgacatctat 1020

gacaattata cgagcacaga ggagagcaat atctttacta cggccatgga aaggtgggat 1080

gtgaaggcca ccgaacaact gccagcaaac atgaggacat tctacgatta cttaatttgt 1140

acaacagatg aggtcgtaga agaattgaaa cttcagaata ataagaatgc tgaattagtc 1200

aagaaagtgc tgattgacgc cgctaaatgc taccattcgg aggtcaaatg gcgtgatgac 1260

cactacgtcc ctaatgatgt tggagagcac ctgcagcttt caatgcgaag cattgcagct 1320

atgcactcca tcaactttgt cttcatttca ctgggagctg tgtgtactag ggaggcggtt 1380

gagtgtgctt tcacttatcc aaaaattatt agaggtatat gtgttcacgc acgtattagt 1440

aacgatatcg cgtcacatga gcgagaacaa gcttcggagc atatggcatc aacgttgcaa 1500

acttgcatga agcagtatgg gattacagta gaggaagctg ctgaaaagct cagagtaata 1560

aacgaggagt catggatgga catcgttgag gaatgccttt ataaggacca gtatcccctg 1620

gcgctttcgg agagggtggt ggcttttgca caatcaatat gtttcatgta caatggtgta 1680

gataaataca ccataccatc aaaactcaag gacagtctag actcattgta cgtcaatttg 1740

attccagttt gacgacatcg catcaagtat taattctagg cttaatataa tgccagtaaa 1800

catcatatgt aagggatatt tactttcgtg aatccaaata atttgagggg tcctgtgttc 1860

ctcttaccaa ggatatgtca tcaagttgaa aaatatagcc agcaaaaaaa aaaaaaaaaa 1920

aaaaa 1925

<210> 32

<211> 1668

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzCtg306-ORF, 编码VzZS1的全长cDNA，仅开放阅读框

<220>

<221> CDS

<222> (1)..(1668)

<400> 32

atg gcg acg act gcc gcc ttc tgc ctc acc acc act ccg atc ggc gag 48

Met Ala Thr Thr Ala Ala Phe Cys Leu Thr Thr Thr Pro Ile Gly Glu

1 5 10 15

cca gtc tgt cgc cgg cag tac ctc cca acc gtc tgg ggc agc ttc ttc 96

Pro Val Cys Arg Arg Gln Tyr Leu Pro Thr Val Trp Gly Ser Phe Phe

20 25 30

ctc acc tac cag cca tgc acg ccg gaa gag gtc cag tcc atg gag gag 144

Leu Thr Tyr Gln Pro Cys Thr Pro Glu Glu Val Gln Ser Met Glu Glu

35 40 45

agg gct ctg gcc aag aag acg gag gtg ggg cgc atg ttg cag gag gtc 192

Arg Ala Leu Ala Lys Lys Thr Glu Val Gly Arg Met Leu Gln Glu Val

50 55 60

gcc gcc tcc agt aac ctc gca cgg aag ctg ggc ctt gtc gat gag cta 240

Ala Ala Ser Ser Asn Leu Ala Arg Lys Leu Gly Leu Val Asp Glu Leu

65 70 75 80

gag cgg ctc ggg gtg gac tat cac tac aag acg gag atc aac gac ttg 288

Glu Arg Leu Gly Val Asp Tyr His Tyr Lys Thr Glu Ile Asn Asp Leu

85 90 95

ctg ggt gcc att tat aat ggc aag gac gac gat aat gga ggt tct gat 336

Leu Gly Ala Ile Tyr Asn Gly Lys Asp Asp Asp Asn Gly Gly Ser Asp

100 105 110

gac gac ctc tat atc aca tcg ctt aag ttc tat ctg ctc agg aag cat 384

Asp Asp Leu Tyr Ile Thr Ser Leu Lys Phe Tyr Leu Leu Arg Lys His

115 120 125

ggg tac gct tta tct tca gat gtg ttt ctg aag ttc aga gat gag caa 432

Gly Tyr Ala Leu Ser Ser Asp Val Phe Leu Lys Phe Arg Asp Glu Gln

130 135 140

gga aat att tca agt gat gat gtg aaa tgc ctg atc atg ttg tat gat 480

Gly Asn Ile Ser Ser Asp Asp Val Lys Cys Leu Ile Met Leu Tyr Asp

145 150 155 160

gcc tca cat ttg agg att cat gag gag aaa att ctt gac aac atc aac 528

Ala Ser His Leu Arg Ile His Glu Glu Lys Ile Leu Asp Asn Ile Asn

165 170 175

agt ttc acc aag agc tgc ctc caa tca gtt tta gaa aca aat ttg gaa 576

Ser Phe Thr Lys Ser Cys Leu Gln Ser Val Leu Glu Thr Asn Leu Glu

180 185 190

ccg gct ctc caa gag gag gtg cgg tgc aca ttg gag aca cct cga ttc 624

Pro Ala Leu Gln Glu Glu Val Arg Cys Thr Leu Glu Thr Pro Arg Phe

195 200 205

aga agg gtt gag aga atc gaa gcg aaa cgc ttt atc tca gcg tac gaa 672

Arg Arg Val Glu Arg Ile Glu Ala Lys Arg Phe Ile Ser Ala Tyr Glu

210 215 220

aag aac ata gca cga gat gac gcc cta cta gag ttt gca agg ctg gac 720

Lys Asn Ile Ala Arg Asp Asp Ala Leu Leu Glu Phe Ala Arg Leu Asp

225 230 235 240

tac aat atc gtg caa att ctc tac tgc aag gag ctg aaa gaa ctt aca 768

Tyr Asn Ile Val Gln Ile Leu Tyr Cys Lys Glu Leu Lys Glu Leu Thr

245 250 255

gta tgg tgg aag gag ttc cat tca cgg aca aat ctg aca ttt gca cga 816

Val Trp Trp Lys Glu Phe His Ser Arg Thr Asn Leu Thr Phe Ala Arg

260 265 270

gat aga att gtg gag atg tat ttc tgg gtc atg gca att att tac gag 864

Asp Arg Ile Val Glu Met Tyr Phe Trp Val Met Ala Ile Ile Tyr Glu

275 280 285

cct tgt tac tcg tat tca cgg ata tgg gtt aca aaa atg ttt cta tcc 912

Pro Cys Tyr Ser Tyr Ser Arg Ile Trp Val Thr Lys Met Phe Leu Ser

290 295 300

gtg gca ttg ttg gat gac atc tat gac aat tat acg agc aca gag gag 960

Val Ala Leu Leu Asp Asp Ile Tyr Asp Asn Tyr Thr Ser Thr Glu Glu

305 310 315 320

agc aat atc ttt act acg gcc atg gaa agg tgg gat gtg aag gcc acc 1008

Ser Asn Ile Phe Thr Thr Ala Met Glu Arg Trp Asp Val Lys Ala Thr

325 330 335

gaa caa ctg cca gca aac atg agg aca ttc tac gat tac tta att tgt 1056

Glu Gln Leu Pro Ala Asn Met Arg Thr Phe Tyr Asp Tyr Leu Ile Cys

340 345 350

aca aca gat gag gtc gta gaa gaa ttg aaa ctt cag aat aat aag aat 1104

Thr Thr Asp Glu Val Val Glu Glu Leu Lys Leu Gln Asn Asn Lys Asn

355 360 365

gct gaa tta gtc aag aaa gtg ctg att gac gcc gct aaa tgc tac cat 1152

Ala Glu Leu Val Lys Lys Val Leu Ile Asp Ala Ala Lys Cys Tyr His

370 375 380

tcg gag gtc aaa tgg cgt gat gac cac tac gtc cct aat gat gtt gga 1200

Ser Glu Val Lys Trp Arg Asp Asp His Tyr Val Pro Asn Asp Val Gly

385 390 395 400

gag cac ctg cag ctt tca atg cga agc att gca gct atg cac tcc atc 1248

Glu His Leu Gln Leu Ser Met Arg Ser Ile Ala Ala Met His Ser Ile

405 410 415

aac ttt gtc ttc att tca ctg gga gct gtg tgt act agg gag gcg gtt 1296

Asn Phe Val Phe Ile Ser Leu Gly Ala Val Cys Thr Arg Glu Ala Val

420 425 430

gag tgt gct ttc act tat cca aaa att att aga ggt ata tgt gtt cac 1344

Glu Cys Ala Phe Thr Tyr Pro Lys Ile Ile Arg Gly Ile Cys Val His

435 440 445

gca cgt att agt aac gat atc gcg tca cat gag cga gaa caa gct tcg 1392

Ala Arg Ile Ser Asn Asp Ile Ala Ser His Glu Arg Glu Gln Ala Ser

450 455 460

gag cat atg gca tca acg ttg caa act tgc atg aag cag tat ggg att 1440

Glu His Met Ala Ser Thr Leu Gln Thr Cys Met Lys Gln Tyr Gly Ile

465 470 475 480

aca gta gag gaa gct gct gaa aag ctc aga gta ata aac gag gag tca 1488

Thr Val Glu Glu Ala Ala Glu Lys Leu Arg Val Ile Asn Glu Glu Ser

485 490 495

tgg atg gac atc gtt gag gaa tgc ctt tat aag gac cag tat ccc ctg 1536

Trp Met Asp Ile Val Glu Glu Cys Leu Tyr Lys Asp Gln Tyr Pro Leu

500 505 510

gcg ctt tcg gag agg gtg gtg gct ttt gca caa tca ata tgt ttc atg 1584

Ala Leu Ser Glu Arg Val Val Ala Phe Ala Gln Ser Ile Cys Phe Met

515 520 525

tac aat ggt gta gat aaa tac acc ata cca tca aaa ctc aag gac agt 1632

Tyr Asn Gly Val Asp Lys Tyr Thr Ile Pro Ser Lys Leu Lys Asp Ser

530 535 540

cta gac tca ttg tac gtc aat ttg att cca gtt tga 1668

Leu Asp Ser Leu Tyr Val Asn Leu Ile Pro Val

545 550 555

<210> 33

<211> 555

<212> PRT

<213> VzZS1

<400> 33

Met Ala Thr Thr Ala Ala Phe Cys Leu Thr Thr Thr Pro Ile Gly Glu

1 5 10 15

Pro Val Cys Arg Arg Gln Tyr Leu Pro Thr Val Trp Gly Ser Phe Phe

20 25 30

Leu Thr Tyr Gln Pro Cys Thr Pro Glu Glu Val Gln Ser Met Glu Glu

35 40 45

Arg Ala Leu Ala Lys Lys Thr Glu Val Gly Arg Met Leu Gln Glu Val

50 55 60

Ala Ala Ser Ser Asn Leu Ala Arg Lys Leu Gly Leu Val Asp Glu Leu

65 70 75 80

Glu Arg Leu Gly Val Asp Tyr His Tyr Lys Thr Glu Ile Asn Asp Leu

85 90 95

Leu Gly Ala Ile Tyr Asn Gly Lys Asp Asp Asp Asn Gly Gly Ser Asp

100 105 110

Asp Asp Leu Tyr Ile Thr Ser Leu Lys Phe Tyr Leu Leu Arg Lys His

115 120 125

Gly Tyr Ala Leu Ser Ser Asp Val Phe Leu Lys Phe Arg Asp Glu Gln

130 135 140

Gly Asn Ile Ser Ser Asp Asp Val Lys Cys Leu Ile Met Leu Tyr Asp

145 150 155 160

Ala Ser His Leu Arg Ile His Glu Glu Lys Ile Leu Asp Asn Ile Asn

165 170 175

Ser Phe Thr Lys Ser Cys Leu Gln Ser Val Leu Glu Thr Asn Leu Glu

180 185 190

Pro Ala Leu Gln Glu Glu Val Arg Cys Thr Leu Glu Thr Pro Arg Phe

195 200 205

Arg Arg Val Glu Arg Ile Glu Ala Lys Arg Phe Ile Ser Ala Tyr Glu

210 215 220

Lys Asn Ile Ala Arg Asp Asp Ala Leu Leu Glu Phe Ala Arg Leu Asp

225 230 235 240

Tyr Asn Ile Val Gln Ile Leu Tyr Cys Lys Glu Leu Lys Glu Leu Thr

245 250 255

Val Trp Trp Lys Glu Phe His Ser Arg Thr Asn Leu Thr Phe Ala Arg

260 265 270

Asp Arg Ile Val Glu Met Tyr Phe Trp Val Met Ala Ile Ile Tyr Glu

275 280 285

Pro Cys Tyr Ser Tyr Ser Arg Ile Trp Val Thr Lys Met Phe Leu Ser

290 295 300

Val Ala Leu Leu Asp Asp Ile Tyr Asp Asn Tyr Thr Ser Thr Glu Glu

305 310 315 320

Ser Asn Ile Phe Thr Thr Ala Met Glu Arg Trp Asp Val Lys Ala Thr

325 330 335

Glu Gln Leu Pro Ala Asn Met Arg Thr Phe Tyr Asp Tyr Leu Ile Cys

340 345 350

Thr Thr Asp Glu Val Val Glu Glu Leu Lys Leu Gln Asn Asn Lys Asn

355 360 365

Ala Glu Leu Val Lys Lys Val Leu Ile Asp Ala Ala Lys Cys Tyr His

370 375 380

Ser Glu Val Lys Trp Arg Asp Asp His Tyr Val Pro Asn Asp Val Gly

385 390 395 400

Glu His Leu Gln Leu Ser Met Arg Ser Ile Ala Ala Met His Ser Ile

405 410 415

Asn Phe Val Phe Ile Ser Leu Gly Ala Val Cys Thr Arg Glu Ala Val

420 425 430

Glu Cys Ala Phe Thr Tyr Pro Lys Ile Ile Arg Gly Ile Cys Val His

435 440 445

Ala Arg Ile Ser Asn Asp Ile Ala Ser His Glu Arg Glu Gln Ala Ser

450 455 460

Glu His Met Ala Ser Thr Leu Gln Thr Cys Met Lys Gln Tyr Gly Ile

465 470 475 480

Thr Val Glu Glu Ala Ala Glu Lys Leu Arg Val Ile Asn Glu Glu Ser

485 490 495

Trp Met Asp Ile Val Glu Glu Cys Leu Tyr Lys Asp Gln Tyr Pro Leu

500 505 510

Ala Leu Ser Glu Arg Val Val Ala Phe Ala Gln Ser Ile Cys Phe Met

515 520 525

Tyr Asn Gly Val Asp Lys Tyr Thr Ile Pro Ser Lys Leu Lys Asp Ser

530 535 540

Leu Asp Ser Leu Tyr Val Asn Leu Ile Pro Val

545 550 555

<210> 34

<211> 1691

<212> DNA

<213> 编码VzZS1的经密码子优化的cDNA

<400> 34

atggccacga ccgcagcatt ctgcctgacc actaccccga tcggcgaacc agtatgccgc 60

cgtcaatact tgccgaccgt gtggggtagc tttttcctga cctatcagcc gtgtaccccg 120

gaagaggtgc agagcatgga agagcgtgcg ctggctaaaa agaccgaggt gggtcgcatg 180

ctgcaagagg tcgcagcaag cagcaacctg gcacgtaaac tgggtttggt cgatgaactg 240

gagcgtctgg gtgtggatta tcactacaag acggagatca atgacctgct gggcgccatt 300

tacaatggta aggacgatga caacggcggc agcgacgacg acctgtatat caccagcctg 360

aaattctacc tgctgcgcaa gcatggctat gcgttgagca gcgatgtgtt cttgaaattc 420

cgtgacgaac agggtaatat ctctagcgac gatgtaaagt gcctgatcat gctgtacgac 480

gcaagccacc tgcgcatcca cgaagaaaag attctggata acattaacag ctttaccaaa 540

tcctgtctgc aaagcgtgtt ggaaacgaat ctggagccgg cactgcaaga agaagtccgc 600

tgcacgctgg aaacccctcg cttccgtcgc gttgagcgca tcgaagcgaa gcgtttcatc 660

agcgcgtatg agaagaatat cgcccgtgac gacgcgctgc tggagtttgc gcgtctggac 720

tacaacatcg ttcagattct gtactgtaaa gaactgaaag agctgacggt gtggtggaaa 780

gaatttcata gccgtactaa tctgaccttt gcccgcgatc gtatcgtcga gatgtatttc 840

tgggtgatgg cgatcattta tgagccgtgt tacagctaca gccgcatctg ggttacgaaa 900

atgttcctgt ccgttgcact gttggatgac atttacgaca actacaccag caccgaagag 960

tccaacatct ttacgaccgc gatggagcgt tgggacgtta aggcgacgga gcagctgccg 1020

gcgaatatgc gtacctttta tgattacttg atttgcacga cggatgaggt cgttgaagag 1080

ctgaaattgc aaaacaacaa gaatgccgag ctggttaaga aagttctgat tgacgcggcc 1140

aaatgttacc atagcgaggt caaatggcgt gacgatcact acgtcccgaa tgatgtcggc 1200

gagcacttgc agctgagcat gcgttctatt gcggctatgc actccatcaa ctttgtgttc 1260

atctctctgg gtgcggtctg tacccgtgag gccgtggaat gcgcgtttac ctatccgaag 1320

attattcgtg gtatttgcgt gcatgcgcgt atttcgaacg atattgcgag ccatgaacgc 1380

gagcaagcgt ctgaacacat ggcttcgacc ctgcaaactt gcatgaaaca gtacggtatt 1440

acggtcgaag aggcagccga gaagttgcgt gttatcaatg aagagagctg gatggatatt 1500

gtggaagagt gtctgtacaa agaccagtat ccgctggctc tgagcgagcg tgttgttgca 1560

ttcgcgcaga gcatttgctt catgtataat ggtgttgata agtataccat cccgagcaag 1620

ctgaaggata gcctggactc gctgtacgtg aacctgattc cggtttaagg taccatatat 1680

gaattcatta a 1691

<210> 35

<211> 1862

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt_4_contig_995, 编码VzZS2的全长cDNA，包括非编码区

<400> 35

gcattcatgg cgacaactgc cgccttctgc ctcaccacca ctccgatcgg cgagccggtc 60

tgtcgccggc agtacctccc aagcgtctgg ggcaacttct tcctcaccta ccagccatgc 120

acgcccgaag aggtccagtc catggaggag agggctctgg ccaagaagac ggaggtgggg 180

cgcatgttgc aggaggtcgc cgcctccggt gacctcgcac ggaagctggg ccttgtcgat 240

gagctagagc ggctcggggt ggactatcat tacaagacgg agatcaacga cttgctgggt 300

gccatttata atggcaagga cgacgataat ggaggttctg atgacgacct ctatatcaca 360

tcgcttaagt tctatctgct caggaagcat gggtacgctt taccttcaga tgtgtttctg 420

aagttcagag atgagcaagg aaatatttca agtgatgatg tgaaatgcct gatcatgttg 480

tatgatgcct cacatttgag gattcatgag gagaaaattc ttgacaacat caacagtttc 540

accaagagct gcctccaatc agttttagaa acaaatttgg aaccggctct ccaagaggag 600

gtgcggtgca cattggagac acctcgattc agaagggttg agagaatcga agcgagacgg 660

tttatctcag cgtacgaaaa gaacatagca cgagatgacg ccctactaga gtttgcaaag 720

ctggactaca atatcgtgca aattctctac tgcaaggagc tgaaagaact tacagtatgg 780

tggaaggagt tccactcaca gacaaatctg acatttgcac gagatagaat tgtggagatg 840

tatttctggg tcatggcaat tatttatgag ccttgttact catattcacg gatatgggtt 900

acaaaaatgt ttctatccgt ggcattgttg gatgacatct atgacaatta tacgagcaca 960

gaggagagca atatctttac tacggccatg gaaaggtggg atgcgaaggc cactgaacaa 1020

ctgccagcaa acatgaggac attctacgat tacttaattt gtacaacaga tgaggtcgta 1080

gaagaattga aacttcagaa taataagaat gctgaattag tcaagaaagt gctgattgac 1140

gctgctaaat gctaccattc ggaggtcaaa tggcgtgatg accactacgt ccctaatgat 1200

gttggagagc acctgcagct ttcaatgcga agcattgcag ctatgcactc catcaacttt 1260

atcttcattt cactgggagc tgtgtgtact agggaggcgg ttgagtgtgc tttcacttat 1320

ccaaaaatta ttagaggtat atgtgttcac gcacgtatta gtaacgatat cgcgtcacat 1380

gagcgagaac aagcttcgga gcatatggca tcaacgttgc aaacttgcat gaagcagtat 1440

gggattacag tagaggaagc tgctgaaaag ctcagagtaa taaacgagga gtcatggatg 1500

aacatcgttg aggaatgcct ttataaggac cagtatcccc tggcgctttc ggagagggtg 1560

gtggcctttg cacaatcaat atgtttcatg tacaatggtg tagataaata caccatacca 1620

tcaaaactca aggacagtct agactcattg tacgtcaatt tgatttcagt ttgacgacat 1680

cgcatcaagt attaattcta ggcttaatat aatgccagta aacatcatat gtaagggata 1740

tttactttcg tgaatccaaa taatttgaga ggtcctgtgt tcctcttacc aaggatatgt 1800

catcaagttg aaaaatatag ccatcactct ctcgttgctt catttcaata tgaacatata 1860

ta 1862

<210> 36

<211> 1668

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt_4_contig_995, 编码VzZS2的全长cDNA，仅开放阅读框

<400> 36

atggcgacaa ctgccgcctt ctgcctcacc accactccga tcggcgagcc ggtctgtcgc 60

cggcagtacc tcccaagcgt ctggggcaac ttcttcctca cctaccagcc atgcacgccc 120

gaagaggtcc agtccatgga ggagagggct ctggccaaga agacggaggt ggggcgcatg 180

ttgcaggagg tcgccgcctc cggtgacctc gcacggaagc tgggccttgt cgatgagcta 240

gagcggctcg gggtggacta tcattacaag acggagatca acgacttgct gggtgccatt 300

tataatggca aggacgacga taatggaggt tctgatgacg acctctatat cacatcgctt 360

aagttctatc tgctcaggaa gcatgggtac gctttacctt cagatgtgtt tctgaagttc 420

agagatgagc aaggaaatat ttcaagtgat gatgtgaaat gcctgatcat gttgtatgat 480

gcctcacatt tgaggattca tgaggagaaa attcttgaca acatcaacag tttcaccaag 540

agctgcctcc aatcagtttt agaaacaaat ttggaaccgg ctctccaaga ggaggtgcgg 600

tgcacattgg agacacctcg attcagaagg gttgagagaa tcgaagcgag acggtttatc 660

tcagcgtacg aaaagaacat agcacgagat gacgccctac tagagtttgc aaagctggac 720

tacaatatcg tgcaaattct ctactgcaag gagctgaaag aacttacagt atggtggaag 780

gagttccact cacagacaaa tctgacattt gcacgagata gaattgtgga gatgtatttc 840

tgggtcatgg caattattta tgagccttgt tactcatatt cacggatatg ggttacaaaa 900

atgtttctat ccgtggcatt gttggatgac atctatgaca attatacgag cacagaggag 960

agcaatatct ttactacggc catggaaagg tgggatgcga aggccactga acaactgcca 1020

gcaaacatga ggacattcta cgattactta atttgtacaa cagatgaggt cgtagaagaa 1080

ttgaaacttc agaataataa gaatgctgaa ttagtcaaga aagtgctgat tgacgctgct 1140

aaatgctacc attcggaggt caaatggcgt gatgaccact acgtccctaa tgatgttgga 1200

gagcacctgc agctttcaat gcgaagcatt gcagctatgc actccatcaa ctttatcttc 1260

atttcactgg gagctgtgtg tactagggag gcggttgagt gtgctttcac ttatccaaaa 1320

attattagag gtatatgtgt tcacgcacgt attagtaacg atatcgcgtc acatgagcga 1380

gaacaagctt cggagcatat ggcatcaacg ttgcaaactt gcatgaagca gtatgggatt 1440

acagtagagg aagctgctga aaagctcaga gtaataaacg aggagtcatg gatgaacatc 1500

gttgaggaat gcctttataa ggaccagtat cccctggcgc tttcggagag ggtggtggcc 1560

tttgcacaat caatatgttt catgtacaat ggtgtagata aatacaccat accatcaaaa 1620

ctcaaggaca gtctagactc attgtacgtc aatttgattt cagtttga 1668

<210> 37

<211> 1668

<212> DNA

<213> 编码VzZS2的经密码子优化的cDNA

<220>

<221> CDS

<222> (1)..(1668)

<400> 37

atg gcc acg acc gca gca ttc tgc ctg acc act acc ccg atc ggc gaa 48

Met Ala Thr Thr Ala Ala Phe Cys Leu Thr Thr Thr Pro Ile Gly Glu

1 5 10 15

cca gta tgc cgc cgt caa tac ttg ccg agc gtg tgg ggt aac ttt ttc 96

Pro Val Cys Arg Arg Gln Tyr Leu Pro Ser Val Trp Gly Asn Phe Phe

20 25 30

ctg acc tat cag ccg tgt acc ccg gaa gag gtg cag agc atg gaa gag 144

Leu Thr Tyr Gln Pro Cys Thr Pro Glu Glu Val Gln Ser Met Glu Glu

35 40 45

cgt gcg ctg gct aaa aag acc gag gtg ggt cgc atg ctg caa gag gtc 192

Arg Ala Leu Ala Lys Lys Thr Glu Val Gly Arg Met Leu Gln Glu Val

50 55 60

gca gca agc ggc gat ctg gca cgt aaa ctg ggt ttg gtc gat gaa ctg 240

Ala Ala Ser Gly Asp Leu Ala Arg Lys Leu Gly Leu Val Asp Glu Leu

65 70 75 80

gag cgt ctg ggt gtg gat tat cac tac aag acg gag atc aat gac ctg 288

Glu Arg Leu Gly Val Asp Tyr His Tyr Lys Thr Glu Ile Asn Asp Leu

85 90 95

ctg ggc gcc att tac aat ggt aag gac gat gac aac ggc ggc agc gac 336

Leu Gly Ala Ile Tyr Asn Gly Lys Asp Asp Asp Asn Gly Gly Ser Asp

100 105 110

gac gac ctg tat atc acc agc ctg aaa ttc tac ctg ctg cgc aag cat 384

Asp Asp Leu Tyr Ile Thr Ser Leu Lys Phe Tyr Leu Leu Arg Lys His

115 120 125

ggc tat gcg ttg cca agc gat gtg ttc ttg aaa ttc cgt gac gaa cag 432

Gly Tyr Ala Leu Pro Ser Asp Val Phe Leu Lys Phe Arg Asp Glu Gln

130 135 140

ggt aat atc tct agc gac gat gta aag tgc ctg atc atg ctg tac gac 480

Gly Asn Ile Ser Ser Asp Asp Val Lys Cys Leu Ile Met Leu Tyr Asp

145 150 155 160

gca agc cac ctg cgc atc cac gaa gaa aag att ctg gat aac att aac 528

Ala Ser His Leu Arg Ile His Glu Glu Lys Ile Leu Asp Asn Ile Asn

165 170 175

agc ttt acc aaa tcc tgt ctg caa agc gtg ttg gaa acg aat ctg gag 576

Ser Phe Thr Lys Ser Cys Leu Gln Ser Val Leu Glu Thr Asn Leu Glu

180 185 190

ccg gca ctg caa gaa gaa gtc cgc tgc acg ctg gaa acc cct cgc ttc 624

Pro Ala Leu Gln Glu Glu Val Arg Cys Thr Leu Glu Thr Pro Arg Phe

195 200 205

cgt cgc gtt gag cgc atc gaa gcg cgt cgt ttc atc agc gcg tat gag 672

Arg Arg Val Glu Arg Ile Glu Ala Arg Arg Phe Ile Ser Ala Tyr Glu

210 215 220

aag aat atc gcc cgt gac gac gcg ctg ctg gag ttt gcg aaa ctg gac 720

Lys Asn Ile Ala Arg Asp Asp Ala Leu Leu Glu Phe Ala Lys Leu Asp

225 230 235 240

tac aac atc gtt cag att ctg tac tgt aaa gaa ctg aaa gag ctg acg 768

Tyr Asn Ile Val Gln Ile Leu Tyr Cys Lys Glu Leu Lys Glu Leu Thr

245 250 255

gtg tgg tgg aaa gaa ttt cat agc caa act aat ctg acc ttt gcc cgc 816

Val Trp Trp Lys Glu Phe His Ser Gln Thr Asn Leu Thr Phe Ala Arg

260 265 270

gat cgt atc gtc gag atg tat ttc tgg gtg atg gcg atc att tat gag 864

Asp Arg Ile Val Glu Met Tyr Phe Trp Val Met Ala Ile Ile Tyr Glu

275 280 285

ccg tgt tac agc tac agc cgc atc tgg gtt acg aaa atg ttc ctg tcc 912

Pro Cys Tyr Ser Tyr Ser Arg Ile Trp Val Thr Lys Met Phe Leu Ser

290 295 300

gtt gca ctg ttg gat gac att tac gac aac tac acc agc acc gaa gag 960

Val Ala Leu Leu Asp Asp Ile Tyr Asp Asn Tyr Thr Ser Thr Glu Glu

305 310 315 320

tcc aac atc ttt acg acc gcg atg gag cgt tgg gac gct aag gcg acg 1008

Ser Asn Ile Phe Thr Thr Ala Met Glu Arg Trp Asp Ala Lys Ala Thr

325 330 335

gag cag ctg ccg gcg aat atg cgt acc ttt tat gat tac ttg att tgc 1056

Glu Gln Leu Pro Ala Asn Met Arg Thr Phe Tyr Asp Tyr Leu Ile Cys

340 345 350

acg acg gat gag gtc gtt gaa gag ctg aaa ttg caa aac aac aag aat 1104

Thr Thr Asp Glu Val Val Glu Glu Leu Lys Leu Gln Asn Asn Lys Asn

355 360 365

gcc gag ctg gtt aag aaa gtt ctg att gac gcg gcc aaa tgt tac cat 1152

Ala Glu Leu Val Lys Lys Val Leu Ile Asp Ala Ala Lys Cys Tyr His

370 375 380

agc gag gtc aaa tgg cgt gac gat cac tac gtc ccg aat gat gtc ggc 1200

Ser Glu Val Lys Trp Arg Asp Asp His Tyr Val Pro Asn Asp Val Gly

385 390 395 400

gag cac ttg cag ctg agc atg cgt tct att gcg gct atg cac tcc atc 1248

Glu His Leu Gln Leu Ser Met Arg Ser Ile Ala Ala Met His Ser Ile

405 410 415

aac ttt atc ttc atc tct ctg ggt gcg gtc tgt acc cgt gag gcc gtg 1296

Asn Phe Ile Phe Ile Ser Leu Gly Ala Val Cys Thr Arg Glu Ala Val

420 425 430

gaa tgc gcg ttt acc tat ccg aag att att cgt ggt att tgc gtg cat 1344

Glu Cys Ala Phe Thr Tyr Pro Lys Ile Ile Arg Gly Ile Cys Val His

435 440 445

gcg cgt att tcg aac gat att gcg agc cat gaa cgc gag caa gcg tct 1392

Ala Arg Ile Ser Asn Asp Ile Ala Ser His Glu Arg Glu Gln Ala Ser

450 455 460

gaa cac atg gct tcg acc ctg caa act tgc atg aaa cag tac ggt att 1440

Glu His Met Ala Ser Thr Leu Gln Thr Cys Met Lys Gln Tyr Gly Ile

465 470 475 480

acg gtc gaa gag gca gcc gag aag ttg cgt gtt atc aat gaa gag agc 1488

Thr Val Glu Glu Ala Ala Glu Lys Leu Arg Val Ile Asn Glu Glu Ser

485 490 495

tgg atg aac att gtg gaa gag tgt ctg tac aaa gac cag tat ccg ctg 1536

Trp Met Asn Ile Val Glu Glu Cys Leu Tyr Lys Asp Gln Tyr Pro Leu

500 505 510

gct ctg agc gag cgt gtt gtt gca ttc gcg cag agc att tgc ttc atg 1584

Ala Leu Ser Glu Arg Val Val Ala Phe Ala Gln Ser Ile Cys Phe Met

515 520 525

tat aat ggt gtt gat aag tat acc atc ccg agc aag ctg aag gat agc 1632

Tyr Asn Gly Val Asp Lys Tyr Thr Ile Pro Ser Lys Leu Lys Asp Ser

530 535 540

ctg gac tcg ctg tac gtg aac ctg att tca gtt taa 1668

Leu Asp Ser Leu Tyr Val Asn Leu Ile Ser Val

545 550 555

<210> 38

<211> 555

<212> PRT

<213> VzZS2

<400> 38

Met Ala Thr Thr Ala Ala Phe Cys Leu Thr Thr Thr Pro Ile Gly Glu

1 5 10 15

Pro Val Cys Arg Arg Gln Tyr Leu Pro Ser Val Trp Gly Asn Phe Phe

20 25 30

Leu Thr Tyr Gln Pro Cys Thr Pro Glu Glu Val Gln Ser Met Glu Glu

35 40 45

Arg Ala Leu Ala Lys Lys Thr Glu Val Gly Arg Met Leu Gln Glu Val

50 55 60

Ala Ala Ser Gly Asp Leu Ala Arg Lys Leu Gly Leu Val Asp Glu Leu

65 70 75 80

Glu Arg Leu Gly Val Asp Tyr His Tyr Lys Thr Glu Ile Asn Asp Leu

85 90 95

Leu Gly Ala Ile Tyr Asn Gly Lys Asp Asp Asp Asn Gly Gly Ser Asp

100 105 110

Asp Asp Leu Tyr Ile Thr Ser Leu Lys Phe Tyr Leu Leu Arg Lys His

115 120 125

Gly Tyr Ala Leu Pro Ser Asp Val Phe Leu Lys Phe Arg Asp Glu Gln

130 135 140

Gly Asn Ile Ser Ser Asp Asp Val Lys Cys Leu Ile Met Leu Tyr Asp

145 150 155 160

Ala Ser His Leu Arg Ile His Glu Glu Lys Ile Leu Asp Asn Ile Asn

165 170 175

Ser Phe Thr Lys Ser Cys Leu Gln Ser Val Leu Glu Thr Asn Leu Glu

180 185 190

Pro Ala Leu Gln Glu Glu Val Arg Cys Thr Leu Glu Thr Pro Arg Phe

195 200 205

Arg Arg Val Glu Arg Ile Glu Ala Arg Arg Phe Ile Ser Ala Tyr Glu

210 215 220

Lys Asn Ile Ala Arg Asp Asp Ala Leu Leu Glu Phe Ala Lys Leu Asp

225 230 235 240

Tyr Asn Ile Val Gln Ile Leu Tyr Cys Lys Glu Leu Lys Glu Leu Thr

245 250 255

Val Trp Trp Lys Glu Phe His Ser Gln Thr Asn Leu Thr Phe Ala Arg

260 265 270

Asp Arg Ile Val Glu Met Tyr Phe Trp Val Met Ala Ile Ile Tyr Glu

275 280 285

Pro Cys Tyr Ser Tyr Ser Arg Ile Trp Val Thr Lys Met Phe Leu Ser

290 295 300

Val Ala Leu Leu Asp Asp Ile Tyr Asp Asn Tyr Thr Ser Thr Glu Glu

305 310 315 320

Ser Asn Ile Phe Thr Thr Ala Met Glu Arg Trp Asp Ala Lys Ala Thr

325 330 335

Glu Gln Leu Pro Ala Asn Met Arg Thr Phe Tyr Asp Tyr Leu Ile Cys

340 345 350

Thr Thr Asp Glu Val Val Glu Glu Leu Lys Leu Gln Asn Asn Lys Asn

355 360 365

Ala Glu Leu Val Lys Lys Val Leu Ile Asp Ala Ala Lys Cys Tyr His

370 375 380

Ser Glu Val Lys Trp Arg Asp Asp His Tyr Val Pro Asn Asp Val Gly

385 390 395 400

Glu His Leu Gln Leu Ser Met Arg Ser Ile Ala Ala Met His Ser Ile

405 410 415

Asn Phe Ile Phe Ile Ser Leu Gly Ala Val Cys Thr Arg Glu Ala Val

420 425 430

Glu Cys Ala Phe Thr Tyr Pro Lys Ile Ile Arg Gly Ile Cys Val His

435 440 445

Ala Arg Ile Ser Asn Asp Ile Ala Ser His Glu Arg Glu Gln Ala Ser

450 455 460

Glu His Met Ala Ser Thr Leu Gln Thr Cys Met Lys Gln Tyr Gly Ile

465 470 475 480

Thr Val Glu Glu Ala Ala Glu Lys Leu Arg Val Ile Asn Glu Glu Ser

485 490 495

Trp Met Asn Ile Val Glu Glu Cys Leu Tyr Lys Asp Gln Tyr Pro Leu

500 505 510

Ala Leu Ser Glu Arg Val Val Ala Phe Ala Gln Ser Ile Cys Phe Met

515 520 525

Tyr Asn Gly Val Asp Lys Tyr Thr Ile Pro Ser Lys Leu Lys Asp Ser

530 535 540

Leu Asp Ser Leu Tyr Val Asn Leu Ile Ser Val

545 550 555

<210> 39

<211> 1766

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt_10_contig_49, 编码VzZS2-Nter2的全长cDNA，包括非编码区

<400> 39

ctgccgtgct atcactctag caaattatac tgagtggatc aacttaccac accagacgtt 60

tgcattcatg gcgacaactg ccaccttctg cctcaccatc actccgatcg gcaagccgga 120

ctgtcgccgg aagtacctcc caagcgtctg gggcaacttc ttcctcacct accagccatg 180

cacgcccgaa gaggtccagt ccatggagga gagggctctg gccaagaaga cggaggtggg 240

gcgcatgttg caggaggtcg ccgcctccgg tgacctcgca cggaagctgg gccttgtcga 300

tgagctagag cggctcgggg tggactatca ttacaagacg gagatcaacg acttgctggg 360

tgccatttat aatggcaagg acgacgataa tggaggttct gatgacgacc tctatatcac 420

atcgcttaag ttctatctgc tcaggaagca tgggtacgct ttaccttcag atgtgtttct 480

gaagttcaga gatgagcaag gaaatatttc aagtgatgat gtgaaatgcc tgatcatgtt 540

gtatgatgcc tcacatttga ggattcatga ggagaaaatt cttgacaaca tcaacagttt 600

caccaagagc tgcctccaat cagttttaga aacaaatttg gaaccggctc tccaagagga 660

ggtgcggtgc acattggaga cacctcgatt cagaagggtt gagagaatcg aagcgagacg 720

gtttatctca gcgtacgaaa agaacatagc acgagatgac gccctactag agtttgcaaa 780

gctggactac aatatcgtgc aaattctcta ctgcaaggag ctgaaagaac ttacagtatg 840

gtggaaggag ttccactcac agacaaatct gacatttgca cgagatagaa ttgtggagat 900

gtatttctgg gtcatggcaa ttatttatga gccttgttac tcatattcac ggatatgggt 960

tacaaaaatg tttctatccg tggcattgtt ggatgacatc tatgacaatt atacgagcac 1020

agaggagagc aatatcttta ctacggccat ggaaaggtgg gatgcgaagg ccactgaaca 1080

actgccagca aacatgagga cattctacga ttacttaatt tgtacaacag atgaggtcgt 1140

agaagaattg aaacttcaga ataataagaa tgctgaatta gtcaagaaag tgctgattga 1200

cgctgctaaa tgctaccatt cggaggtcaa atggcgtgat gaccactacg tccctaatga 1260

tgttggagag cacctgcagc tttcaatgcg aagcattgca gctatgcact ccatcaactt 1320

tatcttcatt tcactgggag ctgtgtgtac tagggaggcg gttgagtgtg ctttcactta 1380

tccaaaaatt attagaggta tatgtgttca cgcacgtatt agtaacgata tcgcgtcaca 1440

tgagcgagaa caagcttcgg agcatatggc atcaacgttg caaacttgca tgaagcagta 1500

tgggattaca gtagaggaag ctgctgaaaa gctcagagta ataaacgagg agtcatggat 1560

gaacatcgtt gaggaatgcc tttataagga ccagtatccc ctggcgcttt cggagagggt 1620

ggtggccttt gcacaatcaa tatgtttcat gtacaatggt gtagataaat acaccatacc 1680

atcaaaactc aaggacagtc tagactcatt gtacgtcaat ttgatttcag tttgacgaca 1740

tcgcatcaag tattaattct aggctt 1766

<210> 40

<211> 1667

<212> DNA

<213> 香根草(Vetiveria zizanoides)_VzTrspt_10_contig_49, 编码VzZS2-Nter2的全长cDNA，仅开放阅读框

<400> 40

atggcgacaa ctgccacctt ctgcctcacc atcactccga tcggcaagcc ggactgtcgc 60

cggaagtacc tcccaagcgt ctggggcaac ttcttcctca cctaccagcc atgcacgccc 120

gaagaggtcc agtccatgga ggagagggct ctggccaaga agacggaggt ggggcgcatg 180

ttgcaggagg tcgccgcctc cggtgacctc gcacggaagc tgggccttgt cgatgagcta 240

gagcggctcg gggtggacta tcattacaag acggagatca acgacttgct gggtgccatt 300

tataatggca aggacgacga taatggaggt tctgatgacg acctctatat cacatcgctt 360

aagttctatc tgctcaggaa gcatgggtac gctttacctt cagatgtgtt tctgaagttc 420

agagatgagc aaggaaatat ttcaagtgat gatgtgaaat gcctgatcat gttgtatgat 480

gcctcacatt tgaggattca tgaggagaaa attcttgaca acatcaacag tttcaccaag 540

agctgcctcc aatcagtttt agaaacaaat ttggaaccgg ctctccaaga ggaggtgcgg 600

tgcacattgg agacacctcg attcagaagg gttgagagaa tcgaagcgag acggtttatc 660

tcagcgtacg aaaagaacat agcacgagat gacgccctac tagagtttgc aaagctggac 720

tacaatatcg tgcaaattct ctactgcaag gagctgaaag aacttacagt atggtggaag 780

gagttccact cacagacaaa tctgacattt gcacgagata gaattgtgga gatgtatttc 840

tgggtcatgg caattattta tgagccttgt tactcatatt cacggatatg ggttacaaaa 900

atgtttctat ccgtggcatt gttggatgac atctatgaca attatacgag cacagaggag 960

agcaatatct ttactacggc catggaaagg tgggatgcga aggccactga acaactgcca 1020

gcaaacatga ggacattcta cgattactta atttgtacaa cagatgaggt cgtagaagaa 1080

ttgaaacttc agaataataa gaatgctgaa ttagtcaaga aagtgctgat tgacgctgct 1140

aaatgctacc attcggaggt caaatggcgt gatgaccact acgtccctaa tgatgttgga 1200

gagcacctgc agctttcaat gcgaagcatt gcagctatgc actccatcaa ctttatcttc 1260

atttcactgg gagctgtgtg tactagggag gcggttgagt gtgctttcac ttatccaaaa 1320

attattagag gtatatgtgt tcacgcacgt attagtaacg atatcgcgtc acatgagcga 1380

gaacaagctt cggagcatat ggcatcaacg ttgcaaactt gcatgaagca gtatgggatt 1440

acagtagagg aagctgctga aaagctcaga gtaataaacg aggagtcatg gatgaacatc 1500

gttgaggaat gcctttataa ggaccagtat cccctggcgc tttcggagag ggtggtggcc 1560

tttgcacaat caatatgttt catgtacaat ggtgtagata aatacaccat accatcaaaa 1620

ctcaaggaca gtctagactc attgtacgtc aatttgattt cagtttg 1667

<210> 41

<211> 1668

<212> DNA

<213> 编码VzZS2-Nter2 SR opt的经密码子优化的cDNA

<220>

<221> CDS

<222> (1)..(1668)

<400> 41

atg gct acg acc gca act ttc tgt ctg act att acg cct atc ggt aaa 48

Met Ala Thr Thr Ala Thr Phe Cys Leu Thr Ile Thr Pro Ile Gly Lys

1 5 10 15

cca gat tgt cgc cgt aag tat tta ccg agc gtg tgg ggt aac ttc ttc 96

Pro Asp Cys Arg Arg Lys Tyr Leu Pro Ser Val Trp Gly Asn Phe Phe

20 25 30

ctg act tat cag ccg tgc acc ccg gaa gag gtg cag agc atg gag gaa 144

Leu Thr Tyr Gln Pro Cys Thr Pro Glu Glu Val Gln Ser Met Glu Glu

35 40 45

cgc gcg ctg gca aag aaa acc gag gtt ggc cgt atg ctg cag gaa gtg 192

Arg Ala Leu Ala Lys Lys Thr Glu Val Gly Arg Met Leu Gln Glu Val

50 55 60

gca gct agc ggt gat ctg gca cgt aaa ctg ggc ctg gta gat gaa ctg 240

Ala Ala Ser Gly Asp Leu Ala Arg Lys Leu Gly Leu Val Asp Glu Leu

65 70 75 80

gag cgt ctg ggt gtt gac tat cac tat aag acc gaa atc aat gac tta 288

Glu Arg Leu Gly Val Asp Tyr His Tyr Lys Thr Glu Ile Asn Asp Leu

85 90 95

ctg ggt gcg att tat aac ggc aaa gac gat gac aac ggc ggc tct gac 336

Leu Gly Ala Ile Tyr Asn Gly Lys Asp Asp Asp Asn Gly Gly Ser Asp

100 105 110

gat gac ttg tac att acg tcg ctg aaa ttc tac ctg ttg cgc aaa cac 384

Asp Asp Leu Tyr Ile Thr Ser Leu Lys Phe Tyr Leu Leu Arg Lys His

115 120 125

ggt tac gcg ttg ccg tcc gat gtt ttt ctg aag ttc cgt gat gaa cag 432

Gly Tyr Ala Leu Pro Ser Asp Val Phe Leu Lys Phe Arg Asp Glu Gln

130 135 140

ggt aat att tct agc gat gac gtt aaa tgt ctg atc atg ctg tat gat 480

Gly Asn Ile Ser Ser Asp Asp Val Lys Cys Leu Ile Met Leu Tyr Asp

145 150 155 160

gca tcc cat ctg cgc att cac gaa gaa aag atc ctg gat aac att aac 528

Ala Ser His Leu Arg Ile His Glu Glu Lys Ile Leu Asp Asn Ile Asn

165 170 175

agc ttt acc aaa agc tgt ctg caa agc gtg ctg gaa acg aat ctg gag 576

Ser Phe Thr Lys Ser Cys Leu Gln Ser Val Leu Glu Thr Asn Leu Glu

180 185 190

ccg gca ctg caa gaa gag gtg cgt tgc acg ctg gaa acc ccg cgt ttt 624

Pro Ala Leu Gln Glu Glu Val Arg Cys Thr Leu Glu Thr Pro Arg Phe

195 200 205

cgt cgc gtt gag cgc atc gaa gcg cgt cgt ttc atc agc gcc tat gag 672

Arg Arg Val Glu Arg Ile Glu Ala Arg Arg Phe Ile Ser Ala Tyr Glu

210 215 220

aag aac att gcg cgt gat gac gca ctg ctg gaa ttt gcg aaa ttg gat 720

Lys Asn Ile Ala Arg Asp Asp Ala Leu Leu Glu Phe Ala Lys Leu Asp

225 230 235 240

tac aat att gtc caa atc ctg tac tgc aaa gaa ctg aaa gaa ctg acc 768

Tyr Asn Ile Val Gln Ile Leu Tyr Cys Lys Glu Leu Lys Glu Leu Thr

245 250 255

gtc tgg tgg aaa gag ttc cac agc cag act aac ctg acc ttc gct cgc 816

Val Trp Trp Lys Glu Phe His Ser Gln Thr Asn Leu Thr Phe Ala Arg

260 265 270

gac cgt atc gtc gag atg tat ttt tgg gtc atg gcc att atc tac gag 864

Asp Arg Ile Val Glu Met Tyr Phe Trp Val Met Ala Ile Ile Tyr Glu

275 280 285

ccg tgc tac agc tac agc cgt atc tgg gtc acc aaa atg ttc ctg tct 912

Pro Cys Tyr Ser Tyr Ser Arg Ile Trp Val Thr Lys Met Phe Leu Ser

290 295 300

gtc gcg ctg ctg gat gat att tac gac aac tat acc agc acc gaa gag 960

Val Ala Leu Leu Asp Asp Ile Tyr Asp Asn Tyr Thr Ser Thr Glu Glu

305 310 315 320

tcc aac atc ttc acg acc gcg atg gaa cgt tgg gac gcg aag gca acc 1008

Ser Asn Ile Phe Thr Thr Ala Met Glu Arg Trp Asp Ala Lys Ala Thr

325 330 335

gag caa ctg ccg gcc aat atg cgc acc ttc tac gat tat ttg att tgt 1056

Glu Gln Leu Pro Ala Asn Met Arg Thr Phe Tyr Asp Tyr Leu Ile Cys

340 345 350

acc acc gac gaa gtt gtc gaa gaa ctg aag ttg cag aac aat aaa aat 1104

Thr Thr Asp Glu Val Val Glu Glu Leu Lys Leu Gln Asn Asn Lys Asn

355 360 365

gcc gaa ttg gtt aaa aaa gtg ctg att gat gcc gcc aag tgc tac cat 1152

Ala Glu Leu Val Lys Lys Val Leu Ile Asp Ala Ala Lys Cys Tyr His

370 375 380

agc gaa gtt aag tgg cgt gat gat cat tat gtt ccg aat gac gtc ggc 1200

Ser Glu Val Lys Trp Arg Asp Asp His Tyr Val Pro Asn Asp Val Gly

385 390 395 400

gag cat ttg caa ctg tcc atg cgc agc atc gcg gcg atg cac agc att 1248

Glu His Leu Gln Leu Ser Met Arg Ser Ile Ala Ala Met His Ser Ile

405 410 415

aac ttt atc ttt atc agc ctg ggc gct gtc tgc acg cgt gaa gct gtt 1296

Asn Phe Ile Phe Ile Ser Leu Gly Ala Val Cys Thr Arg Glu Ala Val

420 425 430

gag tgc gcg ttt acc tat cca aag att att cgt ggt atc tgc gtt cac 1344

Glu Cys Ala Phe Thr Tyr Pro Lys Ile Ile Arg Gly Ile Cys Val His

435 440 445

gcg cgt att tcg aat gac atc gca agc cat gag cgt gag caa gcg agc 1392

Ala Arg Ile Ser Asn Asp Ile Ala Ser His Glu Arg Glu Gln Ala Ser

450 455 460

gag cac atg gca tct acg ctg cag acg tgt atg aaa cag tac ggt att 1440

Glu His Met Ala Ser Thr Leu Gln Thr Cys Met Lys Gln Tyr Gly Ile

465 470 475 480

acg gtt gaa gag gcc gcg gaa aag ctg cgc gtg atc aac gaa gag agc 1488

Thr Val Glu Glu Ala Ala Glu Lys Leu Arg Val Ile Asn Glu Glu Ser

485 490 495

tgg atg aat atc gtt gag gaa tgc ctg tat aaa gac cag tac ccg ctg 1536

Trp Met Asn Ile Val Glu Glu Cys Leu Tyr Lys Asp Gln Tyr Pro Leu

500 505 510

gcg ctg agc gag cgc gtg gtg gcg ttt gcc cag agc att tgt ttt atg 1584

Ala Leu Ser Glu Arg Val Val Ala Phe Ala Gln Ser Ile Cys Phe Met

515 520 525

tac aat ggt gtg gac aag tac acc att ccg tcc aag ctg aaa gac agc 1632

Tyr Asn Gly Val Asp Lys Tyr Thr Ile Pro Ser Lys Leu Lys Asp Ser

530 535 540

ctg gat agc ctg tac gtg aac ctg atc tca gtg taa 1668

Leu Asp Ser Leu Tyr Val Asn Leu Ile Ser Val

545 550 555

<210> 42

<211> 555

<212> PRT

<213> VzZS2-Nter2

<400> 42

Met Ala Thr Thr Ala Thr Phe Cys Leu Thr Ile Thr Pro Ile Gly Lys

1 5 10 15

Pro Asp Cys Arg Arg Lys Tyr Leu Pro Ser Val Trp Gly Asn Phe Phe

20 25 30

Leu Thr Tyr Gln Pro Cys Thr Pro Glu Glu Val Gln Ser Met Glu Glu

35 40 45

Arg Ala Leu Ala Lys Lys Thr Glu Val Gly Arg Met Leu Gln Glu Val

50 55 60

Ala Ala Ser Gly Asp Leu Ala Arg Lys Leu Gly Leu Val Asp Glu Leu

65 70 75 80

Glu Arg Leu Gly Val Asp Tyr His Tyr Lys Thr Glu Ile Asn Asp Leu

85 90 95

Leu Gly Ala Ile Tyr Asn Gly Lys Asp Asp Asp Asn Gly Gly Ser Asp

100 105 110

Asp Asp Leu Tyr Ile Thr Ser Leu Lys Phe Tyr Leu Leu Arg Lys His

115 120 125

Gly Tyr Ala Leu Pro Ser Asp Val Phe Leu Lys Phe Arg Asp Glu Gln

130 135 140

Gly Asn Ile Ser Ser Asp Asp Val Lys Cys Leu Ile Met Leu Tyr Asp

145 150 155 160

Ala Ser His Leu Arg Ile His Glu Glu Lys Ile Leu Asp Asn Ile Asn

165 170 175

Ser Phe Thr Lys Ser Cys Leu Gln Ser Val Leu Glu Thr Asn Leu Glu

180 185 190

Pro Ala Leu Gln Glu Glu Val Arg Cys Thr Leu Glu Thr Pro Arg Phe

195 200 205

Arg Arg Val Glu Arg Ile Glu Ala Arg Arg Phe Ile Ser Ala Tyr Glu

210 215 220

Lys Asn Ile Ala Arg Asp Asp Ala Leu Leu Glu Phe Ala Lys Leu Asp

225 230 235 240

Tyr Asn Ile Val Gln Ile Leu Tyr Cys Lys Glu Leu Lys Glu Leu Thr

245 250 255

Val Trp Trp Lys Glu Phe His Ser Gln Thr Asn Leu Thr Phe Ala Arg

260 265 270

Asp Arg Ile Val Glu Met Tyr Phe Trp Val Met Ala Ile Ile Tyr Glu

275 280 285

Pro Cys Tyr Ser Tyr Ser Arg Ile Trp Val Thr Lys Met Phe Leu Ser

290 295 300

Val Ala Leu Leu Asp Asp Ile Tyr Asp Asn Tyr Thr Ser Thr Glu Glu

305 310 315 320

Ser Asn Ile Phe Thr Thr Ala Met Glu Arg Trp Asp Ala Lys Ala Thr

325 330 335

Glu Gln Leu Pro Ala Asn Met Arg Thr Phe Tyr Asp Tyr Leu Ile Cys

340 345 350

Thr Thr Asp Glu Val Val Glu Glu Leu Lys Leu Gln Asn Asn Lys Asn

355 360 365

Ala Glu Leu Val Lys Lys Val Leu Ile Asp Ala Ala Lys Cys Tyr His

370 375 380

Ser Glu Val Lys Trp Arg Asp Asp His Tyr Val Pro Asn Asp Val Gly

385 390 395 400

Glu His Leu Gln Leu Ser Met Arg Ser Ile Ala Ala Met His Ser Ile

405 410 415

Asn Phe Ile Phe Ile Ser Leu Gly Ala Val Cys Thr Arg Glu Ala Val

420 425 430

Glu Cys Ala Phe Thr Tyr Pro Lys Ile Ile Arg Gly Ile Cys Val His

435 440 445

Ala Arg Ile Ser Asn Asp Ile Ala Ser His Glu Arg Glu Gln Ala Ser

450 455 460

Glu His Met Ala Ser Thr Leu Gln Thr Cys Met Lys Gln Tyr Gly Ile

465 470 475 480

Thr Val Glu Glu Ala Ala Glu Lys Leu Arg Val Ile Asn Glu Glu Ser

485 490 495

Trp Met Asn Ile Val Glu Glu Cys Leu Tyr Lys Asp Gln Tyr Pro Leu

500 505 510

Ala Leu Ser Glu Arg Val Val Ala Phe Ala Gln Ser Ile Cys Phe Met

515 520 525

Tyr Asn Gly Val Asp Lys Tyr Thr Ile Pro Ser Lys Leu Lys Asp Ser

530 535 540

Leu Asp Ser Leu Tyr Val Asn Leu Ile Ser Val

545 550 555

<210> 43

<211> 79

<212> DNA

<213> 人工序列

<220>

<223> 用于LEU2标记PCR的引物

<400> 43

aggtgcagtt cgcgtgcaat tataacgtcg tggcaactgt tatcagtcgt accgcgccat 60

tcgactacgt cgtaaggcc 79

<210> 44

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 用于LEU2标记PCR的引物

<400> 44

tcgtggtcaa ggcgtgcaat tctcaacacg agagtgattc ttcggcgttg ttgctgacca 60

tcgacggtcg aggagaactt 80

<210> 45

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 用于AmpR，大肠杆菌标记PCR的引物

<400> 45

tggtcagcaa caacgccgaa gaatcactct cgtgttgaga attgcacgcc ttgaccacga 60

cacgttaagg gattttggtc atgag 85

<210> 46

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 用于AmpR，大肠杆菌标记PCR的引物

<400> 46

aacgcgtacc ctaagtacgg caccacagtg actatgcagt ccgcactttg ccaatgccaa 60

aaatgtgcgc ggaaccccta 80

<210> 47

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 用于酵母复制起点PCR的引物

<400> 47

ttggcattgg caaagtgcgg actgcatagt cactgtggtg ccgtacttag ggtacgcgtt 60

cctgaacgaa gcatctgtgc ttca 84

<210> 48

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 用于酵母复制起点PCR的引物

<400> 48

ccgagatgcc aaaggatagg tgctatgttg atgactacga cacagaactg cgggtgacat 60

aatgatagca ttgaaggatg agact 85

<210> 49

<211> 82

<212> DNA

<213> 人工序列

<220>

<223> 用于大肠杆菌复制起点PCR的引物

<400> 49

atgtcacccg cagttctgtg tcgtagtcat caacatagca cctatccttt ggcatctcgg 60

tgagcaaaag gccagcaaaa gg 82

<210> 50

<211> 81

<212> DNA

<213> 人工序列

<220>

<223> 用于大肠杆菌复制起点PCR的引物

<400> 50

ctcagatgta cggtgatcgc caccatgtga cggaagctat cctgacagtg tagcaagtgc 60

tgagcgtcag accccgtaga a 81

<210> 51

<211> 1668

<212> DNA

<213> 人工序列

<220>

<223> 为酿酒酵母而密码子优化的VzZS1 DNA

<400> 51

atggctacta ctgctgcttt ctgtttgact actactccaa tcggtgaacc agtttgtaga 60

agacaatact tgccaactgt ttggggttct ttcttcttga cttaccaacc atgtactcca 120

gaagaagttc aatctatgga agaaagagct ttggctaaga agactgaagt tggtagaatg 180

ttgcaagaag ttgctgcttc ttctaacttg gctagaaagt tgggtttggt tgacgaattg 240

gaaagattgg gtgttgacta ccactacaag actgaaatca acgacttgtt gggtgctatc 300

tacaacggta aggacgacga caacggtggt tctgacgacg acttgtacat cacttctttg 360

aagttctact tgttgagaaa gcacggttac gctttgtctt ctgacgtttt cttgaagttc 420

agagacgaac aaggtaacat ctcttctgac gacgttaagt gtttgatcat gttgtacgac 480

gcttctcact tgagaatcca cgaagaaaag atcttggaca acatcaactc tttcactaag 540

tcttgtttgc aatctgtttt ggaaactaac ttggaaccag ctttgcaaga agaagttaga 600

tgtactttgg aaactccaag attcagaaga gttgaaagaa tcgaagctaa gagattcatc 660

tctgcttacg aaaagaacat cgctagagac gacgctttgt tggaattcgc tagattggac 720

tacaacatcg ttcaaatctt gtactgtaag gaattgaagg aattgactgt ttggtggaag 780

gaattccact ctagaactaa cttgactttc gctagagaca gaatcgttga aatgtacttc 840

tgggttatgg ctatcatcta cgaaccatgt tactcttact ctagaatctg ggttactaag 900

atgttcttgt ctgttgcttt gttggacgac atctacgaca actacacttc tactgaagaa 960

tctaacatct tcactactgc tatggaaaga tgggacgtta aggctactga acaattgcca 1020

gctaacatga gaactttcta cgactacttg atctgtacta ctgacgaagt tgttgaagaa 1080

ttgaagttgc aaaacaacaa gaacgctgaa ttggttaaga aggttttgat cgacgctgct 1140

aagtgttacc actctgaagt taagtggaga gacgaccact acgttccaaa cgacgttggt 1200

gaacacttgc aattgtctat gagatctatc gctgctatgc actctatcaa cttcgttttc 1260

atctctttgg gtgctgtttg tactagagaa gctgttgaat gtgctttcac ttacccaaag 1320

atcatcagag gtatctgtgt tcacgctaga atctctaacg acatcgcttc tcacgaaaga 1380

gaacaagctt ctgaacacat ggcttctact ttgcaaactt gtatgaagca atacggtatc 1440

actgttgaag aagctgctga aaagttgaga gttatcaacg aagaatcttg gatggacatc 1500

gttgaagaat gtttgtacaa ggaccaatac ccattggctt tgtctgaaag agttgttgct 1560

ttcgctcaat ctatctgttt catgtacaac ggtgttgaca agtacactat cccatctaag 1620

ttgaaggact ctttggactc tttgtacgtt aacttgatcc cagtttaa 1668

<210> 52

<211> 1668

<212> DNA

<213> 人工序列

<220>

<223> 为酿酒酵母而密码子优化的VzZS2 DNA

<400> 52

atggctacta ctgctgcttt ctgtttgact actactccaa tcggtgaacc agtttgtaga 60

agacaatact tgccatctgt ttggggtaac ttcttcttga cttaccaacc atgtactcca 120

gaagaagttc aatctatgga agaaagagct ttggctaaga agactgaagt tggtagaatg 180

ttgcaagaag ttgctgcttc tggtgacttg gctagaaagt tgggtttggt tgacgaattg 240

gaaagattgg gtgttgacta ccactacaag actgaaatca acgacttgtt gggtgctatc 300

tacaacggta aggacgacga caacggtggt tctgacgacg acttgtacat cacttctttg 360

aagttctact tgttgagaaa gcacggttac gctttgccat ctgacgtttt cttgaagttc 420

agagacgaac aaggtaacat ctcttctgac gacgttaagt gtttgatcat gttgtacgac 480

gcttctcact tgagaatcca cgaagaaaag atcttggaca acatcaactc tttcactaag 540

tcttgtttgc aatctgtttt ggaaactaac ttggaaccag ctttgcaaga agaagttaga 600

tgtactttgg aaactccaag attcagaaga gttgaaagaa tcgaagctag aagattcatc 660

tctgcttacg aaaagaacat cgctagagac gacgctttgt tggaattcgc taagttggac 720

tacaacatcg ttcaaatctt gtactgtaag gaattgaagg aattgactgt ttggtggaag 780

gaattccact ctcaaactaa cttgactttc gctagagaca gaatcgttga aatgtacttc 840

tgggttatgg ctatcatcta cgaaccatgt tactcttact ctagaatctg ggttactaag 900

atgttcttgt ctgttgcttt gttggacgac atctacgaca actacacttc tactgaagaa 960

tctaacatct tcactactgc tatggaaaga tgggacgcta aggctactga acaattgcca 1020

gctaacatga gaactttcta cgactacttg atctgtacta ctgacgaagt tgttgaagaa 1080

ttgaagttgc aaaacaacaa gaacgctgaa ttggttaaga aggttttgat cgacgctgct 1140

aagtgttacc actctgaagt taagtggaga gacgaccact acgttccaaa cgacgttggt 1200

gaacacttgc aattgtctat gagatctatc gctgctatgc actctatcaa cttcatcttc 1260

atctctttgg gtgctgtttg tactagagaa gctgttgaat gtgctttcac ttacccaaag 1320

atcatcagag gtatctgtgt tcacgctaga atctctaacg acatcgcttc tcacgaaaga 1380

gaacaagctt ctgaacacat ggcttctact ttgcaaactt gtatgaagca atacggtatc 1440

actgttgaag aagctgctga aaagttgaga gttatcaacg aagaatcttg gatgaacatc 1500

gttgaagaat gtttgtacaa ggaccaatac ccattggctt tgtctgaaag agttgttgct 1560

ttcgctcaat ctatctgttt catgtacaac ggtgttgaca agtacactat cccatctaag 1620

ttgaaggact ctttggactc tttgtacgtt aacttgatct ctgtttaa 1668

<210> 53

<211> 1668

<212> DNA

<213> 人工序列

<220>

<223> 为酿酒酵母而密码子优化的VzZS2-Nter2 DNA

<400> 53

atggctacta ctgctacttt ctgtttgact atcactccaa tcggtaagcc agactgtaga 60

agaaagtact tgccatctgt ttggggtaac ttcttcttga cttaccaacc atgtactcca 120

gaagaagttc aatctatgga agaaagagct ttggctaaga agactgaagt tggtagaatg 180

ttgcaagaag ttgctgcttc tggtgacttg gctagaaagt tgggtttggt tgacgaattg 240

gaaagattgg gtgttgacta ccactacaag actgaaatca acgacttgtt gggtgctatc 300

tacaacggta aggacgacga caacggtggt tctgacgacg acttgtacat cacttctttg 360

aagttctact tgttgagaaa gcacggttac gctttgccat ctgacgtttt cttgaagttc 420

agagacgaac aaggtaacat ctcttctgac gacgttaagt gtttgatcat gttgtacgac 480

gcttctcact tgagaatcca cgaagaaaag atcttggaca acatcaactc tttcactaag 540

tcttgtttgc aatctgtttt ggaaactaac ttggaaccag ctttgcaaga agaagttaga 600

tgtactttgg aaactccaag attcagaaga gttgaaagaa tcgaagctag aagattcatc 660

tctgcttacg aaaagaacat cgctagagac gacgctttgt tggaattcgc taagttggac 720

tacaacatcg ttcaaatctt gtactgtaag gaattgaagg aattgactgt ttggtggaag 780

gaattccact ctcaaactaa cttgactttc gctagagaca gaatcgttga aatgtacttc 840

tgggttatgg ctatcatcta cgaaccatgt tactcttact ctagaatctg ggttactaag 900

atgttcttgt ctgttgcttt gttggacgac atctacgaca actacacttc tactgaagaa 960

tctaacatct tcactactgc tatggaaaga tgggacgcta aggctactga acaattgcca 1020

gctaacatga gaactttcta cgactacttg atctgtacta ctgacgaagt tgttgaagaa 1080

ttgaagttgc aaaacaacaa gaacgctgaa ttggttaaga aggttttgat cgacgctgct 1140

aagtgttacc actctgaagt taagtggaga gacgaccact acgttccaaa cgacgttggt 1200

gaacacttgc aattgtctat gagatctatc gctgctatgc actctatcaa cttcatcttc 1260

atctctttgg gtgctgtttg tactagagaa gctgttgaat gtgctttcac ttacccaaag 1320

atcatcagag gtatctgtgt tcacgctaga atctctaacg acatcgcttc tcacgaaaga 1380

gaacaagctt ctgaacacat ggcttctact ttgcaaactt gtatgaagca atacggtatc 1440

actgttgaag aagctgctga aaagttgaga gttatcaacg aagaatcttg gatgaacatc 1500

gttgaagaat gtttgtacaa ggaccaatac ccattggctt tgtctgaaag agttgttgct 1560

ttcgctcaat ctatctgttt catgtacaac ggtgttgaca agtacactat cccatctaag 1620

ttgaaggact ctttggactc tttgtacgtt aacttgatct ctgtttaa 1668

<210> 54

<211> 1542

<212> DNA

<213> 人工序列

<220>

<223> 为酿酒酵母而密码子优化的VzCP521-11 DNA

<400> 54

atggaagaca ctaagatctt ggttgctgct gtttctgttt gtgttttgtt ggttgttttg 60

tctaagttga agaagtcttt gttgccaggt gctaagccaa agttgaactt gccaccaggt 120

ccatggactt tgccagttat cggttctttg caccacgtta tcacttaccc aaacttgcac 180

agagctttgc acggtttggc tcaaaagtac ggtccagtta tgatgttcag attgggtgaa 240

gttccaatga tggttgtttc ttctccagct gctgctcaag aagctttgaa gactaacgac 300

atcgctttcg ctgacagata cactaacgct actatcggtg ctttgacttt ccacggtgaa 360

gacatggctt tcgctccata cggtgaaaga tggagacaat tgagaaagat ctgtgttttg 420

gaattgttgt ctgctgctag agttcaatct ttcagacaca tcagagctga agaagtttct 480

agattggttg gtaagttggc tgcttctgct gctgctggtg aagctgttca cttgaacaag 540

atcgttgcta agttcgttaa cgacactatc gttagagaag ctgttggttc tggttctaag 600

caccaagacg aatacttgaa ctctatcgac gttgctttga gacaaactat gggtgttgct 660

ttggctgact tgttcccatc ttctagattg atccaaatga tcgacactgc tccaagaaag 720

gttttggctg ctagaaacaa catggaaaga atcttggaag aaatcatcaa cgaaactaag 780

gaagctatgg acagaggtga cggtcaaaag aaggttgaag gtatcttggg tgttttgttg 840

agattgcaaa aggaaggttc tactccagtt ccattgacta acgaagttat cgttactgtt 900

atgttcgaca tgttcggtgc tggttctgac acttcttcta ctttgttgac ttggtgtatg 960

atggaattgg ttagatctcc accaactatg gctaaggttc aagacgaagt tagagaagct 1020

ttcaagggta agaaggaatc tactatcatc actgaagacg acttgaaggg tttgacttac 1080

ttgaagcaag ttatcaagga agctttgaga atgcacccac cagttccatt gttgttgcca 1140

agaaagtgta gagaaacttg taaggttatg ggttacgaca tcccaaaggg tactgttgtt 1200

ttcgctaacg cttgggctat cggtagagac ccaaagtact gggaagaccc agaagaattc 1260

aagccagaaa gattcgacaa gtctaacgtt gactacaagg gtactaactt cgaatacttg 1320

ccattcggtt ctggtagaag aatctgtcca ggtatcaact tgggtttgtg taacatcgaa 1380

ttggctttgg cttctttgtt gtaccacttc gactggaagt tgccaaacgg tatggaacca 1440

aaggacatcg acatgggtga agctcaaggt ttgatcgctt ctaagaagac taacttgact 1500

ttgcacccag ttactagaat cgctccagct ggtttcaact aa 1542

<210> 55

<211> 1521

<212> DNA

<213> 人工序列

<220>

<223> 为酿酒酵母而密码子优化的VzCP8201 DNA

<400> 55

atggacttct tgagaatccc attcttggtt gctttcgttt tcttggctgt tttgttgaga 60

ttgatcagat cttacatcac ttcttctgct ttgagattgc caccaggtcc atggcaattg 120

ccattgatcg gttctttgca ccacttgttg ttgtctagat tctctgactt gccacacaga 180

gctttgagag aaatgtctgg tacttacggt ccattgatgt tgttgagatt cggttctgtt 240

ccaactttgg ttgtttcttc tgctgaagct gctagagaag ttatgagaac tcacgacttg 300

gctttctgtg acagacactt gggtgttact ttggacatcg ttacttgtgg tggtaaggac 360

atcatctgtt ctccatacaa cgctcactgg agagaattga gaaagttgtg tatggttgaa 420

atcttgtctc aaagaagagt tttgtctttc agatctatca gagaagaaga agttgcttct 480

ttggttagat ctatctctga cgaatgtggt ggtggtcaac aaccagttaa cttgactgaa 540

ggtatctcta gaatgatcaa cgacgttgct gctagaactg ttgttggtga cagatgtaag 600

taccaagacg aatacatgca cgaattggac gaagttgtta gattggctgg tggtttcaac 660

ttggctgact tgtacccatc ttctagattg gttagaagat tctctgctgc tgctagagac 720

gctagaagat gtcaaagaaa catgtacaga atcatccaat ctatcatcca agaaagagaa 780

gctatgccaa ctccagaaag agacgaagaa gacttgttgg gtgttttgtt gagattgcaa 840

agagaaggtg gtttgcaatt cgctttgact aacgaaatcg tttctactgt tatctacgac 900

atcttctctg ctggttctga aacttcttct actgttttgg tttgggctat gtctgaattg 960

gttaagaacc cacaagttat gagaaaggct caatctgaag ttagagacac tttcaagggt 1020

aacaacaaga tcactgaatc tgacttgatc aagttgagat acttgcaatt ggttatcaag 1080

gaaactttga gattgcacgc tccagttcca ttgttgttgc caagagaatg tagagaatct 1140

tgtcaaatca tgggttacga cgttttgaag ggtactaagg ttttcgttaa cgcttgggct 1200

atcgctagag acactggttt gtggtgtgac ggtgaagaat tcagaccaga aagattcgaa 1260

tcttctaaca tcgacttcag aggtaacgac ttcgaattca ctccattcgg tgctggtaga 1320

agagtttgtc caggtatcac tttgggtttg gctaacttgg aattggcttt ggcttctttg 1380

ttgtaccact tcgactggga cttgccaaac ggtgctagat tggaagactt ggacatggct 1440

gaagctttcg gtatcacttt gaagagaaag tctatgttgt ggttgaaggc taagccatac 1500

aacaacttca tcccaaacta a 1521

Claims

1.一种生产氧化的子杂烯化合物的方法，该方法包括：

a.使子杂烯或含子杂烯的组合物与具有细胞色素P450单加氧酶活性的多肽接触，该多肽为VzCP521-11，并且该多肽的氨基酸序列为SEQ ID NO:21，从而获得至少一种子杂烯的氧化产物，其中子杂烯的C3位上发生氧化反应，

该方法还包括在步骤a之前，在具有子杂烯合酶活性的多肽存在下，将法呢基焦磷酸(FPP)环化，

其中所述具有子杂烯合酶活性的多肽的氨基酸序列为SEQ ID NO:33、38或42，

其中步骤a中的子杂烯的转化在具有P450还原酶(CPR)活性的多肽存在下进行，并且其中所述CPR的氨基酸序列为SEQ ID NO:23。

2.权利要求1的方法，其中步骤a在氧气存在下在细胞培养物中在体内进行；或在氧气存在下在液体反应介质中在体外进行。

3.权利要求1和2中任一项的方法，其中步骤a通过在子杂烯或含子杂烯的组合物的存在下，在有助于子杂烯氧化的条件下，培养非人宿主生物或细胞来进行，该非人宿主生物或细胞表达至少一种所述具有细胞色素P450单加氧酶活性的多肽。

4.权利要求1的方法，还包括步骤b：将步骤a中获得的子杂烯氧化产物分离。

5.权利要求1的方法，还包括步骤c，将子杂烯醇转化为子杂烯酮，或转化为包含子杂烯酮和表子杂烯酮的混合物。

6.权利要求1的方法，其中所述具有细胞色素P450单加氧酶活性的多肽VzCP521-11在其N末端延伸了甲硫氨酸或其天然或合成膜锚定序列。

7.权利要求6的方法，其中所述具有细胞色素P450单加氧酶活性的多肽VzCP521-11的氨基酸序列为SEQ ID NO:18。