CN111718916A

CN111718916A - Ggpps定向单点突变蛋白及其应用

Info

Publication number: CN111718916A
Application number: CN202010814751.2A
Authority: CN
Inventors: 郭玉双; 贾蒙骜; 王燃; 董臣; 余婧; 李锋; 魏攀; 金立锋
Original assignee: Guizhou Institute of Tobacco Science
Current assignee: Guizhou Institute of Tobacco Science
Priority date: 2020-06-08
Filing date: 2020-08-13
Publication date: 2020-09-29

Abstract

本发明属于烟草基因工程技术领域，具体涉及GGPPS定向突变蛋白专利申请事宜。现有GGPPS蛋白的154、161和218这三个位点位于酶的催化口袋，209和233这两个位点位于酶分子表面；基于这五个位点，本申请提供了GGPPS系列定向突变蛋白，其中包括：系列单位点突变蛋白、双位点突变蛋白、三位点突变蛋白、四位点突变蛋白、五位点突变蛋白。发明人利用CAST技术构建“小而精”的突变体文库，通过进一步筛选以及基于定向进化需要，发明人对特定位点氨基酸突变类型做了详细分析。初步实验结果表明，特定位点氨基酸突变后，β‑胡萝卜素合成量得到了明显提高，为进一步作物新品种培育奠定了一定技术基础。

Description

GGPPS定向单点突变蛋白及其应用

技术领域

本发明属于烟草基因工程技术领域，具体涉及GGPPS定向突变蛋白。

背景技术

类胡萝卜素是一种重要的质体色素，具有重要的生理作用，与植物的生长发育和光合作用密切相关，影响作物品质性状。牻牛儿基牻牛儿基二磷酸(geranylgeranyldiphosphate，GGPP)是类胡萝卜素、叶绿素和维生素E的植醇侧链、赤霉素以及二萜植保素的共同前体。GGPP由牻牛儿基牻牛儿基二磷酸合酶(GGPP synthase, GGPPS)催化产生，3分子异戊烯基焦磷酸（IPP）和1分子烯丙基异构体二甲基烯丙基焦磷酸(DMAPP)，在GGPPS的作用下缩合生成C20的GGPP。

GGPP是类胡萝卜素合成的起始底物，能够被类胡萝卜素合成通路的端口酶八氢番茄红素(phytoene)合酶(phytoene synthase，PSY)催化形成八氢番茄红素，用于合成类胡萝卜素。对植物GGPPS基因家族的大量研究例证表明，该家族成员不仅编码萜类合成通路上游的重要酶蛋白，而且还直接参与调控植物萜类合成的各个通路，在调控方面发挥着核心作用。

现有研究中，对于类胡萝卜素合成途径虽然已有较多研究，但从植物改造角度而言，如果能够利用基因工程技术实现定向化的选育和培育，是实现植物最大化利用的重要技术前提。

作为合成生物学的关键性技术之一，定向生物进化技术获得了2018年诺贝尔化学奖。该技术广泛用于酶的活性设计，通过定向进化，可有效克服天然酶在环境耐受性、立体/区域选择性、底物特异性、催化效率及产物抑制性等方面存在的缺点，使得自然界成千上万年的进化历程在实验室内较短时间完成。

在酶的定向进化技术发展过程中，传统定向进化时，如利用易错 PCR、DNA混组、序列饱和突变、随机引发体外重组等技术时，存在突变效率低、筛选工作量大等缺点，制约了酶分子的体外定向进化的应用。组合活性中心饱和突变策略 (Combinatorial active-site saturation test，CAST) 则是一种较新的定向进化突变策略，该技术基于蛋白的结构信息，首先借助计算机的模拟基础，随后在酶催化活性中心周围选取与底物有直接相互作用的氨基酸残基，通过构建“小而精”的突变体文库，从而减少突变体文库的筛选规模。

总体上，虽然定向进化技术可以加快作物基因的进化历程，为作物品质的改良提供优质基因，但由于发展时间较短，且存在其他技术难题，因此目前定向进化技术仍未用于植物基因的改造。

烟草作为基因工程研究的模式作物之一，同时烟草内类胡萝卜素含量直接影响了烟草的品质性状。因此，如能结合定向进化对烟草萜类合成基因进行定向改造，对于加快烟草育种具有十分重要的应用意义，同时也可为其他作物的遗传育种奠定一定技术基础。

发明内容

本发明要解决的技术问题是：提供若干具有更好酶活的GGPPS及烟草GGPPS基因，从而为烟草育种、烟草新品种培育提供一种新的技术思路，同时也为其他作物育种和品种改良奠定一定技术基础。

本发明的技术方案是：。

本发明的有益效果：GGPP作为下游类胡萝卜素的前体物质，发明人通过对GGPPS酶活口袋关键氨基酸位点的结构分析，结果表明，154位、第161位、第209位、第218位和第233位是关键性位点。进一步地，发明人利用CAST技术构建“小而精”的突变体文库，从而克服传统定向进化筛选过程中突变率低、筛选量大等缺点。通过进一步筛选以及基于定向进化需要，发明人对特定位点氨基酸突变类型做了详细分析。初步实验结果表明，特定位点氨基酸突变后，β-胡萝卜素合成量得到了明显提高，为进一步作物新品种培育奠定了一定技术基础。

附图说明

图1为GGPPS-154突变体的细菌颜色实验，其中：A 双质粒细菌颜色实验，PAC-94N质粒上含有PSY，PDS以及LCY-B三个基因，而大肠杆菌体内可以合成IPP和DMAPP，但不能产生GGPP，在将具有酶活的GGPPS质粒与PAC-94N共同转化大肠杆菌后，即可在大肠杆菌体内催化产生β-胡萝卜素，使大肠杆菌由白色转化成黄色；B. GGPPS-154单位点突变的细菌颜色实验，其第154位氨基酸位点发生了突变，与PAC-94N双质粒共同转化大肠杆菌BL21（DE）3后，经IPTG诱导后，菌液颜色发生了明显变化，下图为OD440处的吸光值，以空的pET32b作为阴性对照，可以看出，突变体相较于野生型GGPPS在OD440处吸光值有明显提升；

图2为GGPPS-161突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-161单位点突变的细菌颜色实验；

图3为 GGPPS-218突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-218单位点突变的细菌颜色实验；

图4为GGPPS-209突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-209单位点突变的细菌颜色实验；

图5为GGPPS-233突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-233单位点突变的细菌颜色实验；

图6为GGPPS-154/161/218突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-154/161/218三位点组合突变的细菌颜色实验；

图7为GGPPS-209/233突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-209/233两位点组合突变的细菌颜色实验；

图8为GGPPS-154/161/209/218/233突变体的细菌颜色实验，A图与图1A相同，为合成原理图，B图为GGPPS-154/161/209/218/233五位点组合突变的细菌颜色实验。

图9为GGPPS-154与主流作物GGPPS位点对比分析，图中：辣椒（CaGGPPS1）、马铃薯（StGGPPS1）、小麦（TaGGPPS1）、玉米（ZmGGPPS1）、丹参（SmGGPPS1）、咖啡（CanGGPPS1）、胡萝卜（DcGGPPS1）、葡萄（VvGGPPS）、黄瓜（CsaGGPPS）、西瓜（ClGGPPS）、苹果（MdGGPPS1）、橙子（CsiGGPPS）、橡胶树（HbGGPPS）、菊花（CmGGPPS）、水稻（OsGGPPS1）、番茄（SlGGPPS1）、蓖麻（RcGGPPS）、香蕉（MaGGPPS）和银杏（GbGGPPS）。

具体实施方式

下面结合附图和实施例对本申请做进一步的解释说明。

实施例1

由于现有牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)基因的获得是相关序列分析、以及定向进化突变的基础，因此，本实施例首先就现有牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)基因的克隆获得过程简介如下。

首先，根据GenBank登录号NM_001325177.1所示的基因序列，设计PCR扩增用引物序列如下：

正向引物：5’-atgagatctatgaatcttgt-3’，

反向引物：5’-attttcacgataagcaatgt-3’；

随后，进行PCR扩增；

对PCR扩增产物进行电泳检测后，回收、纯化，并将回收纯化后的PCR产物与pGEMT质粒进行连接；

随后，将连接产物转化大肠杆菌DH5α感受态细胞，过夜培养后，挑选并鉴定阳性克隆，以获得重组正确的克隆质粒pGEMT-GGPPS。

为便于后续GGPPS的表达，利用pET-32b(+)质粒，发明人进一步构建了重组表达载体，具体过程为：

首先，设计一对含有NdeⅠ和XhoⅠ酶切位点的引物序列如下：

正向引物：5’-gctaatccatatgGAGCAATTCAATTTCAAAACT-3’，

反向引物：5’-cagctcgagATTTTCACGATAAGCAATGTAAT-3’；

随后，以上述克隆质粒pGEMT-GGPPS为模板，进行PCR扩增，以获得GGPPS基因，并对PCR扩增产物进行回收、纯化；

随后，对PCR扩增获得的GGPPS基因产物和pET-32b(+)质粒分别进行NdeⅠ、XhoⅠ双酶切，回收酶切产物后进行连接；

最后，将连接产物转化DH5α感受态细胞，过夜培养后，挑选阳性克隆进行鉴定，将鉴定正确重组表达质粒载体重新命名为：pET-32b(+)-GGPPS。

实施例2

为便于相关突变位点的检测和分析，本申请中采用了牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)重组工程菌株进行实验验证，因此，本实施例就该工程菌株的构建过程简介如下。

首先，将实施例1中所构建的重组载体pET-32b(+)-GGPPS与PAC-94N质粒共转化表达菌株E.coli BL21(DE3)，同时以空载体pET-32b(+)与PAC-94N质粒共转化作为阴性对照菌株；

随后，过夜培养后，挑选阳性克隆进行鉴定，对于测序正确的阳性克隆菌株进行保藏或者进行进一步β-胡萝卜素含量检测。

β-胡萝卜素含量检测原理为：大肠杆菌自身不能产生GGPP，而PAC-94N质粒则含有β-胡萝卜素合成通路的所有基因，但不含牻牛儿基牻牛儿基二磷酸合成酶编码基因（图.1A），因此，在将重组载体pET-32b(+)-GGPPS与PAC-94N质粒共转化时，则可催化产生GGPP的菌株由白色转变为黄色，而且酶活性越强菌株，黄色越深，进一步通过分光光度计测量OD440的吸光值，即可对最终产物β-胡萝卜素含量进行测定。

实施例3

由于烟草GGPPS尚无晶体结构报道，因此为对该蛋白进行分析，基于其氨基酸序列，发明人对该酶进行了同源建模。建模过程中，其最优模板为3kro，分值为0.993（TM-score用来衡量两个蛋白结构模型的匹配度，分值由0到1，1意味着完美的匹配），根均方差偏离值（RMSD）为0.36 Å，序列一致性（IDEN）为74.9 %，蛋白结构覆盖度（Cov）为99.7 %。

使用Rosetta_docking程序分别将底物C5-DMAPP、C10-GPP、C15-FPP对接至GGPPS催化口袋。通过寻找受体小分子化合物和酶作用的最佳结合位置，从而预测其结合模式。最终分析结果表明：其第154位，第161位和第218位位点位于酶的催化口袋，氨基酸替换后可进一步提高底物与酶活口袋结合能力，并且这些位点参与了酶活调控；而第209位和第233位氨基酸位点位于酶分子表面，有利于蛋白形成二聚体。

需要说明的是，现有GGPPS，由296个氨基酸组成，具体序列如SEQ ID No.1所示，编码GGPPS的基因，由888个核苷酸构成，具体序列如SEQ ID No.2所示，基于上述分析，发明人进一步构建了针对这5个位点的GGPPS饱和突变体文库，具体构建过程简介如下。

首先，根据上述5个位点设计简并引物序列如下：

V154-F：5’-ggaactgaagggttannkgctggacaagtagcg-3’，

I161-F: 5’-ggacaagtagcggatnnkgcttgtactggtaac-3’，

I209-F: 5’-gtggagaaattgaggnnkttcgcgagatgtatt-3’，

F218-F: 5’-tgtattggattattgnnkcaagtagtagatgat-3’，

V233-F: 5’-acaaagtcgtcggagnnkctcggaaaaaccgcc-3’，

general-R: 5’-cacgataagcaatgtaatccg-3’；

随后，以实施例1所构建pET-32b(+)-GGPPS为模板，然后分别以V154-F、I161-F、I209-F、F218-F和V233-F作为正向引物，以general-R作为反向引物，进行全质粒PCR；

再后，将PCR扩增产物进行DpnI消化，随后将消化后的产物与PAC-94N双质粒共同转化E.coli BL21(DE3)感受态细胞，转化结束后，将菌液涂布于含有100 μg/L氨苄青霉素和34μg/L氯霉素的平板，最终获得饱和突变文库。

进一步筛选时，挑选阳性单克隆，培养于含有氨苄青霉素（100 μg/L）和氯霉素（34μg/L）的20ml LB液体培养基里培养过夜，再用终浓度为0.1mM 的IPTG在18℃下诱导表达18小时，培养结束后，离心弃上清，拍照，采用3ml的丙酮重悬后，测量OD440值。

采用上述高通量筛选方法，最终筛选确定吸光度明显增强的突变子并进一步进行测序。结果表明，当：第154位的Val（V）氨基酸突变为中性氨基酸Ala（A）或者突变为半胱氨酸Cys（C）；第161位的Ile（I）氨基酸突变为中性脂肪族氨基酸Leu（L）或者突变为含有巯基的氨基酸Met（M）；第209位Ile（I）氨基酸突变为碱性氨基酸Lys（K）、含有羟基的氨基酸Ser（S）、天冬氨酸Asp（D）、天冬酰胺Asn（N）、丙氨酸Ala（A）或脯氨酸Pro（P）；第218位Phe（F）氨基酸突变为芳香族氨基酸酪氨酸Tyr（Y）或者突变为亮氨酸Leu（L）；第233位氨基酸Val突变为酸性氨基酸酸为Glu（E）或者突变为酪氨酸Tyr（Y）时；烟草牻牛儿基牻牛儿基二磷酸合成酶GGPPS有明显变化。

针对154位点：

当154位点突变为A时，其氨基酸序列为SEQ ID No.13；

其对应碱基编码序列为SEQ ID No.14；

当154位点突变为C时，其编码碱基序列为SEQ ID No.15。

针对161位点：

当161位点突变为L时，其编码碱基序列为SEQ ID No.16；

当161位点突变为M时，其编码碱基序列为SEQ ID No.17。

针对218位点：

当218位点突变为L时，其编码碱基序列为SEQ ID No.18；

当218位点突变为Y时，其编码碱基序列为SEQ ID No.19。

针对209位点：

当209位点突变为P时，其编码碱基序列为SEQ ID No.20；

当209位点突变为K时，其编码碱基序列为SEQ ID No.21；

当209位点突变为D时，其编码碱基序列为SEQ ID No.22；

当209位点突变为N时，其编码碱基序列为SEQ ID No.23；

当209位点突变为S时，其编码碱基序列为SEQ ID No.24；

当209位点突变为A时，其编码碱基序列为SEQ ID No.25。

针对233位点：

当233位点突变为E时，其编码碱基序列为SEQ ID No.26；

当233位点突变为Y时，其编码碱基序列为SEQ ID No.27。

其他双位点、三位点或五位点的具体碱基序列参考上述即可，例如，针对五位点突变蛋白GGPPS-154A/161L/209S/218Y/233E，其氨基酸序列为SEQ ID No.28；

此时，对应编码碱基序列为SEQ ID No.29。

进一步地，发明人将第154位、第161位、第209位、第218位和第233位氨基酸位点进行了不同组合形式突变，并利用现有基因工程技术合成了不同组合突变的表达载体，进一步利用实施例2中的牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)重组工程菌株构建方法构建了不同菌株，并对β-胡萝卜素合成量情况进行了检测。具体检测结果简介如下。

如图1~图5所示单位点实验结果表明：

当第154位Val突变为Ala或Cys，第161位Ile突变为Leu或Met，第209位Ile突变为Lys、Ser、天冬氨酸Asp、天冬酰胺Asn、丙氨酸Ala、脯氨酸Pro，第218位Phe突变为Leu或Tyr，第233位Val突变为Glu或Tyr时，菌体颜色或者说β-胡萝卜素合成量均有明显提升；

如图6~图8所示双位点、三位点和五位点实验结果表明，特定突变方向情况下，不同位点组合情况时，菌体颜色或者说β-胡萝卜素合成量也均有明显提升。

上述结果表明，针对特定位点的定向突变进化方式，可以较好提供GGPPS酶活，从而为进一步提供作物中β-胡萝卜素含量奠定良好基础。

实施例4

在实施例3的分析和验证基础上，发明人进一步对现有主流作物的GGPPS改造位点进行了分析。氨基酸序列的比较分析结果（如图9所示，图9仅展示了154位点对比结果）表明：与本申请烟草的GGPPS类似，主流作物辣椒（CaGGPPS1）、马铃薯（StGGPPS1）、小麦（TaGGPPS1）、玉米（ZmGGPPS1）、丹参（SmGGPPS1）、咖啡（CanGGPPS1）、胡萝卜（DcGGPPS1）、葡萄（VvGGPPS）、黄瓜（CsaGGPPS）、西瓜（ClGGPPS）、苹果（MdGGPPS1）、橙子（CsiGGPPS）、橡胶树（HbGGPPS）、菊花（CmGGPPS）、水稻（OsGGPPS1）、番茄（SlGGPPS1）、蓖麻（RcGGPPS）、香蕉（MaGGPPS）和银杏（GbGGPPS）中GGPPS酶的这5个位点均较为保守，因此，基于相同位点的突变方式是较为可行的，或者直接利用本申请所获得的定向突变蛋白也是可行的，也即，为这些主流作物的新品种培育提供了一种新的思路。

序列表

<110> 贵州省烟草科学研究院

<120>

<130> 1

<160> 29

<210> 1

<211> 296

<212> 氨基酸

<213> GGPPS

<400> 1

EQFNFKTYVA EKAISVNKAL DEAVIVKDPP VIHEAMRYSL LAGGKRVRPM LCLAACELVG 60

GDQSNAMPAA CAVEMIHTMS LIHDDLPCMD NDDLRRGKPT NHKVYGEDVA VLAGDSLLAF 120

AFEYIATATA GVSPSRILAA IGELAKSIGT EGLVAGQVAD IACTGNPNVG LDTLEFIHIH 180

KTAALLEASV VLGAILGGGT DEEVEKLRIF ARCIGLLFQV VDDILDVTKS SEVLGKTAGK 240

DLAVDKTTYP KLLGLEKAKE FAAELNRDAK QQLVEFDPHK AAPLIALADY IAYREN 296

<210> 2

<211>888

<212> DNA

<213> GGPPS

<400> 2

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 3

<211> 20

<212> DNA

<213> 人工合成

<400> 3

atgagatctatgaatcttgt

<210> 4

<211> 20

<212> DNA

<213> 人工合成

<400> 4

attttcacgataagcaatgt

<210> 5

<211>34

<212> DNA

<213> 人工合成

<400> 5

gctaatccatatgGAGCAATTCAATTTCAAAACT

<210> 6

<211> 32

<212> DNA

<213> 人工合成

<400> 6

cagctcgagATTTTCACGATAAGCAATGTAAT

<210> 7

<211> 33

<212> DNA

<213> 人工合成

<400> 7

ggaactgaagggttannkgctggacaagtagcg

<210> 8

<211> 33

<212> DNA

<213> 人工合成

<400> 8

ggacaagtagcggatnnkgcttgtactggtaac

<210> 9

<211> 33

<212> DNA

<213> 人工合成

<400> 9

gtggagaaattgaggnnkttcgcgagatgtatt

<210> 10

<211> 30

<212> DNA

<213> 人工合成

<400> 10

tgtattggattattgnnkcaagtagtagatgat

<210> 11

<211> 30

<212> DNA

<213> 人工合成

<400> 11

acaaagtcgtcggagnnkctcggaaaaaccgcc

<210> 12

<211> 21

<212> DNA

<213> 人工合成

<400> 12

cacgataagcaatgtaatccg

<210> 13

<211> 296

<212> 氨基酸

<213> GGPPS-154A

<400> 13

EQFNFKTYVA EKAISVNKAL DEAVIVKDPP VIHEAMRYSL LAGGKRVRPM LCLAACELVG 60

GDQSNAMPAA CAVEMIHTMS LIHDDLPCMD NDDLRRGKPT NHKVYGEDVA VLAGDSLLAF 120

AFEYIATATA GVSPSRILAA IGELAKSIGT EGLAAGQVAD IACTGNPNVG LDTLEFIHIH 180

KTAALLEASV VLGAILGGGT DEEVEKLRIF ARCIGLLFQV VDDILDVTKS SEVLGKTAGK 240

DLAVDKTTYP KLLGLEKAKE FAAELNRDAK QQLVEFDPHK AAPLIALADY IAYREN 296

<210> 14

<211> 888

<212> DNA

<213> GGPPS-154A

<400> 14

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG CGGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 15

<211> 888

<212> DNA

<213> GGPPS-154C

<400> 15

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAT GCGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 16

<211> 888

<212> DNA

<213> GGPPS-161L

<400> 16

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

CTGGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 17

<211> 888

<212> DNA

<213> GGPPS-161M

<400> 17

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATGGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 18

<211> 888

<212> DNA

<213> GGPPS-218L

<400> 18

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GCTGCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 19

<211> 888

<212> DNA

<213> GGPPS-218Y

<400> 19

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTATCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 20

<211> 888

<212> DNA

<213> GGPPS-209P

<400> 20

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGCCGTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 21

<211> 888

<212> DNA

<213> GGPPS-209K

<400> 21

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGAAATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 22

<211> 888

<212> DNA

<213> GGPPS-209D

<400> 22

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGGATTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 23

<211> 888

<212> DNA

<213> GGPPS-209N

<400> 23

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGAATTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 24

<211> 888

<212> DNA

<213> GGPPS-209S

<400> 24

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGAGCTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 25

<211> 888

<212> DNA

<213> GGPPS-209A

<400> 25

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGGCGTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 26

<211> 888

<212> DNA

<213> GGPPS-233E

<400> 26

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGAAC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 27

<211> 888

<212> DNA

<213> GGPPS-233Y

<400> 27

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480

ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGTATC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888

<210> 28

<211> 296

<212> 氨基酸

<213> GGPPS-154A/161L/209S/218Y/233E

<400> 28

EQFNFKTYVA EKAISVNKAL DEAVIVKDPP VIHEAMRYSL LAGGKRVRPM LCLAACELVG 60

GDQSNAMPAA CAVEMIHTMS LIHDDLPCMD NDDLRRGKPT NHKVYGEDVA VLAGDSLLAF 120

AFEYIATATA GVSPSRILAA IGELAKSIGT EGLAAGQVAD LACTGNPNVG LDTLEFIHIH 180

KTAALLEASV VLGAILGGGT DEEVEKLRSF ARCIGLLYQV VDDILDVTKS SEELGKTAGK 240

DLAVDKTTYP KLLGLEKAKE FAAELNRDAK QQLVEFDPHK AAPLIALADY IAYREN 296

<210> 29

<211> 888

<212> DNA

<213> GGPPS-154A/161L/209S/218Y/233E

<400> 29

GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60

GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120

CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180

GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240

CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300

AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360

GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420

ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG CGGCTGGACA AGTAGCGGAT 480

CTGGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540

AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600

GATGAAGAAG TGGAGAAATT GAGGAGCTTC GCGAGATGTA TTGGATTATT GTATCAAGTA 660

GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGAAC TCGGAAAAAC CGCCGGAAAA 720

GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780

TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840

GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 880

Claims

1.GGPPS定向突变蛋白，其特征在于：GGPPS蛋白碱基序列中，其第154位的Val氨基酸突变为中性氨基酸Ala或者半胱氨酸Cys（C）；

或，其第161位的Ile氨基酸突变为中性脂肪族氨基酸Leu或者含有巯基的氨基酸Met；

或，其第209位Ile氨基酸突变为碱性氨基酸Lys、含有羟基的氨基酸Ser、天冬氨酸Asp、天冬酰胺Asn、丙氨酸Ala或脯氨酸Pro中任一个；

或，其第218位Phe氨基酸突变为芳香族氨基酸酪氨酸Tyr或者亮氨酸Leu；

或，其第233位氨基酸Val突变为酸性氨基酸酸为Glu或者酪氨酸Tyr。

2.如权利要求1所述的GGPPS定向突变蛋白，其特征在于：所述的突变位点任意两、三或五单位点组合所构成的突变蛋白。

3.如权利要求1或2所述的GGPPS定向突变蛋白在合成作物色素类物质中的应用。

4.根据权利要求3所述的应用，其特征在于：所述作物为：烟草、辣椒、番茄、水稻、玉米、小麦、马铃薯、蓖麻、苹果、黄瓜、西瓜、胡萝卜、香蕉、橙子、葡萄、咖啡、银杏、丹参、菊花或橡胶树。