[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111718916A - Ggpps定向单点突变蛋白及其应用 - Google Patents

Ggpps定向单点突变蛋白及其应用 Download PDF

Info

Publication number
CN111718916A
CN111718916A CN202010814751.2A CN202010814751A CN111718916A CN 111718916 A CN111718916 A CN 111718916A CN 202010814751 A CN202010814751 A CN 202010814751A CN 111718916 A CN111718916 A CN 111718916A
Authority
CN
China
Prior art keywords
amino acid
ggpps
site
mutated
muteins
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010814751.2A
Other languages
English (en)
Inventor
郭玉双
贾蒙骜
王燃
董臣
余婧
李锋
魏攀
金立锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Institute of Tobacco Science
Original Assignee
Guizhou Institute of Tobacco Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Institute of Tobacco Science filed Critical Guizhou Institute of Tobacco Science
Publication of CN111718916A publication Critical patent/CN111718916A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01029Geranylgeranyl diphosphate synthase (2.5.1.29)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明属于烟草基因工程技术领域,具体涉及GGPPS定向突变蛋白专利申请事宜。现有GGPPS蛋白的154、161和218这三个位点位于酶的催化口袋,209和233这两个位点位于酶分子表面;基于这五个位点,本申请提供了GGPPS系列定向突变蛋白,其中包括:系列单位点突变蛋白、双位点突变蛋白、三位点突变蛋白、四位点突变蛋白、五位点突变蛋白。发明人利用CAST技术构建“小而精”的突变体文库,通过进一步筛选以及基于定向进化需要,发明人对特定位点氨基酸突变类型做了详细分析。初步实验结果表明,特定位点氨基酸突变后,β‑胡萝卜素合成量得到了明显提高,为进一步作物新品种培育奠定了一定技术基础。

Description

GGPPS定向单点突变蛋白及其应用
技术领域
本发明属于烟草基因工程技术领域,具体涉及GGPPS定向突变蛋白。
背景技术
类胡萝卜素是一种重要的质体色素,具有重要的生理作用,与植物的生长发育和光合作用密切相关,影响作物品质性状。牻牛儿基牻牛儿基二磷酸(geranylgeranyldiphosphate,GGPP)是类胡萝卜素、叶绿素和维生素E的植醇侧链、赤霉素以及二萜植保素的共同前体。GGPP由牻牛儿基牻牛儿基二磷酸合酶(GGPP synthase, GGPPS)催化产生,3分子异戊烯基焦磷酸(IPP)和1分子烯丙基异构体二甲基烯丙基焦磷酸(DMAPP),在GGPPS的作用下缩合生成C20的GGPP。
GGPP是类胡萝卜素合成的起始底物,能够被类胡萝卜素合成通路的端口酶八氢番茄红素(phytoene)合酶(phytoene synthase,PSY)催化形成八氢番茄红素,用于合成类胡萝卜素。对植物GGPPS基因家族的大量研究例证表明,该家族成员不仅编码萜类合成通路上游的重要酶蛋白,而且还直接参与调控植物萜类合成的各个通路,在调控方面发挥着核心作用。
现有研究中,对于类胡萝卜素合成途径虽然已有较多研究,但从植物改造角度而言,如果能够利用基因工程技术实现定向化的选育和培育,是实现植物最大化利用的重要技术前提。
作为合成生物学的关键性技术之一,定向生物进化技术获得了2018年诺贝尔化学奖。该技术广泛用于酶的活性设计,通过定向进化,可有效克服天然酶在环境耐受性、立体/区域选择性、底物特异性、催化效率及产物抑制性等方面存在的缺点,使得自然界成千上万年的进化历程在实验室内较短时间完成。
在酶的定向进化技术发展过程中,传统定向进化时,如利用易错 PCR、DNA混组、序列饱和突变、随机引发体外重组等技术时,存在突变效率低、筛选工作量大等缺点,制约了酶分子的体外定向进化的应用。组合活性中心饱和突变策略 (Combinatorial active-site saturation test,CAST) 则是一种较新的定向进化突变策略,该技术基于蛋白的结构信息,首先借助计算机的模拟基础,随后在酶催化活性中心周围选取与底物有直接相互作用的氨基酸残基,通过构建“小而精”的突变体文库,从而减少突变体文库的筛选规模。
总体上,虽然定向进化技术可以加快作物基因的进化历程,为作物品质的改良提供优质基因,但由于发展时间较短,且存在其他技术难题,因此目前定向进化技术仍未用于植物基因的改造。
烟草作为基因工程研究的模式作物之一,同时烟草内类胡萝卜素含量直接影响了烟草的品质性状。因此,如能结合定向进化对烟草萜类合成基因进行定向改造,对于加快烟草育种具有十分重要的应用意义,同时也可为其他作物的遗传育种奠定一定技术基础。
发明内容
本发明要解决的技术问题是:提供若干具有更好酶活的GGPPS及烟草GGPPS基因,从而为烟草育种、烟草新品种培育提供一种新的技术思路,同时也为其他作物育种和品种改良奠定一定技术基础。
本发明的技术方案是:。
本发明的有益效果:GGPP作为下游类胡萝卜素的前体物质,发明人通过对GGPPS酶活口袋关键氨基酸位点的结构分析,结果表明,154位、第161位、第209位、第218位和第233位是关键性位点。进一步地,发明人利用CAST技术构建“小而精”的突变体文库,从而克服传统定向进化筛选过程中突变率低、筛选量大等缺点。通过进一步筛选以及基于定向进化需要,发明人对特定位点氨基酸突变类型做了详细分析。初步实验结果表明,特定位点氨基酸突变后,β-胡萝卜素合成量得到了明显提高,为进一步作物新品种培育奠定了一定技术基础。
附图说明
图1为GGPPS-154突变体的细菌颜色实验,其中:A 双质粒细菌颜色实验,PAC-94N质粒上含有PSY,PDS以及LCY-B三个基因,而大肠杆菌体内可以合成IPP和DMAPP,但不能产生GGPP,在将具有酶活的GGPPS质粒与PAC-94N共同转化大肠杆菌后,即可在大肠杆菌体内催化产生β-胡萝卜素,使大肠杆菌由白色转化成黄色;B. GGPPS-154单位点突变的细菌颜色实验,其第154位氨基酸位点发生了突变,与PAC-94N双质粒共同转化大肠杆菌BL21(DE)3后,经IPTG诱导后,菌液颜色发生了明显变化,下图为OD440处的吸光值,以空的pET32b作为阴性对照,可以看出,突变体相较于野生型GGPPS在OD440处吸光值有明显提升;
图2为GGPPS-161突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-161单位点突变的细菌颜色实验;
图3为 GGPPS-218突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-218单位点突变的细菌颜色实验;
图4为GGPPS-209突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-209单位点突变的细菌颜色实验;
图5为GGPPS-233突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-233单位点突变的细菌颜色实验;
图6为GGPPS-154/161/218突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-154/161/218三位点组合突变的细菌颜色实验;
图7为GGPPS-209/233突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-209/233两位点组合突变的细菌颜色实验;
图8为GGPPS-154/161/209/218/233突变体的细菌颜色实验,A图与图1A相同,为合成原理图,B图为GGPPS-154/161/209/218/233五位点组合突变的细菌颜色实验。
图9为GGPPS-154与主流作物GGPPS位点对比分析,图中:辣椒(CaGGPPS1)、马铃薯(StGGPPS1)、小麦(TaGGPPS1)、玉米(ZmGGPPS1)、丹参(SmGGPPS1)、咖啡(CanGGPPS1)、胡萝卜(DcGGPPS1)、葡萄(VvGGPPS)、黄瓜(CsaGGPPS)、西瓜(ClGGPPS)、苹果(MdGGPPS1)、橙子(CsiGGPPS)、橡胶树(HbGGPPS)、菊花(CmGGPPS)、水稻(OsGGPPS1)、番茄(SlGGPPS1)、蓖麻(RcGGPPS)、香蕉(MaGGPPS)和银杏(GbGGPPS)。
具体实施方式
下面结合附图和实施例对本申请做进一步的解释说明。
实施例1
由于现有牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)基因的获得是相关序列分析、以及定向进化突变的基础,因此,本实施例首先就现有牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)基因的克隆获得过程简介如下。
首先,根据GenBank登录号NM_001325177.1所示的基因序列,设计PCR扩增用引物序列如下:
正向引物:5’-atgagatctatgaatcttgt-3’,
反向引物:5’-attttcacgataagcaatgt-3’;
随后,进行PCR扩增;
对PCR扩增产物进行电泳检测后,回收、纯化,并将回收纯化后的PCR产物与pGEMT质粒进行连接;
随后,将连接产物转化大肠杆菌DH5α感受态细胞,过夜培养后,挑选并鉴定阳性克隆,以获得重组正确的克隆质粒pGEMT-GGPPS。
为便于后续GGPPS的表达,利用pET-32b(+)质粒,发明人进一步构建了重组表达载体,具体过程为:
首先,设计一对含有NdeⅠ和XhoⅠ酶切位点的引物序列如下:
正向引物:5’-gctaatccatatgGAGCAATTCAATTTCAAAACT-3’,
反向引物:5’-cagctcgagATTTTCACGATAAGCAATGTAAT-3’;
随后,以上述克隆质粒pGEMT-GGPPS为模板,进行PCR扩增,以获得GGPPS基因,并对PCR扩增产物进行回收、纯化;
随后,对PCR扩增获得的GGPPS基因产物和pET-32b(+)质粒分别进行NdeⅠ、XhoⅠ双酶切,回收酶切产物后进行连接;
最后,将连接产物转化DH5α感受态细胞,过夜培养后,挑选阳性克隆进行鉴定,将鉴定正确重组表达质粒载体重新命名为:pET-32b(+)-GGPPS。
实施例2
为便于相关突变位点的检测和分析,本申请中采用了牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)重组工程菌株进行实验验证,因此,本实施例就该工程菌株的构建过程简介如下。
首先,将实施例1中所构建的重组载体pET-32b(+)-GGPPS与PAC-94N质粒共转化表达菌株E.coli BL21(DE3),同时以空载体pET-32b(+)与PAC-94N质粒共转化作为阴性对照菌株;
随后,过夜培养后,挑选阳性克隆进行鉴定,对于测序正确的阳性克隆菌株进行保藏或者进行进一步β-胡萝卜素含量检测。
β-胡萝卜素含量检测原理为:大肠杆菌自身不能产生GGPP,而PAC-94N质粒则含有β-胡萝卜素合成通路的所有基因,但不含牻牛儿基牻牛儿基二磷酸合成酶编码基因(图.1A),因此,在将重组载体pET-32b(+)-GGPPS与PAC-94N质粒共转化时,则可催化产生GGPP的菌株由白色转变为黄色,而且酶活性越强菌株,黄色越深,进一步通过分光光度计测量OD440的吸光值,即可对最终产物β-胡萝卜素含量进行测定。
实施例3
由于烟草GGPPS尚无晶体结构报道,因此为对该蛋白进行分析,基于其氨基酸序列,发明人对该酶进行了同源建模。建模过程中,其最优模板为3kro,分值为0.993(TM-score用来衡量两个蛋白结构模型的匹配度,分值由0到1,1意味着完美的匹配),根均方差偏离值(RMSD)为0.36 Å,序列一致性(IDEN)为74.9 %,蛋白结构覆盖度(Cov)为99.7 %。
使用Rosetta_docking程序分别将底物C5-DMAPP、C10-GPP、C15-FPP对接至GGPPS催化口袋。通过寻找受体小分子化合物和酶作用的最佳结合位置,从而预测其结合模式。最终分析结果表明:其第154位,第161位和第218位位点位于酶的催化口袋,氨基酸替换后可进一步提高底物与酶活口袋结合能力,并且这些位点参与了酶活调控;而第209位和第233位氨基酸位点位于酶分子表面,有利于蛋白形成二聚体。
需要说明的是,现有GGPPS,由296个氨基酸组成,具体序列如SEQ ID No.1所示,编码GGPPS的基因,由888个核苷酸构成,具体序列如SEQ ID No.2所示,基于上述分析,发明人进一步构建了针对这5个位点的GGPPS饱和突变体文库,具体构建过程简介如下。
首先,根据上述5个位点设计简并引物序列如下:
V154-F:5’-ggaactgaagggttannkgctggacaagtagcg-3’,
I161-F: 5’-ggacaagtagcggatnnkgcttgtactggtaac-3’,
I209-F: 5’-gtggagaaattgaggnnkttcgcgagatgtatt-3’,
F218-F: 5’-tgtattggattattgnnkcaagtagtagatgat-3’,
V233-F: 5’-acaaagtcgtcggagnnkctcggaaaaaccgcc-3’,
general-R: 5’-cacgataagcaatgtaatccg-3’;
随后,以实施例1所构建pET-32b(+)-GGPPS为模板,然后分别以V154-F、I161-F、I209-F、F218-F和V233-F作为正向引物,以general-R作为反向引物,进行全质粒PCR;
再后,将PCR扩增产物进行DpnI消化,随后将消化后的产物与PAC-94N双质粒共同转化E.coli BL21(DE3)感受态细胞,转化结束后,将菌液涂布于含有100 μg/L氨苄青霉素和34μg/L氯霉素的平板,最终获得饱和突变文库。
进一步筛选时,挑选阳性单克隆,培养于含有氨苄青霉素(100 μg/L)和氯霉素(34μg/L)的20ml LB液体培养基里培养过夜,再用终浓度为0.1mM 的IPTG在18℃下诱导表达18小时,培养结束后,离心弃上清,拍照,采用3ml的丙酮重悬后,测量OD440值。
采用上述高通量筛选方法,最终筛选确定吸光度明显增强的突变子并进一步进行测序。结果表明,当:第154位的Val(V)氨基酸突变为中性氨基酸Ala(A)或者突变为半胱氨酸Cys(C);第161位的Ile(I)氨基酸突变为中性脂肪族氨基酸Leu(L)或者突变为含有巯基的氨基酸Met(M);第209位Ile(I)氨基酸突变为碱性氨基酸Lys(K)、含有羟基的氨基酸Ser(S)、天冬氨酸Asp(D)、天冬酰胺Asn(N)、丙氨酸Ala(A)或脯氨酸Pro(P);第218位Phe(F)氨基酸突变为芳香族氨基酸酪氨酸Tyr(Y)或者突变为亮氨酸Leu(L);第233位氨基酸Val突变为酸性氨基酸酸为Glu(E)或者突变为酪氨酸Tyr(Y)时;烟草牻牛儿基牻牛儿基二磷酸合成酶GGPPS有明显变化。
针对154位点:
当154位点突变为A时,其氨基酸序列为SEQ ID No.13;
其对应碱基编码序列为SEQ ID No.14;
当154位点突变为C时,其编码碱基序列为SEQ ID No.15。
针对161位点:
当161位点突变为L时,其编码碱基序列为SEQ ID No.16;
当161位点突变为M时,其编码碱基序列为SEQ ID No.17。
针对218位点:
当218位点突变为L时,其编码碱基序列为SEQ ID No.18;
当218位点突变为Y时,其编码碱基序列为SEQ ID No.19。
针对209位点:
当209位点突变为P时,其编码碱基序列为SEQ ID No.20;
当209位点突变为K时,其编码碱基序列为SEQ ID No.21;
当209位点突变为D时,其编码碱基序列为SEQ ID No.22;
当209位点突变为N时,其编码碱基序列为SEQ ID No.23;
当209位点突变为S时,其编码碱基序列为SEQ ID No.24;
当209位点突变为A时,其编码碱基序列为SEQ ID No.25。
针对233位点:
当233位点突变为E时,其编码碱基序列为SEQ ID No.26;
当233位点突变为Y时,其编码碱基序列为SEQ ID No.27。
其他双位点、三位点或五位点的具体碱基序列参考上述即可,例如,针对五位点突变蛋白GGPPS-154A/161L/209S/218Y/233E,其氨基酸序列为SEQ ID No.28;
此时,对应编码碱基序列为SEQ ID No.29。
进一步地,发明人将第154位、第161位、第209位、第218位和第233位氨基酸位点进行了不同组合形式突变,并利用现有基因工程技术合成了不同组合突变的表达载体,进一步利用实施例2中的牻牛儿基牻牛儿基二磷酸合成酶(GGPPS)重组工程菌株构建方法构建了不同菌株,并对β-胡萝卜素合成量情况进行了检测。具体检测结果简介如下。
如图1~图5所示单位点实验结果表明:
当第154位Val突变为Ala或Cys,第161位Ile突变为Leu或Met,第209位Ile突变为Lys、Ser、天冬氨酸Asp、天冬酰胺Asn、丙氨酸Ala、脯氨酸Pro,第218位Phe突变为Leu或Tyr,第233位Val突变为Glu或Tyr时,菌体颜色或者说β-胡萝卜素合成量均有明显提升;
如图6~图8所示双位点、三位点和五位点实验结果表明,特定突变方向情况下,不同位点组合情况时,菌体颜色或者说β-胡萝卜素合成量也均有明显提升。
上述结果表明,针对特定位点的定向突变进化方式,可以较好提供GGPPS酶活,从而为进一步提供作物中β-胡萝卜素含量奠定良好基础。
实施例4
在实施例3的分析和验证基础上,发明人进一步对现有主流作物的GGPPS改造位点进行了分析。氨基酸序列的比较分析结果(如图9所示,图9仅展示了154位点对比结果)表明:与本申请烟草的GGPPS类似,主流作物辣椒(CaGGPPS1)、马铃薯(StGGPPS1)、小麦(TaGGPPS1)、玉米(ZmGGPPS1)、丹参(SmGGPPS1)、咖啡(CanGGPPS1)、胡萝卜(DcGGPPS1)、葡萄(VvGGPPS)、黄瓜(CsaGGPPS)、西瓜(ClGGPPS)、苹果(MdGGPPS1)、橙子(CsiGGPPS)、橡胶树(HbGGPPS)、菊花(CmGGPPS)、水稻(OsGGPPS1)、番茄(SlGGPPS1)、蓖麻(RcGGPPS)、香蕉(MaGGPPS)和银杏(GbGGPPS)中GGPPS酶的这5个位点均较为保守,因此,基于相同位点的突变方式是较为可行的,或者直接利用本申请所获得的定向突变蛋白也是可行的,也即,为这些主流作物的新品种培育提供了一种新的思路。
序列表
<110> 贵州省烟草科学研究院
<120>
<130> 1
<160> 29
<210> 1
<211> 296
<212> 氨基酸
<213> GGPPS
<400> 1
EQFNFKTYVA EKAISVNKAL DEAVIVKDPP VIHEAMRYSL LAGGKRVRPM LCLAACELVG 60
GDQSNAMPAA CAVEMIHTMS LIHDDLPCMD NDDLRRGKPT NHKVYGEDVA VLAGDSLLAF 120
AFEYIATATA GVSPSRILAA IGELAKSIGT EGLVAGQVAD IACTGNPNVG LDTLEFIHIH 180
KTAALLEASV VLGAILGGGT DEEVEKLRIF ARCIGLLFQV VDDILDVTKS SEVLGKTAGK 240
DLAVDKTTYP KLLGLEKAKE FAAELNRDAK QQLVEFDPHK AAPLIALADY IAYREN 296
<210> 2
<211>888
<212> DNA
<213> GGPPS
<400> 2
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 3
<211> 20
<212> DNA
<213> 人工合成
<400> 3
atgagatctatgaatcttgt
<210> 4
<211> 20
<212> DNA
<213> 人工合成
<400> 4
attttcacgataagcaatgt
<210> 5
<211>34
<212> DNA
<213> 人工合成
<400> 5
gctaatccatatgGAGCAATTCAATTTCAAAACT
<210> 6
<211> 32
<212> DNA
<213> 人工合成
<400> 6
cagctcgagATTTTCACGATAAGCAATGTAAT
<210> 7
<211> 33
<212> DNA
<213> 人工合成
<400> 7
ggaactgaagggttannkgctggacaagtagcg
<210> 8
<211> 33
<212> DNA
<213> 人工合成
<400> 8
ggacaagtagcggatnnkgcttgtactggtaac
<210> 9
<211> 33
<212> DNA
<213> 人工合成
<400> 9
gtggagaaattgaggnnkttcgcgagatgtatt
<210> 10
<211> 30
<212> DNA
<213> 人工合成
<400> 10
tgtattggattattgnnkcaagtagtagatgat
<210> 11
<211> 30
<212> DNA
<213> 人工合成
<400> 11
acaaagtcgtcggagnnkctcggaaaaaccgcc
<210> 12
<211> 21
<212> DNA
<213> 人工合成
<400> 12
cacgataagcaatgtaatccg
<210> 13
<211> 296
<212> 氨基酸
<213> GGPPS-154A
<400> 13
EQFNFKTYVA EKAISVNKAL DEAVIVKDPP VIHEAMRYSL LAGGKRVRPM LCLAACELVG 60
GDQSNAMPAA CAVEMIHTMS LIHDDLPCMD NDDLRRGKPT NHKVYGEDVA VLAGDSLLAF 120
AFEYIATATA GVSPSRILAA IGELAKSIGT EGLAAGQVAD IACTGNPNVG LDTLEFIHIH 180
KTAALLEASV VLGAILGGGT DEEVEKLRIF ARCIGLLFQV VDDILDVTKS SEVLGKTAGK 240
DLAVDKTTYP KLLGLEKAKE FAAELNRDAK QQLVEFDPHK AAPLIALADY IAYREN 296
<210> 14
<211> 888
<212> DNA
<213> GGPPS-154A
<400> 14
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG CGGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 15
<211> 888
<212> DNA
<213> GGPPS-154C
<400> 15
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAT GCGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 16
<211> 888
<212> DNA
<213> GGPPS-161L
<400> 16
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
CTGGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 17
<211> 888
<212> DNA
<213> GGPPS-161M
<400> 17
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATGGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 18
<211> 888
<212> DNA
<213> GGPPS-218L
<400> 18
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GCTGCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 19
<211> 888
<212> DNA
<213> GGPPS-218Y
<400> 19
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTATCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 20
<211> 888
<212> DNA
<213> GGPPS-209P
<400> 20
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGCCGTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 21
<211> 888
<212> DNA
<213> GGPPS-209K
<400> 21
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGAAATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 22
<211> 888
<212> DNA
<213> GGPPS-209D
<400> 22
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGGATTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 23
<211> 888
<212> DNA
<213> GGPPS-209N
<400> 23
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGAATTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 24
<211> 888
<212> DNA
<213> GGPPS-209S
<400> 24
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGAGCTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 25
<211> 888
<212> DNA
<213> GGPPS-209A
<400> 25
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGGCGTTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGTGC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 26
<211> 888
<212> DNA
<213> GGPPS-233E
<400> 26
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGAAC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 27
<211> 888
<212> DNA
<213> GGPPS-233Y
<400> 27
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG TAGCTGGACA AGTAGCGGAT 480
ATAGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGATATTC GCGAGATGTA TTGGATTATT GTTTCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGTATC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 888
<210> 28
<211> 296
<212> 氨基酸
<213> GGPPS-154A/161L/209S/218Y/233E
<400> 28
EQFNFKTYVA EKAISVNKAL DEAVIVKDPP VIHEAMRYSL LAGGKRVRPM LCLAACELVG 60
GDQSNAMPAA CAVEMIHTMS LIHDDLPCMD NDDLRRGKPT NHKVYGEDVA VLAGDSLLAF 120
AFEYIATATA GVSPSRILAA IGELAKSIGT EGLAAGQVAD LACTGNPNVG LDTLEFIHIH 180
KTAALLEASV VLGAILGGGT DEEVEKLRSF ARCIGLLYQV VDDILDVTKS SEELGKTAGK 240
DLAVDKTTYP KLLGLEKAKE FAAELNRDAK QQLVEFDPHK AAPLIALADY IAYREN 296
<210> 29
<211> 888
<212> DNA
<213> GGPPS-154A/161L/209S/218Y/233E
<400> 29
GAGCAATTCA ATTTCAAAAC TTACGTAGCT GAAAAGGCTA TTTCTGTAAA TAAAGCTTTA 60
GATGAGGCTG TTATAGTAAA AGACCCACCT GTGATCCACG AAGCAATGCG CTATTCACTT 120
CTCGCCGGCG GCAAAAGAGT CCGACCGATG CTCTGCCTCG CCGCCTGCGA GCTCGTCGGC 180
GGCGACCAAT CCAACGCCAT GCCGGCTGCT TGCGCCGTCG AGATGATCCA CACTATGTCC 240
CTCATTCACG ACGATTTACC TTGTATGGAT AACGACGATC TCCGCCGTGG AAAGCCGACG 300
AACCACAAAG TCTACGGCGA GGACGTGGCG GTCCTCGCCG GAGACTCGCT CCTCGCTTTC 360
GCCTTCGAGT ACATCGCCAC CGCTACCGCC GGAGTTTCAC CGTCGAGGAT CCTCGCCGCC 420
ATCGGCGAAC TGGCGAAATC CATCGGAACT GAAGGGTTAG CGGCTGGACA AGTAGCGGAT 480
CTGGCTTGTA CTGGTAACCC TAATGTTGGA CTCGACACAC TCGAATTCAT TCACATACAC 540
AAAACGGCGG CGCTTCTAGA AGCTTCCGTA GTTCTCGGAG CAATCCTCGG CGGCGGAACA 600
GATGAAGAAG TGGAGAAATT GAGGAGCTTC GCGAGATGTA TTGGATTATT GTATCAAGTA 660
GTAGATGATA TACTCGATGT TACAAAGTCG TCGGAGGAAC TCGGAAAAAC CGCCGGAAAA 720
GATTTGGCAG TAGATAAAAC GACGTATCCA AAACTGCTGG GATTGGAAAA GGCTAAGGAA 780
TTTGCGGCGG AGCTCAACCG AGATGCTAAA CAACAGCTGG TGGAATTTGA TCCACACAAA 840
GCTGCTCCCT TGATTGCTTT GGCGGATTAC ATTGCTTATC GTGAAAAT 880

Claims (4)

1.GGPPS定向突变蛋白,其特征在于:GGPPS蛋白碱基序列中,其第154位的Val氨基酸突变为中性氨基酸Ala或者半胱氨酸Cys(C);
或,其第161位的Ile氨基酸突变为中性脂肪族氨基酸Leu或者含有巯基的氨基酸Met;
或,其第209位Ile氨基酸突变为碱性氨基酸Lys、含有羟基的氨基酸Ser、天冬氨酸Asp、天冬酰胺Asn、丙氨酸Ala或脯氨酸Pro中任一个;
或,其第218位Phe氨基酸突变为芳香族氨基酸酪氨酸Tyr或者亮氨酸Leu;
或,其第233位氨基酸Val突变为酸性氨基酸酸为Glu或者酪氨酸Tyr。
2.如权利要求1所述的GGPPS定向突变蛋白,其特征在于:所述的突变位点任意两、三或五单位点组合所构成的突变蛋白。
3.如权利要求1或2所述的GGPPS定向突变蛋白在合成作物色素类物质中的应用。
4.根据权利要求3所述的应用,其特征在于:所述作物为:烟草、辣椒、番茄、水稻、玉米、小麦、马铃薯、蓖麻、苹果、黄瓜、西瓜、胡萝卜、香蕉、橙子、葡萄、咖啡、银杏、丹参、菊花或橡胶树。
CN202010814751.2A 2020-06-08 2020-08-13 Ggpps定向单点突变蛋白及其应用 Pending CN111718916A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010510096 2020-06-08
CN2020105100961 2020-06-08

Publications (1)

Publication Number Publication Date
CN111718916A true CN111718916A (zh) 2020-09-29

Family

ID=72574275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010814751.2A Pending CN111718916A (zh) 2020-06-08 2020-08-13 Ggpps定向单点突变蛋白及其应用

Country Status (1)

Country Link
CN (1) CN111718916A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5882909A (en) * 1995-09-01 1999-03-16 Toyota Jidosha Kabushiki Kaisha Nucleic acid encoding mutant geranylgeranyl diphosphate synthase
CN1252838A (zh) * 1997-12-16 2000-05-10 丰田自动车株式会社 牻牛儿基二磷酸合酶基因
CN101475946A (zh) * 2009-01-16 2009-07-08 上海师范大学 丹参牻牛儿基牻牛儿基焦磷酸合成酶基因及其编码的蛋白质和应用
CN111593032A (zh) * 2020-05-26 2020-08-28 中国烟草总公司郑州烟草研究院 酶口袋和酶分子表面的定向五位点突变蛋白ggpps

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5882909A (en) * 1995-09-01 1999-03-16 Toyota Jidosha Kabushiki Kaisha Nucleic acid encoding mutant geranylgeranyl diphosphate synthase
CN1252838A (zh) * 1997-12-16 2000-05-10 丰田自动车株式会社 牻牛儿基二磷酸合酶基因
CN101475946A (zh) * 2009-01-16 2009-07-08 上海师范大学 丹参牻牛儿基牻牛儿基焦磷酸合成酶基因及其编码的蛋白质和应用
CN111593032A (zh) * 2020-05-26 2020-08-28 中国烟草总公司郑州烟草研究院 酶口袋和酶分子表面的定向五位点突变蛋白ggpps

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IRINA ORLOVA ET AL.: "The Small Subunit of Snapdragon Geranyl Diphosphate Synthase Modifies the Chain Length Specificity of Tobacco Geranylgeranyl Diphosphate Synthase in Planta", 《THE PLANT CELL》 *
唐美琼等: "植物GGPPS基因研究进展", 《湖北农业科学》 *
魏攀等: "烟草牻牛儿基牻牛儿基焦磷酸合成酶基因NtGGPPS1的克隆和功能分析", 《烟草科技》 *

Similar Documents

Publication Publication Date Title
CN107686840B (zh) 梨转录因子PyERF3及其重组表达载体和应用
CN105907780A (zh) 一种在作物种子胚乳生产虾青素的转基因育种方法
CN113957086B (zh) SlBIN2基因在调控番茄果实成熟和类胡萝卜素合成中的应用
Gabruk et al. The origin, evolution and diversification of multiple isoforms of light-dependent protochlorophyllide oxidoreductase (LPOR): focus on angiosperms
CN111593032B (zh) 酶口袋和酶分子表面的定向五位点突变蛋白ggpps
CN111500551B (zh) Ggpps定向单点突变蛋白ggpps-218
CN109517812A (zh) 杜鹃花查尔酮合成酶RsCHS蛋白及其编码基因
CN111534496B (zh) Ggpps定向单点突变蛋白ggpps-154
CN111549009B (zh) 定向三点突变蛋白ggpps-154-161-218
CN111549010B (zh) Ggpps定向双位点突变蛋白209-233
CN111534497B (zh) Ggpps定向单点突变蛋白ggpps-161
CN111718916A (zh) Ggpps定向单点突变蛋白及其应用
CN107326035B (zh) 一种调控水稻粒型和叶色的去泛素化酶基因ubp5及其应用
CN111534499A (zh) Ggpps定向单点突变蛋白ggpps-233
Slugina et al. Structural and functional diversification of SEPALLATA genes TM5 and RIN in tomato species (section Lycopersicon)
CN105143247B (zh) 包含hat22多核苷酸和多肽的新颖组合物以及使用方法
CN108395473A (zh) 植物类胡萝卜素合成相关蛋白及其编码基因与应用
CN108504665B (zh) 一种花椰菜内参基因及其应用
CN114196678A (zh) 一个控制水稻种子活力刺猬互作蛋白OsHIPL1基因及其工程应用
CN104388446B (zh) 邳半夏鲨烯合酶基因及其编码的蛋白质与应用
CN117737026A (zh) 与小麦籽粒中类胡萝卜素含量相关的ggpps突变蛋白
CN106811448B (zh) 棉花酪氨酸蛋白磷酸酶GhPTP1及其编码基因和应用
CN104694557B (zh) 一种牻牛儿基牻牛儿基二磷酸合酶基因及其编码蛋白和应用
CN110407922A (zh) 水稻耐冷基因qSCT1及其应用
CN114854779B (zh) 一种番茄抗坏血酸生物合成基因pmi及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200929

RJ01 Rejection of invention patent application after publication