[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN107699581B - 3,7-二羟基卓酚酮生物合成基因簇及其应用 - Google Patents

3,7-二羟基卓酚酮生物合成基因簇及其应用 Download PDF

Info

Publication number
CN107699581B
CN107699581B CN201710719271.6A CN201710719271A CN107699581B CN 107699581 B CN107699581 B CN 107699581B CN 201710719271 A CN201710719271 A CN 201710719271A CN 107699581 B CN107699581 B CN 107699581B
Authority
CN
China
Prior art keywords
ala
arg
leu
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710719271.6A
Other languages
English (en)
Other versions
CN107699581A (zh
Inventor
陶美凤
陈雪斐
徐敏
王业民
邓子新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201710719271.6A priority Critical patent/CN107699581B/zh
Publication of CN107699581A publication Critical patent/CN107699581A/zh
Application granted granted Critical
Publication of CN107699581B publication Critical patent/CN107699581B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了一种3,7‑二羟基卓酚酮生物合成基因簇及其应用。该生物合成基因簇共包含8个结构基因:trlA、trlB、trlC、trlD、trlE、trlF、trlH以及trlI;1个调控相关基因:trlJ;以及1个其他功能基因:trlG。其中trlB、trlJ为参与强化分支酸代谢途径的关键调控蛋白,trlC、trlD、trlE提供能够在卓酚酮七元芳香环上进行顺序氧化的工具酶。本发明所提供的基因及其蛋白可用来发现或研究用于医药、工农业的新化合物、基因或蛋白。本发明还提供了一系列工程改造菌株能够高产不同的卓酚酮类化合物,如卓酚酮、7‑羟基卓酚酮、环庚三烯酮和1,4,6‑环庚三烯‑1‑羧酸。

Description

3,7-二羟基卓酚酮生物合成基因簇及其应用
技术领域
本发明属于微生物基因资源和基因工程领域,具体涉及一种抗生素-3,7二羟基卓酚酮的生物合成基因簇及其应用。
背景技术
3,7二羟基卓酚酮是一类具有稀有七元芳香环结构的天然产物,最初于1988年在Streptomyces tropolofaciens No.K611-97(ATCC 53548)中发现并报道。3,7二羟基卓酚酮具有非常好的抗革兰氏阳性细菌、革兰氏阴性菌、分枝杆菌及真菌等广谱抗菌活性,同时还具有非常好的抗肿瘤尤其是B16黑色素瘤的活性以及抗病毒如艾滋病毒(HIV)、乙型肝炎病毒(HBV)及疱疹病毒(HSV)等活性。3,7二羟基卓酚酮因其特殊的α-羟基酮的结构,可以螯合金属离子,因而其可以发挥金属离子螯合剂的功能,抑制金属酶的活性。
基于卓酚酮类化合物的稀有结构骨架与优异的生物活性,卓酚酮类化合物已经成为了一个非常重要的药物研发的先导化合物(lead compound),近期对于卓酚酮类化合物尤其是β-thujaplicin的结构改造的工作也取得了很大进展。然而3,7-二羟基卓酚酮由于产量的限制,导致其在发现后的近30年中取得的研究进展十分有限。
相对于真菌以及植物中研究的比较透彻的卓酚酮类化合物的生物合成途径,细菌中的卓酚酮类化合物的生物合成途径还没有得到很好的揭示。尤其是3,7-二羟基卓酚酮七元芳香环上的羟基化修饰目前为止还没有报道,然而3,7-二羟基卓酚酮上的羟基化修饰是其螯合金属离子发挥抗菌、抗癌以及抗病毒作用所必需的。
因而3,7-二羟基卓酚酮生物合成途径的揭示,对于理解细菌卓酚酮类化合物的合成机理,并进一步利用其进行结构改造具有重要意义。
在本发明中,通过高通量异源表达筛选的方法,获得了3,7-二羟基卓酚酮的生物合成基因簇。结合后续的DNA测序以及分子生物学与生物化学等技术手段,阐明了3,7-二羟基卓酚酮的生物合成机制,尤其是3,7-二羟基卓酚酮七元芳香环上羟基化修饰。基于此研究,本发明可以利用3,7-二羟基卓酚酮生物合成基因簇中的羟基化酶对其他卓酚酮结构类似物进行修饰,提高相应化合物的生物活性;亦或是在羟基化修饰的基础上进一步的结合化学衍生修饰等手段合成更多活性优良的化合物。
发明内容
本发明的目的在于提供一种3,7-二羟基卓酚酮的生物合成基因簇及其所包含的蛋白的功能的研究应用。具体地,本发明提供了由基因工程菌株Streptomyces coelicolorM1154/pCXF1CGMCC No.13916产生的具有广谱抗菌、抗癌以及抗病毒活性的抗生素-3,7-二羟基卓酚酮(3,7-dihydroxytropolone)的生物合成基因簇的克隆、异源表达、测序分析、生物合成途径研究、相关酶的功能研究及其应用。
所述天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF1已于2017年3月23日递交中国微生物菌种保藏管理委员会普通微生物中心保藏,保藏地址为北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所,菌种保藏编号为CGMCC No.13916。
中断3,7-二羟基卓酚酮生物合成基因簇的天蓝色链霉菌(Streptomycescoelicolor)M1154/pCXF3已于2017年4月7日递交中国微生物菌种保藏管理委员会普通微生物中心保藏,保藏地址为北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所,菌种保藏编号为CGMCC No.14005。
中断单加氧酶合成基因trlC的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF6已于2017年3月23日递交中国微生物菌种保藏管理委员会普通微生物中心保藏,保藏地址为北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所,菌种保藏编号为CGMCCNo.13918。
中断黄素还原酶合成基因trlD的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF7已于2017年3月23日递交中国微生物菌种保藏管理委员会普通微生物中心保藏,保藏地址为北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所,菌种保藏编号为CGMCC No.13919。
中断单加氧酶合成基因trlE的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF8已于2017年3月23日递交中国微生物菌种保藏管理委员会普通微生物中心保藏,保藏地址为北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所,菌种保藏编号为CGMCCNo.13920。
中断氧化酶合成基因trlF的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF9已于2017年3月23日递交中国微生物菌种保藏管理委员会普通微生物中心保藏,保藏地址为北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所,菌种保藏编号为CGMCCNo.13921。
本发明的目的是通过以下技术方案来实现的:
第一方面,本发明涉及一种3,7-二羟基卓酚酮的生物合成基因簇,所述基因簇包括编码3,7-二羟基卓酚酮生物合成所涉及的10个基因:
S1、负责3,7-二羟基卓酚酮生物合成的结构基因,包括trlA、trlB、trlC、trlD、trlE、trlF、trlH以及trlI;其中,
trlA位于如SEQ ID NO.1所示基因簇核苷酸序列的第1-480位,编码酰基辅酶A脱水酶,大小为159个氨基酸;
trlB位于如SEQ ID NO.1所示基因簇核苷酸序列的第530-1984位,编码3-脱氧-D-阿糖基庚酮酸-7-磷酸合成酶,大小为484个氨基酸;
trlC位于如SEQ ID NO.1所示基因簇核苷酸序列的第2248-3840位,编码单加氧酶,大小为530个氨基酸;
trlD位于如SEQ ID NO.1所示基因簇核苷酸序列的第3837-4394位,编码黄素还原酶,大小为185个氨基酸;
trlE位于如SEQ ID NO.1所示基因簇核苷酸序列的第4439-5641位,编码单加氧酶,大小为400个氨基酸;
trlF位于如SEQ ID NO.1所示基因簇核苷酸序列的第5697-6308位,编码氧化酶,大小为203个氨基酸;
trlH位于如SEQ ID NO.1所示基因簇核苷酸序列的第6536-7297位,编码硫酯酶,大小为253个氨基酸;
trlI位于如SEQ ID NO.1所示基因簇核苷酸序列的第7299-8508位,编码预苯酸脱水酶-分支酸变位酶双功能酶,大小为402个氨基酸;
S2、负责3,7-二羟基卓酚酮生物合成的调控基因,包括trlJ;
trlJ位于如SEQ ID NO.1所示基因簇核苷酸序列的第8483-9112位,编码TetR家族转录调控蛋白,大小为209个氨基酸;
S3、其他功能蛋白基因,包括trlG;
trlG位于如SEQ ID NO.1所示基因簇核苷酸序列的第6327-6539位,编码其他功能蛋白,大小为70个氨基酸。
优选的,所述基因簇的碱基序列如SEQ ID NO.1中第1-9112位所示。
第二方面,本发明还涉及一种上述3,7-二羟基卓酚酮的生物合成基因簇在催化合成3,7-二羟基卓酚酮及其类似物中的用途。
第三方面,本发明还涉及一种上述3,7-二羟基卓酚酮生物合成基因簇编码的蛋白。
优选的,编码蛋白的氨基酸序列如SEQ ID NO.2-11所示。
其中,如SEQ ID NO.4所示的蛋白为单加氧酶TrlC。
如SEQ ID NO.5所示的蛋白为黄素还原酶TrlD。
如SEQ ID NO.6所示的蛋白为单加氧酶TrlE。
如SEQ ID NO.7所示的蛋白为氧化酶TrlF。
第四方面,本发明还涉及一种上述3,7-二羟基卓酚酮的生物合成基因簇编码的蛋白在催化合成3,7-二羟基卓酚酮及其类似物中的用途。
第五方面,本发明还涉及一种含有上述3,7-二羟基卓酚酮的生物合成基因簇的表达载体。
优选的,所述表达载体的大小为46,192bp,携带39,142bp的外源片段。
第六方面,本发明还涉及一种携带上述的表达载体,即染色体上整合有外源的上述3,7-二羟基卓酚酮生物合成基因簇的重组表达菌株。
优选的,所述的重组表达菌株是天蓝色链霉菌。
第七方面,本发明还涉及一种基因工程菌株,所述基因工程菌株携带上述3,7-二羟基卓酚酮生物合成基因簇。
优选的,所述基因工程菌株为天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF1CGMCC No.13916。
第八方面,本发明还涉及一种基因工程菌株,所述菌株携带上述3,7-二羟基卓酚酮的生物合成基因簇,且其中的某一种或几种基因被失活。
优选的,3,7-二羟基卓酚酮生物合成基因簇被基因失活的基因工程菌株为天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF3CGMCC No.14005。
优选的,3,7-二羟基卓酚酮生物合成基因簇缺失的菌株不能产生3,7-二羟基卓酚酮。
优选的,trlC基因失活的基因工程菌株为天蓝色链霉菌(Streptomycescoelicolor)M1154/pCXF6 CGMCC No.13918。
优选的,trlC的失活菌株不能产生3,7-二羟基卓酚酮,但能合成3,7-二羟基卓酚酮的前体卓酚酮(tropolone)。
优选的,trlD基因失活的基因工程菌株为天蓝色链霉菌(Streptomycescoelicolor)M1154/pCXF7 CGMCC No.13919。
优选的,trlD的失活菌株不能产生3,7-二羟基卓酚酮,但能合成3,7-二羟基卓酚酮的前体7-羟基卓酚酮(tropolone)。
优选的,trlE基因失活的基因工程菌株为天蓝色链霉菌(Streptomycescoelicolor)M1154/pCXF8 CGMCC No.13920。
优选的,trlE的失活菌株不能产生3,7-二羟基卓酚酮,但能合成3,7-二羟基卓酚酮的前体2,4,6-环庚三烯酮(tropone)。
优选的,trlF基因失活的基因工程菌株为天蓝色链霉菌(Streptomycescoelicolor)M1154/pCXF9 CGMCC No.13921。
优选的,trlF的失活菌株不能产生3,7-二羟基卓酚酮,但能合成3,7-二羟基卓酚酮的前体1,4,6-环庚三烯-1-羧酸(cyclohepta-1,4,6-triene-1-formic acid)。
第九方面,本发明还涉及一种中断3,7-二羟基卓酚酮生物合成基因簇的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF3 CGMCC No.14005。
第十方面,本发明还涉及一种中断单加氧酶合成基因trlC的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF6 CGMCC No.13918。
第十一方面,本发明还涉及一种中断黄素还原酶合成基因trlD的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF7 CGMCC No.13919。
第十二方面,本发明还涉及一种中断氧化酶合成基因trlE的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF8 CGMCC No.13920。
第十三方面,本发明还涉及一种中断氧化酶合成基因trlF的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF9 CGMCC No.13921。
第十四方面,本发明还涉及一种上述的天蓝色链霉菌在催化合成卓酚酮、7-羟基卓酚酮、环庚三烯酮或1,4,6-环庚三烯-1-羧酸中的用途。
其中,天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF6 CGMCC No.13918用于催化合成卓酚酮。
天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF7 CGMCC No.13919用于催化合成7-羟基卓酚酮和少量卓酚酮。
天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF8 CGMCC No.13920用于催化合成2,4,6-环庚三烯酮。
天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF9 CGMCC No.13921用于催化合成1,4,6-环庚三烯-1-羧酸。
本发明的原理在于:卓酚酮类化合物是一类具有稀有七元芳香环结构的次级代谢产物,具有非常好的抗菌、抗癌以及抗病毒的活性。相对于真菌以及植物中卓酚酮类化合物的生物合成研究报道,微生物中的卓酚酮类化合物的生物合成机制仍然不是很清楚。由于原核生物中的卓酚酮类化合物的生物合成机制未知,因而从DNA序列的角度去钓取3,7-二羟基卓酚酮的生物合成基因簇就显得无从下手。
然而微生物次级代谢产物往往是聚集成簇的排列,根据这一特性,本发明利用高通量异源表达的方法,结合生物活性筛选,确定了3,7-二羟基卓酚酮的生物合成基因簇,并在异源表达菌株天蓝色链霉菌中实现了表达。进一步的利用DNA测序、遗传学、分子生物学以及生物化学等分析手段与方法,解析了3,7-二羟基卓酚酮的生物合成途径。通过体内的敲除实验和积累代谢产物的分离纯化鉴定,通过体外生化实验,确证了多步氧化酶的功能和生物活性,为后续的改造和利用提供了依据。
与现有技术相比,本发明具有如下有益成果:
1)本发明首次确定了3,7-二羟基卓酚酮的生物合成基因簇,碱基序列如SEQ IDNO.1所示,全长9112个碱基。所述基因簇来源于赭石菌核链霉菌S.ochraceiscleroticusB222;通过异源表达,测序分析及功能研究,确定了3,7-二羟基卓酚酮的生物合成基因簇共包含10个基因;其中trlA、trlB、trlC、trlD、trlE、trlF、trlH以及trlI为结构基因;trlG为其他功能基因;trlJ为调控基因;本发明所提供的基因及其蛋白可以用来寻找和发现用于医药、工业或农业的化合物、基因或蛋白。
2)本发明在异源表达宿主天蓝色链霉菌(Streptomyces coelicolor)M1154中实现了3,7-二羟基卓酚酮生物合成基因簇的高效表达;
3)本发明通过测序、分子生物学以及生物化学等手段解析了3,7-二羟基卓酚酮的生物合成途径;
4)本发明通过单基因敲除获得了一系列的基因缺失菌株以及3,7-二羟基卓酚酮生物合成的前体;为发酵生产卓酚酮、7-羟基卓酚酮、环庚三烯酮以及1,4,6-环庚三烯-1-羧酸提供了菌种来源;
5)本发明报道了首例催化七元芳香环上羟化的蛋白,并确定了trlCD以及trlE负责了3,7-二羟基卓酚酮七元芳香环上2,3,7位的顺序羟化反应。
附图说明
通过阅读参照以下附图对非限制性实施例所做的详细描述,本发明的其他特征、目的和优点将会变得更为突出:
图1为异源表达筛选3,7-二羟基卓酚酮生物合成基因簇的生物活性检测图(A)、S.coelicolor M1154/pCXF1表型图(B)以及3,7-二羟基卓酚酮异源表达液相检测图谱(C);
图2为3,7-二羟基卓酚酮生物合成基因簇的确定示意图;其中,A,pCXF1质粒的大片段缺失示意图;B,pCXF1大片段敲除质粒异源表达产物液相检测图谱;
图3为3,7-二羟基卓酚酮生物合成基因簇及其基因功能示意图;
图4为3,7-二羟基卓酚酮生物合成基因簇中trlC单基因敲除示意图、凝胶检测图及HPLC检测图谱;其中,A,PCR-Targeting敲除trlC基因示意图;B,敲除突变质粒的凝胶检测图;C,trlC敲除质粒异源表达菌株液相检测图谱;
图5为3,7-二羟基卓酚酮生物合成基因簇中trlD单基因敲除示意图、凝胶检测图及HPLC检测图谱;其中,A,PCR-Targeting敲除trlD基因示意图;B,敲除突变质粒的凝胶检测图;C,trlD敲除质粒异源表达菌株液相检测图谱;
图6为3,7-二羟基卓酚酮生物合成基因簇中trlE单基因敲除示意图、凝胶检测图及HPLC检测图谱;其中,A,PCR-Targeting敲除trlE基因示意图;B,敲除突变质粒的凝胶检测图;C,trlE敲除质粒异源表达菌株液相检测图谱;
图7为3,7-二羟基卓酚酮生物合成基因簇中trlF单基因敲除示意图、凝胶检测图及HPLC检测图谱;其中,A,PCR-Targeting敲除trlF基因示意图;B,敲除突变质粒的凝胶检测图;C,trlF敲除质粒异源表达菌株液相检测图谱;
图8为化合物2的核磁及化学结构图;其中,A为氢谱图,B为碳谱图;
图9为化合物5的核磁及化学结构图;其中,A为氢谱图,B为碳谱图;
图10为3,7-二羟基卓酚酮生物合成途径示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明,以下实例将有助于本领域从业人员更深入地理解本发明。以下实施例中未特殊说明的实验方法均为常规方法,未特殊说明的材料、试剂均可从商业途径获取。
LB培养基:用于大肠杆菌的培养;
胰蛋白胨10g,酵母提取物5g,氯化钠5g,去离子水定容至1,000ml,pH 7.0。
2×YT培养基:大肠杆菌-链霉菌属间接合转移;
胰蛋白胨16g,酵母提取物10g,氯化钠5g,去离子水定容至1,000ml,pH 7.0。
SFM培养基:链霉菌培养产孢;
黄豆饼粉20g,甘露醇20g,自来水定容至1,000ml,pH 7.2~7.4。
黄豆饼粉20g先用1,000ml自来水浸泡,121℃灭菌20min,然后过滤收集黄豆饼粉浸提液配制培养基。
R3培养基:链霉菌发酵;
葡萄糖10g,酵母提取物5g,酪蛋白氨基酸0.1g,L-脯氨酸3g,MgCl2·6H2O 10g,CaCl2·2H2O 4g,K2SO4 0.25g,KH2PO4 0.05g,TES 5.6g,微量元素溶液2ml,去离子水定容至1,000ml,pH 7.2。
微量元素溶液(/L)包括:
Figure BDA0001384568660000081
相应固体培养基需要添加15g琼脂粉,SFM固体培养基添加20g琼脂粉。
本发明所涉及的赭石菌核链霉菌S.ochraceiscleroticus B222菌株,分离自神农架山区,在文献“石春芝,吴后波,岳莹玉,陶天申.神农架林区和自然保护区链霉菌资源考察[J].氨基酸和生物资源,2002,(02):1-4”中公开过。
异源表达宿主天蓝色链霉菌(Streptomyces coelicolor)M1154在文献“Gomez-Escribano J P,Bibb M J.Engineering Streptomyces coelicolor for heterologousexpression of secondary metabolite gene clusters.Microbial Biotechnology,2011,4(2):207-215.”中公开过,公众可以从John Innes Centre的Mervyn J Bibb教授处获取。
构建cosmid文库所用载体pJTU2554在文献“Li L,Xu Z,Xu X,et al.TheMildiomycin Biosynthesis:Initial Steps for Sequential Generation of 5-Hydroxymethylcytidine 5′-Monophosphate and 5-Hydroxymethylcytosine inStreptoverticillium rimofaciens ZJU5119.ChemBioChem,2008,9(8):1286-1294.”中公开过,公众可以从上海交通大学邓子新教授处获取。
cosmid文库宿主E.coli XL-1Blue MR/pUZ8002菌株在文献“Chen L,Wang Y,GuoH,et al.High-throughput screening for Streptomyces antibiotic biosynthesisactivators.Applied and environmental microbiology,2012,78(12):4526-4528.”中公开过,公众可以从上海交通大学陶美凤教授处获得。
实施例1、Streptomyces sp.B222 cosmid文库的构建
(一)取Streptomyces sp.B222新鲜孢子接种至30ml TSBY培养基(添加0.6%甘氨酸)中,30℃,220rpm培养16-24h。
(二)离心收集菌体,称取0.5g湿菌体至50ml离心管中,加入5ml SET(75mM NaCl,25mM EDTA,20mM Tris,pH 7.5)缓冲液,振荡打散。加入终浓度为1mg/ml的溶菌酶,37℃温浴10min。加入1/10体积的10%SDS溶液后,再加入终浓度为0.5mg/ml的蛋白酶K,55℃温浴2h。加入1/3体积的5M NaCl溶液,并加入一倍体积的中性酚仿,室温颠倒混匀30min;4,000rpm离心30min后吸取上清至另一新的50ml离心管中,加入等体积氯仿再次颠倒混匀30min除去残留的蛋白。4,000rpm离心30min后吸取上清至另一新的50ml离心管中,加入两倍体积的无水乙醇沉淀基因组DNA。挑取白色絮状的基因组DNA至30ml 75%无水乙醇中,室温静置10min洗去盐离子,重复75%无水乙醇洗涤步骤。倒去75%无水乙醇,室温晾干DNA后,加入3ml TE(pH 8.0)溶解。
(三)利用限制性内切酶Sau3AI对Streptomyces sp.B222基因组DNA进行部分酶切。设置梯度酶切体系(12个梯度),每个梯度酶切体系为200μl。第一管中加入200μl基因组DNA,40μl 10×H缓冲液,159μl无菌水以及1μl Sau3AI;第2至12管中加入20μl 10×H缓冲液以及180μl基因组DNA。从第一管溶液中吸取200μl溶液至第2管中混合均匀得到Sau3AI稀释两倍的酶切体系,进一步再从第2管中吸取200μl溶液至第3管中混合均匀得到Sau3AI稀释四倍的酶切体系,依此类推稀释至第12管,获得相应稀释度的酶切体系。37℃温浴30min后,65℃温浴20min失活。每管取10μl酶切样品进行PFGE检测,检测条件为:Initial switchtime:1s;Final switch time:6s;Voltage:6V/cm;Included angle:120°;Run time:14-16h;Temperature:14℃。选择酶切大小为45-60kb左右的梯度体系,混合进行PFGE凝胶电泳回收DNA,方法同上。切下45-60kb左右胶条用低熔点琼脂糖凝胶制备一块新的凝胶,再次进行PFGE检测除去携带的小片段DNA,检测条件为:Initial switch time:4s;Final switchtime:4s;Voltage:6V/cm;Included angle:120°;Run time:14-16h;Temperature:14℃。切下45-60kb左右胶条回收基因组DNA,溶于10μl TE(pH 8.0)中。
(四)对总DNA进行去磷酸化处理,去磷酸化体系为:8μl基因组DNA,1μl FastAP缓冲液,1μl FastAP。37℃温浴15min后,于75℃温浴5min失活。将去磷酸化的基因组DNA与经HpaI与BamHI双酶切处理的pJTU2554载体进行酶连,酶连体系为:10μl基因组DNA去磷酸化溶液,1μl pJTU2554(经HpaI酶切去磷酸化,然后经BamHI酶切回收载体),1μl 10×Fast-link ligase buffer,1μl 10mM rATP,1μl Fast-link ligase。
(五)利用MaxPlaxTM Lamda Packaging Extracts对酶连产物进行包装并转染E.coli XL-1Blue MR/pUZ8002感受态细胞。涂布LB平板(添加0.1%阿伯拉霉素与0.1%卡那霉素),筛选转染子,获得一个包含2,000个克隆的cosmid文库。将克隆挑至96孔板中置于-80℃进行保存。
实施例2、3,7-二羟基卓酚酮生物合成基因簇的克隆
链霉菌基因组文库异源表达活性筛选方法可参考文献“Chen L,Wang Y,Guo H,etal.High-throughput screening for Streptomyces antibiotic biosynthesisactivators.Applied and environmental microbiology,2012,78(12):4526-4528.”与文献“Xu M,Wang Y,Zhao Z,et al.Functional Genome Mining for Metabolites Encodedby Large Gene Clusters through Heterologous Expression of a Whole-GenomeBacterial Artificial Chromosome Library in Streptomyces spp.Applied andEnvironmental Microbiology,2016,82(19):5795-5805.”
(一)从-80℃冰箱中取出Streptomyces ochraceiscleroticus B222(即,S.ochraceiscleroticus B222)的cosmid文库(12块96孔板),37℃培养箱放置2h至融化完全。
(二)在96孔板中加入130μl新鲜LB培养基,利用复制器将Streptomyces sp.B222的cosmid文库接种至96孔板中,37℃,220rpm培养4~6h至OD600 0.4~0.6。
(三)利用复制器将大肠杆菌菌液影印到均匀涂布了一层热激过的变铅青链霉菌(Streptomyces lividans)SBT5孢子的SFM平板,在生物安全柜中吹干,30℃培养12~16h。
(四)在SFM平板上覆盖三甲氧苄啶和阿泊拉霉素至终浓度为50μg/ml,在生物安全柜中吹干,30℃培养4~6天至接合转移子长出。
(五)利用复制器将长出的接合转移子影印至含有萘啶酮酸(25μg/ml)和阿泊拉霉素(50μg/ml)的SFM平板上除去残留的大肠杆菌和受体菌变铅青链霉菌(Streptomyceslividans)SBT5,30℃培养4~6天至产孢完全。
(六)利用复制器将产孢的接合转移子转移至发酵培养基R3上,30℃发酵培养4~6天至产素完全。
(七)在产素完全的平板上覆盖一层含有1%枯草芽孢杆菌的软琼脂(0.5%琼脂),37℃培养过夜,观察抑菌圈的生成。观察到的抑菌圈如图1A所示,11A11(表达3,7-二羟基卓酚酮的接合转移子)克隆发酵产生的化合物能够显著抑制生测指示菌枯草芽孢杆菌的生长。
实施例3、3,7-二羟基卓酚酮的异源表达
(一),从Streptomyces ochraceiscleroticus B222的cosmid文库文库中挑取11A11克隆至3ml新鲜LB培养基(添加0.1%阿伯拉霉素)中,37℃,220rpm培养过夜。
(二),将提取11A11的cosmid DNA转化大肠杆菌E.coli ET12567电转感受态细胞,得到E.coli ET12567/11A11(E.coli ET12567/pCXF1)菌株,为描述方便,后续11A11cosmid质粒均以pCXF1表示。
(三),利用大肠杆菌-链霉菌三亲本接合转移的方法,以E.coli ET12567/pCXF1为供体菌,S.coelicolor M1154为受体菌,在E.coli ET12567/pUB307的辅助下,将pCXF质粒转入S.coelicolor M1154中,得到3,7-二羟基卓酚酮的表达菌株S.coelicolor M1154/pCXF1 CGMCC No.,如图1B所示;由图1B可知,3,7-二羟基卓酚酮的表达对宿主S.coelicolor M1154有明显地抑制作用。S.coelicolor M1154/pCXF1较之于野生型S.coelicolor M1154菌株不能产孢。
(四),挑取三个S.coelicolor M1154/pCXF1菌株的接合转移子接种至R3固体培养基上,30℃发酵4~6天。
(五),发酵结束后,收集R3固体发酵培养物,利用等体积乙酸乙酯(0.1%乙酸)萃取3遍。收集乙酸乙酯萃提液,真空浓缩旋干,再用1ml甲醇溶解粗样。
(六),12,000rpm离心10min或用0.22μm滤膜过滤甲醇样品后,进行高效液相色谱分析,进样量为10μl。液相分析色谱柱型号为:Agilent Zorbax SB-C18(5μm,4.6×250mm)。
流动相为:
A相为水相(添加1‰三氟乙酸),
B相为乙腈。
分析条件为:0min,5%B;0-15min,B相由5%浓度升至40%;15-25min,B相由40%浓度升至100%;25-30min,B相100%浓度维持5min:30-31min,B相由100%浓度降至5%;31-38min,B相5%浓度平衡7min。流速为0.6ml/min,室温,流动相比例按体积比计算。如图1C所示,3,7-二羟基卓酚酮在S.coelicolor M1154菌株中能够正常表达,出峰时间位于14min。
实施例4、3,7-二羟基卓酚酮的生物合成基因簇的确定
pCXF1大小为46,192bp,携带有39,142bp的外源片段,对这39,142bp的外源片段序列进行基因功能分析发现其上包含一簇核黄素合成相关基因(orf9-orf18)与一簇芳香类化合物代谢相关基因(orf26-orf35)。为了确定pCXF1上与3,7-二羟基卓酚酮生物合成相关的基因,本发明对pCXF1质粒进行了大片段的敲除。利用PCR-targeting技术分别敲除了orf7-orf25与orf25-orf35这两段大片段DNA,获得pCXF2与pCXF3质粒。PCR-Targeting技术可参考文献“Bertolt Gust,Greg L.Challis,Kay Fowler,Tobias Kieser,and KeithF.Chater;PCR-targeted Streptomyces gene replacement identifies a proteindomain needed for biosynthesis of the sesquiterpene soil odor geosmin,PNAS2003,vol.100,no.4,1541-1546”。
orf7-orf25大片段敲除引物序列如下:
SEQ ID NO.12(Δrib-F,5′-3′):
GCCACCGCACCGCCGTACGGGCCGGGCCGCGGCCGTCCGatattccggggatccgtcgac
SEQ ID NO.13(Δrib-R,5′-3′):
GCGGCCGACGATCTGCTGGTGGACGTCGGCTTCCACGCCgtgtaggctggagctgcttc
orf7-orf25大片段敲除验证引物序列如下:
SEQ ID NO.14(ver-Δrib-F,5′-3′):
ATGTCACCGCTGCGCACCGA
SEQ ID NO.15(ver-Δrib-R,5′-3′):
ACCTCCGGTACGGACCAGGA
1)利用Δrib-F/R引物从pJTU6722上扩增红霉素抗性基因eryB,利用PCR-targeting技术将红霉素抗性基因eryB基因插入pCXF1质粒中替换orf7-orf25大片段DNA,得到orf7-orf25的敲除质粒pCXF2,如图2A所示。
2)将pCXF2质粒大肠杆菌-链霉菌属间三亲本接合转移转入S.coelicolor M1154中即可获得orf7-orf25大片段敲除的表达菌株S.coelicolor M1154/pCXF2。
3)将敲除菌株S.coelicolor M1154/pCXF2接种至R3发酵培养基上,30℃发酵培养4-6天后提取发酵产物进行液相检测。液相检测图谱如图2B所示,14min的3,7-二羟基卓酚酮的洗脱峰仍然存在,表明这段基因不参与3,7-二羟基卓酚酮的生物合成,S.coelicolorM1154/pCXF2仍然能够合成3,7-二羟基卓酚酮。
orf25-orf35大片段敲除引物序列如下:
SEQ ID NO.16(Δaro-F,5′-3′):
GCGACGGGTGCGACGGGTGCGGAACATGGGAGCGGCCCTatattccggggatccgtcgac
SEQ ID NO.17(Δaro-R,5′-3′):
GTGTGGCTCCGCCACGCCGTCCGCTCCGCGCTGACCCGGgtgtaggctggagctgcttc
orf25-orf35大片段敲除验证引物序列如下:
SEQ ID NO.18(ver-Δaro-F,5′-3′):
TCACGAACAGCTTCACCCACT
SEQ ID NO.19(ver-Δaro-R,5′-3′):
GGCATCGAACTGTTCGACCTT
1)利用Δaro-F/R引物从pJTU6722上扩增红霉素抗性基因eryB,利用PCR-targeting技术将eryB基因插入pCXF1中替换orf25-orf35大片段DNA,得到orf25-orf35的敲除质粒pCXF3,如图2A所示。
2)将pCXF3质粒大肠杆菌-链霉菌属间三亲本接合转移转入S.coelicolor M1154中即可获得orf25-orf35大片段敲除的表达菌株S.coelicolor M1154/pCXF3。
3)将敲除菌株S.coelicolor M1154/pCXF3接种至R3发酵培养基上,30℃发酵培养4-6天后提取发酵产物进行液相检测。液相检测图谱如图2B所示,14min的3,7-二羟基卓酚酮的洗脱峰消失,表明这段基因参与3,7-二羟基卓酚酮的生物合成。
因而3,7-二羟基卓酚酮的生物合成基因簇应当包含orf26-orf35这段区域内的10个基因,共9112bp。各基因编码的蛋白质及其功能分析见表1,基因组织排布如图3所示。核苷酸序列见SEQ ID NO.1,蛋白质序列见SEQ ID NO.2-11。
表1,3,7-二羟基卓酚酮生物合成基因簇蛋白功能注释
基因 基因位置 蛋白序列 蛋白功能
trlA 1-480 SEQ ID NO.2 酰基辅酶A水合酶
trlB 530-1984 SEQ ID NO.3 3-脱氧-D-阿糖基庚酮酸-7-磷酸合成酶
trlC 2248-3840 SEQ ID NO.4 单加氧酶
trlD 3837-4394 SEQ ID NO.5 黄素还原酶
trlE 4439-5641 SEQ ID NO.6 单加氧酶
trlF 5697-6308 SEQ ID NO.7 氧化酶
trlG 6327-6539 SEQ ID NO.8 未知功能
trlH 6536-7297 SEQ ID NO.9 硫酯酶
trlI 7299-8507 SEQ ID NO.10 预苯酸脱水酶-分支酸变位酶
trlJ 8483-9112 SEQ ID NO.11 TetR转录调控蛋白
实施例5、3,7-二羟基卓酚酮生物合成基因trlC的敲除
细菌来源的卓酚酮类化合物的七元芳香环的合成已经由Robin Tuefel等在文献“Teufel R,Friedrich T,Fuchs G.An oxygenase that forms and deoxygenates toxicepoxide.Nature,2012,483(7389):359-362.”中进行了报道。环庚三烯酚酮七元芳香环是由分支酸途径合成的苯乙酸经苯乙酸代谢途径后合成。3,7-二羟基卓酚酮生物合成基因簇中的trlB及trlI基因编码的蛋白是苯乙酸合成所必需的蛋白,表明3,7-二羟基卓酚酮七元芳香环骨架的合成可能采用了类似的苯乙酸代谢途径。然而3,7-二羟基卓酚酮结构上的羟基化的修饰及其催化顺序仍然未知,本发明将目标锁定在trlC、trlD、trlE及trlF四个氧化还原反应相关的蛋白上。
利用PCR-Targeting技术对trlC基因进行单基因敲除:
trlC基因的敲除引物序列如下:
SEQ ID NO.20(ΔtrlC-F,5′-3′):
ACGAGTACCTGGAGAGCCTCCGGGACGGCCGGGAAGTCAGGATCTatattccggggatccgtcgac
SEQ ID NO.21(ΔtrlC-R,5′-3′):
CGTACTTGTCCAGGTAGGGCCGGACCTCGGGGTTGGACCAGTCGAtgtgtaggctggagctgcttc
trlC基因敲除验证引物序列如下:
SEQ ID NO.22(ver-ΔtrlC-F,5′-3′):
CACCGGCTCGAAAGGTGATC
SEQ ID NO.23(ver-ΔtrlC-R,5′-3′):
GTAGTTCATCTCGTACAGCTC
1)利用ΔtrlC-F/R引物从pJTU6722上扩增红霉素抗性基因eryB,利用PCR-targeting技术将eryB基因插入pCXF1中替换trlC,得到trlC的敲除质粒pCXF1(ΔtrlC::eryB)。将pCXF1(ΔtrlC::eryB)质粒转入BT340菌株中,在FLP重组酶的作用下,将eryB基因抹除,留下81bp的Scar片段,得到trlC基因敲除质粒pCXF6,如图4A所示。pCXF6敲除质粒的验证胶图如图4B所示。野生型的PCR产物大小为1401bp,敲除质粒的PCR产物大小为358bp。
2)将pCXF6质粒大肠杆菌-链霉菌属间三亲本接合转移转入S.coelicolor M1154中即可获得trlC基因敲除的表达菌株S.coelicolor M1154/pCXF6。
3)将敲除菌株S.coelicolor M1154/pCXF6接种至R3发酵培养基上,30℃发酵培养4-6天后提取发酵产物进行液相检测。液相检测图谱如图4C所示,14min的3,7-二羟基卓酚酮的洗脱峰消失,在16.5min出现了一个新的洗脱峰3。
实施例6、3,7-二羟基卓酚酮生物合成基因trlD的敲除
同上利用PCR-Targeting技术对trlD基因进行单基因敲除:
trlD基因的敲除引物序列如下:
SEQ ID NO.24(ΔtrlD-F,5′-3′):
GAGCCCCCGTCCTGCCGGACCAGGCCCAACTCAGGCACGTACTCGatattccggggatccgtcgac
SEQ ID NO.25(ΔtrlD-R,5′-3′):
GACAGCCGGTGTGCGGGCCGACGGCCCAGTCGGCGGCCTGCTCCAtgtgtaggctggagctgcttc
trlD基因敲除验证引物序列如下:
SEQ ID NO.26(ver-ΔtrlD-F,5′-3′):
GAGTACGACGAGCACGGCTG
SEQ ID NO.27(ver-ΔtrlD-R,5′-3′):
CCTGTTCGCTGCCGAAGGC
1)利用ΔtrlD-F/R引物从pJTU6722上扩增红霉素抗性基因eryB,利用PCR-targeting技术将eryB基因插入pCXF1中替换trlD,得到trlD的敲除质粒pCXF1(ΔtrlD::eryB)。将pCXF1(ΔtrlD::eryB)质粒转入BT340菌株中,在FLP重组酶的作用下,将eryB基因抹除,留下81bp的Scar片段,得到trlD基因敲除质粒pCXF7,如图5A所示。pCXF7敲除质粒的验证胶图如图5B所示。野生型的PCR产物大小为703bp,敲除质粒的PCR产物大小为530bp。
2)将pCXF7质粒大肠杆菌-链霉菌属间三亲本接合转移转入S.coelicolor M1154中即可获得trlD基因敲除的表达菌株S.coelicolor M1154/pCXF7。
3)将敲除菌株S.coelicolor M1154/pCXF7接种至R3发酵培养基上,30℃发酵培养4-6天后提取发酵产物进行液相检测。液相检测图谱如图5C所示,14min的3,7-二羟基卓酚酮的洗脱峰消失,在16.5min及17.5min出现了两个新的洗脱峰2与3。
实施例7、3,7-二羟基卓酚酮生物合成基因trlE的敲除
同上利用PCR-Targeting技术对trlE基因进行单基因敲除:
trlE基因的敲除引物序列如下:
SEQ ID NO.28(ΔtrlE-F,5′-3′):
GACTGCGCAGGCAGGGCGTCGAGGCGGTCGTCCACGAGCAGGCGCatattccggggatccgtcgac
SEQ ID NO.29(ΔtrlE-R,5′-3′):
GTGCCAGGAAGTGGGCGAGGACCACCGCGTCCTCCAGGGCCTGGTtgtgtaggctggagctgcttc
trlE基因敲除验证引物序列如下:
SEQ ID NO.30(ver-ΔtrlE-F,5′-3′):
CCTTCACCGAAGTCGCACC
SEQ ID NO.31(ver-ΔtrlE-R,5′-3′):
CGACGCAGACGCTCGTAGG
1)利用ΔtrlE-F/R引物从pJTU6722上扩增红霉素抗性基因eryB,利用PCR-targeting技术将eryB基因插入pCXF1中替换trlE,得到trlE的敲除质粒pCXF1(ΔtrlE::eryB)。将pCXF1(ΔtrlE::eryB)质粒转入BT340菌株中,在FLP重组酶的作用下,将eryB基因抹除,留下81bp的Scar片段,得到trlE基因敲除质粒pCXF8,如图6A所示。pCXF7敲除质粒的验证胶图如图6B所示。野生型的PCR产物大小为703bp,敲除质粒的PCR产物大小为530bp。
2)将pCXF8质粒大肠杆菌-链霉菌属间三亲本接合转移转入S.coelicolor M1154中即可获得trlE基因敲除的表达菌株S.coelicolor M1154/pCXF8。
3)将敲除菌株S.coelicolor M1154/pCXF8接种至R3发酵培养基上,30℃发酵培养4-6天后提取发酵产物进行液相检测。液相检测图谱如图6C所示,14min的3,7-二羟基卓酚酮的洗脱峰消失,在14.1min出现了一个新的洗脱峰4。
实施例8、3,7-二羟基卓酚酮生物合成基因trlF的敲除
同上利用PCR-Targeting技术对trlF基因进行单基因敲除:
trlF基因的敲除引物序列如下:
SEQ ID NO.32(ΔtrlF-F,5′-3′):
ATGGCAAGGACCTACTCCTTCGAAGGCAACGTACCCGTCGTGCATatattccggggatccgtcgac
SEQ ID NO.33(ΔtrlF-R,5′-3′):
CTCGGTGGCGGCCTCCGCCGCGTGCAGACCGGTGAGACAGCGCTGtgtgtaggctggagctgcttc
trlF基因敲除验证引物序列如下:
SEQ ID NO.34(ver-ΔtrlF-F,5′-3′):
GATCCACGGGCACGACATC
SEQ ID NO.35(ver-ΔtrlF-R,5′-3′):
CGTCCTGACGGTCTTGTCC
1)利用ΔtrlF-F/R引物从pJTU6722上扩增红霉素抗性基因eryB,利用PCR-targeting技术将eryB基因插入pCXF1中替换trlF,得到trlF的敲除质粒pCXF1(ΔtrlF::eryB)。将pCXF1(ΔtrlF::eryB)质粒转入BT340菌株中,在FLP重组酶的作用下,将eryB基因抹除,留下81bp的Scar片段,得到trlF基因敲除质粒pCXF9,如图7A所示。pCXF8敲除质粒的验证胶图如图7B所示。野生型的PCR产物大小为782bp,敲除质粒的PCR产物大小为417bp。
2)将pCXF9质粒大肠杆菌-链霉菌属间三亲本接合转移转入S.coelicolor M1154中即可获得trlF基因敲除的表达菌株S.coelicolor M1154/pCXF9。
3)将敲除菌株S.coelicolor M1154/pCXF9接种至R3发酵培养基上,30℃发酵培养4-6天后提取发酵产物进行液相检测。液相检测图谱如图7C所示,14min的3,7-二羟基卓酚酮的洗脱峰消失,在22min出现了一个新的洗脱峰5。
实施例9、中间体化合物2的结构鉴定
将S.coelicolor M1154/pCXF7接种至3L R3固体培养基上,30℃发酵培养4-6天。收集固体发酵培养物,利用等体积乙酸乙酯(添加0.5%乙酸)萃取3遍。35℃旋干后,利用甲醇溶解样品,进一步利用干法拌样将样品上载至CHP20P大孔吸附柱(Φ3.5cm×30cm)上。利用甲醇与水进行梯度洗脱,从纯水起始至纯甲醇,10%的梯度递增,每个梯度洗脱500ml,洗脱液收集至250ml三角瓶中,每瓶100ml。每瓶取出20μl样品进行HPLC检测,方法同实施例3种的步骤(六)所述,收集含有化合物2的洗脱组分。将各组分室温静置过夜,直至出现棕色晶体,挑出晶体用甲醇洗涤后进行X-ray分析,同时挑取晶体洗涤后用氘代氯仿溶解后进行NMR检测,确定化合物2为7-羟基卓酚酮。化合物2的核磁谱图见附图8。
实施例10、中间体化合物3的结构鉴定
将S.coelicolor M1154/pCXF6接种至3L R3固体培养基上,30℃发酵培养4-6天。收集固体发酵培养物,利用等体积乙酸乙酯(添加0.5%乙酸)萃取3遍。35℃旋干后,利用甲醇溶解样品,进一步利用干法拌样将样品上载至CHP20P大孔吸附柱(Φ3.5cm×30cm)上。利用甲醇与水进行梯度洗脱,从纯水起始至纯甲醇,10%的梯度递增,每个梯度洗脱500ml,洗脱液收集至250ml三角瓶中,每瓶100ml。每瓶取出20μl样品进行HPLC检测,方法同前文所述,收集含有化合物3的洗脱组分。将各组分室温静置过夜,直至出现棕色晶体,挑出晶体用甲醇洗涤后进行X-ray分析,同时与卓酚酮标准品进行HPLC和高分辨质谱比对,确定化合物3为卓酚酮。
实施例11、中间体化合物4的结构鉴定
将S.coelicolor M1154/pCXF8接种至3L R3固体培养基上,30℃发酵培养4-6天。收集固体发酵培养物,利用等体积乙酸乙酯(添加0.5%乙酸)萃取3遍。35℃旋干后,利用甲醇溶解样品,进一步利用干法拌样将样品上载至CHP20P大孔吸附柱(Φ3.5cm×30cm)上。利用甲醇与水进行梯度洗脱,从纯水起始至纯甲醇,10%的梯度递增,每个梯度洗脱500ml,洗脱液收集至250ml三角瓶中,每瓶100ml。每瓶取出20μl样品进行HPLC检测,方法同前文所述,收集含有化合物4的洗脱组分。合并含有化合物4的组分,35℃浓缩旋干后用甲醇溶解,进一步利用干法拌样将样品上载至YMC反相C18柱(Φ2cm×20cm)上。利用甲醇与水进行梯度洗脱,起始洗脱体系为20%甲醇,5%的梯度递增洗脱至50%甲醇,每个梯度洗脱200ml,洗脱液收集至15ml玻璃试管中,每管约10ml。每个试管中取出20μl样品进行HPLC检测,方法同前文所述,将仅含有化合物4的组分合并浓缩旋干,获得5mg化合物4纯品。通过高分辨质谱检测,气相质谱和HPLC检测,与2,4,6-环庚三烯酮进行比对,确定化合物4为2,4,6-环庚三烯酮。
实施例12、中间体化合物5的结构鉴定
将S.coelicolor M1154/pCXF9接种至5L R3固体培养基上,30℃发酵培养4-6天。收集固体发酵培养物,利用等体积乙酸乙酯(添加0.5%乙酸)萃取3遍。35℃旋干后,利用甲醇溶解样品,进一步利用干法拌样将样品上载至CHP20P大孔吸附柱(Φ3.5cm×30cm)上。利用甲醇与水进行梯度洗脱,从纯水起始至纯甲醇,10%的梯度递增,每个梯度洗脱500ml,洗脱液收集至250ml三角瓶中,每瓶100ml。每瓶取出20μl样品进行HPLC检测,方法同前文所述,收集含有化合物4的洗脱组分。合并含有化合物5的组分,35℃浓缩旋干后用甲醇溶解,进一步利用干法拌样将样品上载至YMC反相C18柱(Φ2cm×20cm)上。利用甲醇与水进行梯度洗脱,起始洗脱体系为20%甲醇,5%的梯度递增洗脱至50%甲醇,每个梯度洗脱200ml,洗脱液收集至15ml玻璃试管中,每管约10ml。每个试管中取出20μl样品进行HPLC检测,方法同前文所述,将仅含有化合物5的组分合并浓缩旋干,获得5mg化合物5纯品。利用氘代氯仿溶解样品后进行NMR检测,确定化合物5为1,4,6-环庚三烯-1-羧酸。化合物5的结构与核磁图谱见附图9。
实施例13、3,7-二羟基卓酚酮的生物合成途径
结合生物信息学分析3,7-二羟基卓酚酮生物合成基因簇中各蛋白的功能,本发明实施例中的基因敲除与中间体的结构等结果以及之前关于细菌来源环庚三烯酮七元芳香环的合成报道,本发明对细菌中3,7-二羟基卓酚酮的生物合成途径进行了推测。
细菌中的3,7-二羟基卓酚酮的生物合成途径可能包含以下几个步骤(图10):首先经过分支酸代谢途径,在七磷酸景天庚酮糖合酶TrlB的作用下催化4-磷酸-D-赤藓糖(化合物18)和磷酸烯醇式丙酮酸(化合物19)合成3-脱氧-D-阿糖基庚酮酸-7-磷酸(化合物17),起始分支酸途径,以合成大量的分支酸(化合物16)。再由双功能酶TrlH的脱水酶结构域将分支酸脱水形成预苯酸(化合物15),后又在另一预苯酸变位酶的结构域作用下变构形成苯丙酮酸(化合物14)。苯丙酮酸降解形成苯乙酸(化合物13),进入苯乙酸降解途径,首先由苯乙酸辅酶A转移酶将苯乙酸活化形成苯乙酰-CoA(化合物12),再由环氧化酶PaaABCE在苯乙酰-CoA上形成环氧,合成1,2-环氧苯乙酰-CoA(化合物11),再经由异构酶PaaG开环生成氧杂环庚三烯-CoA(化合物10),进一步在烯酰-CoA水合酶TrlA的催化下发生开环生成3-酮-5,6-脱氢庚酰-CoA-半缩醛(化合物9)。3-酮-5,6-脱氢庚酰-CoA-半缩醛中间体极其不稳定,经一步分子内自发的Knoevenagel缩合反应生成2-羟基-1,4,6-环庚三烯-1-甲酰-CoA(化合物8);2-羟基-1,4,6-环庚三烯-1-甲酰-CoA经一步还原生成2-羟基-4,6-环庚二烯-1-甲酰-CoA(化合物7),进一步自发脱水反应生成1,4,6-环庚三烯-1-甲酰-CoA(化合物6),而后在硫酯酶TrlG的催化下水解释放CoA生成1,4,6-环庚三烯-1-羧酸(化合物5);1,4,6-环庚三烯-1-羧酸在氧化酶TrlF的催化下发生脱羧氧化生成2,4,6-环庚三烯酮(化合物4);经单加氧酶TrlE催化后在2,4,6-环庚三烯酮C2位发生羟化生成卓酚酮(化合物3);TrlC与TrlD分别为单加氧酶的氧化酶亚基与还原酶亚基,经TrlC与TrlD催化后在卓酚酮的C7与C3位先后发生羟化生成7-羟基卓酚酮(化合物2)以及终产物3,7-二羟基卓酚酮(化合物1)。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
SEQUENCE LISTING
<110> 上海交通大学
<120> 3,7-二羟基卓酚酮生物合成基因簇及其应用
<130> DAG29671
<160> 35
<170> PatentIn version 3.5
<210> 1
<211> 9112
<212> DNA
<213> Streptomyces ochraceiscleroticus Soc7
<400> 1
tcagcggcgt acggccactt cctcgcgctg ggcgccgccg gcctccgcgc ggccgaacag 60
cagccgcgta cgcatccggt acaacgcctc gccccgctgg ttgtccgcct cgacgacgaa 120
ccggaccgtg cccgtgtccg ggcgccgggg atggggtgcg gcctcctcca cggtggcccg 180
tccgcgcacg tcgtcgccgg ggcgcaccgg gcgcaggaac cggacctcgt ccatgccgta 240
ggagccctgg caggcggagc cggcgagcag ggcgcggacg aactgcccca tgaccaccgc 300
gccggtgtgc cagccgctgg ccaccaggcc gccgaagggg gagcgggccg ccgcctcggg 360
atccaggtgg aagggcatcg ggtcccacac ccgcgcgtag ccgatgatgt cctcgctcgt 420
gagccgggtg gtccccagct cgtaggtgct gccgacgcgg aagtgctcga agtgccgcac 480
gggggtgctc cttcgtctcg ggggtctcgc gggggccggg gcccggcact cagccggggg 540
acgccgcgtg ggccgcgtac accggcgcgc ccaccgggcg gatcagggcg ggctccgggc 600
gggggcggcc caggcggcgc ctctcggcgc tgaaccactc ggcgacccgg aaggccaggt 660
ccatcgactg cccgcggttc aggcgggggt cgcacgccgt ctcgtaccgc agaggcagat 720
cgtcggagag gacctcgtcg ctcccgccca cgcactcggt gacgtcctcc ccggtgagct 780
ccacgtgcac cccgccgggg tgcgtgccca gcgcccggtg gacctcgaag aagcccgtga 840
tctcgtccag gacgtcctcg aagcgccggc tcttgtggcc gctcggcgcg gtgaaggtgt 900
tgccgtgcat cgggtcgcac gcccacacca cccgggcgcc ctccgcgcgc accgcctcca 960
ccagggcggg cagccggtcg cgtaccaggc cccgccccat ccgcgcgatc aacgtgagcc 1020
ggcccggggt gcgcagcgga tccagccggt ccaccagggc ccgtacgtcg tcgacggcgg 1080
cgtcgggacc cagcttgacg ccgagcgggt tgctgacccc ggcggcgaac gcgacgtgcg 1140
cgccgtccag ccggcgggtg cgctcgccga tccagagcag gtgcccgctc agggcgtacc 1200
gccggcccgt gtcggggtcc gttcgcacca gggcggactc gtagtcgagg agcagcgcct 1260
cgtggctggc gaacacctcc gtggtgcgca gcgccgaggt gctcataccg caggcccgga 1320
tgaacgacag cgccgcgtcg atctcgtccg ccagccgctc gtagcggtgt cccgccgcgg 1380
acagcgccac gaagtcacgg ttccactcgt gcacccggcg cagatccgcg tgcccgccgg 1440
cggtgagggc gcgcagcagg ttgagcgtcg ctgcggacgc ctggtagaca cgctccagcc 1500
gggccgggtc aggggtgcgg gcctcggcgg tgaactccag cccgttgacg gcatcgcccc 1560
ggtacgaggg cagcgtcacg ccgccccggg tctcggtggg ctgtgagcgg ggcttggcgt 1620
actggccggc gatacggccg accttgacca ccgggacgcc ggccgcgtac gtcagcacgg 1680
cggccatctg gaggaggacc tccagcttgt tgcggaccga ctccgcgccc accccgtcca 1740
gggtctccgc gcagtcgccg ccctggagca ggaagccccg ccccagggct acttcgccga 1800
gccggtcgag cagggtgtcg cactcctggc cgaacaccag cggcggtgcg gcggacaggg 1860
ccgacaaagt ggtccgcagc gccgtgggat cgggccagtc gggctgctgc gccacgggca 1920
gcgcccgcca cgcttcgaca gagggatcgg caagtgagtt ctcgtccatc tccagggatt 1980
ccacgctgaa aacctcaacg ccttctgttc cgagggcagg gcacggggtt gcggtgcgcg 2040
cagcctgtca cgcgccggcc gggccccggc agtgggacgt tgtggctaga agggcggatc 2100
tactacccgg gtactagcgc cagcggccga ctgtcggggc cggccgcact cctggaccat 2160
ttcggcaggc gccctcgtcg tcggcacccg acggcgggcg cggttcgccg catgtctcca 2220
cgccaccggc tcgaaaggtg atcccgcatg agcagcaccg tcaacccgtc cgggtccgtg 2280
tcccgcccgc agaccgggga cgagtacctg gagagcctcc gggacggccg ggaagtcagg 2340
atctacggcg agaaggtgca ggacgtcacg gctcacccgg ccttccgcaa caactcccgc 2400
atggtggccc ggctcttcga cgcgctccac gaccccgagc gcaacagcaa gctggtcgtc 2460
cccaccgaca ccggcaacgg cggtttcacc cacccgtact tcaaggcccc gtacacctcc 2520
ggcgacctgc ggaccgccgc gcgggccatg gaggagtggg cgcgcatgac gtacggctgg 2580
ctgggccgca cccccgactt caaggccgcc ttcctgtcca ccctgggctc gaacaaggag 2640
cactacgcgc cgttcgagga caacgcgtcc gcgtggtacc gcaaggcaca ggagaacgtg 2700
ctcttcatcg gccacggcat cgtcaacccg ccgatcgacc gcaaccgggg gctgaccgag 2760
ctcaaggacg tgatgctgac ggtggaccgg gagaccgacg ccggcctcgt ggtctccggc 2820
gccaaggtcg tcggcaccgg ggccgcgctc acccagcaca tcttcatcgg cagctacggg 2880
gtcataccga agggcgcgaa ggagttctcc gcgtacttca tcgtgccgac cgacagcccc 2940
ggcctgaaga tcatctcccg gccgtcgtac gagttcgcct cggccaccgt cagcagcccc 3000
ttcgaccagc cgctcagcag ccgcctggac gagaacgacg gcattctcgt cttcgaccag 3060
gtgctgatcc cctgggagaa cgtcttctgc tacgacgtgg acaaggcgaa cgacttcttc 3120
tacgggtcag gcttcttcta ccgggccatg ttccacgcct gcgtccgctt cgccgtgaag 3180
atggacttcc tgaccggcct gctcgccaag tgcctggaga ccacgggcac ctcggagttc 3240
cgcggggtgc agagccggct cggcgaggtc ctcgcctacc gcaacatgtt ctgggccctg 3300
gtcgactcca tggccgagaa ccccaccaag tggcccgacg gcaccgtcac ccccaacggc 3360
gagaccgcgc tggccttccg cgtcctgtcc tcgtcgatct tccccaaggt gcgtgagatc 3420
ttcctgcggg atctcggcag cgcgctgatc tacaacaact cccacgccct cgactggtcc 3480
aaccccgagg tccggcccta cctggacaag tacgtccgcg gcctgggcgt ggaggccatc 3540
gaccgggtga agctgatgaa gctggcatgg gacgcggtcg gcaccgagtt cggggcccgc 3600
tgggagctgt acgagatgaa ctacgcgggc aaccacgagc agatccggtt cgaggcgctg 3660
cacgcccagc aggtctccgg gaagttcgac gactacaagc agctcgtcga ccggtgcctg 3720
tcggagtacg acgagcacgg ctggaaggtc cccgacctcg tcgaccccaa ggacaccacc 3780
gtcatcggcg ccggcgcacc ggacaccggc acgaccgccc cccgcccggc cgcacggtga 3840
gcagccacac ccccgccccg ggcggaccca ccgccccgcc cggagccccc gtcctgccgg 3900
accaggccca actcaggcac gtactcggcc agttcgtgac cggggtgtgc gcggtgtcga 3960
cccgcttcga cacccgctcc ggcgtacgcc acgacgccat cgcggtgaac tcgttcacct 4020
cggtctccct cgacccgccg ctcgtgtcga tgtacctgcg cgacgactcc accttcctgc 4080
ggcgggtccg cacgtccggc cagtgggccg tgtcgttcct cggcaaccgg gcgcgctccc 4140
tggtcggcgt cctcaccgcg cccgcggccc ggcgccctcc ggtggagcag gccgccgact 4200
gggccgtcgg cccgcacacc ggctgtctgg tcctgccgga cggccccgga acgctcgaat 4260
gcgctctgca cctcacgcag gcactcggcg accatgtcct cgtggtcgga cgggtgctgg 4320
gcgcggtggg ccgcgaccac gaacccctgg tcttccaccg cggcgccttc accgaagtcg 4380
caccggcgcc gtgaccacgc tccaccggcc ttcggcagcg aacaggaaag gagaccccat 4440
ggcgaggaaa cgcccgtacg tggcggtggt gggcggcggc atcggcggcc tggccgtcgc 4500
gctgggactg cgcaggcagg gcgtcgaggc ggtcgtccac gagcaggcgc acgcactgtc 4560
ccaccagggg gcggggatcg cgatcggcgc gaacggacac cgggccctgc gggaactggg 4620
cgtcgccaag cggctgaccg cctctgccgc ccggccgtcg cgcgccgact tccggcactg 4680
gcgcaccggc cggtccatgg tgtcgcaccg cctgaccggc ctgtacgagg aacgcttcgg 4740
cgcccccttc tggaccgtgg aacgcgcggc cgtccagcag gctctgctcg ccgaactggg 4800
cccgcgccac gtgcgcctgg gcgcgcgctg caccggggtg gacaggacgg ccgacggcgc 4860
cgtgatccgc ttcgaggacg gcggcgaggc ggaggccgac gcggtcgtcg gggcggacgg 4920
tatccactcc gcggtgcgcc acagcctctt cggcccgcag gaggccgtgt tctccggcac 4980
cagcggatac cgcgccctgg tcccgatgga ccggctgcgg cacgttcccg aactcgccga 5040
accggtgctg tggctgtggc tcggaccggg ccggcacttc atcgcctacc cggtggccga 5100
cggcagcgcg ctgaacttcc tggccgtcgt gcccgaccgc acgtggacgg tggagtcctg 5160
gtccacggag ggcgacgctg ccgagctgcg ggccgccttc gacggctggc acccgttcgt 5220
cacggaggtc ctcggcgcct gcgaacgtcc gggccgctgg gcgctgtacg accgggagcc 5280
gcagcgcgtg tggagttccg gcgcggtgac gctgctggga gatgccgcgc acgcgatgct 5340
gccgcaccac ggacagggcg ccaaccaggc cctggaggac gcggtggtcc tcgcccactt 5400
cctggcacgg acggacaccg gcggtgtgcc gtcggccctg cgcgcctacg agcgtctgcg 5460
tcggccgcgc acccggctgc tccaggcggg ctcccgtaag aacgccggct gcttccagct 5520
ccccgacggg ccgcaggccg aagcccgcaa cgcaaggctg gccaccctgc ccgacgacgt 5580
cgcctggatc cacgggcacg acatcctcgg ctccctgcct gtggccacgt caccggcctg 5640
aaccgcgggc gggggccgcc gaccgcgacg accatcgacg aacggtgagg aacaccatgg 5700
caaggaccta ctccttcgaa ggcaacgtac ccgtcgtgca tcccacggcg ttcgtgcacc 5760
ccgacgccgt gctgatcggg tcggtcgaca tcggtccggg gtgctatgtc ggccccctcg 5820
cgagcctgcg gggcgacttc gggcacatcg aactccgggc gggctccaac gtccaggacg 5880
gctgcgtcct gcactgcttc ccgggggccg acacggtcgt ggaggaggac ggacacgtcg 5940
gccacggcag cgtgctgcac ggctgccggg tgggccggga cagcctcatc ggcatgaagt 6000
ccgtcctcat ggacggtgtc gtggtgggaa cgcgggcgtt cgtcggggcc ggcagcttcg 6060
tcaagtcccg cttccaggta ccggagcggc atctggtggc gggcagcccg gccaaggtgg 6120
tgcgtgaact caccgccgac gagatcgcct ggaagggcaa cgggaccgcc cagtaccaga 6180
agctggccca gcgctgtctc accggtctgc acgcggcgga ggccgccacc gagcgcaccg 6240
ccccggcggc ccccgccgaa cccggcgagc acgaacacgt caccctccac gcctaccggt 6300
cccgctgacg aagcacccga ggcaccttgt cgcggccgat ccgcgcaccg gacaagaccg 6360
tcaggacggg ccccgcgacg gcgccgggct cgcgcgaacg ccaggcccat tcaccggacg 6420
tcacgttcag ggacgtcacg ttcacggacg tcatgttcaa ggacttcacg ctcaaggacc 6480
ttccgcggct ccccagggcc gcgacccttc cccaccccct ccaggaggca tgttcatgaa 6540
cagctcagcc acctcccgac tcgtcgtcgg cgaccggttc cgcgacttcg ccgaggccgt 6600
cggcgccgag acgttctcgc ggctcgcccg ctcgctcgac gcgggcgacc tggacgcggt 6660
cgagggaccg ctgcgcgtgg tcaccggcca gggcgtcggc gagttcgaga tctcctacct 6720
cgaggacgcc gtccgccggc ggcagctgga cgaccggatc gagctggtcc actcggccgg 6780
gcagcccgcc cgtcgccagg aactgcacaa ggcccgcgag gacaacgtgc tgatcgccgg 6840
gctcacacag gtcgacgaca ccgcctacga ggccgccctg aggctgcacg accacaacga 6900
actgctcgtc gacgtccagg accgggtgca cgtgcagggc atggtggccg tcgaggcggc 6960
ccgtcagatg ttcgtcgcgg tggtggagcg ctacttcacg gcccgctggc cgcagcagcg 7020
ctactacatc gtcctcaact ccatcaacac cacgttctcc aacttcctct tccccgtggg 7080
tgccacggtg cggctgacgg tggacgagtc ggaggtgtcg gagcccagcc ggctcacgtt 7140
ccgtacgacg gtggaggtgg agcaggccgg acggcccgcc gctgccgtca ccatcgacgc 7200
ggccgccttc gcccccgggc tgctggagga gaaggagctg cgccgggcca agagcgcggt 7260
ggcgagcacg atggacgccg cactggccat cgcgtgacat gaggacgccg acaccggaca 7320
cccggacgcg ccccgcaccg ggacgactcc cgtacccgga gtggcggttc gcctacctgg 7380
gcccggaagg aaccttcacc gagctggccc tgcggtccct cccggaggcc acgggcgccc 7440
ggctgtcacc ggctgccacg gccaccgagg ccctgacgct ggtgtgccgg ggcgccgcgg 7500
acgccgccat gctgcccgtc cacaacacgg tggccggggt ggtcgcggac acggtgcgcg 7560
cgctcgccga gtcacccgcg ctgaccgtcc tcagggaagt cgtgctcccc gtggaattcg 7620
cccttctggt gcgccccggc acacgacgcg cgcggatccg cacggtgagc ggccatccgc 7680
acgcgggagc gcaggtcggc ggatggctcg acagccgggc gccgcaggcg cgttggacac 7740
cggcgccgtc caacgccgag gccgcgcgca gggtacggga ccgggagtgc gacgccgcgg 7800
tcgccgggga gttcaccgcc gcgcactacg gccttcaggt cctggacgcc gggatacagg 7860
acaccgccgg tgcggtcacc cggttcctgc tgtgcgcgcg tcccggcagg tggagcggcc 7920
cgcgtcccgc cgccgaccgc acctcgctgg tcgggcgtct cgcggcccgg cccgaggagg 7980
ccggcgggct gctcgacggc ctgcggagcc accccttcct gcggtcggtg tccctgcgga 8040
ccgtgtccga cggccgcagc ggctcggtcc tgttcgccga ctgcccggga ggcgccggac 8100
aggccgcgac agcgcgcgcg gtcggcctgc tgcgcctgcg gctgcccgga ctgagagtcc 8160
tggggccgta cccctcggcg acccatgtcc cgtcgtacga acggagcgag accatgcaca 8220
ccgagaccgc cgccgaagcc ggcctctcag cggagaccgg gtcccgggac atcgcccggc 8280
tgcgcgaccg gatcgactcc ctggaccacc tgctcatcgg cacgctcagg gagcggctgg 8340
aggcgtcccg cgagatccag cggatccgta cccgaagcgg cggctcccag gtcgaccccg 8400
ggcgcgaggc cgccgtccgg ggccggtacg ccgaggaact gggggagggc ggaacgggcg 8460
tcgccgaggc gctgctggac atgtgccggg ggcggtcacc acggtgaacc cgcccccgac 8520
gacgacggcg acgtcgtcac cccgcccccg tcgcggccgt gaggacgtcc tcacggccgc 8580
gacggccttg ttccacgagc ggggttacga cgcgacgagc atgagcgaca tcgccgcacg 8640
cctcggcttc accaaggcgg cgctgtaccg gcacgtgacg ggcaaggccg aactgctgcg 8700
ggcgatcacg cggccggtcc gcgcggacgt gcgggccctg ctggccgcga gcaccgccgg 8760
agacgaccgg cccgtcgacc aactctcgga gctgttacga gggttggccg gcgccgcggc 8820
ggccgacccg ggccggtacg tcctcttctg ggggccggac ggcgagcgga gcccgcacgg 8880
gcccgacgcc gtgtgccgtg cggcggtggt ccagcggctg acggaactgc tggagcgcgc 8940
cgccgaccgc ggcgagatac gcgacggcat cgttccccac ctggccgccc ggctgctcgt 9000
cggcgcggtc accggtccgg gccggccggt gtcaccgtcg gccgtggacg tcctgctcga 9060
cgggccggtg cggcgtctga acgacggggc aggccggggg cgggggcgct ga 9112
<210> 2
<211> 159
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 2
Val Arg His Phe Glu His Phe Arg Val Gly Ser Thr Tyr Glu Leu Gly
1 5 10 15
Thr Thr Arg Leu Thr Ser Glu Asp Ile Ile Gly Tyr Ala Arg Val Trp
20 25 30
Asp Pro Met Pro Phe His Leu Asp Pro Glu Ala Ala Ala Arg Ser Pro
35 40 45
Phe Gly Gly Leu Val Ala Ser Gly Trp His Thr Gly Ala Val Val Met
50 55 60
Gly Gln Phe Val Arg Ala Leu Leu Ala Gly Ser Ala Cys Gln Gly Ser
65 70 75 80
Tyr Gly Met Asp Glu Val Arg Phe Leu Arg Pro Val Arg Pro Gly Asp
85 90 95
Asp Val Arg Gly Arg Ala Thr Val Glu Glu Ala Ala Pro His Pro Arg
100 105 110
Arg Pro Asp Thr Gly Thr Val Arg Phe Val Val Glu Ala Asp Asn Gln
115 120 125
Arg Gly Glu Ala Leu Tyr Arg Met Arg Thr Arg Leu Leu Phe Gly Arg
130 135 140
Ala Glu Ala Gly Gly Ala Gln Arg Glu Glu Val Ala Val Arg Arg
145 150 155
<210> 3
<211> 484
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 3
Val Glu Ser Leu Glu Met Asp Glu Asn Ser Leu Ala Asp Pro Ser Val
1 5 10 15
Glu Ala Trp Arg Ala Leu Pro Val Ala Gln Gln Pro Asp Trp Pro Asp
20 25 30
Pro Thr Ala Leu Arg Thr Thr Leu Ser Ala Leu Ser Ala Ala Pro Pro
35 40 45
Leu Val Phe Gly Gln Glu Cys Asp Thr Leu Leu Asp Arg Leu Gly Glu
50 55 60
Val Ala Leu Gly Arg Gly Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu
65 70 75 80
Thr Leu Asp Gly Val Gly Ala Glu Ser Val Arg Asn Lys Leu Glu Val
85 90 95
Leu Leu Gln Met Ala Ala Val Leu Thr Tyr Ala Ala Gly Val Pro Val
100 105 110
Val Lys Val Gly Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Gln
115 120 125
Pro Thr Glu Thr Arg Gly Gly Val Thr Leu Pro Ser Tyr Arg Gly Asp
130 135 140
Ala Val Asn Gly Leu Glu Phe Thr Ala Glu Ala Arg Thr Pro Asp Pro
145 150 155 160
Ala Arg Leu Glu Arg Val Tyr Gln Ala Ser Ala Ala Thr Leu Asn Leu
165 170 175
Leu Arg Ala Leu Thr Ala Gly Gly His Ala Asp Leu Arg Arg Val His
180 185 190
Glu Trp Asn Arg Asp Phe Val Ala Leu Ser Ala Ala Gly His Arg Tyr
195 200 205
Glu Arg Leu Ala Asp Glu Ile Asp Ala Ala Leu Ser Phe Ile Arg Ala
210 215 220
Cys Gly Met Ser Thr Ser Ala Leu Arg Thr Thr Glu Val Phe Ala Ser
225 230 235 240
His Glu Ala Leu Leu Leu Asp Tyr Glu Ser Ala Leu Val Arg Thr Asp
245 250 255
Pro Asp Thr Gly Arg Arg Tyr Ala Leu Ser Gly His Leu Leu Trp Ile
260 265 270
Gly Glu Arg Thr Arg Arg Leu Asp Gly Ala His Val Ala Phe Ala Ala
275 280 285
Gly Val Ser Asn Pro Leu Gly Val Lys Leu Gly Pro Asp Ala Ala Val
290 295 300
Asp Asp Val Arg Ala Leu Val Asp Arg Leu Asp Pro Leu Arg Thr Pro
305 310 315 320
Gly Arg Leu Thr Leu Ile Ala Arg Met Gly Arg Gly Leu Val Arg Asp
325 330 335
Arg Leu Pro Ala Leu Val Glu Ala Val Arg Ala Glu Gly Ala Arg Val
340 345 350
Val Trp Ala Cys Asp Pro Met His Gly Asn Thr Phe Thr Ala Pro Ser
355 360 365
Gly His Lys Ser Arg Arg Phe Glu Asp Val Leu Asp Glu Ile Thr Gly
370 375 380
Phe Phe Glu Val His Arg Ala Leu Gly Thr His Pro Gly Gly Val His
385 390 395 400
Val Glu Leu Thr Gly Glu Asp Val Thr Glu Cys Val Gly Gly Ser Asp
405 410 415
Glu Val Leu Ser Asp Asp Leu Pro Leu Arg Tyr Glu Thr Ala Cys Asp
420 425 430
Pro Arg Leu Asn Arg Gly Gln Ser Met Asp Leu Ala Phe Arg Val Ala
435 440 445
Glu Trp Phe Ser Ala Glu Arg Arg Arg Leu Gly Arg Pro Arg Pro Glu
450 455 460
Pro Ala Leu Ile Arg Pro Val Gly Ala Pro Val Tyr Ala Ala His Ala
465 470 475 480
Ala Ser Pro Gly
<210> 4
<211> 530
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 4
Met Ser Ser Thr Val Asn Pro Ser Gly Ser Val Ser Arg Pro Gln Thr
1 5 10 15
Gly Asp Glu Tyr Leu Glu Ser Leu Arg Asp Gly Arg Glu Val Arg Ile
20 25 30
Tyr Gly Glu Lys Val Gln Asp Val Thr Ala His Pro Ala Phe Arg Asn
35 40 45
Asn Ser Arg Met Val Ala Arg Leu Phe Asp Ala Leu His Asp Pro Glu
50 55 60
Arg Asn Ser Lys Leu Val Val Pro Thr Asp Thr Gly Asn Gly Gly Phe
65 70 75 80
Thr His Pro Tyr Phe Lys Ala Pro Tyr Thr Ser Gly Asp Leu Arg Thr
85 90 95
Ala Ala Arg Ala Met Glu Glu Trp Ala Arg Met Thr Tyr Gly Trp Leu
100 105 110
Gly Arg Thr Pro Asp Phe Lys Ala Ala Phe Leu Ser Thr Leu Gly Ser
115 120 125
Asn Lys Glu His Tyr Ala Pro Phe Glu Asp Asn Ala Ser Ala Trp Tyr
130 135 140
Arg Lys Ala Gln Glu Asn Val Leu Phe Ile Gly His Gly Ile Val Asn
145 150 155 160
Pro Pro Ile Asp Arg Asn Arg Gly Leu Thr Glu Leu Lys Asp Val Met
165 170 175
Leu Thr Val Asp Arg Glu Thr Asp Ala Gly Leu Val Val Ser Gly Ala
180 185 190
Lys Val Val Gly Thr Gly Ala Ala Leu Thr Gln His Ile Phe Ile Gly
195 200 205
Ser Tyr Gly Val Ile Pro Lys Gly Ala Lys Glu Phe Ser Ala Tyr Phe
210 215 220
Ile Val Pro Thr Asp Ser Pro Gly Leu Lys Ile Ile Ser Arg Pro Ser
225 230 235 240
Tyr Glu Phe Ala Ser Ala Thr Val Ser Ser Pro Phe Asp Gln Pro Leu
245 250 255
Ser Ser Arg Leu Asp Glu Asn Asp Gly Ile Leu Val Phe Asp Gln Val
260 265 270
Leu Ile Pro Trp Glu Asn Val Phe Cys Tyr Asp Val Asp Lys Ala Asn
275 280 285
Asp Phe Phe Tyr Gly Ser Gly Phe Phe Tyr Arg Ala Met Phe His Ala
290 295 300
Cys Val Arg Phe Ala Val Lys Met Asp Phe Leu Thr Gly Leu Leu Ala
305 310 315 320
Lys Cys Leu Glu Thr Thr Gly Thr Ser Glu Phe Arg Gly Val Gln Ser
325 330 335
Arg Leu Gly Glu Val Leu Ala Tyr Arg Asn Met Phe Trp Ala Leu Val
340 345 350
Asp Ser Met Ala Glu Asn Pro Thr Lys Trp Pro Asp Gly Thr Val Thr
355 360 365
Pro Asn Gly Glu Thr Ala Leu Ala Phe Arg Val Leu Ser Ser Ser Ile
370 375 380
Phe Pro Lys Val Arg Glu Ile Phe Leu Arg Asp Leu Gly Ser Ala Leu
385 390 395 400
Ile Tyr Asn Asn Ser His Ala Leu Asp Trp Ser Asn Pro Glu Val Arg
405 410 415
Pro Tyr Leu Asp Lys Tyr Val Arg Gly Leu Gly Val Glu Ala Ile Asp
420 425 430
Arg Val Lys Leu Met Lys Leu Ala Trp Asp Ala Val Gly Thr Glu Phe
435 440 445
Gly Ala Arg Trp Glu Leu Tyr Glu Met Asn Tyr Ala Gly Asn His Glu
450 455 460
Gln Ile Arg Phe Glu Ala Leu His Ala Gln Gln Val Ser Gly Lys Phe
465 470 475 480
Asp Asp Tyr Lys Gln Leu Val Asp Arg Cys Leu Ser Glu Tyr Asp Glu
485 490 495
His Gly Trp Lys Val Pro Asp Leu Val Asp Pro Lys Asp Thr Thr Val
500 505 510
Ile Gly Ala Gly Ala Pro Asp Thr Gly Thr Thr Ala Pro Arg Pro Ala
515 520 525
Ala Arg
530
<210> 5
<211> 185
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 5
Val Ser Ser His Thr Pro Ala Pro Gly Gly Pro Thr Ala Pro Pro Gly
1 5 10 15
Ala Pro Val Leu Pro Asp Gln Ala Gln Leu Arg His Val Leu Gly Gln
20 25 30
Phe Val Thr Gly Val Cys Ala Val Ser Thr Arg Phe Asp Thr Arg Ser
35 40 45
Gly Val Arg His Asp Ala Ile Ala Val Asn Ser Phe Thr Ser Val Ser
50 55 60
Leu Asp Pro Pro Leu Val Ser Met Tyr Leu Arg Asp Asp Ser Thr Phe
65 70 75 80
Leu Arg Arg Val Arg Thr Ser Gly Gln Trp Ala Val Ser Phe Leu Gly
85 90 95
Asn Arg Ala Arg Ser Leu Val Gly Val Leu Thr Ala Pro Ala Ala Arg
100 105 110
Arg Pro Pro Val Glu Gln Ala Ala Asp Trp Ala Val Gly Pro His Thr
115 120 125
Gly Cys Leu Val Leu Pro Asp Gly Pro Gly Thr Leu Glu Cys Ala Leu
130 135 140
His Leu Thr Gln Ala Leu Gly Asp His Val Leu Val Val Gly Arg Val
145 150 155 160
Leu Gly Ala Val Gly Arg Asp His Glu Pro Leu Val Phe His Arg Gly
165 170 175
Ala Phe Thr Glu Val Ala Pro Ala Pro
180 185
<210> 6
<211> 400
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 6
Met Ala Arg Lys Arg Pro Tyr Val Ala Val Val Gly Gly Gly Ile Gly
1 5 10 15
Gly Leu Ala Val Ala Leu Gly Leu Arg Arg Gln Gly Val Glu Ala Val
20 25 30
Val His Glu Gln Ala His Ala Leu Ser His Gln Gly Ala Gly Ile Ala
35 40 45
Ile Gly Ala Asn Gly His Arg Ala Leu Arg Glu Leu Gly Val Ala Lys
50 55 60
Arg Leu Thr Ala Ser Ala Ala Arg Pro Ser Arg Ala Asp Phe Arg His
65 70 75 80
Trp Arg Thr Gly Arg Ser Met Val Ser His Arg Leu Thr Gly Leu Tyr
85 90 95
Glu Glu Arg Phe Gly Ala Pro Phe Trp Thr Val Glu Arg Ala Ala Val
100 105 110
Gln Gln Ala Leu Leu Ala Glu Leu Gly Pro Arg His Val Arg Leu Gly
115 120 125
Ala Arg Cys Thr Gly Val Asp Arg Thr Ala Asp Gly Ala Val Ile Arg
130 135 140
Phe Glu Asp Gly Gly Glu Ala Glu Ala Asp Ala Val Val Gly Ala Asp
145 150 155 160
Gly Ile His Ser Ala Val Arg His Ser Leu Phe Gly Pro Gln Glu Ala
165 170 175
Val Phe Ser Gly Thr Ser Gly Tyr Arg Ala Leu Val Pro Met Asp Arg
180 185 190
Leu Arg His Val Pro Glu Leu Ala Glu Pro Val Leu Trp Leu Trp Leu
195 200 205
Gly Pro Gly Arg His Phe Ile Ala Tyr Pro Val Ala Asp Gly Ser Ala
210 215 220
Leu Asn Phe Leu Ala Val Val Pro Asp Arg Thr Trp Thr Val Glu Ser
225 230 235 240
Trp Ser Thr Glu Gly Asp Ala Ala Glu Leu Arg Ala Ala Phe Asp Gly
245 250 255
Trp His Pro Phe Val Thr Glu Val Leu Gly Ala Cys Glu Arg Pro Gly
260 265 270
Arg Trp Ala Leu Tyr Asp Arg Glu Pro Gln Arg Val Trp Ser Ser Gly
275 280 285
Ala Val Thr Leu Leu Gly Asp Ala Ala His Ala Met Leu Pro His His
290 295 300
Gly Gln Gly Ala Asn Gln Ala Leu Glu Asp Ala Val Val Leu Ala His
305 310 315 320
Phe Leu Ala Arg Thr Asp Thr Gly Gly Val Pro Ser Ala Leu Arg Ala
325 330 335
Tyr Glu Arg Leu Arg Arg Pro Arg Thr Arg Leu Leu Gln Ala Gly Ser
340 345 350
Arg Lys Asn Ala Gly Cys Phe Gln Leu Pro Asp Gly Pro Gln Ala Glu
355 360 365
Ala Arg Asn Ala Arg Leu Ala Thr Leu Pro Asp Asp Val Ala Trp Ile
370 375 380
His Gly His Asp Ile Leu Gly Ser Leu Pro Val Ala Thr Ser Pro Ala
385 390 395 400
<210> 7
<211> 203
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 7
Met Ala Arg Thr Tyr Ser Phe Glu Gly Asn Val Pro Val Val His Pro
1 5 10 15
Thr Ala Phe Val His Pro Asp Ala Val Leu Ile Gly Ser Val Asp Ile
20 25 30
Gly Pro Gly Cys Tyr Val Gly Pro Leu Ala Ser Leu Arg Gly Asp Phe
35 40 45
Gly His Ile Glu Leu Arg Ala Gly Ser Asn Val Gln Asp Gly Cys Val
50 55 60
Leu His Cys Phe Pro Gly Ala Asp Thr Val Val Glu Glu Asp Gly His
65 70 75 80
Val Gly His Gly Ser Val Leu His Gly Cys Arg Val Gly Arg Asp Ser
85 90 95
Leu Ile Gly Met Lys Ser Val Leu Met Asp Gly Val Val Val Gly Thr
100 105 110
Arg Ala Phe Val Gly Ala Gly Ser Phe Val Lys Ser Arg Phe Gln Val
115 120 125
Pro Glu Arg His Leu Val Ala Gly Ser Pro Ala Lys Val Val Arg Glu
130 135 140
Leu Thr Ala Asp Glu Ile Ala Trp Lys Gly Asn Gly Thr Ala Gln Tyr
145 150 155 160
Gln Lys Leu Ala Gln Arg Cys Leu Thr Gly Leu His Ala Ala Glu Ala
165 170 175
Ala Thr Glu Arg Thr Ala Pro Ala Ala Pro Ala Glu Pro Gly Glu His
180 185 190
Glu His Val Thr Leu His Ala Tyr Arg Ser Arg
195 200
<210> 8
<211> 70
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 8
Leu Ser Arg Pro Ile Arg Ala Pro Asp Lys Thr Val Arg Thr Gly Pro
1 5 10 15
Ala Thr Ala Pro Gly Ser Arg Glu Arg Gln Ala His Ser Pro Asp Val
20 25 30
Thr Phe Arg Asp Val Thr Phe Thr Asp Val Met Phe Lys Asp Phe Thr
35 40 45
Leu Lys Asp Leu Pro Arg Leu Pro Arg Ala Ala Thr Leu Pro His Pro
50 55 60
Leu Gln Glu Ala Cys Ser
65 70
<210> 9
<211> 253
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 9
Met Asn Ser Ser Ala Thr Ser Arg Leu Val Val Gly Asp Arg Phe Arg
1 5 10 15
Asp Phe Ala Glu Ala Val Gly Ala Glu Thr Phe Ser Arg Leu Ala Arg
20 25 30
Ser Leu Asp Ala Gly Asp Leu Asp Ala Val Glu Gly Pro Leu Arg Val
35 40 45
Val Thr Gly Gln Gly Val Gly Glu Phe Glu Ile Ser Tyr Leu Glu Asp
50 55 60
Ala Val Arg Arg Arg Gln Leu Asp Asp Arg Ile Glu Leu Val His Ser
65 70 75 80
Ala Gly Gln Pro Ala Arg Arg Gln Glu Leu His Lys Ala Arg Glu Asp
85 90 95
Asn Val Leu Ile Ala Gly Leu Thr Gln Val Asp Asp Thr Ala Tyr Glu
100 105 110
Ala Ala Leu Arg Leu His Asp His Asn Glu Leu Leu Val Asp Val Gln
115 120 125
Asp Arg Val His Val Gln Gly Met Val Ala Val Glu Ala Ala Arg Gln
130 135 140
Met Phe Val Ala Val Val Glu Arg Tyr Phe Thr Ala Arg Trp Pro Gln
145 150 155 160
Gln Arg Tyr Tyr Ile Val Leu Asn Ser Ile Asn Thr Thr Phe Ser Asn
165 170 175
Phe Leu Phe Pro Val Gly Ala Thr Val Arg Leu Thr Val Asp Glu Ser
180 185 190
Glu Val Ser Glu Pro Ser Arg Leu Thr Phe Arg Thr Thr Val Glu Val
195 200 205
Glu Gln Ala Gly Arg Pro Ala Ala Ala Val Thr Ile Asp Ala Ala Ala
210 215 220
Phe Ala Pro Gly Leu Leu Glu Glu Lys Glu Leu Arg Arg Ala Lys Ser
225 230 235 240
Ala Val Ala Ser Thr Met Asp Ala Ala Leu Ala Ile Ala
245 250
<210> 10
<211> 402
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 10
Met Arg Thr Pro Thr Pro Asp Thr Arg Thr Arg Pro Ala Pro Gly Arg
1 5 10 15
Leu Pro Tyr Pro Glu Trp Arg Phe Ala Tyr Leu Gly Pro Glu Gly Thr
20 25 30
Phe Thr Glu Leu Ala Leu Arg Ser Leu Pro Glu Ala Thr Gly Ala Arg
35 40 45
Leu Ser Pro Ala Ala Thr Ala Thr Glu Ala Leu Thr Leu Val Cys Arg
50 55 60
Gly Ala Ala Asp Ala Ala Met Leu Pro Val His Asn Thr Val Ala Gly
65 70 75 80
Val Val Ala Asp Thr Val Arg Ala Leu Ala Glu Ser Pro Ala Leu Thr
85 90 95
Val Leu Arg Glu Val Val Leu Pro Val Glu Phe Ala Leu Leu Val Arg
100 105 110
Pro Gly Thr Arg Arg Ala Arg Ile Arg Thr Val Ser Gly His Pro His
115 120 125
Ala Gly Ala Gln Val Gly Gly Trp Leu Asp Ser Arg Ala Pro Gln Ala
130 135 140
Arg Trp Thr Pro Ala Pro Ser Asn Ala Glu Ala Ala Arg Arg Val Arg
145 150 155 160
Asp Arg Glu Cys Asp Ala Ala Val Ala Gly Glu Phe Thr Ala Ala His
165 170 175
Tyr Gly Leu Gln Val Leu Asp Ala Gly Ile Gln Asp Thr Ala Gly Ala
180 185 190
Val Thr Arg Phe Leu Leu Cys Ala Arg Pro Gly Arg Trp Ser Gly Pro
195 200 205
Arg Pro Ala Ala Asp Arg Thr Ser Leu Val Gly Arg Leu Ala Ala Arg
210 215 220
Pro Glu Glu Ala Gly Gly Leu Leu Asp Gly Leu Arg Ser His Pro Phe
225 230 235 240
Leu Arg Ser Val Ser Leu Arg Thr Val Ser Asp Gly Arg Ser Gly Ser
245 250 255
Val Leu Phe Ala Asp Cys Pro Gly Gly Ala Gly Gln Ala Ala Thr Ala
260 265 270
Arg Ala Val Gly Leu Leu Arg Leu Arg Leu Pro Gly Leu Arg Val Leu
275 280 285
Gly Pro Tyr Pro Ser Ala Thr His Val Pro Ser Tyr Glu Arg Ser Glu
290 295 300
Thr Met His Thr Glu Thr Ala Ala Glu Ala Gly Leu Ser Ala Glu Thr
305 310 315 320
Gly Ser Arg Asp Ile Ala Arg Leu Arg Asp Arg Ile Asp Ser Leu Asp
325 330 335
His Leu Leu Ile Gly Thr Leu Arg Glu Arg Leu Glu Ala Ser Arg Glu
340 345 350
Ile Gln Arg Ile Arg Thr Arg Ser Gly Gly Ser Gln Val Asp Pro Gly
355 360 365
Arg Glu Ala Ala Val Arg Gly Arg Tyr Ala Glu Glu Leu Gly Glu Gly
370 375 380
Gly Thr Gly Val Ala Glu Ala Leu Leu Asp Met Cys Arg Gly Arg Ser
385 390 395 400
Pro Arg
<210> 11
<211> 209
<212> PRT
<213> Streptomyces ochraceiscleroticus Soc7
<400> 11
Val Pro Gly Ala Val Thr Thr Val Asn Pro Pro Pro Thr Thr Thr Ala
1 5 10 15
Thr Ser Ser Pro Arg Pro Arg Arg Gly Arg Glu Asp Val Leu Thr Ala
20 25 30
Ala Thr Ala Leu Phe His Glu Arg Gly Tyr Asp Ala Thr Ser Met Ser
35 40 45
Asp Ile Ala Ala Arg Leu Gly Phe Thr Lys Ala Ala Leu Tyr Arg His
50 55 60
Val Thr Gly Lys Ala Glu Leu Leu Arg Ala Ile Thr Arg Pro Val Arg
65 70 75 80
Ala Asp Val Arg Ala Leu Leu Ala Ala Ser Thr Ala Gly Asp Asp Arg
85 90 95
Pro Val Asp Gln Leu Ser Glu Leu Leu Arg Gly Leu Ala Gly Ala Ala
100 105 110
Ala Ala Asp Pro Gly Arg Tyr Val Leu Phe Trp Gly Pro Asp Gly Glu
115 120 125
Arg Ser Pro His Gly Pro Asp Ala Val Cys Arg Ala Ala Val Val Gln
130 135 140
Arg Leu Thr Glu Leu Leu Glu Arg Ala Ala Asp Arg Gly Glu Ile Arg
145 150 155 160
Asp Gly Ile Val Pro His Leu Ala Ala Arg Leu Leu Val Gly Ala Val
165 170 175
Thr Gly Pro Gly Arg Pro Val Ser Pro Ser Ala Val Asp Val Leu Leu
180 185 190
Asp Gly Pro Val Arg Arg Leu Asn Asp Gly Ala Gly Arg Gly Arg Gly
195 200 205
Arg
<210> 12
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 12
gccaccgcac cgccgtacgg gccgggccgc ggccgtccga tattccgggg atccgtcgac 60
<210> 13
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 13
gcggccgacg atctgctggt ggacgtcggc ttccacgccg tgtaggctgg agctgcttc 59
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 14
atgtcaccgc tgcgcaccga 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 15
acctccggta cggaccagga 20
<210> 16
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 16
gcgacgggtg cgacgggtgc ggaacatggg agcggcccta tattccgggg atccgtcgac 60
<210> 17
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 17
gtgtggctcc gccacgccgt ccgctccgcg ctgacccggg tgtaggctgg agctgcttc 59
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 18
tcacgaacag cttcacccac t 21
<210> 19
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 19
ggcatcgaac tgttcgacct t 21
<210> 20
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 20
acgagtacct ggagagcctc cgggacggcc gggaagtcag gatctatatt ccggggatcc 60
gtcgac 66
<210> 21
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 21
cgtacttgtc caggtagggc cggacctcgg ggttggacca gtcgatgtgt aggctggagc 60
tgcttc 66
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 22
caccggctcg aaaggtgatc 20
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 23
gtagttcatc tcgtacagct c 21
<210> 24
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 24
gagcccccgt cctgccggac caggcccaac tcaggcacgt actcgatatt ccggggatcc 60
gtcgac 66
<210> 25
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 25
gacagccggt gtgcgggccg acggcccagt cggcggcctg ctccatgtgt aggctggagc 60
tgcttc 66
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 26
gagtacgacg agcacggctg 20
<210> 27
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 27
cctgttcgct gccgaaggc 19
<210> 28
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 28
gactgcgcag gcagggcgtc gaggcggtcg tccacgagca ggcgcatatt ccggggatcc 60
gtcgac 66
<210> 29
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 29
gtgccaggaa gtgggcgagg accaccgcgt cctccagggc ctggttgtgt aggctggagc 60
tgcttc 66
<210> 30
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 30
ccttcaccga agtcgcacc 19
<210> 31
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 31
cgacgcagac gctcgtagg 19
<210> 32
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 32
atggcaagga cctactcctt cgaaggcaac gtacccgtcg tgcatatatt ccggggatcc 60
gtcgac 66
<210> 33
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 33
ctcggtggcg gcctccgccg cgtgcagacc ggtgagacag cgctgtgtgt aggctggagc 60
tgcttc 66
<210> 34
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 正向
<400> 34
gatccacggg cacgacatc 19
<210> 35
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 反向
<400> 35
cgtcctgacg gtcttgtcc 19

Claims (10)

1.一种3,7-二羟基卓酚酮的生物合成基因簇,其特征在于,所述基因簇的碱基序列如SEQ ID NO.1所示;所述基因簇包括编码3,7-二羟基卓酚酮生物合成所涉及的10个基因:
S1、负责3,7-二羟基卓酚酮生物合成的结构基因,为trlAtrlBtrlCtrlDtrlEtrlFtrlH以及trlI;其中,
trlA位于如SEQ ID NO.1所示序列的第1-480位,编码酰基辅酶A脱水酶,大小为159个氨基酸;
trlB位于如SEQ ID NO.1所示序列的第530-1984位,编码3-脱氧-D-阿糖基庚酮酸-7-磷酸合成酶,大小为484个氨基酸;
trlC位于如SEQ ID NO.1所示序列的第2248-3840位,编码单加氧酶,大小为530个氨基酸;
trlD位于如SEQ ID NO.1所示序列的第3837-4394位,编码黄素还原酶,大小为185个氨基酸;
trlE位于如SEQ ID NO.1所示序列的第4439-5641位,编码单加氧酶,大小为400个氨基酸;
trlF位于如SEQ ID NO.1所示序列的第5697-6308位,编码氧化酶,大小为203个氨基酸;
trlH位于如SEQ ID NO.1所示序列的第6536-7297位,编码硫酯酶,大小为253个氨基酸;
trlI位于如SEQ ID NO.1所示序列的第7299-8508位,编码预苯酸脱水酶-分支酸变位酶双功能酶,大小为402个氨基酸;
S2、负责3,7-二羟基卓酚酮生物合成的调控基因trlJ;
trlJ位于如SEQ ID NO.1所示序列的第8483-9112位,编码TetR家族转录调控蛋白,大小为209个氨基酸;
S3、其他功能蛋白基因trlG;
trlG位于如SEQ ID NO.1所示序列的第6327-6539位,编码其他功能蛋白,大小为70个氨基酸。
2.一种如权利要求1所述的3,7-二羟基卓酚酮的生物合成基因簇编码的蛋白。
3.一种如权利要求1所述的3,7-二羟基卓酚酮的生物合成基因簇或其编码的蛋白在催化合成3,7-二羟基卓酚酮中的用途。
4.一种含有权利要求1所述的3,7-二羟基卓酚酮的生物合成基因簇的表达载体。
5.一种基因工程菌株,其特征在于,所述基因工程菌株携带如权利要求1所述的3,7-二羟基卓酚酮的生物合成基因簇。
6.一种基因工程菌株,其特征在于,所述基因工程菌株携带如权利要求1所述的3,7-二羟基卓酚酮的生物合成基因簇,且其中的trlC基因、trlD基因、trlE基因或trlF基因被失活。
7.一种中断单加氧酶合成基因trlC的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF6 ,其保藏编号为CGMCC No. 13918。
8.一种中断黄素还原酶合成基因trlD的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF7,其保藏编号为CGMCC No. 13919 。
9.一种中断单加氧酶合成基因trlE的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF8,其保藏编号为CGMCC No. 13920。
10.一种中断氧化酶合成基因trlF的天蓝色链霉菌(Streptomyces coelicolor)M1154/pCXF9,其保藏编号为CGMCC No. 13921 。
CN201710719271.6A 2017-08-21 2017-08-21 3,7-二羟基卓酚酮生物合成基因簇及其应用 Expired - Fee Related CN107699581B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710719271.6A CN107699581B (zh) 2017-08-21 2017-08-21 3,7-二羟基卓酚酮生物合成基因簇及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710719271.6A CN107699581B (zh) 2017-08-21 2017-08-21 3,7-二羟基卓酚酮生物合成基因簇及其应用

Publications (2)

Publication Number Publication Date
CN107699581A CN107699581A (zh) 2018-02-16
CN107699581B true CN107699581B (zh) 2020-12-29

Family

ID=61171157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710719271.6A Expired - Fee Related CN107699581B (zh) 2017-08-21 2017-08-21 3,7-二羟基卓酚酮生物合成基因簇及其应用

Country Status (1)

Country Link
CN (1) CN107699581B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114317470B (zh) * 2021-12-28 2024-04-30 中国医学科学院医药生物技术研究所 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5079721B2 (ja) * 2009-02-23 2012-11-21 新日鐵化学株式会社 エポキシ樹脂組成物および成形物
WO2015053299A1 (ja) * 2013-10-11 2015-04-16 日本化薬株式会社 フェノール樹脂の製造方法、フェノール樹脂、エポキシ樹脂およびエポキシ樹脂組成物

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5079721B2 (ja) * 2009-02-23 2012-11-21 新日鐵化学株式会社 エポキシ樹脂組成物および成形物
WO2015053299A1 (ja) * 2013-10-11 2015-04-16 日本化薬株式会社 フェノール樹脂の製造方法、フェノール樹脂、エポキシ樹脂およびエポキシ樹脂組成物

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Involvement of the TetR-Type Regulator PaaR in the Regulation of Pristinamycin I Biosynthesis through an Effect on Precursor Supply in Streptomyces pristinaespiralis;Zhao, Yawei;《JOURNAL OF BACTERIOLOGY》;20151230;第193卷(第12期);全文 *
Streptomyces sampsonii strain KJ40 chromosome, complete genome,GenBank: CP016824.1;Zhang,B;《NCBI Genbank database》;20160812;全文 *
藤黄生孢链霉菌NRRL 2401遗传操作系统和基因文库的构建;成雪晴等;《微生物学报》;20161230;全文 *

Also Published As

Publication number Publication date
CN107699581A (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
Luo et al. Activation and characterization of a cryptic polycyclic tetramate macrolactam biosynthetic gene cluster
CN109750009B (zh) 一种草铵膦脱氢酶突变体及其应用
Makitrynskyy et al. Secondary nucleotide messenger c-di-GMP exerts a global control on natural product biosynthesis in streptomycetes
CN110218244B (zh) 化合物ilamycin F及其应用
Sucipto et al. Exploring Chemical Diversity of α‐Pyrone Antibiotics: Molecular Basis of Myxopyronin Biosynthesis
Zhu et al. Discovery and engineered overproduction of antimicrobial nucleoside antibiotic A201A from the deep-sea marine actinomycete Marinactinospora thermotolerans SCSIO 00652
Chen et al. Biosynthesis of tropolones in Streptomyces spp.: interweaving biosynthesis and degradation of phenylacetic acid and hydroxylations on the tropone ring
Meng et al. Improvement of pristinamycin I (PI) production in Streptomyces pristinaespiralis by metabolic engineering approaches
Korp et al. Engineering pseudochelin production in Myxococcus xanthus
KR100945483B1 (ko) pikD 조절유전자의 발현벡터를 이용한 스트렙토미세스베네주엘라에(Streptomycesvenezuelae)에서폴리케타이드(polyketide)의 생산성 증가방법
CN111117942B (zh) 一种产林可霉素的基因工程菌及其构建方法和应用
CN104630100A (zh) 改造的克雷伯氏肺炎杆菌及其生产r-乙偶姻的应用
CN107699581B (zh) 3,7-二羟基卓酚酮生物合成基因簇及其应用
CN116286574B (zh) 精准调控Bacillus subtilis内源多基因表达的CRISPRa方法及其应用
Xie et al. Enhancement of himastatin bioproduction via inactivation of atypical repressors in Streptomyces hygroscopicus
CN107699532B (zh) 3,7-二羟基卓酚酮高产菌株及其发酵培养方法
Ren et al. Reconstruction of secondary metabolic pathway to synthesize novel metabolite in Saccharopolyspora erythraea
CN106554932B (zh) 一种产生庆大霉素b的基因工程菌及其构建方法
CN112375725B (zh) 一种生产维生素b6的代谢工程菌株及其构建方法与应用
CN108486028B (zh) 一种高产含有L-Val结构单元的化合物的菌株△mfnH
Zhang et al. Mining and characterization of the PKS–NRPS hybrid for epicoccamide A: a mannosylated tetramate derivative from Epicoccum sp. CPCC 400996
Li et al. Discovery of venediols by activation of a silent type I polyketide biosynthetic gene cluster in Streptomyces venezuelae ATCC 15439
CN116837016B (zh) 一种构建生产辣椒素香草壬酰胺的重组大肠杆菌工程菌株的方法及重组菌株和应用
EP2297181B1 (en) Synthetic pathway enzymes for the production of argyrins
CN118063531B (zh) 大环内酯类化合物PA-46101s C-E的制备及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201229