CN104928272A - 融合多肽、编码它的核酸分子以及使用它产生衣康酸的方法 - Google Patents
融合多肽、编码它的核酸分子以及使用它产生衣康酸的方法 Download PDFInfo
- Publication number
- CN104928272A CN104928272A CN201510121385.1A CN201510121385A CN104928272A CN 104928272 A CN104928272 A CN 104928272A CN 201510121385 A CN201510121385 A CN 201510121385A CN 104928272 A CN104928272 A CN 104928272A
- Authority
- CN
- China
- Prior art keywords
- aconitase
- cis
- cells
- genetic modification
- methylene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- LVHBHZANLOWSRM-UHFFFAOYSA-N methylenebutanedioic acid Natural products OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 title claims abstract description 150
- 230000004927 fusion Effects 0.000 title claims abstract description 66
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 40
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 39
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 38
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 6
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 6
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 6
- JAHNSTQSQJOJLO-UHFFFAOYSA-N 2-(3-fluorophenyl)-1h-imidazole Chemical compound FC1=CC=CC(C=2NC=CN=2)=C1 JAHNSTQSQJOJLO-UHFFFAOYSA-N 0.000 title abstract description 3
- 238000004519 manufacturing process Methods 0.000 title description 4
- 108010009924 Aconitate hydratase Proteins 0.000 claims abstract description 83
- 238000000034 method Methods 0.000 claims abstract description 15
- 102000009836 Aconitate hydratase Human genes 0.000 claims description 82
- 108090000489 Carboxy-Lyases Proteins 0.000 claims description 44
- 102000004031 Carboxy-Lyases Human genes 0.000 claims description 43
- 108090000623 proteins and genes Proteins 0.000 claims description 42
- 241000894006 Bacteria Species 0.000 claims description 35
- 230000000968 intestinal effect Effects 0.000 claims description 35
- 238000012239 gene modification Methods 0.000 claims description 24
- 230000005017 genetic modification Effects 0.000 claims description 24
- 235000013617 genetically modified food Nutrition 0.000 claims description 24
- 239000002773 nucleotide Substances 0.000 claims description 20
- 125000003729 nucleotide group Chemical group 0.000 claims description 20
- 241000228212 Aspergillus Species 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 16
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 12
- 101150106096 gltA gene Proteins 0.000 claims description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 4
- 241001465318 Aspergillus terreus Species 0.000 claims description 3
- 241000588724 Escherichia coli Species 0.000 claims description 3
- 230000006698 induction Effects 0.000 claims description 3
- 238000004113 cell culture Methods 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 claims 26
- 210000003527 eukaryotic cell Anatomy 0.000 claims 1
- 239000013604 expression vector Substances 0.000 claims 1
- 101150023641 ppc gene Proteins 0.000 claims 1
- 102100038248 Cis-aconitate decarboxylase Human genes 0.000 abstract description 9
- 108030001549 Cis-aconitate decarboxylases Proteins 0.000 abstract description 3
- 102100039868 Cytoplasmic aconitate hydratase Human genes 0.000 abstract 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 54
- 239000013612 plasmid Substances 0.000 description 31
- 230000001580 bacterial effect Effects 0.000 description 29
- 238000012258 culturing Methods 0.000 description 26
- 102000004190 Enzymes Human genes 0.000 description 23
- 108090000790 Enzymes Proteins 0.000 description 23
- 239000000523 sample Substances 0.000 description 22
- 238000012360 testing method Methods 0.000 description 20
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 14
- 101150113917 acnA gene Proteins 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 101150053555 acnB gene Proteins 0.000 description 8
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 8
- 108010030844 2-methylcitrate synthase Proteins 0.000 description 7
- 101100054574 Corynebacterium diphtheriae (strain ATCC 700971 / NCTC 13129 / Biotype gravis) acn gene Proteins 0.000 description 7
- 101100215150 Dictyostelium discoideum aco1 gene Proteins 0.000 description 7
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 7
- 235000011187 glycerol Nutrition 0.000 description 7
- 101150118781 icd gene Proteins 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 108010071536 Citrate (Si)-synthase Proteins 0.000 description 6
- 102000006732 Citrate synthase Human genes 0.000 description 6
- 241000235015 Yarrowia lipolytica Species 0.000 description 6
- 239000003513 alkali Substances 0.000 description 6
- 229940041514 candida albicans extract Drugs 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 230000002103 transcriptional effect Effects 0.000 description 6
- 239000012138 yeast extract Substances 0.000 description 6
- PBLQSFOIWOTFNY-UHFFFAOYSA-N 3-methylbut-2-enyl 4-methoxy-8-(3-methylbut-2-enoxy)quinoline-2-carboxylate Chemical compound C1=CC=C2C(OC)=CC(C(=O)OCC=C(C)C)=NC2=C1OCC=C(C)C PBLQSFOIWOTFNY-UHFFFAOYSA-N 0.000 description 5
- 101150014984 ACO gene Proteins 0.000 description 5
- ODBLHEXUDAPZAU-ZAFYKAAXSA-N D-threo-isocitric acid Chemical compound OC(=O)[C@H](O)[C@@H](C(O)=O)CC(O)=O ODBLHEXUDAPZAU-ZAFYKAAXSA-N 0.000 description 5
- 101100378193 Dictyostelium discoideum aco2 gene Proteins 0.000 description 5
- ODBLHEXUDAPZAU-FONMRSAGSA-N Isocitric acid Natural products OC(=O)[C@@H](O)[C@H](C(O)=O)CC(O)=O ODBLHEXUDAPZAU-FONMRSAGSA-N 0.000 description 5
- 239000013592 cell lysate Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- ODBLHEXUDAPZAU-UHFFFAOYSA-N threo-D-isocitric acid Natural products OC(=O)C(O)C(C(O)=O)CC(O)=O ODBLHEXUDAPZAU-UHFFFAOYSA-N 0.000 description 5
- 108030005611 2-methylcitrate dehydratases Proteins 0.000 description 4
- 108010036824 Citrate (pro-3S)-lyase Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- YNOXCRMFGMSKIJ-UHFFFAOYSA-N 2-methylcitric acid Chemical compound OC(=O)C(C)C(O)(C(O)=O)CC(O)=O YNOXCRMFGMSKIJ-UHFFFAOYSA-N 0.000 description 3
- GIEGKXINITVUOO-UHFFFAOYSA-N 2-methylidenebutanedioic acid Chemical compound OC(=O)CC(=C)C(O)=O.OC(=O)CC(=C)C(O)=O GIEGKXINITVUOO-UHFFFAOYSA-N 0.000 description 3
- 101710082464 Cis-aconitate decarboxylase Proteins 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 108010048430 aconitate decarboxylase Proteins 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000021523 carboxylation Effects 0.000 description 3
- 238000006473 carboxylation reaction Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- FZIPCQLKPTZZIM-UHFFFAOYSA-N 2-oxidanylpropane-1,2,3-tricarboxylic acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O.OC(=O)CC(O)(C(O)=O)CC(O)=O FZIPCQLKPTZZIM-UHFFFAOYSA-N 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 102000012011 Isocitrate Dehydrogenase Human genes 0.000 description 2
- 108010075869 Isocitrate Dehydrogenase Proteins 0.000 description 2
- 241000186840 Lactobacillus fermentum Species 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000221566 Ustilago Species 0.000 description 2
- 230000003570 biosynthesizing effect Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 101150042350 gltA2 gene Proteins 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 229940012969 lactobacillus fermentum Drugs 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- YDZFYKJFTOMLMS-UHFFFAOYSA-N 1-hydroxypropane-1,2,3-tricarboxylic acid;2-hydroxypropane-1,2,3-tricarboxylic acid Chemical compound OC(=O)C(O)C(C(O)=O)CC(O)=O.OC(=O)CC(O)(C(O)=O)CC(O)=O YDZFYKJFTOMLMS-UHFFFAOYSA-N 0.000 description 1
- FIYQGZWUDCJKNO-UHFFFAOYSA-N 2-oxobutanedioic acid Chemical compound OC(=O)CC(=O)C(O)=O.OC(=O)CC(=O)C(O)=O FIYQGZWUDCJKNO-UHFFFAOYSA-N 0.000 description 1
- FECNVDHIIJYRIA-UHFFFAOYSA-N 2-oxopentanedioic acid Chemical compound OC(=O)CCC(=O)C(O)=O.OC(=O)CCC(=O)C(O)=O FECNVDHIIJYRIA-UHFFFAOYSA-N 0.000 description 1
- 229920002972 Acrylic fiber Polymers 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101100215147 Caenorhabditis elegans aco-1 gene Proteins 0.000 description 1
- 241000588917 Citrobacter koseri Species 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108700034430 EC 4.1.1.38 Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241000212961 Helicobasidium Species 0.000 description 1
- 241000531392 Helicobasidium mompa Species 0.000 description 1
- 101100112138 Mesembryanthemum crystallinum PPCA gene Proteins 0.000 description 1
- 241001661345 Moesziomyces antarcticus Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 101150012928 PPC1 gene Proteins 0.000 description 1
- 108090000472 Phosphoenolpyruvate carboxykinase (ATP) Proteins 0.000 description 1
- 108090000645 Phosphoenolpyruvate carboxykinase (GTP) Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 101100028851 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PCK1 gene Proteins 0.000 description 1
- 241000168254 Siro Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- GTZCVFVGUGFEME-IWQZZHSRSA-N cis-aconitic acid Chemical compound OC(=O)C\C(C(O)=O)=C\C(O)=O GTZCVFVGUGFEME-IWQZZHSRSA-N 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- CSRCBLMBBOJYEX-UHFFFAOYSA-M sodium;2-morpholin-4-ylethanesulfonic acid;hydroxide Chemical compound [OH-].[Na+].OS(=O)(=O)CCN1CCOCC1 CSRCBLMBBOJYEX-UHFFFAOYSA-M 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Enzymes And Modification Thereof (AREA)
Abstract
一种融合多肽、编码它的核酸分子以及使用它产生衣康酸的方法。本发明涉及一种融合多肽,其包含乌头酸酶(aconitase,Aco)与顺式乌头酸脱羧酶(cis-aconitic acid decarboxylase,CAD)。本发明也描述了表达此融合多肽的经基因修饰的细胞,与使用此细胞的方法。
Description
技术领域
本发明涉及用以在细胞中产生衣康酸的重组酶系统。
背景技术
在化学产业中高度需求的衣康酸(Itaconate)为一前驱物化合物,通常用于各种产物的制造,如亚克力纤维、橡胶、人工钻石与透镜(lens)。特定的丝状真菌(例如,黑穗病菌属(Ustilago)、紫纹羽病菌属(Helicobasidium)与曲菌属(Aspergillus))将单糖类转化成此化合物。目前,衣康酸的工业生产主要仰赖以天然衣康酸生产菌株—例如土曲菌(Aspergillus terreus)—进行发酵。土曲菌生长缓慢且于其孢子形成阶段不产生衣康酸。因此,亟需一种以高产量来产生衣康酸的方法。
发明内容
本发明描述一种包含乌头酸酶(aconitase,Aco)与顺式乌头酸脱羧酶(cis-aconitic acid decarboxylase,CAD)的融合多肽,以及编码此多肽的核酸分子。此多肽显示出乌头酸酶活性与顺式乌头酸脱羧酶活性。
本发明也描述了表达此融合多肽的经基因修饰的细胞。此类细胞通过在允许融合多肽表达与衣康酸产生的条件下培养细胞,可用来产生衣康酸。
下文结合附图与说明提及一或多个实施例的细节。实施例的其它特征、目的与优点,从说明书与附图,以及从权利要求书中是明显的。
附图说明
图1A与图1B。于大肠杆菌(Escherichia coli)细胞中的衣康酸的生物合成。图1A:通过乌头酸酶(Aco)与顺式乌头酸脱羧酶(CAD)所催化的反应分别以方框与椭圆框所标示。图1B:乌头酸酶A(AcnA)、乌头酸酶B(AcnB)(来自大肠杆菌)与顺式乌头酸脱羧酶(来自土曲菌)对于柠檬酸(citrate)与顺式乌头酸(cis-aconitate)的Km值列于表中。
图2。cad-aco融合基因的基础编排与用来克隆这些基因的PCR策略。位于接头区域的内部XbaI切割位点(cutting site)被用来将两种的PCR-1与PCR-2片段连接在一起。外面的KpnI与HindIII切割位点(以方框标出)被用来插入pSA40a在此载体上的对应位。以单一连接反应将所有3个片段连接在一起。
图3A与图3B。在携带不同cad-aco融合体或cad与aco基因的菌株中,衣康酸(图3A)与顺式乌头酸(图3B)的产量的比较。这些菌株全部以相同的宿主,大肠杆菌SY403K为基础。于各菌株中所携带的载体列于括号中。
图4。在被提供过量的柠檬酸的不同菌株中,衣康酸与顺式乌头酸的产生的比较。这些菌株以相同的宿主,大肠杆菌SY403K为基础。两个质粒被包含于细胞中,pPC6,用以过量提供柠檬酸,而用以测试功能的质粒,则列于括号中。
图5A与图5B。在被提供过量的柠檬酸的不同菌株中,衣康酸(图5A)与顺式乌头酸(图5B)的产生的比较。这些菌株以相同的宿主,大肠杆菌PCI400*为基础,且携带两个质粒,pPC6与用以测试功能的质粒(列于括号中)。
图6A与图6B。在被提供过量的柠檬酸且被表达个别的顺式乌头酸脱羧酶的不同菌株中,衣康酸(图6A)与顺式乌头酸(图6B)的产生的比较。这些菌株以相同的宿主,大肠杆菌PCI400*为基础,且携带三个质粒,pPC1、pPC6与用以测试功能的质粒(列于括号中)。
图7A与图7B。在不同测试菌株中,衣康酸(图7A)与顺式乌头酸(图7B)的产生的比较。这些菌株以相同的宿主,大肠杆菌PCI400*为基础。
图8。在被提供过量的柠檬酸的不同菌株中,衣康酸与顺式乌头酸的产生的比较。这些菌株以相同的宿主,大肠杆菌SY403K为基础,且携带两个质粒,pPC6与用以测试功能的质粒(列于括号中)。
具体实施方式
在下文详细叙述中,为了说明目的,提及多个特定细节以提供所揭露的实施例的彻底了解。然而,明显的是,可实施一或多个实施例而不须这些细节。在其它例子中,为了简化附图,概要地显示熟知的结构或装置。
在真核或原核宿主中,衣康酸的生物合成需要两种酶,乌头酸酶(aconitase,Aco)与顺式乌头酸脱羧酶(cis-aconitic acid decarboxylase,CAD),以用于将柠檬酸(citrate)转化为衣康酸的两个依序反应。柠檬酸首先通过乌头酸酶被转化为顺式乌头酸。所产生的顺式乌头酸通过顺式乌头酸脱羧酶更进一步被转化为衣康酸,随着释放一分子的CO2(图1)。如于此所使用,用语“衣康酸(itaconate)”与“衣康酸(itaconic acid)”可被替换地使用。
非预期地发现,表达包含乌头酸酶与顺式乌头酸脱羧酶的融合多肽的细胞,产生高程度的衣康酸。
因此,于此所描述为一融合多肽,其包含乌头酸酶与顺式乌头酸脱羧酶。
于此所使用的用语“顺式乌头酸脱羧酶(cis-aconitate decarboxylase)”或“CAD”意指任何自然发生的顺式乌头酸脱羧酶(例如,于Dwiarti et al.,J.Bioscience and Bioengineering, 94(1):29-33, 2002 与WO 2009/014437中所描述的土曲菌顺式乌头酸脱羧酶)及其功能性等同物。例如,顺式乌头酸脱羧酶包括于US Patent No. 8,338,158中所描述的突变的土曲菌顺式乌头酸脱羧酶。于以下所提供的是一示范的土曲菌顺式乌头酸脱羧酶的核苷酸序列(SEQID No:1)与一氨基酸序列(SEQ ID No:2):
atgaccaagcagtctgctgattccaacgcgaagtctggtgtgacctctgagatctgtcac
M T K Q S A D S N A K S G V T S E I C H
tgggcgtctaatctcgccactgatgatatcccgagcgacgttctggagcgtgcaaaatac
W A S N L A T D D I P S D V L E R A K Y
ctgatcctggatggtatcgcgtgcgcgtgggtaggtgctcgtgtcccatggtctgaaaaa
L I L D G I A C A W V G A R V P W S E K
tacgttcaagcgaccatgtctttcgaacctccgggtgcgtgtcgtgtcatcggttacggc
Y V Q A T M S F E P P G A C R V I G Y G
cagaaactgggtccggtagcggctgccatgacgaactctgcatttattcaggcgaccgaa
Q K L G P V A A A M T N S A F I Q A T E
ctcgatgactatcactctgaagcgccgctgcattccgcgtctatcgttctcccggcagtt
L D D Y H S E A P L H S A S I V L P A V
ttcgcggcgagcgaagtactggccgaacagggtaaaaccatctctggtattgacgtgatt
F A A S E V L A E Q G K T I S G I D V I
ctggctgcgatcgttggtttcgagagcggtcctcgcatcggcaaagcgatctacggttct
L A A I V G F E S G P R I G K A I Y G S
gacctcctgaacaacggctggcactgcggtgcggtatatggcgcaccggctggtgcgctc
D L L N N G W H C G A V Y G A P A G A L
gcaactggtaagctcctgggcctcacgccggacagcatggaagatgcactgggtattgcc
A T G K L L G L T P D S M E D A L G I A
tgcacgcaagcatgcggcctcatgtccgcgcagtatggtggcatggttaaacgtgttcag
C T Q A C G L M S A Q Y G G M V K R V Q
cacggtttcgcagcgcgtaatggtctcctcggtggcctcctggctcacggcggctacgag
H G F A A R N G L L G G L L A H G G Y E
gcgatgaaaggtgttctcgagcgttcttacggtggcttcctgaagatgttcaccaagggc
A M K G V L E R S Y G G F L K M F T K G
aacggtcgtgaaccgccgtacaaagaagaagaggttgtggctggtctgggtagcttctgg
N G R E P P Y K E E E V V A G L G S F W
cacaccttcaccattcgtatcaaactgtacgcgtgctgcggtctcgtacacggtcctgtt
H T F T I R I K L Y A C C G L V H G P V
gaagccattgaaaacctccagggtcgttacccggaactgctcaatcgtgctaacctgtct
E A I E N L Q G R Y P E L L N R A N L S
aacatccgccacgttcacgtacaactctctaccgcgagcaactcccactgtggttggatc
N I R H V H V Q L S T A S N S H C G W I
ccagaagagcgcccaatctcttctatcgcgggtcaaatgtctgtcgcatatatcctcgcc
P E E R P I S S I A G Q M S V A Y I L A
gttcagctcgttgaccaacagtgtctgctcagccagttctccgagtttgacgataatctg
V Q L V D Q Q C L L S Q F S E F D D N L
gaacgcccggaagtgtgggacctggcacgtaaggttaccagctctcaatctgaggagttc
E R P E V W D L A R K V T S S Q S E E F
gaccaggacggtaactgtctctctgccggtcgcgtccgtattgagttcaacgacggctcc
D Q D G N C L S A G R V R I E F N D G S
tccatcaccgaatccgttgagaagccgctcggtgtaaaggaaccaatgccaaatgaacgc
S I T E S V E K P L G V K E P M P N E R
atcctgcacaaataccgtaccctggcgggttctgtaacggacgaaagccgtgttaaggag
I L H K Y R T L A G S V T D E S R V K E
atcgaggatctcgtgctcggcctggaccgtctgaccgatattagcccgctcctcgagctg
I E D L V L G L D R L T D I S P L L E L
Ctgaattgtccggttaaatccccactggtttaa
L N C P V K S P L V -
于此所使用的用语“乌头酸酶(aconitase)”或“Aco”意指任何自然发生的顺式乌头酸脱羧酶及其功能性等同物,包括,但不限于,自然发生的土曲菌与大肠杆菌乌头酸酶与其变体。于以下所提供的是大肠杆菌乌头酸酶A(由acnA基因所编码)与乌头酸酶B(由acnB基因所编码)的核苷酸序列与氨基酸序列:
一大肠杆菌乌头酸酶A的核酸序列(SEQ ID No:3)与氨基酸序列(SEQ ID No:4)
乌头酸酶A
atgtcgtcaaccctacgagaagccagtaaggacacgttgcaggccaaagataaaacttac
M S S T L R E A S K D T L Q A K D K T Y
cactactacagcctgccgcttgctgctaaatcactgggcgatatcacccgtctacccaag
H Y Y S L P L A A K S L G D I T R L P K
tcactcaaagttttgctcgaaaacctgctgcgctggcaggatggtaactcggttaccgaa
S L K V L L E N L L R W Q D G N S V T E
gaggatatccacgcgctggcaggatggctgaaaaatgcccatgctgaccgtgaaattgcc
E D I H A L A G W L K N A H A D R E I A
taccgcccggcaagggtgctgatgcaggactttaccggcgtacctgccgttgttgatctg
Y R P A R V L M Q D F T G V P A V V D L
gcggcaatgcgcgaagcggttaaacgcctcggcggcgatactgcaaaggttaacccgctc
A A M R E A V K R L G G D T A K V N P L
tcaccggtcgacctggtcattgaccactcggtgaccgtcgatcgttttggtgatgatgag
S P V D L V I D H S V T V D R F G D D E
gcatttgaagaaaacgtacgcctggaaatggagcgcaaccacgaacgttatgtgttcctg
A F E E N V R L E M E R N H E R Y V F L
aaatggggaaagcaagcgttcagtcggtttagcgtcgtgccgccaggcacaggcatttgc
K W G K Q A F S R F S V V P P G T G I C
catcaggttaacctcgaatatctcggcaaagcagtgtggagtgaattgcaggacggtgaa
H Q V N L E Y L G K A V W S E L Q D G E
tggattgcttatccggatacactcgttggtactgactcgcacaccaccatgatcaacggc
W I A Y P D T L V G T D S H T T M I N G
cttggcgtgctggggtggggcgttggtgggatcgaagcagaagccgcaatgttaggccag
L G V L G W G V G G I E A E A A M L G Q
ccggtttccatgcttatcccggatgtagtgggcttcaaacttaccggaaaattacgtgaa
P V S M L I P D V V G F K L T G K L R E
ggtattaccgccacagacctggttctcactgttacccaaatgctgcgcaaacatggcgtg
G I T A T D L V L T V T Q M L R K H G V
gtggggaaattcgtcgaattttatggtgatggtctggattcactaccgttggcggatcgc
V G K F V E F Y G D G L D S L P L A D R
gccaccattgccaatatgtcgccagaatatggtgccacctgtggcttcttcccaatcgat
A T I A N M S P E Y G A T C G F F P I D
gctgtaaccctcgattacatgcgtttaagcgggcgcagcgaagatcaggtcgagttggtc
A V T L D Y M R L S G R S E D Q V E L V
gaaaaatatgccaaagcgcagggcatgtggcgtaacccgggcgatgaaccaatttttacc
E K Y A K A Q G M W R N P G D E P I F T
agtacgttagaactggatatgaatgacgttgaagcgagcctggcagggcctaaacgccca
S T L E L D M N D V E A S L A G P K R P
caggatcgcgttgcactgcccgatgtaccaaaagcatttgccgccagtaacgaactggaa
Q D R V A L P D V P K A F A A S N E L E
gtgaatgccacgcataaagatcgccagccggtcgattatgttatgaacggacatcagtat
V N A T H K D R Q P V D Y V M N G H Q Y
cagttacctgatggcgctgtggtcattgctgcgataacctcgtgcaccaacacctctaac
Q L P D G A V V I A A I T S C T N T S N
ccaagtgtgctgatggccgcaggcttgctggcgaaaaaagccgtaactctgggcctcaag
P S V L M A A G L L A K K A V T L G L K
cggcaaccatgggtcaaagcgtcgctggcaccgggttcgaaagtcgtttctgattatctg
R Q P W V K A S L A P G S K V V S D Y L
gcaaaagcgaaactgacaccgtatctcgacgaactggggtttaaccttgtgggatacggt
A K A K L T P Y L D E L G F N L V G Y G
tgtaccacctgtattggtaactctgggccgctgcccgatcctatcgaaacggcaatcaaa
C T T C I G N S G P L P D P I E T A I K
aaaagcgatttaaccgtcggtgcggtgctgtccggcaaccgtaactttgaaggccgtatc
K S D L T V G A V L S G N R N F E G R I
catccgctggttaaaactaactggctggcctcgccgccgctggtggttgcctatgcgctg
H P L V K T N W L A S P P L V V A Y A L
gcgggaaatatgaatatcaacctggcttctgagcctatcggccatgatcgcaaaggcgat
A G N M N I N L A S E P I G H D R K G D
ccggtttatctgaaagatatctggccatcggcacaagaaattgcccgtgcggtagaacaa
P V Y L K D I W P S A Q E I A R A V E Q
gtctccacagaaatgttccgcaaagagtacgcagaagtttttgaaggcacagcagagtgg
V S T E M F R K E Y A E V F E G T A E W
aagggaattaacgtcacacgatccgatacctacggttggcaggaggactcaacctatatt
K G I N V T R S D T Y G W Q E D S T Y I
cgcttatcgcctttctttgatgaaatgcaggcaacaccagcaccagtggaagatattcac
R L S P F F D E M Q A T P A P V E D I H
ggtgcgcggatcctcgcaatgctgggggattcagtcaccactgaccatatctctccggcg
G A R I L A M L G D S V T T D H I S P A
ggcagtattaagcccgacagcccagcgggtcgatatctacaaggtcggggtgttgagcga
G S I K P D S P A G R Y L Q G R G V E R
aaagactttaactcctacggttcgcggcgtggtaaccatgaagtgatgatgcgcggcacc
K D F N S Y G S R R G N H E V M M R G T
ttcgccaatattcgcatccgtaatgaaatggtgcctggcgttgaaggggggatgacgcgg
F A N I R I R N E M V P G V E G G M T R
catttacctgacagcgacgtagtctctatttatgatgctgcgatgcgctataagcaggag
H L P D S D V V S I Y D A A M R Y K Q E
caaacgccgctggcggtgattgccgggaaagagtatggatcaggctccagtcgtgactgg
Q T P L A V I A G K E Y G S G S S R D W
gcggcaaaaggtccgcgtctgcttggtattcgtgtggtgattgccgaatcgtttgaacga
A A K G P R L L G I R V V I A E S F E R
attcaccgttcgaatttaattggcatgggcatcctgccgctggaatttccgcaaggcgta
I H R S N L I G M G I L P L E F P Q G V
acgcgtaaaacgttagggctaaccggggaagagaagattgatattggcgatctgcaaaac
T R K T L G L T G E E K I D I G D L Q N
ctacaacccggcgcgacggttccggtgacgcttacgcgcgcggatggtagccaggaagtc
L Q P G A T V P V T L T R A D G S Q E V
gtaccctgccgttgtcgtatcgacaccgcgacggagttgacctactaccagaacgacggc
V P C R C R I D T A T E L T Y Y Q N D G
attttgcattatgtcattcgtaatatgttgaagtaa
I L H Y V I R N M L K -
一大肠杆菌乌头酸酶B的核酸序列(SEQ ID No:5)与氨基酸序列(SEQ ID No:6)
乌头酸酶B
atgctagaagaataccgtaagcacgtagctgagcgtgccgctgaggggattgcgcccaaa
M L E E Y R K H V A E R A A E G I A P K
cccctggatgcaaaccaaatggccgcacttgtagagctgctgaaaaacccgcccgcgggc
P L D A N Q M A A L V E L L K N P P A G
gaagaagaattcctgttagatctgttaaccaaccgtgttcccccaggcgtcgatgaagcc
E E E F L L D L L T N R V P P G V D E A
gcctatgtcaaagcaggcttcctggctgctatcgcgaaaggcgaagccaaatcccctctg
A Y V K A G F L A A I A K G E A K S P L
ctgactccggaaaaagccatcgaactgctgggcaccatgcagggtggttacaacattcat
L T P E K A I E L L G T M Q G G Y N I H
ccgctgatcgacgcgctggatgatgccaaactggcacctattgctgccaaagcactttct
P L I D A L D D A K L A P I A A K A L S
cacacgctgctgatgttcgataacttctatgacgtagaagagaaagcgaaagcaggcaac
H T L L M F D N F Y D V E E K A K A G N
gaatatgcgaagcaggttatgcagtcctgggcggatgccgaatggttcctgaatcgcccg
E Y A K Q V M Q S W A D A E W F L N R P
gcgctggctgaaaaactgaccgttactgtcttcaaagtcactggcgaaactaacaccgat
A L A E K L T V T V F K V T G E T N T D
gacctttctccggcaccggatgcgtggtcacgcccggatatcccactgcacgcgctggcg
D L S P A P D A W S R P D I P L H A L A
atgctgaaaaacgcccgtgaaggtattgagccagaccagcctggtgttgttggtccgatc
M L K N A R E G I E P D Q P G V V G P I
aagcaaatcgaagctctgcaacagaaaggtttcccgctggcgtacgtcggtgacgttgtg
K Q I E A L Q Q K G F P L A Y V G D V V
ggtacgggttcttcgcgtaaatccgccactaactccgttctgtggtttatgggcgatgat
G T G S S R K S A T N S V L W F M G D D
attccacatgtgccgaacaaacgcggcggtggtttgtgcctcggcggtaaaattgcaccc
I P H V P N K R G G G L C L G G K I A P
atcttctttaacacgatggaagacgcgggtgcactgccaatcgaagtcgacgtctctaac
I F F N T M E D A G A L P I E V D V S N
ctgaacatgggcgacgtgattgacgtttacccgtacaaaggtgaagtgcgtaaccacgaa
L N M G D V I D V Y P Y K G E V R N H E
accggcgaactgctggcgaccttcgaactgaaaaccgacgtgctgattgatgaagtgcgt
T G E L L A T F E L K T D V L I D E V R
gctggtggccgtattccgctgattatcgggcgtggcctgaccaccaaagcgcgtgaagca
A G G R I P L I I G R G L T T K A R E A
cttggtctgccgcacagtgatgtgttccgtcaggcgaaagatgtcgctgagagcgatcgc
L G L P H S D V F R Q A K D V A E S D R
ggcttctcgctggcgcaaaaaatggtaggccgtgcctgtggcgtgaaaggcattcgtccg
G F S L A Q K M V G R A C G V K G I R P
ggcgcgtactgtgaaccgaaaatgacttctgtaggttcccaggacaccaccggcccgatg
G A Y C E P K M T S V G S Q D T T G P M
acccgtgatgaactgaaagacctggcgtgcctgggcttctcggctgacctggtgatgcag
T R D E L K D L A C L G F S A D L V M Q
tctttctgccacaccgcggcgtatccgaagccagttgacgtgaacacgcaccacacgctg
S F C H T A A Y P K P V D V N T H H T L
ccggacttcattatgaaccgtggcggtgtgtcgctgcgtccgggtgacggcgtcattcac
P D F I M N R G G V S L R P G D G V I H
tcctggctgaaccgtatgctgctgccggataccgtcggtaccggtggtgactcccatacc
S W L N R M L L P D T V G T G G D S H T
cgtttcccgatcggtatctctttcccggcgggttctggtctggtggcgtttgctgccgca
R F P I G I S F P A G S G L V A F A A A
actggcgtaatgccgcttgatatgccggaatccgttctggtgcgcttcaaaggcaaaatg
T G V M P L D M P E S V L V R F K G K M
cagccgggcatcaccctgcgcgatctggtacacgctattccgctgtatgcgatcaaacaa
Q P G I T L R D L V H A I P L Y A I K Q
ggtctgctgaccgttgagaagaaaggcaagaaaaacatcttctctggccgcatcctggaa
G L L T V E K K G K K N I F S G R I L E
attgaaggtctgccggatctgaaagttgagcaggcctttgagctaaccgatgcgtccgcc
I E G L P D L K V E Q A F E L T D A S A
gagcgttctgccgctggttgtaccatcaagctgaacaaagaaccgatcatcgaatacctg
E R S A A G C T I K L N K E P I I E Y L
aactctaacatcgtcctgctgaagtggatgatcgcggaaggttacggcgatcgtcgtacc
N S N I V L L K W M I A E G Y G D R R T
ctggaacgtcgtattcagggcatggaaaaatggctggcgaatcctgagctgctggaagcc
L E R R I Q G M E K W L A N P E L L E A
gatgcagatgcggaatacgcggcagtgatcgacatcgatctggcggatattaaagagcca
D A D A E Y A A V I D I D L A D I K E P
atcctgtgtgctccgaacgacccggatgacgcgcgtccgctgtctgcggtacagggtgag
I L C A P N D P D D A R P L S A V Q G E
aagatcgacgaagtgtttatcggttcctgcatgaccaacatcggtcacttccgtgctgcg
K I D E V F I G S C M T N I G H F R A A
ggtaaactgctggatgcgcataaaggtcagttgccgacccgcctgtgggtggcaccgcca
G K L L D A H K G Q L P T R L W V A P P
acccgtatggacgccgcacagttgaccgaagaaggctactacagcgtcttcggtaagagt
T R M D A A Q L T E E G Y Y S V F G K S
ggtgcgcgtatcgagatccctggctgttccctgtgtatgggtaaccaggcgcgtgtggcg
G A R I E I P G C S L C M G N Q A R V A
gacggtgcaacggtggtttccacctctacccgtaacttcccgaaccgtctgggtactggc
D G A T V V S T S T R N F P N R L G T G
gcgaatgtcttcctggcttctgcggaactggcggctgttgcggcgctgattggcaaactg
A N V F L A S A E L A A V A A L I G K L
ccgacgccggaagagtaccagacctacgtggcgcaggtagataaaacagccgttgatact
P T P E E Y Q T Y V A Q V D K T A V D T
taccgttatctgaacttcaaccagctttctcagtacaccgagaaagccgatggggtgatt
Y R Y L N F N Q L S Q Y T E K A D G V I
ttccagactgcggtttaa
F Q T A V -
例如,顺式乌头酸脱羧酶可位于多肽的N端。在一实施例中,乌头酸酶与顺式乌头酸脱羧酶通过接头来连接,而接头具有,例如1-200个氨基酸。接头可为EFGPGPGPGPGPLEVLFQGPGRAKL(SEQ ID No:7)。
于以下所显示的是示范的融合多肽的氨基酸序列与编码出此多肽的核酸序列:
顺式乌头酸脱羧酶-接头-乌头酸酶A的核酸序列(SEQ ID No:8)与氨基酸序列(SEQ ID No:9)
atgaccaagcagtctgctgattccaacgcgaagtctggtgtgacctctgagatctgtcac
M T K Q S A D S N A K S G V T S E I C H
tgggcgtctaatctcgccactgatgatatcccgagcgacgttctggagcgtgcaaaatac
W A S N L A T D D I P S D V L E R A K Y
Ctgatcctggatggtatcgcgtgcgcgtgggtaggtgctcgtgtcccatggtctgaaaaa
L I L D G I A C A W V G A R V P W S E K
tacgttcaagcgaccatgtctttcgaacctccgggtgcgtgtcgtgtcatcggttacggc
Y V Q A T M S F E P P G A C R V I G Y G
cagaaactgggtccggtagcggctgccatgacgaactctgcatttattcaggcgaccgaa
Q K L G P V A A A M T N S A F I Q A T E
ctcgatgactatcactctgaagcgccgctgcattccgcgtctatcgttctcccggcagtt
L D D Y H S E A P L H S A S I V L P A V
ttcgcggcgagcgaagtactggccgaacagggtaaaaccatctctggtattgacgtgatt
F A A S E V L A E Q G K T I S G I D V I
ctggctgcgatcgttggtttcgagagcggtcctcgcatcggcaaagcgatctacggttct
L A A I V G F E S G P R I G K A I Y G S
gacctcctgaacaacggctggcactgcggtgcggtatatggcgcaccggctggtgcgctc
D L L N N G W H C G A V Y G A P A G A L
gcaactggtaagctcctgggcctcacgccggacagcatggaagatgcactgggtattgcc
A T G K L L G L T P D S M E D A L G I A
tgcacgcaagcatgcggcctcatgtccgcgcagtatggtggcatggttaaacgtgttcag
C T Q A C G L M S A Q Y G G M V K R V Q
cacggtttcgcagcgcgtaatggtctcctcggtggcctcctggctcacggcggctacgag
H G F A A R N G L L G G L L A H G G Y E
gcgatgaaaggtgttctcgagcgttcttacggtggcttcctgaagatgttcaccaagggc
A M K G V L E R S Y G G F L K M F T K G
aacggtcgtgaaccgccgtacaaagaagaagaggttgtggctggtctgggtagcttctgg
N G R E P P Y K E E E V V A G L G S F W
cacaccttcaccattcgtatcaaactgtacgcgtgctgcggtctcgtacacggtcctgtt
H T F T I R I K L Y A C C G L V H G P V
gaagccattgaaaacctccagggtcgttacccggaactgctcaatcgtgctaacctgtct
E A I E N L Q G R Y P E L L N R A N L S
aacatccgccacgttcacgtacaactctctaccgcgagcaactcccactgtggttggatc
N I R H V H V Q L S T A S N S H C G W I
ccagaagagcgcccaatctcttctatcgcgggtcaaatgtctgtcgcatatatcctcgcc
P E E R P I S S I A G Q M S V A Y I L A
gttcagctcgttgaccaacagtgtctgctcagccagttctccgagtttgacgataatctg
V Q L V D Q Q C L L S Q F S E F D D N L
gaacgcccggaagtgtgggacctggcacgtaaggttaccagctctcaatctgaggagttc
E R P E V W D L A R K V T S S Q S E E F
gaccaggacggtaactgtctctctgccggtcgcgtccgtattgagttcaacgacggctcc
D Q D G N C L S A G R V R I E F N D G S
tccatcaccgaatccgttgagaagccgctcggtgtaaaggaaccaatgccaaatgaacgc
S I T E S V E K P L G V K E P M P N E R
atcctgcacaaataccgtaccctggcgggttctgtaacggacgaaagccgtgttaaggag
I L H K Y R T L A G S V T D E S R V K E
atcgaggatctcgtgctcggcctggaccgtctgaccgatattagcccgctcctcgagctg
I E D L V L G L D R L T D I S P L L E L
ctgaattgtccggttaaatccccactgggtattgaatttggtccgggtccaggtcctggt
L N C P V K S P L G I E F G P G P G P G
cctggccctctagaagtgttgttccaaggtcctggtcgtgcgaaactcatgtcgtcaacc
P G P L E V L F Q G P G R A K L M S S T
ctacgagaagccagtaaggacacgttgcaggccaaagataaaacttaccactactacagc
L R E A S K D T L Q A K D K T Y H Y Y S
ctgccgcttgctgctaaatcactgggcgatatcacccgtctacccaagtcactcaaagtt
L P L A A K S L G D I T R L P K S L K V
ttgctcgaaaacctgctgcgctggcaggatggtaactcggttaccgaagaggatatccac
L L E N L L R W Q D G N S V T E E D I H
gcgctggcaggatggctgaaaaatgcccatgctgaccgtgaaattgcctaccgcccggca
A L A G W L K N A H A D R E I A Y R P A
agggtgctgatgcaggactttaccggcgtacctgccgttgttgatctggcggcaatgcgc
R V L M Q D F T G V P A V V D L A A M R
gaagcggttaaacgcctcggcggcgatactgcaaaggttaacccgctctcaccggtcgac
E A V K R L G G D T A K V N P L S P V D
ctggtcattgaccactcggtgaccgtcgatcgttttggtgatgatgaggcatttgaagaa
L V I D H S V T V D R F G D D E A F E E
aacgtacgcctggaaatggagcgcaaccacgaacgttatgtgttcctgaaatggggaaag
N V R L E M E R N H E R Y V F L K W G K
caagcgttcagtcggtttagcgtcgtgccgccaggcacaggcatttgccatcaggttaac
Q A F S R F S V V P P G T G I C H Q V N
ctcgaatatctcggcaaagcagtgtggagtgaattgcaggacggtgaatggattgcttat
L E Y L G K A V W S E L Q D G E W I A Y
ccggatacactcgttggtactgactcgcacaccaccatgatcaacggccttggcgtgctg
P D T L V G T D S H T T M I N G L G V L
gggtggggcgttggtgggatcgaagcagaagccgcaatgttaggccagccggtttccatg
G W G V G G I E A E A A M L G Q P V S M
cttatcccggatgtagtgggcttcaaacttaccggaaaattacgtgaaggtattaccgcc
L I P D V V G F K L T G K L R E G I T A
acagacctggttctcactgttacccaaatgctgcgcaaacatggcgtggtggggaaattc
T D L V L T V T Q M L R K H G V V G K F
gtcgaattttatggtgatggtctggattcactaccgttggcggatcgcgccaccattgcc
V E F Y G D G L D S L P L A D R A T I A
aatatgtcgccagaatatggtgccacctgtggcttcttcccaatcgatgctgtaaccctc
N M S P E Y G A T C G F F P I D A V T L
gattacatgcgtttaagcgggcgcagcgaagatcaggtcgagttggtcgaaaaatatgcc
D Y M R L S G R S E D Q V E L V E K Y A
aaagcgcagggcatgtggcgtaacccgggcgatgaaccaatttttaccagtacgttagaa
K A Q G M W R N P G D E P I F T S T L E
ctggatatgaatgacgttgaagcgagcctggcagggcctaaacgcccacaggatcgcgtt
L D M N D V E A S L A G P K R P Q D R V
gcactgcccgatgtaccaaaagcatttgccgccagtaacgaactggaagtgaatgccacg
A L P D V P K A F A A S N E L E V N A T
cataaagatcgccagccggtcgattatgttatgaacggacatcagtatcagttacctgat
H K D R Q P V D Y V M N G H Q Y Q L P D
ggcgctgtggtcattgctgcgataacctcgtgcaccaacacctctaacccaagtgtgctg
G A V V I A A I T S C T N T S N P S V L
atggccgcaggcttgctggcgaaaaaagccgtaactctgggcctcaagcggcaaccatgg
.M A A G L L A K K A V T L G L K R Q P W
gtcaaagcgtcgctggcaccgggttcgaaagtcgtttctgattatctggcaaaagcgaaa
V K A S L A P G S K V V S D Y L A K A K
ctgacaccgtatctcgacgaactggggtttaaccttgtgggatacggttgtaccacctgt
L T P Y L D E L G F N L V G Y G C T T C
attggtaactctgggccgctgcccgatcctatcgaaacggcaatcaaaaaaagcgattta
I G N S G P L P D P I E T A I K K S D L
accgtcggtgcggtgctgtccggcaaccgtaactttgaaggccgtatccatccgctggtt
T V G A V L S G N R N F E G R I H P L V
aaaactaactggctggcctcgccgccgctggtggttgcctatgcgctggcgggaaatatg
K T N W L A S P P L V V A Y A L A G N M
aatatcaacctggcttctgagcctatcggccatgatcgcaaaggcgatccggtttatctg
N I N L A S E P I G H D R K G D P V Y L
aaagatatctggccatcggcacaagaaattgcccgtgcggtagaacaagtctccacagaa
K D I W P S A Q E I A R A V E Q V S T E
atgttccgcaaagagtacgcagaagtttttgaaggcacagcagagtggaagggaattaac
M F R K E Y A E V F E G T A E W K G I N
gtcacacgatccgatacctacggttggcaggaggactcaacctatattcgcttatcgcct
V T R S D T Y G W Q E D S T Y I R L S P
ttctttgatgaaatgcaggcaacaccagcaccagtggaagatattcacggtgcgcggatc
F F D E M Q A T P A P V E D I H G A R I
ctcgcaatgctgggggattcagtcaccactgaccatatctctccggcgggcagtattaag
L A M L G D S V T T D H I S P A G S I K
cccgacagcccagcgggtcgatatctacaaggtcggggtgttgagcgaaaagactttaac
P D S P A G R Y L Q G R G V E R K D F N
tcctacggttcgcggcgtggtaaccatgaagtgatgatgcgcggcaccttcgccaatatt
S Y G S R R G N H E V M M R G T F A N I
cgcatccgtaatgaaatggtgcctggcgttgaaggggggatgacgcggcatttacctgac
R I R N E M V P G V E G G M T R H L P D
agcgacgtagtctctatttatgatgctgcgatgcgctataagcaggagcaaacgccgctg
S D V V S I Y D A A M R Y K Q E Q T P L
gcggtgattgccgggaaagagtatggatcaggctccagtcgtgactgggcggcaaaaggt
A V I A G K E Y G S G S S R D W A A K G
ccgcgtctgcttggtattcgtgtggtgattgccgaatcgtttgaacgaattcaccgttcg
P R L L G I R V V I A E S F E R I H R S
aatttaattggcatgggcatcctgccgctggaatttccgcaaggcgtaacgcgtaaaacg
N L I G M G I L P L E F P Q G V T R K T
ttagggctaaccggggaagagaagattgatattggcgatctgcaaaacctacaacccggc
L G L T G E E K I D I G D L Q N L Q P G
gcgacggttccggtgacgcttacgcgcgcggatggtagccaggaagtcgtaccctgccgt
A T V P V T L T R A D G S Q E V V P C R
tgtcgtatcgacaccgcgacggagttgacctactaccagaacgacggcattttgcattat
C R I D T A T E L T Y Y Q N D G I L H Y
gtcattcgtaatatgttgaagtaa
V I R N M L K *
顺式乌头酸脱羧酶-接头-乌头酸酶B的核酸序列(SEQ ID No:10)与氨基酸序列(SEQ ID No:11)。
atgaccaagcagtctgctgattccaacgcgaagtctggtgtgacctctgagatctgtcac
M T K Q S A D S N A K S G V T S E I C H
tgggcgtctaatctcgccactgatgatatcccgagcgacgttctggagcgtgcaaaatac
W A S N L A T D D I P S D V L E R A K Y
Ctgatcctggatggtatcgcgtgcgcgtgggtaggtgctcgtgtcccatggtctgaaaaa
L I L D G I A C A W V G A R V P W S E K
tacgttcaagcgaccatgtctttcgaacctccgggtgcgtgtcgtgtcatcggttacggc
Y V Q A T M S F E P P G A C R V I G Y G
cagaaactgggtccggtagcggctgccatgacgaactctgcatttattcaggcgaccgaa
Q K L G P V A A A M T N S A F I Q A T E
ctcgatgactatcactctgaagcgccgctgcattccgcgtctatcgttctcccggcagtt
L D D Y H S E A P L H S A S I V L P A V
ttcgcggcgagcgaagtactggccgaacagggtaaaaccatctctggtattgacgtgatt
F A A S E V L A E Q G K T I S G I D V I
ctggctgcgatcgttggtttcgagagcggtcctcgcatcggcaaagcgatctacggttct
L A A I V G F E S G P R I G K A I Y G S
gacctcctgaacaacggctggcactgcggtgcggtatatggcgcaccggctggtgcgctc
D L L N N G W H C G A V Y G A P A G A L
gcaactggtaagctcctgggcctcacgccggacagcatggaagatgcactgggtattgcc
A T G K L L G L T P D S M E D A L G I A
tgcacgcaagcatgcggcctcatgtccgcgcagtatggtggcatggttaaacgtgttcag
C T Q A C G L M S A Q Y G G M V K R V Q
cacggtttcgcagcgcgtaatggtctcctcggtggcctcctggctcacggcggctacgag
H G F A A R N G L L G G L L A H G G Y E
gcgatgaaaggtgttctcgagcgttcttacggtggcttcctgaagatgttcaccaagggc
A M K G V L E R S Y G G F L K M F T K G
aacggtcgtgaaccgccgtacaaagaagaagaggttgtggctggtctgggtagcttctgg
N G R E P P Y K E E E V V A G L G S F W
cacaccttcaccattcgtatcaaactgtacgcgtgctgcggtctcgtacacggtcctgtt
H T F T I R I K L Y A C C G L V H G P V
gaagccattgaaaacctccagggtcgttacccggaactgctcaatcgtgctaacctgtct
E A I E N L Q G R Y P E L L N R A N L S
aacatccgccacgttcacgtacaactctctaccgcgagcaactcccactgtggttggatc
N I R H V H V Q L S T A S N S H C G W I
ccagaagagcgcccaatctcttctatcgcgggtcaaatgtctgtcgcatatatcctcgcc
P E E R P I S S I A G Q M S V A Y I L A
gttcagctcgttgaccaacagtgtctgctcagccagttctccgagtttgacgataatctg
V Q L V D Q Q C L L S Q F S E F D D N L
gaacgcccggaagtgtgggacctggcacgtaaggttaccagctctcaatctgaggagttc
E R P E V W D L A R K V T S S Q S E E F
gaccaggacggtaactgtctctctgccggtcgcgtccgtattgagttcaacgacggctcc
D Q D G N C L S A G R V R I E F N D G S
tccatcaccgaatccgttgagaagccgctcggtgtaaaggaaccaatgccaaatgaacgc
S I T E S V E K P L G V K E P M P N E R
atcctgcacaaataccgtaccctggcgggttctgtaacggacgaaagccgtgttaaggag
I L H K Y R T L A G S V T D E S R V K E
atcgaggatctcgtgctcggcctggaccgtctgaccgatattagcccgctcctcgagctg
I E D L V L G L D R L T D I S P L L E L
ctgaattgtccggttaaatccccactgggtattgaatttggtccgggtccaggtcctggt
L N C P V K S P L G I E F G P G P G P G
cctggccctctagaagtgttgttccaaggtcctggtcgtgcgaaactcgtgctagaagaa
P G P L E V L F Q G P G R A K L V L E E
taccgtaagcacgtagctgagcgtgccgctgaggggattgcgcccaaacccctggatgca
Y R K H V A E R A A E G I A P K P L D A
aaccaaatggccgcacttgtagagctgctgaaaaacccgcccgcgggcgaagaagaattc
N Q M A A L V E L L K N P P A G E E E F
ctgttagatctgttaaccaaccgtgttcccccaggcgtcgatgaagccgcctatgtcaaa
L L D L L T N R V P P G V D E A A Y V K
gcaggcttcctggctgctatcgcgaaaggcgaagccaaatcccctctgctgactccggaa
A G F L A A I A K G E A K S P L L T P E
aaagccatcgaactgctgggcaccatgcagggtggttacaacattcatccgctgatcgac
K A I E L L G T M Q G G Y N I H P L I D
gcgctggatgatgccaaactggcacctattgctgccaaagcactttctcacacgctgctg
A L D D A K L A P I A A K A L S H T L L
atgttcgataacttctatgacgtagaagagaaagcgaaagcaggcaacgaatatgcgaag
M F D N F Y D V E E K A K A G N E Y A K
caggttatgcagtcctgggcggatgccgaatggttcctgaatcgcccggcgctggctgaa
Q V M Q S W A D A E W F L N R P A L A E
aaactgaccgttactgtcttcaaagtcactggcgaaactaacaccgatgacctttctccg
K L T V T V F K V T G E T N T D D L S P
gcaccggatgcgtggtcacgcccggatatcccactgcacgcgctggcgatgctgaaaaac
A P D A W S R P D I P L H A L A M L K N
gcccgtgaaggtattgagccagaccagcctggtgttgttggtccgatcaagcaaatcgaa
A R E G I E P D Q P G V V G P I K Q I E
gctctgcaacagaaaggtttcccgctggcgtacgtcggtgacgttgtgggtacgggttct
A L Q Q K G F P L A Y V G D V V G T G S
tcgcgtaaatccgccactaactccgttctgtggtttatgggcgatgatattccacatgtg
S R K S A T N S V L W F M G D D I P H V
ccgaacaaacgcggcggtggtttgtgcctcggcggtaaaattgcacccatcttctttaac
P N K R G G G L C L G G K I A P I F F N
acgatggaagacgcgggtgcactgccaatcgaagtcgacgtctctaacctgaacatgggc
T M E D A G A L P I E V D V S N L N M G
gacgtgattgacgtttacccgtacaaaggtgaagtgcgtaaccacgaaaccggcgaactg
D V I D V Y P Y K G E V R N H E T G E L
ctggcgaccttcgaactgaaaaccgacgtgctgattgatgaagtgcgtgctggtggccgt
L A T F E L K T D V L I D E V R A G G R
attccgctgattatcgggcgtggcctgaccaccaaagcgcgtgaagcacttggtctgccg
I P L I I G R G L T T K A R E A L G L P
cacagtgatgtgttccgtcaggcgaaagatgtcgctgagagcgatcgcggcttctcgctg
H S D V F R Q A K D V A E S D R G F S L
gcgcaaaaaatggtaggccgtgcctgtggcgtgaaaggcattcgtccgggcgcgtactgt
A Q K M V G R A C G V K G I R P G A Y C
gaaccgaaaatgacttctgtaggttcccaggacaccaccggcccgatgacccgtgatgaa
E P K M T S V G S Q D T T G P M T R D E
ctgaaagacctggcgtgcctgggcttctcggctgacctggtgatgcagtctttctgccac
L K D L A C L G F S A D L V M Q S F C H
accgcggcgtatccgaagccagttgacgtgaacacgcaccacacgctgccggacttcatt
T A A Y P K P V D V N T H H T L P D F I
atgaaccgtggcggtgtgtcgctgcgtccgggtgacggcgtcattcactcctggctgaac
M N R G G V S L R P G D G V I H S W L N
cgtatgctgctgccggataccgtcggtaccggtggtgactcccatacccgtttcccgatc
R M L L P D T V G T G G D S H T R F P I
ggtatctctttcccggcgggttctggtctggtggcgtttgctgccgcaactggcgtaatg
G I S F P A G S G L V A F A A A T G V M
ccgcttgatatgccggaatccgttctggtgcgcttcaaaggcaaaatgcagccgggcatc
P L D M P E S V L V R F K G K M Q P G I
accctgcgcgatctggtacacgctattccgctgtatgcgatcaaacaaggtctgctgacc
T L R D L V H A I P L Y A I K Q G L L T
gttgagaagaaaggcaagaaaaacatcttctctggccgcatcctggaaattgaaggtctg
V E K K G K K N I F S G R I L E I E G L
ccggatctgaaagttgagcaggcctttgagctaaccgatgcgtccgccgagcgttctgcc
P D L K V E Q A F E L T D A S A E R S A
gctggttgtaccatcaagctgaacaaagaaccgatcatcgaatacctgaactctaacatc
A G C T I K L N K E P I I E Y L N S N I
gtcctgctgaagtggatgatcgcggaaggttacggcgatcgtcgtaccctggaacgtcgt
V L L K W M I A E G Y G D R R T L E R R
attcagggcatggaaaaatggctggcgaatcctgagctgctggaagccgatgcagatgcg
I Q G M E K W L A N P E L L E A D A D A
gaatacgcggcagtgatcgacatcgatctggcggatattaaagagccaatcctgtgtgct
E Y A A V I D I D L A D I K E P I L C A
ccgaacgacccggatgacgcgcgtccgctgtctgcggtacagggtgagaagatcgacgaa
P N D P D D A R P L S A V Q G E K I D E
gtgtttatcggttcctgcatgaccaacatcggtcacttccgtgctgcgggtaaactgctg
V F I G S C M T N I G H F R A A G K L L
gatgcgcataaaggtcagttgccgacccgcctgtgggtggcaccgccaacccgtatggac
D A H K G Q L P T R L W V A P P T R M D
gccgcacagttgaccgaagaaggctactacagcgtcttcggtaagagtggtgcgcgtatc
A A Q L T E E G Y Y S V F G K S G A R I
gagatccctggctgttccctgtgtatgggtaaccaggcgcgtgtggcggacggtgcaacg
E I P G C S L C M G N Q A R V A D G A T
gtggtttccacctctacccgtaacttcccgaaccgtctgggtactggcgcgaatgtcttc
V V S T S T R N F P N R L G T G A N V F
ctggcttctgcggaactggcggctgttgcggcgctgattggcaaactgccgacgccggaa
L A S A E L A A V A A L I G K L P T P E
gagtaccagacctacgtggcgcaggtagataaaacagccgttgatacttaccgttatctg
E Y Q T Y V A Q V D K T A V D T Y R Y L
aacttcaaccagctttctcagtacaccgagaaagccgatggggtgattttccagactgcg
N F N Q L S Q Y T E K A D G V I F Q T A
gtttaa
V *
顺式乌头酸脱羧酶-接头-乌头酸酶B E424Q的核酸序列(SEQ ID No:12)与氨基酸序列(SEQ ID No:13)。
atgaccaagcagtctgctgattccaacgcgaagtctggtgtgacctctgagatctgtcac
M T K Q S A D S N A K S G V T S E I C H
tgggcgtctaatctcgccactgatgatatcccgagcgacgttctggagcgtgcaaaatac
W A S N L A T D D I P S D V L E R A K Y
Ctgatcctggatggtatcgcgtgcgcgtgggtaggtgctcgtgtcccatggtctgaaaaa
L I L D G I A C A W V G A R V P W S E K
tacgttcaagcgaccatgtctttcgaacctccgggtgcgtgtcgtgtcatcggttacggc
Y V Q A T M S F E P P G A C R V I G Y G
cagaaactgggtccggtagcggctgccatgacgaactctgcatttattcaggcgaccgaa
Q K L G P V A A A M T N S A F I Q A T E
ctcgatgactatcactctgaagcgccgctgcattccgcgtctatcgttctcccggcagtt
L D D Y H S E A P L H S A S I V L P A V
ttcgcggcgagcgaagtactggccgaacagggtaaaaccatctctggtattgacgtgatt
F A A S E V L A E Q G K T I S G I D V I
ctggctgcgatcgttggtttcgagagcggtcctcgcatcggcaaagcgatctacggttct
L A A I V G F E S G P R I G K A I Y G S
gacctcctgaacaacggctggcactgcggtgcggtatatggcgcaccggctggtgcgctc
D L L N N G W H C G A V Y G A P A G A L
gcaactggtaagctcctgggcctcacgccggacagcatggaagatgcactgggtattgcc
A T G K L L G L T P D S M E D A L G I A
tgcacgcaagcatgcggcctcatgtccgcgcagtatggtggcatggttaaacgtgttcag
C T Q A C G L M S A Q Y G G M V K R V Q
cacggtttcgcagcgcgtaatggtctcctcggtggcctcctggctcacggcggctacgag
H G F A A R N G L L G G L L A H G G Y E
gcgatgaaaggtgttctcgagcgttcttacggtggcttcctgaagatgttcaccaagggc
A M K G V L E R S Y G G F L K M F T K G
aacggtcgtgaaccgccgtacaaagaagaagaggttgtggctggtctgggtagcttctgg
N G R E P P Y K E E E V V A G L G S F W
cacaccttcaccattcgtatcaaactgtacgcgtgctgcggtctcgtacacggtcctgtt
H T F T I R I K L Y A C C G L V H G P V
gaagccattgaaaacctccagggtcgttacccggaactgctcaatcgtgctaacctgtct
E A I E N L Q G R Y P E L L N R A N L S
aacatccgccacgttcacgtacaactctctaccgcgagcaactcccactgtggttggatc
N I R H V H V Q L S T A S N S H C G W I
ccagaagagcgcccaatctcttctatcgcgggtcaaatgtctgtcgcatatatcctcgcc
P E E R P I S S I A G Q M S V A Y I L A
gttcagctcgttgaccaacagtgtctgctcagccagttctccgagtttgacgataatctg
V Q L V D Q Q C L L S Q F S E F D D N L
gaacgcccggaagtgtgggacctggcacgtaaggttaccagctctcaatctgaggagttc
E R P E V W D L A R K V T S S Q S E E F
gaccaggacggtaactgtctctctgccggtcgcgtccgtattgagttcaacgacggctcc
D Q D G N C L S A G R V R I E F N D G S
tccatcaccgaatccgttgagaagccgctcggtgtaaaggaaccaatgccaaatgaacgc
S I T E S V E K P L G V K E P M P N E R
atcctgcacaaataccgtaccctggcgggttctgtaacggacgaaagccgtgttaaggag
I L H K Y R T L A G S V T D E S R V K E
atcgaggatctcgtgctcggcctggaccgtctgaccgatattagcccgctcctcgagctg
I E D L V L G L D R L T D I S P L L E L
ctgaattgtccggttaaatccccactgggtattgaatttggtccgggtccaggtcctggt
L N C P V K S P L G I E F G P G P G P G
cctggccctctagaagtgttgttccaaggtcctggtcgtgcgaaactcgtgctagaagaa
P G P L E V L F Q G P G R A K L V L E E
taccgtaagcacgtagctgagcgtgccgctgaggggattgcgcccaaacccctggatgca
Y R K H V A E R A A E G I A P K P L D A
aaccaaatggccgcacttgtagagctgctgaaaaacccgcccgcgggcgaagaagaattc
N Q M A A L V E L L K N P P A G E E E F
ctgttagatctgttaaccaaccgtgttcccccaggcgtcgatgaagccgcctatgtcaaa
L L D L L T N R V P P G V D E A A Y V K
gcaggcttcctggctgctatcgcgaaaggcgaagccaaatcccctctgctgactccggaa
A G F L A A I A K G E A K S P L L T P E
aaagccatcgaactgctgggcaccatgcagggtggttacaacattcatccgctgatcgac
K A I E L L G T M Q G G Y N I H P L I D
gcgctggatgatgccaaactggcacctattgctgccaaagcactttctcacacgctgctg
A L D D A K L A P I A A K A L S H T L L
atgttcgataacttctatgacgtagaagagaaagcgaaagcaggcaacgaatatgcgaag
M F D N F Y D V E E K A K A G N E Y A K
caggttatgcagtcctgggcggatgccgaatggttcctgaatcgcccggcgctggctgaa
Q V M Q S W A D A E W F L N R P A L A E
aaactgaccgttactgtcttcaaagtcactggcgaaactaacaccgatgacctttctccg
K L T V T V F K V T G E T N T D D L S P
gcaccggatgcgtggtcacgcccggatatcccactgcacgcgctggcgatgctgaaaaac
A P D A W S R P D I P L H A L A M L K N
gcccgtgaaggtattgagccagaccagcctggtgttgttggtccgatcaagcaaatcgaa
A R E G I E P D Q P G V V G P I K Q I E
gctctgcaacagaaaggtttcccgctggcgtacgtcggtgacgttgtgggtacgggttct
A L Q Q K G F P L A Y V G D V V G T G S
tcgcgtaaatccgccactaactccgttctgtggtttatgggcgatgatattccacatgtg
S R K S A T N S V L W F M G D D I P H V
ccgaacaaacgcggcggtggtttgtgcctcggcggtaaaattgcacccatcttctttaac
P N K R G G G L C L G G K I A P I F F N
acgatggaagacgcgggtgcactgccaatcgaagtcgacgtctctaacctgaacatgggc
T M E D A G A L P I E V D V S N L N M G
gacgtgattgacgtttacccgtacaaaggtgaagtgcgtaaccacgaaaccggcgaactg
D V I D V Y P Y K G E V R N H E T G E L
ctggcgaccttcgaactgaaaaccgacgtgctgattgatgaagtgcgtgctggtggccgt
L A T F E L K T D V L I D E V R A G G R
attccgctgattatcgggcgtggcctgaccaccaaagcgcgtgaagcacttggtctgccg
I P L I I G R G L T T K A R E A L G L P
cacagtgatgtgttccgtcaggcgaaagatgtcgctgagagcgatcgcggcttctcgctg
H S D V F R Q A K D V A E S D R G F S L
gcgcaaaaaatggtaggccgtgcctgtggcgtgaaaggcattcgtccgggcgcgtactgt
A Q K M V G R A C G V K G I R P G A Y C
gaaccgaaaatgacttctgtaggttcccaggacaccaccggcccgatgacccgtgatcag
E P K M T S V G S Q D T T G P M T R D Q
ctgaaagacctggcgtgcctgggcttctcggctgacctggtgatgcagtctttctgccac
L K D L A C L G F S A D L V M Q S F C H
accgcggcgtatccgaagccagttgacgtgaacacgcaccacacgctgccggacttcatt
T A A Y P K P V D V N T H H T L P D F I
atgaaccgtggcggtgtgtcgctgcgtccgggtgacggcgtcattcactcctggctgaac
M N R G G V S L R P G D G V I H S W L N
cgtatgctgctgccggataccgtcggtaccggtggtgactcccatacccgtttcccgatc
R M L L P D T V G T G G D S H T R F P I
ggtatctctttcccggcgggttctggtctggtggcgtttgctgccgcaactggcgtaatg
G I S F P A G S G L V A F A A A T G V M
ccgcttgatatgccggaatccgttctggtgcgcttcaaaggcaaaatgcagccgggcatc
P L D M P E S V L V R F K G K M Q P G I
accctgcgcgatctggtacacgctattccgctgtatgcgatcaaacaaggtctgctgacc
T L R D L V H A I P L Y A I K Q G L L T
gttgagaagaaaggcaagaaaaacatcttctctggccgcatcctggaaattgaaggtctg
V E K K G K K N I F S G R I L E I E G L
ccggatctgaaagttgagcaggcctttgagctaaccgatgcgtccgccgagcgttctgcc
P D L K V E Q A F E L T D A S A E R S A
gctggttgtaccatcaagctgaacaaagaaccgatcatcgaatacctgaactctaacatc
A G C T I K L N K E P I I E Y L N S N I
gtcctgctgaagtggatgatcgcggaaggttacggcgatcgtcgtaccctggaacgtcgt
V L L K W M I A E G Y G D R R T L E R R
attcagggcatggaaaaatggctggcgaatcctgagctgctggaagccgatgcagatgcg
I Q G M E K W L A N P E L L E A D A D A
gaatacgcggcagtgatcgacatcgatctggcggatattaaagagccaatcctgtgtgct
E Y A A V I D I D L A D I K E P I L C A
ccgaacgacccggatgacgcgcgtccgctgtctgcggtacagggtgagaagatcgacgaa
P N D P D D A R P L S A V Q G E K I D E
gtgtttatcggttcctgcatgaccaacatcggtcacttccgtgctgcgggtaaactgctg
V F I G S C M T N I G H F R A A G K L L
gatgcgcataaaggtcagttgccgacccgcctgtgggtggcaccgccaacccgtatggac
D A H K G Q L P T R L W V A P P T R M D
gccgcacagttgaccgaagaaggctactacagcgtcttcggtaagagtggtgcgcgtatc
A A Q L T E E G Y Y S V F G K S G A R I
gagatccctggctgttccctgtgtatgggtaaccaggcgcgtgtggcggacggtgcaacg
E I P G C S L C M G N Q A R V A D G A T
gtggtttccacctctacccgtaacttcccgaaccgtctgggtactggcgcgaatgtcttc
V V S T S T R N F P N R L G T G A N V F
ctggcttctgcggaactggcggctgttgcggcgctgattggcaaactgccgacgccggaa
L A S A E L A A V A A L I G K L P T P E
gagtaccagacctacgtggcgcaggtagataaaacagccgttgatacttaccgttatctg
E Y Q T Y V A Q V D K T A V D T Y R Y L
aacttcaaccagctttctcagtacaccgagaaagccgatggggtgattttccagactgcg
N F N Q L S Q Y T E K A D G V I F Q T A
gtttaa
V *
顺式乌头酸脱羧酶-接头-Yaco1的核酸序列(SEQ ID No:14)与氨基酸序列(SEQ ID No:15)。
atgaccaagcagtctgctgattccaacgcgaagtctggtgtgacctctgagatctgtcac
M T K Q S A D S N A K S G V T S E I C H
tgggcgtctaatctcgccactgatgatatcccgagcgacgttctggagcgtgcaaaatac
W A S N L A T D D I P S D V L E R A K Y
Ctgatcctggatggtatcgcgtgcgcgtgggtaggtgctcgtgtcccatggtctgaaaaa
L I L D G I A C A W V G A R V P W S E K
tacgttcaagcgaccatgtctttcgaacctccgggtgcgtgtcgtgtcatcggttacggc
Y V Q A T M S F E P P G A C R V I G Y G
cagaaactgggtccggtagcggctgccatgacgaactctgcatttattcaggcgaccgaa
Q K L G P V A A A M T N S A F I Q A T E
ctcgatgactatcactctgaagcgccgctgcattccgcgtctatcgttctcccggcagtt
L D D Y H S E A P L H S A S I V L P A V
ttcgcggcgagcgaagtactggccgaacagggtaaaaccatctctggtattgacgtgatt
F A A S E V L A E Q G K T I S G I D V I
ctggctgcgatcgttggtttcgagagcggtcctcgcatcggcaaagcgatctacggttct
L A A I V G F E S G P R I G K A I Y G S
gacctcctgaacaacggctggcactgcggtgcggtatatggcgcaccggctggtgcgctc
D L L N N G W H C G A V Y G A P A G A L
gcaactggtaagctcctgggcctcacgccggacagcatggaagatgcactgggtattgcc
A T G K L L G L T P D S M E D A L G I A
tgcacgcaagcatgcggcctcatgtccgcgcagtatggtggcatggttaaacgtgttcag
C T Q A C G L M S A Q Y G G M V K R V Q
cacggtttcgcagcgcgtaatggtctcctcggtggcctcctggctcacggcggctacgag
H G F A A R N G L L G G L L A H G G Y E
gcgatgaaaggtgttctcgagcgttcttacggtggcttcctgaagatgttcaccaagggc
A M K G V L E R S Y G G F L K M F T K G
aacggtcgtgaaccgccgtacaaagaagaagaggttgtggctggtctgggtagcttctgg
N G R E P P Y K E E E V V A G L G S F W
cacaccttcaccattcgtatcaaactgtacgcgtgctgcggtctcgtacacggtcctgtt
H T F T I R I K L Y A C C G L V H G P V
gaagccattgaaaacctccagggtcgttacccggaactgctcaatcgtgctaacctgtct
E A I E N L Q G R Y P E L L N R A N L S
aacatccgccacgttcacgtacaactctctaccgcgagcaactcccactgtggttggatc
N I R H V H V Q L S T A S N S H C G W I
ccagaagagcgcccaatctcttctatcgcgggtcaaatgtctgtcgcatatatcctcgcc
P E E R P I S S I A G Q M S V A Y I L A
gttcagctcgttgaccaacagtgtctgctcagccagttctccgagtttgacgataatctg
V Q L V D Q Q C L L S Q F S E F D D N L
gaacgcccggaagtgtgggacctggcacgtaaggttaccagctctcaatctgaggagttc
E R P E V W D L A R K V T S S Q S E E F
gaccaggacggtaactgtctctctgccggtcgcgtccgtattgagttcaacgacggctcc
D Q D G N C L S A G R V R I E F N D G S
tccatcaccgaatccgttgagaagccgctcggtgtaaaggaaccaatgccaaatgaacgc
S I T E S V E K P L G V K E P M P N E R
atcctgcacaaataccgtaccctggcgggttctgtaacggacgaaagccgtgttaaggag
I L H K Y R T L A G S V T D E S R V K E
atcgaggatctcgtgctcggcctggaccgtctgaccgatattagcccgctcctcgagctg
I E D L V L G L D R L T D I S P L L E L
ctgaattgtccggttaaatccccactgggtattgaatttggtccgggtccaggtcctggt
L N C P V K S P L G I E F G P G P G P G
cctggccctctagaagtgttgttccaaggtcctggtcgtgcgaaactcatgctggctagt
P G P L E V L F Q G P G R A K L M L A S
cgtgtttcaatcaaagctccacgccttgcacgtagccttgcgactaccactaatgcctcc
R V S I K A P R L A R S L A T T T N A S
ctcaacttggactccaaggtccgaatgaacaactgggaggccaacaacttcctcaacttc
L N L D S K V R M N N W E A N N F L N F
aagaagcacaccgagaacgtccagattgtcaaggagcgactcaaccgacccctgacctac
K K H T E N V Q I V K E R L N R P L T Y
gctgagaagattctctacggccatctcgacaagccccatgagcaggagattgtccgaggt
A E K I L Y G H L D K P H E Q E I V R G
cagtcctacctcaagctgcgacccgatcgagccgcctgccaggatgccaccgcccagatg
Q S Y L K L R P D R A A C Q D A T A Q M
gccattctgcagttcatgtctgccggtatccccaccgtccagacccccaccaccgtccac
A I L Q F M S A G I P T V Q T P T T V H
tgtgaccatcttatccaggcccaggttggtggtgagcaggatcttgctcgagccatcgac
C D H L I Q A Q V G G E Q D L A R A I D
atcaacaaggaggtctacaacttccttggcaccgcctccgccaagtacgacattggtttc
I N K E V Y N F L G T A S A K Y D I G F
tggaaggccggatccggtattatccaccagatcattctcgagaactacgccttccccggt
W K A G S G I I H Q I I L E N Y A F P G
gcccttctcattggttccgactctcatacccccaacgccggtggtctcggtatgctcgcc
A L L I G S D S H T P N A G G L G M L A
atcggtgtcggtggtgccgatgtcgtcgacgtcatggccggtctcccctgggagcttaag
I G V G G A D V V D V M A G L P W E L K
gcccccaagattatcggtgtcaagctgaccggtaagctctctggctggacctcccccaag
A P K I I G V K L T G K L S G W T S P K
gatattatcctgaaggtcgctggtatcctcaccgtcaagggtggaaccggtgctatcgtc
D I I L K V A G I L T V K G G T G A I V
gagtacttcggtgatggtgtcgataacctgtcctgcactggtatgggaaccatctgtaac
E Y F G D G V D N L S C T G M G T I C N
atgggtgccgagattggtgctaccacctccaccttccccttcaacgagcgaatggccgac
M G A E I G A T T S T F P F N E R M A D
taccttaacgccactggccgaaaggagattgccgactttgctcgactttacaaccacttc
Y L N A T G R K E I A D F A R L Y N H F
ctctctgccgatgagggttgtgagtacgatcagctcatcgagattgacctgaacaccctt
L S A D E G C E Y D Q L I E I D L N T L
gagccttacgtcaacggtcccttcactcccgatcttgccacccccatctccaagctcaag
E P Y V N G P F T P D L A T P I S K L K
gatgtcgccgtcgagaacggatggccccttgaggtcaaggtcggtcttatcggctcttgc
D V A V E N G W P L E V K V G L I G S C
accaactcctcttacgaggatatggagcgatccgcctccattgccaaggacgccatggcc
T N S S Y E D M E R S A S I A K D A M A
cacggtcttaagtccaagtccatctacaccgtcacccccggttccgagcagatccgagcc
H G L K S K S I Y T V T P G S E Q I R A
accattgagcgagatggtcagctccagaccttcctcgacttcggtggtatcgtccttgct
T I E R D G Q L Q T F L D F G G I V L A
aacgcttgtggcccctgcattggtcagtgggaccgacgagacatcaagaagggtgagaag
N A C G P C I G Q W D R R D I K K G E K
aacaccattgtctcttcttacaaccgaaacttcactggccgaaacgattctaaccctgcc
N T I V S S Y N R N F T G R N D S N P A
acccacgctttcgtcacctctcccgatctcgtcaccgctttcgccattgctggtgacctc
T H A F V T S P D L V T A F A I A G D L
cgattcaaccctctcactgactccctgaaggattctgagggtaaggagttcaagctcaag
R F N P L T D S L K D S E G K E F K L K
gagcccactggaaagggtctgcccgaccgaggttacgaccccggcatggacacctaccag
E P T G K G L P D R G Y D P G M D T Y Q
gctccccccgccgaccgatctgccgtcgaggttgatgtttcccccacttccgaccgactc
A P P A D R S A V E V D V S P T S D R L
cagatcctcaagcccttcaagccttgggacggcaaggacggtattgacatgcccatcctc
Q I L K P F K P W D G K D G I D M P I L
atcaagtctcttggtaagaccaccactgaccatatctctcaggccggtccctggcttaag
I K S L G K T T T D H I S Q A G P W L K
taccgaggccatctccagaacatctccaacaactacatgattggagccatcaacgctgag
Y R G H L Q N I S N N Y M I G A I N A E
aacgaggaggccaacaacgtccgaaaccagatcactggcgagtggggaggagttcccgag
N E E A N N V R N Q I T G E W G G V P E
actgccattgcttaccgagacaacggtatccgatgggttgttgtcggaggtgataacttc
T A I A Y R D N G I R W V V V G G D N F
ggtgagggttcttctcgagagcacgctgctcttgagccccgattcctcggtggtttcgcc
G E G S S R E H A A L E P R F L G G F A
atcatcaccaagtcttttgcccgaattcacgagactaacctgaagaagcagggtctcctg
I I T K S F A R I H E T N L K K Q G L L
ccccttaacttcgtcaacggtgctgactacgacaagatccagccctccgataagatctcc
P L N F V N G A D Y D K I Q P S D K I S
attcttggtcttaaggaccttgcccccggcaagaacgtcaccattgaggttacccccaag
I L G L K D L A P G K N V T I E V T P K
gacggtgccaagtggaccaccgaggtttctcacacctacaactctgagcagctcgagtgg
D G A K W T T E V S H T Y N S E Q L E W
ttcaagtacggctctgccctcaacaagatggctgcctccaagaaataa
F K Y G S A L N K M A A S K K *
通过使用本技术领域中已知的方法,例如重组技术,可产生融合多肽以及编码融合多肽的核酸分子。
可将编码一融合多肽的序列有效连接至适合的启动子以产生表达盒。在一例子中,表达盒包括编码序列,其有效连接至启动子。在另一例子中,表达盒包括多个编码序列,其全部为与一启动子可操作的连接。于那例子中,较佳为将一核糖体结合位点合并至各个编码序列的5’端。若需要,根据于宿主细胞中的最适密码子使用,使编码序列进行密码子优化。
如于此所使用,用语“启动子”意指一核苷酸序列,其包含在一所要求的宿主细胞中起始可操作连接的核酸序列的转录的组件。至少,一激活子包含RNA聚合酶结合位点。其可更包含一或多个,根据定义,为增强转录的增强子组件,或一或多个控制启动子开/关的状态的调控组件。启动子可为可诱导型或组成型启动子。
可将用以表达上述融合多肽的表达盒引入适合的宿主细胞以产生经基因修饰的细胞。选择阳性转型株,且通过本技术领域中已知的方法,例如,免疫印迹法或酶活性分析,可确认融合多肽的表达。之后可将经修饰的细胞培养于用以衣康酸产生的适合的培养基中。例如,培养基可包含葡萄糖、甘油或柠檬酸用以制造衣康酸的前驱物。参见,例如,US Patent No.8,192,965。在一足够的培养期间后,可从培养基分离衣康酸。
适合的宿主细胞,包括,但不限于,黑曲菌(Aspergillus niger)、土曲菌、大肠杆菌、南极类酵母真菌(Pseudozyma antarctica)、解脂耶氏酵母菌(Yarrowia lipotica)与啤酒酵母菌(Saccharomyces cerevisiae)细胞。
上述经基因修饰的细胞可具有一突变内生性的icd基因(编码出异柠檬酸脱氢酶(isocitrate dehydrogenase)),以使其相较于其野生型相对物(wild-type counterpart),表达较低程度的异柠檬酸脱氢酶。异柠檬酸脱氢酶将异柠檬酸转化成α-酮戊二酸(α-ketoglutarate)。icd基因存在于各种种类的微生物中,包括土曲菌(GenBank Accession Nos.XM_001210553与XP_001210553)、克氏柠檬酸杆菌(Citrobacter koseri)(GenBank AccessionNos.NC_009792与YP_001453397)、发酵乳杆菌(Lactobacillus fermentum)(GenBank Accession Nos.NC_010610与YP_001843755)、啤酒酵母菌(GenBank Accession Nos.NM_001182876与NP_014361)、解脂耶氏酵母菌(GenBank Accession Nos.XM_503571与XP_503571)及大肠杆菌(GenBank Accession Nos.NC_000913与NP_415654)。也参见US Patent No.8,143,036。产生具有突变的内生性icd基因的微生物的方法,为本技术领域所已知。例如,通过同源重组,突变(例如,插入、删除、点突变)的icd基因可被引入。作为一例子,大肠杆菌icd基因的编码区域如下所示:
大肠杆菌异柠檬酸脱氢酶的核苷酸序列(SEQ ID No:16)与氨基酸序列(SEQ ID No:17)
atggaaagtaaagtagttgttccggcacaaggcaagaagatcaccctgcaaaacggcaaa
M E S K V V V P A Q G K K I T L Q N G K
ctcaacgttcctgaaaatccgattatcccttacattgaaggtgatggaatcggtgtagat
L N V P E N P I I P Y I E G D G I G V D
gtaaccccagccatgctgaaagtggtcgacgctgcagtcgagaaagcctataaaggcgag
V T P A M L K V V D A A V E K A Y K G E
cgtaaaatctcctggatggaaatttacaccggtgaaaaatccacacaggtttatggtcag
R K I S W M E I Y T G E K S T Q V Y G Q
gacgtctggctgcctgctgaaactcttgatctgattcgtgaatatcgcgttgccattaaa
D V W L P A E T L D L I R E Y R V A I K
ggtccgctgaccactccggttggtggcggtattcgctctctgaacgttgccctgcgccag
G P L T T P V G G G I R S L N V A L R Q
gaactggatctctacatctgcctgcgtccggtacgttactatcagggcactccaagcccg
E L D L Y I C L R P V R Y Y Q G T P S P
gttaaacaccctgaactgaccgatatggttatcttccgtgaaaactcggaagacatttat
V K H P E L T D M V I F R E N S E D I Y
gcgggtatcgaatggaaagcagactctgccgacgccgagaaagtgattaaattcctgcgt
A G I E W K A D S A D A E K V I K F L R
gaagagatgggggtgaagaaaattcgcttcccggaacattgtggtatcggtattaagccg
E E M G V K K I R F P E H C G I G I K P
tgttcggaagaaggcaccaaacgtctggttcgtgcagcgatcgaatacgcaattgctaac
C S E E G T K R L V R A A I E Y A I A N
gatcgtgactctgtgactctggtgcacaaaggcaacatcatgaagttcaccgaaggagcg
D R D S V T L V H K G N I M K F T E G A
tttaaagactggggctaccagctggcgcgtgaagagtttggcggtgaactgatcgacggt
F K D W G Y Q L A R E E F G G E L I D G
ggcccgtggctgaaagttaaaaacccgaacactggcaaagagatcgtcattaaagacgtg
G P W L K V K N P N T G K E I V I K D V
attgctgatgcattcctgcaacagatcctgctgcgtccggctgaatatgatgttatcgcc
I A D A F L Q Q I L L R P A E Y D V I A
tgtatgaacctgaacggtgactacatttctgacgccctggcagcgcaggttggcggtatc
C M N L N G D Y I S D A L A A Q V G G I
ggtatcgcccctggtgcaaacatcggtgacgaatgcgccctgtttgaagccacccacggt
G I A P G A N I G D E C A L F E A T H G
actgcgccgaaatatgccggtcaggacaaagtaaatcctggctctattattctctccgct
T A P K Y A G Q D K V N P G S I I L S A
gagatgatgctgcgccacatgggttggaccgaagcggctgacttaattgttaaaggtatg
E M M L R H M G W T E A A D L I V K G M
gaaggcgcaatcaacgcgaaaaccgtaacctatgacttcgagcgtctgatggatggcgct
E G A I N A K T V T Y D F E R L M D G A
aaactgctgaaatgttcagagtttggtgacgcgatcatcgaaaacatgtaa
K L L K C S E F G D A I I E N M -
或者,或除此之外,经基因修饰的细胞也可表达或过度表达一或多个的下列酶:(a)酶,其将磷酸烯醇丙酮酸(phosphoenolpyruvate)转化成草酰乙酸(oxaloacetate)(例如,磷酸烯醇丙酮酸羧化酶/羧化激酶(phosphoenolpyruvatecarboxylase/carboxykinase);包括三种同功同工型EC 4.1.1.32、EC 4.1.1.38与EC 4.1.1.49)与功用相似的EC 4.1.1.31;(b)酶,其将草酰乙酸转化成柠檬酸(例如,柠檬酸合成酶(citrate synthase)、2-甲基柠檬酸合成酶(2-methylcitrate synthase)与柠檬酸裂解酶(citrate lyase);以及(c)酶,其将柠檬酸或异柠檬酸转化成顺式乌头酸(例如,乌头酸酶与2-甲基柠檬酸脱水酶(2-methylcitrate dehydratase))。也参见US Patent No.8,143,036。
于此使用的用语“磷酸烯醇丙酮酸羧化酶/羧化激酶”、“柠檬酸合成酶”、“2-甲基柠檬酸合成酶”、“柠檬酸裂解酶”与“2-甲基柠檬酸脱水酶”意指具有上述酶活性的所有酶,包括自然发生的酶与它们的功能性等同物两者。下方所提供为大肠杆菌磷酸烯醇丙酮酸羧化酶(由ppc基因所编码)与柠檬酸合成酶(由gltA基因所编码)的核苷酸序列与氨基酸序列。
大肠杆菌磷酸烯醇丙酮酸羧化酶的核酸序列(SEQ ID No:18)与氨基酸序列(SEQ ID No:19)
atgaacgaacaatattccgcattgcgtagtaatgtcagtatgctcggcaaagtgctggga
M N E Q Y S A L R S N V S M L G K V L G
gaaaccatcaaggatgcgttgggagaacacattcttgaacgcgtagaaactatccgtaag
E T I K D A L G E H I L E R V E T I R K
ttgtcgaaatcttcacgcgctggcaatgatgctaaccgccaggagttgctcaccacctta
L S K S S R A G N D A N R Q E L L T T L
caaaatttgtcgaacgacgagctgctgcccgttgcgcgtgcgtttagtcagttcctgaac
Q N L S N D E L L P V A R A F S Q F L N
ctggccaacaccgccgagcaataccacagcatttcgccgaaaggcgaagctgccagcaac
L A N T A E Q Y H S I S P K G E A A S N
ccggaagtgatcgcccgcaccctgcgtaaactgaaaaaccagccggaactgagcgaagac
P E V I A R T L R K L K N Q P E L S E D
accatcaaaaaagcagtggaatcgctgtcgctggaactggtcctcacggctcacccaacc
T I K K A V E S L S L E L V L T A H P T
gaaattacccgtcgtacactgatccacaaaatggtggaagtgaacgcctgtttaaaacag
E I T R R T L I H K M V E V N A C L K Q
ctcgataacaaagatatcgctgactacgaacacaaccagctgatgcgtcgcctgcgccag
L D N K D I A D Y E H N Q L M R R L R Q
ttgatcgcccagtcatggcataccgatgaaatccgtaagctgcgtccaagcccggtagat
L I A Q S W H T D E I R K L R P S P V D
gaagccaaatggggctttgccgtagtggaaaacagcctgtggcaaggcgtaccaaattac
E A K W G F A V V E N S L W Q G V P N Y
ctgcgcgaactgaacgaacaactggaagagaacctcggctacaaactgcccgtcgaattt
L R E L N E Q L E E N L G Y K L P V E F
gttccggtccgttttacttcgtggatgggcggcgaccgcgacggcaacccgaacgtcact
V P V R F T S W M G G D R D G N P N V T
gccgatatcacccgccacgtcctgctactcagccgctggaaagccaccgatttgttcctg
A D I T R H V L L L S R W K A T D L F L
aaagatattcaggtgctggtttctgaactgtcgatggttgaagcgacccctgaactgctg
K D I Q V L V S E L S M V E A T P E L L
gcgctggttggcgaagaaggtgccgcagaaccgtatcgctatctgatgaaaaacctgcgt
A L V G E E G A A E P Y R Y L M K N L R
tctcgcctgatggcgacacaggcatggctggaagcgcgcctgaaaggcgaagaactgcca
S R L M A T Q A W L E A R L K G E E L P
aaaccagaaggcctgctgacacaaaacgaagaactgtgggaaccgctctacgcttgctac
K P E G L L T Q N E E L W E P L Y A C Y
cagtcacttcaggcgtgtggcatgggtattatcgccaacggcgatctgctcgacaccctg
Q S L Q A C G M G I I A N G D L L D T L
cgccgcgtgaaatgtttcggcgtaccgctggtccgtattgatatccgtcaggagagcacg
R R V K C F G V P L V R I D I R Q E S T
cgtcataccgaagcgctgggcgagctgacccgctacctcggtatcggcgactacgaaagc
R H T E A L G E L T R Y L G I G D Y E S
tggtcagaggccgacaaacaggcgttcctgatccgcgaactgaactccaaacgtccgctt
W S E A D K Q A F L I R E L N S K R P L
ctgccgcgcaactggcaaccaagcgccgaaacgcgcgaagtgctcgatacctgccaggtg
L P R N W Q P S A E T R E V L D T C Q V
attgccgaagcaccgcaaggctccattgccgcctacgtgatctcgatggcgaaaacgccg
I A E A P Q G S I A A Y V I S M A K T P
tccgacgtactggctgtccacctgctgctgaaagaagcgggtatcgggtttgcgatgccg
S D V L A V H L L L K E A G I G F A M P
gttgctccgctgtttgaaaccctcgatgatctgaacaacgccaacgatgtcatgacccag
V A P L F E T L D D L N N A N D V M T Q
ctgctcaatattgactggtatcgtggcctgattcagggcaaacagatggtgatgattggc
L L N I D W Y R G L I Q G K Q M V M I G
tattccgactcagcaaaagatgcgggagtgatggcagcttcctgggcgcaatatcaggca
Y S D S A K D A G V M A A S W A Q Y Q A
caggatgcattaatcaaaacctgcgaaaaagcgggtattgagctgacgttgttccacggt
Q D A L I K T C E K A G I E L T L F H G
cgcggcggttccattggtcgcggcggcgcacctgctcatgcggcgctgctgtcacaaccg
R G G S I G R G G A P A H A A L L S Q P
ccaggaagcctgaaaggcggcctgcgcgtaaccgaacagggcgagatgatccgctttaaa
P G S L K G G L R V T E Q G E M I R F K
tatggtctgccagaaatcaccgtcagcagcctgtcgctttataccggggcgattctggaa
Y G L P E I T V S S L S L Y T G A I L E
gccaacctgctgccaccgccggagccgaaagagagctggcgtcgcattatggatgaactg
A N L L P P P E P K E S W R R I M D E L
tcagtcatctcctgcgatgtctaccgcggctacgtacgtgaaaacaaagattttgtgcct
S V I S C D V Y R G Y V R E N K D F V P
tacttccgctccgctacgccggaacaagaactgggcaaactgccgttgggttcacgtccg
Y F R S A T P E Q E L G K L P L G S R P
gcgaaacgtcgcccaaccggcggcgtcgagtcactacgcgccattccgtggatcttcgcc
A K R R P T G G V E S L R A I P W I F A
tggacgcaaaaccgtctgatgctccccgcctggctgggtgcaggtacggcgctgcaaaaa
W T Q N R L M L P A W L G A G T A L Q K
gtggtcgaagacggcaaacagagcgagctggaggctatgtgccgcgattggccattcttc
V V E D G K Q S E L E A M C R D W P F F
tcgacgcgtctcggcatgctggagatggtcttcgccaaagcagacctgtggctggcggaa
S T R L G M L E M V F A K A D L W L A E
tactatgaccaacgcctggtagacaaagcactgtggccgttaggtaaagagttacgcaac
Y Y D Q R L V D K A L W P L G K E L R N
ctgcaagaagaagacatcaaagtggtgctggcgattgccaacgattcccatctgatggcc
L Q E E D I K V V L A I A N D S H L M A
gatctgccgtggattgcagagtctattcagctacggaatatttacaccgacccgctgaac
D L P W I A E S I Q L R N I Y T D P L N
gtattgcaggccgagttgctgcaccgctcccgccaggcagaaaaagaaggccaggaaccg
V L Q A E L L H R S R Q A E K E G Q E P
gatcctcgcgtcgaacaagcgttaatggtcactattgccgggattgcggcaggtatgcgt
D P R V E Q A L M V T I A G I A A G M R
aataccggctaa
N T G -
一大肠杆菌柠檬酸合成酶的核酸序列(SEQ ID No:20)与氨基酸序列(SEQ ID No:21)
atggctgatacaaaagcaaaactcaccctcaacggggatacagctgttgaactggatgtg
M A D T K A K L T L N G D T A V E L D V
ctgaaaggcacgctgggtcaagatgttattgatatccgtactctcggttcaaaaggtgtg
L K G T L G Q D V I D I R T L G S K G V
ttcacctttgacccaggcttcacttcaaccgcatcctgcgaatctaaaattacttttatt
F T F D P G F T S T A S C E S K I T F I
gatggtgatgaaggtattttgctgcaccgcggtttcccgatcgatcagctggcgaccgat
D G D E G I L L H R G F P I D Q L A T D
tctaactacctggaagtttgttacatcctgctgaatggtgaaaaaccgactcaggaacag
S N Y L E V C Y I L L N G E K P T Q E Q
tatgacgaatttaaaactacggtgacccgtcataccatgatccacgagcagattacccgt
Y D E F K T T V T R H T M I H E Q I T R
ctgttccatgctttccgtcgcgactcgcatccaatggcagtcatgtgtggtattaccggc
L F H A F R R D S H P M A V M C G I T G
gcgctggcggcgttctatcacgactcgctggatgttaacaatcctcgtcaccgtgaaatt
A L A A F Y H D S L D V N N P R H R E I
gccgcgttccgcctgctgtcgaaaatgccgaccatggccgcgatgtgttacaagtattcc
A A F R L L S K M P T M A A M C Y K Y S
attggtcagccatttgtttacccgcgcaacgatctctcctacgccggtaacttcctgaat
I G Q P F V Y P R N D L S Y A G N F L N
atgatgttctccacgccgtgcgaaccgtatgaagttaatccgattctggaacgtgctatg
M M F S T P C E P Y E V N P I L E R A M
gaccgtattctgatcctgcacgctgaccatgaacagaacgcctctacctccaccgtgcgt
D R I L I L H A D H E Q N A S T S T V R
accgctggctcttcgggtgcgaacccgtttgcctgtatcgcagcaggtattgcttcactg
T A G S S G A N P F A C I A A G I A S L
tggggacctgcgcacggcggtgctaacgaagcggcgctgaaaatgctggaagaaatcagc
W G P A H G G A N E A A L K M L E E I S
tccgttaaacacattccggaatttgttcgtcgtgcgaaagacaaaaatgattctttccgc
S V K H I P E F V R R A K D K N D S F R
ctgatgggcttcggtcaccgcgtgtacaaaaattacgacccgcgcgccaccgtaatgcgt
L M G F G H R V Y K N Y D P R A T V M R
gaaacctgccatgaagtgctgaaagagctgggcacgaaggatgacctgctggaagtggct
E T C H E V L K E L G T K D D L L E V A
atggagctggaaaacatcgcgctgaacgacccgtactttatcgagaagaaactgtacccg
M E L E N I A L N D P Y F I E K K L Y P
aacgtcgatttctactctggtatcatcctgaaagcgatgggtattccgtcttccatgttc
N V D F Y S G I I L K A M G I P S S M F
accgtcattttcgcaatggcacgtaccgttggctggatcgcccactggagcgaaatgcac
T V I F A M A R T V G W I A H W S E M H
agtgacggtatgaagattgcccgtccgcgtcagctgtatacaggatatgaaaaacgcgac
S D G M K I A R P R Q L Y T G Y E K R D
Tttaaaagcgatatcaagcgttaa
F K S D I K R -
下方表1列出磷酸烯醇丙酮酸羧化酶/羧化激酶、柠檬酸合成酶与乌头酸酶,及示范的2-甲基柠檬酸合成酶、柠檬酸裂解酶与2-甲基柠檬酸脱水酶的额外例子:
表1
通过本技术领域已知方法,例如,重组技术,可构建上述经基因修饰的细胞。编码任何的上述酶的序列可被有效连接至适合的启动子,以产生之后可被引入宿主细胞中的表达盒。
以下特定实施例被解释为仅为说明性,且不以任何方式为揭露的其它部分的限制。不须更进一步的细节,相信本技术领域的普通技术人员,根据于此的说明,可利用本说明书至其最大程度。于此所引用的所有出版物皆以其全文并入为参考文献。
实施例
实施例1:以来自大肠杆菌的acnA或acnB的cad-aco融合基因的构建
采用Tsuchiya et al(Biochim.Biophysi.Acta,2008,1784:1847-1856)所报导的方法来设计顺式乌头酸脱羧酶-乌头酸酶融合多肽,其每个包含顺式乌头酸脱羧酶于N端与乌头酸酶于C端,以包含25个氨基酸富有PG的短肽(SEQID No:7)来连接。C端的顺式乌头酸脱羧酶通过并入V490GI突变也被轻微地修饰。在乌头酸酶的情况,测试三种类型的乌头酸酶:乌头酸脱羧酶A(AcnA)、乌头酸脱羧酶B(AcnB)与乌头酸脱羧酶B(AcnB)E424Q突变。之后,总共构建了3种类型的顺式乌头酸脱羧酶-乌头酸酶融合体:顺式乌头酸脱羧酶-乌头酸酶A、顺式乌头酸脱羧酶-乌头酸酶B以及顺式乌头酸脱羧酶-乌头酸酶B E424Q(SEQ ID No:9、11与13)。
为了构建融合基因,应用引物与PCR以独立地扩增两条DNA片段(图2):1)片段PCR-1,其包括cad编码区与接头且其两侧被位于cad基因正上游的KpnI切割位点与位于接头区域的XbaI切割位点所包围;2)片段PCR-2,其仅包含接头的部分与完整的乌头酸酶基因,且被位于接头上的Xba切割位点与位于乌头酸酶基因下游的HindIII切割位点所包夹。由于有三个不同的乌头酸酶基因要被测试,所以制备了三种不同种类的PCR-2片段。它们全部分享上述的相同结构且如于图2中所示。
如下列出所使用的引物于表2中。
表2、用来制备cad-acnA、cad-acnB与cad-acnB[E424Q]融合基因的引物
将所制备的PCR-1与PCR-2片段进行胶体纯化,且将其以KpnI与XbaI(对于PCR-1类型),或以XbaI与HindIII(对于PCR-2类型)来进行处理,且经由三-片段-连接方式将其与pSA40a载体连接于KpnI/HindIII切割位点。之后构建下方三个重组克隆体:pTYL101、pTYL102与pTYL103,其分别于各质粒上携带PLlacO1::cad-接头-acnA(‘cad-acnA’)、PLlacO1::cad-接头-acnB(‘cad-acnB’)与PLlacO1::cad-接头-acnB(E424Q)(‘cad-acnBeq’)的融合基因。下方表3列出于此所述的表达质粒。
表3、表达质粒
实施例2:顺式乌头酸脱羧酶-乌头酸酶融合蛋白显示出顺式乌头酸脱羧酶与乌头酸酶两者活性
将质粒pTYL101、pTYL102与pTYL103分别引入大肠杆菌SY403K(基因型:BW25113acnA-acnB-icd-kanr)细胞中,且以0.5mM IPTG来诱导位于这些质粒上的cad-aco融合基因。前述细胞培养后以IPTG诱导,再制备成细胞裂解物,并以体外分析法,测定细胞裂解物中顺式乌头酸脱羧酶-乌头酸酶蛋白质的活性。顺式乌头酸脱羧酶-乌头酸酶蛋白质的活性。通过将pP104A,其携带转录融合的PLlaco1::cad::acnA操纵子,以及pSA40a,为载体,分别引入大肠杆菌SY403K细胞来以相似的程序来制备阳性与阴性对照组裂解物。
下方表4列出于此揭露的细菌菌株。
在1mL含有顺式乌头酸(12.5mM)与MES-NaOH(50mM,pH 6.5)缓冲液的反应混合物中使用0.2mL测试样本的细胞裂解物,且于37℃培养25分钟。为了停止反应,添加3-4μL的浓缩(18M)H2SO4溶液。之后将样本溶液以0.2μM滤器过滤并以HPLC分析以检测衣康酸、柠檬酸(异柠檬酸)的存在与剩余的顺式乌头酸的量。
结果显示于表5中。
表5
*:对于pTYL101、pTYL102与pTYL103,使用两个随机挑选的克隆体以制备细胞裂解物并独立地执行体外分析。于此列出的结果为来自两个样本的数据的平均值。
#:数据不只包括柠檬酸也包括异柠檬酸,由于此两种化合物的分析的HPLC信号被混杂在一起。
相较于阳性与阴性对照组,表达顺式乌头酸脱羧酶-乌头酸酶融合蛋白(来自pTYL101、pTYL102或pTYL103)的细胞裂解物引起显著量的衣康酸的形成,这指出全部三种类型的顺式乌头酸脱羧酶-乌头酸酶融合蛋白具有顺式乌头酸脱羧酶活性。在顺式乌头酸脱羧酶-乌头酸酶A(来自pTYL101)的情况,将柠檬酸/异柠檬酸的形成,及顺式乌头酸的消耗,与阳性对照组(表达来自pP104A的乌头酸酶A)比较,其支持至少顺式乌头酸脱羧酶-乌头酸酶A具有乌头酸酶活性。已知乌头酸酶B在细胞裂解液中是不稳定的,若没有经过再活化处理,例如补充Fe2+/S2-,将无法检测到活性。此正好是在顺式乌头酸脱羧酶-乌头酸酶B(来自pTYL102)与顺式乌头酸脱羧酶-乌头酸酶B/E424Q(来自pTYL103)的样本裂解物中没有检测到柠檬酸/异柠檬酸的理由。它们的乌头酸酶活性通过下方描述的体内培养分析被显示。
实施例3:从表达cad-aco融合基因的细胞增加顺式乌头酸释放
A.在大肠杆菌SY403K中,具有acnA-acnB-icd-突变的突变株
为了比较在cad-aco融合体与它们的个别相对物(counterparts)之间的衣康酸产生效率,全部以大肠杆菌SY403K宿主细胞为基础的菌株RT001、RT002、RT008与RT010,测试它们产生衣康酸的能力。
以2-3mL的LB培养基(添加抗生素)制备测试样本的隔夜培养物,来自其中的0.2-0.4mL细胞悬浮液被分别种入40mL的发酵培养基(0.5%酵母菌提取物、0.05%蛋白胨、3%甘油、1x M9盐基,pH7.0)维持于250mL-培养瓶中。这些培养瓶首先于30℃或37℃培养伴随旋转(200x rpm),直到细胞OD600nm达到约0.2-0.4。之后添加IPTG至0.5mM浓度且进一步将培养瓶于30℃培养约64小时。在培养期间,在选择的时间从各样本培养瓶移出1mL样本以分析累积于培养基中的衣康酸与顺式乌头酸的量。
如图3所示,显著量的衣康酸累积于带有翻译融合(translational fused)的cad-aco融合基因的细胞中,而此支持这些基因的确编码出有效的双功能性融合蛋白,不只提供衣康酸合成所需的顺式乌头酸脱羧酶活性,且也提供形成顺式乌头酸所需的乌头酸酶活性,而顺式乌头酸为顺式乌头酸脱羧酶的唯一基质。
在这些样本中,须提醒的是,带有acnA的细胞其与cad翻译融合如在RT001中,或与cad转录融合如在RT008中,相较于带有acnB的细胞(即,RT002与RT010),累积较多的衣康酸。由于在宿主细胞中,染色体的acnA与acnB已被删除,RT008与RT010的乌头酸酶活性主要分别来自乌头酸酶A与乌头酸酶B,其各由它们所分别携带的质粒所提供。
特别是,RT002的衣康酸产量甚至高于RT010,此现象支持顺式乌头酸脱羧酶-乌头酸酶融合体对衣康酸生产具有有益的影响,原因则可能源于顺式乌头酸脱羧酶紧密地与乌头酸酶B连接,而能有效捕获顺式乌头酸。此外,当限制顺式乌头酸的补充时,此有益效果更是显著,如同在RT002与RT010的情况,在这些实例中,不论是以个别酶型式或是与顺式乌头酸脱羧酶功能性融合型式存在的乌头酸酶B,其对柠檬酸的高Km值,可能使得乌头酸酶B的实际活性偏低,连带限制顺式乌头酸的补充。
需提醒的是,不论它们的衣康酸产量,顺式乌头酸的释放仅显著增加于带有cad-aco融合基因于质粒上的RT001与RT002中,而不在个别地被表达乌头酸酶A或乌头酸酶B酶的RT008或RT010中。
菌株RT021、RT022、RT023是通过将cad-aco融合基因系统与携带PLlacO1::ppc::gltA操作子的质粒pPC6,共转化进入大肠杆菌SY403K细胞而产生。携带pP104A或pP154A的质粒的对照组RT031与RT032,也以相似的方式来产生。在发酵期间的衣康酸的产生在这些菌株中伴随它们的顺式乌头酸的释放来被比较。
以2-3mL的LB培养基(添加抗生素)来制备测试样本的隔夜培养物,来自其中的0.2-0.4mL细胞悬浮液被分别种入30mL的发酵培养基(0.4%酵母菌提取物、2%甘油、1x M9盐基,pH7.0)维持于250mL-培养瓶中。这些培养瓶首先于30℃或37℃培养伴随旋转(200x rpm),直到细胞OD600nm达到约0.2-0.4。之后添加IPTG至0.5mM浓度且进一步将培养瓶于30℃培养约64小时。在培养期间,在选择的时间从各样本培养瓶移出1mL样本以分析累积于培养基中的衣康酸与顺式乌头酸的量。
结果如图4中所示。显然地,相较于在缺乏pPC6中所获得的产量(参见图3),在所有测试样本中皆观察到在衣康酸产量方面大于10倍的改善,特别是对于被表达个别的酶或以顺式乌头酸脱羧酶-乌头酸酶B融合体的形式的乌头酸酶B的细胞而言。于这些细胞中过量提供柠檬酸,“全力提供”了乌头酸酶B酶能量,导致顺式乌头酸的有效产生,其更进一步“活化”顺式乌头酸脱羧酶于相同细胞中,使得衣康酸产量增加且也释放顺式乌头酸。再次,须提醒的是,在带有cad-aco融合基因的细胞中,顺式乌头酸的释放,显著高于带有转录融合的cad与aco基因的细胞。
B.在大肠杆菌PCI400*中,携带icd-突变的突变株
在大肠杆菌SY403K细胞中,染色体的acnA与acnB基因已被删除。为了测试这些位于染色体的aco基因对于来自cad-aco融合基因的衣康酸产生的影响,我们之后将cad-aco表达系统与pPC6质粒共转化进大肠杆菌PCI400*中,大肠杆菌PCI400*带有icd-删除与未确认的有利于在所使用的发酵培养基中的细胞生长的突变。这些菌株,RT014、RT015、RT017与RT018,在衣康酸的产生产量与所释放的顺式乌头酸的相对量方面,被互相比较。
以2-3mL的LB培养基(添加抗生素)来制备测试样本的隔夜培养物,来自其中的0.2-0.4mL细胞悬浮液被分别种入40mL的发酵培养基(0.5%酵母菌提取物、0.05%蛋白胨、3%甘油、1x M9盐基,pH7.0)维持于250mL-培养瓶中。这些培养瓶首先于30℃或37℃培养伴随旋转(200x rpm),直到细胞OD600nm达到约0.2-0.4。之后添加IPTG至0.5mM浓度且进一步将培养瓶于30℃培养约64小时。在培养期间,在选择的时间从各样本培养瓶移出1mL样本以分析累积于培养基中的衣康酸与顺式乌头酸的量。
如于图5中所示,在这些以PCI400*-为基础的菌株中,所产生的衣康酸及所释放的顺式乌头酸的相对量,与在以SY403K宿主为基础的菌株中所观察到的相似(参见图3与图4),尽管相较于在以SY403K为基础的菌株中,衣康酸的产量在以PCI400*为基础的菌株中似乎较少。
上方测试证实了,表达cad-aco融合基因的细胞释放较多的顺式乌头酸,相较于被表达相似但为个别的cad与aco基因,不论染色体上的aco基因存在与否,及伴随可以过量提供柠檬酸于细胞中的ppc与gltA基因的共-过量表达与否。其也证实上述,在融合构建体上的顺式乌头酸脱羧酶与乌头酸酶酶的紧密连接,的确有益于融合酶的顺式乌头酸脱羧酶部分捕获从在附近的乌头酸酶所释放的顺式乌头酸,且当限制顺式乌头酸的提供时,其更为显著(参见图1)。
实施例4:cad-aco与cad的共-过度表达促进衣康酸的有效产生
测试两种方式来改善顺式乌头酸至衣康酸的转化:首先,选择强的结构性启动子,PCP25(Jensen and Hammer,1998,Biotechnol.Bioeng.5:191-195)以增加cad-acnA基因的表达程度,且为此目的构建了携带PCP25::cad-AcnA基因的质粒pTYL112。其次,将携带PLlacO1::cad基因的质粒pPC1,伴随pPC6以及cad-acnA表达质粒,pTYL101或pTYL112,引入PCI400*细胞中。在这些菌株与对照组中,比较衣康酸的产生产量,于对照组中,携带cad-aco基因的质粒被携带转录融合的cad与acnA基因的pP104A,或pSA40a(为克隆载体)取代。
以2-3mL的LB培养基(添加抗生素)来制备测试样本的隔夜培养物,来自其中的0.2-0.4mL细胞悬浮液被分别种入40mL的发酵培养基(0.4%酵母菌提取物、2%甘油、1xM9盐基,pH7.0)维持于250mL-培养瓶中。这些培养瓶首先于30℃伴随旋转(200xrpm)培养4-5小时。之后不管它们的OD600nm添加IPTG至各样本且至0.5mM浓度,OD600nm记录为在0.06至0.23的范围。进一步将培养瓶于30℃培养。在培养期间,在选择的时间从各样本培养瓶移出1mL样本以分析累积于培养基中的衣康酸与顺式乌头酸的量。
结果显示于图6中。发现相较于在对照组,携带转录融合的cad与acnA基因或空白载体的RT127与RT114中,衣康酸的相对产量在携带cad-acnA融合基因的菌株,RT113与RT101中较高。于RT113中观察到比在RT101中较高的衣康酸产量,可能是因为pTYL112上所带有的PCP25::cad-acnA基因的表达增加。
在RT101与RT127的菌株之间的比较中,于RT101中翻译融合的cad-acnA基因与于RT127中转录融合的cad::acnA基因被相同的IPTG-诱导PLlacO1启动子所触发。然而,RT101并不仅产生较多的衣康酸,且也释放较高量的顺式乌头酸至培养基中。此结果支持双功能性顺式乌头酸脱羧酶-乌头酸酶酶,相较于它们个别的相对物,至少在所测试的条件下,在衣康酸产生方面是更有效的。
在这些菌株中引入pPC1质粒,尽管提供了独立的cad基因的额外来源,但可在细胞中实质上减少这三种质粒的各个的复制数目,由于在它们的中分享了相同的ColE1起始点,且总质粒数目在细胞中被控制。相较于仅携带pPC6与pP104A两个相同质粒的RT017细胞而言,在携带三个质粒的RT127细胞中,前述控制作用可导致pP104A复制数目的减少与来自在此质粒上的PLlacO1::cad::acnA基因的较少表达。为了补充减少的乌头酸酶活性,质粒pP154K,其带有转录融合的PLlacO1::cad::acnB基因,被用来取代在RT109的菌株中的pPC1。之后,在RT109、RT101与RT113的中比较衣康酸产生产量。
以2-3mL的LB培养基(添加抗生素)来制备测试样本的隔夜培养物,来自其中的0.2-0.4mL细胞悬浮液被分别种入30mL的发酵培养基(0.4%酵母菌提取物、2%甘油、1x M9盐基,pH7.0)维持于250mL-培养瓶中。这些培养瓶首先于30℃或37℃培养伴随旋转(200x rpm),直到细胞OD600nm达到约0.2-0.4。之后添加IPTG至0.5mM浓度且进一步将培养瓶于30℃培养。在培养期间,在选择的时间从各样本培养瓶移出1mL样本以分析累积于培养基中的衣康酸与顺式乌头酸的量。
如于图7中所示,RT109的衣康酸产生产量高于RT101,而不像前述在RT127中所观察到的。这些结果指出,在RT109中,来自在pP154K质粒上的PLlacO1::cad::acnB基因的增加的乌头酸酶活性,的确促进了衣康酸产生。在震荡培养下,RT109的衣康酸产量于45小时达到约2.1g/L,并且于70小时达到约2.8g/L,而未调整pH值。
特别是,在RT113中观察到的最高衣康酸产量,在未调整pH值下,于45小时达到约3.2g/L,于70小时达到约4.0g/L,且这些产量显著地高于在RT109中所观察到的衣康酸产量。在RT113细胞中,通过来自pPC6质粒的ppc::gltA基因的过度表达来达成柠檬酸的充足提供;通过于pTYL112质粒上的PCP25::cad-acnA融合基因的增强表达来达到高程度的乌头酸酶与顺式乌头酸脱羧酶活性;此外,进一步增加的顺式乌头酸脱羧酶活性是由携带于pPC1质粒上的个别的cad基因来补充。
实施例5:使用来自解脂耶氏酵母菌的乌头酸酶的双功效顺式乌头酸脱羧酶-乌头酸酶融合酶的构建
乌头酸酶为被发现于不同物种的细胞中的三羧酸循环的关键组成,且为在结构与功能上为高度保守。通过大肠杆菌独特的乌头酸酶B或高度保守的乌头酸酶A,来构建双功能的顺式乌头酸脱羧酶-乌头酸酶酶的成功,强烈暗示了以真核来源的乌头酸酶与顺式乌头酸脱羧酶之间进行功能性融合的可能性。
由于已如上方所提供与描述,可提供cad-aco融合基因以设置用于衣康酸产生的重组的大肠杆菌菌株,并伴随改善的效率。以真核的乌头酸酶为基础的有效的顺式乌头酸脱羧酶-乌头酸酶融合体可具有改善在真核宿主中的衣康酸产量的潜力,前述真核宿主,例如,自然产生者,像是土曲菌,或是,以黑曲菌或解脂耶氏酵母菌为基础的重组株。
对于以真核乌头酸酶为基础的CAD-Aco融合体的构建,我们选择来自解脂耶氏酵母菌的aco1基因(YALI0D09361p;Yli_Aco1),通过与描述于实施例1中相似的方式,来与cad基因融合在一起。为了以一不使用真核宿主的简单方式来测试新构建的CAD-Yaco1融合体的功能性,将所产生的融合基因设计为被表达在,染色体上的acnA与acnB已被删除的大肠杆菌SY403K中。因此,可通过在SY403K宿主中表达融合基因,而从所产生的衣康酸及/或顺式乌头酸的存在,轻易地检测质粒编码的乌头酸酶与顺式乌头酸脱羧酶活性。
Yli_Aco1的DNA序列为由NCBI所维持的Genbank取得。此基因的氨基酸序列高度相似于来自土曲菌的乌头酸酶,乌头酸酶A(登录号码:AAC61778)的序列,具有81.4%的相似度及70.7%的相同度。于Yli_Aco1中发现两个外显子,其中的外显子1是短的且仅包括30nt(编码出前10个氨基酸)。
PCR引物被用来:1)扩增来自解脂耶氏酵母菌的染色体的Yli_Aco1基因的外显子2;2)重建外显子1编码区;3)重建接头区域;4)产生包含具有XbaI切割位点与HindIII切割位点于端点的接头-Yaco1融合体的DNA片段。将引物列于下方表6中。
表6:用于克隆Yli_Aco1与构建PLlacO1::cad-Yaco1融合基因的引物
为了构建pTYL107,其为携带PLlacO1::cad-Yaco1融合基因的表达质粒,将PCR-扩增的接头-Yaco1融合体以XbaI与HindIII酶处理,且之后将其用来置换于pTYL101质粒上。在独特的XbaI与HindIII切割位点之间的acnA编码区。
为了测试在大肠杆菌SY403K中的pTYL107的功能性表达,将于RT024中衣康酸发酵产量与带有功能性cad-aco基因的菌株进行比较,而带有功能性cad-aco基因的菌株包括RT021、RT022与RT023。对于对照组而言,使用带有编码出来自土曲菌的acnA基因的pP190A的菌株RT027,以及带有空白载体pSA40a的RT030。
以2-3mL的LB培养基(添加抗生素)来制备测试样本的隔夜培养物,来自其中的0.2-0.4mL细胞悬浮液被分别种入30mL的发酵培养基(0.4%酵母菌提取物、2%甘油、1xM9盐基,pH7.0)维持于250mL-培养瓶中。这些培养瓶首先于30℃或37℃培养伴随旋转(200xrpm),直到细胞OD600nm达到约0.2-0.4。之后添加IPTG至0.5mM浓度且进一步将培养瓶于30℃培养。在培养期间,在选择的时间从各样本培养瓶移出1mL样本以分析累积于培养基中的衣康酸与顺式乌头酸的量。
结果如于图8中所示。与阳性对照组(RT021、RT022与RT023)相似,在RT024的培养基中检测到显著量的衣康酸与顺式乌头酸,尽管衣康酸的产量相当的少。这些结果强烈地支持表达于RT024中CAD-Yaco1是双功能性的,能够将细胞的柠檬酸转化成顺式乌头酸,并将顺式乌头酸转化成衣康酸。于RT024中所发现的相对低的衣康酸产量是可被合理地接受的,由于在异质性(heterogeneous)的大肠杆菌宿主中的Yli_Aco1的乌头酸酶活性很可能是低的。此观点由在菌株RT027中所观察到的顺式乌头酸的低产量所支持,菌株RT027独立地被表达来自异质性的土曲菌的乌头酸酶A。
其它实施例
于此说明书中所揭露的所有特征可被以任何组合形式来进行组合。于此说明书中所揭露的各个特征,可以适合相同、相等或相似目的的替代特征所取代。因此,除非特别以其它方式陈述,所揭露的各特征仅为一般系列的相等或相似特征的一个例子。
自上方说明,该技术领域中具有通常知识者可轻易地确认所述实施例的必要特征,且不超出其精神与范围的情况下而可做出实施例的各种改变与修饰,以使其适合各种用途与情况。因此,其它实施例也在申请专利范围的中。对于该技术领域中具有通常知识者而言,可对所揭露的实施例做出各种修饰与变化是明显的。所意指为,说明书与实施例仅被视为示例,伴随所揭露的实际范围由权利要求书及其等同物所指出。
参考文献
1.Tsuchiya,et al.(2008)Versatile architechure of a bacterial aconitase Band its catalytic performance in the sequential reaction coupled with isocitratedehydrogenase.Biochim.Biophysi.Acta 1784:1847-1856
2.Dwiarti,et al.(2002)Purification and characterization of cis-aconiticacid decarboxylase from Aspergillus terreus TN484-M1.J.Biosci.Bioeng.94:29-33
3.Jordan,PA,et al.(1999)Biochemical and spectroscopic characterizationof Escherichia coli aconitase(AcnA and AcnB).Biochem.J.344:739-746
4.Williams,CH,et al.(2002)E.coli aconitase B structure reveals aHEAT-like domain with implications for protein-protein recognition.NatureStructural Bio.9:447-452
5.Varghese,S.et al.(2003)Contrasting sensitivities of Escherichia coliaconitases A and B to oxidation and iron depletion.J.Bacteriol.185:221-230
6.Jensen PR.,and Hammer K.(1998)Artificial promoters for metabolicoptimization.Biotechnol.Bioeng.5:191-195
7.Steiger MG.,et al.(2013)Biochemistry of microbial itaconic acidproduction.Front.Microbio.4:23.doi:10.3389/fmicb.2013.00023
8.Blumhoff,M.,et al.(2013)Targeting enzymes to the right compartment:metabolic engineering for itaconic acid production by Aspergillus niger.Metab.Eng.19:26-32
Claims (30)
1.一种融合多肽,包括乌头酸酶Aco与顺式乌头酸脱羧酶CAD,其中该多肽显示出乌头酸酶活性与顺式乌头酸脱羧酶活性。
2.根据权利要求1所述的融合多肽,其中该顺式乌头酸脱羧酶在该多肽的N端部分中。
3.根据权利要求2所述的融合多肽,还包括介于该乌头酸酶与该顺式乌头酸脱羧酶之间的接头。
4.根据权利要求3所述的融合多肽,其中该乌头酸酶为大肠杆菌乌头酸酶A(AcnA)或乌头酸酶B(AcnB)。
5.根据权利要求1所述的融合多肽,其中该乌头酸酶为真核的乌头酸酶。
6.根据权利要求4所述的融合多肽,其中该乌头酸酶B(AcnB)为乌头酸酶B(AcnB)E424Q突变。
7.根据权利要求1所述的融合多肽,其中该顺式乌头酸脱羧酶为顺式乌头酸脱羧酶V490GI突变。
8.根据权利要求1所述的融合多肽,其中该融合多肽具有SEQ ID No:9、11、13或15的氨基酸序列。
9.一种核酸分子,包括编码出根据权利要求1所述的融合多肽的一核酸序列。
10.一种表达载体,包括编码出根据权利要求1所述的融合多肽的核酸序列与有效连接至该核酸序列的启动子。
11.一种经基因修饰的细胞,包括编码出根据权利要求1所述的融合多肽的核酸序列与有效连接至该核酸序列的启动子。
12.根据权利要求11所述的经基因修饰的细胞,其中该细胞为大肠杆菌细胞,而该启动子为大肠杆菌可诱导型或组成型启动子。
13.根据权利要求11所述的经基因修饰的细胞,其中该细胞为真核细胞,而该启动子为真核的可诱导型或组成型启动子。
14.根据权利要求12所述的经基因修饰的细胞,其中该顺式乌头酸脱羧酶在该多肽的N端部分中。
15.根据权利要求14所述的经基因修饰的细胞,其中该顺式乌头酸脱羧酶与该乌头酸酶为通过接头来连接。
16.根据权利要求15所述的经基因修饰的细胞,其中该乌头酸酶为大肠杆菌乌头酸酶A(AcnA)或乌头酸酶B(AcnB)。
17.根据权利要求15所述的经基因修饰的细胞,其中该乌头酸酶为真核的乌头酸酶。
18.根据权利要求16所述的经基因修饰的细胞,其中该乌头酸酶B(AcnB)为乌头酸酶B(AcnB)E424Q突变。
19.根据权利要求16所述的经基因修饰的细胞,其中该乌头酸酶为大肠杆菌乌头酸酶A(AcnA)。
20.根据权利要求17所述的经基因修饰的细胞,其中该乌头酸酶为酵母菌乌头酸酶。
21.根据权利要求14所述的经基因修饰的细胞,其中该顺式乌头酸脱羧酶为顺式乌头酸脱羧酶V490GI突变。
22.根据权利要求21所述的经基因修饰的细胞,其中该细胞为icd功能缺乏型(icd-)。
23.根据权利要求21所述的经基因修饰的细胞,还包括ppc基因与gltA基因。
24.根据权利要求23所述的经基因修饰的细胞,还包括另AcnA基因与另一AcnB基因。
25.根据权利要求24所述的经基因修饰的细胞,还包括土曲菌(Aspergillus terreus)顺式乌头酸脱羧酶基因。
26.根据权利要求11所述的经基因修饰的细胞,其中该启动子为PCP25启动子。
27.根据权利要求11所述的经基因修饰的细胞,其中该细胞产生衣康酸。
28.一种产生衣康酸的方法,包括将根据权利要求11所述的经基因修饰的细胞培养于用以产生衣康酸的培养基中,由此该细胞产生衣康酸。
29.根据权利要求28所述的产生衣康酸的方法,还包括分离该衣康酸。
30.一种产生衣康酸的方法,包括:
产生经基因修饰的细胞,其表达根据权利要求1所述的融合多肽;以及
在允许该融合多肽表达与衣康酸产生的条件下培养该细胞,由此该细胞表达该多肽并产生衣康酸。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461955468P | 2014-03-19 | 2014-03-19 | |
US61/955,468 | 2014-03-19 | ||
TW104107863 | 2015-03-12 | ||
TW104107863A TWI628191B (zh) | 2014-03-19 | 2015-03-12 | 融合多胜肽、編碼此融合多胜肽之核酸分子、含此核酸分子之載體或細胞以及藉由此細胞產生衣康酸的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104928272A true CN104928272A (zh) | 2015-09-23 |
Family
ID=54115699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510121385.1A Pending CN104928272A (zh) | 2014-03-19 | 2015-03-19 | 融合多肽、编码它的核酸分子以及使用它产生衣康酸的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104928272A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107723317A (zh) * | 2017-11-29 | 2018-02-23 | 华东理工大学 | 一种在大肠杆菌中生产衣康酸的方法 |
CN110036114A (zh) * | 2016-08-26 | 2019-07-19 | 勒萨弗尔公司 | 提高的衣康酸生产 |
CN110527637A (zh) * | 2019-07-18 | 2019-12-03 | 中国科学院青岛生物能源与过程研究所 | 一种产乌头酸的土曲霉菌株及其构建方法与应用 |
CN113454228A (zh) * | 2018-12-21 | 2021-09-28 | 伊莱利利公司 | 抗angptl3/8复合物抗体和使用所述抗体的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101993899A (zh) * | 2009-08-25 | 2011-03-30 | 财团法人工业技术研究院 | 在酵母菌中产生衣康酸的方法 |
-
2015
- 2015-03-19 CN CN201510121385.1A patent/CN104928272A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101993899A (zh) * | 2009-08-25 | 2011-03-30 | 财团法人工业技术研究院 | 在酵母菌中产生衣康酸的方法 |
Non-Patent Citations (3)
Title |
---|
DAISUKE TSUCHIYA ET AL.: "Versatile architecture of a bacterial aconitase B and its catalytic performance in the sequential reaction coupled with isocitrate dehydrogenase", 《BIOCHIMICA ET BIOPHYSICA ACTA》 * |
诸丽萍等: "衣康酸的生产、应用和前景", 《衣康酸的生产、应用和前景》 * |
黄子亮等: "融合酶的设计和应用研究进展", 《生物工程学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110036114A (zh) * | 2016-08-26 | 2019-07-19 | 勒萨弗尔公司 | 提高的衣康酸生产 |
CN110036114B (zh) * | 2016-08-26 | 2023-09-29 | 勒萨弗尔公司 | 提高的衣康酸生产 |
CN107723317A (zh) * | 2017-11-29 | 2018-02-23 | 华东理工大学 | 一种在大肠杆菌中生产衣康酸的方法 |
CN113454228A (zh) * | 2018-12-21 | 2021-09-28 | 伊莱利利公司 | 抗angptl3/8复合物抗体和使用所述抗体的方法 |
CN110527637A (zh) * | 2019-07-18 | 2019-12-03 | 中国科学院青岛生物能源与过程研究所 | 一种产乌头酸的土曲霉菌株及其构建方法与应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101814888B1 (ko) | 5-아미노레불린산 고수율 균주 및 이의 제조방법과 응용 | |
US11225675B2 (en) | D-lactate dehydrogenase, engineered strain containing D-lactate dehydrogenase and construction method and use of engineered strain | |
CN109536398A (zh) | 用于产量增加的方法中的重组体微生物 | |
CN113564193B (zh) | 一种微生物基因表达命运共同体及其构建方法和应用 | |
CN105283554A (zh) | 表现出提高的通过发酵途径的通量的重组微生物 | |
CN108103039B (zh) | 一组岩藻糖基转移酶突变体及其筛选方法和应用 | |
CN104928272A (zh) | 融合多肽、编码它的核酸分子以及使用它产生衣康酸的方法 | |
CN111748535B (zh) | 一种丙氨酸脱氢酶突变体及其在发酵生产l-丙氨酸中的应用 | |
CN105713883B (zh) | 一种l-脯氨酸-4-羟基化酶及其应用 | |
CN110904072B (zh) | 一种新型磷脂酶d及其制备功能性磷脂的方法 | |
JP2017534268A (ja) | 有用産物の生産のための改変微生物および方法 | |
WO2019008131A1 (en) | PSEUDOMONAS PUTIDA RECOMBINANT FOR THE PRODUCTION OF D-XYLONATE FROM D-XYLOSE | |
CN106574236A (zh) | 遗传修饰的产生(r)‑乳酸的嗜热细菌 | |
KR100702728B1 (ko) | 환상 뎁시펩티드 합성효소 및 그의 유전자 및 환상뎁시펩티드의 대량생산계 | |
CN112867790B (zh) | 提高苹果酸产量的新突变蛋白 | |
US9803209B2 (en) | Bacterial mutants with improved transformation efficiency | |
TWI628191B (zh) | 融合多胜肽、編碼此融合多胜肽之核酸分子、含此核酸分子之載體或細胞以及藉由此細胞產生衣康酸的方法 | |
US20220127648A1 (en) | Genetically engineered yeast yarrowia lipolytica and methods for producing bio-based glycolic acid | |
KR101775226B1 (ko) | 페리플라즘으로 분비되는 지방산 이중결합 수화효소를 이용한 히드록시지방산 제조방법 | |
KR20200023450A (ko) | 기능적 dna 서열의 안정화된 카피 수를 갖는 미생물 및 관련 방법 | |
WO2019108836A1 (en) | Methods for thaxtomin production in engineered non-native streptomyces in the absence of cellobiose | |
US12012434B2 (en) | Mutant transporters for bacterial uptake of terephthalic acid | |
EP1231266A1 (en) | Arabidopsis-origin gdp-4-keto-6-deoxy-d-mannose-3,5-epimerase-4-reductase gene | |
Sánchez et al. | Microbial Synthesis of Secondary Metabolites and Strain Improvement: Current Trends and Future Prospects | |
CN112522231B (zh) | 一种酰基转移酶及其编码基因和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150923 |
|
RJ01 | Rejection of invention patent application after publication |