CN112672989A - 工程化苯丙氨酸氨裂合酶多肽 - Google Patents
工程化苯丙氨酸氨裂合酶多肽 Download PDFInfo
- Publication number
- CN112672989A CN112672989A CN201980059859.0A CN201980059859A CN112672989A CN 112672989 A CN112672989 A CN 112672989A CN 201980059859 A CN201980059859 A CN 201980059859A CN 112672989 A CN112672989 A CN 112672989A
- Authority
- CN
- China
- Prior art keywords
- ammonia lyase
- phenylalanine ammonia
- sequence
- engineered
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108700023158 Phenylalanine ammonia-lyases Proteins 0.000 title claims abstract description 401
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 383
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 376
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 374
- 239000002157 polynucleotide Substances 0.000 claims abstract description 112
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 111
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 111
- 238000000034 method Methods 0.000 claims abstract description 107
- 238000004519 manufacturing process Methods 0.000 claims abstract description 44
- 239000000203 mixture Substances 0.000 claims abstract description 30
- 238000006467 substitution reaction Methods 0.000 claims description 148
- 150000001413 amino acids Chemical group 0.000 claims description 117
- 239000012634 fragment Substances 0.000 claims description 89
- 239000013604 expression vector Substances 0.000 claims description 26
- 108020004705 Codon Proteins 0.000 claims description 24
- 229940125782 compound 2 Drugs 0.000 claims description 16
- 239000002609 medium Substances 0.000 claims description 9
- 239000001963 growth medium Substances 0.000 claims description 8
- 241000078013 Trichormus variabilis Species 0.000 claims description 7
- 238000012258 culturing Methods 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 abstract description 24
- 230000003197 catalytic effect Effects 0.000 abstract description 7
- 210000004027 cell Anatomy 0.000 description 182
- 235000001014 amino acid Nutrition 0.000 description 165
- 229940024606 amino acid Drugs 0.000 description 112
- 108090000623 proteins and genes Proteins 0.000 description 98
- 102000004190 Enzymes Human genes 0.000 description 92
- 108090000790 Enzymes Proteins 0.000 description 92
- 229940088598 enzyme Drugs 0.000 description 92
- 125000003275 alpha amino acid group Chemical group 0.000 description 82
- 238000006243 chemical reaction Methods 0.000 description 63
- 230000000694 effects Effects 0.000 description 54
- 230000014509 gene expression Effects 0.000 description 39
- 150000007523 nucleic acids Chemical class 0.000 description 39
- 239000013598 vector Substances 0.000 description 33
- -1 amine compounds Chemical class 0.000 description 32
- 239000000758 substrate Substances 0.000 description 29
- 102000004169 proteins and genes Human genes 0.000 description 28
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 27
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 27
- 239000006166 lysate Substances 0.000 description 26
- 108091026890 Coding region Proteins 0.000 description 25
- 239000000047 product Substances 0.000 description 25
- 230000001580 bacterial effect Effects 0.000 description 24
- 238000002703 mutagenesis Methods 0.000 description 22
- 231100000350 mutagenesis Toxicity 0.000 description 22
- 235000018102 proteins Nutrition 0.000 description 22
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 125000000539 amino acid group Chemical group 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 125000001072 heteroaryl group Chemical group 0.000 description 17
- 241000894007 species Species 0.000 description 17
- 108010076504 Protein Sorting Signals Proteins 0.000 description 16
- 125000000217 alkyl group Chemical group 0.000 description 16
- 125000003118 aryl group Chemical group 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 15
- 230000002538 fungal effect Effects 0.000 description 15
- 239000002773 nucleotide Substances 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 15
- 230000006798 recombination Effects 0.000 description 15
- 238000005215 recombination Methods 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 14
- 238000007792 addition Methods 0.000 description 14
- 230000009286 beneficial effect Effects 0.000 description 14
- 125000004432 carbon atom Chemical group C* 0.000 description 14
- 230000002255 enzymatic effect Effects 0.000 description 14
- 230000010076 replication Effects 0.000 description 14
- 238000012216 screening Methods 0.000 description 14
- 239000000126 substance Substances 0.000 description 14
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 241000193830 Bacillus <bacterium> Species 0.000 description 12
- 229960005091 chloramphenicol Drugs 0.000 description 12
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 12
- 238000000855 fermentation Methods 0.000 description 12
- 230000004151 fermentation Effects 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 12
- 102220330036 rs1555864368 Human genes 0.000 description 12
- 241001467578 Microbacterium Species 0.000 description 11
- 239000002253 acid Substances 0.000 description 11
- 239000002777 nucleoside Substances 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 11
- 102200101796 rs72554307 Human genes 0.000 description 11
- 125000001424 substituent group Chemical group 0.000 description 11
- 240000006439 Aspergillus oryzae Species 0.000 description 10
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 10
- 108700010070 Codon Usage Proteins 0.000 description 10
- 102000053602 DNA Human genes 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 10
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 10
- 241000235648 Pichia Species 0.000 description 10
- 230000002209 hydrophobic effect Effects 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 235000014469 Bacillus subtilis Nutrition 0.000 description 9
- 241000235058 Komagataella pastoris Species 0.000 description 9
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 9
- 230000002378 acidificating effect Effects 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 241000351920 Aspergillus nidulans Species 0.000 description 8
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical group N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 244000063299 Bacillus subtilis Species 0.000 description 8
- 241000186660 Lactobacillus Species 0.000 description 8
- 241000187747 Streptomyces Species 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 8
- 125000005842 heteroatom Chemical group 0.000 description 8
- 125000000623 heterocyclic group Chemical group 0.000 description 8
- 229940039696 lactobacillus Drugs 0.000 description 8
- 229960005190 phenylalanine Drugs 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 239000002904 solvent Substances 0.000 description 8
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 7
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 7
- 239000004284 Heptyl p-hydroxybenzoate Substances 0.000 description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 7
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 7
- 241000194017 Streptococcus Species 0.000 description 7
- 150000007513 acids Chemical class 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000004128 high performance liquid chromatography Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000008488 polyadenylation Effects 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- 239000004382 Amylase Substances 0.000 description 6
- 108010065511 Amylases Proteins 0.000 description 6
- 102000013142 Amylases Human genes 0.000 description 6
- 241000186063 Arthrobacter Species 0.000 description 6
- 102220471083 Aryl hydrocarbon receptor_R40D_mutation Human genes 0.000 description 6
- 241000228245 Aspergillus niger Species 0.000 description 6
- 241000194108 Bacillus licheniformis Species 0.000 description 6
- 241000194107 Bacillus megaterium Species 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 241000186216 Corynebacterium Species 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 241000588722 Escherichia Species 0.000 description 6
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- BVCZEBOGSOYJJT-UHFFFAOYSA-N ammonium carbamate Chemical compound [NH4+].NC([O-])=O BVCZEBOGSOYJJT-UHFFFAOYSA-N 0.000 description 6
- 235000019418 amylase Nutrition 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- KXDHJXZQYSOELW-UHFFFAOYSA-N carbonic acid monoamide Natural products NC(O)=O KXDHJXZQYSOELW-UHFFFAOYSA-N 0.000 description 6
- 125000000753 cycloalkyl group Chemical group 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 210000005253 yeast cell Anatomy 0.000 description 6
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 5
- 150000008574 D-amino acids Chemical class 0.000 description 5
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 5
- YLQBMQCUIZJEEH-UHFFFAOYSA-N Furan Chemical compound C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 102220471907 Glycosylphosphatidylinositol-anchored high density lipoprotein-binding protein 1_Y66A_mutation Human genes 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- 241000192041 Micrococcus Species 0.000 description 5
- 241000520272 Pantoea Species 0.000 description 5
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 5
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 5
- 241000589516 Pseudomonas Species 0.000 description 5
- 241000223259 Trichoderma Species 0.000 description 5
- 241000588901 Zymomonas Species 0.000 description 5
- 229960003767 alanine Drugs 0.000 description 5
- 125000003342 alkenyl group Chemical group 0.000 description 5
- 125000000304 alkynyl group Chemical group 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical group [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 239000001110 calcium chloride Substances 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 5
- 238000011068 loading method Methods 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 102200075465 rs878855319 Human genes 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- 241000589158 Agrobacterium Species 0.000 description 4
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 4
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 4
- 241000193403 Clostridium Species 0.000 description 4
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 241000223218 Fusarium Species 0.000 description 4
- 241000223221 Fusarium oxysporum Species 0.000 description 4
- 102220566453 GDNF family receptor alpha-1_Y66F_mutation Human genes 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- 150000008575 L-amino acids Chemical class 0.000 description 4
- 241000588912 Pantoea agglomerans Species 0.000 description 4
- 241000588696 Pantoea ananatis Species 0.000 description 4
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 4
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 4
- 241000235403 Rhizomucor miehei Species 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000191940 Staphylococcus Species 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- YTPLMLYBLZKORZ-UHFFFAOYSA-N Thiophene Chemical compound C=1C=CSC=1 YTPLMLYBLZKORZ-UHFFFAOYSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 108090000637 alpha-Amylases Proteins 0.000 description 4
- XSCHRSMBECNVNS-UHFFFAOYSA-N benzopyrazine Natural products N1=CC=NC2=CC=CC=C21 XSCHRSMBECNVNS-UHFFFAOYSA-N 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 239000001177 diphosphate Substances 0.000 description 4
- 235000011180 diphosphates Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000006911 enzymatic reaction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- RDOWQLZANAYVLL-UHFFFAOYSA-N phenanthridine Chemical compound C1=CC=C2C3=CC=CC=C3C=NC2=C1 RDOWQLZANAYVLL-UHFFFAOYSA-N 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 239000011593 sulfur Chemical group 0.000 description 4
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 3
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonium chloride Substances [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 3
- 108010037870 Anthranilate Synthase Proteins 0.000 description 3
- 241001328122 Bacillus clausii Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- 101710154606 Hemagglutinin Proteins 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 3
- 102100027612 Kallikrein-11 Human genes 0.000 description 3
- 241000186984 Kitasatospora aureofaciens Species 0.000 description 3
- 241000235649 Kluyveromyces Species 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 150000008547 L-phenylalanines Chemical class 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- 241000589323 Methylobacterium Species 0.000 description 3
- 229930182474 N-glycoside Natural products 0.000 description 3
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 3
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 3
- PCNDJXKNXGMECE-UHFFFAOYSA-N Phenazine Natural products C1=CC=CC2=NC3=CC=CC=C3N=C21 PCNDJXKNXGMECE-UHFFFAOYSA-N 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 101710176177 Protein A56 Proteins 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 101000959719 Rattus norvegicus AP-3 complex subunit mu-1 Proteins 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 241000120541 Rhizophora Species 0.000 description 3
- 241000235527 Rhizopus Species 0.000 description 3
- 241000190932 Rhodopseudomonas Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 3
- 241000256248 Spodoptera Species 0.000 description 3
- 241000187432 Streptomyces coelicolor Species 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 101710152431 Trypsin-like protease Proteins 0.000 description 3
- 108010052982 Tyrosine 2,3-aminomutase Proteins 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 125000001931 aliphatic group Chemical group 0.000 description 3
- 125000003545 alkoxy group Chemical group 0.000 description 3
- 125000004453 alkoxycarbonyl group Chemical group 0.000 description 3
- 102000004139 alpha-Amylases Human genes 0.000 description 3
- 229940024171 alpha-amylase Drugs 0.000 description 3
- 238000005576 amination reaction Methods 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 229910021529 ammonia Inorganic materials 0.000 description 3
- 239000001099 ammonium carbonate Substances 0.000 description 3
- 235000012501 ammonium carbonate Nutrition 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000002210 biocatalytic effect Effects 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 150000002341 glycosylamines Chemical class 0.000 description 3
- 239000008187 granular material Substances 0.000 description 3
- 229910052736 halogen Inorganic materials 0.000 description 3
- 150000002367 halogens Chemical class 0.000 description 3
- 125000004447 heteroarylalkenyl group Chemical group 0.000 description 3
- 125000005312 heteroarylalkynyl group Chemical group 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 125000001820 oxy group Chemical group [*:1]O[*:2] 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 125000004076 pyridyl group Chemical group 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 125000006413 ring segment Chemical group 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 102200044494 rs28903098 Human genes 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 125000000547 substituted alkyl group Chemical group 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 125000003396 thiol group Chemical group [H]S* 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- GHBCIXGRCZIPNQ-MHZLTWQESA-N (3s)-2-(2,2-diphenylacetyl)-6-methoxy-5-phenylmethoxy-3,4-dihydro-1h-isoquinoline-3-carboxylic acid Chemical compound C([C@H](N(CC1=CC=C2OC)C(=O)C(C=3C=CC=CC=3)C=3C=CC=CC=3)C(O)=O)C1=C2OCC1=CC=CC=C1 GHBCIXGRCZIPNQ-MHZLTWQESA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 description 2
- TZMSYXZUNZXBOL-UHFFFAOYSA-N 10H-phenoxazine Chemical compound C1=CC=C2NC3=CC=CC=C3OC2=C1 TZMSYXZUNZXBOL-UHFFFAOYSA-N 0.000 description 2
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- HBEDSQVIWPRPAY-UHFFFAOYSA-N 2,3-dihydrobenzofuran Chemical compound C1=CC=C2OCCC2=C1 HBEDSQVIWPRPAY-UHFFFAOYSA-N 0.000 description 2
- VEPOHXYIFQMVHW-XOZOLZJESA-N 2,3-dihydroxybutanedioic acid (2S,3S)-3,4-dimethyl-2-phenylmorpholine Chemical compound OC(C(O)C(O)=O)C(O)=O.C[C@H]1[C@@H](OCCN1C)c1ccccc1 VEPOHXYIFQMVHW-XOZOLZJESA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- GDRVFDDBLLKWRI-UHFFFAOYSA-N 4H-quinolizine Chemical compound C1=CC=CN2CC=CC=C21 GDRVFDDBLLKWRI-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- FVEPUQVTLVLBMB-UHFFFAOYSA-N 5-methylidene-1h-imidazol-4-one Chemical compound C=C1N=CNC1=O FVEPUQVTLVLBMB-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 101150079978 AGRN gene Proteins 0.000 description 2
- 241001578974 Achlya <moth> Species 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 102100040026 Agrin Human genes 0.000 description 2
- 108700019743 Agrin Proteins 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 2
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000186074 Arthrobacter globiformis Species 0.000 description 2
- 241000235349 Ascomycota Species 0.000 description 2
- 102000035101 Aspartic proteases Human genes 0.000 description 2
- 108091005502 Aspartic proteases Proteins 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 241000589151 Azotobacter Species 0.000 description 2
- 241000193752 Bacillus circulans Species 0.000 description 2
- 241000193747 Bacillus firmus Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 2
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 2
- 101000755953 Bacillus subtilis (strain 168) Ribosome maturation factor RimP Proteins 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 241000589876 Campylobacter Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000146399 Ceriporiopsis Species 0.000 description 2
- 241000123346 Chrysosporium Species 0.000 description 2
- 241000193401 Clostridium acetobutylicum Species 0.000 description 2
- 241000193454 Clostridium beijerinckii Species 0.000 description 2
- 241000193468 Clostridium perfringens Species 0.000 description 2
- 241001552623 Clostridium tetani E88 Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 241001246273 Endothia Species 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102220467058 Enteropeptidase_N68A_mutation Human genes 0.000 description 2
- 102000010911 Enzyme Precursors Human genes 0.000 description 2
- 108010062466 Enzyme Precursors Proteins 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 108091060211 Expressed sequence tag Proteins 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241000606790 Haemophilus Species 0.000 description 2
- 241000589989 Helicobacter Species 0.000 description 2
- 102000030789 Histidine Ammonia-Lyase Human genes 0.000 description 2
- 108700006308 Histidine ammonia-lyases Proteins 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 241001468191 Lactobacillus kefiri Species 0.000 description 2
- 241000194036 Lactococcus Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 241000970829 Mesorhizobium Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- 241001467552 Mycobacterium bovis BCG Species 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- SBKRTALNRRAOJP-BWSIXKJUSA-N N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methylheptanamide (6S)-N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methyloctanamide sulfuric acid Chemical compound OS(O)(=O)=O.CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O.CC[C@H](C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O SBKRTALNRRAOJP-BWSIXKJUSA-N 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241000194109 Paenibacillus lautus Species 0.000 description 2
- 241000588701 Pectobacterium carotovorum Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 2
- 108010093965 Polymyxin B Proteins 0.000 description 2
- 101001121531 Pseudomonas chlororaphis 47 kDa protein Proteins 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 102220495689 Putative uncharacterized protein FLJ43944_R40A_mutation Human genes 0.000 description 2
- KYQCOXFCLRTKLS-UHFFFAOYSA-N Pyrazine Chemical compound C1=CN=CC=N1 KYQCOXFCLRTKLS-UHFFFAOYSA-N 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- 241000187561 Rhodococcus erythropolis Species 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194054 Streptococcus uberis Species 0.000 description 2
- 241000971005 Streptomyces fungicidicus Species 0.000 description 2
- 241000187392 Streptomyces griseus Species 0.000 description 2
- 241000187398 Streptomyces lividans Species 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000202898 Ureaplasma Species 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 2
- 241001507667 Volvariella Species 0.000 description 2
- 241000589634 Xanthomonas Species 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- DGEZNRSVGBDHLK-UHFFFAOYSA-N [1,10]phenanthroline Chemical compound C1=CN=C2C3=NC=CC=C3C=CC2=C1 DGEZNRSVGBDHLK-UHFFFAOYSA-N 0.000 description 2
- 108010048241 acetamidase Proteins 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 229960003121 arginine Drugs 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 229960000190 bacillus calmette–guérin vaccine Drugs 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 150000003857 carboxamides Chemical class 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 238000011098 chromatofocusing Methods 0.000 description 2
- 235000013985 cinnamic acid Nutrition 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 239000005289 controlled pore glass Substances 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 125000004404 heteroalkyl group Chemical group 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- MTNDZQHUAFNZQY-UHFFFAOYSA-N imidazoline Chemical compound C1CN=CN1 MTNDZQHUAFNZQY-UHFFFAOYSA-N 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 238000003317 immunochromatography Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- AWJUIBRHMBBTKR-UHFFFAOYSA-N isoquinoline Chemical compound C1=NC=CC2=CC=CC=C21 AWJUIBRHMBBTKR-UHFFFAOYSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 2
- 229940124280 l-arginine Drugs 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000002934 lysing effect Effects 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 125000001624 naphthyl group Chemical group 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000007833 oxidative deamination reaction Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 229950000688 phenothiazine Drugs 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- LFSXCDWNBUNEEM-UHFFFAOYSA-N phthalazine Chemical compound C1=NN=CC2=CC=CC=C21 LFSXCDWNBUNEEM-UHFFFAOYSA-N 0.000 description 2
- 125000003386 piperidinyl group Chemical group 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229960003548 polymyxin b sulfate Drugs 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002342 ribonucleoside Substances 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 102200096874 rs104894801 Human genes 0.000 description 2
- 102220004067 rs104894910 Human genes 0.000 description 2
- 102220058279 rs28903098 Human genes 0.000 description 2
- 102220277134 rs776745497 Human genes 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 229940124530 sulfonamide Drugs 0.000 description 2
- 150000003456 sulfonamides Chemical class 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000008961 swelling Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 229930192474 thiophene Natural products 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- WBYWAXJHAXSJNI-VOTSOKGWSA-N trans-cinnamic acid Chemical compound OC(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- WOFPJDJFPVDIQV-AWEZNQCLSA-N (2s)-2-amino-3-(3-methoxy-2-phenylmethoxyphenyl)propanoic acid Chemical compound COC1=CC=CC(C[C@H](N)C(O)=O)=C1OCC1=CC=CC=C1 WOFPJDJFPVDIQV-AWEZNQCLSA-N 0.000 description 1
- ASWBNKHCZGQVJV-UHFFFAOYSA-N (3-hexadecanoyloxy-2-hydroxypropyl) 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(O)COP([O-])(=O)OCC[N+](C)(C)C ASWBNKHCZGQVJV-UHFFFAOYSA-N 0.000 description 1
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 description 1
- BAXOFTOLAUCFNW-UHFFFAOYSA-N 1H-indazole Chemical compound C1=CC=C2C=NNC2=C1 BAXOFTOLAUCFNW-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 1
- VLRSADZEDXVUPG-UHFFFAOYSA-N 2-naphthalen-1-ylpyridine Chemical compound N1=CC=CC=C1C1=CC=CC2=CC=CC=C12 VLRSADZEDXVUPG-UHFFFAOYSA-N 0.000 description 1
- VHMICKWLTGFITH-UHFFFAOYSA-N 2H-isoindole Chemical compound C1=CC=CC2=CNC=C21 VHMICKWLTGFITH-UHFFFAOYSA-N 0.000 description 1
- MGADZUXDNSDTHW-UHFFFAOYSA-N 2H-pyran Chemical compound C1OC=CC=C1 MGADZUXDNSDTHW-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241000266272 Acidithiobacillus Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 102000005862 Angiotensin II Human genes 0.000 description 1
- 101800000733 Angiotensin-2 Proteins 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108050008359 Aromatic amino acid lyases Proteins 0.000 description 1
- 102000000050 Aromatic amino acid lyases Human genes 0.000 description 1
- 241000185996 Arthrobacter citreus Species 0.000 description 1
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 1
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 1
- 241000980809 Aspergillus aureus Species 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 108010045681 Bacillus stearothermophilus neutral protease Proteins 0.000 description 1
- 101900040182 Bacillus subtilis Levansucrase Proteins 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- 241001453698 Buchnera <proteobacteria> Species 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001619326 Cephalosporium Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 241000190831 Chromatium Species 0.000 description 1
- WBYWAXJHAXSJNI-SREVYHEPSA-N Cinnamic acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1 WBYWAXJHAXSJNI-SREVYHEPSA-N 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 241000222290 Cladosporium Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 241000361255 Diogenes Species 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241001454374 Drosophila <fruit fly, subgenus> Species 0.000 description 1
- 101100085603 Drosophila melanogaster nclb gene Proteins 0.000 description 1
- 108700036505 EC 4.3.1.5 Proteins 0.000 description 1
- 240000000664 Eriochloa polystachya Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 101100390711 Escherichia coli (strain K12) fhuA gene Proteins 0.000 description 1
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 1
- PMVSDNDAUGGCCE-TYYBGVCCSA-L Ferrous fumarate Chemical compound [Fe+2].[O-]C(=O)\C=C\C([O-])=O PMVSDNDAUGGCCE-TYYBGVCCSA-L 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 241000896533 Gliocladium Species 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 241001401556 Glutamicibacter mysorens Species 0.000 description 1
- 241001524188 Glutamicibacter nicotianae Species 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 102220466693 Histone H4 transcription factor_S22P_mutation Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- JPXZQMKKFWMMGK-KQYNXXCUSA-N IDP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(N=CNC2=O)=C2N=C1 JPXZQMKKFWMMGK-KQYNXXCUSA-N 0.000 description 1
- CZGUSIXMZVURDU-JZXHSEFVSA-N Ile(5)-angiotensin II Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=[NH2+])NC(=O)[C@@H]([NH3+])CC([O-])=O)C(C)C)C1=CC=C(O)C=C1 CZGUSIXMZVURDU-JZXHSEFVSA-N 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- WRYCSMQKUKOKBP-UHFFFAOYSA-N Imidazolidine Chemical compound C1CNCN1 WRYCSMQKUKOKBP-UHFFFAOYSA-N 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- QUOGESRFPZDMMT-UHFFFAOYSA-N L-Homoarginine Natural products OC(=O)C(N)CCCCNC(N)=N QUOGESRFPZDMMT-UHFFFAOYSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- QUOGESRFPZDMMT-YFKPBYRVSA-N L-homoarginine Chemical compound OC(=O)[C@@H](N)CCCCNC(N)=N QUOGESRFPZDMMT-YFKPBYRVSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100032166 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr5 gene Proteins 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 241000489469 Ogataea kodamae Species 0.000 description 1
- 241000826199 Ogataea wickerhamii Species 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102100028200 Ornithine transcarbamylase, mitochondrial Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- ZCQWOFVYLHDMMC-UHFFFAOYSA-N Oxazole Chemical compound C1=COC=N1 ZCQWOFVYLHDMMC-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001524178 Paenarthrobacter ureafaciens Species 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000192138 Prochlorococcus Species 0.000 description 1
- 241000157935 Promicromonospora citrea Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- 102220495684 Putative uncharacterized protein FLJ43944_N25A_mutation Human genes 0.000 description 1
- WTKZEGDFNFYCGP-UHFFFAOYSA-N Pyrazole Chemical compound C=1C=NNC=1 WTKZEGDFNFYCGP-UHFFFAOYSA-N 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100292548 Rattus norvegicus Adi1 gene Proteins 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000190967 Rhodospirillum Species 0.000 description 1
- 241001092459 Rubus Species 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 101000928111 Scheffersomyces stipitis (strain ATCC 58785 / CBS 6054 / NBRC 10063 / NRRL Y-11545) Alcohol dehydrogenase 1 Proteins 0.000 description 1
- 241000233671 Schizochytrium Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241001149962 Sporothrix Species 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241000187758 Streptomyces ambofaciens Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- FZWLAAWBMGSTSO-UHFFFAOYSA-N Thiazole Chemical compound C1=CSC=N1 FZWLAAWBMGSTSO-UHFFFAOYSA-N 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000607291 Vibrio fluvialis Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241001523965 Xylaria Species 0.000 description 1
- 241000204366 Xylella Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 125000004442 acylamino group Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical class 0.000 description 1
- 125000004644 alkyl sulfinyl group Chemical class 0.000 description 1
- 125000004390 alkyl sulfonyl group Chemical class 0.000 description 1
- 125000004656 alkyl sulfonylamino group Chemical class 0.000 description 1
- 125000004414 alkyl thio group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000004103 aminoalkyl group Chemical class 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- VZTDIZULWFCMLS-UHFFFAOYSA-N ammonium formate Chemical compound [NH4+].[O-]C=O VZTDIZULWFCMLS-UHFFFAOYSA-N 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 229950006323 angiotensin ii Drugs 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000005018 aryl alkenyl group Chemical group 0.000 description 1
- 125000005015 aryl alkynyl group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940005348 bacillus firmus Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 125000000051 benzyloxy group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])O* 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- 238000010504 bond cleavage reaction Methods 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000003739 carbamimidoyl group Chemical class C(N)(=N)* 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 125000003636 chemical group Chemical class 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229930016911 cinnamic acid Natural products 0.000 description 1
- WCZVZNOTHYJIEI-UHFFFAOYSA-N cinnoline Chemical compound N1=NC=CC2=CC=CC=C21 WCZVZNOTHYJIEI-UHFFFAOYSA-N 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 238000010959 commercial synthesis reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 244000096108 cunha Species 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000000000 cycloalkoxy group Chemical group 0.000 description 1
- 125000001316 cycloalkyl alkyl group Chemical group 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 125000004663 dialkyl amino group Chemical class 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- CKIDTYWBOZNDIH-UHFFFAOYSA-N diethylamino-[(dimethylamino)methyl]-dimethylazanium Chemical compound CCN(CC)[N+](C)(C)CN(C)C CKIDTYWBOZNDIH-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical group OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000012039 electrophile Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 208000024386 fungal infectious disease Diseases 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 125000004438 haloalkoxy group Chemical group 0.000 description 1
- 125000001188 haloalkyl group Chemical group 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 125000005553 heteroaryloxy group Chemical group 0.000 description 1
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-M hexanoate Chemical compound CCCCCC([O-])=O FUZZWVXGSFPDMH-UHFFFAOYSA-M 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 125000001183 hydrocarbyl group Chemical group 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- ORTFAQDWJHRMNX-UHFFFAOYSA-N hydroxidooxidocarbon(.) Chemical group O[C]=O ORTFAQDWJHRMNX-UHFFFAOYSA-N 0.000 description 1
- 125000002768 hydroxyalkyl group Chemical group 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- HOBCFUWDNJPFHB-UHFFFAOYSA-N indolizine Chemical compound C1=CC=CN2C=CC=C21 HOBCFUWDNJPFHB-UHFFFAOYSA-N 0.000 description 1
- 125000003406 indolizinyl group Chemical group C=1(C=CN2C=CC=CC12)* 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- ZLTPDFXIESTBQG-UHFFFAOYSA-N isothiazole Chemical compound C=1C=NSC=1 ZLTPDFXIESTBQG-UHFFFAOYSA-N 0.000 description 1
- CTAPFRYPJLPFDF-UHFFFAOYSA-N isoxazole Chemical compound C=1C=NOC=1 CTAPFRYPJLPFDF-UHFFFAOYSA-N 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000012263 liquid product Substances 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 208000004296 neuralgia Diseases 0.000 description 1
- 208000021722 neuropathic pain Diseases 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000001912 oat gum Substances 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000447 polyanionic polymer Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920002620 polyvinyl fluoride Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000030788 protein refolding Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- CPNGPNLZQNNVQM-UHFFFAOYSA-N pteridine Chemical compound N1=CN=CC2=NC=CN=C21 CPNGPNLZQNNVQM-UHFFFAOYSA-N 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- PBMFSQRYOILNGV-UHFFFAOYSA-N pyridazine Chemical compound C1=CC=NN=C1 PBMFSQRYOILNGV-UHFFFAOYSA-N 0.000 description 1
- 125000005344 pyridylmethyl group Chemical group [H]C1=C([H])C([H])=C([H])C(=N1)C([H])([H])* 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- JWVCLYRUEFBMGU-UHFFFAOYSA-N quinazoline Chemical compound N1=CN=CC2=CC=CC=C21 JWVCLYRUEFBMGU-UHFFFAOYSA-N 0.000 description 1
- 125000004621 quinuclidinyl group Chemical group N12C(CC(CC1)CC2)* 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 102220234101 rs1114167687 Human genes 0.000 description 1
- 102200126728 rs587777863 Human genes 0.000 description 1
- 102200027239 rs730880292 Human genes 0.000 description 1
- 102220203268 rs748463159 Human genes 0.000 description 1
- 102220223237 rs766143485 Human genes 0.000 description 1
- 102220329435 rs933930437 Human genes 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 229940115922 streptococcus uberis Drugs 0.000 description 1
- 125000005415 substituted alkoxy group Chemical group 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 125000005346 substituted cycloalkyl group Chemical group 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 description 1
- 125000005420 sulfonamido group Chemical group S(=O)(=O)(N*)* 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000004149 tartrazine Substances 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- IBBLKSWSCDAPIF-UHFFFAOYSA-N thiopyran Chemical compound S1C=CC=C=C1 IBBLKSWSCDAPIF-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y403/00—Carbon-nitrogen lyases (4.3)
- C12Y403/01—Ammonia-lyases (4.3.1)
- C12Y403/01024—Phenylalanine ammonia-lyase (4.3.1.24)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0014—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
- C12N9/0022—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with oxygen as acceptor (1.4.3)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了工程化苯丙氨酸氨裂合酶(PAL)多肽及其组合物,以及编码工程化苯丙氨酸氨裂合酶(PAL)多肽的多核苷酸。还提供了用于产生PAL酶的方法。在一些实施方案中,工程化PAL多肽被优化以提供增强的催化活性,所述催化活性可用于在工业工艺条件下产生药物化合物。
Description
本申请要求分别于2018年7月12日和2019年3月6日提交的美国专利申请序列号62/696,978和62/814,362的优先权,这两项美国专利申请在此出于所有目的通过引用以其整体并入本文。
发明领域
本发明提供了工程化苯丙氨酸氨裂合酶(PAL)多肽及其组合物,以及编码工程化苯丙氨酸氨裂合酶(PAL)多肽的多核苷酸。还提供了用于产生PAL酶的方法。在一些实施方案中,工程化PAL多肽被优化以提供增强的催化活性,所述催化活性可用于在工业工艺条件下产生药物化合物。
对序列表、表格或计算机程序的引用
序列表的正式副本作为ASCII格式化文本文件经由EFS-Web与说明书同时提交,文件名为“CX2-179WO1_ST25.txt”,创建日期为2019年6月12日,且大小为4.16兆字节。经由EFS-Web提交的序列表为说明书的一部分并且通过引用以其整体并入本文。
发明背景
苯丙氨酸氨裂合酶(PAL)(参见例如,Cui等人,Crit.Rev.Biotechnol.,34:258-268[2014];Hyun等人,Mycobiol.,39:257-265[2011];MacDonald等人,Biochem.CellBiol.,85:273-282[2007])连同组氨酸氨裂合酶(HAL)和酪氨酸氨裂合酶(TAL)一起(参见例如,Kyndt等人,FEBS Lett.,512:240-244[2002];Watt等人,Chem.Biol.,13:1317-132[2006];和Xue等人,J.Ind.Microbiol.Biotechnol.,34:599-604[2007])是芳族氨基酸裂合酶家族(EC 4.3.1.23-1.25和4.3.1.3)的成员。更具体地,具有PAL活性的酶(EC4.3.1.23-1.25,并且先前分类为EC 4.3.1.5)催化将L-苯丙氨酸非氧化脱氨为(E)-肉桂酸(方案1)。
该反应是可逆的,并且因此PAL催化(E)-肉桂酸的胺化,在高浓度的氨的存在下或者在溶液中释放氨的物质的存在下产生L-苯丙氨酸(方案1)。
PAL为一种非哺乳动物酶,广泛分布于植物中并且还在真菌和有限数目的细菌中被鉴定出。它通常是一种典型质量为300-340kDa的四聚体(参见例如,Cui等人,Crit.Rev.Biotechnol.,34:258-268[2014])。它不需要外部添加的辅因子,而是通过三个残基,即丙氨酸、丝氨酸和甘氨酸的自环化和脱水在酶的活性位点形成辅因子,以形成充当亲电试剂来催化反应的3,5-二氢-5-亚甲基-4H-咪唑-4-酮(MIO)(参见例如,MacDonald和D’Cunha,Biochem.Cell Biol.,85:273-82[2007])。
手性胺化合物作为中间体或合成子常用于制药、农业化学和化学工业中,用于制备许多商业上期望的化合物。据估计,目前40%的药物含有胺官能度(aminefunctionality)(参见例如,Ghislieri和Turner,Top.Catal.,57:284-300[2014])。通常,手性胺化合物的这些工业应用涉及仅利用分子的一种特定的立体异构形式(例如只有(R)对映异构体或(S)对映异构体是生理学活性的)。
PAL酶具有高度的对映选择性,并已用于胺化方向的苯丙氨酸商业合成(参见例如,Yamada等人,Appl.Environ.Microbiol.,19:421-427[1981];和EI-Batal等人,ActaMicrobiol.Pol.,51:153-169[2002])。据报道,工程化PAL变体对芳环上具有小取代基的肉桂酸具有活性(参见例如,Gloge等人.Chem.Eur.J.,6:3386-3390[2000];de Lange等人,ChemCatChem.,3:289-292
[2011];Lovelock等人,Bioorg.Med.Chem.,22:5555-5557[2014];Parmeggiani等人,Angew.Chem.Int.Ed.,54:4608-4611[2015];Rowles等人,Tetrahed.,72:7343-7347[2016];和Weise等人,Catal.Sci.Technol.,6:4086-408[2016])。
当在用于手性氨基酸产生的胺化反应方向中使用时,用酸调节至期望pH的氨水溶液通常用作氨源。此外,还已经使用含氨的盐诸如碳酸铵和氨基甲酸铵(Weise等人,Catal.Sci.Technol.,6:4086-408[2016])。还可以使用其他铵盐,诸如氯化铵、硫酸铵、乙酸铵、磷酸铵、甲酸铵等。
商业上使用PAL的一个主要缺点是它们通常具有制备工业上重要的手性胺化合物所不希望有的性质。这些缺点包括与天然底物肉桂酸和苯丙氨酸相比,对芳环上含有大体积或富电子取代基的底物的活性差或没有活性,并且在工业上有用的工艺条件下(例如,在有机溶剂的存在下或在升高的温度时)通常稳定性差。因此,对能在从许多种底物制备手性胺化合物的工业方法中使用的工程化PAL存在需求。
发明概述
本发明提供了工程化苯丙氨酸氨裂合酶(PAL)、具有PAL活性的多肽,和编码这些酶的多核苷酸,以及包含这些多核苷酸和多肽的载体和宿主细胞。还提供了用于产生PAL酶的方法。本发明还提供了包含PAL酶的组合物,以及使用工程化PAL酶的方法。
本发明提供了工程化苯丙氨酸氨裂合酶(PAL)多肽及其组合物,以及编码工程化苯丙氨酸氨裂合酶(PAL)多肽的多核苷酸。在一些实施方案中,工程化PAL多肽被优化以提供增强的催化活性,所述催化活性可用于在工业工艺条件下产生药物化合物。
本发明提供了工程化苯丙氨酸氨裂合酶,所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894和/或988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。本发明还提供了工程化苯丙氨酸氨裂合酶,所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894和/或988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,其中工程化苯丙氨酸氨裂合酶在多肽序列中包含至少一个取代或取代集,并且其中多肽序列的氨基酸位置分别参照SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894和/或988编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:80/99/104/175/220/359、80/104、80/104/105/172、80/104/105/172/175/222/359、80/104/105/172/220/222、80/104/105/220、80/104/105/220/222/416、80/104/105/222、80/104/172/175、80/104/172/175/220/310/359、80/104/172/222、80/104/359/416、84、90、99/104/105/172/175/220/222、100、101、104、104/105/175、104/172/310/359、104/175/213/222/359、104/175/220/222、104/220/222/359、104/359、107、108、110/419、175/315、219、219/540、220、347、360、363、405、416、418、423、450、451和452,其中多肽序列的氨基酸位置参照SEQ ID NO:4编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:80A/99D/104A/175A/220G/359Y、80A/104A、80A/104A/105I/172A、80A/104A/105I/172A/220G/222V、80A/104A/105I/172T/175A/222V/359Y、80A/104A/105I/220G、80A/104A/105I/220G/222V/416V、80A/104A/105I/222V、80A/104A/172A/175A、80A/104A/172A/175A/220G/310A/359Y、80A/104A/172T/222V、80A/104A/359Y/416V、84P、84V、90T、99D/104A/105I/172T/175A/220G/222V、100R、100S、101K、104A、104A/105I/175A、104A/172A/310A/359Y、104A/175A/213Q/222V/359Y、104A/175A/220G/222V、104A/220G/222V/359Y、104A/359Y、104I、104P、104S、107T、108E、110P/419D、175G/315R、219G、219M/540G、219P、220P、347V、360V、363R、405R、416E、416L、418G、423E、450E、451P和452A,其中多肽序列的氨基酸位置参照SEQ ID NO:4编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:V80A/E99D/L104A/S175A/A220G/H359Y、V80A/L104A、V80A/L104A/V105I/V172A、V80A/L104A/V105I/V172A/A220G/M222V、V80A/L104A/V105I/V172T/S175A/M222V/H359Y、V80A/L104A/V105I/A220G、V80A/L104A/V105I/A220G/M222V/M416V、V80A/L104A/V105I/M222V、V80A/L104A/V172A/S175A、V80A/L104A/V172A/S175A/A220G/I310A/H359Y、V80A/L104A/V172T/M222V、V80A/L104A/H359Y/M416V、F84P、F84V、V90T、E99D/L104A/V105I/V172T/S175A/A220G/M222V、L100R、L100S、Q101K、L104A、L104A/V105I/S175A、L104A/V172A/I310A/H359Y、L104A/S175A/L213Q/M222V/H359Y、L104A/S175A/A220G/M222V、L104A/A220G/M222V/H359Y、L104A/H359Y、L104I、L104P、L104S、H107T、L108E、T110P/K419D、S175G/S315R、L219G、L219M/E540G、L219P、A220P、N347V、G360V、F363R、S405R、M416E、M416L、L418G、I423E、F450E、N451P和Q452A,其中多肽序列的氨基酸位置参照SEQ ID NO:4编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:20/306/564、74/80/105/107/394/420、74/83/102/105/107/111/222/394/416、74/97/105/106/107、74/102/105/106/107/175/394、74/102/105/106/107/175/394/421、80/84/99/104/105/107/219、80/102/105/107/304、83/102/105/106/107/416/420/421、83/102/105/394/416/420、84、84/99、84/99/104/105/219、84/107、97/102/105/106/107/111/394/420/421、97/102/105/107/111/175/304/421/424、97/102/111/175/222/420/421、97/105/107/111/222/421/424、97/105/107/111/394/416/421、99/105/107、102、102/105/107/222/304/307/394/421/424、102/105/107/222/304/394/421/424、102/105/107/304/424、102/105/107/394/416/424、102/107/111/222/394、102/107/420/424、103、104、105、105/106/107/420/421、105/107、105/107/111、105/107/111/304、105/107/111/394/420/424、105/107/222/304/416、105/111/219、105/175/219、105/219、106、107、107/111/209/222/304、107/222/304、107/291、107/421、175、216、219、220、222/421/424、304/394/416/420、306、359、394、395、413、416、418和420,其中多肽序列的氨基酸位置参照SEQ ID NO:8编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:20D/306L/564Q、74D/80A/105I/107G/394N/420S、74D/83S/102E/105I/107S/111A/222A/394N/416V、74D/97T/105I/106R/107G、74D/102E/105I/106R/107G/175A/394N/421T、74D/102E/105I/106R/107L/175A/394N、80A/84V/99D/104I/105I/107T/219G、80A/102E/105I/107L/304W、83S/102E/105I/106R/107G/416V/420S/421T、83S/102E/105I/394N/416V/420S、84G、84L、84P、84R、84S、84V、84V/99D、84V/99D/104I/105I/219G、84V/107T、97T/102E/105I/106R/107G/111A/394N/420S/421T、97T/102E/105I/107G/111A/175A/304W/421T/424V、97T/102E/111A/175A/222G/420S/421T、97T/105I/107G/111A/222G/421T/424V、97T/105I/107S/111A/394N/416V/421T、99D/105I/107T、102E/105I/107G/394N/416V/424V、102E/105I/107I/304W/424V、102E/105I/107S/222G/304W/307H/394N/421T/424V、102E/105I/107S/222G/304W/394N/421T/424V、102E/107A/111A/222G/394N、102E/107G/420S/424V、102N、103S、104G、105I、105I/106R/107G/420S/421T、105I/107A/222G/304W/416V、105I/107E/111A、105I/107G/111A/394N/420S/424V、105I/107I/111A/304W、105I/107T、105I/111A/219G、105I/175A/219G、105I/219G、106M、107G、107G/291N、107G/421T、107L、107L/222G/304W、107P、107Q、107T、107T/111A/209I/222G/304W、175N、216G、219C、220S、222A/421T/424V、304W/394N/416V/420S、306L、359R、394V、395M、413E、413T、416A、416C、416G、416H、416L、416V、418I、420A和420S,其中多肽序列的氨基酸位置参照SEQ ID NO:8编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:G20D/D306L/P564Q、G74D/V80A/V105I/H107G/A394N/G420S、G74D/G83S/T102E/V105I/H107S/G111A/V222A/A394N/M416V、G74D/A97T/V105I/W106R/H107G、G74D/T102E/V105I/W106R/H107G/S175A/A394N/L421T、G74D/T102E/V105I/W106R/H107L/S175A/A394N、V80A/F84V/E99D/A104I/V105I/H107T/L219G、V80A/T102E/V105I/H107L/Y304W、G83S/T102E/V105I/W106R/H107G/M416V/G420S/L421T、G83S/T102E/V105I/A394N/M416V/G420S、F84G、F84L、F84P、F84R、F84S、F84V、F84V/E99D、F84V/E99D/A104I/V105I/L219G、F84V/H107T、A97T/T102E/V105I/W106R/H107G/G111A/A394N/G420S/L421T、A97T/T102E/V105I/H107G/G111A/S175A/Y304W/L421T/C424V、A97T/T102E/G111A/S175A/V222G/G420S/L421T、A97T/V105I/H107G/G111A/V222G/L421T/C424V、A97T/V105I/H107S/G111A/A394N/M416V/L421T、E99D/V105I/H107T、T102E/V105I/H107G/A394N/M416V/C424V、T102E/V105I/H107I/Y304W/C424V、T102E/V105I/H107S/V222G/Y304W/G307H/A394N/L421T/C424V、T102E/V105I/H107S/V222G/Y304W/A394N/L421T/C424V、T102E/H107A/G111A/V222G/A394N、T102E/H107G/G420S/C424V、T102N、N103S、A104G、V105I、V105I/W106R/H107G/G420S/L421T、V105I/H107A/V222G/Y304W/M416V、V105I/H107E/G111A、V105I/H107G/G111A/A394N/G420S/C424V、V105I/H107I/G111A/Y304W、V105I/H107T、V105I/G111A/L219G、V105I/S175A/L219G、V105I/L219G、W106M、H107G、H107G/S291N、H107G/L421T、H107L、H107L/V222G/Y304W、H107P、H107Q、H107T、H107T/G111A/S209I/V222G/Y304W、S175N、K216G、L219C、G220S、V222A/L421T/C424V、Y304W/A394N/M416V/G420S、D306L、Y359R、A394V、S395M、K413E、K413T、M416A、M416C、M416G、M416H、M416L、M416V、L418I、G420A和G420S,其中多肽序列的氨基酸位置参照SEQ ID NO:8编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3、3/550、4、5、6、7、10、14、22、22/76、24、25、40、75、76、76/561、84/107/175/219、84/107/219、102/107/219/410、107、107/216/410、107/219、107/220、212、219/220、219/220/410、220/359、220/410、286、301、303、410、502、544、566和567,其中多肽序列的氨基酸位置参照SEQ ID NO:106编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQID NO:106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:3E、3E/550T、3H、3K、3N、3P、3R、4P、4S、5D、5L、5P、6D、6S、7D、7G、7T、10A、10P、10S、14A、22A、22V/76S、24V、25R、40D、75L、76A、76E、76H、76L、76L/561L、76M、76R、76T、84P/107A/175A/219C、84P/107A/219C、84P/107G/219C、102N/107G/219C/410K、107A、107A/219C、107G、107G/216G/410K、107G/219C、107G/220S、212N、212P、219C/220S、219C/220S/410K、220S/359R、220S/410K、286R、301S、303I、303K、303R、303T、303V、410K、502Q、502T、544W、566G和567D,其中多肽序列的氨基酸位置参照SEQID NO:106编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:T3E、T3E/A550T、T3H、T3K、T3N、T3P、T3R、L4P、L4S、S5D、S5L、S5P、Q6D、Q6S、A7D、A7G、A7T、K10A、K10P、K10S、Q14A、S22A、S22V/P76S、A24V、N25R、R40D、E75L、P76A、P76E、P76H、P76L、P76L/D561L、P76M、P76R、P76T、F84P/S107A/S175A/L219C、F84P/S107A/L219C、F84P/S107G/L219C、E102N/S107G/L219C/R410K、S107A、S107A/L219C、S107G、S107G/K216G/R410K、S107G/L219C、S107G/G220S、T212N、T212P、L219C/G220S、L219C/G220S/R410K、G220S/Y359R、G220S/R410K、S286R、K301S、D303I、D303K、D303R、D303T、D303V、R410K、A502Q、A502T、R544W、L566G和H567D,其中多肽序列的氨基酸位置参照SEQ ID NO:106编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:252具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:252具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3/4/5/7/76/84/107/307、3/5/107/307/566、3/7/76/107/307/566、3/7/84/307、24/76/107/307、24/84/107/307、76、76/84/107、76/84/107/307、76/84/107/307/502、76/84/107/502、76/107、76/107/307、76/307、76/307/502、84/107/307、84/107/307/502、84/301/307/566、84/307、107/301/502、107/307、107/307/566、107/502、107/502/566、307、307/502和307/566,其中多肽序列的氨基酸位置参照SEQ ID NO:252编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:252具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:3E/4S/5P/7G/76T/84P/107A/307G、3E/7G/84P/307G、3K/7D/76L/107A/307G/566G、3P/5P/107A/307G/566G、24V/76A/107A/307G、24V/84P/107G/307G、76A/84P/107A/502Q、76H/84P/107A、76H/307G/502Q、76L/107A/307G、76L/107G/307G、76L/307G、76M/84P/107A、76M/84P/107A/307G、76M/84P/107G、76M/84P/107G/307G、76M/107A、76M/107G、76T、76T/84P/107A/307G/502Q、76T/84P/107G、76T/107G、84P/107A/307G、84P/107A/307G/502Q、84P/301S/307G/566G、84P/307G、107A/301S/502Q、107A/307G、107A/307G/566G、107A/502Q、107A/502Q/566G、307G、307G/502Q和307G/566G,其中多肽序列的氨基酸位置参照SEQ IDNO:252编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:252具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:T3E/L4S/S5P/A7G/P76T/F84P/S107A/H307G、T3E/A7G/F84P/H307G、T3K/A7D/P76L/S107A/H307G/L566G、T3P/S5P/S107A/H307G/L566G、A24V/P76A/S107A/H307G、A24V/F84P/S107G/H307G、P76A/F84P/S107A/A502Q、P76H/F84P/S107A、P76H/H307G/A502Q、P76L/S107A/H307G、P76L/S107G/H307G、P76L/H307G、P76M/F84P/S107A、P76M/F84P/S107A/H307G、P76M/F84P/S107G、P76M/F84P/S107G/H307G、P76M/S107A、P76M/S107G、P76T、P76T/F84P/S107A/H307G/A502Q、P76T/F84P/S107G、P76T/S107G、F84P/S107A/H307G、F84P/S107A/H307G/A502Q、F84P/K301S/H307G/L566G、F84P/H307G、S107A/K301S/A502Q、S107A/H307G、S107A/H307G/L566G、S107A/A502Q、S107A/A502Q/L566G、H307G、H307G/A502Q和H307G/L566G,其中多肽序列的氨基酸位置参照SEQ ID NO:252编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:446具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:446具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3/4/6/7/76、3/4/6/7/303、3/4/7、3/4/7/76、3/6/502、3/7/76、7/303、40/303、76、76/502、82、100、102、171、174、216、218、219、222、222/509、303、303/502、304和345,其中多肽序列的氨基酸位置参照SEQ ID NO:446编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:446具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:3E/4S/7V/76H、3E/6S/502Q、3H/4S/7G、3H/7D/76H、3H/7D/76R、3K/4S/6S/7V/303I、3T/4S/6D/7D/76R、7G/303I、40D/303I、76A、76H、76L、76R、76R/502Q、82T、100H、102M、171P、171V、174G、216G、218A、219M、219T、222T、222T/509K、222V、303I、303I/502Q、304F、304H、304V和345S,其中多肽序列的氨基酸位置参照SEQ ID NO:446编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:446具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:P3E/L4S/A7V/P76H、P3E/Q6S/A502Q、P3H/L4S/A7G、P3H/A7D/P76H、P3H/A7D/P76R、P3K/L4S/Q6S/A7V/D303I、P3T/L4S/Q6D/A7D/P76R、A7G/D303I、R40D/D303I、P76A、P76H、P76L、P76R、P76R/A502Q、S82T、L100H、E102M、L171P、L171V、L174G、K216G、G218A、C219M、C219T、G222T、G222T/E509K、G222V、D303I、D303I/A502Q、W304F、W304H、W304V和T345S,其中多肽序列的氨基酸位置参照SEQ ID NO:446编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:482具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:482具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3/4/7、3/7、4/7、4/7/216/218、7、7/40、7/76/82/174/222/303、7/76/174/222、7/76/219/303、7/82、7/216/218、40/82、47、66、76/82/216/218、76/216、76/216/219、82、112、171、174/222、209、216、219、219/345、222、268、271、331、366、428、437、443、460、474、503、524、538和543,其中多肽序列的氨基酸位置参照SEQ ID NO:482编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:482具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:3E/4S/7D、3E/7D、4S/7D、4S/7D/216G/218A、7D、7D/40D、7D/76L/82T/174G/222T/303I、7D/76M/174G/222V、7D/76M/219T/303I、7D/82T、7D/216G/218A、40D/82T、47P、47Q、66W、76L/82T/216G/218A、76M/216G、76M/216G/219T、82T、112L、112S、112T、171P、174G/222V、209A、216G、219T、219T/345S、222V、268T、271A、331T、366S、428L、428M、437H、443Q、460F、474Y、503T、524A、524D、524R、538I、538V和543Q,其中多肽序列的氨基酸位置参照SEQID NO:482编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:482具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:P3E/L4S/A7D、P3E/A7D、L4S/A7D、L4S/A7D/K216G/G218A、A7D、A7D/R40D、A7D/P76L/S82T/L174G/G222T/D303I、A7D/P76M/L174G/G222V、A7D/P76M/C219T/D303I、A7D/S82T、A7D/K216G/G218A、R40D/S82T、L47P、L47Q、Y66W、P76L/S82T/K216G/G218A、P76M/K216G、P76M/K216G/C219T、S82T、A112L、A112S、A112T、L171P、L174G/G222V、S209A、K216G、C219T、C219T/T345S、G222V、I268T、S271A、S331T、Q366S、I428L、I428M、N437H、F443Q、T460F、N474Y、C503T、S524A、S524D、S524R、L538I、L538V和A543Q,其中多肽序列的氨基酸位置参照SEQ ID NO:482编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:516具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:516具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:4、4/304、6、7、9、16、20、25、40、40/437、44/47、44/47/94/509、44/94/270/554、44/94/554、47、47/76、47/76/345、47/94/509、47/195/554、47/428、51/106、76、76/271、76/345、82、84、94/149、94/195、94/554、98、98/460、109、112/524、271/345、271/428、302、303、304、306、349、358、410、413、416和524,其中多肽序列的氨基酸位置参照SEQ ID NO:516编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:516具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:4G、4I/304C、6R、7S、9C、16S、16Y、20T、25A、25G、40D、40D/437H、44H/47K、44H/47K/94P/509L、44H/94P/270Q/554R、44H/94P/554R、47K、47K/94P/509L、47K/195E/554R、47P、47P/76H、47P/76H/345S、47P/428L、51A/106G、76H、76H/271A、76H/345S、82T、84P、94P/149T、94P/195E、94P/554R、98A、98E、98N/460A、109G、112L/524A、271A/345S、271A/428L、302R、303I、304H、304L、304S、306K、349I、358L、410M、413S、413T、416T和524A,其中多肽序列的氨基酸位置参照SEQ ID NO:516编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:516具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:L4G、L4I/W304C、Q6R、D7S、S9C、F16S、F16Y、G20T、N25A、N25G、R40D、R40D/N437H、N44H/L47K、N44H/L47K/R94P/E509L、N44H/R94P/N270Q/V554R、N44H/R94P/V554R、L47K、L47K/R94P/E509L、L47K/K195E/V554R、L47P、L47P/M76H、L47P/M76H/T345S、L47P/I428L、T51A/W106G、M76H、M76H/S271A、M76H/T345S、S82T、F84P、R94P/I149T、R94P/K195E、R94P/V554R、S98A、S98E、S98N/T460A、K109G、A112L/S524A、S271A/T345S、S271A/I428L、H302R、D303I、W304H、W304L、W304S、D306K、L349I、Y358L、R410M、K413S、K413T、M416T和S524A,其中多肽序列的氨基酸位置参照SEQ ID NO:516编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:618具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:618具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:4/47/76/82/94、7/44/94/98、7/47/76/82、7/76/554、7/94/98、16/40/76、16/44/76/98、16/44/94/98/524、25/54/68/72、25/54/68/72/158/339、25/54/68/72/209/212/339/517、25/54/68/158/339/517、25/54/72/339/517、25/54/158/209/212/339/551、30/68/72/207/209/212/339/495/517、40/44/76/304/509、40/44/98/304、40/76/304/437、40/76/554、44/76/94/112/304、44/76/112、44/94/271/304/437/554、47/76/82/94/271、47/76/82/271/304、47/76/94/271、47/76/94/271/306/375/524/554、47/76/304/306/554、47/76/304/524/554、47/94、47/94/271、47/94/271/304/554、49/114/240/521、54/68/158/209/212/495/517、68/72/158/209/212/339/495/551、68/72/158/517、68/158/209/495/517/551、76、76/271/304/554、76/304/437、82、82/554、94/98、94/98/306、94/98/509、94/98/524、94/554、98/270/304/554、119、294、357、400、516、527和565,其中多肽序列的氨基酸位置参照SEQ ID NO:618编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ IDNO:618具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:4I/47K/76H/82T/94P、7S/44H/94P/98N、7S/47P/76H/82T、7S/76H/554R、7S/94P/98E、16Y/40D/76H、16Y/44H/76H/98E、16Y/44H/94P/98E/524A、25T/54E/68A/72A/158H/339V、25T/54E/68A/72A/209E/212Q/339V/517E、25T/54E/72A/339V/517E、25T/54E/158H/209E/212Q/339V/551S、25T/54K/68A/72A、25T/54K/68A/158H/339V/517E、30G/68A/72A/207G/209E/212Q/339V/495A/517E、40D/44H/76H/304H/509L、40D/44H/98A/304S、40D/76H/304S/437H、40D/76H/554R、44H/76H/94P/112L/304S、44H/76H/112L、44H/94P/271A/304S/437H/554R、47K/76H/82T/94P/271A、47K/76H/82T/271A/304S、47K/76H/94P/271A、47K/76H/304S/306K/554R、47K/94P、47K/94P/271A、47K/94P/271A/304S/554R、47P/76H/94P/271A/306K/375M/524A/554R、47P/76H/304S/524A/554R、49R/114K/240K/521K、54K/68A/158H/209E/212Q/495A/517E、68A/72A/158H/209E/212Q/339V/495A/551S、68A/72A/158H/517E、68A/158H/209E/495A/517E/551S、76H、76H/271A/304S/554R、76H/304S/437H、82T、82T/554R、94P/98E/306K、94P/98E/509L、94P/98E/524A、94P/98N、94P/554R、98E/270Q/304S/554R、119E、119V、294A、294C、357I、400A、516M、527V和565E,其中多肽序列的氨基酸位置参照SEQ ID NO:618编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:618具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:L4I/L47K/M76H/S82T/R94P、D7S/N44H/R94P/S98N、D7S/L47P/M76H/S82T、D7S/M76H/V554R、D7S/R94P/S98E、F16Y/R40D/M76H、F16Y/N44H/M76H/S98E、F16Y/N44H/R94P/S98E/S524A、N25T/T54E/N68A/E72A/Y158H/I339V、N25T/T54E/N68A/E72A/S209E/T212Q/I339V/H517E、N25T/T54E/E72A/I339V/H517E、N25T/T54E/Y158H/S209E/T212Q/I339V/A551S、N25T/T54K/N68A/E72A、N25T/T54K/N68A/Y158H/I339V/H517E、N30G/N68A/E72A/N207G/S209E/T212Q/I339V/T495A/H517E、R40D/N44H/M76H/W304H/E509L、R40D/N44H/S98A/W304S、R40D/M76H/W304S/N437H、R40D/M76H/V554R、N44H/M76H/R94P/A112L/W304S、N44H/M76H/A112L、N44H/R94P/S271A/W304S/N437H/V554R、L47K/M76H/S82T/R94P/S271A、L47K/M76H/S82T/S271A/W304S、L47K/M76H/R94P/S271A、L47K/M76H/W304S/D306K/V554R、L47K/R94P、L47K/R94P/S271A、L47K/R94P/S271A/W304S/V554R、L47P/M76H/R94P/S271A/D306K/L375M/S524A/V554R、L47P/M76H/W304S/S524A/V554R、S49R/N114K/Q240K/Q521K、T54K/N68A/Y158H/S209E/T212Q/T495A/H517E、N68A/E72A/Y158H/S209E/T212Q/I339V/T495A/A551S、N68A/E72A/Y158H/H517E、N68A/Y158H/S209E/T495A/H517E/A551S、M76H、M76H/S271A/W304S/V554R、M76H/W304S/N437H、S82T、S82T/V554R、R94P/S98E/D306K、R94P/S98E/E509L、R94P/S98E/S524A、R94P/S98N、R94P/V554R、S98E/N270Q/W304S/V554R、A119E、A119V、V294A、V294C、S357I、N400A、R516M、R527V和C565E,其中多肽序列的氨基酸位置参照SEQ ID NO:618编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:714具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:714具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:25、25/40/158/209/304/410/517、25/54/271/517、25/158/209/410、25/306/339、25/410、40/47/68/94/98/410/517、40/68/460/517、47/98/339/410、54/68/72/98/209/517、68、68/339/517、72/94/158/339/410/460/517、72/158/209/410/517、83、94/158/209/339/410、100、129、158、158/207/339/410、158/209/410/517、207/410、207/410/460/517、220、317、339、394、410、410/517、416、460、460/517和517,其中多肽序列的氨基酸位置参照SEQID NO:714编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:714具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:25T、25T/40D/158H/209E/304H/410M/517E、25T/54E/271A/517E、25T/158H/209E/410M、25T/306E/339V、25T/410M、40D/47K/68A/94P/98A/410M/517E、40D/68A/460A/517E、47K/98E/339V/410M、54E/68A/72A/98E/209E/517E、68A、68A/339V/517E、72A/94P/158H/339V/410M/460A/517E、72A/158H/209E/410M/517E、83L、83P、94P/158H/209E/339V/410M、100G、129I、158H、158H/207G/339V/410M、158H/209E/410M/517E、207G/410M、207G/410M/460A/517E、220A、317E、339V、394S、410M、410M/517E、416I、460A、460A/517E和517E,其中多肽序列的氨基酸位置参照SEQ ID NO:714编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:714具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:N25T、N25T/R40D/Y158H/S209E/S304H/R410M/H517E、N25T/T54E/S271A/H517E、N25T/Y158H/S209E/R410M、N25T/D306E/I339V、N25T/R410M、R40D/P47K/N68A/R94P/S98A/R410M/H517E、R40D/N68A/T460A/H517E、P47K/S98E/I339V/R410M、T54E/N68A/E72A/S98E/S209E/H517E、N68A、N68A/I339V/H517E、E72A/R94P/Y158H/I339V/R410M/T460A/H517E、E72A/Y158H/S209E/R410M/H517E、G83L、G83P、R94P/Y158H/S209E/I339V/R410M、L100G、A129I、Y158H、Y158H/N207G/I339V/R410M、Y158H/S209E/R410M/H517E、N207G/R410M、N207G/R410M/T460A/H517E、S220A、R317E、I339V、N394S、R410M、R410M/H517E、M416I、T460A、T460A/H517E和H517E,其中多肽序列的氨基酸位置参照SEQ ID NO:714编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:830具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:830具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:N25T、N25T/R40D/Y158H/S209E/S304H/R410M/H517E、N25T/T54E/S271A/H517E、N25T/Y158H/S209E/R410M、N25T/D306E/I339V、N25T/R410M、R40D/P47K/N68A/R94P/S98A/R410M/H517E、R40D/N68A/T460A/H517E、P47K/S98E/I339V/R410M、T54E/N68A/E72A/S98E/S209E/H517E、N68A、N68A/I339V/H517E、E72A/R94P/Y158H/I339V/R410M/T460A/H517E、E72A/Y158H/S209E/R410M/H517E、G83L、G83P、R94P/Y158H/S209E/I339V/R410M、L100G、A129I、Y158H、Y158H/N207G/I339V/R410M、Y158H/S209E/R410M/H517E、N207G/R410M、N207G/R410M/T460A/H517E、S220A、R317E、I339V、N394S、R410M、R410M/H517E、M416I、T460A、T460A/H517E和H517E,其中多肽序列的氨基酸位置参照SEQ ID NO:830编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:830具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:25T/83L/158H/220A/517E、25T/83P/220A/416I、25T/158H/209E/220A/517E、25T/158H/220A、25T/158H/220A/517E、25T/220A/339V、25T/220A/517E、25T/410M/416I/517E、40G、45H、54K/59R、54K/285L、83P、83P/209E/220A/410M/517E、83P/339V/410M、119Q、158H/220A/271A/517E、209P、209T、220A、220A/410M/416I/517E、220A/517E、244S、246V、271A、271A/410M/416I/517E、293M、304A、339V、368F、400A、400Q、410A、410E、410M/416I/517E、424A、459F、479S、520A、525P、537A、537P、562V和565K,其中多肽序列的氨基酸位置参照SEQ ID NO:830编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ IDNO:830具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:N25T/G83L/Y158H/S220A/H517E、N25T/G83P/S220A/M416I、N25T/Y158H/S209E/S220A/H517E、N25T/Y158H/S220A、N25T/Y158H/S220A/H517E、N25T/S220A/I339V、N25T/S220A/H517E、N25T/R410M/M416I/H517E、R40G、G45H、T54K/G59R、T54K/I285L、G83P、G83P/S209E/S220A/R410M/H517E、G83P/I339V/R410M、A119Q、Y158H/S220A/S271A/H517E、S209P、S209T、S220A、S220A/R410M/M416I/H517E、S220A/H517E、A244S、A246V、S271A、S271A/R410M/M416I/H517E、L293M、S304A、I339V、V368F、N400A、N400Q、R410A、R410E、R410M/M416I/H517E、V424A、Y459F、A479S、G520A、S525P、G537A、G537P、I562V和C565K,其中多肽序列的氨基酸位置参照SEQ ID NO:830编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:894具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:894具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:25/40/45/209/424、25/40/424、25/45/54/73/246/424、25/54/73/209/424/520、40/47/54/214/503、40/54/209/214/244/339/520、40/54/214/244/339/503、40/209/246/424、54、54/209/214/244、54/209/214/244/339/503、54/424、54/424/520、209/503、227、246、246/424、274/311、410、411、413和424,其中多肽序列的氨基酸位置参照SEQ ID NO:894编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:894具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:25T/40C/424A、25T/40G/45H/209P/424A、25T/45H/54L/73K/246V/424A、25T/54P/73K/209T/424A/520A、40G/209P/246V/424A、40Q/47R/54P/214N/503T、40Q/54P/209P/214N/244S/339V/520A、40T/54P/214N/244S/339V/503T、54K/209P/214N/244S/339V/503T、54P、54P/209P/214N/244S、54P/424A、54P/424A/520A、209P/503T、227F、246V、246V/424A、274P/311S、410Q、411A、413S、424A、424C、424G和424S,其中多肽序列的氨基酸位置参照SEQ ID NO:894编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:894具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:N25T/R40C/V424A、N25T/R40G/G45H/E209P/V424A、N25T/G45H/T54L/S73K/A246V/V424A、N25T/T54P/S73K/E209T/V424A/G520A、R40G/E209P/A246V/V424A、R40Q/P47R/T54P/L214N/C503T、R40Q/T54P/E209P/L214N/A244S/I339V/G520A、R40T/T54P/L214N/A244S/I339V/C503T、T54K/E209P/L214N/A244S/I339V/C503T、T54P、T54P/E209P/L214N/A244S、T54P/V424A、T54P/V424A/G520A、E209P/C503T、V227F、A246V、A246V/V424A、H274P/Q311S、M410Q、E411A、K413S、V424A、V424C、V424G和V424S,其中多肽序列的氨基酸位置参照SEQ ID NO:894编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:40、40/54/214/421/424、40/90/421/424、40/214、40/214/424、40/421/424、40/424、54/214、66、90/214/424、106/227、106/227/244、106/227/244/554、106/227/554、214、214/421、339、421/424、424、454、463、464、474和543,其中多肽序列的氨基酸位置参照SEQ IDNO:988编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:40C、40C/54L/214Q/421S/424C、40C/90Q/421S/424C、40C/214N/424C、40C/214Q、40C/421S/424G、40C/424C、54L/214Q、66F、90Q/214Q/424G、106R/227F、106S/227F/244S、106S/227F/244S/554C、106S/227F/554C、214Q、214Q/421S、339M、421S/424C、424C、454L、454V、463A、463G、463L、463N、463S、463V、463W、464C、464Q、474E和543Q,其中多肽序列的氨基酸位置参照SEQ ID NO:988编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:R40C、R40C/P54L/L214Q/T421S/A424C、R40C/V90Q/T421S/A424C、R40C/L214N/A424C、R40C/L214Q、R40C/T421S/A424G、R40C/A424C、P54L/L214Q、Y66F、V90Q/L214Q/A424G、W106R/V227F、W106S/V227F/A244S、W106S/V227F/A244S/R554C、W106S/V227F/R554C、L214Q、L214Q/T421S、I339M、T421S/A424C、A424C、I454L、I454V、T463A、T463G、T463L、T463N、T463S、T463V、T463W、L464C、L464Q、N474E和A543Q,其中多肽序列的氨基酸位置参照SEQ ID NO:988编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:36、40/66/227、40/66/227/244/410/424、40/66/410/474、40/410/411/424、47、66、66/214/374/410/474、66/214/424、66/214/437/474、66/227、66/227/244/424/543、66/227/424、66/339、66/339/410/543、66/339/474、66/370、66/410/424/454/527、66/424、66/463/464、66/543、102、104、105、154、214/244/543、214/374/424、227、227/244/411/424、227/339/413/437、244/411、339、394、410、410/411/424、413、421、424、517、524和554,其中多肽序列的氨基酸位置参照SEQ ID NO:988编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:36C、36Q、40C/66F/227F、40C/66F/227F/244S/410K/424C、40C/66F/410K/474E、40C/410K/411A/424C、47A、47E、47R、47T、66F、66F/214Q/374D/410K/474E、66F/214Q/424C、66F/214Q/437G/474E、66F/227F、66F/227F/244S/424C/543Q、66F/227F/424G、66F/339L、66F/339L/410K/543Q、66F/339L/474E、66F/370E、66F/410K/424C/454V/527H、66F/424C、66F/463A/464C、66F/463L/464Q、66F/543Q、102S、104G、105G、154T、214Q/244S/543Q、214Q/374D/424C、227F、227F/244S/411A/424C、227F/339L/413A/437G、244S/411A、339L、394L、410K/411A/424G、410L、410T、410V、410Y、413T、421Q、424G、424L、517D、524I、554L和554V,其中多肽序列的氨基酸位置参照SEQ ID NO:988编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:N36C、N36Q、R40C/Y66F/V227F、R40C/Y66F/V227F/A244S/M410K/A424C、R40C/Y66F/M410K/N474E、R40C/M410K/E411A/A424C、P47A、P47E、P47R、P47T、Y66F、Y66F/L214Q/H374D/M410K/N474E、Y66F/L214Q/A424C、Y66F/L214Q/N437G/N474E、Y66F/V227F、Y66F/V227F/A244S/A424C/A543Q、Y66F/V227F/A424G、Y66F/I339L、Y66F/I339L/M410K/A543Q、Y66F/I339L/N474E、Y66F/M370E、Y66F/M410K/A424C/I454V/R527H、Y66F/A424C、Y66F/T463A/L464C、Y66F/T463L/L464Q、Y66F/A543Q、M102S、A104G、I105G、G154T、L214Q/A244S/A543Q、L214Q/H374D/A424C、V227F、V227F/A244S/E411A/A424C、V227F/I339L/K413A/N437G、A244S/E411A、I339L、N394L、M410K/E411A/A424G、M410L、M410T、M410V、M410Y、K413T、T421Q、A424G、A424L、E517D、A524I、R554L和R554V,其中多肽序列的氨基酸位置参照SEQ ID NO:988编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:1140具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:1140具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:36/47/424/517/554、47/214/413/524/563、47/410/524、47/524、47/554、214、214/424、410、410/517/554、410/554、424/517/554、517/524/554和554,其中多肽序列的氨基酸位置参照SEQ ID NO:1140编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQID NO:1140具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:36Q/47R/424L/517D/554V、47E/214Q/413A/524I/563V、47E/524I、47T/410Y/524I、47T/554L、214Q、214Q/424L、410L/554V、410T/517D/554V、410Y、424L/517D/554V、517D/524I/554L和554L,其中多肽序列的氨基酸位置参照SEQ ID NO:1140编号。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:1140具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中工程化苯丙氨酸氨裂合酶包含选自以下的至少一个取代或取代集:N36Q/P47R/A424L/E517D/R554V、P47E/L214Q/K413A/A524I/L563V、P47E/A524I、P47T/K410Y/A524I、P47T/R554L、L214Q、L214Q/A424L、K410L/R554V、K410T/E517D/R554V、K410Y、A424L/E517D/R554V、E517D/A524I/R554L和R554L,其中多肽序列的氨基酸位置参照SEQ ID NO:1140编号。
在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列或其功能片段。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包括SEQ ID NO:4、8、106、252、446、482、516、618、714、830、894、988或1140,或其功能片段。在又一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与表5.1、表6.1、表7.1、表8.1、表9.1、表10.1、表11.1、表12.1、表13.1、表14.1、表15.1、表18.1和/或表19.1中列出的至少一种工程化苯丙氨酸氨裂合酶的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。在又一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4-1222中偶数编号的序列中列出的至少一种工程化苯丙氨酸氨裂合酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4-1222中偶数编号的序列中列出的至少一种工程化苯丙氨酸氨裂合酶变体的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含SEQ ID NO:4-1222中偶数编号的序列中列出的多肽序列。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶包含与野生型多变鱼腥藻(Anabaena variabilis)苯丙氨酸氨裂合酶相比表现出至少一种改进的性质的多肽序列。在一些另外的实施方案中,改进的性质包括改进的化合物2产生。在一些实施方案中,改进的性质包括改进的以下的产生:
在一些另外的实施方案中,改进的性质包括改进的对以下的利用:
在又一些另外的实施方案中,改进的性质包括改进的从
在又一些另外的实施方案中,改进的性质包括改进的对映选择性。在一些另外的实施方案中,改进的性质包括改进的稳定性。在一些另外的实施方案中,改进的性质包括改进的热稳定性、改进的酸稳定性和/或改进的碱稳定性。在一些另外的实施方案中,工程化苯丙氨酸氨裂合酶是纯化的。本发明中还提供了组合物,所述组合物包含至少一种本文提供的工程化苯丙氨酸氨裂合酶。本发明中还提供了组合物,所述组合物包含本文提供的工程化苯丙氨酸氨裂合酶。
本发明还提供了工程化多核苷酸序列,所述工程化多核苷酸序列编码至少一种本文提供的工程化苯丙氨酸氨裂合酶。在一些实施方案中,工程化多核苷酸序列包含与SEQID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。在一些另外的实施方案中,工程化多核苷酸序列包含与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中工程化苯丙氨酸氨裂合酶的多核苷酸序列在一个或更多个位置处包含至少一个取代。在一些另外的实施方案中,工程化多核苷酸序列包含与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。在一些实施方案中,工程化多核苷酸序列包括SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139。在一些另外的实施方案中,工程化多核苷酸序列包含与SEQ ID NO:3-1221中奇数编号的序列之一的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。在一些另外的实施方案中,工程化多核苷酸序列包括SEQ ID NO:3-1221中列出的奇数编号的序列中列出的序列。在一些另外的实施方案中,工程化多核苷酸序列可操作地连接至控制序列。在一些实施方案中,控制序列包括启动子。在一些另外的实施方案中,启动子是异源启动子。在一些另外的实施方案中,控制序列包括多于一种控制序列。在一些实施方案中,一个控制序列包含启动子,并且另一个控制序列包含不同的控制序列。在一些实施方案中,工程化多核苷酸序列是密码子优化的。本发明还提供了表达载体,所述表达载体包含至少一种本文提供的多核苷酸序列。本发明还提供了宿主细胞,所述宿主细胞包含至少一种本文提供的表达载体。在一些实施方案中,本发明提供了宿主细胞,所述宿主细胞包含至少一种本文提供的多核苷酸序列。在一些实施方案中,宿主细胞为原核细胞,而在一些其他实施方案中,宿主细胞为真核细胞。在一些另外的实施方案中,宿主细胞为大肠杆菌(E.coli)。
本发明还提供了在宿主细胞中产生工程化苯丙氨酸氨裂合酶的方法,所述方法包括在合适的条件下在培养基中培养本文提供的宿主细胞,从而产生至少一种本文提供的工程化苯丙氨酸氨裂合酶。在一些实施方案中,方法还包括从培养基和/或宿主细胞回收至少一种工程化苯丙氨酸氨裂合酶的步骤。在一些另外的实施方案中,方法还包括纯化使用本发明的方法获得的至少一种苯丙氨酸氨裂合酶的步骤。
发明描述
本发明提供了工程化苯丙氨酸氨裂合酶(PAL)多肽及其组合物,以及编码工程化苯丙氨酸氨裂合酶(PAL)多肽的多核苷酸。还提供了用于产生PAL酶的方法。在一些实施方案中,工程化PAL多肽被优化以提供增强的催化活性,所述催化活性可用于在工业工艺条件下产生药物化合物。
除非另外定义,本文使用的所有技术和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学中的实验程序是本领域中熟知的并且普遍地采用的那些。这样的技术是熟知的,并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析使用了标准技术或其修改形式。因此,以下术语意在具有本文提供的含义。
尽管本发明的实践中可使用类似或等同于本文描述的那些的任何合适的方法和材料,本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂,因为这些可以根据本领域技术人员使用它们的情况而改变。因此,下文即将定义的术语通过参考本发明作为整体而被更充分地描述。
应理解,上文的一般描述和下文的详细描述仅是示例性的和说明性的,而不是限制本发明。本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围,如同这样的较窄数值范围在本文被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同此类较低(或较高)数值限制在本文被清楚地写出。
除非上下文另外清楚地指明,否则如本文使用的单数形式"一(a)"、"一(an)"和"该(the)"包括复数指代物。因此,例如对“多肽(a polypeptide)”的提及包括多于一个多肽。
类似地,“包括(comprise、comprises、comprising)”、“包括(include、includes和including)”是可互换的,而不意图为限制性的。因此,如本文使用的,术语“包括(comprising)”及其同源词以其包括性意义使用(即,等同于术语“包括(including)”及其相应的同源词)。
还应理解,在各种实施方案的描述使用术语“包括(comprising)”的情况下,本领域技术人员将理解,在一些具体实例中,可以可选择地使用“基本上由...组成”或“由...组成”的语言描述实施方案。
本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,特此通过引用明确并入本文。
定义和缩写
用于遗传编码的氨基酸的缩写是常规的,并且如下:丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酸(Glu或E)、谷氨酰胺(Gln或Q)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。
当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文清楚看出,否则氨基酸可以是关于α-碳(Cα)的L-构型或D-构型。例如,“Ala”表示丙氨酸而不指定关于α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以一串单字母或三字母缩写(或其混合)呈现时,根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非具体描述,否则缩写的核苷可以是核糖核苷或2'-脱氧核糖核苷。核苷可以基于单独地或基于总体地指定为核糖核苷或2'-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时,序列按照常规惯例呈现为5'至3'方向,并且不示出磷酸。
如本文使用的,术语“约”意指特定值的可接受误差。在一些实例中,“约”意指在给定值范围的0.05%、0.5%、1.0%或2.0%内。在一些实例中,“约”意指在给定值的1、2、3或4个标准差内。
如本文使用的,“EC”编号是指生物化学和分子生物学国际联合命名委员会(Nomenclature Committee of the International Union of Biochemistry andMolecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。
如本文使用的,“ATCC”是指美国典型培养物保藏中心(American Type CultureCollection),其生物保藏收集物包括基因和菌株。
如本文使用的,“NCBI”是指美国国家生物技术信息中心(National Center forBiological Information)和其中提供的序列数据库。
如本文使用的,“苯丙氨酸氨裂合酶”(“PAL”)酶是催化L-苯丙氨酸和相关化合物诸如L-2-氨基-3-(2-(苄氧基)-3-甲氧基苯基)丙酸的可逆非氧化脱氨的酶。
“蛋白”、“多肽”和“肽”在本文可互换使用,以表示无论长度或翻译后修饰(例如,糖基化或磷酸化),通过酰胺键共价连接的至少两个氨基酸的聚合物。该定义中包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物的聚合物。
“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。
如本文使用的,“亲水氨基酸或残基”是指根据Eisenberg等人(Eisenberg等人,J.Mol.Biol.,179:125-142[1984])的归一化共有疏水性标度,具有表现出小于零的疏水性的侧链的氨基酸或残基。遗传编码的亲水氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。
如本文使用的,“酸性氨基酸或残基”是指当氨基酸被包含在肽或多肽中时,具有表现出小于约6的pKa值的侧链的亲水氨基酸或残基。由于氢离子的损失,酸性氨基酸在生理pH通常具有带负电荷的侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。
如本文使用的,“碱性氨基酸或残基”是指当氨基酸被包含在肽或多肽中时,具有表现出大于约6的pKa值的侧链的亲水氨基酸或残基。由于与水合氢离子的缔合,碱性氨基酸在生理pH通常具有带正电荷的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。
如本文使用的,“极性氨基酸或残基”是指具有在生理pH不带电荷但具有其中两个原子共同共有的电子对被其中一个原子更紧密地保持(held more closely)的至少一个键的侧链的亲水氨基酸或残基。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。
如本文使用的,“疏水氨基酸或残基”是指根据Eisenberg等人(Eisenberg等人,J.Mol.Biol.,179:125-142[1984])的归一化共有疏水性标度,具有表现出大于零的疏水性的侧链的氨基酸或残基。遗传编码的疏水氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。
如本文使用的,“芳族氨基酸或残基”是指具有包括至少一个芳族或杂芳族环的侧链的亲水或疏水氨基酸或残基。遗传编码的芳族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。尽管由于其杂芳族氮原子的pKa,L-His(H)有时被归类为碱性残基,或因为其侧链包括杂芳族环而被归类为芳族残基,但在本文中,组氨酸被归类为亲水残基或为“受限残基(constrained residue)”(参见下文)。
如本文使用的,“受限氨基酸或残基”是指具有受限几何形状的氨基酸或残基。本文中,受限残基包括L-Pro(P)和L-His(H)。组氨酸具有受限的几何形状,因为它具有相对小的咪唑环。脯氨酸具有受限的几何形状,因为它也具有五元环。
如本文使用的,“非极性氨基酸或残基”是指具有在生理pH不带电荷并具有其中两个原子共同共有的电子对通常由两个原子各自同等地保持(即侧链不是极性的)的键的侧链的疏水氨基酸或残基。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。
如本文使用的,“脂肪族氨基酸或残基”是指具有脂肪族烃侧链的疏水氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。值得注意的是,半胱氨酸(或“L-Cys”或“[C]”)是不常见的,因为它可以与其他L-Cys(C)氨基酸或其他含磺酰基或巯基的氨基酸形成二硫化物桥。“半胱氨酸样残基”包括半胱氨酸和含有可用于形成二硫化物桥的巯基部分的其他氨基酸。L-Cys(C)(和具有含-SH侧链的其他氨基酸)以还原的游离-SH或氧化的二硫化物桥接形式存在于肽中的能力影响L-Cys(C)对肽贡献净疏水特征还是亲水特征。虽然根据Eisenberg的归一化共有标度(Eisenberg等人,1984,上文),L-Cys(C)表现出0.29的疏水性,但是应当理解,为了本公开内容的目的,L-Cys(C)被分类为其自身独特的组。
如本文使用的,“小氨基酸或残基”是指具有包括总计三个或更少的碳和/或杂原子(不包括α-碳和氢)的侧链的氨基酸或残基。根据上述定义,小氨基酸或残基可进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。
如本文使用的,“含羟基的氨基酸或残基”是指含有羟基(-OH)部分的氨基酸。遗传编码的含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。
如本文使用的,“多核苷酸”和“核酸”是指共价连接在一起的两个或更多个核苷酸。多核苷酸可以完全包含核糖核苷酸(即RNA)、完全包含2'脱氧核糖核苷酸(即DNA)或包含核糖核苷酸和2'脱氧核糖核苷酸的混合物。虽然核苷典型地将经由标准磷酸二酯连接连接在一起,但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包括单链区域和双链区域二者。此外,虽然多核苷酸通常包含天然存在的编码核苷碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),它可以包含一种或更多种经修饰和/或合成的核苷碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,这样的经修饰或合成的核苷碱基是编码氨基酸序列的核苷碱基。
如本文使用的,“核苷”是指包含核苷碱基(即含氮碱基)和5-碳糖(例如核糖或脱氧核糖)的糖基胺。核苷的非限制性实例包括胞苷、尿苷、腺苷、鸟苷、胸苷和肌苷。相比之下,术语“核苷酸”是指包含核苷碱基、5-碳糖和一个或更多个磷酸基团的糖基胺。在一些实施方案中,核苷可以被激酶磷酸化以产生核苷酸。
如本文使用的,“核苷二磷酸”是指包含核苷碱基(即含氮碱基)、5-碳糖(例如核糖或脱氧核糖)和二磷酸(即焦磷酸)部分的糖基胺。在本文的一些实施方案中,“核苷二磷酸”缩写为“NDP”。核苷二磷酸的非限制性实例包括胞苷二磷酸(CDP)、尿苷二磷酸(UDP)、腺苷二磷酸(ADP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)和肌苷二磷酸。在一些情形中,术语“核苷”和“核苷酸”可互换使用。
如本文使用的,“编码序列”是指核酸(例如基因)编码蛋白质的氨基酸序列的部分。
如本文使用的,术语“生物催化(biocatalysis)”、“生物催化(biocatalytic)”、“生物转化”和“生物合成”是指使用酶来对有机化合物进行化学反应。
如本文使用的,“野生型”和“天然存在的”是指在自然界中发现的形式。例如野生型多肽或多核苷酸序列为生物体中存在的序列,其可从天然来源分离且未通过人为操纵被有意地修饰。
如本文使用的,当关于细胞、核酸或多肽使用时,“重组”、“工程化”、“非天然存在的”和“变体”是指已经以自然界原本不存在的方式修饰的材料或相应于该材料的天然或自然形式的材料。在一些实施方案中,细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同,但由合成材料和/或通过使用重组技术操纵产生或衍生。非限制性实例包括,除其他以外,表达自然(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的自然基因的重组细胞。
术语“序列同一性百分比(%)”在本文中用于指多核苷酸或多肽之间的比较,并通过比较比较窗中两条最佳比对的序列确定,其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即,空位),以用于两个序列的最佳比对。百分比可以通过如下计算:确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性百分比。可选地,百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以通过任何合适的方法进行,包括但不限于Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981]),通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970]),通过Pearson和Lipman的相似性搜索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]),通过这些算法的计算机化实现(例如,GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或者通过目视检查,如本领域已知的。适用于确定序列同一性百分比和序列相似性的算法的实例包括但不限于BLAST和BLAST 2.0算法,由Altschul等人描述(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucl.Acids Res.,3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为邻近字评分阈值(参见,Altschul等人,上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(用于匹配残基对的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况时,停止字击中在每一个方向的延伸:累积比对评分从其最大达到值下降了量X;由于累积了一个或更多个负评分残基比对,累积得分达到0或小于0;或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3,期望(E)为10和BLOSUM62评分矩阵(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与%序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
如本文使用的,“参考序列”是指用作序列和/或活性比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包括两个序列之间不同的(divergent)序列,所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列(primary amino acid sequence),其中参考序列是可以在一级序列中具有一个或更多个变化的序列。
如本文使用的,“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比,可以包括20%或更少的添加或缺失(即,空位)以用于两个序列的最佳比对。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
如本文使用的,当在对给定氨基酸或多核苷酸序列进行编号的情况中使用时,“对应于”、“参考”或“相对于”是指当给定氨基酸或多核苷酸序列与参考序列相比较时对指定参考序列的残基进行编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定氨基酸序列,诸如工程化苯丙氨酸氨裂合酶的氨基酸序列可以通过引入空位以与参考序列对齐,来优化两个序列之间的残基匹配。在这些情况中,尽管存在空位,对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。
如本文使用的,“大体同一性(substantial identity)”是指在至少20个残基位置的比较窗中、通常在至少30-50个残基的窗中,与参考序列相比,具有至少80%序列同一性、至少85%同一性、至少89%至95%之间的序列同一性,或更通常至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性百分比通过在比较窗中比较参考序列和包含总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的一些具体实施方案中,术语“大体同一性”意指当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共有至少80%的序列同一性,优选地至少89%的序列同一性、至少95%的序列同一性或更多(例如99%的序列同一性)。在一些实施方案中,在被比较的序列中不相同的残基位置因保守氨基酸取代而有差异。
如本文使用的,“氨基酸差异”和“残基差异”是指在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。在一些情况下,参考序列具有组氨酸标签,但相对于没有组氨酸标签的等同参考序列,编号维持不变。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQID NO:4相比位置X93处的残基差异”是指对应于SEQ ID NO:4的位置93的多肽位置处的氨基酸残基的差异。因此,如果SEQ ID NO:4的参考多肽在位置93处具有丝氨酸,则“与SEQ IDNO:4相比位置X93处的残基差异”是指在对应于SEQ ID NO:4的位置93的多肽位置处除了丝氨酸以外的任何残基的氨基酸取代。在本文的大多数实例中,在一个位置处的具体氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中不同的残基)的单字母标识符。在一些实例中(例如,在实施例中呈现的表格中),本发明还提供由常规符号“AnB”表示的具体氨基酸差异,其中A为参考序列中的残基的单字母标识符,“n”为参考序列中的残基位置的编号,并且B为工程化多肽的序列中残基取代的单字母标识符。在一些实例中,本发明的多肽可以相对于参考序列包含一个或更多个氨基酸残基差异,其由相对于参考序列存在残基差异的一列指定位置指示。在一些实施方案中,在多于一个氨基酸可以用于多肽的具体残基位置中时,可以使用的各种氨基酸残基由“/”分开(例如,X307H/X307P或X307H/P)。斜线也可用于指示给定变体内的多于一个取代(即,在给定序列中诸如在组合变体中存在多于一个取代)。在一些实施方案中,本发明包括含有一个或更多个氨基酸差异的工程化多肽序列,所述氨基酸差异包括保守氨基酸取代或非保守氨基酸取代。在一些另外的实施方案中,本发明提供了包含保守氨基酸取代和非保守氨基酸取代两者的工程化多肽序列。
如本文使用的,“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基,并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于,在一些实施方案中,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。
如本文使用的,“非保守取代”是指用具有显著不同的侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸,并且影响(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水氨基酸取代亲水氨基酸。
如本文使用的,“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%或多达氨基酸总数的20%,同时保留酶活性和/或保留工程化苯丙氨酸氨裂合酶的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。氨基酸序列中的缺失通常用“-”表示。
如本文使用的,“插入”是指通过将一个或更多个氨基酸添加到参考多肽对多肽进行的修饰。插入可以处于多肽的内部部分或者到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或被天然存在的多肽中的一个或更多个氨基酸分开。
术语“氨基酸取代集”或“取代集”是指与参考序列相比,多肽序列中的一组氨基酸取代。取代集可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多个氨基酸取代。在一些实施方案中,取代集是指在实施例中提供的表格中列出的任何变体苯丙氨酸氨裂合酶中存在的氨基酸取代的集合。
“功能片段”和“生物活性片段”在本文可互换使用,指如下多肽:所述多肽具有氨基末端缺失和/或羧基末端缺失和/或内部缺失,但其中剩余的氨基酸序列与和它进行比较的序列(例如,本发明的全长工程化苯丙氨酸氨裂合酶)中的对应位置相同,并且保留全长多肽的基本上全部活性。
如本文使用的,“分离的多肽”是指与其天然伴随的其他污染物(例如蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如,宿主细胞内或经由体外合成)中取出或纯化的多肽。重组苯丙氨酸氨裂合酶多肽可以存在于细胞内、存在于细胞培养基中,或以各种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,重组苯丙氨酸氨裂合酶多肽可以是分离的多肽。
如本文使用的,“基本上纯的多肽”或“纯化的蛋白”是指如下组合物,在所述组合物中多肽物质是存在的主要物质(即,在摩尔或重量基础上,它比该组合物中的任何其他单独的大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,通常是基本上纯化的组合物。然而,在一些实施方案中,包含苯丙氨酸氨裂合酶的组合物包含少于50%纯的(例如,约10%、约20%、约30%、约40%或约50%)的苯丙氨酸氨裂合酶。通常,基本上纯的苯丙氨酸氨裂合酶组合物构成该组合物中存在的所有大分子物质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物质),其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的重组苯丙氨酸氨裂合酶多肽是基本上纯的多肽组合物。
如本文使用的,“改进的酶性质”是指酶的至少一种改进的性质。在一些实施方案中,本发明提供了与参考苯丙氨酸氨裂合酶多肽和/或野生型苯丙氨酸氨裂合酶多肽和/或另一种工程化苯丙氨酸氨裂合酶多肽相比表现出在任何酶性质的改进的工程化苯丙氨酸氨裂合酶多肽。因此,可以确定并比较各种苯丙氨酸氨裂合酶多肽,包括野生型以及工程化苯丙氨酸氨裂合酶之间的“改进”的水平。改进的性质包括但不限于诸如以下的性质:增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物或终产物抑制的抗性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH的耐受性、增加的对蛋白水解活性的耐受性(即,降低的对蛋白水解的敏感性)、降低的聚集、增加的溶解度、和改变的温度谱(temperature profile)。在另外的实施方案中,该术语用于指苯丙氨酸氨裂合酶的至少一种改进的性质。在一些实施方案中,本发明提供了与参考苯丙氨酸氨裂合酶多肽和/或野生型苯丙氨酸氨裂合酶多肽和/或另一种工程化苯丙氨酸氨裂合酶多肽相比表现出在任何酶性质的改进的工程化苯丙氨酸氨裂合酶多肽。因此,可以确定并比较各种苯丙氨酸氨裂合酶多肽,包括野生型以及工程化苯丙氨酸氨裂合酶之间的“改进”的水平。
如本文使用的,“增加的酶活性”和“增强的催化活性”是指工程化多肽的改进的性质,可以被表示为与参考酶相比,比活性(例如产生的产物/时间/重量蛋白)的增加或将底物转化为产物的转化百分比(例如在指定的时间段使用指定量的酶,将起始量的底物转化为产物的转化百分比)的增加。在一些实施方案中,该术语是指本文提供的工程化苯丙氨酸氨裂合酶多肽的改进的性质,可以被表示为与参考苯丙氨酸氨裂合酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加或将底物转化为产物的百分比(例如使用指定量的苯丙氨酸氨裂合酶,在指定时间段内将起始量的底物转化为产物的转化百分比)的增加。在一些实施方案中,这些术语用于指本文提供的改进的苯丙氨酸氨裂合酶。在实施例中提供了确定本发明的工程化苯丙氨酸氨裂合酶的酶活性的示例性方法。可以影响与酶活性相关的任何性质,包括典型的酶性质Km、Vmax或kcat,它们的改变可以导致增加的酶活性。例如,酶活性的改进可以是对应野生型酶的酶活性的约1.1倍到相比于天然存在的苯丙氨酸氨裂合酶或苯丙氨酸氨裂合酶多肽所源自的另一种工程化苯丙氨酸氨裂合酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更大的酶活性。
如本文使用的,“转化”是指一种或多于一种底物酶促转化(或生物转化)为一种或多于一种对应的产物。“转化百分比”是指在指定条件下在一定时间段内被转化为产物的底物的百分比。因此,苯丙氨酸氨裂合酶多肽的“酶活性”或“活性”可以表示为特定时间段内底物转化为产物的“转化百分比”。
具有“通用型性质(generalist properties)”的酶(或“通用型酶(generalistenzymes)”)是指与亲本序列相比,对宽范围的底物表现出改进的活性的酶。通用型酶不必对于每种可能的底物都表现出改进的活性。在一些实施方案中,本发明提供了具有通用型性质的苯丙氨酸氨裂合酶变体,因为相对于亲本基因,它们对宽范围的空间和电子不同的底物表现出相似或改进的活性。此外,本文提供的通用型酶被工程化为跨越宽范围的有差异的分子被改进以增加代谢物/产物的产生。
术语“严格杂交条件”在本文中用于指在该条件下核酸杂交体是稳定的条件。如本领域技术人员已知的,杂交体的稳定性反映在杂交体的解链温度(Tm)中。通常,杂交体的稳定性是离子强度、温度、G/C含量和离液剂的存在的函数。多核苷酸的Tm值可以使用用于预测解链温度的已知方法来计算(参见例如Baldino等人,Meth.Enzymol.,168:761-777[1989];Bolton等人,Proc.Natl.Acad.Sci.USA 48:1390[1962];Bresslauer等人,Proc.Natl.Acad.Sci.USA 83:8893-8897[1986];Freier等人,Proc.Natl.Acad.Sci.USA83:9373-9377[1986];Kierzek等人,Biochem.,25:7840-7846[1986];Rychlik等人,Nucl.Acids Res.,18:6409-6412[1990](勘误,Nucl.Acids Res.,19:698[1991]);Sambrook等人,上文);Suggs等人,1981,于Developmental Biology Using Purified Genes中,Brown等人.[eds.],pp.683-693,Academic Press,Cambridge,MA[1981];以及Wetmur,Crit.Rev.Biochem.Mol.Biol.26:227-259[1991])。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在限定的条件下,诸如中度严格或高度严格条件下,与编码本发明的工程化苯丙氨酸氨裂合酶的序列的互补序列杂交。
如本文使用的,“杂交严格性”是指核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性。示例性中度严格性条件是等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤的条件。“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格性条件指仅允许在0.018M NaCl中在65℃形成稳定杂交体的那些核酸序列的杂交(即,如果杂交体在0.018M NaCl中在65℃是不稳定的,它在如本文考虑的高严格性条件下是不稳定的)的条件。可以提供高严格性条件,例如,通过在等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS在42℃的条件杂交,然后在0.1×SSPE和0.1%SDS中在65℃洗涤提供。另一种高严格性条件是在等同于在含有0.1%(w/v)SDS的5X SSC中在65℃杂交的条件进行杂交和在含有0.1%SDS的0.1×SSC中在65℃洗涤。其他高严格性杂交条件以及中等严格性条件在上文引用的参考文献中描述。
如本文使用的,“密码子优化的”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中有效地表达。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示,但熟知的是,特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言,这种密码子使用偏倚可能更高。在一些实施方案中,可以对编码苯丙氨酸氨裂合酶的多核苷酸进行密码子优化,用于在选择用于表达的宿主生物体中的优化产生。
如本文使用的,“优选的”、“最佳的”、和“高密码子使用偏倚”密码子在单独或组合使用时,可以互换地指在蛋白编码区中的以高于编码相同氨基酸的其他密码子的频率使用的密码子。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率,或它们的组合来确定。其频率随着基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用于确定特定生物体中密码子频率(例如密码子使用、相对同义密码子使用)和密码子偏好的各种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析,和基因中使用的密码子的有效数目(参见例如,GCG CodonPreference,Genetics Computer Group Wisconsin Package;CodonW,Peden,University ofNottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucl.Acids Res.,222437-46[1994];以及Wright,Gene 87:23-29[1990])。许多不同的生物体的密码子使用表是可用的(参见例如,Wada等人,Nucl.Acids Res.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret等人,上文;Henaut和Danchin,于Escherichia coli and Salmonella中,Neidhardt等人.(eds.),ASM Press,Washington D.C.,p.2047-2066[1996])。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达的蛋白质的核酸序列(例如,完整的蛋白质编码序列-CDS)、表达的序列标签(ESTS),或基因组序列的预测编码区(参见例如,Mount,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.[2001];Uberbacher,Meth.Enzymol.,266:259-281[1996];以及Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997])。
如本文使用的,“控制序列”包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每一个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。最低程度而言,控制序列包括启动子以及转录和翻译终止信号。出于引入特定限制性位点的目的,控制序列可以与接头一起提供,所述特定限制性位点促进控制序列与编码多肽的核酸序列的编码区的连接。
“可操作地连接的”在本文被定义为如下配置:在所述配置中控制序列被适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的位置处,使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”是指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变体、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
短语“合适的反应条件”是指在酶促转化反应溶液中的那些条件(例如,酶载量(enzyme loading)、底物载量、温度、pH、缓冲液、助溶剂等的范围),在所述条件下本发明的苯丙氨酸氨裂合酶多肽能够将底物转化为期望的产物化合物。一些示例性的“合适的反应条件”在本文中提供。
如本文使用的,“载量”,诸如在“化合物载量”或“酶载量”中,是指在反应起始时组分在反应混合物中的浓度或量。
如本文使用的,在酶促转化反应过程的情况下,“底物”是指由本文提供的工程化酶(例如工程化苯丙氨酸氨裂合酶多肽)作用的化合物或分子。
如本文使用的,由反应产生的产物(例如L-苯丙氨酸类似物)的“增加”的产率发生在:与相同条件下用相同底物和其他取代物,但不存在感兴趣的组分的情况下进行的反应相比,反应期间存在的特定组分(例如苯丙氨酸氨裂合酶)导致产生更多的产物时。
如果与参与催化反应的其他酶相比,特定酶的量少于约2%、约1%或约0.1%(wt/wt),则称该反应“基本上不含”该酶。
如本文使用的,“分级分离(fractionating)”液体(例如培养肉汤)是指应用分离工艺(例如盐沉淀、柱色谱法、尺寸排阻和过滤)或这样的工艺的组合来提供一种溶液,其中期望蛋白在溶液中占总蛋白的百分比大于初始液体产物中的百分比。
如本文使用的,“起始组合物”是指包含至少一种底物的任何组合物。在一些实施方案中,起始组合物包含任何合适的底物。
如本文使用的,在酶促转化过程的情况下,“产物”是指从酶多肽对底物的作用而产生的化合物或分子。
如本文使用的,本文使用的“平衡”是指如由化学或酶促反应的正向速率常数和反向速率常数确定的在化学或酶促反应中产生化学物质的稳定状态浓度的过程(例如,两种物质A和B的相互转化),包括立体异构体的相互转化。
如本文使用的,“烷基”是指具有1个至18个碳原子(包括端点)的,直链的或支链的,更优选地1个至8个碳原子(包括端点),并且最优选地1个至6个碳原子(包括端点)的饱和烃基团。具有指定数目的碳原子的烷基在括号中表示(例如(C1-C4)烷基是指1个至4个碳原子的烷基)。
如本文使用的,“烯基”是指具有2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个双键但任选地含有多于一个双键的基团。
如本文使用的,“炔基”是指具有2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个三键但任选地含有多于一个三键,并且另外任选地含有一个或更多个双键键合部分的基团。
如本文使用的,“杂烷基”、“杂烯基”和“杂炔基”是指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团代替的如本文定义的烷基、烯基和炔基。可以代替碳原子的杂原子和/或杂原子基团包括但不限于-O-、-S-、-S-O-、-NRα-、-PH-、-S(O)-、-S(O)2-、-S(O)NRα-、-S(O)2NRα-等,包括它们的组合,其中每个Rα独立地选自氢、烷基、杂烷基、环烷基、杂环烷基、芳基和杂芳基。
如本文使用的,“烷氧基”是指基团-ORβ,其中Rβ是如上文定义的烷基基团,包括还如本文定义的任选地被取代的烷基基团。
如本文使用的,“芳基”是指具有单环(例如苯基)或多于一个稠环(例如萘基或蒽基)的具有6个至12个碳原子(包括端点)的不饱和的芳族碳环基团。示例性芳基包括苯基、吡啶基、萘基等。
如本文使用的,“氨基”是指基团-NH2。被取代的氨基是指基团-NHRδ、NRδRδ和NRδRδRδ,其中每个Rδ独立地选自被取代的或未被取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基(sulfanyl)、亚磺酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
如本文使用的,“氧代”是指=O。
如本文使用的,“氧基”是指二价基团-O-,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。
如本文使用的,“羧基”是指-COOH。
如本文使用的,“羰基”是指-C(O)-,其可以具有各种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
如本文使用的,“烷氧基羰基”指-C(O)ORε,其中Rε是本文定义的烷基,其可以任选地被取代。
如本文使用的,“氨基羰基”是指-C(O)NH2。被取代的氨基羰基是指-C(O)NRδRδ,其中氨基基团NRδRδ如本文定义的。
如本文使用的,“卤素(halogen)”和“卤代(halo)”是指氟、氯、溴和碘。
如本文使用的,“羟基”是指-OH。
如本文使用的,“氰基”指-CN。
如本文使用的,“杂芳基”是指具有1个至10个碳原子(包括端点)和在环内的选自氧、氮和硫的1个至4个杂原子(包括端点)的芳族杂环基团。这样的杂芳基基团可以具有单环(例如吡啶基或呋喃基)或多于一个稠环(例如吲嗪基(indolizinyl)或苯并噻吩基)。
如本文使用的,“杂芳基烷基”是指被杂芳基取代的烷基(即杂芳基-烷基-基团),优选地在烷基部分具有1个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。这样的杂芳基烷基基团通过吡啶基甲基等例示。
如本文使用的,“杂芳基烯基”是指被杂芳基取代的烯基(即杂芳基-烯基-基团),优选地在烯基部分具有2个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。
如本文使用的,“杂芳基炔基”是指被杂芳基取代的炔基(即杂芳基-炔基-基团),优选地在炔基部分具有2个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。
如本文使用的,“杂环”、“杂环的”和可互换的“杂环烃基”是指具有单环或多于一个稠环的、具有2个至10个碳环原子(包括端点)和在环内的选自氮、硫或氧的1个至4个杂环原子(包括端点)的饱和的或不饱和基团。这样的杂环基团可以具有单环(例如哌啶基或四氢呋喃基)或多于一个稠环(例如,二氢吲哚基、二氢苯并呋喃或奎宁环基(quinuclidinyl))。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪(quinolizine)、异喹啉、喹啉、酞嗪(phthalazine)、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑(carbazole)、咔啉(carboline)、菲啶(phenanthridine)、吖啶、菲咯啉(phenanthroline)、异噻唑、吩嗪(phenazine)、异噁唑、吩噁嗪(phenoxazine)、吩噻嗪(phenothiazine)、咪唑烷、咪唑啉(imidazoline)、哌啶、哌嗪、吡咯烷、吲哚啉等。
如本文使用的,“元环(membered ring)”意指包括任何环状结构。术语“元”之前的数字表示构成环的骨架原子的数目。因此,例如环己基、吡啶、吡喃和噻喃是6元环,并且环戊基、吡咯、呋喃和噻吩是5元环。
除非另外指明,否则在前述基团中被氢占据的位置可以被例如但不限于以下的取代基进一步取代:羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤素、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、甲酰胺基、被取代的甲酰胺基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰胺基(sulfonamido)、被取代的磺酰胺基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基甲酰基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基;并且优选的杂原子是氧、氮和硫。应理解,在这些取代基上存在开放化合价的情况下,它们可以被烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代,在碳上存在这些开放化合价的情况下,它们可以被卤素和氧-、氮-或硫-键合的取代基进一步取代,并且在存在多于一个这样的开放化合价的情况下,这些基团可以通过直接形成键或通过与新的杂原子(优选地氧、氮或硫)形成键而连接形成环。还应理解,可以进行上文的取代,条件是用取代基替代氢不会对本发明的分子带来不可接受的不稳定性,并且以其他方式在化学上是合理的。
如本文使用的术语“培养”是指微生物细胞群体在任何合适的条件(例如,使用液体、凝胶或固体培养基)下的生长。
重组多肽可以使用本领域已知的任何合适的方法产生。可以将编码感兴趣的野生型多肽的基因克隆到载体诸如质粒中,并且在期望的宿主诸如大肠杆菌等中表达。重组多肽的变体可以通过本领域已知的各种方法产生。事实上,存在本领域技术人员熟知的各种各样不同的诱变技术。此外,诱变试剂盒还可从许多商业分子生物学供应商获得。方法可用于做出确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变,或整个基因内的随机诱变(例如,饱和诱变)。本领域的技术人员已知产生酶变体的许多合适的方法,包括但不限于,使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组,和化学饱和诱变,或本领域已知的任何其他合适的方法。诱变和定向进化方法可以容易地应用于编码酶的多核苷酸,以产生可以被表达、筛选和测定的变体文库。任何合适的诱变和定向进化方法可用于本发明并且是本领域熟知的(参见例如美国专利第5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326号,以及所有相关的美国以及PCT和非美国的对应申请;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767;和WO 2009/152336,其全部通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶克隆通过使酶制品经历确定的温度(或其他测定条件),并测量热处理或其他合适的测定条件之后剩余的酶活性的量来进行筛选。然后将包含编码多肽的多核苷酸的克隆从基因分离,测序以鉴定核苷酸序列的改变(如果有),并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如,标准生物化学技术,诸如HPLC分析)进行。
在变体产生之后,可以筛选它们的任何期望的性质(例如,高或增加的活性,或者低或降低的活性,增加的热活性,增加的热稳定性,和/或酸性pH稳定性等)。在一些实施方案中,可使用“重组苯丙氨酸氨裂合酶多肽”(在本文中还被称为“工程化苯丙氨酸氨裂合酶多肽”、“变体苯丙氨酸氨裂合酶”、“苯丙氨酸氨裂合酶变体”和“苯丙氨酸氨裂合酶组合变体”)。在一些实施方案中,可使用“重组苯丙氨酸氨裂合酶多肽”(还被称为“工程化苯丙氨酸氨裂合酶多肽”、“变体苯丙氨酸氨裂合酶”、“苯丙氨酸氨裂合酶变体”和“苯丙氨酸氨裂合酶组合变体”)。
如本文使用的,“载体”是用于将DNA序列引入细胞中的DNA构建体。在一些实施方案中,载体是可操作地连接至能够实现DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中,“表达载体”具有可操作地连接至DNA序列(例如,转基因)以驱动在宿主细胞中表达的启动子序列,并且在一些实施方案中,还包含转录终止子序列。
如本文使用的,术语“表达”包括参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,术语“产生”是指蛋白和/或其他化合物从细胞的产生。意在该术语涵盖参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,如果氨基酸或核苷酸序列(例如,启动子序列、信号肽、终止子序列等)与它可操作地连接至的另一个序列在自然界中未缔合,则这两个序列是“异源的”。例如“异源多核苷酸”是通过实验室技术引入宿主细胞中的任何多核苷酸,并且包括从宿主细胞中取出、经历实验室操纵并且然后再引入宿主细胞的多核苷酸。
如本文使用的,术语“宿主细胞”和“宿主菌株”是指用于包含本文提供的DNA(例如,编码苯丙氨酸氨裂合酶变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中,宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。
术语“类似物”意指与参考多肽具有多于70%序列同一性,但少于100%序列同一性(例如,多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些实施方案中,类似物意指如下多肽,所述多肽包含一个或更多个非天然存在的氨基酸残基(包括但不限于高精氨酸、鸟氨酸和正缬氨酸)以及天然存在的氨基酸。在一些实施方案中,类似物还包括一个或更多个D-氨基酸残基以及两个或更多个氨基酸残基之间的非肽连接。
术语“有效量”意指足以产生期望的结果的量。本领域普通技术人员可以通过使用常规实验确定有效量是多少。
术语“分离的”和“纯化的”用于指从与其天然缔合的至少一种其他组分取出的分子(例如,分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度,而是意在作为相对定义。
如本文使用的,“立体选择性”是指在化学或酶促反应中一种立体异构体相对于另一种立体异构体的优先形成。立体选择性可以是部分的,此时一种立体异构体的形成优于另一种立体异构体,或者立体选择性可以是完全的,此时只形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两者的总和中一种对映异构体的分数(通常被报告为百分比)。可选择地,本领域通常将其报告为根据下式从中计算的对映异构体过量(“e.e.”)(通常为百分比):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]。在立体异构体是非对映异构体的情况下,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常被报告为百分比),通常可选择地报告为非对映异构体过量(“d.e.”)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。
如本文使用的,术语“区域选择性”和“区域选择性反应”是指其中键形成或断裂的一个方向优先于所有其他可能的方向发生的反应。如果区别是完全的,则反应可以是完全(100%)区域选择的,如果在一个位点的反应产物优于在其他位点的反应产物,则反应可以是大体上区域选择的(至少75%),或部分区域选择的(x%,其中百分比依赖于感兴趣的反应进行设置)。
如本文使用的,“化学选择性”是指在化学或酶促反应中一种产物相对于另一种产物的优先形成。
如本文使用的,“pH稳定的”是指与未处理的酶相比,在暴露于高或低的pH(例如4.5-6或8至12)一段时间(例如0.5-24小时)后维持类似活性(例如多于60%至80%)的苯丙氨酸氨裂合酶多肽。
如本文使用的,“热稳定”是指与暴露于升高的温度(例如40℃至80℃)的野生型酶相比,在暴露于相同的升高的温度持续一段时间(例如0.5h-24h)后,维持类似活性(例如多于60%至80%)的苯丙氨酸氨裂合酶多肽。
如本文使用的,“溶剂稳定”是指与暴露于不同浓度(例如5%-99%)的溶剂(乙醇、异丙醇、二甲基亚砜[DMSO]、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)的野生型酶相比,在暴露于相同浓度的相同溶剂持续一段时间(例如0.5h-24h)后,维持类似活性(多于例如60%至80%)的苯丙氨酸氨裂合酶多肽。
如本文使用的,“热稳定且溶剂稳定”是指既热稳定又溶剂稳定的苯丙氨酸氨裂合酶多肽。
如本文使用的,“任选的”和“任选地”意指随后描述的事件或情形可以发生或可以不发生,并且意指该描述包括当该事件或情形发生时的实例和其中该事件或情形没有发生的实例。本领域普通技术人员将理解,对于被描述为包含一个或更多个任选的取代基的任何分子,仅意在包括空间上可实现的和/或合成上可行的化合物。
如本文使用的,“任选地被取代的”是指一种或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基基团、环烷基基团、芳基基团和杂芳基基团彼此独立地可以被取代或可以不被取代。
发明详述
本发明提供了工程化苯丙氨酸氨裂合酶(PAL)多肽及其组合物,以及编码工程化苯丙氨酸氨裂合酶(PAL)多肽的多核苷酸。还提供了用于产生PAL酶的方法。在一些实施方案中,工程化PAL多肽被优化以提供增强的催化活性,所述催化活性可用于在工业工艺条件下产生药物化合物。
在一些实施方案中,本发明提供了适用于产生L-苯丙氨酸类似物诸如EMA401-A1(Novartis)的酶。开发本发明是为了解决酶产生这些L-苯丙氨酸类似物的潜在用途。然而,已经确定这种方法的一个挑战是野生型酶不太可能是产生L-苯丙氨酸类似物所需的必需底物类似物的最佳选择。
特别感兴趣的是开发能够催化方案2中示出的反应的PAL酶。化合物(2),也称为EMA401-A1,是也称为EMA401的化合物(3)的前体,如方案3中示出的。EMA401作为2型血管紧张素II(AT2R)受体的高亲和力配体是首创的(first in class),并且正在被研究用于治疗神经病理性疼痛(参见,Hesselink和Schatman,J.Pain Res.,10:439-443[2017])。在开发本发明之前,由于苄基环上取代基(即苄氧基和甲氧基基团)的庞大性质和这些基团的供电子性质,因为这已经被描述为对PAL活性有负面影响(参见,Ahmed等人,ACS Catal.,8:3129-3132[2018]),预计很难鉴定对化合物(1)具有足够活性的天然存在的PAL酶用于商业应用。因此,开发本发明是为了解决对这些酶进行工程化以获得对化合物(1)的新的或改进的活性的需要,如下文方案2中示出的。
本发明提供了工程化PAL多肽、编码该多肽的多核苷酸、制备该多肽的方法以及用于使用该多肽的方法。在描述涉及多肽时,应理解,它还描述了编码该多肽的多核苷酸。
在一些实施方案中,本发明提供了与野生型PAL酶相比具有改进的性质的工程化、非天然存在的PAL酶。任何合适的反应条件可用于本发明。在一些实施方案中,使用方法来分析工程化多肽进行异构化反应的改进的性质。在一些实施方案中,如下文和实施例中进一步描述的,根据工程化PAL、一种或更多种底物、一种或更多种缓冲液、一种或更多种溶剂的浓度或量、pH、包括温度和反应时间的条件和/或工程化PAL多肽固定在固体支持物上的条件来改变反应条件。在一些实施方案中,利用另外的反应组分或另外的技术来补充反应条件。在一些实施方案中,这些包括采取措施来稳定酶或防止酶失活、减少产物抑制、使反应平衡变动到期望的产物形成。
在一些另外的实施方案中,用于将底物化合物转化为产物化合物的任何上文描述的方法还可以包括一个或更多个选自以下的步骤:一种或更多种产物化合物的提取、分离、纯化、结晶、过滤和/或冻干。用于从通过本文提供的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶一种或更多种产物的方法、技术和方案是普通技术人员已知的和/或通过常规实验获得的。此外,在下文的实施例中提供了说明性方法。
工程化PAL多肽
在一些另外的实施方案中,本发明的工程化苯丙氨酸氨裂合酶多肽包括包含与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140包含至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的多肽。
在一些实施方案中,工程化苯丙氨酸氨裂合酶多肽通过在有利于产生工程化苯丙氨酸氨裂合酶多肽的条件下培养包含编码至少一种工程化苯丙氨酸氨裂合酶多肽的至少一种多核苷酸序列的微生物来产生。在一些实施方案中,工程化苯丙氨酸氨裂合酶多肽随后从所得的培养基和/或细胞回收。
本发明提供了具有苯丙氨酸氨裂合酶活性的示例性工程化苯丙氨酸氨裂合酶多肽。实施例提供了显示将特定氨基酸序列特征与工程化苯丙氨酸氨裂合酶多肽的功能活性关联的序列结构信息的表格。该结构-功能关联信息以以下形式提供:示例性工程化苯丙氨酸氨裂合酶多肽相对于SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140的参考工程化多肽的特定氨基酸残基差异,以及相关的经实验确定的活性数据。
在一些实施方案中,具有苯丙氨酸氨裂合酶活性的本发明的工程化苯丙氨酸氨裂合酶多肽包含这样的氨基酸序列:与参考序列SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140具有至少85%的序列同一性,并且与参考序列(例如,野生型多变鱼腥藻苯丙氨酸氨裂合酶)相比,其表现出至少一种改进的性质。
在一些实施方案中,表现出至少一种改进的性质的工程化苯丙氨酸氨裂合酶多肽与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140具有至少85%、至少88%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更大的氨基酸序列同一性,以及与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140相比在一个或更多个氨基酸位置处(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个、20个或更多个氨基酸位置处)的氨基酸残基差异。在一些实施方案中,工程化苯丙氨酸氨裂合酶多肽是在实施例中提供的表格中列出的多肽。
在一些实施方案中,本发明提供了工程化苯丙氨酸氨裂合酶多肽的功能片段。在一些实施方案中,功能片段包含其所源自的工程化苯丙氨酸氨裂合酶多肽(即,亲本工程化苯丙氨酸氨裂合酶)的活性的至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在一些实施方案中,功能片段包含工程化苯丙氨酸氨裂合酶的亲本序列的至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在一些实施方案中,功能片段被截短了少于5个、少于10个、少于15个、少于10个、少于25个、少于30个、少于35个、少于40个、少于45个和少于50个氨基酸。
在一些实施方案中,本发明提供了工程化苯丙氨酸氨裂合酶多肽的功能片段。在一些实施方案中,功能片段包含其所源自的工程化苯丙氨酸氨裂合酶多肽(即,亲本工程化苯丙氨酸氨裂合酶)的活性的至少约95%、96%、97%、98%或99%。在一些实施方案中,功能片段包含工程化苯丙氨酸氨裂合酶的亲本序列的至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施方案中,功能片段被截短了少于5个、少于10个、少于15个、少于10个、少于25个、少于30个、少于35个、少于40个、少于45个、少于50个、少于55个、少于60个、少于65个或少于70个氨基酸。
在一些实施方案中,表现出至少一种改进的性质的工程化苯丙氨酸氨裂合酶多肽与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140具有至少85%、至少88%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更大的氨基酸序列同一性,以及与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140相比在一个或更多个氨基酸位置处(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置处)的氨基酸残基差异。在一些实施方案中,工程化苯丙氨酸氨裂合酶包含与SEQ IDNO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140的至少90%的序列同一性,并且包含至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中,工程化苯丙氨酸氨裂合酶多肽由SEQ ID NO:4、8、106、252、446、482、516、618、714、830、894、988和/或1140的序列组成。
编码工程化多肽的工程化PAL多核苷酸、表达载体和宿主细胞
本发明提供了编码本文描述的工程化酶多肽的多核苷酸。在一些实施方案中,多核苷酸可操作地连接至控制基因表达的一个或更多个异源调节序列,以产生能够表达多肽的重组多核苷酸。在一些实施方案中,将包含编码一种或更多种工程化酶多肽的至少一种异源多核苷酸的表达构建体引入适当的宿主细胞中以表达一种或更多种相应的酶多肽。
如对技术人员将是明显的,蛋白序列的可得性以及对对应于各种氨基酸的密码子的了解提供能够编码主题多肽的所有多核苷酸的描述。遗传密码子的简并性,其中相同氨基酸由可选的或同义的密码子编码,允许制备极大数目的核酸,所有这些核酸编码工程化酶(例如PAL)多肽。因此,本发明提供了通过基于可能的密码子选项来选择组合用于产生编码本文描述的酶多肽的可制备的酶多核苷酸的每种和每一种可能变化形式的方法和组合物,并且所有这样的变化形式都被认为是针对本文描述的任何多肽具体公开的,包括实施例中(例如,各个表格中)呈现的氨基酸序列。
在一些实施方案中,密码子被优选地优化,以被用于蛋白产生的选择的宿主细胞利用。例如,细菌中使用的优选的密码子通常用于细菌中的表达。因此,编码工程化酶多肽的密码子优化的多核苷酸在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选的密码子。
在一些实施方案中,酶多核苷酸编码具有酶活性与本文公开的性质的工程化多肽,其中多肽包含与选自SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140的参考序列或任何变体(例如实施例中提供的那些)的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列,以及与一种或更多种参考多核苷酸或如实施例中公开的任何变体的氨基酸序列相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中,参考多肽序列选自SEQ ID NO:2、4、8、106、482、516、618、714、830、894、988和/或1140。
在一些实施方案中,苯丙氨酸氨裂合酶多核苷酸编码具有苯丙氨酸氨裂合酶活性与本文公开的性质的工程化多肽,其中多肽包含与选自SEQ ID NO:4、8、106、252、446、482、516、618、714、830、894、988和/或1140的参考序列或任何变体(例如实施例中提供的那些)的氨基酸序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列,以及与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1140的参考多核苷酸相比或实施例中公开的任何变体的氨基酸序列的一个或更多个差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中,参考序列选自SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1140。在一些实施方案中,工程化苯丙氨酸氨裂合酶变体包含SEQ ID NO:4、8、106、252、446、482、516、618、714、830、894、988和/或1140中列出的多肽序列。在一些实施方案中,工程化苯丙氨酸氨裂合酶变体包含实施例(例如,表4.1、表5.1、表6.1、表7.1、表8.1、表9.1、表10.1、表11.1、表12.1、表13.1、表14.1、表15.1、表18.1和/或表19.1)中提供的取代或取代集。
本发明提供了多核苷酸,所述多核苷酸编码本文提供的工程化苯丙氨酸氨裂合酶变体。在一些实施方案中,多核苷酸包含与选自SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的参考序列或任何变体(例如实施例中提供的那些)的氨基酸序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的核苷酸序列,以及与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的参考多核苷酸或实施例中公开的任何变体的氨基酸序列相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中,参考序列选自SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139。在一些实施方案中,多核苷酸能够与选自SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的参考多核苷酸序列或其互补序列或者编码本文提供的任何变体苯丙氨酸氨裂合酶多肽的多核苷酸序列在高度严格条件下杂交。在一些实施方案中,能够在高度严格条件下杂交的多核苷酸编码包含与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139相比具有一个或更多个残基差异的氨基酸序列的苯丙氨酸氨裂合酶多肽。在一些实施方案中,工程化苯丙氨酸氨裂合酶变体由SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139中列出的多核苷酸序列编码。
在一些实施方案中,多核苷酸能够与选自本文提供的任何多核苷酸序列的参考多核苷酸序列或其互补序列或者编码本文提供的任何变体酶多肽的多核苷酸序列在高度严格条件下杂交。在一些实施方案中,能够在高度严格条件下杂交的多核苷酸编码包含与参考序列相比具有一个或更多个残基差异的氨基酸序列的酶多肽。
在一些实施方案中,编码本文的工程化酶多肽中的任一个的分离的多核苷酸以各种方式被操纵,以促进酶多肽的表达。在一些实施方案中,编码酶多肽的多核苷酸构成表达载体,其中存在一个或更多个控制序列来调节酶多核苷酸和/或多肽的表达。根据所用的表达载体,在分离的多核苷酸插入载体之前对分离的多核苷酸的操纵可以是期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。在一些实施方案中,控制序列包括,除其他以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。在一些实施方案中,基于宿主细胞的选择对合适的启动子进行选择。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的合适启动子包括,但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因,以及原核β-内酰胺酶基因(参见,例如,Villa-Kamaroff等人,Proc.Natl Acad.Sci.USA 75:3727-3731[1978]),以及tac启动子(参见,例如,DeBoer等人,Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括但不限于从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusariumoxysporum)胰蛋白酶样蛋白酶(参见,例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母(Saccharomycescerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992])。
在一些实施方案中,控制序列也是合适的转录终止子序列(即由宿主细胞识别以终止转录的序列)。在一些实施方案中,终止子序列可操作地连接至编码酶多肽的核酸序列的3'末端。在选择的宿主细胞中有功能的任何合适的终止子可用于本发明中。用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如,Romanos等,上文)。
在一些实施方案中,控制序列也是合适的前导序列(即对由宿主细胞的翻译重要的mRNA的非翻译区)。在一些实施方案中,前导序列可操作地连接至编码酶多肽的核酸序列的5'末端。在选择的宿主细胞中有功能的任何合适的前导序列可用于本发明中。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列从以下的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
在一些实施方案中,控制序列也是多腺苷酸化序列(即可操作地连接至核酸序列的3'末端的序列,并且其在转录时,被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号)。在选择的宿主细胞中有功能的任何合适的多腺苷酸化序列可用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括,但不限于以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列是已知的(参见例如Guo和Sherman,Mol.Cell.Bio.,15:5983-5990[1995])。
在一些实施方案中,控制序列包括信号肽(即编码连接至多肽的氨基末端并将编码的多肽引导到细胞的分泌途径的氨基酸序列的编码区)。在一些实施方案中,核酸序列的编码序列的5'末端固有地包含信号肽编码区,其符合翻译阅读框地(in translationreading frame)与编码分泌的多肽的编码区的区段天然地连接。可选择地,在一些实施方案中,编码序列的5'末端包含对编码序列而言外来的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何合适的信号肽编码区可用于一种或更多种工程化多肽的表达。用于细菌宿主细胞的有效信号肽编码区是包括但不限于从以下的基因获得的那些信号肽编码区:芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。在一些实施方案中,对于丝状真菌宿主细胞有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和Humicola lanuginosa脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些:酿酒酵母α-因子和酿酒酵母转化酶。
在一些实施方案中,控制序列也是编码定位在多肽的氨基末端处的氨基酸序列的前肽编码区。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区可以从包括但不限于以下的基因的任何合适的来源获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见例如WO 95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还利用了调节序列。这些序列促进相对于宿主细胞生长的多肽表达调节。调节系统的实例是引起基因的表达响应于化学或物理刺激(包括调节性化合物的存在)被开启或关闭的那些。在原核宿主细胞中,合适的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调节序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
在另一方面,本发明涉及包含编码工程化酶多肽的多核苷酸,以及根据其待引入的宿主的类型,一个或更多个表达调控区诸如启动子和终止子、复制起点等的重组表达载体。在一些实施方案中,本文描述的各种核酸和控制序列连接在一起以产生重组表达载体,所述重组表达载体包括一个或更多个方便的限制性位点,以允许在这样的位点插入或取代编码酶多肽的核酸序列。可选择地,在一些实施方案中,本发明的核酸序列通过将核酸序列或包含该序列的核酸构建体插入到用于表达的合适的载体中来表达。在涉及产生表达载体的一些实施方案中,编码序列位于载体中使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何合适的载体(例如,质粒或病毒),其可以方便地进行重组DNA程序并且引起酶多核苷酸序列的表达。载体的选择通常取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体为自主复制载体(即,作为染色体外的实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选择的实施方案中,载体是其中当被引入宿主细胞中时,被整合到基因组中并与其被整合进的一条或更多条染色体一起复制的载体。此外,在一些实施方案中,利用了单一载体或质粒,或者一起包含待引入宿主细胞的基因组中的总DNA的两种或更多种载体或质粒,和/或转座子。
在一些实施方案中,表达载体包含允许容易选择转化的细胞的一个或更多个选择标志物(selectable marker)。“选择标志物”是其产物提供抗微生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。细菌的选择标志物的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标志物包括但不限于amdS(乙酰胺酶;例如来自构巢曲霉(A.nidulans)或米曲霉(A.orzyae))、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶;例如来自吸水链霉菌(S.Hygroscopicus))、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶;例如来自构巢曲霉或米曲霉)、sC(硫酸腺苷酰转移酶(sulfateadenyltransferase))和trpC(邻氨基苯甲酸合酶),以及其等同物。
在另一方面,本发明提供了一种宿主细胞,所述宿主细胞包含编码本发明的至少一种工程化酶多肽的至少一种多核苷酸,所述多核苷酸可操作地连接至一个或更多个控制序列用于在宿主细胞中表达一种或更多种工程化酶。适合在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门菌(Salmonellatyphimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichiapastoris)(ATCC登录号201178));昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞还包括各种大肠杆菌(Escherichia coli)菌株(例如,W3110(ΔfhuA)和BL21)。细菌的选择标志物的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素和/或四环素抗性的标志物。
在一些实施方案中,本发明的表达载体包含允许载体整合到宿主细胞的基因组中或允许载体在细胞中独立于基因组进行自主复制的元件。在一些涉及整合到宿主细胞基因组中的实施方案中,载体依赖于编码多肽的核酸序列或用于通过同源或非同源重组将载体整合到基因组中的载体的任何其他元件。
在一些替代实施方案中,表达载体包含另外的核酸序列,用于指导通过同源重组整合到宿主细胞的基因组中。另外的核酸序列使载体能够在一条或更多条染色体中的一个或更多个精确位置处整合到宿主细胞基因组中。为了增加在精确位置处整合的可能性,整合元件优选地包含足够数量的核苷酸,诸如100个至10,000个碱基对,优选地400个至10,000个碱基对,和最优选地800个至10,000个碱基对,它们与相应的靶序列高度同源,以提高同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码核酸序列。在另一方面,载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,载体还可以包含复制起点,使得载体能够在所讨论的宿主细胞中自主复制。细菌复制起点的实例是允许在大肠杆菌中复制的P15A ori,或者质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)或pACYC184的复制起点以及允许在芽孢杆菌属(Bacillus)中复制的pUB110、pE194或pTA1060的复制起点。用于在酵母宿主细胞中使用的复制起点的实例是2μm复制起点、ARS1、ARS4、ARS1和CEN3的组合以及ARS4和CEN6的组合。复制起点可以是具有使其在宿主细胞中温度敏感地发挥功能的突变的复制起点(参见例如,Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433[1978])。
在一些实施方案中,将多于一个拷贝的本发明的核酸序列插入宿主细胞以增加基因产物的产生。核酸序列拷贝数的增加可以通过将该序列的至少一个另外的拷贝整合到宿主细胞基因组中,或者通过将可扩增的选择标志物基因包含在核酸序列中来获得,其中可以通过在合适的选择剂的存在下培养细胞来选择含有选择标志物基因的扩增的拷贝并从而含有核酸序列的另外的拷贝的细胞。
用于本发明的许多表达载体是商购可得的。合适的商业表达载体包括但不限于p3xFLAGTMTM表达载体(Sigma-Aldrich Chemicals),其包括用于在哺乳动物宿主细胞中表达的CMV启动子和hGH多腺苷酸化位点、以及用于在大肠杆菌中扩增的pBR322复制起点和氨苄青霉素抗性标志物。其他合适的表达载体包括但不限于pBluescriptII SK(-)和pBK-CMV(Stratagene),以及衍生自pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly的质粒(参见例如,Lathe等人,Gene 57:193-201[1987])。
因此,在一些实施方案中,将包含编码至少一种变体苯丙氨酸氨裂合酶的序列的载体转化到宿主细胞中,以允许载体的增殖和一种或更多种变体苯丙氨酸氨裂合酶的表达。在一些实施方案中,变体苯丙氨酸氨裂合酶被翻译后修饰以去除信号肽,并且在一些情况下可以在分泌后被裂解。在一些实施方案中,上文描述的转化的宿主细胞在合适的营养培养基中,在允许表达一种或更多种变体苯丙氨酸氨裂合酶的条件下培养。可用于培养宿主细胞的任何合适的培养基可用于本发明,包括但不限于含有合适补充物的基本培养基或复合培养基。在一些实施方案中,宿主细胞在HTP培养基中生长。合适的培养基可以从多个商业供应商获得,或者可以根据公开的配方(例如,在美国典型培养物保藏中心的目录中的)制备。
在另一方面,本发明提供了包含编码本文提供的改进的苯丙氨酸氨裂合酶多肽的多核苷酸的宿主细胞,所述多核苷酸可操作地连接到用于在宿主细胞中表达苯丙氨酸氨裂合酶的一个或更多个控制序列。用于表达由本发明的表达载体编码的苯丙氨酸氨裂合酶多肽的宿主细胞是本领域熟知的,并且包括但不限于,细菌细胞诸如大肠杆菌、巨大芽孢杆菌(Bacillus megaterium)、开菲尔乳杆菌(Lactobacillus kefir)、链霉菌属和鼠伤寒沙门菌细胞;真菌细胞诸如酵母细胞(例如酿酒酵母或巴斯德毕赤酵母(ATCC登录号201178));昆虫细胞诸如果蝇属S2和夜蛾属Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。用于上文描述的宿主细胞的合适的培养基和生长条件是本领域熟知的。
用于表达苯丙氨酸氨裂合酶的多核苷酸可以通过本领域已知的各种方法引入细胞中。技术包括,除其他以外,电穿孔、生物弹射粒子轰击(biolistic particlebombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞中的各种方法是本领域技术人员已知的。
在一些实施方案中,宿主细胞为真核细胞。合适的真核宿主细胞包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。合适的真菌宿主细胞包括但不限于子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、半知菌亚门(Deuteromycota)、接合菌门(Zygomycota)、不完全菌(Fungi imperfecti)。在一些实施方案中,真菌宿主细胞是酵母细胞和丝状真菌细胞。本发明的丝状真菌宿主细胞包括Eumycotina和卵菌亚门(Oomycota)的所有丝状形式。丝状真菌的特征是营养菌丝体,其中细胞壁由几丁质、纤维素和其他复杂多糖组成。本发明的丝状真菌宿主细胞在形态学上不同于酵母。
在本发明的一些实施方案中,丝状真菌宿主细胞是任何合适的属和种,包括但不限于:绵霉属(Achlya)、枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢子菌属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内座壳属(Endothia)、镰刀菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、脉孢菌属(Neurospora)、青霉菌属(Penicillium)、柄孢壳菌属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨形孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、柱顶孢霉属(Scytalidium)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、和/或草菇属(Volvariella)、和/或有性型或无性型、以及其同物异名、基原异名或分类学等同物。
在本发明的一些实施方案中,宿主细胞是酵母细胞,包括但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)或耶氏酵母属(Yarrowia)物种的细胞。在本发明的一些实施方案中,酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母、卡尔斯伯酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、Saccharomyces norbensis、克鲁维酵母(Saccharomyces kluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母、Pichia finlandica、Pichia trehalophila、Pichia kodamae、膜醭毕赤酵母(Pichiamembranaefaciens)、Pichia opuntiae、Pichia thermotolerans、Pichia salictaria、Pichia quercuum、Pichia pijperi、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白念珠菌(Candida albicans)或解脂耶氏酵母(Yarrowialipolytica)。
在本发明的一些实施方案中,宿主细胞是藻类细胞,诸如衣藻属(Chlamydomonas)(例如莱茵衣藻(C.reinhardtii))和席藻属(Phormidium)(席藻属物种ATCC29409)。
在一些其他实施方案中,宿主细胞为原核细胞。合适的原核细胞包括但不限于革兰氏阳性、革兰氏阴性和革兰氏可变(Gram-variable)细菌细胞。任何合适的细菌生物体可用于本发明,包括但不限于土壤杆菌属(Agrobacterium)、脂环酸芽胞杆菌属(Alicyclobacillus)、鱼腥藻属(Anabaena)、组囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、嗜酸栖热菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、Campestris、弯曲杆菌属(Campylobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭形杆菌属(Fusobacterium)、粪杆菌属(Faecalibacterium)、弗朗西丝菌属(Francisella)、黄杆菌属(Flavobacterium)、地芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中生根瘤菌(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅列藻属(Scenedesmus)、链霉菌属、链球菌属(Streptococcus)、Synecoccus、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷菌属(Serratia)、沙门菌属(Salmonella)、志贺菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、Tularensis、Temecula、嗜热聚球藻(Thermosynechococcus)、热球菌属(Thermococcus)、脲原体(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施方案中,宿主细胞是以下的物种:土壤杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、布赫纳氏菌属、地芽孢杆菌属、弯曲杆菌属、梭菌属、棒状杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门菌属、链球菌属、链霉菌属或发酵单胞菌属。在一些实施方案中,细菌宿主菌株对人类是非致病性的。在一些实施方案中,细菌宿主菌株是工业菌株。许多细菌的工业菌株是已知的并且适用于本发明。在本发明的一些实施方案中,细菌宿主细胞是土壤杆菌属物种(例如,放射形土壤杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)和悬钩子土壤杆菌(A.rubi))。在本发明的一些实施方案中,细菌宿主细胞是节杆菌属物种(例如,金黄节杆菌(A.aurescens)、柠檬色节杆菌(A.citreus)、球形节杆菌(A.globiformis)、A.hydrocarboglutamicus、A.mysorens、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、A.protophonniae、A.roseoparqffinus、硫磺色节杆菌(A.sulfureus)和产脲节杆菌(A.ureafaciens))。在本发明的一些实施方案中,细菌宿主细胞是芽孢杆菌属物种(例如,苏云金芽孢杆菌(B.thuringensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、B.alkaophius、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens))。在一些实施方案中,宿主细胞是工业芽孢杆菌属菌株,包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌或解淀粉芽孢杆菌。在一些实施方案中,芽孢杆菌宿主细胞是枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌和/或解淀粉芽孢杆菌。在一些实施方案中,细菌宿主细胞是梭菌属物种(例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌E88(C.tetani E88)、象牙海岸梭菌(C.lituseburense)、C.saccharobutylicum、产气荚膜梭菌(C.perfringens)和拜氏梭菌(C.beijerinckii))。在一些实施方案中,细菌宿主细胞是棒状杆菌属物种(例如,谷氨酸棒状杆菌(C.glutamicum)和嗜乙酰乙酸棒状杆菌(C.acetoacidophilum))。在一些实施方案中,细菌宿主细胞为埃希氏菌属物种(例如,大肠杆菌)。在一些实施方案中,宿主细胞为大肠杆菌W3110。在一些实施方案中,细菌宿主细胞是欧文氏菌属物种(例如,噬夏孢欧文氏菌(E.uredovora)、胡萝卜软腐欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、E.punctata和E.terreus)。在一些实施方案中,细菌宿主细胞是泛菌属物种(例如,柠檬酸泛菌(P.citrea)和成团泛菌(P.agglomerans))。在一些实施方案中,细菌宿主细胞是假单胞菌属物种(例如恶臭假单胞菌(P.putida)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii和假单胞菌属物种D-0l 10(P.sp.D-0l 10))。在一些实施方案中,细菌宿主细胞是链球菌属物种(例如,S.equisimiles、酿脓链球菌(S.pyogenes)和乳房链球菌(S.uberis))。在一些实施方案中,细菌宿主细胞是链霉菌属物种(例如,生二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、生金色链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)和变铅青链霉菌(S.lividans))。在一些实施方案中,细菌宿主细胞是发酵单胞菌属物种(例如,运动发酵单胞菌(Z.mobilis)和解脂发酵单胞菌(Z.lipolytica))。
可用于本发明的许多原核和真核菌株是公众从许多培养物保藏中心可容易地获得的,诸如美国典型培养物保藏中心(ATCC)、德国微生物和真菌保藏中心(DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH,DSM)、荷兰中央农业研究中心(Centraalbureau Voor Schimmelcultures,CBS)和美国农业研究服务专利培养物保藏中心北方区域研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center,NRRL)。
在一些实施方案中,宿主细胞被遗传修饰以具有改进蛋白分泌、蛋白稳定性的特征和/或蛋白表达和/或分泌所期望的其他性质。遗传修饰可以通过遗传工程技术和/或典型微生物技术(例如,化学或UV诱变和随后的选择)来实现。事实上,在一些实施方案中,重组修饰和典型选择技术的组合用于产生宿主细胞。使用重组技术,核酸分子可以以引起宿主细胞内和/或培养基中一种或更多种苯丙氨酸氨裂合酶变体的产量增加的方式引入、缺失、抑制或修饰。例如,敲除Alp1功能产生蛋白酶缺陷的细胞,并且敲除pyr5功能产生具有嘧啶缺陷表型的细胞。在一种遗传工程方法中,同源重组用于通过在体内特异性靶向基因来诱导靶向的基因修饰,以抑制编码蛋白的表达。在替代方法中,siRNA、反义和/或核酶技术可用于抑制基因表达。本领域已知各种降低细胞中的蛋白表达的方法,包括但不限于编码蛋白的基因的全部或一部分的缺失,和位点特异性诱变以破坏基因产物的表达或活性。(参见例如,Chaveroche等人,Nucl.Acids Res.,28:22 e97[2000];Cho等人,Molec.PlantMicrobe Interact.,19:7-15[2006];Maruyama 和Kitamoto,Biotechnol Lett.,30:1811-1817[2008];Takahashi等人,Mol.Gen.Genom.,272:344-352[2004];和You等人,Arch.Microbiol.,191:615-622[2009],其均通过引用并入本文)。也可使用随机诱变,随后筛选期望的突变(参见例如,Combier等人,FEMS Microbiol.Lett.,220:141-8[2003];和Firon等人,Eukary.Cell.2:247-55[2003],二者通过引用并入)。
将载体或DNA构建体引入宿主细胞中可以使用本领域已知的任何合适的方法完成,包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、PEG介导的转化、电穿孔或本领域已知的其他常用技术。在一些实施方案中,可使用大肠杆菌表达载体pCK100900i(参见,美国专利第9,714,437号,通过引用在此并入本文)。
在一些实施方案中,本发明的工程化宿主细胞(即,“重组宿主细胞”)在常规营养培养基中培养,所述培养基经适当修改以激活启动子、选择转化体或扩增苯丙氨酸氨裂合酶多核苷酸。培养条件,诸如温度、pH等,是先前与选择用于表达的宿主细胞一起使用的那些,并且是本领域技术人员熟知的。如所述的,许多标准参考文献和教科书可用于许多细胞的培养和产生,包括细菌、植物、动物(尤其是哺乳动物)和古细菌(archaebacterial)来源的细胞的培养和产生。
在一些实施方案中,表达本发明的变体苯丙氨酸氨裂合酶多肽的细胞在分批或连续发酵条件下生长。典型的“分批发酵”是封闭的系统,其中培养基的组成在发酵开始时设定,并且在发酵期间不受人为变化的影响。分批系统的一种变化形式是“补料分批发酵”,其也可用于本发明。在这种变化形式中,随着发酵的进行,底物以增量添加。当分解代谢物阻遏可能抑制细胞的代谢时,以及期望培养基中具有有限量的底物时,补料分批系统是有用的。分批发酵和补料分批发酵是本领域常见和熟知的。“连续发酵”是开放的系统,其中将确定的发酵培养基连续添加到生物反应器,并且同时取出等量的条件培养基用于处理。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵系统力图维持稳态生长条件。用于调节用于连续发酵过程的营养物和生长因子的方法以及用于使产物形成速率最大化的技术是工业微生物学领域熟知的。
在本发明的一些实施方案中,无细胞转录/翻译系统可用于产生一种或更多种变体苯丙氨酸氨裂合酶。若干系统是商购可得的,并且方法是本领域技术人员熟知的。
本发明提供了制备变体苯丙氨酸氨裂合酶多肽或其生物活性片段的方法。在一些实施方案中,该方法包括:提供用编码包含与SEQ ID NO:2、4、8、106、482、516、618、714、830、894、988和/或1140的至少约70%(或至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%)序列同一性并且包含至少一个本文提供的突变的氨基酸序列的多核苷酸转化的宿主细胞;在培养基中在宿主细胞表达编码的变体苯丙氨酸氨裂合酶多肽的条件下培养转化的宿主细胞;和任选地回收或分离表达的变体苯丙氨酸氨裂合酶多肽,和/或回收或分离含有表达的变体苯丙氨酸氨裂合酶多肽的培养基。在一些实施方案中,方法还提供任选地在表达编码的苯丙氨酸氨裂合酶多肽后裂解转化的宿主细胞,并任选地从细胞裂解物回收和/或分离表达的变体苯丙氨酸氨裂合酶多肽。本发明还提供了制备变体苯丙氨酸氨裂合酶多肽的方法,所述方法包括在适于产生变体苯丙氨酸氨裂合酶多肽的条件下培养用变体苯丙氨酸氨裂合酶多核苷酸转化的宿主细胞,并回收变体苯丙氨酸氨裂合酶多肽。通常,使用本领域熟知的蛋白质回收技术,包括本文描述的那些技术,从宿主细胞培养基、宿主细胞或两者回收或分离苯丙氨酸氨裂合酶多肽。在一些实施方案中,通过离心收集宿主细胞,通过物理或化学手段破坏,并保留所得的粗提取物用于进一步纯化。用于蛋白质表达的微生物细胞可以通过任何方便的方法来破坏,包括但不限于冻融循环、声波处理(sonication)、机械破坏和/或使用细胞裂解剂,以及本领域技术人员熟知的许多其他合适的方法。
宿主细胞中表达的工程化苯丙氨酸氨裂合酶可以使用本领域已知的用于蛋白纯化的技术中的任一种或更多种从细胞和/或培养基回收,所述用于蛋白纯化的技术包括,除了其他以外,溶菌酶处理、声波处理、过滤、盐析、超离心和色谱法。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是以商标名CelLytic BTM(Sigma-Aldrich)商购可得的。因此,在一些实施方案中,通过本领域已知的各种方法中的任一种来回收/分离并任选地纯化所得多肽。例如,在一些实施方案中,多肽通过常规程序从营养培养基分离,所述常规程序包括但不限于离心、过滤、提取、喷雾干燥、蒸发、色谱法(例如离子交换、亲和、疏水相互作用、色谱聚焦(chromatofocusing)和尺寸排阻)或沉淀。在一些实施方案中,根据需要,使用蛋白质重折叠步骤来完成成熟蛋白质的构造。此外,在一些实施方案中,在最终纯化步骤中采用高效液相色谱(HPLC)。例如,在一些实施方案中,本领域已知的方法可用于本发明(参见例如,Parry等人,Biochem.J.,353:117[2001];和Hong等人,Appl.Microbiol.Biotechnol.,73:1331[2007],二者通过引用并入本文)。事实上,本领域已知的任何合适的纯化方法可用于本发明。
用于分离苯丙氨酸氨裂合酶多肽的色谱技术包括但不限于,反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件部分地取决于诸如以下的因素:净电荷、疏水性、亲水性、分子量、分子形状等,是本领域技术人员已知的。
在一些实施方案中,亲和技术可用于分离改进的苯丙氨酸氨裂合酶。对于亲和色谱纯化,可以使用特异性结合苯丙氨酸氨裂合酶多肽的任何抗体。为了产生抗体,可以通过注射苯丙氨酸氨裂合酶免疫接种各种宿主动物,包括但不限于兔、小鼠、大鼠等。苯丙氨酸氨裂合酶多肽可以借助于侧链官能基团或附接至侧链官能基团的接头附接至合适的载体诸如BSA。根据宿主物种,可以使用各种佐剂增强免疫应答,包括但不限于弗氏(完全和不完全)、矿物凝胶诸如氢氧化铝、表面活性物质诸如溶血卵磷脂、普朗尼克多元醇、聚阴离子、肽、油乳剂、钥孔血蓝蛋白(keyhole limpet hemocyanin)、二硝基苯酚,以及潜在有用的人类佐剂诸如BCG(卡介苗)和短棒状杆菌(Corynebacterium parvum)。
在一些实施方案中,制备苯丙氨酸氨裂合酶变体并以表达酶的细胞形式、作为粗提取物或作为分离或纯化的制品使用。在一些实施方案中,将苯丙氨酸氨裂合酶变体制备成冻干剂、粉末形式(例如丙酮粉末),或者制备成酶溶液。在一些实施方案中,苯丙氨酸氨裂合酶变体是基本上纯的制品形式。
在一些实施方案中,苯丙氨酸氨裂合酶多肽连接到任何合适的固体基底。固体基底包括但不限于固相、表面和/或膜。固体支持物包括但不限于有机聚合物诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺,以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。基底的构型可以呈珠、球、颗粒(particle)、小粒(granule)、凝胶、膜或表面的形式。表面可以是平坦的、基本上平坦的或非平坦的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷(depression)或其他容器(container)、器皿(vessel)、特征或位置的形式。多于一个支持物可以被配置在阵列上于多个位置处,所述位置可用试剂的自动递送或通过检测方法和/或仪器寻址。
在一些实施方案中,免疫学方法用于纯化苯丙氨酸氨裂合酶变体。在一种方法中,使用常规方法产生的针对变体苯丙氨酸氨裂合酶多肽(例如,针对包含SEQ ID NO:2、4、8、106、482、516、618、714、830、894、988和1140的任一种的多肽、和/或其免疫原性片段)的抗体被固定在珠上,与细胞培养基在变体苯丙氨酸氨裂合酶被结合的条件下混合,并沉淀。在一种相关的方法中,可使用免疫色谱法(immunochromatography)。
在一些实施方案中,将变体苯丙氨酸氨裂合酶表达为包含非酶部分的融合蛋白。在一些实施方案中,变体苯丙氨酸氨裂合酶序列与纯化促进结构域融合。如本文使用的,术语“纯化促进结构域”是指介导与其融合的多肽的纯化的结构域。合适的纯化结构域包括但不限于金属螯合肽、允许在固定化金属上纯化的组氨酸-色氨酸模块、结合谷胱甘肽的序列(例如,GST)、血凝素(HA)标签(对应于源自流感血凝素蛋白的表位;参见例如,Wilson等人,Cell 37:767[1984])、麦芽糖结合蛋白序列、在FLAGS延伸/亲和纯化系统(例如,可从Immunex Corp获得的系统)中使用的FLAG表位,等等。考虑用于本文描述的组合物和方法的一种表达载体提供了融合蛋白的表达,所述融合蛋白包含与由肠激酶裂解位点隔开的多组氨酸区域融合的本发明的多肽。组氨酸残基促进在IMIAC(固定化金属离子亲和色谱;参见例如,Porath等人,Prot.Exp.Purif.,3:263-281[1992])上纯化,而肠激酶裂解位点提供了从融合蛋白分离变体苯丙氨酸氨裂合酶多肽的手段。pGEX载体(Promega)也可用于表达将外源多肽表达为与谷胱甘肽S-转移酶(GST)的融合蛋白。一般来说,这样的融合蛋白是可溶的,并且可以通过吸附到配体-琼脂糖珠(例如,在GST-融合蛋白的情况下,谷胱甘肽-琼脂糖),然后在游离配体的存在下洗脱,容易地从裂解的细胞纯化。
因此,在另一方面,本发明提供了产生工程化酶多肽的方法,其中所述方法包括将能够表达编码工程化酶多肽的多核苷酸的宿主细胞在适合于该多肽表达的条件下培养。在一些实施方案中,方法还包括分离和/或纯化如本文描述的酶多肽的步骤。
用于宿主细胞的合适的培养基和生长条件是本领域熟知的。考虑了,用于将用于表达酶多肽的多核苷酸引入细胞中的任何合适的方法可用于本发明。合适的技术包括但不限于,电穿孔、生物弹射粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。
实验
提供以下实施例,包括实验和获得的结果,仅用于说明的目的,而不应被解释为限制本发明。事实上,下文描述的许多试剂和设备有各种合适的来源。不意图将本发明限于任何试剂和设备项目的任何特定来源。
在下文的实验公开内容中,应用以下缩写:M(摩尔/升);mM(毫摩尔/升),uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);U(单位);MW(分子量);AUC(曲线下面积);rpm(转/分);psi和PSI(磅/平方英寸);℃(摄氏度);RT和rt(室温);CV(变异系数);CAM和cam(氯霉素);PMBS(硫酸多粘菌素B);IPTG(异丙基β-D-l-硫代吡喃半乳糖苷);LB(溶菌肉汤,lysogeny broth);TB(超级肉汤,terrific broth);SFP(摇瓶粉末);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);nt(核苷酸;多核苷酸);aa(氨基酸;多肽);大肠杆菌W3110(常用的实验室大肠杆菌菌株,可从Coli Genetic Stock Center[CGSC],New Haven,CT获得);HTP(高通量);HPLC(高压液相色谱);HPLC-UV(HPLC-紫外光可见检测器);1H NMR(质子核磁共振光谱学);FIOPC(相对于阳性对照的倍数改进);Sigma和Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI);Microfluidics(Microfluidics,Westwood,MA);Life Technologies(Life Technologies,FisherScientific,Waltham,MA的一部分);Amresco(Amresco,LLC,Solon,OH);Carbosynth(Carbosynth,Ltd.,Berkshire,UK);Varian(Varian Medical Systems,Palo Alto,CA);Agilent(Agilent Technologies,Inc.,Santa Clara,CA);Infors(Infors USA Inc.,Annapolis Junction,MD);和Thermotron(Thermotron,Inc.,Holland,MI)。
实施例1
含HTP PAL的湿细胞沉淀的制备
将为了在大肠杆菌中表达而优化的编码多变鱼腥藻苯丙氨酸氨裂合酶(AvPAL)(SEQ ID NO:2)的合成基因(SEQ ID NO:1)克隆到pCK110900载体中。选择更稳定且具有酪氨酸氨裂合酶活性的野生型AvPAL(SEQ ID NO:2)的进化的变体作为亲本基因(SEQ ID NO:4)。用含有亲本PAL编码基因(SEQ ID NO:3)的相应质粒转化W3110大肠杆菌细胞,并铺板在含有1%葡萄糖和30μg/ml氯霉素(CAM)的LB琼脂板上,并在37℃生长过夜。挑选单克隆菌落,并接种到180μl含有1%葡萄糖和30μg/mL氯霉素的LB中,并置于96孔浅孔微量滴定板的孔中。将板用O2可透过的密封件(seal)密封,并使培养物在30℃、200rpm和85%湿度生长过夜。然后,将10μl的每种细胞培养物转移到含有390μl TB和30μg/mL CAM的96孔深孔板的孔中。将深孔板用O2可透过的密封件密封,并在30℃、250rpm和85%湿度孵育,直到达到OD6000.6-0.8。然后通过添加异丙基硫代糖苷(IPTG)至1mM的最终浓度来诱导细胞培养物,并在30℃以250rpm摇动孵育过夜。然后使用4,000rpm持续10min的离心使细胞沉淀。弃去上清液,并在裂解前将沉淀在-80℃冷冻。
实施例2
含HTP PAL的细胞裂解物的制备
用400μl含有100mM三乙醇胺缓冲液pH 7.5、1g/L溶菌酶和0.5g/L的裂解缓冲液裂解如实施例1描述地制备的冷冻沉淀。将裂解混合物在室温摇动2小时。然后将板在4000rpm和4℃离心15min。然后将上清液作为澄清的裂解物用于生物催化反应,以确定酶活性。
实施例3
从摇瓶(SF)培养物制备冻干裂解物
将从具有1%葡萄糖和30μg/ml CAM的LB琼脂板挑选并在37℃孵育过夜的含有期望的基因的单个菌落转移到6ml具有1%葡萄糖和30μg/ml CAM的LB。使培养物在30℃、250rpm生长18h,并以约1:50传代培养至250ml含30μg/ml CAM的TB中,至约0.05的最终OD600。使传代培养物在30℃、250rpm生长约195分钟,达到0.6-0.8之间的OD600,并用1mMIPTG诱导。然后使传代培养物在30℃和250rpm生长20h。将传代培养物以4000rpm离心20min。弃去上清液,并将沉淀重悬浮于35ml的25mM三乙醇胺缓冲液,pH 7.5中。使用处理器系统(Microfluidics)在18,000psi裂解细胞。使裂解物沉淀(10,000rpm x 60min),然后将上清液冷冻并冻干以产生摇瓶(SF)酶粉末。
实施例4
用于产生化合物2的改进的PAL变体
选择来自多变鱼腥藻的野生型PAL(SEQ ID NO:2)的变体作为初始亲本酶(SEQ IDNO:4)。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。
每个100μL反应在96孔浅孔微量滴定板中以50%(v/v)澄清的细胞裂解物、10mM化合物(1)、1M碳酸铵,pH~9进行。将板热密封,并在30℃孵育,并在Infors振荡器中以500RPM摇动过夜。将板取出,并且通过将1体积(100μL)甲醇添加到板然后混合和离心来猝灭。然后根据需要将上清液在甲醇中稀释另外的量,使其高于检测限值并在分析的线性范围内。在Agilent RapidFire 365高通量质谱仪上使用制造商的方案进行分析。
相对于SEQ ID NO:4的活性计算为与SEQ ID NO:4相比,通过先前描述的RapidFire分析确定的由变体形成的产物的曲线下面积。
实施例5
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:8作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例4中描述地进行HTP筛选反应。如实施例4中描述地计算相对于SEQ ID NO:8的活性。
实施例6
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:106作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例4中描述地进行HTP筛选反应,除了裂解物在添加至反应板之前稀释2倍并将反应温度升高至40℃。如实施例4中描述地计算相对于SEQ ID NO:106的活性。
实施例7
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:252作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例6中描述地进行HTP筛选反应,除了裂解物在添加至反应板之前稀释8倍。如实施例4中描述地计算相对于SEQ ID NO:252的活性。
实施例8
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:446作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例7中描述地进行HTP筛选反应。如实施例4中描述地计算相对于SEQ ID NO:446的活性。
实施例9
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:482作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例7中描述地进行HTP筛选反应,除了裂解物在添加至反应之前稀释4倍,将化合物(1)的浓度增加到40mM,并用2M氨基甲酸铵代替1M碳酸铵。如实施例4中描述地计算相对于SEQ ID NO:482的活性。
实施例10
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:516作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例9中描述地进行HTP筛选反应,除了裂解物浓度改变为5%v:v并且在添加至反应之前没有稀释,并且氨基甲酸铵浓度增加到4M。如实施例4中描述地计算相对于SEQ ID NO:516的活性。
实施例11
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:618作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例10中描述地进行HTP筛选反应,除了裂解物浓度改变为10%v:v并且在添加至反应之前稀释4倍,并且氨基甲酸铵浓度增加到4.5M。如实施例4中描述地计算相对于SEQ ID NO:618的活性。
实施例12
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:714作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例11中描述地进行HTP筛选反应,除了裂解物在添加至反应之前没有稀释,化合物(1)的浓度增加到80mM,并且氨基甲酸铵浓度增加到5M。如实施例4中描述地计算相对于SEQ ID NO:714的活性。
实施例13
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:830作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例12中描述地进行HTP筛选反应,除了氨基甲酸铵浓度改变为4.5M。如实施例4中描述地计算相对于SEQ ID NO:830的活性。
实施例14
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:894作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例13中描述地进行HTP筛选反应,除了裂解物在添加至反应之前稀释8倍,并如实施例16中描述地通过HPLC对反应进行分析。相对于SEQ ID NO:894的活性计算为与SEQ ID NO:894的转化百分比相比,变体的转化百分比。
实施例15
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:988作为亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例14中描述地进行HTP筛选反应。如实施例14中描述地计算相对于SEQ ID NO:988的活性。
实施例16
用于监测方案2中的反应的HPLC分析方法
本实施例提供了用于收集实施例14、15、18和19中提供的数据的方法。本实施例中提供的方法可用于分析使用本发明产生的变体。然而,并不意图将本发明限于本文描述的方法,因为其他合适的方法是本领域技术人员已知的。
实施例17
PAL变体的对映选择性
本实施例提供了用于确定方案2中示出的反应的对映选择性的方法。仅评价了实施例4-15中描述的一些变体的对映选择性,并且在每种情况中在这些条件下没有观察到不期望的(R)-氨基酸。本实施例中提供的方法可用于分析使用本发明产生的变体。然而,并不意图将本发明限于本文描述的方法,因为其他合适的方法是本领域技术人员已知的。
实施例18
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:988作为用于另外的下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例14中描述地进行HTP筛选反应。如实施例14中描述地计算相对于SEQ ID NO:988的活性。
实施例19
用于产生化合物2的改进的PAL变体
选择SEQ ID NO:1140作为用于另一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变,和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽,并且如实施例2中描述地产生澄清的裂解物。如实施例14中描述地进行HTP筛选反应,除了裂解物在添加至反应板之前稀释16倍。如实施例14中描述地计算相对于SEQ ID NO:1140的活性。
出于所有目的,本申请中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入本文,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出出于所有目的通过引用并入一样。
虽然已经说明和描述了各种具体的实施方案,但是将理解,可以做出各种改变而不偏离本发明的精神和范围。
Claims (43)
1.一种工程化苯丙氨酸氨裂合酶,所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894和/或988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,其中所述工程化苯丙氨酸氨裂合酶在所述多肽序列中包含至少一个取代或取代集,并且其中所述多肽序列的氨基酸位置分别参照SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140编号。
2.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:80/99/104/175/220/359、80/104、80/104/105/172、80/104/105/172/175/222/359、80/104/105/172/220/222、80/104/105/220、80/104/105/220/222/416、80/104/105/222、80/104/172/175、80/104/172/175/220/310/359、80/104/172/222、80/104/359/416、84、90、99/104/105/172/175/220/222、100、101、104、104/105/175、104/172/310/359、104/175/213/222/359、104/175/220/222、104/220/222/359、104/359、107、108、110/419、175/315、219、219/540、220、347、360、363、405、416、418、423、450、451和452,其中所述多肽序列的氨基酸位置参照SEQ ID NO:4编号。
3.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:20/306/564、74/80/105/107/394/420、74/83/102/105/107/111/222/394/416、74/97/105/106/107、74/102/105/106/107/175/394、74/102/105/106/107/175/394/421、80/84/99/104/105/107/219、80/102/105/107/304、83/102/105/106/107/416/420/421、83/102/105/394/416/420、84、84/99、84/99/104/105/219、84/107、97/102/105/106/107/111/394/420/421、97/102/105/107/111/175/304/421/424、97/102/111/175/222/420/421、97/105/107/111/222/421/424、97/105/107/111/394/416/421、99/105/107、102、102/105/107/222/304/307/394/421/424、102/105/107/222/304/394/421/424、102/105/107/304/424、102/105/107/394/416/424、102/107/111/222/394、102/107/420/424、103、104、105、105/106/107/420/421、105/107、105/107/111、105/107/111/304、105/107/111/394/420/424、105/107/222/304/416、105/111/219、105/175/219、105/219、106、107、107/111/209/222/304、107/222/304、107/291、107/421、175、216、219、220、222/421/424、304/394/416/420、306、359、394、395、413、416、418和420,其中所述多肽序列的氨基酸位置参照SEQ ID NO:8编号。
4.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3、3/550、4、5、6、7、10、14、22、22/76、24、25、40、75、76、76/561、84/107/175/219、84/107/219、102/107/219/410、107、107/216/410、107/219、107/220、212、219/220、219/220/410、220/359、220/410、286、301、303、410、502、544、566和567,其中所述多肽序列的氨基酸位置参照SEQ ID NO:106编号。
5.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:252具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3/4/5/7/76/84/107/307、3/5/107/307/566、3/7/76/107/307/566、3/7/84/307、24/76/107/307、24/84/107/307、76、76/84/107、76/84/107/307、76/84/107/307/502、76/84/107/502、76/107、76/107/307、76/307、76/307/502、84/107/307、84/107/307/502、84/301/307/566、84/307、107/301/502、107/307、107/307/566、107/502、107/502/566、307、307/502和307/566,其中所述多肽序列的氨基酸位置参照SEQ ID NO:252编号。
6.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:446具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3/4/6/7/76、3/4/6/7/303、3/4/7、3/4/7/76、3/6/502、3/7/76、7/303、40/303、76、76/502、82、100、102、171、174、216、218、219、222、222/509、303、303/502、304和345,其中所述多肽序列的氨基酸位置参照SEQ ID NO:446编号。
7.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:482具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:3/4/7、3/7、4/7、4/7/216/218、7、7/40、7/76/82/174/222/303、7/76/174/222、7/76/219/303、7/82、7/216/218、40/82、47、66、76/82/216/218、76/216、76/216/219、82、112、171、174/222、209、216、219、219/345、222、268、271、331、366、428、437、443、460、474、503、524、538和543,其中所述多肽序列的氨基酸位置参照SEQ ID NO:482编号。
8.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:516具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:4、4/304、6、7、9、16、20、25、40、40/437、44/47、44/47/94/509、44/94/270/554、44/94/554、47、47/76、47/76/345、47/94/509、47/195/554、47/428、51/106、76、76/271、76/345、82、84、94/149、94/195、94/554、98、98/460、109、112/524、271/345、271/428、302、303、304、306、349、358、410、413、416和524,其中所述多肽序列的氨基酸位置参照SEQ ID NO:516编号。
9.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:618具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:4/47/76/82/94、7/44/94/98、7/47/76/82、7/76/554、7/94/98、16/40/76、16/44/76/98、16/44/94/98/524、25/54/68/72、25/54/68/72/158/339、25/54/68/72/209/212/339/517、25/54/68/158/339/517、25/54/72/339/517、25/54/158/209/212/339/551、30/68/72/207/209/212/339/495/517、40/44/76/304/509、40/44/98/304、40/76/304/437、40/76/554、44/76/94/112/304、44/76/112、44/94/271/304/437/554、47/76/82/94/271、47/76/82/271/304、47/76/94/271、47/76/94/271/306/375/524/554、47/76/304/306/554、47/76/304/524/554、47/94、47/94/271、47/94/271/304/554、49/114/240/521、54/68/158/209/212/495/517、68/72/158/209/212/339/495/551、68/72/158/517、68/158/209/495/517/551、76、76/271/304/554、76/304/437、82、82/554、94/98、94/98/306、94/98/509、94/98/524、94/554、98/270/304/554、119、294、357、400、516、527和565,其中所述多肽序列的氨基酸位置参照SEQ ID NO:618编号。
10.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:714具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:25、25/40/158/209/304/410/517、25/54/271/517、25/158/209/410、25/306/339、25/410、40/47/68/94/98/410/517、40/68/460/517、47/98/339/410、54/68/72/98/209/517、68、68/339/517、72/94/158/339/410/460/517、72/158/209/410/517、83、94/158/209/339/410、100、129、158、158/207/339/410、158/209/410/517、207/410、207/410/460/517、220、317、339、394、410、410/517、416、460、460/517和517,其中所述多肽序列的氨基酸位置参照SEQ ID NO:714编号。
11.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:830具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:25/83/158/220/517、25/83/220/416、25/158/209/220/517、25/158/220、25/158/220/517、25/220/339、25/220/517、25/410/416/517、40、45、54/59、54/285、83、83/209/220/410/517、83/339/410、119、158/220/271/517、209、220、220/410/416/517、220/517、244、246、271、271/410/416/517、293、304、339、368、400、410、410/416/517、424、459、479、520、525、537、562和565,其中所述多肽序列的氨基酸位置参照SEQ ID NO:830编号。
12.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:894具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:25/40/45/209/424、25/40/424、25/45/54/73/246/424、25/54/73/209/424/520、40/47/54/214/503、40/54/209/214/244/339/520、40/54/214/244/339/503、40/209/246/424、54、54/209/214/244、54/209/214/244/339/503、54/424、54/424/520、209/503、227、246、246/424、274/311、410、411、413和424,其中所述多肽序列的氨基酸位置参照SEQ IDNO:894编号。
13.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:40、40/54/214/421/424、40/90/421/424、40/214、40/214/424、40/421/424、40/424、54/214、66、90/214/424、106/227、106/227/244、106/227/244/554、106/227/554、214、214/421、339、421/424、424、454、463、464、474和54340、40/54/214/421/424、40/90/421/424、40/214、40/214/424、40/421/424、40/424、54/214、66、90/214/424、106/227、106/227/244、106/227/244/554、106/227/554、214、214/421、339、421/424、424、454、463、464、474和543,其中所述多肽序列的氨基酸位置参照SEQ ID NO:988编号。
14.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:988具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:36、40/66/227、40/66/227/244/410/424、40/66/410/474、40/410/411/424、47、66、66/214/374/410/474、66/214/424、66/214/437/474、66/227、66/227/244/424/543、66/227/424、66/339、66/339/410/543、66/339/474、66/370、66/410/424/454/527、66/424、66/463/464、66/543、102、104、105、154、214/244/543、214/374/424、227、227/244/411/424、227/339/413/437、244/411、339、394、410、410/411/424、413、421、424、517、524和554,其中所述多肽序列的氨基酸位置参照SEQ ID NO:988编号。
15.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:1140具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多肽序列或其功能片段,并且其中所述工程化苯丙氨酸氨裂合酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:36/47/424/517/554、47/214/413/524/563、47/410/524、47/524、47/554、214、214/424、410、410/517/554、410/554、424/517/554、517/524/554和554,其中所述多肽序列的氨基酸位置参照SEQ ID NO:1140编号。
16.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:2、4、8、106、252、446、482、516、618、714、830、894、988和/或1140至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列或其功能片段。
17.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包括SEQ ID NO:4、8、106、252、446、482、516、618、714、830、894、988、1140或其功能片段。
18.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与表5.1、表6.1、表7.1、表8.1、表9.1、表10.1、表11.1、表12.1、表13.1、表14.1、表15.1、表18.1和/或表19.1中列出的至少一种工程化苯丙氨酸氨裂合酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。
19.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4-1222中偶数编号的序列中列出的至少一种工程化苯丙氨酸氨裂合酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。
20.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与SEQ ID NO:4-1222中偶数编号的序列中列出的至少一种工程化苯丙氨酸氨裂合酶变体的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。
21.根据权利要求1所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包括SEQ ID NO:4-1222中偶数编号的序列中列出的多肽序列。
22.根据权利要求1-21中任一项所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶包含与野生型多变鱼腥藻(Anabaena variabilis)苯丙氨酸氨裂合酶相比表现出至少一种改进的性质的多肽序列。
23.根据权利要求22所述的工程化苯丙氨酸氨裂合酶,其中所述改进的性质包括改进的化合物2产生。
27.根据权利要求22所述的工程化苯丙氨酸氨裂合酶,其中所述改进的性质包括改进的对映选择性。
28.根据权利要求22所述的工程化苯丙氨酸氨裂合酶,其中所述改进的性质包括改进的稳定性。
29.根据权利要求1-28中任一项所述的工程化苯丙氨酸氨裂合酶,其中所述工程化苯丙氨酸氨裂合酶是纯化的。
30.一种组合物,所述组合物包含至少一种在权利要求1-29中任一项中提供的工程化苯丙氨酸氨裂合酶。
31.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码至少一种根据权利要求1-30中任一项所述的工程化苯丙氨酸氨裂合酶。
32.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码至少一种工程化苯丙氨酸氨裂合酶,其中所述多核苷酸序列包含与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述工程化苯丙氨酸氨裂合酶的多核苷酸序列在一个或更多个位置处包含至少一个取代。
33.根据权利要求31或32所述的工程化多核苷酸序列,其中所述多核苷酸序列包含与SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
34.根据权利要求29-31中任一项所述的工程化多核苷酸序列,其中所述多核苷酸序列包括SEQ ID NO:1、3、7、105、251、445、481、515、617、713、829、893、987和/或1139。
35.根据权利要求29-32中任一项所述的工程化多核苷酸序列,其中所述多核苷酸序列包括SEQ ID NO:3-1221中列出的奇数编号的序列中列出的序列。
36.根据权利要求31-35中任一项所述的工程化多核苷酸序列,其中所述多核苷酸序列可操作地连接到控制序列。
37.根据权利要求21-36中任一项所述的工程化多核苷酸序列,其中所述工程化多核苷酸序列是密码子优化的。
38.一种表达载体,所述表达载体包含至少一种根据权利要求31-37中任一项所述的多核苷酸序列。
39.一种宿主细胞,所述宿主细胞包含至少一种根据权利要求38所述的表达载体。
40.一种宿主细胞,所述宿主细胞包含至少一种根据权利要求31-37中任一项所述的多核苷酸序列。
41.一种在宿主细胞中产生工程化苯丙氨酸氨裂合酶的方法,所述方法包括在合适的条件下在培养基中培养根据权利要求39和/或40所述的宿主细胞,从而产生至少一种工程化苯丙氨酸氨裂合酶。
42.根据权利要求41所述的方法,所述方法还包括从所述培养基和/或所述宿主细胞回收至少一种工程化苯丙氨酸氨裂合酶的步骤。
43.根据权利要求41和/或42所述的方法,所述方法还包括纯化所述至少一种工程化苯丙氨酸氨裂合酶的步骤。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862696978P | 2018-07-12 | 2018-07-12 | |
US62/696,978 | 2018-07-12 | ||
US201962814362P | 2019-03-06 | 2019-03-06 | |
US62/814,362 | 2019-03-06 | ||
PCT/US2019/037205 WO2020013951A1 (en) | 2018-07-12 | 2019-06-14 | Engineered phenylalanine ammonia lyase polypeptides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112672989A true CN112672989A (zh) | 2021-04-16 |
Family
ID=69140030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980059859.0A Pending CN112672989A (zh) | 2018-07-12 | 2019-06-14 | 工程化苯丙氨酸氨裂合酶多肽 |
Country Status (8)
Country | Link |
---|---|
US (2) | US11198861B2 (zh) |
EP (1) | EP3820833A4 (zh) |
JP (1) | JP2021531749A (zh) |
CN (1) | CN112672989A (zh) |
CA (1) | CA3105916A1 (zh) |
IL (1) | IL279916A (zh) |
SG (1) | SG11202012198QA (zh) |
WO (1) | WO2020013951A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024016658A1 (zh) * | 2022-07-18 | 2024-01-25 | 浙江泽科塔生物医药有限公司 | Pal变体、包含该pal变体的药物组合物以及用于制备该pal变体的方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL295353A (en) | 2020-03-20 | 2022-10-01 | Synlogic Operating Co Inc | Genetically engineered microorganisms to reduce hyperphenylalaninemia |
WO2022145178A1 (ja) * | 2020-12-28 | 2022-07-07 | 国立研究開発法人理化学研究所 | フェニルアラニンアンモニアリアーゼを用いた鎖状の不飽和カルボン酸化合物の製造方法 |
WO2023039466A1 (en) * | 2021-09-08 | 2023-03-16 | Ginkgo Bioworks, Inc. | Engineered phenylalanine ammonia lyase enzymes |
US20230383535A1 (en) * | 2022-05-26 | 2023-11-30 | Green Canopy NODE Technologies, INC | Modular wall component and a method for manufacturing a modular wall component |
WO2024032012A1 (zh) * | 2022-08-10 | 2024-02-15 | 百葵锐(深圳)生物科技有限公司 | 苯丙氨酸解氨酶突变体及其应用 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020102712A1 (en) * | 2000-07-24 | 2002-08-01 | Pcbu Services, Inc. | Phenylalanine ammonia lyase polypeptide and polynucleotide sequences and methods of obtaining and using same |
US20080008695A1 (en) * | 2006-06-12 | 2008-01-10 | Vellard Michel C | Compositions of prokaryotic phenylalanine ammonia-lyase and methods of using compositions thereof |
WO2008118176A2 (en) * | 2006-06-02 | 2008-10-02 | Verenium Corporation | Lase enzymes, nucleic acids encoding them and methods for making and using them |
CN101965397A (zh) * | 2008-01-03 | 2011-02-02 | 维莱尼姆公司 | 转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法 |
CN102690833A (zh) * | 2006-03-07 | 2012-09-26 | 维莱尼姆公司 | 醛缩酶、编码它们的核酸及制备和使用它们的方法 |
US20140314843A1 (en) * | 2013-04-18 | 2014-10-23 | Codexis, Inc. | Engineered phenylalanine ammonia lyase polypeptides |
CN106459935A (zh) * | 2014-03-27 | 2017-02-22 | 诺维信公司 | 具有磷脂酶c活性的多肽和编码它们的多核苷酸 |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5246943A (en) | 1992-05-19 | 1993-09-21 | Warner-Lambert Company | Substituted 1,2,3,4-tetahydroisoquinolines with angiotensin II receptor antagonist properties |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US20060257890A1 (en) | 1996-05-20 | 2006-11-16 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6406855B1 (en) | 1994-02-17 | 2002-06-18 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6165793A (en) | 1996-03-25 | 2000-12-26 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5928905A (en) | 1995-04-18 | 1999-07-27 | Glaxo Group Limited | End-complementary polymerase reaction |
US6995017B1 (en) | 1994-02-17 | 2006-02-07 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6309883B1 (en) | 1994-02-17 | 2001-10-30 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
BR9507817A (pt) | 1994-06-03 | 1997-09-16 | Novo Nordisk Biotech Inc | Construção de dna enzima vetor recombinante célula hospedeira recombinante lacase de ascomicete ou deuteromicete processos para obter uma enzima de lacase para melhorar o rendimento de enzima recombinante para polimerizar um substrato de lignina ou lignossulfato em soluç o para despolimerizar in situ a pasta kraft para oxidar corantes ou precursores de corantes para pintar cabelo e para polimerizar ou oxidar um composto fenólico ou anilina composição de corante e recipiente contendo a mesma |
WO1996000787A1 (en) | 1994-06-30 | 1996-01-11 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
FI104465B (fi) | 1995-06-14 | 2000-02-15 | Valio Oy | Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
US6506602B1 (en) | 1996-03-25 | 2003-01-14 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US7148054B2 (en) | 1997-01-17 | 2006-12-12 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
ATE334225T1 (de) | 1997-01-17 | 2006-08-15 | Maxygen Inc | Evolution prokaryotischer ganzer zellen durch rekursive sequenzrekombination |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
WO1998031816A1 (en) | 1997-01-17 | 1998-07-23 | Regents Of The University Of Minnesota | Dna molecules and protein displaying improved triazine compound degrading ability |
EP2270234B1 (en) | 1997-12-08 | 2013-03-06 | California Institute of Technology | Method for creating polynucleotide and polypeptide sequences |
JP2002510506A (ja) | 1998-04-02 | 2002-04-09 | テラス ジェネティック リソーシズ,インコーポレイティド | 遺伝子配列に遺伝障害を有する植物を得る方法 |
BR9910174A (pt) | 1998-05-01 | 2001-03-06 | Maxygen Inc | Processo para se obter um gene recombinante otimizado de resistência à praga, biblioteca, e, processo para se obter um organismo que seja patogênico a uma praga de vegetal |
EP1090024A2 (en) | 1998-06-17 | 2001-04-11 | Maxygen, Inc. | Method for producing polynucleotides with desired properties |
US6365408B1 (en) | 1998-06-19 | 2002-04-02 | Maxygen, Inc. | Methods of evolving a polynucleotides by mutagenesis and recombination |
US6605430B1 (en) | 1998-08-12 | 2003-08-12 | Maxygen, Inc. | DNA shuffling of monooxygenase genes for production of industrial chemicals |
EP1119616A2 (en) | 1998-10-07 | 2001-08-01 | Maxygen, Inc. | Dna shuffling to produce nucleic acids for mycotoxin detoxification |
WO2000028018A1 (en) | 1998-11-10 | 2000-05-18 | Maxygen, Inc. | Modified adp-glucose pyrophosphorylase for improvement and optimization of plant phenotypes |
JP4221100B2 (ja) | 1999-01-13 | 2009-02-12 | エルピーダメモリ株式会社 | 半導体装置 |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6917882B2 (en) | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US6961664B2 (en) | 1999-01-19 | 2005-11-01 | Maxygen | Methods of populating data structures for use in evolutionary simulations |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US7702464B1 (en) | 2001-08-21 | 2010-04-20 | Maxygen, Inc. | Method and apparatus for codon determining |
US8457903B1 (en) | 1999-01-19 | 2013-06-04 | Codexis Mayflower Holdings, Llc | Method and/or apparatus for determining codons |
US7873477B1 (en) | 2001-08-21 | 2011-01-18 | Codexis Mayflower Holdings, Llc | Method and system using systematically varied data libraries |
EP1108783A3 (en) | 1999-01-19 | 2001-09-05 | Maxygen, Inc. | Oligonucleotide-mediated nucleic acid recombination |
US20070065838A1 (en) | 1999-01-19 | 2007-03-22 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
KR20010102069A (ko) | 1999-02-11 | 2001-11-15 | 추후제출 | 고효율 질량 분석 |
WO2000052155A2 (en) | 1999-03-05 | 2000-09-08 | Maxygen, Inc. | Recombination of insertion modified nucleic acids |
US6703240B1 (en) | 1999-04-13 | 2004-03-09 | Maxygar, Inc. | Modified starch metabolism enzymes and encoding genes for improvement and optimization of plant phenotypes |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US6519065B1 (en) | 1999-11-05 | 2003-02-11 | Jds Fitel Inc. | Chromatic dispersion compensation device |
US6686515B1 (en) | 1999-11-23 | 2004-02-03 | Maxygen, Inc. | Homologous recombination in plants |
AU2788101A (en) | 2000-01-11 | 2001-07-24 | Maxygen, Inc. | Integrated systems and methods for diversity generation and screening |
WO2001075767A2 (en) | 2000-03-30 | 2001-10-11 | Maxygen, Inc. | In silico cross-over site selection |
DE60144145D1 (de) | 2000-04-03 | 2011-04-14 | Maxygen Inc | Subtilisin-variante |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
ES2564570T3 (es) | 2002-03-01 | 2016-03-23 | Codexis Mayflower Holdings, Llc | Métodos, sistemas y software para la identificación de biomoléculas funcionales |
WO2003078583A2 (en) | 2002-03-09 | 2003-09-25 | Maxygen, Inc. | Optimization of crossover points for directed evolution |
CA2580679A1 (en) | 2004-09-17 | 2006-03-30 | Biomarin Pharmaceutical Inc. | Variants and chemically-modified variants of phenylalanine ammonia-lyase |
JP2008525515A (ja) * | 2004-12-28 | 2008-07-17 | ディーエスエム アイピー アセッツ ビー.ブイ. | 光学活性なインドリン−2−カルボン酸の調製方法 |
EP2250595B1 (en) | 2008-02-12 | 2017-06-14 | Codexis, Inc. | Method of selecting an optimized diverse population of variants |
US8768871B2 (en) | 2008-02-12 | 2014-07-01 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
US20090312196A1 (en) | 2008-06-13 | 2009-12-17 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
DK2285958T3 (en) | 2008-06-13 | 2016-03-29 | Codexis Inc | Method for synthesizing polynucleotides |
US8383346B2 (en) | 2008-06-13 | 2013-02-26 | Codexis, Inc. | Combined automated parallel synthesis of polynucleotide variants |
WO2012010843A1 (en) * | 2010-07-21 | 2012-01-26 | Spinifex Pharmaceuticals Pty Ltd | Salt and solvates of a tetrahydroisoquinoline derivative |
HUE042817T2 (hu) | 2011-06-28 | 2019-07-29 | Codexis Inc | Fehérjevariánsok elõállítása régiókeveréssel |
US20150133698A1 (en) | 2012-04-20 | 2015-05-14 | Codexis, Inc. | Production of fatty alcohols from engineered microorganisms |
-
2019
- 2019-06-14 WO PCT/US2019/037205 patent/WO2020013951A1/en unknown
- 2019-06-14 CN CN201980059859.0A patent/CN112672989A/zh active Pending
- 2019-06-14 US US16/441,458 patent/US11198861B2/en active Active
- 2019-06-14 EP EP19834611.6A patent/EP3820833A4/en not_active Withdrawn
- 2019-06-14 SG SG11202012198QA patent/SG11202012198QA/en unknown
- 2019-06-14 CA CA3105916A patent/CA3105916A1/en active Pending
- 2019-06-14 JP JP2021500609A patent/JP2021531749A/ja active Pending
-
2021
- 2021-01-03 IL IL279916A patent/IL279916A/en unknown
- 2021-11-09 US US17/522,370 patent/US20220056431A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020102712A1 (en) * | 2000-07-24 | 2002-08-01 | Pcbu Services, Inc. | Phenylalanine ammonia lyase polypeptide and polynucleotide sequences and methods of obtaining and using same |
CN102690833A (zh) * | 2006-03-07 | 2012-09-26 | 维莱尼姆公司 | 醛缩酶、编码它们的核酸及制备和使用它们的方法 |
WO2008118176A2 (en) * | 2006-06-02 | 2008-10-02 | Verenium Corporation | Lase enzymes, nucleic acids encoding them and methods for making and using them |
US20080008695A1 (en) * | 2006-06-12 | 2008-01-10 | Vellard Michel C | Compositions of prokaryotic phenylalanine ammonia-lyase and methods of using compositions thereof |
CN101965397A (zh) * | 2008-01-03 | 2011-02-02 | 维莱尼姆公司 | 转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法 |
US20140314843A1 (en) * | 2013-04-18 | 2014-10-23 | Codexis, Inc. | Engineered phenylalanine ammonia lyase polypeptides |
CN106459935A (zh) * | 2014-03-27 | 2017-02-22 | 诺维信公司 | 具有磷脂酶c活性的多肽和编码它们的多核苷酸 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024016658A1 (zh) * | 2022-07-18 | 2024-01-25 | 浙江泽科塔生物医药有限公司 | Pal变体、包含该pal变体的药物组合物以及用于制备该pal变体的方法 |
Also Published As
Publication number | Publication date |
---|---|
CA3105916A1 (en) | 2020-01-16 |
EP3820833A1 (en) | 2021-05-19 |
WO2020013951A1 (en) | 2020-01-16 |
US20200017845A1 (en) | 2020-01-16 |
IL279916A (en) | 2021-03-01 |
SG11202012198QA (en) | 2021-01-28 |
JP2021531749A (ja) | 2021-11-25 |
US20220056431A1 (en) | 2022-02-24 |
US11198861B2 (en) | 2021-12-14 |
EP3820833A4 (en) | 2022-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12110493B2 (en) | Engineered purine nucleoside phosphorylase variant enzymes | |
US11198861B2 (en) | Engineered phenylalanine ammonia lyase polypeptides | |
AU2019302422B2 (en) | Engineered phosphopentomutase variant enzymes | |
US12110513B2 (en) | Engineered pantothenate kinase variant enzymes | |
CN114072165A (zh) | 工程化蔗糖磷酸化酶变体酶 | |
US12012620B2 (en) | Peroxidase activity towards 10-acetyl-3,7-dihydroxyphenoxazine | |
CN114127102A (zh) | 工程化乙酸激酶变体酶 | |
US20230374470A1 (en) | Engineered galactose oxidase variant enzymes | |
US20230374486A1 (en) | Engineered phosphopentomutase variant enzymes | |
US20240132858A1 (en) | Engineered uridine phosphorylase variant enzymes | |
US20240002817A1 (en) | Engineered pantothenate kinase variant enzymes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210416 |