EA043748B1 - PENICILLIN G ACYLASES - Google Patents
PENICILLIN G ACYLASES Download PDFInfo
- Publication number
- EA043748B1 EA043748B1 EA201991637 EA043748B1 EA 043748 B1 EA043748 B1 EA 043748B1 EA 201991637 EA201991637 EA 201991637 EA 043748 B1 EA043748 B1 EA 043748B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- sequence
- pga
- seq
- acylase
- polypeptide
- Prior art date
Links
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 title description 23
- 108010073038 Penicillin Amidase Proteins 0.000 claims description 224
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 212
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 205
- 229920001184 polypeptide Polymers 0.000 claims description 202
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical group N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 184
- 238000006243 chemical reaction Methods 0.000 claims description 162
- 230000000694 effects Effects 0.000 claims description 87
- 108090001061 Insulin Proteins 0.000 claims description 76
- 102000004877 Insulin Human genes 0.000 claims description 76
- 229940125396 insulin Drugs 0.000 claims description 76
- 150000007523 nucleic acids Chemical class 0.000 claims description 53
- 102000039446 nucleic acids Human genes 0.000 claims description 28
- 108020004707 nucleic acids Proteins 0.000 claims description 28
- 230000006872 improvement Effects 0.000 claims description 23
- 230000002255 enzymatic effect Effects 0.000 claims description 21
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 16
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 210000004027 cell Anatomy 0.000 description 173
- 235000001014 amino acid Nutrition 0.000 description 135
- 229940024606 amino acid Drugs 0.000 description 127
- 102200118198 rs33967755 Human genes 0.000 description 124
- 150000001413 amino acids Chemical class 0.000 description 118
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 109
- 108090000623 proteins and genes Proteins 0.000 description 108
- 239000000047 product Substances 0.000 description 94
- 102220005162 rs33945705 Human genes 0.000 description 88
- 102000004190 Enzymes Human genes 0.000 description 87
- 108090000790 Enzymes Proteins 0.000 description 87
- 238000000034 method Methods 0.000 description 84
- 229940088598 enzyme Drugs 0.000 description 82
- 102000040430 polynucleotide Human genes 0.000 description 79
- 108091033319 polynucleotide Proteins 0.000 description 79
- 239000002157 polynucleotide Substances 0.000 description 79
- 230000010933 acylation Effects 0.000 description 62
- 238000005917 acylation reaction Methods 0.000 description 62
- 230000014509 gene expression Effects 0.000 description 49
- 238000004128 high performance liquid chromatography Methods 0.000 description 48
- 108020004705 Codon Proteins 0.000 description 46
- 239000000758 substrate Substances 0.000 description 39
- 239000013598 vector Substances 0.000 description 39
- CRZQGDNQQAALAY-UHFFFAOYSA-N Methyl benzeneacetate Chemical compound COC(=O)CC1=CC=CC=C1 CRZQGDNQQAALAY-UHFFFAOYSA-N 0.000 description 38
- 102000004169 proteins and genes Human genes 0.000 description 37
- 108010076504 Protein Sorting Signals Proteins 0.000 description 35
- 125000003275 alpha amino acid group Chemical group 0.000 description 35
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 33
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 33
- 102220472113 Transmembrane protein_S67A_mutation Human genes 0.000 description 32
- 108091026890 Coding region Proteins 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 31
- WLJVXDMOQOGPHL-UHFFFAOYSA-N phenylacetic acid Chemical compound OC(=O)CC1=CC=CC=C1 WLJVXDMOQOGPHL-UHFFFAOYSA-N 0.000 description 31
- 239000006166 lysate Substances 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 30
- 108091028043 Nucleic acid sequence Proteins 0.000 description 24
- 230000001580 bacterial effect Effects 0.000 description 24
- 239000013604 expression vector Substances 0.000 description 24
- 239000006227 byproduct Substances 0.000 description 23
- 239000012535 impurity Substances 0.000 description 22
- 238000006467 substitution reaction Methods 0.000 description 21
- 238000002703 mutagenesis Methods 0.000 description 20
- 231100000350 mutagenesis Toxicity 0.000 description 20
- 230000002538 fungal effect Effects 0.000 description 19
- 230000035772 mutation Effects 0.000 description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- 230000010076 replication Effects 0.000 description 17
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 16
- 239000007983 Tris buffer Substances 0.000 description 16
- -1 aromatic amino acid Chemical class 0.000 description 16
- 230000009286 beneficial effect Effects 0.000 description 16
- 230000006798 recombination Effects 0.000 description 16
- 238000005215 recombination Methods 0.000 description 16
- 239000006228 supernatant Substances 0.000 description 16
- 108700023418 Amidases Proteins 0.000 description 14
- 108700010070 Codon Usage Proteins 0.000 description 14
- 102220512501 Homeobox protein Nkx-2.5_G74D_mutation Human genes 0.000 description 14
- 102000005922 amidase Human genes 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- 125000000539 amino acid group Chemical group 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 12
- 241000588773 Kluyvera cryocrescens Species 0.000 description 12
- 108700026244 Open Reading Frames Proteins 0.000 description 12
- 125000002252 acyl group Chemical group 0.000 description 12
- 238000007792 addition Methods 0.000 description 12
- 229960005091 chloramphenicol Drugs 0.000 description 12
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 229960003424 phenylacetic acid Drugs 0.000 description 12
- 239000003279 phenylacetic acid Substances 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 125000006850 spacer group Chemical group 0.000 description 12
- NGHVIOIJCVXTGV-ALEPSDHESA-N 6-aminopenicillanic acid Chemical compound [O-]C(=O)[C@H]1C(C)(C)S[C@@H]2[C@H]([NH3+])C(=O)N21 NGHVIOIJCVXTGV-ALEPSDHESA-N 0.000 description 11
- NGHVIOIJCVXTGV-UHFFFAOYSA-N 6beta-amino-penicillanic acid Natural products OC(=O)C1C(C)(C)SC2C(N)C(=O)N21 NGHVIOIJCVXTGV-UHFFFAOYSA-N 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 230000002209 hydrophobic effect Effects 0.000 description 11
- 239000002245 particle Substances 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 10
- 238000011068 loading method Methods 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 229940056360 penicillin g Drugs 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 240000006439 Aspergillus oryzae Species 0.000 description 9
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 9
- 241000193830 Bacillus <bacterium> Species 0.000 description 9
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 9
- 239000001963 growth medium Substances 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 108010065511 Amylases Proteins 0.000 description 8
- 235000014469 Bacillus subtilis Nutrition 0.000 description 8
- 241000235379 Piromyces Species 0.000 description 8
- 230000002378 acidificating effect Effects 0.000 description 8
- 238000010828 elution Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 239000012139 lysis buffer Substances 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000001404 mediated effect Effects 0.000 description 8
- 239000000843 powder Substances 0.000 description 8
- 239000004382 Amylase Substances 0.000 description 7
- 102000013142 Amylases Human genes 0.000 description 7
- 241000233866 Fungi Species 0.000 description 7
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 7
- 235000019418 amylase Nutrition 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- 241000228245 Aspergillus niger Species 0.000 description 6
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 239000012071 phase Substances 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- 241000351920 Aspergillus nidulans Species 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 125000003118 aryl group Chemical group 0.000 description 5
- 239000011942 biocatalyst Substances 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000001747 exhibiting effect Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 102220333977 rs756127206 Human genes 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 5
- KZZWQCKYLNIOBT-UHFFFAOYSA-N 5-amino-2-nitrobenzoic acid Chemical compound NC1=CC=C([N+]([O-])=O)C(C(O)=O)=C1 KZZWQCKYLNIOBT-UHFFFAOYSA-N 0.000 description 4
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 4
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 4
- 241000194108 Bacillus licheniformis Species 0.000 description 4
- 241000194107 Bacillus megaterium Species 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000186216 Corynebacterium Species 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 108091060211 Expressed sequence tag Proteins 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- 102000005720 Glutathione transferase Human genes 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- 239000006137 Luria-Bertani broth Substances 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 101150016593 PGA gene Proteins 0.000 description 4
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 4
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 4
- 241000235403 Rhizomucor miehei Species 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 4
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 4
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 4
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- IPBVNPXQWQGGJP-UHFFFAOYSA-N acetic acid phenyl ester Natural products CC(=O)OC1=CC=CC=C1 IPBVNPXQWQGGJP-UHFFFAOYSA-N 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- 125000001931 aliphatic group Chemical group 0.000 description 4
- 108090000637 alpha-Amylases Proteins 0.000 description 4
- 102000004139 alpha-Amylases Human genes 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 150000001408 amides Chemical class 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 238000009792 diffusion process Methods 0.000 description 4
- 150000002148 esters Chemical class 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 239000000833 heterodimer Substances 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 229940049953 phenylacetate Drugs 0.000 description 4
- 150000003141 primary amines Chemical class 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 102220005541 rs34068598 Human genes 0.000 description 4
- 102220187197 rs3809694 Human genes 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 229910052720 vanadium Inorganic materials 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- DCYGAPKNVCQNOE-UHFFFAOYSA-N 2,2,2-triphenylacetic acid Chemical group C=1C=CC=CC=1C(C=1C=CC=CC=1)(C(=O)O)C1=CC=CC=C1 DCYGAPKNVCQNOE-UHFFFAOYSA-N 0.000 description 3
- QHVQEQRGDKOHHC-UHFFFAOYSA-N 2-nitro-5-[(2-phenylacetyl)amino]benzoic acid Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(NC(=O)CC=2C=CC=CC=2)=C1 QHVQEQRGDKOHHC-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- 108010037870 Anthranilate Synthase Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 108090000145 Bacillolysin Proteins 0.000 description 3
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 3
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 3
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 3
- 108010059892 Cellulase Proteins 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- 241000588698 Erwinia Species 0.000 description 3
- 241000588722 Escherichia Species 0.000 description 3
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 3
- 241000223221 Fusarium oxysporum Species 0.000 description 3
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- SBKRTALNRRAOJP-BWSIXKJUSA-N N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methylheptanamide (6S)-N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methyloctanamide sulfuric acid Chemical compound OS(O)(=O)=O.CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O.CC[C@H](C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O SBKRTALNRRAOJP-BWSIXKJUSA-N 0.000 description 3
- MKWKNSIESPFAQN-UHFFFAOYSA-N N-cyclohexyl-2-aminoethanesulfonic acid Chemical compound OS(=O)(=O)CCNC1CCCCC1 MKWKNSIESPFAQN-UHFFFAOYSA-N 0.000 description 3
- 241000520272 Pantoea Species 0.000 description 3
- 108010093965 Polymyxin B Proteins 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 101710152431 Trypsin-like protease Proteins 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 241000588901 Zymomonas Species 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 229960003121 arginine Drugs 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 150000008300 phosphoramidites Chemical class 0.000 description 3
- 229960003548 polymyxin b sulfate Drugs 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 102200082947 rs33954632 Human genes 0.000 description 3
- 102220410746 rs886044165 Human genes 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000003643 water by type Substances 0.000 description 3
- 239000002132 β-lactam antibiotic Substances 0.000 description 3
- 229940124586 β-lactam antibiotics Drugs 0.000 description 3
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 241000186063 Arthrobacter Species 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 241001328122 Bacillus clausii Species 0.000 description 2
- 241000194103 Bacillus pumilus Species 0.000 description 2
- 101000755953 Bacillus subtilis (strain 168) Ribosome maturation factor RimP Proteins 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- 241001453698 Buchnera <proteobacteria> Species 0.000 description 2
- 239000008000 CHES buffer Substances 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 108010062466 Enzyme Precursors Proteins 0.000 description 2
- 102000010911 Enzyme Precursors Human genes 0.000 description 2
- 241000589565 Flavobacterium Species 0.000 description 2
- 101150094690 GAL1 gene Proteins 0.000 description 2
- 101150108358 GLAA gene Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 241000626621 Geobacillus Species 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- 102100027612 Kallikrein-11 Human genes 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000194036 Lactococcus Species 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000589323 Methylobacterium Species 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 241001467552 Mycobacterium bovis BCG Species 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 241000588912 Pantoea agglomerans Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000187561 Rhodococcus erythropolis Species 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 108090000787 Subtilisin Proteins 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- 241000223258 Thermomyces lanuginosus Species 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- LSQZJLSUYDQPKJ-NJBDSQKTSA-N amoxicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=C(O)C=C1 LSQZJLSUYDQPKJ-NJBDSQKTSA-N 0.000 description 2
- 229960003022 amoxicillin Drugs 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 229960000190 bacillus calmette–guérin vaccine Drugs 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- 230000002210 biocatalytic effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- ZAIPMKNFIOOWCQ-UEKVPHQBSA-N cephalexin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@@H]3N(C2=O)C(=C(CS3)C)C(O)=O)=CC=CC=C1 ZAIPMKNFIOOWCQ-UEKVPHQBSA-N 0.000 description 2
- 229940106164 cephalexin Drugs 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000005289 controlled pore glass Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- PYHXGXCGESYPCW-UHFFFAOYSA-N diphenylacetic acid Chemical group C=1C=CC=CC=1C(C(=O)O)C1=CC=CC=C1 PYHXGXCGESYPCW-UHFFFAOYSA-N 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 125000001072 heteroaryl group Chemical group 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229940124280 l-arginine Drugs 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 230000002934 lysing effect Effects 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 101150105920 npr gene Proteins 0.000 description 2
- 101150017837 nprM gene Proteins 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- LSQZJLSUYDQPKJ-UHFFFAOYSA-N p-Hydroxyampicillin Natural products O=C1N2C(C(O)=O)C(C)(C)SC2C1NC(=O)C(N)C1=CC=C(O)C=C1 LSQZJLSUYDQPKJ-UHFFFAOYSA-N 0.000 description 2
- 235000019371 penicillin G benzathine Nutrition 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 125000006239 protecting group Chemical group 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 101150108007 prs gene Proteins 0.000 description 2
- 101150086435 prs1 gene Proteins 0.000 description 2
- 101150070305 prsA gene Proteins 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 102200009842 rs121434497 Human genes 0.000 description 2
- 102220095224 rs527503775 Human genes 0.000 description 2
- 102220277134 rs776745497 Human genes 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 230000000707 stereoselective effect Effects 0.000 description 2
- 230000008961 swelling Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- NPDBDJFLKKQMCM-UHFFFAOYSA-N tert-butylglycine Chemical compound CC(C)(C)C(N)C(O)=O NPDBDJFLKKQMCM-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 229910052721 tungsten Inorganic materials 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 229910052727 yttrium Inorganic materials 0.000 description 2
- ASWBNKHCZGQVJV-UHFFFAOYSA-N (3-hexadecanoyloxy-2-hydroxypropyl) 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(O)COP([O-])(=O)OCC[N+](C)(C)C ASWBNKHCZGQVJV-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- NKBWMBRPILTCRD-UHFFFAOYSA-N 2-Methylheptanoic acid Chemical compound CCCCCC(C)C(O)=O NKBWMBRPILTCRD-UHFFFAOYSA-N 0.000 description 1
- FKNWOCICTKKNIH-UHFFFAOYSA-N 2-[[2-(2-nitrophenyl)acetyl]amino]benzoic acid Chemical compound OC(=O)C1=CC=CC=C1NC(=O)CC1=CC=CC=C1[N+]([O-])=O FKNWOCICTKKNIH-UHFFFAOYSA-N 0.000 description 1
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 1
- WLJVXDMOQOGPHL-PPJXEINESA-N 2-phenylacetic acid Chemical compound O[14C](=O)CC1=CC=CC=C1 WLJVXDMOQOGPHL-PPJXEINESA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- NVIAYEIXYQCDAN-CLZZGJSISA-N 7beta-aminodeacetoxycephalosporanic acid Chemical compound S1CC(C)=C(C(O)=O)N2C(=O)[C@@H](N)[C@@H]12 NVIAYEIXYQCDAN-CLZZGJSISA-N 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241001578974 Achlya <moth> Species 0.000 description 1
- 241001134629 Acidothermus Species 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241001135511 Agrobacterium rubi Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- LSBDFXRDZJMBSC-UHFFFAOYSA-N Amide-Phenylacetic acid Natural products NC(=O)CC1=CC=CC=C1 LSBDFXRDZJMBSC-UHFFFAOYSA-N 0.000 description 1
- 101150086876 Amy gene Proteins 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 102220614023 Angiotensin-converting enzyme 2_T27Y_mutation Human genes 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000185996 Arthrobacter citreus Species 0.000 description 1
- 241000186074 Arthrobacter globiformis Species 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 241000223651 Aureobasidium Species 0.000 description 1
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193747 Bacillus firmus Species 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 101900040182 Bacillus subtilis Levansucrase Proteins 0.000 description 1
- 241000151861 Barnettozyma salicaria Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 241000221198 Basidiomycota Species 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241001274890 Boeremia exigua Species 0.000 description 1
- 241000149420 Bothrometopus brevis Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 241000605902 Butyrivibrio Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241001619326 Cephalosporium Species 0.000 description 1
- 241000146399 Ceriporiopsis Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000190831 Chromatium Species 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 102220568693 Claudin-16_H71D_mutation Human genes 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000429427 Clostridium saccharobutylicum Species 0.000 description 1
- 241001552623 Clostridium tetani E88 Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 241000222511 Coprinus Species 0.000 description 1
- 241001464948 Coprococcus Species 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- 241000222356 Coriolus Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 101100317179 Dictyostelium discoideum vps26 gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101100085603 Drosophila melanogaster nclb gene Proteins 0.000 description 1
- 101150015836 ENO1 gene Proteins 0.000 description 1
- 101100407639 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) prtB gene Proteins 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 240000000664 Eriochloa polystachya Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 241001608234 Faecalibacterium Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000700662 Fowlpox virus Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 241000896533 Gliocladium Species 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 241001401556 Glutamicibacter mysorens Species 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 1
- 241000223198 Humicola Species 0.000 description 1
- 101100232312 Hypocrea jecorina hfb1 gene Proteins 0.000 description 1
- 101100232315 Hypocrea jecorina hfb2 gene Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 241000186984 Kitasatospora aureofaciens Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 241001468191 Lactobacillus kefiri Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- FXHOOIRPVKKKFG-UHFFFAOYSA-N N,N-Dimethylacetamide Chemical compound CN(C)C(C)=O FXHOOIRPVKKKFG-UHFFFAOYSA-N 0.000 description 1
- 102220526248 NACHT, LRR and PYD domains-containing protein 6_F71R_mutation Human genes 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 101100032166 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr5 gene Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 102000035092 Neutral proteases Human genes 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 241000489469 Ogataea kodamae Species 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 241000489470 Ogataea trehalophila Species 0.000 description 1
- 241000826199 Ogataea wickerhamii Species 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 241000157908 Paenarthrobacter aurescens Species 0.000 description 1
- 241001524178 Paenarthrobacter ureafaciens Species 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 241000157907 Paeniglutamicibacter sulfureus Species 0.000 description 1
- 241000237988 Patellidae Species 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000015731 Peptide Hormones Human genes 0.000 description 1
- 108010038988 Peptide Hormones Proteins 0.000 description 1
- 241000530350 Phaffomyces opuntiae Species 0.000 description 1
- 241000529953 Phaffomyces thermotolerans Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000235062 Pichia membranifaciens Species 0.000 description 1
- 241000221945 Podospora Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000192138 Prochlorococcus Species 0.000 description 1
- 108010076181 Proinsulin Proteins 0.000 description 1
- 241000157935 Promicromonospora citrea Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 102220626969 Protein CutA_H71L_mutation Human genes 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100292548 Rattus norvegicus Adi1 gene Proteins 0.000 description 1
- 241000235402 Rhizomucor Species 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000190967 Rhodospirillum Species 0.000 description 1
- 241000186567 Romboutsia lituseburensis Species 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- 101150014136 SUC2 gene Proteins 0.000 description 1
- 241000187792 Saccharomonospora Species 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 1
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000195663 Scenedesmus Species 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000015473 Schizothorax griseus Species 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 101800001707 Spacer peptide Proteins 0.000 description 1
- 102100026263 Sphingomyelin phosphodiesterase Human genes 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 241000521540 Starmera quercuum Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194054 Streptococcus uberis Species 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241000187758 Streptomyces ambofaciens Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000971005 Streptomyces fungicidicus Species 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001137870 Thermoanaerobacterium Species 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 241000203807 Tropheryma Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 241001507667 Volvariella Species 0.000 description 1
- 241000370136 Wickerhamomyces pijperi Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000204366 Xylella Species 0.000 description 1
- 101150075580 Xyn1 gene Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 241000758405 Zoopagomycotina Species 0.000 description 1
- 241000588902 Zymomonas mobilis Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 102000045404 acyltransferase activity proteins Human genes 0.000 description 1
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 150000001576 beta-amino acids Chemical group 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 102220419663 c.47A>T Human genes 0.000 description 1
- 102220421646 c.83T>C Human genes 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 230000023852 carbohydrate metabolic process Effects 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 101150052795 cbh-1 gene Proteins 0.000 description 1
- 101150114858 cbh2 gene Proteins 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 229960003326 cloxacillin Drugs 0.000 description 1
- LQOLIRLGBULYKD-JKIFEVAISA-N cloxacillin Chemical compound N([C@@H]1C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C1=C(C)ON=C1C1=CC=CC=C1Cl LQOLIRLGBULYKD-JKIFEVAISA-N 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010960 commercial process Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 239000006184 cosolvent Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 101150066032 egl-1 gene Proteins 0.000 description 1
- 101150003727 egl2 gene Proteins 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229920000578 graft copolymer Polymers 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108060003552 hemocyanin Proteins 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000003317 immunochromatography Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-O oxonium Chemical compound [OH3+] XLYOFNOQVPJJNP-UHFFFAOYSA-O 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 101150093025 pepA gene Proteins 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000447 polyanionic polymer Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000030788 protein refolding Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 208000009305 pseudorabies Diseases 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 102200036772 rs10281879 Human genes 0.000 description 1
- 102200130903 rs11542065 Human genes 0.000 description 1
- 102200009843 rs121434498 Human genes 0.000 description 1
- 102220238658 rs1468529365 Human genes 0.000 description 1
- 102200082890 rs33972047 Human genes 0.000 description 1
- 102200087974 rs63751098 Human genes 0.000 description 1
- 102220277681 rs760158426 Human genes 0.000 description 1
- 102220084968 rs863225270 Human genes 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229940054967 vanquish Drugs 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 150000003952 β-lactams Chemical class 0.000 description 1
Description
По настоящей заявке испрашивают приоритет патентных заявок США с серийными №№ 62/442810 и 62/472055, поданных 5 января 2017 г. и 16 марта 2017 г. соответственно, обе они включены, таким образом, посредством ссылки во всей их полноте для всех целей.This application claims benefit to U.S. Patent Application Serial Nos. 62/442810 and 62/472055, filed January 5, 2017 and March 16, 2017, respectively, both of which are hereby incorporated by reference in their entirety for all purposes. .
Область изобретенияField of invention
Настоящее изобретение предусматривает сконструированные ферменты ацилазы пенициллина G (PGA), полинуклеотиды, кодирующие ферменты, композиции, содержащие ферменты, и способы использования сконструированных ферментов PGA.The present invention provides engineered penicillin G acylase (PGA) enzymes, polynucleotides encoding the enzymes, compositions containing the enzymes, and methods of using the engineered PGA enzymes.
Ссылка на список последовательностей, таблицу или компьютерную программуLink to sequence list, table, or computer program
Официальная копия списка последовательностей подана одновременно с описанием в виде текстового файла в формате ASCII через EFS-Web с названием файла Списки последовательностей^, датой создания 5 июня 2019 г. и размером 967 КБ. Список последовательностей, поданный через EFS-Web, является частью описания и включен в полном объеме по ссылке в настоящее описание.An official copy of the sequence listing is submitted along with the description as an ASCII text file via EFS-Web with the file name Sequence Listings^, creation date June 5, 2019, and size 967 KB. The sequence listing provided via EFS-Web is part of the specification and is incorporated in its entirety by reference into this specification.
Предпосылки изобретенияBACKGROUND OF THE INVENTION
Ацилаза пенициллина G (PGA) (пенициллинамидаза, ЕС 3.5.1.11) катализирует расщепление амидной связи боковой цепи пенициллина G (бензилпенициллина). Фермент используют коммерчески при получении 6-амино-пенициллановой кислоты (6-АРА) и фенилуксусной кислоты (РАА). 6-АРА является ключевым соединением при промышленном получении полусинтетических β-лактамных антибиотиков, таких как амоксициллин, ампициллин и цефалексин. Встречаемый в природе фермент PGA демонстрирует нестабильность в коммерческих процессах, что требует иммобилизации на твердых подложках для коммерческого применения. PGA ковалентно связывают с различными основами, и системы с иммобилизованной PGA описывают как эффективные инструменты для синтеза чистых оптических изомеров. Однако прикрепление к твердым поверхностям ведет к нарушению свойств фермента, таким как сниженная активность и/или избирательность, и ограничение доступом растворенных веществ. Кроме того, несмотря на то, что прикрепление к твердым подложкам делает возможным захват ферментов и повторное использование в дополнительных циклах обработки, стабильность фермента является такой, что такие применения могут быть ограничены. Ферментативный катализ пенициллина G с помощью PGA до 6АРА является региоспецифическим (не происходит расщепление лактам-амидной связи) и стереоспецифическим. Получение 6-АРА составляет, возможно, наибольшую пользу от ферментативного катализа при получении фармацевтических средств. Ферментативная активность PGA, ассоциированная с фенацетильным фрагментом, допускает стереоспецифический гидролиз большого спектра фенацетильных производных первичных аминов, а также спиртов.Penicillin G acylase (PGA) (penicillin amidase, EC 3.5.1.11) catalyzes the cleavage of the amide bond of the penicillin G (benzylpenicillin) side chain. The enzyme is used commercially in the preparation of 6-amino-penicillanic acid (6-APA) and phenylacetic acid (PAA). 6-APA is a key compound in the industrial production of semisynthetic β-lactam antibiotics such as amoxicillin, ampicillin and cephalexin. The naturally occurring PGA enzyme exhibits instability in commercial processes, requiring immobilization on solid supports for commercial applications. PGA is covalently linked to various backbones, and systems with immobilized PGA have been described as effective tools for the synthesis of pure optical isomers. However, attachment to solid surfaces leads to impairment of enzyme properties, such as reduced activity and/or selectivity, and limited access of solutes. In addition, although attachment to solid supports allows enzymes to be captured and reused in additional processing cycles, the stability of the enzyme is such that such applications may be limited. The enzymatic catalysis of penicillin G by PGA to 6APA is regiospecific (no cleavage of the lactam-amide bond occurs) and stereospecific. The production of 6-APA is perhaps the greatest benefit from enzymatic catalysis in the production of pharmaceuticals. The enzymatic activity of PGA, associated with the phenacetyl moiety, allows stereospecific hydrolysis of a wide range of phenacetyl derivatives of primary amines, as well as alcohols.
Сущность изобретенияThe essence of the invention
Настоящее изобретение предусматривает сконструированные ферменты ацилазы пенициллина G (PGA), полинуклеотиды, кодирующие ферменты, композиции, содержащие ферменты, и способы использования сконструированных ферментов PGA. Настоящее изобретение предусматривает сконструированные ацилазы пенициллина G, способные к ацилированию инсулина, где полипептидная последовательность указанной ацилазы пенициллина G по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентична SEQ ID № 2, 4, 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 142, 154 и 160. В некоторых вариантах осуществления ацилаза пенициллина G содержит SEQ ID № 4, 12, 24, 40, 56, 70, 82, 108, 110, 116, 136, 142, 154 или 160. В некоторых дополнительных вариантах осуществления сконструированная ацилаза пенициллина G содержит последовательность, которая по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентична по меньшей мере одной последовательности, приведенной в табл. 5.1, 5.1, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 7.1, 8.1, 9.1, 11.1, 12.1, 13.1, 14.1, 15.1, 16.1, 17.1, 18.1, 19.1 и/или табл. 20.1. В некоторых дополнительных вариантах осуществления сконструированная ацилаза пенициллина G содержит последовательность содержит последовательность, приведенную в табл. 5.1, 5.1, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 7.1, 8.1, 9.1, 11.1, 12.1, 13.1, 14.1, 15.1, 16.1, 17.1, 18.1, 19.1 и/или табл. 20.1. В некоторых других дополнительных вариантах осуществления сконструированная ацилаза пенициллина G содержит гистидиновую метку. В некоторых вариантах осуществления гистидиновая метка присутствует на С-конце сконструированной ацилазы пенициллина G. В некоторых дополнительных вариантах осуществления, сконструированная ацилаза пенициллина G содержит полипептидную последовательность, выбранную из SEQ ID № 110 и SEQ ID № 142.The present invention provides engineered penicillin G acylase (PGA) enzymes, polynucleotides encoding the enzymes, compositions containing the enzymes, and methods of using the engineered PGA enzymes. The present invention provides engineered penicillin G acylases capable of acylating insulin, wherein the polypeptide sequence of said penicillin G acylase is at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% , 98%, 99% or greater identical to SEQ ID Nos. 2, 4, 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 142, 154, and 160. In some embodiments, penicillin acylase G contains SEQ ID No. 4, 12, 24, 40, 56, 70, 82, 108, 110, 116, 136, 142, 154, or 160. In some additional embodiments, the engineered penicillin acylase G contains a sequence that is at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more identical to at least one sequence shown in table. 5.1, 5.1, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 7.1, 8.1, 9.1, 11.1, 12.1, 13.1, 14.1, 15.1, 16.1, 17.1, 18.1, 19.1 and/or table. 20.1. In some further embodiments, the engineered penicillin G acylase comprises the sequence comprising the sequence shown in Table. 5.1, 5.1, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 7.1, 8.1, 9.1, 11.1, 12.1, 13.1, 14.1, 15.1, 16.1, 17.1, 18.1, 19.1 and/or table. 20.1. In some other additional embodiments, the engineered penicillin G acylase contains a histidine tag. In some embodiments, a histidine tag is present at the C-terminus of the engineered penicillin G acylase. In some further embodiments, the engineered penicillin G acylase comprises a polypeptide sequence selected from SEQ ID NO: 110 and SEQ ID NO: 142.
Настоящее изобретение также относится к сконструированным полинуклеотидным последовательностям, кодирующим сконструированные ацилазы пенициллина G, предусмотренные в настоящем описании. В некоторых вариантах осуществления сконструированная полинуклеотидная последовательность содержит полинуклеотидную последовательность, которая по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентична SEQ ID №№ 1, 11, 23, 39, 55, 69, 81, 99, 107, 109, 115, 135, 141, 153 и/или 159.The present invention also provides engineered polynucleotide sequences encoding the engineered penicillin G acylases provided herein. In some embodiments, the engineered polynucleotide sequence comprises a polynucleotide sequence that is at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or greater identical to SEQ ID Nos. 1, 11, 23, 39, 55, 69, 81, 99, 107, 109, 115, 135, 141, 153 and/or 159.
Настоящее изобретение также относится к векторам, содержащим сконструированные полинуклеотидные последовательности, предусмотренные в настоящем описании. В некоторых вариантах осуществления векторы содержат по меньшей мере одну сконструированную полинуклеотидную последовательность, содержащую полинуклеотидную последовательность(и), по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентичную SEQ ID №№ 2, 11, 23, 39, 55, 69, 81, 99,The present invention also relates to vectors containing the designed polynucleotide sequences provided herein. In some embodiments, the vectors contain at least one engineered polynucleotide sequence comprising polynucleotide sequence(s) of at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% , 98%, 99% or more identical to SEQ ID Nos. 2, 11, 23, 39, 55, 69, 81, 99,
- 1 043748- 1 043748
107, 109, 115, 135, 141, 153 и/или 159. В некоторых дополнительных вариантах осуществления векторы содержат по меньшей мере одну управляющую последовательность.107, 109, 115, 135, 141, 153 and/or 159. In some further embodiments, the vectors comprise at least one escape sequence.
Настоящее изобретение также относится к клеткам-хозяевам, содержащим по меньшей мере один вектор, предусмотренный в настоящем описании. В некоторых вариантах осуществления векторы в клетках-хозяевах содержат по меньшей мере одну сконструированную полинуклеотидную последовательность, содержащую полинуклеотидную последовательность(и), по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентичную SEQ ID №№ 1, 11, 23, 39, 55, 69, 81, 99, 107, 109, 115, 135, 141, 153 и/или 159. В некоторых дополнительных вариантах осуществления векторы содержат по меньшей мере одну управляющую последовательность.The present invention also relates to host cells containing at least one vector as provided herein. In some embodiments, the host cell vectors comprise at least one engineered polynucleotide sequence comprising at least 85%, 90%, 91%, 92%, 93%, 94%, 95% of the polynucleotide sequence(s) 96%, 97%, 98%, 99% or greater identical to SEQ ID Nos. 1, 11, 23, 39, 55, 69, 81, 99, 107, 109, 115, 135, 141, 153 and/or 159. In some further embodiments, the vectors comprise at least one escape sequence.
Настоящее изобретение также относится к способам получения ацилированного инсулина, которые включают предоставление: по меньшей мере одной сконструированной ацилазы пенициллина G по любому из пп.1-7 и инсулина; и экспонирование сконструированной ацилазы пенициллина G и инсулина в таких условиях, что сконструированная ацилаза пенициллина G ацилирует инсулин, тем самым получая ацилированный инсулин. В некоторых вариантах осуществления ацилирование проводят в присутствии метилфенилацетата. В некоторых дополнительных вариантах осуществления, ацилирование происходит в любом из положений А1, В1 и/или В29 указанного инсулина. В некоторых дополнительных вариантах осуществления, ацилирование происходит в положении А1 указанного инсулина, тогда как в некоторых альтернативных вариантах осуществления ацилирование происходит в положении В1 указанного инсулина, и в других вариантах осуществления ацилирование происходит в положении В29 указанного инсулина. В некоторых вариантах осуществления ацилирование происходит в положениях A1, B1 и/или В29 указанного инсулина. В некоторых дополнительных вариантах осуществления, ацилирование происходит в положениях A1, B1 и В29 инсулина. В некоторых дополнительных вариантах осуществления способов, сконструированная ацилаза пенициллина G продуцирует более чем 90% более ацилированного инсулина по сравнению с получением ацилированного инсулина с помощью полипептида из SEQ ID № 2, 4, 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 142, 154 и/или 160.The present invention also relates to methods for producing acylated insulin, which include providing: at least one engineered penicillin G acylase according to any one of claims 1 to 7 and insulin; and exposing the engineered penicillin G acylase and insulin under conditions such that the engineered penicillin G acylase acylates insulin, thereby producing acylated insulin. In some embodiments, the acylation is carried out in the presence of methyl phenylacetate. In some further embodiments, the acylation occurs at any of the A1, B1 and/or B29 positions of said insulin. In some further embodiments, the acylation occurs at the A1 position of the insulin, while in some alternative embodiments, the acylation occurs at the B1 position of the insulin, and in other embodiments, the acylation occurs at the B29 position of the insulin. In some embodiments, acylation occurs at positions A1, B1 and/or B29 of said insulin. In some additional embodiments, acylation occurs at positions A1, B1, and B29 of insulin. In some further embodiments of the methods, the engineered penicillin G acylase produces greater than 90% more acylated insulin compared to producing acylated insulin using the polypeptide of SEQ ID NO: 2, 4, 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 142, 154 and/or 160.
Настоящее изобретение также относится к композициям ацилированного инсулина, получаемым с использованием по меньшей мере одной сконструированной ацилазы пенициллина G, предусмотренной в настоящем описании. В некоторых дополнительных вариантах осуществления, настоящее изобретение предусматривает композиции, содержащие ацилированный инсулин, получаемый с использованием по меньшей мере одного способа, предусмотренного в настоящем описании.The present invention also relates to acylated insulin compositions prepared using at least one engineered penicillin G acylase provided herein. In some further embodiments, the present invention provides compositions comprising acylated insulin produced using at least one method provided herein.
Краткое описание фигурBrief description of the figures
На фиг. 1 приведена хроматограмма для аналитического способа, описанного в табл. 21.5, которую используют для того, чтобы количественно определять инсулин и порядок элюирования ацилированных продуктов.In fig. 1 shows a chromatogram for the analytical method described in table. 21.5, which is used to quantify insulin and the elution order of acylated products.
На фиг. 2 приведены результаты экспериментов, описанных в примере 10.In fig. 2 shows the results of the experiments described in example 10.
На фиг. 3 приведены результаты экспериментов, описанных в примере 16.In fig. 3 shows the results of the experiments described in example 16.
Описание изобретенияDescription of the invention
Настоящее изобретение предусматривает сконструированные ацилазы пенициллина G (PGA), которые способны расщеплять пенициллин до фенилуксусной кислоты и 6-аминопенициллановой кислоты (6-АРА), которая является ключевым промежуточным соединением в синтезе большого спектра βлактамных антибиотиков. В частности, настоящее изобретение предусматривает сконструированные PGA, которые способны продуцировать монозащищенный или дизащищенный фенилацетатом инсулин посредством добавления защитной группы в положения A1, B1 или В29 свободного инсулина или удаления защитных групп из А1/В1/В29 тризащищенного инсулина или удаления А1/В1/В29 трифенилацетатных защитных групп для того, чтобы высвобождать свободный инсулин.The present invention provides engineered penicillin G acylases (PGAs) that are capable of degrading penicillin to phenylacetic acid and 6-aminopenicillanic acid (6-APA), which is a key intermediate in the synthesis of a wide range of β-lactam antibiotics. In particular, the present invention provides engineered PGAs that are capable of producing monoprotected or diprotected phenylacetate insulin by adding a protecting group to the A1, B1 or B29 positions of free insulin or removing protecting groups from A1/B1/B29 of triprotected insulin or removing A1/B1/B29 of triphenylacetate protective groups in order to release free insulin.
В целом, встречаемые в природе PGA представляют собой гетеродимерные ферменты, состоящие из альфа-субъединицы и бета-субъединицы. В природе PGA дикого типа синтезируется в виде полипептида препро-PGA, содержащего N-концевой сигнальный пептид, который опосредует транслокацию в периплазму, и линкерную область, соединяющую С-конец альфа-субъединицы с N-концом бетасубъединицы. Протеолитическая обработка ведет к зрелому гетеродимерному ферменту. Межмолекулярная линкерная область также может выполнять функцию содействия надлежащей укладке фермента. PGA, предусмотренные в настоящем описании, основаны PGA из Kluyvera citrophila, в которую вводили различные модификации для того, чтобы создавать усовершенствованные ферментативные свойства, как описано подробно далее.In general, naturally occurring PGAs are heterodimeric enzymes consisting of an alpha subunit and a beta subunit. In nature, wild-type PGA is synthesized as a prepro-PGA polypeptide containing an N-terminal signal peptide that mediates translocation into the periplasm and a linker region connecting the C-terminus of the alpha subunit to the N-terminus of the beta subunit. Proteolytic processing leads to a mature heterodimeric enzyme. The intermolecular linker region may also serve the function of facilitating proper folding of the enzyme. The PGAs provided herein are based on PGAs from Kluyvera citrophila, into which various modifications have been introduced in order to create improved enzymatic properties, as described in detail below.
Для описаний, предусмотренных в настоящем описании, использование формы единственного числа включает множественное число (и наоборот), пока конкретно не указано иное. Например, формы единственного числа включают множественное число до тех пор, пока контекст явно не указывает на иное. Аналогичным образом, содержать, содержит, содержащий, включать, включает и включающий являются взаимозаменяющими и не предназначены для ограничения. Кроме того, следует понимать, что когда в описаниях различных вариантов осуществления используют термин содержащий, специалисты в данной области поймут, что в некоторых конкретных случаях вариант осуществления можно альтернативно описывать с использованием формулировки состоящий по существу из или со- 2 043748 стоящий из.For the purposes of the descriptions provided herein, the use of the singular form includes the plural (and vice versa) unless specifically stated otherwise. For example, singular forms include the plural unless the context clearly indicates otherwise. Likewise, contain, contains, containing, include, includes, and including are interchangeable and not intended to be limiting. It should also be understood that when the term comprising is used in the descriptions of various embodiments, those skilled in the art will appreciate that in some particular cases, an embodiment may alternatively be described using the language consisting essentially of or consisting of.
Как приведенное выше общее описание, включая чертежи, так и последующее подробное описание являются лишь образцовыми и разъясняющими и не являются ограничением этого раскрытия. Кроме того, заголовки разделов, используемые в настоящем описании, служат только цели организации и их не следует толковать в качестве ограничения описываемого объекта изобретения.Both the foregoing general description, including the drawings, and the following detailed description are exemplary and explanatory only and are not intended to limit this disclosure. In addition, section headings used in this specification are for organizational purposes only and should not be construed as limiting the subject matter described.
ОпределенияDefinitions
Как используют в настоящем описании, следующие термины приведены в следующих значениях.As used herein, the following terms are given the following meanings.
По отношению к настоящему раскрытию, технические и научные термины, используемые в описаниях в настоящем описании, должны иметь значения, в которых их обычно понимает специалист в данной области, пока конкретно не определено иное. Соответственно, следующие термины приведены в следующих значениях. Все патенты и публикации, в том числе все последовательности, раскрытые в таких патентах и публикациях, упоминаемых в настоящем описании, в явной форме включены по ссылке. Если не указано иное, практическая реализация настоящего изобретения включает общепринятые способы, широко используемые в молекулярной биологии, ферментации, микробиологии и связанных областях, которые известны специалистам в данной области. Пока в настоящем описании не определенное иное, все технические и научные термины, используемые в настоящем описании, имеют то же значение, как их обычно понимает специалист в области, к которой это изобретение относится. Несмотря на то, что любые способы и материалы, подобные или эквивалентные тем, что описаны в настоящем описании, можно использовать при практической реализации или тестировании настоящего изобретения, описаны предпочтительные способы и материалы. В действительности, подразумевают, что настоящее изобретение не ограничено конкретными способами, протоколами и реактивами, описанными в настоящем описании, поскольку они могут варьировать, в зависимости от контекста, в котором их используют. Заголовки, предусмотренные в настоящем описании, не являются ограничениями для различных аспектов или вариантов осуществления настоящего изобретения.With respect to the present disclosure, technical and scientific terms used in the descriptions herein shall have the meanings in which they are commonly understood by one skilled in the art, unless specifically defined otherwise. Accordingly, the following terms are given the following meanings. All patents and publications, including all sequences disclosed in such patents and publications mentioned herein, are expressly incorporated by reference. Unless otherwise indicated, the practice of the present invention includes conventional methods widely used in molecular biology, fermentation, microbiology and related fields that are known to those skilled in the art. Unless otherwise defined herein, all technical and scientific terms used herein have the same meaning as commonly understood by one skilled in the art to which this invention relates. Although any methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present invention, preferred methods and materials are described. Indeed, the present invention is not intended to be limited to the specific methods, protocols and reagents described herein, as they may vary depending on the context in which they are used. The headings provided herein are not intended to limit the various aspects or embodiments of the present invention.
Тем не менее, чтобы облегчать понимание настоящего изобретения, многие термины определены далее. Числовые диапазоны включают числа, определяющие диапазон. Таким образом, предусмотрено, что каждый числовой диапазон, раскрытый в настоящем описании, охватывает каждый более узкий числовой диапазон, который попадает в такой более узкий числовой диапазон, как если бы все такие более узкие числовые диапазоны были в явной форме изложены в настоящем описании. Также предусмотрено, что каждое максимальное (или минимальное) числовое ограничение, раскрытое в настоящем описании, включает каждое меньшее (или большее) числовое ограничение, как если бы такие меньшие (или большие) числовые ограничения были в явной форме изложены в настоящем описании.However, to facilitate understanding of the present invention, many terms are defined below. Numeric ranges include numbers that define a range. Thus, each numerical range disclosed herein is intended to cover each narrower numerical range that falls within such narrower numerical range as if all such narrower numerical ranges were expressly set forth herein. It is also provided that each maximum (or minimum) numerical limitation disclosed herein includes each lesser (or greater) numerical limitation as if such lesser (or greater) numerical limitations were expressly set forth herein.
Как используют в настоящем описании, термин содержащий и его производные используют в их инклюзивном значении (т.е. эквиваленты термину включающий и соответствующим ему производным).As used herein, the term containing and its derivatives are used in their inclusive meaning (ie, equivalent to the term including and its corresponding derivatives).
Как используют в настоящем описании и в приложенной формуле изобретения, форма единственного числа включает множественное число, пока контекст явно не указывает на иное. Таким образом, например, упоминание о клетке-хозяине включает множество таких клеток-хозяев.As used herein and in the appended claims, the singular form includes the plural unless the context clearly indicates otherwise. Thus, for example, reference to a host cell includes a plurality of such host cells.
Если не указано иное, нуклеиновые кислоты пишут слева направо в ориентации от 5' к 3' и аминокислотные последовательности пишут слева направо в ориентации от амино к карбокси соответственно.Unless otherwise noted, nucleic acids are written from left to right in a 5' to 3' orientation and amino acid sequences are written from left to right in an amino to carboxy orientation, respectively.
Заголовки, предусмотренные в настоящем описании, не являются ограничениями для различных аспектов или вариантов осуществления изобретения, которые можно получить, обратившись к описанию в целом. Соответственно, термины, которые определены далее, более полно определены путем обращения к описанию в целом.The headings provided herein are not intended to limit the various aspects or embodiments of the invention, which may be obtained by reference to the specification as a whole. Accordingly, the terms that are defined below are more fully defined by reference to the description as a whole.
Как используют в настоящем описании, термины белок, полипептид и пептид используют взаимозаменяемо в настоящем описании для обозначения полимера по меньшей мере двух аминокислот, ковалентно связанных амидной связью, независимо от длины или посттрансляционных модификаций (например, гликозилирования, фосфорилирования, липидизация, миристилирования, убиквитинилирования и т.д.). В это определение включены D- и L-аминокислоты и смеси D- и L-аминокислот.As used herein, the terms protein, polypeptide, and peptide are used interchangeably herein to refer to a polymer of at least two amino acids covalently linked by an amide bond, regardless of length or post-translational modifications (e.g., glycosylation, phosphorylation, lipidation, myristylation, ubiquitinylation, and etc.). Included in this definition are D- and L-amino acids and mixtures of D- and L-amino acids.
Как используют в настоящем описании, полинуклеотид и нуклеиновая кислота относятся к двум или больше нуклеозидам, которые ковалентно связаны вместе. Полинуклеотид может полностью состоять из рибонуклеозидов (т.е. РНК), полностью состоять из 2'-дезоксирибонуклеотидов (т.е. ДНК) или смесей рибо- и 2'-дезоксирибонуклеозидов. Хотя нуклеозиды обычно связывают вместе через стандартные фосфодиэфирные связи, полинуклеотиды могут содержать одну или несколько нестандартных связей. Полинуклеотид может быть одноцепочечным или двухцепочечным или может содержать как одноцепочечные области, так и двухцепочечные области. Кроме того, хотя полинуклеотид обычно состоит из встречаемых в природе кодирующих нуклеиновых оснований (т.е. аденина, гуанина, урацила, тимина и цитозина), он может содержать одно или несколько модифицированных и/или синтетических нуклеиновых оснований (например, инозин, ксантин, гипоксантин и т.д.). Предпочтительно такие модифицированные или синтетические нуклеиновые основания будут кодирующими нуклеиновыми основаниями.As used herein, polynucleotide and nucleic acid refer to two or more nucleosides that are covalently linked together. A polynucleotide may be composed entirely of ribonucleosides (i.e., RNA), composed entirely of 2'-deoxyribonucleotides (i.e., DNA), or mixtures of ribo- and 2'-deoxyribonucleosides. Although nucleosides are usually linked together through standard phosphodiester linkages, polynucleotides may contain one or more non-standard linkages. The polynucleotide may be single-stranded or double-stranded, or may contain both single-stranded regions and double-stranded regions. In addition, although a polynucleotide typically consists of naturally occurring coding nucleic acid bases (i.e., adenine, guanine, uracil, thymine, and cytosine), it may contain one or more modified and/or synthetic nucleic acid bases (e.g., inosine, xanthine, hypoxanthine, etc.). Preferably, such modified or synthetic nucleic acid bases will be coding nucleic acid bases.
Как используют в настоящем описании, степень строгости гибридизации относится к условиям гибридизации, таким как условия промывания, при гибридизации нуклеиновых кислот. В целом, реакцииAs used herein, the degree of hybridization stringency refers to the hybridization conditions, such as washing conditions, when hybridizing nucleic acids. Overall, the reactions
- 3 043748 гибридизации осуществляют в условиях более низкой степени строгости, после чего следуют промывания переменной, но более высокой степени строгости. Термин умеренно строгая гибридизация относится к условиям, которые допускают связывание целевой ДНК с комплементарной нуклеиновой кислотой, которая обладает приблизительно 60% идентичностью, предпочтительно приблизительно 75% идентичностью, приблизительно 85% идентичностью с целевой ДНК; с более чем приблизительно 90% идентичностью с целевым полинуклеотидом. Образцовые умеренно строгие условия представляют собой условия, эквивалентные гибридизации в 50% формамиде, 5х растворе Денхарта, 5х SSPE, 0,2% SDS при 42°С, после чего следует промывание в 0,2х SSPE, 0,2% SDS при 42°С. Гибридизация высокой степени строгости в целом относится к условиям, которые составляют приблизительно 10°С или меньше от температуры теплового плавления Tm, как определяют в условиях раствора для определенной полинуклеотидной последовательности. В некоторых вариантах осуществления условия высокой степени строгости относятся к условиям, которые допускают гибридизацию только тех последовательностей нуклеиновой кислоты, которые образуют стабильные гибриды в 0,018 М NaCl при 65°С (т.е. если гибрид не стабилен в 0,018 М NaCl при 65°С, он не будет стабилен в условиях с высокой строгостью, как предусмотрено в настоящем описании). Условия с высокой строгостью можно обеспечивать, например, посредством гибридизации в условиях, эквивалентных 50% формамиду, 5х раствору Денхарта, 5х SSPE, 0,2% SDS при 42°С, после чего следует промывание в 0,1х SSPE и 0,1% SDS при 65°С. Другие условия высокой степени строгости представляют собой гибридизацию в условиях, эквивалентных гибридизации в 5х SSC, содержащем 0,1% (мас.:об.) SDS при 65°С и промыванию в 0,1х SSC, содержащем 0,1% SDS, при 65°С. Другие условия гибридизации высокой степени строгости, а также умеренно строгие условия, известны специалистам в данной области.- 3 043748 hybridizations are carried out under lower stringency conditions, followed by variable but higher stringency washes. The term moderately stringent hybridization refers to conditions that allow the binding of target DNA to a complementary nucleic acid that has about 60% identity, preferably about 75% identity, about 85% identity to the target DNA; with greater than approximately 90% identity to the target polynucleotide. Exemplary moderately stringent conditions are conditions equivalent to hybridization in 50% formamide, 5x Denhart's solution, 5x SSPE, 0.2% SDS at 42°C, followed by a wash in 0.2x SSPE, 0.2% SDS at 42°C WITH. High stringency hybridization generally refers to conditions that are approximately 10° C. or less of the thermal melting temperature T m as determined under solution conditions for a particular polynucleotide sequence. In some embodiments, high stringency conditions refer to conditions that allow hybridization of only those nucleic acid sequences that form stable hybrids in 0.018 M NaCl at 65°C (i.e., if the hybrid is not stable in 0.018 M NaCl at 65°C , it will not be stable under high stringency conditions as provided herein). High stringency conditions can be achieved, for example, by hybridization under conditions equivalent to 50% formamide, 5x Denhart's solution, 5x SSPE, 0.2% SDS at 42°C, followed by a wash in 0.1x SSPE and 0.1% SDS at 65°C. Other high stringency conditions are hybridization under conditions equivalent to hybridization in 5x SSC containing 0.1% (w:v) SDS at 65°C and washing in 0.1x SSC containing 0.1% SDS at 65°C. Other high stringency hybridization conditions, as well as moderate stringency conditions, are known to those skilled in the art.
Как используют в настоящем описании, кодирующая последовательность относится к той части нуклеиновой кислоты (например, гену), которая кодирует аминокислотную последовательность белка.As used herein, a coding sequence refers to that portion of a nucleic acid (eg, a gene) that encodes the amino acid sequence of a protein.
Как используют в настоящем описании, с оптимизацией кодонов относится к изменениям в кодонах полинуклеотида, кодирующего белок, на те, которые предпочтительно использует конкретный организм, так что кодируемый белок эффективно экспрессируют в организме, представляющем интерес. В некоторых вариантах осуществления полинуклеотиды, кодирующие ферменты PGA, могут быть с оптимизацией кодонов для оптимального получения из организма-хозяина, выбранного для экспрессии. Несмотря на то, что генетический код является вырожденным в том отношении, что большинство аминокислоты представлены несколькими кодонами, называемыми синонимами или синонимическими кодонами, хорошо известно, что использование кодонов конкретными организмами является неслучайным и смещенным в направлении конкретных кодонных триплетов. Это предпочтение кодонов может быть выше в отношении заданного гена, генов с общей функцией или происхождением от общего предка, сильно экспрессируемых белков в сравнении с белками с низким числом копий и агрегатных кодирующих белки областей в геноме организма. В некоторых вариантах осуществления полинуклеотиды, кодирующие ферменты PGA, могут быть с оптимизацией кодонов для оптимального получения из организма-хозяина, выбранного для экспрессии.As used herein, codon optimization refers to changes in the codons of a polynucleotide encoding a protein to those preferentially used by a particular organism, such that the encoded protein is efficiently expressed in the organism of interest. In some embodiments, polynucleotides encoding PGA enzymes may be codon optimized for optimal production from the host selected for expression. Although the genetic code is degenerate in that most amino acids are represented by multiple codons, called synonyms or synonymous codons, it is well known that codon usage by specific organisms is non-random and biased towards specific codon triplets. This codon preference may be higher for a given gene, genes with common function or descent from a common ancestor, highly expressed versus low copy number proteins, and aggregate protein coding regions in an organism's genome. In some embodiments, polynucleotides encoding PGA enzymes may be codon optimized for optimal production from the host selected for expression.
Как используют в настоящем описании, кодоны с предпочтительным, оптимальным, высоким предпочтением кодонов относятся взаимозаменяемо к кодонам, которые используют с более высокой частотой в кодирующих белок областях, чем другие кодоны, которые кодируют ту же аминокислоту. Предпочтительные кодоны можно определять по отношению к использованию кодонов в одном гене, наборе генов с общей функцией или происхождением, высоко экспрессируемых генах, частоте кодонов в агрегатных кодирующих белок областях всего организма, частоте кодонов в агрегатных кодирующих белок областях родственных организмов или их сочетаний. Кодоны, частота которых возрастает вместе с уровнем экспрессии гена, обычно представляют собой оптимальные кодоны для экспрессии. Известны различные способы для определения частоты кодонов (например, использование кодонов, относительное использование синонимических кодонов) и кодонных предпочтений у конкретных организмов, включая многопараметрический анализ, например, с использованием кластерного анализа или анализа соответствий, и эффективное число кодонов, используемых в гене (см., например, GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, John Peden, University of Nottingham; McInerney, Bioinform., 14:372-73 [1998]; Stenico et al., Nucleic Acids Res., 222:437-46 [1994]; and Wright, Ген 87:23-29 [1990]). Таблицы использования кодонов доступны для растущего списка организмов (см., например, Wada et al., Nucleic Acids Res., 20:2111-2118 [1992]; Nakamura et al., Nucl. Acids Res., 28:292 [2000]; Duret, et al., выше; Henaut and Danchin, Escherichia coli and Salmonella, Neidhardt, et al. (ред.), ASM Press, Washington D.C., [1996], стр. 2047-2066. Источник данных для получения использования кодонов может полагаться на любую доступную нуклеотидную последовательность, способную кодировать белок. Эти наборы данных включают последовательности нуклеиновой кислоты, о которых известно, что они фактически кодируют экспрессируемые белки (например, полные кодирующие белок последовательности - CDS), метки экспрессируемой последовательности (ESTS) или предсказанные кодирующие области геномных последовательностей (см., например, Uberbacher, Meth. Enzymol., 266:259-281 [1996]; Tiwari et al., Comput. Appl. Biosci., 13:263-270 [1997]).As used herein, preferred, optimal, and high codon preference codons refer interchangeably to codons that are used at a higher frequency in protein coding regions than other codons that code for the same amino acid. Preferred codons can be determined with respect to codon usage in a single gene, a set of genes with a common function or origin, highly expressed genes, the frequency of codons in aggregate protein-coding regions of an entire organism, the frequency of codons in aggregate protein-coding regions of related organisms, or combinations thereof. Codons whose frequency increases with the level of gene expression generally represent the optimal codons for expression. Various methods are known to determine codon frequency (e.g., codon usage, relative synonymous codon usage) and codon preferences in specific organisms, including multivariate analysis, e.g., using cluster or correspondence analysis, and the effective number of codons used in a gene (see eg GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, John Peden, University of Nottingham; McInerney, Bioinform., 14:372-73 [1998]; Stenico et al., Nucleic Acids Res., 222:437-46 [1994]; and Wright, Gene 87:23-29 [1990]). Codon usage tables are available for a growing list of organisms (see, for example, Wada et al., Nucleic Acids Res., 20:2111-2118 [1992]; Nakamura et al., Nucl. Acids Res., 28:292 [2000] ; Duret, et al., supra; Henaut and Danchin, Escherichia coli and Salmonella, Neidhardt, et al. (eds.), ASM Press, Washington D.C., [1996], pp. 2047-2066. Source of data for obtaining codon usage can rely on any available nucleotide sequence capable of encoding a protein. These data sets include nucleic acid sequences that are known to actually encode expressed proteins (e.g. complete protein coding sequences - CDS), expressed sequence tags (ESTS) or predicted coding regions of genomic sequences (see, for example, Uberbacher, Meth. Enzymol., 266:259-281 [1996]; Tiwari et al., Comput. Appl. Biosci., 13:263-270 [1997]).
- 4 043748- 4 043748
Как используют в настоящем описании, управляющую последовательность определяют в настоящем описании как включающую все компоненты, которые необходимы или благоприятны для экспрессии полинуклеотида и/или полипептида по настоящему изобретению, каждая управляющая последовательность может быть нативной или чужеродной для полинуклеотида, представляющего интерес. Такие управляющие последовательности включают, но не ограничиваясь этим, лидерную последовательность, последовательность полиаденилирования, пропептидную последовательность, промотор, последовательность сигнального пептида и терминатор транскрипции.As used herein, a control sequence is defined herein to include all components that are necessary or beneficial for expression of the polynucleotide and/or polypeptide of the present invention, each control sequence being native or foreign to the polynucleotide of interest. Such control sequences include, but are not limited to, a leader sequence, a polyadenylation sequence, a propeptide sequence, a promoter, a signal peptide sequence, and a transcription terminator.
Как используют в настоящем описании, функционально связанную определяют в настоящем описании как конфигурацию, в которой управляющую последовательность надлежащим образом размещают (т.е. в функциональной связи) в положении относительно полинуклеотида, представляющего интерес, так что управляющая последовательность управляет или регулирует экспрессию полинуклеотида и/или полипептида, представляющего интерес.As used herein, operably linked is defined herein as a configuration in which a control sequence is suitably placed (i.e., operably linked) at a position relative to the polynucleotide of interest such that the control sequence controls or regulates expression of the polynucleotide and/or or a polypeptide of interest.
Как используют в настоящем описании, промоторная последовательность относится к последовательности нуклеиновой кислоты, которую распознает клетка-хозяин для экспрессии полинуклеотида, представляющего интерес, такого как кодирующая последовательность. Управляющая последовательность может содержать подходящую промоторную последовательность. Промоторная последовательность содержит транскрипционные управляющие последовательности, которые опосредуют экспрессию полинуклеотида, представляющего интерес. Промотор может представлять собой любую последовательность нуклеиновой кислоты, которая демонстрирует транскрипционную активность в клетке-хозяине, предпочтительно включая мутантные, усеченные и гибридные промоторы, и которую можно получать из генов, кодирующих внеклеточные или внутриклеточные полипептиды, гомологичные или гетерологичные для клетки-хозяина.As used herein, a promoter sequence refers to a nucleic acid sequence that is recognized by a host cell for expression of a polynucleotide of interest, such as a coding sequence. The control sequence may comprise a suitable promoter sequence. The promoter sequence contains transcriptional control sequences that mediate expression of the polynucleotide of interest. A promoter can be any nucleic acid sequence that exhibits transcriptional activity in a host cell, preferably including mutant, truncated, and hybrid promoters, and that can be derived from genes encoding extracellular or intracellular polypeptides homologous or heterologous to the host cell.
Как используют в настоящем описании, встречаемая в природе или дикого типа относится к форме, которую находят в природе. Например, встречаемые в природе или дикого типа полипептид или полинуклеотидная последовательность представляет собой последовательность, присутствующую в организме, которую можно из источника в природе и которую человек не модифицировал целенаправленно с помощью манипуляций.As used herein, naturally occurring or wild type refers to the form that is found in nature. For example, a naturally occurring or wild-type polypeptide or polynucleotide sequence is a sequence present in an organism that can be derived from a source in nature and that has not been purposefully modified by human manipulation.
Как используют в настоящем описании, не встречаемый в природе, сконструированный и рекомбинантный, когда используют в настоящем раскрытии со ссылкой на (например, клетку, нуклеиновую кислоту или полипептид), относится к материалу, или материалу, соответствующему природной или нативной форме материала, который модифицирован таким образом, который иначе не существовал бы в природе. В некоторых вариантах осуществления материал является идентичным встречаемому в природе материалу, но его получают или создают из синтетических материалов и/или посредством манипуляции с использованием рекомбинантных способов. Неограничивающие примеры включают, среди прочих, рекомбинантные клетки, экспрессирующие гены, которые не встречаются в нативной (не рекомбинантной) форме клетки, или экспрессирующие нативные гены, которые иначе экспрессируются на другом уровне.As used herein, non-naturally occurring, engineered, and recombinant, when used in this disclosure with reference to (e.g., a cell, nucleic acid, or polypeptide), refers to a material, or material corresponding to a natural or native form of the material, that is modified in a way that would not otherwise exist in nature. In some embodiments, the material is identical to a naturally occurring material, but is produced or created from synthetic materials and/or through manipulation using recombinant methods. Non-limiting examples include, but are not limited to, recombinant cells expressing genes that are not found in the native (non-recombinant) form of the cell, or expressing native genes that are otherwise expressed at a different level.
Как используют в настоящем описании, процентная доля идентичности последовательностей, процент идентичности и процент идентичных относятся к сравнению между полинуклеотидными последовательностями или полипептидными последовательностями, и их определяют посредством сравнения двух оптимально выровненных последовательностей в окне сравнения, где часть полинуклеотидной или полипептидной последовательности в окне сравнения может содержать добавления или делеции (т.е. пропуски) по сравнению с эталонной последовательностью для оптимального выравнивания двух последовательностей. Процентную долю вычисляют посредством определения числа положений, в которых встречаются идентичные основания нуклеиновых кислот или аминокислотные остатки в обеих последовательностях, или основание нуклеиновой кислоты или аминокислотный остаток выравнивают с пропуском, чтобы получать число совпадающих положений, и делят число совпадающих положений на общее число положений в окне сравнения и умножают результат на 100, чтобы получать процентную долю идентичности последовательностей. Определение оптимального выравнивания и процента идентичности последовательностей осуществляют с использованием алгоритмов BLAST и BLAST 2.0 (см., например, Altschul et al., J. Mol. Biol. 215:403-410 [1990]; и Altschul et al., Nucl. Acids Res. 3389-3402 [1977]). Программное обеспечение для осуществления анализа BLAST общедоступно через веб-сайт National Center for Biotechnology Information.As used herein, percent sequence identity, percent identity, and percent identical refer to a comparison between polynucleotide sequences or polypeptide sequences and are determined by comparing two optimally aligned sequences in a comparison window, wherein a portion of the polynucleotide or polypeptide sequence in the comparison window may contain additions or deletions (i.e., omissions) compared to a reference sequence to optimally align two sequences. The percentage is calculated by determining the number of positions at which identical nucleic acid bases or amino acid residues occur in both sequences, or aligning the nucleic acid base or amino acid residue with a gap to obtain the number of matching positions, and dividing the number of matching positions by the total number of positions in the window comparisons and multiply the result by 100 to obtain the percentage sequence identity. Determination of optimal alignment and percent sequence identity is performed using the BLAST and BLAST 2.0 algorithms (see, for example, Altschul et al., J. Mol. Biol. 215:403-410 [1990]; and Altschul et al., Nucl. Acids Res. 3389-3402 [1977]). Software for performing BLAST analysis is publicly available through the National Center for Biotechnology Information website.
В кратком изложении, анализ BLAST включает сначала идентификацию пар последовательностей с высокими оценками (HSP) посредством идентификации коротких слов длины W в запросной последовательности, которые или совпадают или отвечают определенному порогу оценки с положительным значением Т, когда выравнивают со словом той же длины в последовательности из базы данных. Т обозначают как порог оценки соседних слов (Altschul et al., выше). Эти начальные совпадения соседних слов действуют в качестве затравок для инициации поиска для того, чтобы находить более длинные HSP, содержащие их. Затем совпадения слов расширяют в обоих направлениях вдоль каждой последовательности до тех пор, пока можно увеличивать кумулятивную оценку выравнивания. Кумулятивные оценки вычисляют с использованием, для нуклеотидных последовательностей, параметров М (награда за пару совпаBriefly, BLAST analysis involves first identifying high scoring sequence pairs (HSPs) by identifying short words of length W in the query sequence that either match or meet a certain score threshold with a positive T value when aligned with a word of the same length in the sequence Database. T is designated as the threshold for judging adjacent words (Altschul et al., supra). These initial matches of neighboring words act as seeds to initiate searches to find longer HSPs containing them. Word matches are then expanded in both directions along each sequence as long as the cumulative alignment score can be increased. Cumulative scores are calculated using, for nucleotide sequences, parameters M (reward per matching pair
- 5 043748 дающих остатков; всегда >0) и N (штраф за несовпадающие остатки; всегда <0). Для аминокислотных последовательностей матрицу замен используют для того, чтобы вычислять кумулятивную оценку. Расширение совпадений слов в каждом направлении останавливают, когда: кумулятивная оценка выравнивания снижается на количество X от ее максимального достигнутого значения; кумулятивная оценка снижается до нуля или ниже, из-за накопления одного или нескольких выравниваний остатков с отрицательными оценками; или достигают конца любой из последовательностей. Параметры алгоритма BLAST W, Т и X определяют чувствительность и скорость выравнивания. В программе BLASTN (для нуклеотидных последовательностей) используют по умолчанию длину слова (W) 11, ожидание (Е) 10, М=5, N=4 и сравнение обеих нитей. Для аминокислотных последовательностей, в программе BLASTP используют по умолчанию длину слова (W) 3, ожидание (Е) 10 и матрицу замен BLOSUM62 (см., например, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989]).- 5 043748 giving remainders; always >0) and N (penalty for mismatched balances; always <0). For amino acid sequences, a substitution matrix is used to calculate a cumulative score. Expansion of word matches in each direction is stopped when: the cumulative alignment score is reduced by an amount X from its maximum value achieved; the cumulative score is reduced to zero or lower due to the accumulation of one or more residual alignments with negative scores; or reach the end of any of the sequences. The BLAST algorithm parameters W, T and X determine the sensitivity and speed of alignment. The BLASTN program (for nucleotide sequences) uses a default word length (W) of 11, expectation (E) of 10, M=5, N=4, and comparison of both strands. For amino acid sequences, BLASTP defaults to a word length (W) of 3, an expectation (E) of 10, and a BLOSUM62 substitution matrix (see, for example, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989 ]).
В данной области доступны и известны многие другие алгоритмы, которые функционируют аналогично BLAST, предоставляя процент идентичности для двух последовательностей. Оптимальное выравнивание последовательностей для сравнения можно проводить с использованием любого подходящего известного в данной области способа (например, с помощью алгоритма локальной гомологии Smith и Waterman, Adv. Appl. Math. 2:482 [1981]; с помощью алгоритма выравнивания по гомологии Needleman и Wunsch, J. Mol. Biol. 48:443 [1970]; с помощью способа поиска сходства Pearson и Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]; и/или с помощью компьютерных реализаций этих алгоритмов [GAP, BESTFIT, FASTA и TFASTA в GCG Wisconsin Software Package]), или путем визуального просмотра, используя способы, общеизвестные в данной области. Дополнительно, при определении выравнивания последовательностей и процента идентичности последовательностей можно использовать программы BESTFIT или GAP в GCG Wisconsin Software Package (Accelrys, Madison WI), используя предусмотренные параметры по умолчанию.Many other algorithms are available and known in the art that function similarly to BLAST by providing percent identity between two sequences. Optimal alignment of sequences for comparison can be performed using any suitable method known in the art (eg, using the local homology algorithm of Smith and Waterman, Adv. Appl. Math. 2:482 [1981]; using the homology alignment algorithm of Needleman and Wunsch , J. Mol. Biol. 48:443 [1970]; using the similarity search method of Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]; and/or using computer implementations of these algorithms [GAP , BESTFIT, FASTA and TFASTA in the GCG Wisconsin Software Package]), or by visual inspection using methods well known in the art. Additionally, the BESTFIT or GAP programs in the GCG Wisconsin Software Package (Accelrys, Madison WI) can be used to determine sequence alignment and percent sequence identity using the default parameters provided.
Как используют в настоящем описании, существенная идентичность относится к полинуклеотидной или полипептидной последовательности, которая обладает по меньшей мере 80% идентичности последовательностей, по меньшей мере 85% идентичности и 89-95% идентичности последовательностей, более обычно по меньшей мере 99% идентичности последовательностей по сравнению с эталонной последовательностью в окне сравнения по меньшей мере в 20 положений остатков, часто в окне по меньшей мере 30-50 остатков, где процентную долю идентичности последовательностей вычисляют посредством сравнения эталонной последовательности с последовательностью, которая содержит делеции или добавления, которые составляют 20% или меньше от эталонной последовательности в окне сравнения. В конкретных вариантах осуществления, применяемых к полипептидам, термин существенная идентичность обозначает, что две полипептидные последовательности, когда выровнены оптимально, например, с помощью программ GAP или BESTFIT с использованием весов пропусков по умолчанию, имеют по меньшей мере 80% идентичности последовательностей, предпочтительно по меньшей мере 89% идентичности последовательностей, по меньшей мере 95% идентичности последовательностей или больше (например, 99% идентичности последовательностей). В некоторых предпочтительных вариантах осуществления положения остатков, которые не идентичны, отличаются консервативными аминокислотными заменами.As used herein, substantial identity refers to a polynucleotide or polypeptide sequence that has at least 80% sequence identity, at least 85% sequence identity and 89-95% sequence identity, more typically at least 99% sequence identity compared to with the reference sequence in a comparison window of at least 20 residue positions, often in a window of at least 30-50 residues, where the percentage of sequence identity is calculated by comparing the reference sequence with a sequence that contains deletions or additions that are 20% or less from the reference sequence in the comparison window. In specific embodiments, as applied to polypeptides, the term substantial identity means that two polypeptide sequences, when optimally aligned, e.g., using the GAP or BESTFIT programs using default gap weights, have at least 80% sequence identity, preferably at least at least 89% sequence identity, at least 95% sequence identity, or greater (eg, 99% sequence identity). In some preferred embodiments, residue positions that are not identical are distinguished by conservative amino acid substitutions.
Как используют в настоящем описании, эталонная последовательность относится к определенной последовательности, с которой сравнивают другую последовательность. Эталонная последовательность может представлять собой подмножество более крупной последовательности, например, сегмент полноразмерной последовательности гена или полипептида. В целом, эталонная последовательность составляет по меньшей мере 20 нуклеотидных или аминокислотных остатков в длину, по меньшей мере 25 остатков в длину, по меньшей мере 50 остатков в длину или полную длину нуклеиновой кислоты или полипептида. Поскольку каждый из двух полинуклеотидов или полипептидов может (1) содержать последовательность (т.е. часть полной последовательности), которая схожа между двумя последовательностями, и (2) дополнительно содержать последовательность, которая расходится между двумя последовательностями, сравнение последовательностей между двумя (или больше) полинуклеотидами или полипептидами обычно осуществляют посредством сравнения последовательностей двух полинуклеотидов в окне сравнения для того, чтобы идентифицировать и сравнивать локальные области сходства последовательностей. Термин эталонная последовательность не предназначен для ограничения последовательностями дикого типа, и может включать сконструированные или измененные последовательности. Например, в некоторых вариантах осуществления эталонная последовательность может представлять собой предварительно сконструированную или измененную аминокислотную последовательность.As used herein, a reference sequence refers to a specific sequence to which another sequence is compared. The reference sequence may be a subset of a larger sequence, such as a segment of the full-length sequence of a gene or polypeptide. In general, the reference sequence is at least 20 nucleotide or amino acid residues in length, at least 25 residues in length, at least 50 residues in length, or the entire length of a nucleic acid or polypeptide. Because each of two polynucleotides or polypeptides may (1) contain a sequence (i.e., part of the complete sequence) that is similar between the two sequences, and (2) additionally contain a sequence that is divergent between the two sequences, comparison of the sequences between the two (or more ) polynucleotides or polypeptides are typically performed by comparing the sequences of two polynucleotides in a comparison window in order to identify and compare local regions of sequence similarity. The term reference sequence is not intended to be limited to wild-type sequences, and may include engineered or altered sequences. For example, in some embodiments, the reference sequence may be a pre-designed or modified amino acid sequence.
Как используют в настоящем описании, окно сравнения относится к умозрительному сегменту из по меньшей мере приблизительно 20 непрерывных нуклеотидных положений или аминокислотных остатков, в котором последовательность можно сравнивать с эталонной последовательностью из по меньшей мере 20 непрерывных нуклеотидов или аминокислот и где часть последовательности в окне сравнения может содержать добавления или делеции (т.е. пропуски) в 20% или меньше по сравнению с эталонной последовательностью (которая не содержит добавления или делеции) для оптимального выравнивания двух последовательностей. Окно сравнения может быть длиннее 20 непрерывных остатков и необяAs used herein, a comparison window refers to a speculative segment of at least about 20 contiguous nucleotide positions or amino acid residues in which the sequence can be compared to a reference sequence of at least 20 contiguous nucleotides or amino acid residues and where a portion of the sequence in the comparison window can contain additions or deletions (i.e., gaps) of 20% or less compared to the reference sequence (which does not contain additions or deletions) for optimal alignment of the two sequences. The comparison window may be longer than 20 continuous residues and may not
- 6 043748 зательно включает 30, 40, 50, 100 или более длинные окна.- 6 043748 optionally includes 30, 40, 50, 100 or longer windows.
Как используют в настоящем описании, соответствующий, в отношении и относительно, когда используют в контексте нумерации данной аминокислотной или полинуклеотидной последовательности, относится к нумерации остатков конкретной эталонной последовательности, когда данную аминокислотную или полинуклеотидную последовательность сравнивают с эталонной последовательностью. Другими словами, номер остатка или положение остатка в данном полимере обозначают относительно эталонной последовательности, а не по фактическому нумерационному положению остатка в данной аминокислотной или полинуклеотидной последовательности. Например, заданную аминокислотную последовательность, такую как ту, что у сконструированной PGA, можно выравнивать с эталонной последовательностью посредством введения пропусков для того, чтобы оптимизировать совпадения остатков между двумя последовательностями. В этих случаях, несмотря на то, что присутствуют пропуски, нумерацию остатка в заданной аминокислотной или полинуклеотидной последовательности выполняют относительно эталонной последовательности, с которой ее выровняли. Как используют в настоящем описании, упоминание о положении остатка, таком как Xn, как дополнительно описано далее, следует толковать как указание на соответствующий остаток, пока конкретно не указано иное. Таким образом, например, Х94 относится к любой аминокислоте в положении 94 в полипептидной последовательности.As used herein, corresponding, in relation to, and relative to, when used in the context of numbering a given amino acid or polynucleotide sequence, refers to the numbering of residues of a particular reference sequence when a given amino acid or polynucleotide sequence is compared to a reference sequence. In other words, the residue number or position of a residue in a given polymer is designated relative to a reference sequence and not by the actual numbering position of the residue in a given amino acid or polynucleotide sequence. For example, a given amino acid sequence, such as that of a designed PGA, can be aligned to a reference sequence by introducing gaps in order to optimize residue matches between the two sequences. In these cases, although gaps are present, the residue numbering in a given amino acid or polynucleotide sequence is relative to the reference sequence to which it is aligned. As used herein, reference to a residue position such as Xn, as further described below, should be interpreted as indicating the corresponding residue unless specifically stated otherwise. Thus, for example, X94 refers to any amino acid at position 94 in the polypeptide sequence.
Как используют в настоящем описании, усовершенствованное свойство фермента относится к PGA, которая проявляет усовершенствование любого свойства фермента по сравнению с эталонной PGA. Для сконструированных полипептидов PGA, описанных в настоящем описании, сравнение в целом выполняют с ферментом PGA дикого типа, несмотря на то, что в некоторых вариантах осуществления эталонной PGA может быть другая усовершенствованная сконструированная PGA. Свойства фермента, для которых усовершенствование желательно, включают, но не ограничиваясь этим, ферментативную активность (которую можно выражать в единицах процентов превращения субстрата за конкретное время реакции с использованием конкретного количества PGA), хемоселективность, тепловую стабильность, стабильность в растворителе, рН профиль активности, требования к кофакторам, стойкость к ингибиторам (например, ингибирование продуктом), стереоспецифичность и стереоселективность (включая энантиоселективность).As used herein, an improved enzyme property refers to a PGA that exhibits an improvement in any enzyme property compared to a reference PGA. For the engineered PGA polypeptides described herein, comparisons are generally made with the wild-type PGA enzyme, although in some embodiments the reference PGA may be another improved engineered PGA. Enzyme properties for which improvement is desirable include, but are not limited to, enzymatic activity (which can be expressed in units of percent substrate conversion over a specific reaction time using a specific amount of PGA), chemoselectivity, thermal stability, solvent stability, pH profile of activity, cofactor requirements, inhibitor resistance (e.g., product inhibition), stereospecificity, and stereoselectivity (including enantioselectivity).
Как используют в настоящем описании, увеличенная ферментативная активность относится к усовершенствованному свойству сконструированных полипептидов PGA, которую может представлять увеличение удельной активности (например, получаемый продукт/время/масса белка) или увеличение процента превращения субстрата в продукт (например, процент превращения начального количества субстрата в продукт за конкретный период времени с использованием конкретного количества PGA) по сравнению с эталонным ферментом PGA. Образцовые способы определения активности фермента приведены в примерах. Можно влиять на любое свойство, относящееся к активности фермента, включая классические свойства фермента Km, Vmax или kcat, изменения которых могут вести к увеличенной ферментативной активности. Усовершенствование активности фермента может составлять приблизительно от 1,5 крат ферментативной активности соответствующего фермента PGA дикого типа, до 2 крат, 5 крат, 10 крат, 20 крат, 25 крат, 50 крат, 75 крат, 100 крат или больше ферментативной активности относительно встречаемой в природе PGA или другой сконструированной PGA, из которой получали полипептиды PGA. В конкретных вариантах осуществления, сконструированный фермент PGA проявляет усовершенствованную ферментативную активность в диапазоне от 1,5 до 50 раз, от 1,5 до 100 раз более чем та, что у родительского фермента PGA. Специалист в данной области поймет, что активность любого фермента ограничена диффузией так, что скорость каталитического оборота не может превышать скорости диффузии субстрата, включая любые необходимые кофакторы. Теоретический максимум предела диффузии, или kcat/Km, в целом составляет приблизительно от 108 до 109 (М-1 с-1). Таким образом, любые усовершенствования активности фермента PGA будут иметь верхний предел, связанный со скоростью диффузии субстратов, на которые действует фермент PGA. Активность PGA можно измерять с помощью любого одного из стандартных анализов, используемых для измерения высвобождения фенилуксусной кислоты при расщеплении пенициллина G, например, посредством титрования (см., например, Simons and Gibson, Biotechnol. Tech.,13:365-367 [1999]). В некоторых вариантах осуществления активность PGA можно измерять с использованием 6-нитрофенилацетамидобензойной кислоты (NIPAB), продукт расщепления которой 5-амино-2-нитробензойная кислота поддается обнаружению спектрофотометрически (λmax=405 нм). Сравнение активностей ферментов выполняют с использованием определенного препарата фермента, определенного анализа при определенных условиях и одного или нескольких определенных субстратов, как дополнительно описано подробно в настоящем описании. В целом, когда сравнивают лизаты, определяют число клеток и количество анализируемого белка, а также использование идентичных экспрессирующих систем и идентичных клеток-хозяев для того, чтобы минимизировать вариации в количестве фермента, продуцируемого клетками-хозяевами и присутствующего в лизатах.As used herein, increased enzymatic activity refers to an improved property of engineered PGA polypeptides, which may represent an increase in specific activity (e.g., product produced/time/weight of protein) or an increase in the percentage of substrate converted to product (e.g., the percentage of initial amount of substrate converted to product over a specific period of time using a specific amount of PGA) compared to a reference PGA enzyme. Exemplary methods for determining enzyme activity are given in the examples. Any property related to enzyme activity can be influenced, including the classical enzyme properties Km, V max or kc at , changes in which can lead to increased enzymatic activity. The improvement in enzyme activity can range from approximately 1.5 times the enzymatic activity of the corresponding wild-type PGA enzyme, up to 2 times, 5 times, 10 times, 20 times, 25 times, 50 times, 75 times, 100 times or more enzyme activity relative to that found in the nature of PGA or other engineered PGA from which PGA polypeptides were derived. In specific embodiments, the engineered PGA enzyme exhibits improved enzymatic activity ranging from 1.5 to 50 times, 1.5 to 100 times greater than that of the parent PGA enzyme. One skilled in the art will appreciate that the activity of any enzyme is diffusion limited such that the rate of catalytic turnover cannot exceed the rate of diffusion of the substrate, including any required cofactors. The theoretical maximum diffusion limit, or kcat/Km, is generally approximately 10 8 to 109 (M -1 s -1 ). Thus, any improvements in PGA enzyme activity will have an upper limit related to the rate of diffusion of the substrates on which the PGA enzyme acts. PGA activity can be measured using any one of the standard assays used to measure the release of phenylacetic acid from the breakdown of penicillin G, for example, by titration (see, for example, Simons and Gibson, Biotechnol. Tech., 13:365-367 [1999] ). In some embodiments, PGA activity can be measured using 6-nitrophenylacetamidobenzoic acid (NIPAB), the cleavage product of which 5-amino-2-nitrobenzoic acid is detectable spectrophotometrically (λ max =405 nm). Comparisons of enzyme activities are performed using a specific enzyme preparation, a specific assay under specific conditions, and one or more specific substrates, as further described in detail herein. In general, when lysates are compared, the number of cells and the amount of protein analyzed are determined, as is the use of identical expression systems and identical host cells in order to minimize variations in the amount of enzyme produced by the host cells and present in the lysates.
Как используют в настоящем описании, увеличенная ферментативная активность и увеличенная активность относятся к усовершенствованному свойству сконструированного фермента, которое может быть представлено увеличением удельной активности (например, получаемый продукт/время/масса белAs used herein, increased enzyme activity and increased activity refer to an improved property of the engineered enzyme, which may be represented by an increase in specific activity (e.g., product/time/weight of protein
- 7 043748 ка) или увеличением процента превращения субстрата в продукт (например, процент превращения начального количества субстрата в продукт за конкретный период времени с использованием конкретного количества PGA) по сравнению с эталонным ферментом, как раскрыто в настоящем описании. Можно влиять на любое свойство, относящееся к активности фермента, включая классические свойства фермента Km, Vmax или kcat, изменения которых могут вести к увеличенной ферментативной активности. В некоторых вариантах осуществления ферменты PGA, предусмотренные в настоящем описании, высвобождают инсулин посредством удаления трифенилацетатных защитных групп с конкретных остатков в инсулине. Сравнение активностей ферментов выполняют с использованием определенного препарата фермента, определенного анализа при определенных условиях и одного или нескольких определенных субстратов, как дополнительно описано подробно в настоящем описании. В целом, когда сравнивают ферменты в клеточных лизатах, определяют число клеток и количество анализируемого белка, а также использование идентичных экспрессирующих систем и идентичных клеток-хозяев для того, чтобы минимизировать вариации в количестве фермента, продуцируемого клетками-хозяевами и присутствующего в лизатах.- 7 043748 ka) or an increase in the percentage conversion of substrate to product (eg, the percentage conversion of an initial amount of substrate to product over a specific period of time using a specific amount of PGA) compared to a reference enzyme as disclosed herein. Any property related to enzyme activity can be influenced, including the classical enzyme properties Km, V max or k cat , changes in which can lead to increased enzymatic activity. In some embodiments, PGA enzymes provided herein release insulin by removing triphenylacetate protecting groups from specific residues in insulin. Comparisons of enzyme activities are performed using a specific enzyme preparation, a specific assay under specific conditions, and one or more specific substrates, as further described in detail herein. In general, when enzymes in cell lysates are compared, the number of cells and the amount of protein analyzed are determined, as is the use of identical expression systems and identical host cells to minimize variation in the amount of enzyme produced by the host cells and present in the lysates.
Как используют в настоящем описании, превращение относится к ферментативному превращению субстрата в соответствующий продукт.As used herein, conversion refers to the enzymatic conversion of a substrate to the corresponding product.
Как используют в настоящем описании, процент превращения относится к проценту субстрата, который превращают в продукт за определенный период времени в конкретных условиях. Таким образом, например, ферментативную активность или активность полипептида PGA можно выражать в виде процента превращения субстрата в продукт.As used herein, percentage conversion refers to the percentage of substrate that is converted to product over a given period of time under specific conditions. Thus, for example, the enzymatic activity or activity of a PGA polypeptide can be expressed as the percentage of substrate to product conversion.
Как используют в настоящем описании, хемоселективность относится к предпочтительному образованию в химической или ферментативной реакции одного продукта относительно других.As used herein, chemoselectivity refers to the preferential formation of one product relative to others in a chemical or enzymatic reaction.
Как используют в настоящем описании, термостабильный используют, чтобы отослать к полипептиду, который устойчив к инактивации под воздействием набора температурных условий (например, 40-80°С) в течение определенного периода времени (например, 0,5-24 ч), по сравнению с необработанным ферментом, таким образом сохраняя определенный уровень остаточной активности (например, более чем 60-80%) после воздействия повышенных температур.As used herein, thermostable is used to refer to a polypeptide that is resistant to inactivation when exposed to a set of temperature conditions (eg, 40-80°C) over a specified period of time (eg, 0.5-24 hours), versus with untreated enzyme, thus maintaining a certain level of residual activity (eg, more than 60-80%) after exposure to elevated temperatures.
Как используют в настоящем описании, стабильный в растворителе относится к способности полипептида поддерживать схожую активность (например, более чем, например, 60-80%) после воздействия различных концентраций (например, 5-99%) растворителя (например, изопропилового спирта, тетрагидрофурана, 2-метилтетрагидрофурана, ацетона, толуола, бутилацетата, трет-бутилметилового эфира и т.д.) в течение определенного периода времени (например, 0,5-24 ч) по сравнению с необработанным ферментом.As used herein, solvent stable refers to the ability of a polypeptide to maintain similar activity (e.g., greater than, e.g., 60-80%) after exposure to varying concentrations (e.g., 5-99%) of solvent (e.g., isopropyl alcohol, tetrahydrofuran, 2-methyltetrahydrofuran, acetone, toluene, butyl acetate, tert-butyl methyl ether, etc.) for a certain period of time (for example, 0.5-24 hours) compared to untreated enzyme.
Как используют в настоящем описании, рН стабильный относится к полипептиду PGA, который сохраняет схожую активность (например, более чем 60-80%) после воздействия высокого или низкого рН (например, 4,5-6 или 8-12) в течение определенного периода времени (например, 0,5-24 ч) по сравнению с необработанным ферментом.As used herein, pH stable refers to a PGA polypeptide that retains similar activity (e.g., greater than 60-80%) after exposure to high or low pH (e.g., 4.5-6 or 8-12) for a specified period time (eg 0.5-24 hours) compared to untreated enzyme.
Как используют в настоящем описании, термостабильный и стабильный в растворителе относится к полипептиду PGA, который и термостабилен и стабилен в растворителе.As used herein, heat-stable and solvent-stable refers to a PGA polypeptide that is both heat-stable and solvent-stable.
Как используют в настоящем описании, гидрофильная аминокислота или остаток относится к аминокислоте или остатку, имеющим боковую цепь, проявляющую гидрофобность меньше нуля в соответствии с нормализованной консенсусной шкалой гидрофобности по Eisenberg et al., (Eisenberg et al., J. Mol. Biol., 179:125-142 [1984]). Генетически кодируемые гидрофильные аминокислоты включают L-Thr (T), L-Ser (S), L-His (H), L-Glu (E), L-Asn (N), L-Gln (Q), L-Asp (D), L-Lys (K) и L-Arg (R).As used herein, a hydrophilic amino acid or residue refers to an amino acid or residue having a side chain exhibiting hydrophobicity less than zero according to the normalized consensus hydrophobicity scale of Eisenberg et al., (Eisenberg et al., J. Mol. Biol., 179:125-142 [1984]). Genetically encoded hydrophilic amino acids include L-Thr (T), L-Ser (S), L-His (H), L-Glu (E), L-Asn (N), L-Gln (Q), L-Asp (D), L-Lys (K) and L-Arg (R).
Как используют в настоящем описании, кислая аминокислота или остаток относится к гидрофильной аминокислоте или остатку, имеющим боковую цепь, проявляющую значение рК меньше приблизительно 6, когда аминокислота входит в пептид или полипептид. Кислые аминокислоты обычно имеют отрицательно заряженные боковые цепи при физиологическом рН из-за утраты иона водорода. Генетически кодируемые кислые аминокислоты включают L-Glu (E) и L-Asp (D).As used herein, an acidic amino acid or residue refers to a hydrophilic amino acid or residue having a side chain exhibiting a pK value of less than about 6 when the amino acid is included in a peptide or polypeptide. Acidic amino acids typically have negatively charged side chains at physiological pH due to the loss of a hydrogen ion. Genetically encoded acidic amino acids include L-Glu (E) and L-Asp (D).
Как используют в настоящем описании, основная аминокислота или остаток относится к гидрофильным аминокислоте или остатку, имеющим боковую цепь, проявляющую значение рК более приблизительно 6, когда аминокислота входит в пептид или полипептид. Основные аминокислоты обычно имеют положительно заряженные боковые цепи при физиологическом рН из-за ассоциации с ионом гидрония. Генетически кодируемые основные аминокислоты включают L-Arg (R) и L-Lys (K).As used herein, a basic amino acid or residue refers to a hydrophilic amino acid or residue having a side chain exhibiting a pK value greater than about 6 when the amino acid is included in a peptide or polypeptide. Basic amino acids typically have positively charged side chains at physiological pH due to association with the hydronium ion. Genetically encoded essential amino acids include L-Arg (R) and L-Lys (K).
Как используют в настоящем описании, полярная аминокислота или остаток относится к гидрофильным аминокислоте или остатку, имеющим боковую цепь, которая не заряжена при физиологическом рН, но которая имеет по меньшей мере одну связь, в которой пара электронов, общая для двух атомов, удерживается более близко одним из атомов. Генетически кодируемые полярные аминокислоты включают L-Asn (N), L-Gln (Q), L-Ser (S) и L-Thr (T).As used herein, a polar amino acid or residue refers to a hydrophilic amino acid or residue having a side chain that is uncharged at physiological pH, but that has at least one bond in which a pair of electrons shared by two atoms is held more closely one of the atoms. Genetically encoded polar amino acids include L-Asn (N), L-Gln (Q), L-Ser (S), and L-Thr (T).
Как используют в настоящем описании, гидрофобная аминокислота или остаток относится к аминокислоте или остатку, имеющим боковая цепь, проявляющую гидрофобность более нуля в соответствии с нормализованной консенсусной шкалой гидрофобности по Eisenberg et al., (Eisenberg et al., J. Mol. Biol.,As used herein, a hydrophobic amino acid or residue refers to an amino acid or residue having a side chain exhibiting hydrophobicity greater than zero according to the normalized consensus hydrophobicity scale of Eisenberg et al., (Eisenberg et al., J. Mol. Biol.,
- 8 043748- 8 043748
179:125-142 [1984]). Генетически кодируемые гидрофобные аминокислоты включают L-Pro (P), L-Ile (I),179:125-142 [1984]). Genetically encoded hydrophobic amino acids include L-Pro (P), L-Ile (I),
L-Phe (F), L-Val (V), L-Leu (L), L-Trp (W), L-Met (M), L-Ala (А) и L-Tyr (Y).L-Phe (F), L-Val (V), L-Leu (L), L-Trp (W), L-Met (M), L-Ala (A) and L-Tyr (Y).
Как используют в настоящем описании, ароматическая аминокислота или остаток относится к гидрофильной или гидрофобной аминокислоте или остатку, имеющим боковую цепь, которая содержит по меньшей мере одно ароматическое или гетероароматическое кольцо. Генетически кодируемые ароматические аминокислоты включают L-Phe (F), L-Tyr (Y) и L-Trp (W). Несмотря на то, что вследствие рКа его гетероароматического атома азота, L-His (H) иногда классифицируют как основный остаток, или как ароматический остаток, поскольку его боковая цепь содержит гетероароматическое кольцо, в настоящем описании гистидин классифицируют как гидрофильный остаток или как конформационно затрудненный остаток (см. далее).As used herein, an aromatic amino acid or residue refers to a hydrophilic or hydrophobic amino acid or residue having a side chain that contains at least one aromatic or heteroaromatic ring. Genetically encoded aromatic amino acids include L-Phe (F), L-Tyr (Y), and L-Trp (W). Although due to the pKa of its heteroaromatic nitrogen atom, L-His(H) is sometimes classified as a basic residue, or as an aromatic residue because its side chain contains a heteroaromatic ring, herein histidine is classified as a hydrophilic residue or a conformationally hindered residue (see below).
Как используют в настоящем описании, конформационно затрудненная аминокислота или остаток относится к аминокислоте или остатку, которые имеют конформационно затрудненную геометрию. в настоящем описании конформационно затрудненные остатки включают L-Pro (P) и L-His (H). Гистидин имеет конформационно затрудненную геометрию, поскольку он имеет относительно небольшое имидазольное кольцо. Пролин имеет конформационно затрудненную геометрию, поскольку он также имеет пятичленное кольцо.As used herein, a conformationally constrained amino acid or residue refers to an amino acid or residue that has a conformationally constrained geometry. as used herein, conformationally constrained residues include L-Pro (P) and L-His (H). Histidine has a conformationally constrained geometry because it has a relatively small imidazole ring. Proline has a conformationally constrained geometry because it also has a five-membered ring.
Как используют в настоящем описании, неполярная аминокислота или остаток относится к гидрофобной аминокислоте или остатку, имеющим боковую цепь, которая не заряжена при физиологическом рН и которая имеет связи, в которых пара электронов, обычно общих для двух атомов, в целом удерживается в равной мере каждым из двух атомов (т.е. боковая цепь не является полярной). Генетически кодируемые неполярные аминокислоты включают L-Gly (G), L-Leu (L), L-Val (V), L-Ile (I), L-Met (M) и L-Ala (A).As used herein, a nonpolar amino acid or residue refers to a hydrophobic amino acid or residue having a side chain that is uncharged at physiological pH and that has bonds in which a pair of electrons typically shared by two atoms is generally held equally by each of two atoms (i.e. the side chain is not polar). Genetically encoded nonpolar amino acids include L-Gly (G), L-Leu (L), L-Val (V), L-Ile (I), L-Met (M), and L-Ala (A).
Как используют в настоящем описании, алифатическая аминокислота или остаток относится к гидрофобной аминокислоте или остатку, имеющему алифатическую углеводородную боковую цепь.As used herein, an aliphatic amino acid or residue refers to a hydrophobic amino acid or residue having an aliphatic hydrocarbon side chain.
Генетически кодируемые алифатические аминокислоты включают L-Ala (A), L-Val (V), L-Leu (L) и L-Ile (I).Genetically encoded aliphatic amino acids include L-Ala (A), L-Val (V), L-Leu (L), and L-Ile (I).
Следует отметить, что цистеин (или L-Cys или [С]) необычен в том отношении, что он может образовывать дисульфидные мостики с другими аминокислотами L-Cys (С) или другим сульфанил- или сульфгидрил-содержащими аминокислотами. Цистеинподобные остатки включают цистеин и другие аминокислоты, которые содержат сульфгидрильные фрагменты, которые доступны для формирования дисульфидных мостиков. Способность L-Cys (С) (и других аминокислот с SH-содержащими боковыми цепями) существовать в пептиде или в восстановленной форме со свободным SH или окисленной форме с дисульфидным мостиком, влияет на то, привносит ли L-Cys (С) суммарный гидрофобный или гидрофильный характер в пептид. Хотя L-Cys (С) проявляет гидрофобность 0,29 в соответствии с нормализованной консенсусной шкалой по Eisenberg (Eisenberg et al., 1984, выше), следует понимать, что для целей настоящего раскрытия L-Cys (С) относят к его собственной уникальной группе.It should be noted that cysteine (or L-Cys or [C]) is unusual in that it can form disulfide bridges with other L-Cys (C) amino acids or other sulfanyl- or sulfhydryl-containing amino acids. Cysteine-like residues include cysteine and other amino acids that contain sulfhydryl moieties that are available for the formation of disulfide bridges. The ability of L-Cys(C) (and other amino acids with SH-containing side chains) to exist in the peptide, either in a reduced form with free SH or an oxidized form with a disulfide bridge, influences whether L-Cys(C) contributes net hydrophobic or hydrophilic character in the peptide. Although L-Cys (C) exhibits a hydrophobicity of 0.29 according to the Eisenberg normalized consensus scale (Eisenberg et al., 1984, supra), it should be understood that for purposes of the present disclosure, L-Cys (C) is referred to as its own unique group.
Как используют в настоящем описании, небольшая аминокислота или остаток относится к аминокислоте или остатку, имеющим боковую цепь, которая состоит из всего трех или меньше атомов углерода и/или гетероатомов (не включая α-углерод и водороды). Малые аминокислоты или остатки дополнительно можно относить к алифатическим, неполярным, полярным или кислым небольшим аминокислотам или остатками, в соответствии с вышеприведенными определениями. Генетически кодируемые небольшие аминокислоты включают L-Ala (A), L-Val (V), L-Cys (С), L-Asn (N), L-Ser (S), L-Thr (T) и L-Asp (D).As used herein, a small amino acid or residue refers to an amino acid or residue having a side chain that consists of only three or fewer carbon atoms and/or heteroatoms (not including α-carbon and hydrogens). Small amino acids or residues can further be referred to as aliphatic, non-polar, polar or acidic small amino acids or residues, in accordance with the above definitions. Genetically encoded small amino acids include L-Ala (A), L-Val (V), L-Cys (C), L-Asn (N), L-Ser (S), L-Thr (T) and L-Asp (D).
Как используют в настоящем описании, гидроксилсодержащая аминокислота или остаток относится к аминокислоте, содержащей гидроксильный (-ОН) фрагмент.As used herein, a hydroxyl-containing amino acid or residue refers to an amino acid containing a hydroxyl (-OH) moiety.
Генетически кодируемые гидроксилсодержащие аминокислоты включают L-Ser (S) L-Thr (T) и LTyr (Y).Genetically encoded hydroxyl-containing amino acids include L-Ser (S), L-Thr (T), and LTyr (Y).
Как используют в настоящем описании, различие аминокислот и различие остатков относится к различию аминокислотного остатка в определенном положении полипептидной последовательности относительно аминокислотного остатка в соответствующем положении в эталонной последовательности. Положения различных аминокислот в целом обозначают в настоящем описании как Хп, где п относится к соответствующему положению в эталонной последовательности, на которой основано отличие остатков. Например, различие остатков в положении Х40 по сравнению с SEQ ID № 2 относится к отличию аминокислотного остатка в положении полипептида, соответствующем положению 40 в SEQ ID № 2. Таким образом, если эталонный полипептид из SEQ ID № 2 имеет гистидин в положении 40, то различие остатков в положении Х40 по сравнению с SEQ ID № 2 относится к замене аминокислоты любым остатком, отличным от гистидина, в положении полипептида, соответствующем положению 40 в SEQ ID № 2. В большинстве случаев в настоящем описании, конкретное различие аминокислотных остатков в определенном положении указывают как XnY, где Xn представляет собой конкретное соответствующее положение, как описано выше, и Y представляет собой однобуквенный идентификатор аминокислоты, встречающейся в сконструированном полипептиде (т.е. другой остаток, нежели в эталонном полипептиде). В некоторых случаях, настоящее раскрытие также предусматривает конкретные различияAs used herein, amino acid difference and residue difference refer to the difference of an amino acid residue at a particular position in a polypeptide sequence relative to an amino acid residue at a corresponding position in a reference sequence. The positions of the various amino acids are generally referred to herein as Xn, where n refers to the corresponding position in the reference sequence on which the residue difference is based. For example, the difference in residues at position X40 compared to SEQ ID No. 2 refers to the difference in amino acid residue at position of the polypeptide corresponding to position 40 in SEQ ID No. 2. Thus, if the reference polypeptide from SEQ ID No. 2 has a histidine at position 40, then a residue difference at position X40 compared to SEQ ID No. 2 refers to the replacement of an amino acid with any residue other than histidine at the position of the polypeptide corresponding to position 40 in SEQ ID No. 2. In most cases herein, a specific difference in amino acid residues at a particular position is indicated as XnY, where Xn is the specific corresponding position as described above, and Y is the one-letter identifier of the amino acid occurring in the designed polypeptide (ie, a different residue than in the reference polypeptide). In some cases, the present disclosure also makes specific distinctions
- 9 043748 аминокислот, обозначаемые стандартной записью AnB, где А представляет собой однобуквенный идентификатор остатка в эталонной последовательности, n представляет собой номер положения остатка в эталонной последовательности и В представляет собой однобуквенный идентификатор замены остатка в последовательности сконструированного полипептида. В некоторых случаях, полипептид по настоящему раскрытию может содержать одно или несколько различий аминокислотных остатков относительно эталонной последовательности, которые показывает список конкретных положений, где присутствуют различия остатков относительно эталонной последовательности. В некоторых вариантах осуществления, где можно использовать более чем одну аминокислоту в конкретном положении остатка полипептида, различные аминокислотные остатки, которые можно использовать, разделяют с помощью / (например, X192A/G). Настоящее раскрытие включает сконструированные полипептидные последовательности, содержащие одно или несколько различий аминокислот, которые включают консервативные и/или неконсервативные аминокислотные замены. Аминокислотные последовательности конкретных рекомбинантных полипептидов карбоангидразы, включенные в список последовательностей по настоящему раскрытию, содержат начальный остаток метионина (М) (т.е. М представляет положение остатка 1). Однако специалист в данной области поймет, что этот начальный остаток метионина можно удалять с помощью биологических механизмов процессинга, например, в системе трансляции в клеткехозяине или in vitro, чтобы создавать зрелый белок, не содержащий начальный остаток метионина, но в остальном сохраняющий свойства фермента. Следовательно, термин различие аминокислотных остатков относительно SEQ ID № 2 в положении Xn, как используют в настоящем описании, может относиться к положению Xn или соответствующему положению (например, положению (Х-1)п) в эталонной последовательности, которая обработана с тем, чтобы начальный метионин отсутствовал.- 9,043,748 amino acids, designated by the standard notation AnB, where A is the one-letter residue identifier in the reference sequence, n is the residue position number in the reference sequence, and B is the one-letter residue substitution identifier in the sequence of the designed polypeptide. In some cases, a polypeptide of the present disclosure may contain one or more amino acid residue differences relative to a reference sequence, which is indicated by a list of specific positions where residue differences relative to the reference sequence are present. In some embodiments, where more than one amino acid can be used at a particular residue position of the polypeptide, the different amino acid residues that can be used are separated by / (eg, X192A/G). The present disclosure includes engineered polypeptide sequences containing one or more amino acid differences that include conservative and/or non-conservative amino acid substitutions. The amino acid sequences of specific recombinant carbonic anhydrase polypeptides included in the sequence listing of the present disclosure contain an initial methionine residue (M) (ie, M represents the position of residue 1). However, one skilled in the art will appreciate that this initial methionine residue can be removed by biological processing mechanisms, such as in a host cell translation system or in vitro, to create a mature protein that does not contain the initial methionine residue but otherwise retains the properties of the enzyme. Therefore, the term amino acid residue difference relative to SEQ ID No. 2 at position Xn, as used herein, may refer to position Xn or a corresponding position (eg, position (X-1)n) in a reference sequence that is processed so that the initial methionine was absent.
Как используют в настоящем описании, фраза консервативные аминокислотные замены относится к взаимозаменяемости остатков, имеющих схожие боковые цепи, и, таким образом, обычно включает замену аминокислоты в полипептиде на аминокислоты в том же или сходно определяемом классе аминокислот. В качестве примера и не ограничения, в некоторых вариантах осуществления аминокислоту с алифатической боковой цепью заменяют на другую алифатическую аминокислоту (например, аланин, валин, лейцин и изолейцин); аминокислоту с гидроксильной боковой цепью заменяют на другую аминокислоту с гидроксильной боковой цепью (например, серин и треонин); аминокислоты, имеющие ароматические боковые цепи, заменяют на другую аминокислоту, имеющую ароматическую боковую цепь (например, фенилаланин, тирозин, триптофан и гистидин); аминокислоту с основной боковой цепью заменяют на другую аминокислоту с основной боковой цепью (например, лизин и аргинин); аминокислоту с кислой боковой цепью заменяют на другую аминокислоту с кислой боковой цепью (например, аспарагиновая кислота или глутаминовая кислота); и/или гидрофобную или гидрофильную аминокислоту заменяют на другую гидрофобную или гидрофильную аминокислоту, соответственно. Образцовые консервативные замены приведены в табл. 1.As used herein, the phrase conservative amino acid substitutions refers to the interchangeability of residues having similar side chains, and thus generally includes the replacement of an amino acid in a polypeptide with amino acids in the same or similarly defined class of amino acids. By way of example and not limitation, in some embodiments, an amino acid with an aliphatic side chain is replaced with another aliphatic amino acid (eg, alanine, valine, leucine, and isoleucine); an amino acid with a hydroxyl side chain is replaced with another amino acid with a hydroxyl side chain (eg, serine and threonine); amino acids having aromatic side chains are replaced with another amino acid having an aromatic side chain (eg, phenylalanine, tyrosine, tryptophan and histidine); an amino acid with a basic side chain is replaced with another amino acid with a basic side chain (eg, lysine and arginine); an amino acid with an acidic side chain is replaced with another amino acid with an acidic side chain (for example, aspartic acid or glutamic acid); and/or a hydrophobic or hydrophilic amino acid is replaced by another hydrophobic or hydrophilic amino acid, respectively. Exemplary conservative substitutions are given in table. 1.
Таблица 1. Образцовые консервативные аминокислотные заменыTable 1. Exemplary conservative amino acid substitutions
Как используют в настоящем описании, фраза неконсервативная замена относится к замене аминокислоты в полипептиде на аминокислоту со значительно отличающимися свойствами боковой цепи. Неконсервативные замены позволяют использовать аминокислоты между определенными группами, а не внутри них, и влияют на (а) структуру пептидного остова в области замены (например, пролин вместо глицина) (b) заряд или гидрофобность или (с) объем боковой цепи. В качестве примера и не ограничения, образцовая неконсервативная замена может представлять собой кислую аминокислоту, заменяемую на основную или алифатическую аминокислоту; ароматическую аминокислоту, заменяемую на маленькую аминокислоту; и гидрофильную аминокислоту, заменяемую на гидрофобную аминокислоту.As used herein, the phrase non-conservative substitution refers to the replacement of an amino acid in a polypeptide with an amino acid with significantly different side chain properties. Non-conservative substitutions allow the use of amino acids between certain groups rather than within them, and affect (a) the structure of the peptide backbone at the site of the substitution (e.g. proline instead of glycine) (b) charge or hydrophobicity or (c) side chain volume. By way of example and not limitation, an exemplary non-conservative substitution may be an acidic amino acid replaced by a basic or aliphatic amino acid; an aromatic amino acid replaced by a small amino acid; and a hydrophilic amino acid replaced by a hydrophobic amino acid.
Как используют в настоящем описании, делеция относится к модификации полипептида посредством удаления одной или нескольких аминокислот из эталонного полипептида. Делеции могут включать удаление 1 или больше аминокислот, 2 или больше аминокислот, 5 или больше аминокислот, 10 или больше аминокислот, 15 или больше аминокислот или 20 или больше аминокислот, вплоть до 10% от общего числа аминокислот или вплоть до 20% от общего числа аминокислот, образующих полипептид, при сохранении ферментативной активности и/или сохранении усовершенствованных свойств сконст- 10 043748 руированного фермента. Делеции могут быть направлены на внутренние части и/или концевые части полипептида. В различных вариантах осуществления делеция может содержать непрерывный сегмент или может быть прерывающейся.As used herein, deletion refers to modification of a polypeptide by removing one or more amino acids from a reference polypeptide. Deletions may include the deletion of 1 or more amino acids, 2 or more amino acids, 5 or more amino acids, 10 or more amino acids, 15 or more amino acids, or 20 or more amino acids, up to 10% of the total amino acids, or up to 20% of the total amino acids forming the polypeptide, while maintaining enzymatic activity and/or maintaining the improved properties of the constructed enzyme. Deletions may be directed to the internal portions and/or terminal portions of the polypeptide. In various embodiments, the deletion may comprise a continuous segment or may be discontinuous.
Как используют в настоящем описании, инсерция относится к модификации полипептида посредством добавления одной или нескольких аминокислот в эталонный полипептид. В некоторых вариантах осуществления усовершенствованные сконструированные ферменты PGA содержат инсерции одной или нескольких аминокислот во встречаемом в природе полипептиде PGA, а также инсерции одной или нескольких аминокислот в сконструированных полипептидах PGA. Инсерции могут находиться во внутренних частях полипептида или на карбокси- или аминоконце. Инсерции, как используют в настоящем описании, включают слитые белки как они известны в данной области. Инсерция может представлять собой непрерывный сегмент аминокислот или может быть разделена одной или несколькими аминокислотами во встречаемом в природе полипептиде.As used herein, insertion refers to modifying a polypeptide by adding one or more amino acids to a reference polypeptide. In some embodiments, the improved engineered PGA enzymes comprise insertions of one or more amino acids into a naturally occurring PGA polypeptide, as well as insertions of one or more amino acids into engineered PGA polypeptides. Insertions can be located in the internal parts of the polypeptide or at the carboxy or amino terminus. Insertions, as used herein, include fusion proteins as known in the art. The insertion may be a contiguous segment of amino acids or may be separated by one or more amino acids in a naturally occurring polypeptide.
Термин набор замен аминокислот или набор замен относится к группе замен аминокислот в полипептидной последовательности, по сравнению с эталонной последовательностью. Набор замен может иметь 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 или больше замен аминокислот. В некоторых вариантах осуществления набор замен относится к набору замен аминокислот, который присутствует в любом из вариантов PGA, перечисленных в таблицах, приведенных в примерах.The term amino acid substitution set or substitution set refers to a group of amino acid substitutions in a polypeptide sequence compared to a reference sequence. A set of substitutions may have 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 or more amino acid substitutions. In some embodiments, a substitution set refers to a set of amino acid substitutions that are present in any of the PGA variants listed in the tables provided in the examples.
Как используют в настоящем описании, фрагмент относится к полипептиду, который имеет аминоконцевую и/или карбоксиконцевую делецию, но где остальная аминокислотная последовательность идентична соответствующим положениям в последовательности. Фрагменты обычно имеют приблизительно 80%, приблизительно 90%, приблизительно 95%, приблизительно 98% или приблизительно 99% полноразмерного полипептида PGA, например, полипептида из SEQ ID № 2. В некоторых вариантах осуществления фрагмент является биологически активным (т.е. он проявляет ту же ферментативную активность, что и полноразмерная последовательность).As used herein, a fragment refers to a polypeptide that has an amino-terminal and/or carboxy-terminal deletion, but where the remaining amino acid sequence is identical to the corresponding positions in the sequence. The fragments typically have about 80%, about 90%, about 95%, about 98%, or about 99% of the full-length PGA polypeptide, such as the polypeptide of SEQ ID NO: 2. In some embodiments, the fragment is biologically active (i.e., it exhibits same enzymatic activity as the full-length sequence).
Как используют в настоящем описании, выделенный полипептид относится к полипептиду, который по существу отделяют от других контаминантов, которые в природе сопутствуют ему, например, белок, липиды и полинуклеотиды. Термин охватывает полипептиды, которые удалены из или очищены от встречаемого в природе окружения или экспрессирующей системы (например, клетка-хозяин или синтез in vitro). Усовершенствованные ферменты PGA могут присутствовать в клетке, присутствовать в клеточной среде или могут быть получены в различных формах, таких как лизаты или выделенные препараты. По существу, в некоторых вариантах осуществления сконструированные полипептиды PGA по настоящему раскрытию могут представлять собой выделенный полипептид.As used herein, an isolated polypeptide refers to a polypeptide that is substantially separated from other contaminants that naturally accompany it, such as protein, lipids, and polynucleotides. The term covers polypeptides that are removed from or purified from the naturally occurring environment or expression system (eg, host cell or in vitro synthesis). The improved PGA enzymes may be present in the cell, present in the cellular environment, or may be obtained in various forms, such as lysates or isolated preparations. As such, in some embodiments, the engineered PGA polypeptides of the present disclosure may be an isolated polypeptide.
Как используют в настоящем описании, по существу чистый полипептид относится к композиции, в которой частицы полипептида представляют собой преобладающие присутствующие частицы (т.е. на молярной или массовой основе, он является более многочисленным, чем любые другие индивидуальные макромолекулярные частицы в композиции), и в целом представляет собой в значительной степени очищенную композицию, когда рассматриваемые частицы составляют по меньшей мере приблизительно 50% присутствующих макромолекулярных частиц по молям или % массы. В целом, композиция по существу чистого сконструированного полипептида PGA содержит приблизительно 60% или больше, приблизительно 70% или больше, приблизительно 80% или больше, приблизительно 90% или больше, приблизительно 91% или больше, приблизительно 92% или больше, приблизительно 93% или больше, приблизительно 94% или больше, приблизительно 95% или больше, приблизительно 96% или больше, приблизительно 97% или больше, приблизительно 98% или больше или приблизительно 99% от всех макромолекулярных частиц по молям или % массы, присутствующих в композиции. Частицы растворителя, низкомолекулярные соединения (<500 Да) и частицы элементарных ионов не считают макромолекулярными частицами. В некоторых вариантах осуществления выделенный усовершенствованный полипептид PGA представляет собой композицию по существу чистого полипептида.As used herein, a substantially pure polypeptide refers to a composition in which the polypeptide particles are the predominant particles present (i.e., on a molar or mass basis, it is more numerous than any other individual macromolecular particles in the composition), and generally represents a substantially purified composition when the particles in question constitute at least about 50% of the macromolecular particles present by mole or % by weight. In general, the substantially pure engineered PGA polypeptide composition contains about 60% or more, about 70% or more, about 80% or more, about 90% or more, about 91% or more, about 92% or more, about 93% or more, about 94% or more, about 95% or more, about 96% or more, about 97% or more, about 98% or more, or about 99% of all macromolecular particles by moles or % by weight present in the composition. Solvent particles, low molecular weight compounds (<500 Da) and elemental ion particles are not considered macromolecular particles. In some embodiments, the isolated improved PGA polypeptide is a substantially pure polypeptide composition.
Как используют в настоящем описании, когда используют по отношению к нуклеиновой кислоте или полипептиду, термин гетерологичный относится к последовательности, которую обычно организм (например, организм дикого типа) не экспрессирует и не секретирует. В некоторых вариантах осуществления термин охватывает последовательность, которая содержит две или больше подпоследовательностей, которые не встречаются в той же связи друг с другом, как их обычно находят в природе, или является рекомбинантно сконструированной так, что ее уровень экспрессии или физическую связь с другими нуклеиновыми кислотами или другими молекулами в клетке или структуру обычно не встречают в природе. Например, гетерологичную нуклеиновую кислоту обычно получают рекомбинантно, имея две или больше последовательностей из несвязанных генов, которые устроены таким образом, который не находят в природе (например, открытая рамка считывания (ORF) нуклеиновой кислоты по изобретению функционально связана с промоторной последовательностью, вставленной в экспрессирующую кассету, такую как вектор). В некоторых вариантах осуществления гетерологичный полинуклеотид относится к любому полинуклеотиду, который вводят в клетку-хозяина с помощью лабораторных приемов и который включает полинуклеотиды, которые удаляют из клетки-хозяина, подвергаемой лабораторной манипуляции, и затем повторно вводят в клетку-хозяина.As used herein, when used in relation to a nucleic acid or polypeptide, the term heterologous refers to a sequence that an organism (eg, a wild-type organism) does not normally express or secrete. In some embodiments, the term covers a sequence that contains two or more subsequences that do not occur in the same association with each other as they are typically found in nature, or are recombinantly engineered such that its expression level or physical association with other nucleic acids or other molecules in a cell or structure not usually found in nature. For example, a heterologous nucleic acid is typically produced recombinantly, having two or more sequences from unrelated genes that are arranged in a manner not found in nature (e.g., the open reading frame (ORF) of a nucleic acid of the invention is operably linked to a promoter sequence inserted into an expression cassette such as vector). In some embodiments, a heterologous polynucleotide refers to any polynucleotide that is introduced into a host cell by laboratory techniques, and which includes polynucleotides that are removed from a host cell subjected to laboratory manipulation and then reintroduced into the host cell.
- 11 043748- 11 043748
Как используют в настоящем описании, подходящие условия реакции относятся к тем условиям в растворе биокаталитической реакции (например, диапазонам загрузки фермента, загрузки субстрата, загрузки кофакторов, температуре, рН, буферам, сорастворителям и т. д.), при которых полипептид PGA по настоящему раскрытию способен высвобождать свободный инсулин посредством удаления трифенилацетатных защитных групп. Образцовые подходящие условия реакции предусмотрены в настоящем раскрытии и проиллюстрированы примерами.As used herein, suitable reaction conditions refer to those conditions in the biocatalytic reaction solution (e.g., ranges of enzyme loading, substrate loading, cofactor loading, temperature, pH, buffers, cosolvents, etc.) under which the PGA polypeptide is presently opening is capable of releasing free insulin by removing triphenylacetate protecting groups. Exemplary suitable reaction conditions are provided in the present disclosure and are illustrated by examples.
Как используют в настоящем описании, загрузка, например, в загрузке соединения, загрузке фермента или загрузке кофактора относится к концентрации или количеству компонента в реакционной смеси в начале реакции.As used herein, loading, for example in compound loading, enzyme loading, or cofactor loading, refers to the concentration or amount of a component in the reaction mixture at the start of the reaction.
Как используют в настоящем описании, субстрат в контексте опосредованного биокатализатором процесса относится к соединению или молекуле, на которые действует биокатализатор.As used herein, substrate, in the context of a biocatalyst-mediated process, refers to the compound or molecule that is acted upon by the biocatalyst.
Как используют в настоящем описании, продукт в контексте опосредованного биокатализатором процесса относится к соединению или молекуле, являющимся результатом действия биокатализатора.As used herein, product, in the context of a biocatalyst-mediated process, refers to a compound or molecule resulting from the action of a biocatalyst.
Как используют в настоящем описании, уравновешивание, как используют в настоящем описании, относится к процессу, ведущему к равновесной концентрации химических частиц в химической или ферментативной реакции (например, взаимопревращение двух частиц А и В), включая взаимопревращение стереоизомеров, как определяют с помощью прямой константы скорости и обратной константы скорости химической или ферментативной реакции.As used herein, equilibration, as used herein, refers to the process leading to an equilibrium concentration of chemical species in a chemical or enzymatic reaction (e.g., the interconversion of two species A and B), including the interconversion of stereoisomers, as determined by a direct constant rate and inverse rate constant of a chemical or enzymatic reaction.
Как используют в настоящем описании, ацилаза и ацилтрансферазы, используют взаимозаменяемо, чтобы отослать к ферментам, которые способны к переносу ацильной группы с донора на акцептор, чтобы формировать сложные эфиры или амиды. Опосредованная ацилазой обратная реакция ведет к гидролизу сложного эфира или амида.As used herein, acylase and acyltransferases are used interchangeably to refer to enzymes that are capable of transferring an acyl group from a donor to an acceptor to form esters or amides. The acylase-mediated reverse reaction leads to hydrolysis of the ester or amide.
Как используют в настоящем описании, пенициллин G и бензилпенициллин относятся к антибиотику, также известному как (2S,5R,6R)-3,3-диметил-7-оксо-6-(2-фенилацетамидо)-4-тиа-1-азабициkло [3.2.0]гептан-2-карбоновая кислота (C16H18N2O4S). В первую очередь, он эффективен против грамположительных организмов, хотя некоторые грамотрицательные организмы также восприимчивы к нему.As used herein, penicillin G and benzylpenicillin refer to the antibiotic also known as (2S,5R,6R)-3,3-dimethyl-7-oxo-6-(2-phenylacetamido)-4-thia-1-azabicyl [3.2.0]heptane-2-carboxylic acid (C 16 H 18 N 2 O 4 S). It is primarily effective against gram-positive organisms, although some gram-negative organisms are also susceptible to it.
Как используют в настоящем описании, ацилазу пенициллина G и PGA используют взаимозаменяемо, чтобы отослать к ферменту, обладающему способностью опосредовать расщепление пенициллина G (бензилпенициллина) до фенилуксусной кислоты (РНА) и 6-аминопенициллановой кислоты (6АРА). В некоторых вариантах осуществления активность PGA может быть основана на расщеплении модельных субстратов, например, на расщеплении 6-нитро-3-(фенилацетамид)бензойной кислоты до фенилуксусной кислоты и 5-амино-2-нитробензойной кислоты. PGA также способны осуществлять обратную реакцию переноса ацильной группы с донора ацила на акцептор ацила. PGA, как обозначают в настоящем описании, включают встречаемые в природе PGA (дикого типа), а также не встречаемые в природе ферменты PGA, включающие один или несколько сконструированных полипептидов, создаваемых путем манипуляции человека. Ген PGA дикого типа представляет собой гетеродимер, состоящий из альфа-субъединицы (23,8 кДа) и бета-субъединицы (62,2 кДа), связанных спейсерной областью в 54 аминокислоты. Из-за присутствия спейсерной области, необходима стадия аутопроцессинга для того, чтобы формировать активный белок.As used herein, penicillin G acylase and PGA are used interchangeably to refer to an enzyme having the ability to mediate the cleavage of penicillin G (benzylpenicillin) to phenylacetic acid (PHA) and 6-aminopenicillanic acid (6APA). In some embodiments, PGA activity may be based on the cleavage of model substrates, for example, the cleavage of 6-nitro-3-(phenylacetamide)benzoic acid to phenylacetic acid and 5-amino-2-nitrobenzoic acid. PGAs are also capable of performing the reverse reaction of acyl group transfer from an acyl donor to an acyl acceptor. PGAs, as referred to herein, include naturally occurring PGAs (wild type) as well as non-naturally occurring PGA enzymes comprising one or more engineered polypeptides created by human manipulation. The wild-type PGA gene is a heterodimer consisting of an alpha subunit (23.8 kDa) and a beta subunit (62.2 kDa) linked by a 54 amino acid spacer region. Due to the presence of a spacer region, an autoprocessing step is required in order to form the active protein.
Как используют в настоящем описании, донор ацила относится к той части субстрата ацилазы, которая дает ацильную группу акцептору ацила для того, чтобы формировать сложные эфиры или амиды.As used herein, an acyl donor refers to that portion of an acylase substrate that donates an acyl group to an acyl acceptor to form esters or amides.
Как используют в настоящем описании, акцептор ацила относится к той части субстрата ацилазы, которая принимает ацильную группу от донора ацила для того, чтобы формировать сложные эфиры или амиды.As used herein, an acyl acceptor refers to that part of an acylase substrate that accepts an acyl group from an acyl donor in order to form esters or amides.
Как используют в настоящем описании, последовательность α-цепи относится к аминокислотной последовательности, которая соответствует (например, обладает по меньшей мере 85% идентичностью) остаткам в положениях с 27 до 235 в SEQ ID № 2. Как используют в настоящем описании, одноцепочечный полипептид может содержать последовательность отцепи и дополнительную последовательность(и).As used herein, an α-chain sequence refers to an amino acid sequence that corresponds to (e.g., has at least 85% identity to) residues at positions 27 to 235 in SEQ ID No. 2. As used herein, a single chain polypeptide may contain the release sequence and additional sequence(s).
Как используют в настоящем описании, последовательность β-цепи относится к аминокислотной последовательности, которая соответствует (например, обладает по меньшей мере 85% идентичностью) остаткам в положениях с 290 до 846 в SEQ ID № 2. Как используют в настоящем описании, одноцепочечный полипептид может содержать последовательность β-цепи и дополнительную последовательность(и).As used herein, a β chain sequence refers to an amino acid sequence that corresponds to (e.g., has at least 85% identity to) residues at positions 290 to 846 in SEQ ID No. 2. As used herein, a single chain polypeptide may contain a β-strand sequence and additional sequence(s).
Как используют в настоящем описании, получен из, когда используют в контексте сконструированных ферментов PGA, идентифицирует исходный фермент PGA и/или ген, кодирующий такой фермент PGA, на котором основано конструирование. Например, одноцепочечный сконструированный фермент PGA из SEQ ID № 60 получали посредством искусственного развития, на протяжении нескольких поколений, гена, кодирующего PGA из К. citrophila. Таким образом, в некоторых вариантах осуществления сконструированные ферменты PGA получают из встречаемого в природе или PGA дикого типа сAs used herein, derived from, when used in the context of engineered PGA enzymes, identifies the parent PGA enzyme and/or the gene encoding such PGA enzyme on which the design is based. For example, the single-chain engineered PGA enzyme of SEQ ID NO: 60 was produced by artificially evolving, over several generations, the gene encoding PGA from K. citrophila. Thus, in some embodiments, engineered PGA enzymes are derived from naturally occurring or wild type PGA with
- 12 043748- 12 043748
SEQ ID № 2, хотя в некоторых дополнительных вариантах осуществления сконструированные ферменты PGA получают из других развитых ферментов PGA. В некоторых вариантах осуществления сконструированная PGA содержит последовательность α-цепи и последовательность β-цепи, которые могут присутствовать в виде отдельных полипептидов в зрелом ферменте или могут присутствовать в качестве части одноцепочечного полипептида. В некоторых вариантах осуществления, когда присутствует в виде одноцепочечной формы, сконструированный полипептид PGA может содержать, от амино- к карбоксиконцу, структуру B-L-A в которой В представляет собой последовательность β-цепи (или единицу В); А представляет собой последовательность α-цепи (или единицу А); и L представляет собой линкер, соединяющий последовательности α-цепи и β-цепи. В некоторых вариантах осуществления спейсер или линкер L содержит спейсер или линкер достаточной длины и гибкости, чтобы допускать надлежащую укладку и взаимодействие единиц А и В для того, чтобы формировать функциональный фермент PGA. Образцовый линкер/спейсер содержит аминокислотную последовательность Gln-Leu-Asp-Gln.SEQ ID NO: 2, although in some additional embodiments, engineered PGA enzymes are derived from other engineered PGA enzymes. In some embodiments, the engineered PGA comprises an α chain sequence and a β chain sequence, which may be present as separate polypeptides in the mature enzyme or may be present as part of a single chain polypeptide. In some embodiments, when present in single-chain form, the engineered PGA polypeptide may comprise, from amino to carboxy terminus, a B-L-A structure in which B is a β-strand sequence (or B unit); A represents an α-chain sequence (or A unit); and L is a linker connecting the α-chain and β-chain sequences. In some embodiments, the spacer or linker L comprises a spacer or linker of sufficient length and flexibility to allow proper folding and interaction of the A and B units to form a functional PGA enzyme. An exemplary linker/spacer contains the amino acid sequence Gln-Leu-Asp-Gln.
Будь в форме отдельных полипептидов или в виде одноцепочечного полипептида, последовательности α- и β-цепей могут иметь одну или несколько различий остатков по сравнению со встречаемыми в природе последовательностями α- и β-цепей из PGA K. citrophila.Whether in the form of individual polypeptides or as a single-chain polypeptide, the α- and β-chain sequences may have one or more residue differences compared to the naturally occurring α- and β-chain sequences from the K. citrophila PGA.
Как используют в настоящем описании, инсулин относится к полипептидному гормону, продуцируемому бета-клетками поджелудочной железы у нормальных индивидуумов. Инсулин необходим для регуляции метаболизма углеводов, посредством снижения уровней глюкозы крови. Систематический недостаток инсулина ведет к диабету. Инсулин состоит из 51 аминокислоты и имеет молекулярную массу приблизительно 5800 Да. Инсулин состоит из двух пептидных цепей (обозначаемых А и В), содержащих одну внутрисубъединичную и две межсубъедининых дисульфидных связи. Цепь А состоит из 21 аминокислоты и цепь В состоит из 30 аминокислот. Две цепи образуют высоко упорядоченную структуру, с несколькими альфа-спиральными областями в обеих цепях А и В. Изолированные цепи неактивны. В растворе инсулин представляет собой мономер, димер или гексамер. Он является гексамером в высоко концентрированных препаратах, используемых для подкожной инъекции, но становится мономером по мере его разведения текучими веществами организма. Предусмотрено, что определение охватывает проинсулин и любой очищенный выделенный полипептид, имеющий частично или полностью первичную структурную конформацию и по меньшей мере одно из биологических свойств инсулина, встречаемого в природе. Кроме того, предусмотрено, что оно охватывает природный и получаемый синтетически инсулин, в том числе гликоформы, а также аналоги (например, полипептиды, имеющие делеции, инсерции и/или замены).As used herein, insulin refers to a polypeptide hormone produced by pancreatic beta cells in normal individuals. Insulin is necessary to regulate carbohydrate metabolism by lowering blood glucose levels. A systematic lack of insulin leads to diabetes. Insulin consists of 51 amino acids and has a molecular weight of approximately 5800 Da. Insulin consists of two peptide chains (designated A and B) containing one intrasubunit and two intersubunit disulfide bonds. Chain A consists of 21 amino acids and chain B consists of 30 amino acids. The two chains form a highly ordered structure, with several alpha-helical regions in both chains A and B. Isolated chains are inactive. In solution, insulin is a monomer, dimer or hexamer. It is a hexamer in highly concentrated preparations used for subcutaneous injection, but becomes a monomer as it is diluted by body fluids. The definition is intended to include proinsulin and any purified isolated polypeptide having part or all of the primary structural conformation and at least one of the biological properties of naturally occurring insulin. It is also intended to cover natural and synthetically produced insulin, including glycoforms, as well as analogues (eg, polypeptides having deletions, insertions and/or substitutions).
Инсулин содержит три нуклеофильных амина, которые потенциально могут вступать в реакцию с донором фенилацетата и быть защищенными с помощью PGA. Эти остатки включают Lys в В-цепи в положении 29 (В29) и два N-концевых свободных амина, Gly на А-цепи в положении 1 (А1) и Phe на Вцепи в положении 1 (В1). Тризащищенный инсулин (фенилацетат, химически прикрепленный к остаткам A1, B1, B29 в инсулине человека) предусмотрен в настоящем описании. Ранее сообщалось, что PGA катализирует гидролиз N-фенилацетат-защищенных пептидов и инсулина с исключительной избирательностью к фенилацетатной амидной связи, оставляя остальные пептидные связи белка интактными (Brtnik et al., Coll. Czech. Chem. Commun., 46 (8), 1983-1989 [1981] и Wang et al. Biopolym. 25 (Suppl.), S109-S114 [1986]).Insulin contains three nucleophilic amines that can potentially react with the phenylacetate donor and be protected by PGA. These residues include Lys on the B chain at position 29 (B29) and two N-terminal free amines, Gly on the A chain at position 1 (A1) and Phe on the B chain at position 1 (B1). Triprotected insulin (phenylacetate chemically attached to the A1, B1, B29 residues in human insulin) is provided herein. It was previously reported that PGA catalyzes the hydrolysis of N-phenylacetate-protected peptides and insulin with exceptional selectivity for the phenylacetate amide bond, leaving the remaining peptide bonds of the protein intact (Brtnik et al., Coll. Czech. Chem. Commun., 46 (8), 1983 -1989 [1981] and Wang et al. Biopolym. 25 (Suppl.), S109-S114 [1986]).
Как используют в настоящем описании, трифенилацетатная защитная группа относится к молекуле инсулина, которая имеет три первичных амина в положениях B1, B29 и А1, которые защищают фенилацильной группой.As used herein, a triphenylacetate protecting group refers to an insulin molecule that has three primary amines at positions B1, B29 and A1, which are protected by a phenylacetate group.
Как используют в настоящем описании, дифенилацетатная защитная группа относится к молекуле инсулина, которая имеет два первичных амина в положениях B1, B29 и/или А1, которые защищены фенилацильной группой.As used herein, a diphenylacetate protecting group refers to an insulin molecule that has two primary amines at positions B1, B29 and/or A1 that are protected by a phenylacetate group.
Как используют в настоящем описании, дифенилацетатная защитная группа относится к молекуле инсулина, которая имеет один первичный амин в положениях B1, B29 или А1, которые защищены фенилацильной группой.As used herein, a diphenylacetate protecting group refers to an insulin molecule that has one primary amine at the B1, B29 or A1 positions that is protected by a phenylacetate group.
Ацилазы пенициллина GPenicillin G acylases
Впервые была описана ацилаза пенициллина из Penicillium chrysogenum Wise. Q176 авторами Sakaguchi и Murao (Sakaguchi and Murao, J. Agr.Chem. Soc. Jpn., 23:411 [1950]). Ацилаза пенициллина G представляет собой гидролитический фермент, который действует на боковые цепи пенициллина G, цефалоспорина G и родственных антибиотиков с образованием промежуточных соединений β-лактамных антибиотиков 6-аминопенициллановой кислоты и 7-аминодезацетоксицефалоспорановой кислоты с фенилуксусной кислотой в качестве общего побочного продукта. Эти промежуточные соединения антибиотиков входят в потенциальные строительные блоки для полусинтетических антибиотиков, таких как ампициллин, амоксициллин, клоксациллин, цефалексин и цефатоксим.Penicillin acylase was first described from Penicillium chrysogenum Wise. Q176 by Sakaguchi and Murao (Sakaguchi and Murao, J. Agr. Chem. Soc. Jpn., 23:411 [1950]). Penicillin G acylase is a hydrolytic enzyme that acts on the side chains of penicillin G, cephalosporin G, and related antibiotics to produce the β-lactam antibiotic intermediates 6-aminopenicillanic acid and 7-aminodesacetoxycephalosporanic acid, with phenylacetic acid as a common byproduct. These antibiotic intermediates are potential building blocks for semisynthetic antibiotics such as ampicillin, amoxicillin, cloxacillin, cephalexin, and cefatoxime.
Как указано выше, ацилазы пенициллина G (PGA) отличаются способностью катализировать гидролитическое расщепление пенициллина G, с сопряженным основанием структурной формулы (I), до 6аминопенициллановой кислоты, с сопряженным основанием структурной формулы (II), и фенилуксуснойAs stated above, penicillin G acylases (PGAs) are distinguished by their ability to catalyze the hydrolytic cleavage of penicillin G, with its conjugate base of structural formula (I), to 6-aminopenicillanic acid, with its conjugate base of structural formula (II), and phenylacetic acid.
- 13 043748 кислоты структурной формулы (III), как показано в схеме 1:- 13 043748 acid of structural formula (III), as shown in scheme 1:
Схема 1Scheme 1
W (П) (тп)W (P) (tp)
Без ограничения теорией, субстратная специфичность выглядит ассоциированной с распознаванием гидрофобной фенильной группы, тогда как нуклеофил, которым в некоторых PGA является остаток серина на N-конце бета-цепи, выполняет функцию акцептора бета-лактама и различных других групп, таких как бета-аминокислоты. PGA также могут отличаться способностью расщеплять модельные субстраты, аналогичные пенициллину G, например, расщепление 6-нитро-3-(фенилацетамидо)бензойной кислоты (NIPAB) структурной формулы (IV), как показано в схеме 2:Without being limited by theory, substrate specificity appears to be associated with the recognition of a hydrophobic phenyl group, while the nucleophile, which in some PGAs is a serine residue at the N-terminus of the beta chain, functions as an acceptor for the beta-lactam and various other groups such as beta-amino acids. PGAs may also differ in their ability to cleave model substrates similar to penicillin G, such as the cleavage of 6-nitro-3-(phenylacetamido)benzoic acid (NIPAB) of structural formula (IV), as shown in Scheme 2:
Схема 2Scheme 2
(TV) (V) (HI) до фенилуксусной кислоты структурной формулы (III) и 5-амино-2-нитробензойной кислоты структурной формулы (V) (см., например, Alkema et al., Anal. Biochem., 275:47-53 [1999]). Поскольку 5-амино2-нитробензойная кислота является хромогенной, субстрат формулы (IV) предоставляет удобный способ измерения активности PGA. В дополнение к вышеуказанным реакциям, PGA также можно использовать при кинетическом разрешении DL-трет-лейцина для получения оптически чистого трет-лейцина (см., например, Liu et al., Prep. Biochem. Biotechnol., 36:235-41 [2006]). (TV) (V) (HI) to phenylacetic acid of structural formula (III) and 5-amino-2-nitrobenzoic acid of structural formula (V) (see, for example, Alkema et al., Anal. Biochem., 275:47 -53 [1999]). Since 5-amino2-nitrobenzoic acid is chromogenic, the substrate of formula (IV) provides a convenient method for measuring PGA activity. In addition to the above reactions, PGA can also be used to kinetically resolve DL-tert-leucine to produce optically pure tert-leucine (see, for example, Liu et al., Prep. Biochem. Biotechnol., 36:235-41 [2006 ]).
PGA по настоящему изобретению основаны на ферменте, полученном из организма Kluyvera citrophila (K. citrophila). Как и в случае PGA от других организмов, PGA от K. citrophila представляет собой гетеродимерный фермент, состоящий из альфа-субъединицы и бета-субъединицы, которые возникают посредством протеолитического процессинга препрополипептида PGA. Удалением сигнального пептида и спейсерного пептид получают зрелый гетеродимер (см., например, Barbero et al., Ген 49:69-80 [1986]). Аминокислотная последовательность встречаемого в природе препрополипептида PGA из K. citrophila общедоступна (см., например, номер доступа GenBank P07941, [gi:129551]) и предоставлена в настоящем описании как SEQ ID № 2. Последовательность альфа-цепи встречаемой в природе PGA K. citrophila соответствует остаткам с 27 до 235 из SEQ ID № 2. Последовательность бета-цепи встречаемой в природе PGA K. citrophila соответствует остаткам с 290 до 846 из SEQ ID № 2.The PGAs of the present invention are based on an enzyme obtained from the organism Kluyvera citrophila (K. citrophila). As with PGA from other organisms, PGA from K. citrophila is a heterodimeric enzyme consisting of an alpha subunit and a beta subunit, which arise through proteolytic processing of the PGA prepropolypeptide. Removal of the signal peptide and spacer peptide produces a mature heterodimer (see, eg, Barbero et al., Gene 49:69-80 [1986]). The amino acid sequence of the naturally occurring PGA prepropolypeptide from K. citrophila is publicly available (see, e.g., GenBank accession number P07941, [gi:129551]) and is provided herein as SEQ ID No. 2. Naturally occurring PGA K alpha chain sequence. citrophila corresponds to residues 27 to 235 of SEQ ID No. 2. The beta chain sequence of the naturally occurring K. citrophila PGA corresponds to residues 290 to 846 of SEQ ID No. 2.
Остатки с 1 до 26 из SEQ ID № 2 соответствуют сигнальному пептиду и остатки 236-289 из SEQ ID № 2 соответствуют связывающему пропептиду, оба их удаляют для того, чтобы создавать встречаемый в природе зрелый фермент PGA, который представляет собой гетеродимер, содержащий субъединицу αцепи и субъединицу β-цепи. В некоторых вариантах осуществления сконструированная PGA содержит последовательность α-цепи и последовательность β-цепи, которые могут присутствовать в виде отдельных полипептидов в зрелом ферменте или могут присутствовать в качестве части одноцепочечного полипептида. В некоторых вариантах осуществления, которая присутствует в виде одноцепочечной формы, сконструированный полипептид PGA может содержать, от амино- к карбоксиконцу, структуру B-L-A в которой В представляет собой последовательность β-цепи (или единицу В); А представляет собой последовательность α-цепи (или единицу А); и L представляет собой линкер, соединяющий последовательности α-цепи и β-цепи. В некоторых вариантах осуществления спейсер или линкер L содержит спейсер или линкер достаточной длины и гибкости, чтобы допускать надлежащую укладку и взаимодействие единиц А и В для того, чтобы формировать функциональный фермент PGA. Образцовый линкер/спейсер содержит аминокислотную последовательность Gln-Leu-Asp-Gln.Residues 1 to 26 of SEQ ID No. 2 correspond to the signal peptide and residues 236 to 289 of SEQ ID No. 2 correspond to the binding propeptide, both of which are removed to create the naturally occurring mature PGA enzyme, which is a heterodimer containing an α chain subunit and a β-chain subunit. In some embodiments, the engineered PGA comprises an α chain sequence and a β chain sequence, which may be present as separate polypeptides in the mature enzyme or may be present as part of a single chain polypeptide. In some embodiments, which is present in single-chain form, the engineered PGA polypeptide may comprise, from amino to carboxy terminus, a B-L-A structure in which B is a β-strand sequence (or B unit); A represents an α-chain sequence (or A unit); and L is a linker connecting the α chain and β chain sequences. In some embodiments, the spacer or linker L comprises a spacer or linker of sufficient length and flexibility to allow proper folding and interaction of the A and B units to form a functional PGA enzyme. An exemplary linker/spacer contains the amino acid sequence Gln-Leu-Asp-Gln.
Будь в форме отдельных полипептидов или в виде одноцепочечного полипептида, последовательности α- и β-цепей могут иметь одно или несколько различий остатков по сравнению со встречаемыми в природе последовательностями α- и β-цепей из PGA K. citrophila.Whether in the form of individual polypeptides or as a single-chain polypeptide, the α- and β-chain sequences may have one or more residue differences compared to the naturally occurring α- and β-chain sequences from the K. citrophila PGA.
В некоторых вариантах осуществления настоящее изобретение предусматривает сконструированные полипептиды PGA с аминокислотными последовательностями, которые обладают по меньшей мере приблизительно 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% или больше идентичностью последовательностей с SEQ ID №№ 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160.In some embodiments, the present invention provides engineered PGA polypeptides with amino acid sequences that have at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% or greater sequence identity to SEQ ID Nos. 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/or 160 .
Настоящее изобретение предусматривает инсулинспецифические биокатализаторы ацилирования, подходящие для использования в коммерческом масштабе. Направленную эволюцию использовали для разработки эффективных вариантов ацилаз, которые способны добавлять фенилацетатную защитную группу к инсулину в положениях A1, B1 и/или В29. Варианты PGA, предусмотренные в настоящем описании, способны принимать широкий диапазон ацильных групп, проявлять увеличенную стабильность вThe present invention provides insulin-specific acylation biocatalysts suitable for use on a commercial scale. Directed evolution has been used to develop efficient acylase variants that are capable of adding a phenylacetate protecting group to insulin at positions A1, B1 and/or B29. The PGA variants provided herein are capable of accepting a wide range of acyl groups, exhibiting increased stability in
- 14 043748 растворителе и усовершенствованную термостабильность по сравнению с PGA дикого типа. Варианты PGA, предусмотренные в настоящем описании, не содержат спейсерную область. Таким образом, стадия аутопроцессинга не требуется для того, чтобы получать активные ферменты. Настоящее изобретение также относится к полинуклеотидам, кодирующим сконструированные полипептиды PGA. В некоторых вариантах осуществления полинуклеотиды функционально связаны с одной или несколькими гетерологичными регуляторными последовательностями, которые управляют экспрессией гена, чтобы создавать рекомбинантный полинуклеотид, способный экспрессировать полипептид.- 14 043748 solvent and improved thermal stability compared to wild type PGA. The PGA variants provided herein do not contain a spacer region. Thus, an autoprocessing step is not required in order to obtain active enzymes. The present invention also relates to polynucleotides encoding engineered PGA polypeptides. In some embodiments, the polynucleotides are operably linked to one or more heterologous regulatory sequences that control gene expression to create a recombinant polynucleotide capable of expressing the polypeptide.
Экспрессионные конструкции, содержащие гетерологичный полинуклеотид, кодирующий сконструированные полипептиды PGA, можно вводить в подходящие клетки-хозяева для того, чтобы экспрессировать соответствующий полипептид PGA. По причине известности кодонов, соответствующих различным аминокислотам, доступность белковой последовательности предоставляет описание всех полинуклеотидов, способных кодировать рассматриваемое. Вырожденность генетического кода, где одни и те же аминокислоты кодируют посредством альтернативные или синонимические кодоны, допускает создание чрезвычайно большого числа нуклеиновых кислот, все из которых кодируют усовершенствованные ферменты PGA, раскрытые в настоящем описании. Таким образом, имея идентифицированную конкретную аминокислотную последовательность, специалисты в данной области могут создавать любое число различных нуклеиновых кислот путем простой модификации последовательности одного или нескольких кодонов таким образом, который не меняет аминокислотную последовательность белка. В связи с этим, настоящее раскрытие, в частности, предусматривает каждую и всякую возможную вариацию полинуклеотидов, которые можно получать, выбирая комбинации на основе выбора возможных кодонов, и все такие вариации следует рассматривать как конкретно раскрытые для любого полипептида, раскрытого в настоящем описании, включая аминокислотные последовательности, представленные в таблицах в примерах.Expression constructs containing a heterologous polynucleotide encoding the engineered PGA polypeptides can be introduced into suitable host cells to express the corresponding PGA polypeptide. Because the codons corresponding to different amino acids are known, the availability of a protein sequence provides a description of all polynucleotides capable of encoding the one in question. The degeneracy of the genetic code, where the same amino acids are encoded by alternative or synonymous codons, allows for the creation of an extremely large number of nucleic acids, all of which encode the improved PGA enzymes disclosed herein. Thus, once a specific amino acid sequence has been identified, those skilled in the art can create any number of different nucleic acids by simply modifying the sequence of one or more codons in a manner that does not change the amino acid sequence of the protein. In this regard, the present disclosure specifically provides for each and every possible variation of polynucleotides that can be obtained by selecting combinations based on the selection of possible codons, and all such variations are to be considered as specifically disclosed for any polypeptide disclosed herein, including amino acid sequences presented in the tables in the examples.
В различных вариантах осуществления, кодоны предпочтительно отбирают так, чтобы они подходил к клетке-хозяину, в которой получают белок. Например, предпочтительные кодоны, используемые в бактериях, используют для того, чтобы экспрессировать ген в бактериях; предпочтительные кодоны, используемые в дрожжах используют для экспрессии в дрожжа; и предпочтительные кодоны, используемые у млекопитающих, используют для экспрессии в клетках млекопитающих.In various embodiments, codons are preferably selected to suit the host cell in which the protein is produced. For example, preferred codons used in bacteria are used to express a gene in bacteria; preferred codons used in yeast are used for expression in yeast; and preferred codons used in mammals are used for expression in mammalian cells.
В определенных вариантах осуществления все кодоны не нужно заменять для того, чтобы оптимизировать использование кодонов для полипептидов PGA, поскольку природная последовательность содержит предпочтительные кодоны, а также поскольку использование предпочтительных кодонов может не требоваться для всех аминокислотных остатков. Следовательно, полинуклеотиды с оптимизацией кодонов, кодирующие ферменты PGA, могут содержать предпочтительные кодоны в приблизительно 40%, 50%, 60%, 70%, 80% или более чем 90% положений кодонов полноразмерной кодирующей области.In certain embodiments, all codons do not need to be replaced in order to optimize codon usage for PGA polypeptides because the natural sequence contains preferred codons and because the use of preferred codons may not be required for all amino acid residues. Therefore, codon-optimized polynucleotides encoding PGA enzymes may contain preferred codons at approximately 40%, 50%, 60%, 70%, 80%, or greater than 90% of the codon positions of the full-length coding region.
В некоторых вариантах осуществления полинуклеотид содержит нуклеотидную последовательность, кодирующую полипептид PGA с аминокислотной последовательностью, которая обладает по меньшей мере приблизительно 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% или большей идентичностью последовательностей с любой альфа-цепью и/или бета-цепью эталонных сконструированных полипептидов PGA, описанных в настоящем описании. Соответственно, в некоторых вариантах осуществления полинуклеотид кодирует аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентична эталонным последовательностям альфа- и бета-цепей на основе SEQ ID № 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160. В некоторых вариантах осуществления полинуклеотид кодирует аминокислотную последовательность альфа- и/или бета-цепи из SEQ ID № 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160.In some embodiments, the polynucleotide comprises a nucleotide sequence encoding a PGA polypeptide with an amino acid sequence that is at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% or greater sequence identity to any alpha chain and/or beta chain of the reference engineered PGA polypeptides described herein. Accordingly, in some embodiments, the polynucleotide encodes an amino acid sequence that is at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or greater identical to the alpha and beta chain reference sequences based on SEQ ID Nos. 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/or 160. In some embodiments, the polynucleotide encodes the alpha and/or beta chain amino acid sequence of SEQ ID NO: 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/ or 160.
В некоторых вариантах осуществления полинуклеотид содержит нуклеотидную последовательность, кодирующую полипептид PGA с аминокислотной последовательностью, которая обладает по меньшей мере приблизительно 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% или большей идентичностью последовательностей с SEQ ID № 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160. Соответственно, в некоторых вариантах осуществления полинуклеотид кодирует аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше идентична SEQ ID № 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160.In some embodiments, the polynucleotide comprises a nucleotide sequence encoding a PGA polypeptide with an amino acid sequence that is at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% or greater sequence identity to SEQ ID No. 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/or 160. Accordingly, in some embodiments, the polynucleotide encodes an amino acid sequence that is at least about 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95 %, 96%, 97%, 98%, 99% or greater is identical to SEQ ID No. 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/or 160.
В некоторых вариантах осуществления выделенным полинуклеотидом, кодирующим усовершенствованный полипептид PGA, манипулировали различными способами для обеспечения усовершенствованной активности и/или экспрессии полипептида. Манипуляции с выделенным полинуклеотидом перед его встраиванием в вектор могут быть желательны или необходимы, в зависимости от экспрессирующего вектора. Приемы модификаций полинуклеотидов и последовательностей нуклеиновой кислоты с использованием способов рекомбинантных ДНК хорошо известны в данной области.In some embodiments, an isolated polynucleotide encoding an improved PGA polypeptide has been manipulated in various ways to provide improved activity and/or expression of the polypeptide. Manipulation of the isolated polynucleotide before its insertion into a vector may be desirable or necessary, depending on the expression vector. Techniques for modifying polynucleotides and nucleic acid sequences using recombinant DNA techniques are well known in the art.
Например, способы мутагенеза и направленной эволюции можно легко применять к полинуклеотидам для того, чтобы создавать варианты библиотек, которые можно экспрессировать, осуществлять их скрининг и анализ. Способы мутагенеза и направленной эволюции хорошо известны в данной областиFor example, mutagenesis and directed evolution techniques can be readily applied to polynucleotides to create expressible library variants, screen them, and analyze them. Mutagenesis and directed evolution techniques are well known in the art.
- 15 043748 (см., например, патенты США №№ 5605793, 5830721, 6132970, 6420175, 6277638, 6365408, 6602986,- 15 043748 (see, for example, US patents No. 5605793, 5830721, 6132970, 6420175, 6277638, 6365408, 6602986,
7288375, 6287861, 6297053, 6576467, 6444468, 5811238, 6117679, 6165793, 6180406, 6291242, 6995017,7288375, 6287861, 6297053, 6576467, 6444468, 5811238, 6117679, 6165793, 6180406, 6291242, 6995017,
6395547, 6506602, 6519065, 6506603, 6413774, 6573098, 6323030, 6344356, 6372497, 7868138, 5834252,6395547, 6506602, 6519065, 6506603, 6413774, 6573098, 6323030, 6344356, 6372497, 7868138, 5834252,
5928905, 6489146, 6096548, 6387702, 6391552, 6358742, 6482647, 6335160, 6653072, 6355484, 603344,5928905, 6489146, 6096548, 6387702, 6391552, 6358742, 6482647, 6335160, 6653072, 6355484, 603344,
6319713, 6613514, 6455253, 6579678, 6586182, 6406855, 6946296, 7534564, 7776598, 5837458, 6391640,6319713, 6613514, 6455253, 6579678, 6586182, 6406855, 6946296, 7534564, 7776598, 5837458, 6391640,
6309883, 7105297, 7795030, 6326204, 6251674, 6716631, 6528311, 6287862, 6335198, 6352859, 6379964,6309883, 7105297, 7795030, 6326204, 6251674, 6716631, 6528311, 6287862, 6335198, 6352859, 6379964,
7148054, 7629170, 7620500, 6365377, 6358740, 6406910, 6413745, 6436675, 6961664, 7430477, 7873499,7148054, 7629170, 7620500, 6365377, 6358740, 6406910, 6413745, 6436675, 6961664, 7430477, 7873499,
7702464, 7783428, 7747391, 7747393, 7751986, 6376246, 6426224, 6423542, 6479652, 6319714, 6521453,7702464, 7783428, 7747391, 7747393, 7751986, 6376246, 6426224, 6423542, 6479652, 6319714, 6521453,
6368861, 7421347, 7058515, 7024312, 7620502, 7853410, 7957912, 7904249 и все связанные эквиваленты не для США; Ling et al., Anal. Biochem., 254(2):157-78 [1997]; Dale et al., Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al., Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wells et al., Ген, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A., 94:4504-4509 [1997]; Crameri et al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 и WO 2009/152336, все они включены в настоящее описание посредством ссылки).6368861, 7421347, 7058515, 7024312, 7620502, 7853410, 7957912, 7904249 and all related non-US equivalents; Ling et al., Anal. Biochem., 254(2):157-78 [1997]; Dale et al., Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al., Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wells et al., Gene 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A. 94:4504-4509 [1997]; Crameri et al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 and WO 2009/152336, all of which are incorporated herein by reference).
В некоторых вариантах осуществления варианты ацилаз PGA по настоящему изобретению дополнительно содержат дополнительные последовательности, которые не изменяют кодируемую активность фермента. Например, в некоторых вариантах осуществления варианты ацилаз PGA связывают с эпитопной меткой или другой последовательностью, которую можно использовать при очистке.In some embodiments, the PGA acylase variants of the present invention further comprise additional sequences that do not alter the encoded enzyme activity. For example, in some embodiments, PGA acylase variants are linked to an epitope tag or other sequence that can be used in purification.
В некоторых вариантах осуществления полипептиды вариантов ацилаз PGA по настоящему изобретению секретирует клетка-хозяин, в которой их экспрессируют (например, клетка-хозяин дрожжей или нитчатых грибов) и экспрессируют в виде препротеина, содержащего сигнальный пептид (т.е. аминокислотную последовательность, которая связана с аминоконцом полипептида и которая направляет кодируемый полипептид по клеточному секреторному пути).In some embodiments, the PGA acylase variant polypeptides of the present invention are secreted by the host cell in which they are expressed (e.g., a yeast or filamentous fungus host cell) and expressed as a preprotein containing a signal peptide (i.e., an amino acid sequence that is linked with the amino terminus of the polypeptide and which directs the encoded polypeptide along the cellular secretory pathway).
В некоторых вариантах осуществления сигнальный пептид представляет собой эндогенный сигнальный пептид ацилазы PGA К. citrophila. В некоторых других вариантах осуществления используют сигнальные пептиды из других секретируемых белков K. citrophila.In some embodiments, the signal peptide is an endogenous K. citrophila PGA acylase signal peptide. In some other embodiments, signal peptides from other secreted proteins of K. citrophila are used.
В некоторых вариантах осуществления другие сигнальные пептиды находят использование, в зависимости от клетки-хозяина и других факторов. Области, кодирующие эффективные сигнальные пептиды, для клеток-хозяев нитчатых грибов включают, но не ограничиваясь этим, кодирующие сигнальные пептиды области, получаемые из ТАКА амилазы Aspergillus oryzae, нейтральной амилазы Aspergillus niger, глюкоамилазы Aspergillus niger, аспарагиновой протеиназы Rhizomucor miehei, целлюлазы Humicola insolens, липазы Humicola lanuginosa и целлобиогидролазы II Т. reesei. Кодирующие сигнальные пептиды области для бактериальных клеток-хозяев включают, но не ограничиваясь этим, кодирующие сигнальные пептиды области, получаемые из генов мальтогенной амилазы Bacillus NClB 11837, альфа-амилазы Bacillus stearothermophilus, субтилизина Bacillus licheniformis, β-лактамазы Bacillus licheniformis, нейтральной протеазы (nprT, nprS, nprM) Bacillus stearothermophilus и prsA Bacillus subtilis. В некоторых дополнительных вариантах осуществления другие сигнальные пептиды находят использование в настоящем изобретении (см., например, Simonen and Palva, Microbiol. Rev., 57: 109-137 [1993], включено в настоящее описание посредством ссылки). Дополнительные эффективные сигнальные пептиды для дрожжевых клеток-хозяев включают таковые из генов альфа-фактора Saccharomyces cerevisiae, инвертазы SUC2Saccharomyces cerevisiae (см., например, Taussig and Carlson, Nucl. Acids Res., 11:1943-54 [1983]; № доступа SwissProt P00724; и Romanos et al., Yeast 8:423-488 [1992]). В некоторых вариантах осуществления находят применение варианты этих сигнальных пептидов и других сигнальных пептидов. В действительности, не предусмотрено, что настоящее изобретение ограничено каким-либо конкретным сигнальным пептидом, поскольку любой подходящий сигнальный пептид, известный в данной области, находит использование в настоящем изобретении.In some embodiments, other signal peptides are used, depending on the host cell and other factors. Effective signal peptide-encoding regions for filamentous fungal host cells include, but are not limited to, signal peptide-encoding regions derived from Aspergillus oryzae TAKA amylase, Aspergillus niger neutral amylase, Aspergillus niger glucoamylase, Rhizomucor miehei aspartic proteinase, Humicola insolens cellulase, Humicola lanuginosa lipase and T. reesei cellobiohydrolase II. Signal peptide coding regions for bacterial host cells include, but are not limited to, signal peptide coding regions derived from the Bacillus NClB 11837 maltogenic amylase, Bacillus stearothermophilus alpha-amylase, Bacillus licheniformis subtilisin, Bacillus licheniformis β-lactamase, neutral protease (nprT) genes , nprS, nprM) Bacillus stearothermophilus and prsA Bacillus subtilis. In some additional embodiments, other signal peptides find use in the present invention (see, for example, Simonen and Palva, Microbiol. Rev., 57: 109-137 [1993], incorporated herein by reference). Additional effective signal peptides for yeast host cells include those of the Saccharomyces cerevisiae alpha factor, SUC2 invertase genes (see, e.g., Taussig and Carlson, Nucl. Acids Res., 11:1943-54 [1983]; SwissProt accession no. P00724; and Romanos et al., Yeast 8:423-488 [1992]). In some embodiments, variants of these signal peptides and other signal peptides are used. In fact, the present invention is not intended to be limited to any particular signal peptide, as any suitable signal peptide known in the art finds use in the present invention.
В некоторых вариантах осуществления настоящее изобретение предусматривает полинуклеотиды, кодирующие полипептиды вариантов ацилаз PGA и/или их биологически активные фрагменты, как раскрыто в настоящем описании. В некоторых вариантах осуществления полинуклеотид функционально связан с одной или несколькими гетерологичными регуляторными или управляющими последовательностями, которые управляют экспрессией гена для того, чтобы создавать рекомбинантный полинуклеотид, способный экспрессировать полипептид. В некоторых вариантах осуществления экспрессионные конструкции, содержащие гетерологичный полинуклеотид, кодирующий вариант ацилазы PGA, вводят в подходящие клетки-хозяева для того, чтобы экспрессировать вариант ацилазы PGA.In some embodiments, the present invention provides polynucleotides encoding PGA acylase variant polypeptides and/or biologically active fragments thereof, as disclosed herein. In some embodiments, the polynucleotide is operably linked to one or more heterologous regulatory or control sequences that control gene expression to create a recombinant polynucleotide capable of expressing the polypeptide. In some embodiments, expression constructs comprising a heterologous polynucleotide encoding a PGA acylase variant are introduced into suitable host cells to express the PGA acylase variant.
Средние специалисты в данной области поймут, что из-за вырожденности генетического кода существует множество нуклеотидных последовательностей, кодирующих полипептиды вариантов ацилаз PGA по настоящему изобретению. Например, все кодоны AGA, AGG, CGA, CGC, CGG и CGU кодируют аминокислоту аргинин. Таким образом, в каждом положении в нуклеиновых кислотах по изобретению,Those of ordinary skill in the art will appreciate that, due to the degeneracy of the genetic code, there are many nucleotide sequences encoding the polypeptides of the PGA acylase variants of the present invention. For example, codons AGA, AGG, CGA, CGC, CGG and CGU all code for the amino acid arginine. Thus, at each position in the nucleic acids of the invention,
- 16 043748 где аргинин определен кодоном, кодон можно изменять на любой из соответствующих кодонов, описанных выше, без изменения кодируемого полипептида. Понятно, что U в последовательности РНК соответствует Т в последовательности ДНК. Изобретение относится к и предусматривает каждую и всякую возможную вариацию последовательности нуклеиновой кислоты, кодирующей полипептид по изобретению, которую можно выполнять, выбирая комбинации на основе возможных альтернатив кодонов.- 16 043748 where arginine is specified by a codon, the codon can be changed to any of the corresponding codons described above without changing the encoded polypeptide. It is clear that the U in the RNA sequence corresponds to the T in the DNA sequence. The invention relates to and provides for each and every possible variation of the nucleic acid sequence encoding a polypeptide of the invention, which can be accomplished by selecting combinations based on possible codon alternatives.
Как указано выше, также можно разрабатывать последовательность ДНК, кодирующую PGA, с кодонами с высоким предпочтением кодонов (кодонов, которые используют с более высокой частотой в кодирующих белок областях, чем другие кодоны, которые кодируют ту же аминокислоту). Предпочтительные кодоны можно определять по отношению к использованию кодонов в одном гене, наборе генов с общей функцией или происхождением, высоко экспрессируемых генах, частоте кодонов в агрегатных кодирующих белок областях целого организма, частоте кодонов в агрегатных кодирующих белок областях родственных организмов или их сочетаний. Кодон, частота которого возрастает вместе с уровнем экспрессии гена, обычно является оптимальным кодоном для экспрессии. В частности, последовательность ДНК можно оптимизировать для экспрессии в конкретном организме-хозяине. Различные способы хорошо известны в данной области для определения частоты кодонов (например, использование кодонов, относительное использование синонимических кодонов) и кодонные предпочтения в конкретных организмах, включая многопараметрический анализ (например, с использованием кластерного анализа или анализа соответствий) и эффективное число кодонов, используемых в гене. Источник данных для получения использования кодонов может полагаться на любую доступную нуклеотидную последовательность, способную кодировать белок.As stated above, it is also possible to design the DNA sequence encoding PGA with high codon preference codons (codons that are used at a higher frequency in protein coding regions than other codons that code for the same amino acid). Preferred codons can be determined with respect to codon usage in a single gene, a set of genes with a common function or origin, highly expressed genes, the frequency of codons in aggregate protein-coding regions of a whole organism, the frequency of codons in aggregate protein-coding regions of related organisms, or combinations thereof. A codon whose frequency increases with the level of gene expression is usually the optimal codon for expression. In particular, the DNA sequence can be optimized for expression in a particular host organism. Various methods are well known in the art for determining codon frequency (e.g., codon usage, relative usage of synonymous codons) and codon preferences in specific organisms, including multivariate analysis (e.g., using cluster analysis or correspondence analysis) and the effective number of codons used in gene The data source may rely on any available nucleotide sequence capable of encoding a protein to obtain codon usage.
Эти наборы данных включают последовательности нуклеиновой кислоты, которые доподлинно кодируют экспрессируемые белки (например, полные кодирующие белок последовательности -CDS), метки экспрессируемой последовательности (EST) или предсказанные кодирующие области геномных последовательностей, как хорошо известно в данной области. Полинуклеотиды, кодирующие варианты PGA, можно получать с использованием любых подходящих известные в данной области способов. Обычно олигонуклеотиды синтезируют индивидуально, затем соединяют (например, способами ферментативного или химического лигирования или опосредованными полимеразой способами) для того, чтобы формировать по существу любую желаемую непрерывную последовательность. В некоторых вариантах осуществления полинуклеотиды по настоящему изобретению получают посредством химического синтеза с использованием любых подходящих известных в данной области способов, включая в качестве неограничивающих примеров автоматизированные способы синтеза. Например, в фосфорамидитном способе олигонуклеотиды синтезируют (например, в автоматическом синтезаторе ДНК), очищают, отжигают, лигируют и клонируют в подходящие векторы. В некоторых вариантах осуществления после этого получают фрагменты двухцепочечной ДНК или посредством синтеза комплементарной нити и отжига нитей вместе при подходящих условиях или посредством добавления комплементарной нити с использованием ДНК-полимеразы и подходящей последовательности праймера. Существует множество общих и стандартных текстов, в которых предоставлены способы, которые можно использовать в настоящем изобретении и которые хорошо известны специалистам в данной области.These data sets include nucleic acid sequences that accurately encode expressed proteins (eg, complete protein coding sequences -CDS), expressed sequence tags (ESTs), or predicted coding regions of genomic sequences, as is well known in the art. Polynucleotides encoding PGA variants can be prepared using any suitable methods known in the art. Typically, oligonucleotides are synthesized individually, then joined (eg, by enzymatic or chemical ligation or polymerase-mediated methods) to form essentially any desired contiguous sequence. In some embodiments, the polynucleotides of the present invention are produced by chemical synthesis using any suitable methods known in the art, including, but not limited to, automated synthesis methods. For example, in the phosphoramidite method, oligonucleotides are synthesized (eg, in an automated DNA synthesizer), purified, annealed, ligated, and cloned into suitable vectors. In some embodiments, double-stranded DNA fragments are then produced either by synthesizing the complementary strand and annealing the strands together under suitable conditions or by adding the complementary strand using DNA polymerase and a suitable primer sequence. There are many general and standard texts that provide methods that can be used in the present invention and that are well known to those skilled in the art.
Сконструированные PGA можно получать, подвергая полинуклеотид, кодирующий встречаемую в природе PGA, способам мутагенеза и/или направленной эволюции, как рассмотрено выше. Мутагенез можно осуществлять в соответствии с любыми из приемов, известных в данной области, включая случайный и сайт-специфический мутагенез. Направленную эволюцию можно осуществлять с использованием любых из приемов, известных в данной области для скрининга усовершенствованных вариантов, включая перетасовку. Другие процедуры направленной эволюции, которые находят применение, включают, но не ограничиваясь этим, процесс (стадию) ступенчатой достройки, рекомбинацию in vitro, мутагенную ПЦР, кассетный мутагенез, сплайсинг посредством достраивания перекрытий (SOE), способы направленной эволюции ProSAR™ и т.д., а также любые другие подходящие способы.Engineered PGAs can be produced by subjecting a polynucleotide encoding a naturally occurring PGA to mutagenesis and/or directed evolution methods, as discussed above. Mutagenesis can be carried out in accordance with any of the techniques known in the art, including random and site-specific mutagenesis. Directed evolution can be carried out using any of the techniques known in the art for screening improved variants, including shuffling. Other directed evolution procedures that are used include, but are not limited to, stepwise extension, in vitro recombination, mutagenic PCR, cassette mutagenesis, splicing by overlap extension (SOE), ProSAR™ directed evolution techniques, etc. ., as well as any other suitable methods.
Осуществляют скрининг клонов, получаемых после мутагенетической обработки, по сконструированным PGA, имеющим желаемое усовершенствованное свойство фермента. Измерение активности фермента из экспрессионных библиотек можно осуществлять с использованием стандартных биохимических приемов мониторинга скорости образования продукта. Когда желаемым усовершенствованным свойством фермента является тепловая стабильность, активность фермента можно измерять после воздействия на препараты фермента определенными температурами и измерения количества активности фермента, остающейся после тепловой обработки. Затем клоны, содержащие полинуклеотид, кодирующий PGA, выделяют, секвенируют для того, чтобы идентифицировать изменения в нуклеотидной последовательности (если уместно), и используют для того, чтобы экспрессировать фермент в клетке-хозяине.Clones obtained after mutagenetic treatment are screened for engineered PGAs having the desired improved enzyme property. Measurement of enzyme activity from expression libraries can be accomplished using standard biochemical techniques for monitoring the rate of product formation. When the desired improved property of an enzyme is thermal stability, enzyme activity can be measured after exposing enzyme preparations to specific temperatures and measuring the amount of enzyme activity remaining after heat treatment. Clones containing the polynucleotide encoding PGA are then isolated, sequenced to identify changes in the nucleotide sequence (if appropriate), and used to express the enzyme in a host cell.
Когда последовательность сконструированного полипептида известна, полинуклеотиды, кодирующие фермент, можно получать стандартными твердофазными способами, в соответствии с известными способами синтеза. В некоторых вариантах осуществления фрагменты приблизительно до 100 оснований можно синтезировать индивидуально, затем соединять (например, способами ферментативного или химического лигирования или опосредованными полимеразой способами) для того, чтобы формировать любую желаемую непрерывную последовательность. Например, полинуклеотиды и олигонуклеотиды поOnce the sequence of the designed polypeptide is known, polynucleotides encoding the enzyme can be prepared by standard solid phase methods, in accordance with known synthetic methods. In some embodiments, fragments of up to about 100 bases can be synthesized individually and then joined (eg, by enzymatic or chemical ligation or polymerase-mediated methods) to form any desired contiguous sequence. For example, polynucleotides and oligonucleotides
- 17 043748 изобретению можно получать посредством химического синтеза (например, с использованием классического фосфорамидитного способа, описанного в Beaucage et al., Tet. Lett., 22:1859-69 [1981], или способа, описанного в Matthes et al., EMBO J., 3:801-05 [1984], как его обычно практикуют в автоматизированных способах синтеза). В соответствии с фосфорамидитным способом олигонуклеотиды синтезируют (например, в автоматическом синтезаторе ДНК), очищают, отжигают, лигируют и клонируют в подходящие векторы. Кроме того, по существу любую нуклеиновую кислоту можно получать из любого из различных коммерческих источников (например, Midland Certified Reagent Company, Midland, TX, The Great American Ген Company, Ramona, CA, ExpressGen Inc. Chicago, IL, Operon Technologies Inc., Alameda, CA и многие другие).- 17 043748 of the invention can be obtained by chemical synthesis (for example, using the classical phosphoramidite method described in Beaucage et al., Tet. Lett., 22:1859-69 [1981], or the method described in Matthes et al., EMBO J., 3:801-05 [1984], as commonly practiced in automated synthesis methods). In the phosphoramidite method, oligonucleotides are synthesized (eg in an automated DNA synthesizer), purified, annealed, ligated and cloned into suitable vectors. In addition, essentially any nucleic acid can be obtained from any of a variety of commercial sources (e.g., Midland Certified Reagent Company, Midland, TX, The Great American Gene Company, Ramona, CA, ExpressGen Inc. Chicago, IL, Operon Technologies Inc., Alameda, CA and many others).
Настоящее изобретение также относится к рекомбинантным конструкциям, содержащим последовательность, кодирующую по меньшей мере один вариант PGA, как предусмотрено в настоящем описании. В некоторых вариантах осуществления настоящее изобретение предусматривает экспрессирующий вектор, содержащий полинуклеотид варианта PGA, функционально связанный с гетерологичным промотором. В некоторых вариантах осуществления экспрессирующие векторы по настоящему изобретению используют для того, чтобы трансформировать подходящие клетки-хозяева, чтобы позволять клеткамхозяевам экспрессировать белок варианта PGA. Способы рекомбинантной экспрессии белков в грибах и других организмах хорошо известны в данной области, и множество экспрессирующих векторов доступно или можно сконструировать с использованием стандартных способов. В некоторых вариантах осуществления конструкции нуклеиновой кислоты по настоящему изобретению содержат вектор, такой как, плазмида, космида, фаг, вирус, бактериальная искусственная хромосома (ВАС), искусственная хромосома дрожжей (YAC) и т.п., в который встроена последовательность нуклеиновой кислоты по изобретению. В некоторых вариантах осуществления полинуклеотиды по настоящему изобретению встраивают в любой один из различных экспрессирующих векторов, подходящих для экспрессии полипептида(ов) варианта PGA. Подходящие векторы включают, но не ограничиваясь этим хромосомные, нехромосомные и синтетические последовательности ДНК (например, производные SV40), а также бактериальные плазмиды, фаговую ДНК, бакуловирусные, дрожжевые плазмиды, векторы, полученные из комбинаций плазмид и фаговой ДНК, вирусную ДНК, например, вируса осповакцины, аденовируса, вируса оспы птиц, псевдобешенства, аденовируса, аденоассоциированного вируса, ретровирусов и многих других. Любой подходящий вектор, который трансдуцирует генетический материал в клетку и, если репликация желательна, который является реплицируемым и жизнеспособным в релевантном хозяине, находит использование в настоящем изобретении.The present invention also provides recombinant constructs containing a sequence encoding at least one PGA variant as provided herein. In some embodiments, the present invention provides an expression vector comprising a PGA variant polynucleotide operably linked to a heterologous promoter. In some embodiments, the expression vectors of the present invention are used to transform suitable host cells to allow the host cells to express a PGA variant protein. Methods for recombinant expression of proteins in fungi and other organisms are well known in the art, and many expression vectors are available or can be constructed using standard methods. In some embodiments, the nucleic acid constructs of the present invention comprise a vector, such as a plasmid, cosmid, phage, virus, bacterial artificial chromosome (BAC), yeast artificial chromosome (YAC), and the like, into which a nucleic acid sequence is inserted at invention. In some embodiments, the polynucleotides of the present invention are inserted into any one of various expression vectors suitable for expressing the PGA variant polypeptide(s). Suitable vectors include, but are not limited to, chromosomal, non-chromosomal and synthetic DNA sequences (e.g. SV40 derivatives), as well as bacterial plasmids, phage DNA, baculovirus, yeast plasmids, vectors derived from combinations of plasmids and phage DNA, viral DNA, e.g. vaccinia virus, adenovirus, fowlpox virus, pseudorabies, adenovirus, adeno-associated virus, retroviruses and many others. Any suitable vector that transduces genetic material into a cell and, if replication is desired, that is replicable and viable in the relevant host finds use in the present invention.
В некоторых вариантах осуществления конструкция дополнительно содержит регуляторные последовательности, включая в качестве неограничивающих примеров промотор, функционально связанный с кодирующей последовательностью белка. Большое число подходящих векторов и промоторов известно специалистам в данной области. В действительности, в некоторых вариантах осуществления, чтобы достигать высоких уровней экспрессии у конкретного хозяина, часто полезно экспрессировать варианты PGA по настоящему изобретению под управлением гетерологичного промотора. В некоторых вариантах осуществления промоторную последовательность функционально связывают с 5'-областью кодирующей вариант PGA последовательности с использованием любого подходящего известного в данной области способа. Примеры эффективных промоторов для экспрессии вариантов PGA включают, но не ограничиваясь этим, промоторы грибов. В некоторых вариантах осуществления находит применение промоторная последовательность, которая управляет экспрессией гена, отличного от гена PGA, в штамме грибов. В качестве неограничивающего примера, можно использовать промотор грибов из гена, кодирующего эндоглюканазу. В некоторых вариантах осуществления находит применение промоторная последовательность, которая управляет экспрессией гена PGA в штамме грибов, отличном от штамма грибов, у которого получали PGA. Примеры других подходящих промоторов, которые можно использовать для того, чтобы управлять транскрипцией нуклеотидных конструкций по настоящему изобретению в клеткаххозяевах нитчатых грибов, включают, но не ограничиваясь этим, промоторы, получаемые из генов ТАКА амилазы Aspergillus oryzae, аспарагиновой протеиназы Rhizomucor miehei, нейтральной альфа-амилазы Aspergillus niger, кислой стабильной альфа-амилазы Aspergillus niger, глюкоамилазы Aspergillus niger или Aspergillus awamori (glaA), липазы Rhizomucor miehei, щелочной протеазы Aspergillus oryzae, триозофосфатизомеразы Aspergillus oryzae, ацетамидазы Aspergillus nidulans и трипсиноподобной протеазы Fusarium oxysporum (см., например, WO 96/00787, включенную в настоящее описание посредством ссылки), а также промотор NA2-tpi (гибрид промоторов из генов нейтральной альфа-амилазы Aspergillus niger и триозофосфатизомеразы Aspergillus oryzae), промоторы, такие как cbh1, cbh2, egl1, egl2, pepA, hfb1, hfb2, xyn1, amy и glaA (см., например, Nunberg et al., Mol. Cell Biol., 4:2306-2315 [1984]; Boel et al., EMBO J., 3:1581-85 [1984]; и европейскую патентную заявку 137280, все они включены в настоящее описание посредством ссылки), и их мутантные, усеченные и гибридные промоторы.In some embodiments, the construct further comprises regulatory sequences, including, but not limited to, a promoter, operably linked to a protein coding sequence. A large number of suitable vectors and promoters are known to those skilled in the art. In fact, in some embodiments, in order to achieve high levels of expression in a particular host, it is often useful to express the PGA variants of the present invention under the control of a heterologous promoter. In some embodiments, the promoter sequence is operably linked to the 5' region of the PGA variant coding sequence using any suitable method known in the art. Examples of effective promoters for the expression of PGA variants include, but are not limited to, fungal promoters. In some embodiments, a promoter sequence is used that directs the expression of a gene other than the PGA gene in a fungal strain. As a non-limiting example, a fungal promoter from a gene encoding an endoglucanase can be used. In some embodiments, a promoter sequence is used that directs expression of the PGA gene in a fungal strain other than the fungal strain from which the PGA was derived. Examples of other suitable promoters that can be used to drive transcription of the nucleotide constructs of the present invention in filamentous fungal host cells include, but are not limited to, promoters derived from the Aspergillus oryzae TAKA amylase genes, Rhizomucor miehei aspartic proteinase, neutral alpha-amylase Aspergillus niger, Aspergillus niger acidic stable alpha-amylase, Aspergillus niger or Aspergillus awamori glucoamylase (glaA), Rhizomucor miehei lipase, Aspergillus oryzae alkaline protease, Aspergillus oryzae triosephosphate isomerase, Aspergillus nidulans acetamidase and Fusarium oxysporum trypsin-like protease (see for example WO 96 /00787, incorporated herein by reference), as well as the NA2-tpi promoter (a hybrid of promoters from the Aspergillus niger neutral alpha-amylase and Aspergillus oryzae triose phosphate isomerase genes), promoters such as cbh1, cbh2, egl1, egl2, pepA, hfb1, hfb2, xyn1, amy and glaA (see, for example, Nunberg et al., Mol. Cell Biol., 4:2306-2315 [1984]; Boel et al., EMBO J., 3:1581-85 [1984]; and European Patent Application 137280, all of which are incorporated herein by reference), and their mutant, truncated and hybrid promoters.
В дрожжевых клетках-хозяевах эффективные промоторы включают, но не ограничиваясь этим, те, что из генов енолазы Saccharomyces cerevisiae (eno-1), галактокиназы Saccharomyces cerevisiae (gal1), алкогольдегидрогеназы/глицеральдегид-3-фосфатдегидрогеназы Saccharomyces cerevisiae (ADH2/GAP) и 3фосфоглицераткиназы S. cerevisiae. Дополнительные эффективные промоторы, которые можно исполь- 18 043748 зовать для дрожжевых клеток-хозяев, известны в данной области (см., например, Romanos et al., YeastIn yeast host cells, effective promoters include, but are not limited to, those of the Saccharomyces cerevisiae enolase (eno-1), Saccharomyces cerevisiae galactokinase (gal1), Saccharomyces cerevisiae alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenase (ADH2/GAP) and 3phosphoglycerate kinases from S. cerevisiae. Additional effective promoters that can be used for yeast host cells are known in the art (see, for example, Romanos et al., Yeast
8:423-488 [1992], включенную в настоящее описание посредством ссылки). Кроме того, промоторы, ассоциированные с получением хитиназы в грибах, находят применение в настоящем изобретении (см., например, Blaiseau and Lafay, Gene 120243-248 [1992]; и Limon et al., Curr. Genet., 28:478-83 [1995], обе они включены в настоящее описание посредством ссылки).8:423-488 [1992], incorporated herein by reference). In addition, promoters associated with chitinase production in fungi find use in the present invention (see, for example, Blaiseau and Lafay, Gene 120243-248 [1992]; and Limon et al., Curr. Genet., 28:478- 83 [1995], both of which are incorporated herein by reference).
Для бактериальных клеток-хозяев подходящие промоторы для управления транскрипцией конструкций нуклеиновой кислоты по настоящему раскрытию включают, но не ограничиваясь этим, промоторы, получаемые из lac-оперона Е.coli, trp-оперона Е. coli, бактериофага А, гена агаразы Streptomyces coelicolor (dagA), гена левансахаразы Bacillus subtilis (sacB), гена альфа-амилазы Bacillus licheniformis (amyL), гена мальтогенной амилазы Bacillus stearothermophilus (amyM), гена альфа-амилазы Bacillus amyloliquefaciens (amyQ), гена пенициллиназы Bacillus licheniformis (penP), генов xylA и xylB Bacillus subtilis и прокариотического гена бета-лактамазы (см., например, Villa-Kamaroff et al., Proc. Natl. Acad. Sci. USA 75: 3727-3731 [1978]), а также промотора tac (см., например, DeBoer et al., Proc. Natl. Acad. Sci. USA 80: 21-25 [1983]).For bacterial host cells, suitable promoters for driving transcription of the nucleic acid constructs of the present disclosure include, but are not limited to, promoters derived from the E. coli lac operon, E. coli trp operon, bacteriophage A, Streptomyces coelicolor agarase gene (dagA ), Bacillus subtilis levansucrase gene (sacB), Bacillus licheniformis alpha-amylase gene (amyL), Bacillus stearothermophilus maltogenic amylase gene (amyM), Bacillus amyloliquefaciens alpha-amylase gene (amyQ), Bacillus licheniformis penicillinase gene (penP), xylA and xylB of Bacillus subtilis and the prokaryotic beta-lactamase gene (see, e.g., Villa-Kamaroff et al., Proc. Natl. Acad. Sci. USA 75: 3727-3731 [1978]), as well as the tac promoter (see, e.g. , DeBoer et al., Proc. Natl. Acad. Sci. USA 80: 21-25 [1983]).
В некоторых вариантах осуществления клонированные варианты PGA по настоящему изобретению также имеют подходящую последовательность терминатора транскрипции, последовательность, распознаваемую клеткой-хозяином для того, чтобы терминировать транскрипцию. Последовательность терминатора функционально связывают с 3'-концом последовательности нуклеиновой кислоты, кодирующей полипептид. Любой терминатор, который функционален в клетке-хозяине, предпочтительно находит применение в настоящем изобретении. Образцовые терминаторы транскрипции для клеток-хозяев нитчатых грибов включают, но не ограничиваясь этим, те, которые получают из генов ТАКА амилазы Aspergillus oryzae, глюкоамилазы Aspergillus niger, антранилатсинтазы Aspergillus nidulans, альфа-глюкозидазы Aspergillus niger и трипсиноподобной протеазы Fusarium oxysporum (также см. патент США № 7399627, включенный в настоящее описание посредством ссылки). В некоторых вариантах осуществления образцовые терминаторы для дрожжевых клеток-хозяев включают те, которые получают из генов енолазы Saccharomyces cerevisiae, цитохрома С Saccharomyces cerevisiae (CYCl) и глицеральдегид-3фосфатдегидрогеназы Saccharomyces cerevisiae. Другие эффективные терминаторы для дрожжевых клеток-хозяев общеизвестны специалистам в данной области (см., например, Romanos et al., Yeast 8:423-88 [1992]).In some embodiments, the cloned PGA variants of the present invention also have a suitable transcription terminator sequence, a sequence recognized by the host cell to terminate transcription. The terminator sequence is operably linked to the 3' end of the nucleic acid sequence encoding the polypeptide. Any terminator that is functional in a host cell preferably finds use in the present invention. Exemplary transcription terminators for filamentous fungal host cells include, but are not limited to, those derived from the Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Aspergillus niger alpha-glucosidase, and Fusarium oxysporum trypsin-like protease genes (see also patent US No. 7,399,627, incorporated herein by reference). In some embodiments, exemplary terminators for yeast host cells include those derived from the Saccharomyces cerevisiae enolase, Saccharomyces cerevisiae cytochrome C (CYCl) and Saccharomyces cerevisiae glyceraldehyde-3phosphate dehydrogenase genes. Other effective terminators for yeast host cells are well known to those skilled in the art (see, eg, Romanos et al., Yeast 8:423-88 [1992]).
В некоторых вариантах осуществления подходящая лидерная последовательность, являющаяся частью клонируемой последовательности варианта PGA, представляет собой нетранслируемую область мРНК, которая важна для трансляции в клетке-хозяине. Лидерную последовательность функционально связывают с 5'-концом последовательности нуклеиновой кислоты, кодирующей полипептид. Любая лидерная последовательность, которая функциональна в клетке-хозяине, предпочтительно находит применение в настоящем изобретении. Образцовые лидеры для клеток-хозяев нитчатых грибов включают, но не ограничиваясь этим, те, которые получают из генов ТАКА амилазы Aspergillus oryzae и триозофосфатизомеразы Aspergillus nidulans. Подходящие лидеры для дрожжевых клеток-хозяев включают, но не ограничиваясь этим, те, которые получают из генов енолазы Saccharomyces cerevisiae (ENO-1), 3фосфоглицераткиназы Saccharomyces cerevisiae, альфа-фактора Saccharomyces cerevisiae и алкогольдегидрогеназы/глицеральдегид-3-фосфатдегидрогеназы Saccharomyces cerevisiae (ADH2/GAP).In some embodiments, a suitable leader sequence that is part of the PGA variant sequence to be cloned is an untranslated region of the mRNA that is important for translation in the host cell. The leader sequence is operably linked to the 5' end of the nucleic acid sequence encoding the polypeptide. Any leader sequence that is functional in a host cell preferably finds use in the present invention. Exemplary leaders for filamentous fungal host cells include, but are not limited to, those derived from the Aspergillus oryzae TAKA amylase and Aspergillus nidulans triose phosphate isomerase genes. Suitable leaders for yeast host cells include, but are not limited to, those derived from the Saccharomyces cerevisiae enolase (ENO-1), Saccharomyces cerevisiae 3phosphoglycerate kinase, Saccharomyces cerevisiae alpha factor, and Saccharomyces cerevisiae alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenase (ADH2) genes. /GAP).
В некоторых вариантах осуществления последовательности по настоящему изобретению также содержат последовательность полиаденилирования, которая представляет собой последовательность, функционально связанную с 3'-концом последовательности нуклеиновой кислоты и которую, при транскрипции, распознает клетка-хозяин в качестве сигнала для добавления остатков полиаденозина к транскрибируемой мРНК. Любая последовательность полиаденилирования, которая функциональна в клеткехозяине, предпочтительно находит применение в настоящем изобретении. Образцовые последовательности полиаденилирования для клеток-хозяев нитчатых грибов включают, но не ограничиваясь этим, те, которые получают из генов ТАКА амилазы Aspergillus oryzae, глюкоамилазы Aspergillus niger, антранилатсинтазы Aspergillus nidulans, трипсиноподобной протеазы Fusarium oxysporum и альфа-глюкозидазы Aspergillus niger. Эффективные последовательности полиаденилирования для дрожжевых клеток-хозяев известны в данной области (см., например, Guo and Sherman, Mol. Cell. Biol., 15:5983-5990 [1995]).In some embodiments, the sequences of the present invention also contain a polyadenylation sequence, which is a sequence operably linked to the 3' end of the nucleic acid sequence and which, when transcribed, is recognized by the host cell as a signal to add polyadenosine residues to the transcribed mRNA. Any polyadenylation sequence that is functional in a host cell preferably finds use in the present invention. Exemplary polyadenylation sequences for filamentous fungal host cells include, but are not limited to, those derived from the Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Fusarium oxysporum trypsin-like protease, and Aspergillus niger alpha-glucosidase genes. Efficient polyadenylation sequences for yeast host cells are known in the art (see, for example, Guo and Sherman, Mol. Cell. Biol., 15:5983-5990 [1995]).
В некоторых вариантах осуществления управляющая последовательность содержит кодирующую сигнальный пептид область, кодирующую аминокислотную последовательность, связываемую с аминоконцом полипептида и направляющую кодируемый полипептид по секреторному пути клетки. 5'-конец кодирующей последовательности в последовательности нуклеиновой кислоты может неотъемлемо содержать кодирующую сигнальный пептид область, в природе связанную с сохранением трансляционной рамки считывания с сегментом кодирующей области, который кодирует секретируемый полипептид. Альтернативно, 5'-конец кодирующей последовательности может содержать кодирующую сигнальный пептид область, которая чужеродна для кодирующей последовательности. Когда кодирующая последовательность в природе не содержит кодирующую сигнальный пептид область, может потребоваться чужеродная кодирующая сигнальный пептид область.In some embodiments, the control sequence comprises a signal peptide coding region encoding an amino acid sequence that binds to the amino terminus of the polypeptide and directs the encoded polypeptide to the secretory pathway of the cell. The 5' end of the coding sequence in the nucleic acid sequence may inherently contain a signal peptide coding region, naturally associated with conservation of translational reading frame with a segment of the coding region that encodes the secreted polypeptide. Alternatively, the 5' end of the coding sequence may contain a signal peptide coding region that is foreign to the coding sequence. When the coding sequence does not naturally contain a signal peptide coding region, a foreign signal peptide coding region may be required.
Альтернативно, чужеродной кодирующей сигнальный пептид областью можно просто замещать ес- 19 043748 тественную кодирующую сигнальный пептид область для того, чтобы усиливать секрецию полипептида.Alternatively, the foreign signal peptide coding region may simply replace the native signal peptide coding region in order to enhance secretion of the polypeptide.
Однако любую кодирующую сигнальный пептид область, которая направляет экспрессируемый полипептид по секреторному пути клетки-хозяина, предпочтительно можно использовать в настоящем изобретении.However, any signal peptide coding region that directs the expressed polypeptide to the secretory pathway of a host cell can preferably be used in the present invention.
Эффективные кодирующие сигнальные пептиды области для бактериальных клеток-хозяев включают, но не ограничиваясь этим, кодирующие сигнальные пептиды области, получаемые из генов мальтогенной амилазы Bacillus NC1B 11837, альфа-амилазы Bacillus stearothermophilus, субтилизина Bacillus licheniformis, бета-лактамазы Bacillus licheniformis, нейтральной протеазы Bacillus stearothermophilus (nprT, nprS, nprM) и prsA Bacillus subtilis.Effective signal peptide coding regions for bacterial host cells include, but are not limited to, signal peptide coding regions derived from the Bacillus NC1B 11837 maltogenic amylase, Bacillus stearothermophilus alpha-amylase, Bacillus licheniformis subtilisin, Bacillus licheniformis beta-lactamase, Bacillus neutral protease genes stearothermophilus (nprT, nprS, nprM) and prsA Bacillus subtilis.
Дополнительные сигнальные пептиды известны в данной области (см., например, Simonen and Palva, Microbiol. Rev., 57: 109-137 [1993]).Additional signal peptides are known in the art (see, for example, Simonen and Palva, Microbiol. Rev., 57: 109-137 [1993]).
Эффективные кодирующие сигнальные пептиды области для клеток-хозяев нитчатых грибов включают, но не ограничиваясь этим, кодирующие сигнальные пептиды области, получаемые из генов ТАКА амилазы Aspergillus oryzae, нейтральной амилазы Aspergillus niger, глюкоамилазы Aspergillus niger, аспарагиновой протеиназы Rhizomucor miehei, целлюлазы Humicola insolens и липазы Humicola lanuginosa.Effective signal peptide coding regions for filamentous fungal host cells include, but are not limited to, signal peptide coding regions derived from the Aspergillus oryzae TAKA amylase, Aspergillus niger neutral amylase, Aspergillus niger glucoamylase, Rhizomucor miehei aspartic proteinase, Humicola insolens cellulase, and lipase genes Humicola lanuginosa.
Эффективные сигнальные пептиды для дрожжевых клеток-хозяев включают, но не ограничиваясь этим, гены альфа-фактора Saccharomyces cerevisiae и инвертазы Saccharomyces cerevisiae. Другие эффективные кодирующие сигнальные пептиды области известны в данной области (см., например, Romanos et al., [1992], выше).Effective signal peptides for yeast host cells include, but are not limited to, the Saccharomyces cerevisiae alpha factor and Saccharomyces cerevisiae invertase genes. Other effective signal peptide coding regions are known in the art (see, eg, Romanos et al., [1992], supra).
В некоторых вариантах осуществления управляющая последовательность содержит кодирующую пропептид область, которая кодирует аминокислотную последовательность, расположенную на аминоконце полипептида. Получаемый полипептид известен как профермент или прополипептид (или зимоген, в некоторых случаях). Прополипептид в целом неактивен и может быть превращен в зрелый активный полипептид PGA посредством каталитического или аутокаталитического отщепления пропептида от прополипептид. Кодирующую пропептид область можно получать из генов щелочной протеазы Bacillus subtilis (aprE), нейтральной протеазы Bacillus subtilis (nprT), альфа-фактора Saccharomyces cerevisiae, аспарагиновой протеиназы Rhizomucor miehei и лактазы Myceliophthora thermophila (см., например, WO 95/33836).In some embodiments, the control sequence comprises a propeptide coding region, which encodes an amino acid sequence located at the amino terminus of the polypeptide. The resulting polypeptide is known as a proenzyme or propolypeptide (or zymogen, in some cases). The propolypeptide is generally inactive and can be converted to the mature active PGA polypeptide by catalytic or autocatalytic cleavage of the propeptide from the propolypeptide. The propeptide coding region can be derived from the Bacillus subtilis alkaline protease (aprE), Bacillus subtilis neutral protease (nprT), Saccharomyces cerevisiae alpha factor, Rhizomucor miehei aspartic proteinase and Myceliophthora thermophila lactase genes (see, for example, WO 95/33836).
Когда обе области сигнального пептида и пропептида присутствуют на аминоконце полипептида, область пропептида располагают рядом с аминоконцом полипептида, а область сигнального пептида располагают рядом с аминоконцом области пропептида.When both signal peptide and propeptide regions are present at the amino terminus of the polypeptide, the propeptide region is located adjacent to the amino terminus of the polypeptide and the signal peptide region is located adjacent to the amino terminus of the propeptide region.
В некоторых вариантах осуществления регуляторные последовательности также используют для того, чтобы сделать возможной регуляцию экспрессии полипептида относительно роста клетки-хозяина. Примеры регуляторных систем представляют собой те, которые обеспечивают экспрессию гена, подлежащего включению или выключению в ответ на химический или физический стимул, включая присутствие регуляторного соединения. В прокариотических клетках-хозяевах подходящие регуляторные последовательности включают, но не ограничиваясь этим, системы операторов lac, tac и trp. В дрожжевых клетках-хозяевах подходящие регуляторные системы включают, например, систему ADH2 или систему GAL1. У нитчатых грибов подходящие регуляторные последовательности включают промотор ТАКА альфа-амилазы, промотор глюкоамилазы Aspergillus niger и промотор глюкоамилазы Aspergillus oryzae.In some embodiments, regulatory sequences are also used to allow the expression of the polypeptide to be regulated relative to the growth of the host cell. Examples of regulatory systems are those that provide expression of a gene to be turned on or off in response to a chemical or physical stimulus, including the presence of a regulatory compound. In prokaryotic host cells, suitable regulatory sequences include, but are not limited to, the lac, tac and trp operator systems. In yeast host cells, suitable regulatory systems include, for example, the ADH2 system or the GAL1 system. In filamentous fungi, suitable regulatory sequences include the TAKA alpha-amylase promoter, the Aspergillus niger glucoamylase promoter, and the Aspergillus oryzae glucoamylase promoter.
Другими примерами регуляторных последовательностей являются те, которые допускают амплификацию гена. В эукариотических системах они включают ген дигидрофолатредуктазы, который амплифицируется в присутствии метотрексата, и гены металлотионеина, которые амплифицируются в присутствии тяжелых металлов. В этих случаях последовательность нуклеиновой кислоты, кодирующую полипептид PGA по настоящему изобретению, следует функционально связывать с регуляторной последовательностью.Other examples of regulatory sequences are those that allow gene amplification. In eukaryotic systems, these include the dihydrofolate reductase gene, which is amplified in the presence of methotrexate, and the metallothionein genes, which are amplified in the presence of heavy metals. In these cases, the nucleic acid sequence encoding the PGA polypeptide of the present invention should be operably linked to a regulatory sequence.
Таким образом, в дополнительных вариантах осуществления настоящее изобретение предусматривает рекомбинантные экспрессирующие векторы, содержащие полинуклеотид, кодирующий сконструированный полипептид PGA или его вариант, и одну или несколько регулирующих экспрессию областей, таких как промотор и терминатор, сайт начала репликации и т.д., в зависимости от типа хозяев, в которые их следует вводить. В некоторых вариантах осуществления различные последовательности нуклеиновой кислоты и управляющие последовательности, описанные выше, соединяют вместе для получения рекомбинантного экспрессирующего вектора, который может содержать один или несколько удобных участков рестрикции для того, чтобы сделать возможной инсерцию или замену последовательности нуклеиновой кислоты, кодирующей полипептид, в таких участках. Альтернативно, в некоторых вариантах осуществления последовательности нуклеиновой кислоты экспрессируют посредством встраивания последовательности нуклеиновой кислоты или конструкции нуклеиновой кислоты, содержащей последовательность, в подходящий вектор для экспрессии. При создании экспрессирующего вектора, кодирующую последовательность располагают в векторе с тем, чтобы функционально связывать кодирующую последовательность с подходящими управляющими последовательностями для экспрессии.Thus, in additional embodiments, the present invention provides recombinant expression vectors comprising a polynucleotide encoding an engineered PGA polypeptide or variant thereof, and one or more expression control regions, such as a promoter and terminator, an origin of replication, etc., depending on the type of hosts into which they should be introduced. In some embodiments, the various nucleic acid sequences and control sequences described above are linked together to produce a recombinant expression vector, which may contain one or more convenient restriction sites to allow the insertion or replacement of a polypeptide-encoding nucleic acid sequence in such areas. Alternatively, in some embodiments, nucleic acid sequences are expressed by inserting the nucleic acid sequence or a nucleic acid construct containing the sequence into a suitable expression vector. When creating an expression vector, a coding sequence is positioned in the vector so as to operably link the coding sequence to suitable expression control sequences.
Рекомбинантный экспрессирующий вектор включает любой подходящий вектор (например, плазмиду или вирус), который можно в целях удобства подвергать процедурам с рекомбинантной ДНК и мо- 20 043748 жет обеспечивать экспрессию полинуклеотидной последовательности. Выбор вектора обычно зависит от совместимости вектора с клеткой-хозяином, в которую вектор следует вводить. В некоторых вариантах осуществления векторы представляют собой линейные или замкнутые кольцевые плазмиды.A recombinant expression vector includes any suitable vector (eg, plasmid or virus) that can be conveniently manipulated with recombinant DNA and can provide expression of a polynucleotide sequence. The choice of vector generally depends on the compatibility of the vector with the host cell into which the vector is to be introduced. In some embodiments, the vectors are linear or closed circular plasmids.
В некоторых вариантах осуществления экспрессирующий вектор представляет собой автономно реплицирующийся вектор (т. е. вектор, который существует в виде внехромосомного объекта, репликация которого не зависит от хромосомной репликации, такого как плазмида, внехромосомный элемент, минихромосома или искусственная хромосома). В некоторых вариантах осуществления вектор содержит любые средства для обеспечения саморепликации. Альтернативно, в некоторых других вариантах осуществления, при введении в клетку-хозяина, вектор встраивают в геном и реплицируют вместе с хромосомой(ами), в которую он встроен. Кроме того, в дополнительных вариантах осуществления находят применение один вектор или плазмида или два или больше вектора или плазмид, которые вместе содержат полную ДНК, подлежащую введению в геном клетки-хозяина, или транспозон.In some embodiments, the expression vector is an autonomously replicating vector (i.e., a vector that exists as an extrachromosomal entity whose replication is independent of chromosomal replication, such as a plasmid, extrachromosomal element, minichromosome, or artificial chromosome). In some embodiments, the vector contains any means to enable self-replication. Alternatively, in some other embodiments, when introduced into a host cell, the vector is inserted into the genome and replicated along with the chromosome(s) into which it is inserted. In addition, in additional embodiments, one vector or plasmid or two or more vectors or plasmids that together contain the entire DNA to be introduced into the host cell genome, or transposon, are used.
В некоторых вариантах осуществления экспрессирующий вектор по настоящему изобретению содержит один или несколько селективных маркеров, которые допускают простой отбор трансформированных клеток. Селективный маркер представляет собой ген, продукт которого обеспечивает устойчивость к биоциду или вирусу, устойчивость к противомикробным средствам или тяжелым металлам, прототрофность для ауксотрофов и т.п. Любые подходящие селективные маркеры для использования в клетках-хозяевах нитчатых грибов находят использование в настоящем изобретении, включая, но не ограничиваясь этим, amdS (ацетамидаза), argB (орнитинкарбамоилтрансфераза), bar (фосфинотрицинацетилтрансфераза), hph (гигромицинфосфотрансфераза), niaD (нитратредуктаза), pyrG (оротидин-5'фосфатдекарбоксилаза), sC (сульфатаденилтрансфераза) и trpC (антранилатсинтаза), а также их эквиваленты. Дополнительные маркеры, которые можно использовать в клетках-хозяевах, таких как Aspergillus, включают, но не ограничиваясь этим, гены amdS и pyrG Aspergillus nidulans или Aspergillus oryzae, и ген bar Streptomyces hygroscopicus. Подходящие маркеры для дрожжевых клеток-хозяев включают, но не ограничиваясь этим, ADE2, HIS3, LEU2, LYS2, МЕТ3, TRP1 и URA3. Примеры бактериальных селективных маркеров включают, но не ограничиваясь этим, гены dal из Bacillus subtilis или Bacillus licheniformis или маркеры, которые придают устойчивость к антибиотикам, такую как устойчивость к ампициллину, канамицину, хлорамфениколу и/или тетрациклину.In some embodiments, the expression vector of the present invention contains one or more selectable markers that allow simple selection of transformed cells. A selectable marker is a gene whose product provides resistance to a biocide or virus, resistance to antimicrobials or heavy metals, prototrophy for auxotrophs, etc. Any suitable selectable markers for use in filamentous fungal host cells find use in the present invention, including, but not limited to, amdS (acetamidase), argB (ornithine carbamoyltransferase), bar (phosphinotricin acetyltransferase), hph (hygromycin phosphotransferase), niaD (nitrate reductase), pyrG (orotidine 5'phosphate decarboxylase), sC (sulfate adenyl transferase) and trpC (anthranilate synthase), as well as their equivalents. Additional markers that can be used in host cells such as Aspergillus include, but are not limited to, the amdS and pyrG genes of Aspergillus nidulans or Aspergillus oryzae, and the bar gene of Streptomyces hygroscopicus. Suitable markers for yeast host cells include, but are not limited to, ADE2, HIS3, LEU2, LYS2, MET3, TRP1 and URA3. Examples of bacterial selectable markers include, but are not limited to, dal genes from Bacillus subtilis or Bacillus licheniformis or markers that confer antibiotic resistance, such as resistance to ampicillin, kanamycin, chloramphenicol and/or tetracycline.
В некоторых вариантах осуществления экспрессирующие векторы по настоящему изобретению содержат элемент(ы), который допускает встраивание вектора в геном клетки-хозяина или автономную репликацию вектора в клетке независимо от генома. В некоторых вариантах осуществления, включающих встраивание в геном клетки-хозяина, векторы основаны на последовательности нуклеиновой кислоты, кодирующей полипептид или любой другой элемент вектора для встраивания вектора в геном посредством гомологичной или негомологичной рекомбинации.In some embodiments, the expression vectors of the present invention contain element(s) that allow the vector to be inserted into the genome of a host cell or to replicate autonomously in the cell independently of the genome. In some embodiments involving insertion into the genome of a host cell, the vectors are based on a nucleic acid sequence encoding a polypeptide or any other vector element for insertion of the vector into the genome via homologous or non-homologous recombination.
В некоторых альтернативных вариантах осуществления, экспрессирующие векторы содержат дополнительные последовательности нуклеиновой кислоты для того, чтобы направлять встраивание посредством гомологичной рекомбинации в геном клетки-хозяина. Дополнительные последовательности нуклеиновой кислоты делают возможным встраивание вектора в геном клетки-хозяина в точном местоположении(ях) в хромосоме(ах). Чтобы увеличивать вероятность встраивания в точном местоположении, интеграционные элементы предпочтительно содержат достаточное число нуклеотидов, такое как от 100 до 10000 пар оснований, предпочтительно от 400 до 10000 пар оснований и наиболее предпочтительно от 800 до 10000 пар оснований, которые высоко гомологичны с соответствующей целевой последовательностью, чтобы увеличивать вероятность гомологичной рекомбинации. Интеграционные элементы могут представлять собой любую последовательность, которая гомологична с целевой последовательностью в геноме клетки-хозяина. Кроме того, интеграционные элементы могут представлять собой некодирующие или кодирующие последовательности нуклеиновой кислоты. С другой стороны, вектор можно встраивать в геном клетки-хозяина посредством негомологичной рекомбинации.In some alternative embodiments, expression vectors contain additional nucleic acid sequences to direct integration through homologous recombination into the host cell genome. Additional nucleic acid sequences enable the vector to be inserted into the host cell genome at precise location(s) on the chromosome(s). To increase the likelihood of insertion at a precise location, the integration elements preferably contain a sufficient number of nucleotides, such as 100 to 10,000 base pairs, preferably 400 to 10,000 base pairs, and most preferably 800 to 10,000 base pairs, that are highly homologous to the corresponding target sequence, to increase the likelihood of homologous recombination. Integration elements can be any sequence that is homologous to a target sequence in the host cell genome. In addition, integration elements can be non-coding or coding nucleic acid sequences. Alternatively, the vector can be inserted into the host cell genome through non-homologous recombination.
Для автономной репликации вектор дополнительно может содержать участок начала репликации, который делает возможной автономную репликацию вектора в рассматриваемой клетке-хозяине. Примеры бактериальных участков начала репликации представляют собой ori P15A или участки начала репликации плазмид pBR322, pUC19, pACYC177 (эта плазмида имеет ori P15A) или pACYC184, которые допускают репликацию в Е. coli, и pUB110, pE194, рТА1060 или pAMe1, которые допускают репликацию в Bacillus. Примеры участков начала репликации для использования в дрожжевых клетках-хозяевах представляет собой 2 мкм участок начала репликации, ARS1, ARS4, комбинацию ARS1 и CEN3 и комбинацию ARS4 и CEN6. Участком начала репликации может быть тот, который имеет мутацию, которая делает его функционирование чувствительным к температуре в клетке-хозяине (см., например, Ehrlich, Proc. Natl. Acad. Sci. USA 75:1433 [1978]).For autonomous replication, the vector may further comprise an origin of replication that allows autonomous replication of the vector in the host cell in question. Examples of bacterial origins of replication are ori P15A or origins of replication of plasmids pBR322, pUC19, pACYC177 (this plasmid has ori P15A) or pACYC184, which are permissible for replication in E. coli, and pUB110, pE194, pTA1060 or pAMe1, which are permissible for replication in Bacillus. Examples of origins of replication for use in yeast host cells are the 2 μm origin of replication, ARS1, ARS4, the combination of ARS1 and CEN3, and the combination of ARS4 and CEN6. An origin of replication may be one that has a mutation that makes its operation temperature sensitive in the host cell (see, for example, Ehrlich, Proc. Natl. Acad. Sci. USA 75:1433 [1978]).
В некоторых вариантах осуществления более чем одну копию последовательности нуклеиновой кислоты по настоящему изобретению вставляют в клетку-хозяина для увеличения продуцирования продукта гена. Увеличение числа копий последовательности нуклеиновой кислоты можно получать посредством встраивания по меньшей мере одной дополнительной копии последовательности в геном клеткихозяина или посредством включения амплифицируемого гена селективного маркера с последовательно- 21 043748 стью нуклеиновой кислоты, где клетки, содержащие амплифицированные копии гена селективного маркера и, тем самым, дополнительные копии последовательности нуклеиновой кислоты, можно выбирать посредством культивирования клеток в присутствии подходящего средства для отбора.In some embodiments, more than one copy of a nucleic acid sequence of the present invention is inserted into a host cell to increase production of a gene product. An increase in the number of copies of a nucleic acid sequence can be obtained by inserting at least one additional copy of the sequence into the genome of a host cell or by incorporating an amplified selectable marker gene with the nucleic acid sequence, wherein cells containing amplified copies of the selectable marker gene and thereby additional copies of the nucleic acid sequence can be selected by culturing the cells in the presence of a suitable selection agent.
Многие экспрессирующие векторы для использования в настоящем изобретении коммерчески доступны. Подходящие коммерческие экспрессирующие векторы включают, но не ограничиваясь этим, экспрессирующие векторы p3xFLAGTMTM (Sigma-Aldrich Chemicals), которые содержат промотор CMV и сайт полиаденилирования hGH для экспрессии в клетках-хозяевах млекопитающих и участок начала репликации pBR322 и маркеры устойчивости к ампициллину для амплификации в Е.coli. Другие подходящие экспрессирующие векторы включают, но не ограничиваясь этим, pBluescriptII SK(-) и pBK-CMV (Stratagene), и плазмиды, полученные из pBR322 (Gibco BRL), pUC (Gibco BRL), pREP4, pCEP4 (Invitrogen) или pPoly (см., например, Lathe et al., Gene 57:193-201 [1987]).Many expression vectors for use in the present invention are commercially available. Suitable commercial expression vectors include, but are not limited to, p3xFLAGTMTM expression vectors (Sigma-Aldrich Chemicals), which contain the CMV promoter and hGH polyadenylation site for expression in mammalian host cells and the pBR322 origin of replication and ampicillin resistance markers for amplification in E .coli. Other suitable expression vectors include, but are not limited to, pBluescriptII SK(-) and pBK-CMV (Stratagene), and plasmids derived from pBR322 (Gibco BRL), pUC (Gibco BRL), pREP4, pCEP4 (Invitrogen) or pPoly ( see, for example, Lathe et al., Gene 57:193-201 [1987]).
Таким образом, в некоторых вариантах осуществления вектор, содержащий последовательность, кодирующую по меньшей мере один вариант PGA, трансформируют в клетку-хозяина для того, чтобы делать возможным размножение вектора и экспрессию варианта(ов) PGA. В некоторых вариантах осуществления варианты PGA являются посттрансляционно модифицированными для того, чтобы удалять сигнальный пептид, и в некоторых случаях могут расщепляться после секреции. В некоторых вариантах осуществления описанную выше трансформированную клетку-хозяина культивируют в подходящей питательной среде в условиях, допускающих экспрессию варианта(ов) PGA. Любая подходящая среда, которую можно использовать для культивирования клеток-хозяев, находит применение в настоящем изобретении, включая в качестве неограничивающих примеров минимальные или комплексные среды, содержащие подходящие добавки. В некоторых вариантах осуществления клетки-хозяева растят в средах НТР. Подходящие среды доступны у различных коммерческих поставщиков, или их можно получать в соответствии с опубликованными прописями (например, в каталогах American Type Culture Collection).Thus, in some embodiments, a vector containing a sequence encoding at least one PGA variant is transformed into a host cell to allow propagation of the vector and expression of the PGA variant(s). In some embodiments, PGA variants are post-translationally modified to remove a signal peptide, and in some cases may be cleaved after secretion. In some embodiments, the transformed host cell described above is cultured in a suitable growth medium under conditions allowing expression of the PGA variant(s). Any suitable medium that can be used to culture host cells finds use in the present invention, including, but not limited to, minimal or complex media containing suitable additives. In some embodiments, host cells are grown in HTP media. Suitable media are available from various commercial suppliers or can be obtained from published recipes (eg, American Type Culture Collection catalogs).
В другом аспекте настоящее изобретение предусматривает клетки-хозяева, содержащие полинуклеотид, кодирующий усовершенствованный полипептид PGA, предусмотренный в настоящем описании, полинуклеотид функционально связывают с одной или несколькими управляющими последовательностями для экспрессии фермента PGA в клетке-хозяине. Клетки-хозяева для использования в экспрессии полипептидов PGA, кодируемых экспрессирующими векторами по настоящему изобретению, хорошо известны в данной области и включают, но не ограничиваясь этим, бактериальные клетки, такие как клетки Е.coli, Bacillus megaterium, Lactobacillus kefir, Streptomyces и Salmonella typhimurium; клетки грибов, такие как дрожжевые клетки (например, Saccharomyces cerevisiae или Pichia pastoris (№ доступа АТСС 201178)); клетки насекомого, такие как клетки Drosophila S2 и Spodoptera Sf9; клетки животного, такие как клетки СНО, COS, BHK, 293 и меланомы Боуэса; и клетки растения. Подходящие среды для культивирования и условия роста для описанных выше клеток-хозяев хорошо известны в данной области.In another aspect, the present invention provides host cells containing a polynucleotide encoding an improved PGA polypeptide as provided herein, the polynucleotide being operably linked to one or more control sequences for expression of a PGA enzyme in the host cell. Host cells for use in the expression of PGA polypeptides encoded by the expression vectors of the present invention are well known in the art and include, but are not limited to, bacterial cells such as E. coli, Bacillus megaterium, Lactobacillus kefir, Streptomyces and Salmonella typhimurium cells ; fungal cells, such as yeast cells (for example, Saccharomyces cerevisiae or Pichia pastoris (Accession No. ATCC 201178)); insect cells such as Drosophila S2 and Spodoptera Sf9 cells; animal cells such as CHO, COS, BHK, 293 and Bowes melanoma cells; and plant cells. Suitable culture media and growth conditions for the host cells described above are well known in the art.
Полинуклеотиды для экспрессии PGA можно вводить в клетки с помощью различных известных в данной области способов. Приемы включают, среди прочих, электропорацию, бомбардировку биолистическими частицами, опосредованную липосомами трансфекцию, трансфекцию с хлоридом кальция и слияние протопластов. Различные способы введения полинуклеотидов в клетки известны специалистам в данной области.PGA expression polynucleotides can be introduced into cells using a variety of methods known in the art. Techniques include electroporation, biolistic particle bombardment, liposome-mediated transfection, calcium chloride transfection, and protoplast fusion, among others. Various methods for introducing polynucleotides into cells are known to those skilled in the art.
В некоторых вариантах осуществления клетка-хозяин представляет собой эукариотическую клетку. Подходящие эукариотические клетки-хозяева включают, но не ограничиваясь этим, клетки грибов, клетки водорослей, клетки насекомого и клетки растения. Подходящие клетки-хозяева грибов включают, но не ограничиваясь этим, Ascomycota, Basidiomycota, Deuteromycota, Zygomycota, Fungi imperfecti. В некоторых вариантах осуществления клетки-хозяева грибов представляют собой клетки дрожжей и клетки нитчатых грибов. Клетки-хозяева нитчатых грибов по настоящему изобретению включают все нитчатые формы подотдела Eumycotina и Oomycota. Нитчатые грибы отличаются вегетативным мицелием с клеточной стенкой, состоящей из хитина, целлюлозы и других сложных полисахаридов. Клетки-хозяева нитчатых грибов по настоящему изобретению морфологически отличны от дрожжей.In some embodiments, the host cell is a eukaryotic cell. Suitable eukaryotic host cells include, but are not limited to, fungal cells, algal cells, insect cells and plant cells. Suitable fungal host cells include, but are not limited to, Ascomycota, Basidiomycota, Deuteromycota, Zygomycota, Fungi imperfecti. In some embodiments, the fungal host cells are yeast cells and filamentous fungal cells. The filamentous fungal host cells of the present invention include all filamentous forms of the subdivision Eumycotina and Oomycota. Filamentous fungi are distinguished by vegetative mycelium with a cell wall consisting of chitin, cellulose and other complex polysaccharides. The host cells of the filamentous fungi of the present invention are morphologically distinct from yeast.
В некоторых вариантах осуществления настоящего изобретения клетки-хозяева нитчатых грибов относятся к любому подходящему роду и виду, включая в качестве неограничивающих примеров Achlya, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Cephalosporium, Chrysosporium, Cochliobolus, Corynascus, Cryphonectria, Cryptococcus, Coprinus, Coriolus, Diplodia, Endothis, Fusarium, Gibberella, Gliocladium, Humicola, Hypocrea, Myceliophthora, Mucor, Neurospora, Penicillium, Podospora, Phlebia, Piromyces, Pyricularia, Rhizomucor, Rhizopus, Schizophyllum, Scytalidium, Sporotrichum, Talaromyces, Thermoascus, Thielavia, Trametes, Tolypocladium, Trichoderma, Verticillium и/или Volvariella и/или телеоморфы или анаморфы, а также их синонимы, базионимы или таксономические эквиваленты.In some embodiments of the present invention, the filamentous fungal host cells are any suitable genus and species, including, but not limited to, Achlya, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Cephalosporium, Chrysosporium, Cochliobolus, Corynascus, Cryphonectria, Cryptococcus, Coprinus, Coriolus, Diplodia, Endothis, Fusarium, Gibberlla, Gliocladium, Humicola, Hypocrea, Myceliophthora, Mucor, Neurospora, Penicillium, Podospora, Phlebia, PIROMYCES, PIROMYCES, PIROMYCES, PIROMYCES, PIROMYCES, PIROMYCES, PIROMYCES, PIROMYCES Yricularia, Rhizomucor, Rhizopus, Schizophyllum, Scytalidium, Sporotrichum, Talaromyces, Thermoascus, Thielavia, Trametes, Tolypocladium, Trichoderma, Verticillium and/or Volvariella and/or teleomorphs or anamorphs, as well as their synonyms, basionyms or taxonomic equivalents.
В некоторых вариантах осуществления настоящего изобретения, клетка-хозяин представляет собой клетку дрожжей, включая в качестве неограничивающих примеров клетки видов Candida, Hansenula, Saccharomyces, Schizosaccharomyces, Pichia, Kluyveromyces или Yarrowia. В некоторых вариантах осуществления настоящего изобретения клетка дрожжей представляет собой Hansenula polymorpha, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces norbensis, SaccharomycesIn some embodiments of the present invention, the host cell is a yeast cell, including but not limited to Candida, Hansenula, Saccharomyces, Schizosaccharomyces, Pichia, Kluyveromyces, or Yarrowia species. In some embodiments of the present invention, the yeast cell is Hansenula polymorpha, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces norbensis, Saccharomyces
- 22 043748 kluyveri, Schizosaccharomyces pombe, Pichia pastoris, Pichia finlandica, Pichia trehalophila, Pichia kodamae,- 22 043748 kluyveri, Schizosaccharomyces pombe, Pichia pastoris, Pichia finlandica, Pichia trehalophila, Pichia kodamae,
Pichia membranaefaciens, Pichia opuntiae, Pichia thermotolerans, Pichia salictaria, Pichia quercuum, Pichia pijperi, Pichia stipitis, Pichia methanolica, Pichia angusta, Kluyveromyces lactis, Candida albicans или Yarrowia lipolytica.Pichia membranaefaciens, Pichia opuntiae, Pichia thermotolerans, Pichia salictaria, Pichia quercuum, Pichia pijperi, Pichia stipitis, Pichia methanolica, Pichia angusta, Kluyveromyces lactis, Candida albicans or Yarrowia lipolytica.
В некоторых вариантах осуществления изобретения клетка-хозяин представляет собой клетку водоросли, например, Chlamydomonas (например, С. reinhardtii) и Phormidium (P. sp. АТСС29409).In some embodiments, the host cell is an algal cell, such as Chlamydomonas (eg, C. reinhardtii) and Phormidium (P. sp. ATCC29409).
В некоторых других вариантах осуществления клетка-хозяин представляет собой прокариотическую клетку. Подходящие прокариотические клетки включают, но не ограничиваясь этим, грамположительные, грамотрицательные и грамвариабельные бактериальные клетки. Любой подходящий бактериальный организм находит применение в настоящем изобретении, включая в качестве неограничивающих примеров Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Acinetobacter, Acidothermus, Arthrobacter, Azobacter, Bacillus, Bifidobacterium, Brevibacterium, Butyrivibrio, Buchnera, Campestris, Camplyobacter, Clostridium, Corynebacterium, Chromatium, Coprococcus, Escherichia, Enterococcus, Enterobacter, Erwinia, Fusobacterium, Faecalibacterium, Francisella, Flavobacterium, Geobacillus, Haemophilus, Helicobacter, Klebsiella, Lactobacillus, Lactococcus, Ilyobacter, Micrococcus, Microbacterium, Mesorhizobium, Methylobacterium, Methylobacterium, Mycobacterium, Neisseria, Pantoea, Pseudomonas, Prochlorococcus, Rhodobacter, Rhodopseudomonas, Rhodopseudomonas, Roseburia, Rhodospirillum, Rhodococcus, Scenedesmus, Streptomyces, Streptococcus, Synecoccus, Saccharomonospora, Staphylococcus, Serratia, Salmonella, Shigella, Thermoanaerobacterium, Tropheryma, Tularensis, Temecula, Thermosynechococcus, Thermococcus, Ureaplasma, Xanthomonas, Xylella, Yersinia и Zymomonas. В некоторых вариантах осуществления клетка-хозяин представляет собой вид Agrobacterium, Acinetobacter, Azobacter, Bacillus, Bifidobacterium, Buchnera, Geobacillus, Campylobacter, Clostridium, Corynebacterium, Escherichia, Enterococcus, Erwinia, Flavobacterium, Lactobacillus, Lactococcus, Pantoea, Pseudomonas, Staphylococcus, Salmonella, Streptococcus, Streptomyces или Zymomonas. В некоторых вариантах осуществления бактериальный штамм-хозяин не патогенен для человека. В некоторых вариантах осуществления бактериальный штамм-хозяин представляет собой промышленный штамм. Многие бактериальные промышленные штаммы известны и подходят для настоящего изобретения. В некоторых вариантах осуществления настоящего изобретения, бактериальная клеткахозяин относится к виду Agrobacterium (например, A. radiobacter, A. rhizogenes и А. rubi). В некоторых вариантах осуществления настоящего изобретения, бактериальная клетка-хозяин относится к виду Arthrobacter (например, A. aurescens, A. citreus, A. globiformis, A. hydrocarboglutamicus, A. mysorens, A. nicotianae, A. paraffineus, A. protophonniae, A. roseoparqffinus, A. sulfureus и A. ureafaciens). В некоторых вариантах осуществления настоящего изобретения бактериальная клетка-хозяин относится к виду Bacillus (например, В. thuringensis, В. anthracis, В. megaterium, В. subtilis, В. lentus, В. circulans, В. pumilus, В. lautus, B.coagulans, В. brevis, В. firmus, В. alkaophius, В. licheniformis, В. clausii, B. stearothermophilus, В. halodurans и В. amyloliquefaciens). В некоторых вариантах осуществления клетка-хозяин представляет собой промышленный штамм Bacillus, включая в качестве неограничивающих примеров В. subtilis, В. pumilus, В. licheniformis, В. megaterium, В. clausii, В. stearothermophilus или В. amyloliquefaciens. В некоторых вариантах осуществления клетки-хозяева Bacillus представляют собой В. subtilis, В. licheniformis, В. megaterium, В. stearothermophilus и/или В. amyloliquefaciens. В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Clostridium (например, С. acetobutylicum, С. tetani E88, С. lituseburense, C. saccharobutylicum, С. perfringens и С. beijerinckii). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Corynebacterium (например, С. glutamicum и С. acetoacidophilum). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Escherichia (например, Е. coli). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Erwinia (например, Е. uredovora, E. carotovora, E. ananas, E. herbicola, E. punctata и Е. terreus). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Pantoea (например, P. Citrea и P. agglomerans). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Pseudomonas (например, P. putida, P. aeruginosa, P. Mevalonii и P. sp. D-01 10). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Streptococcus (например, S. equisimiles, S. Pyogenes и S. uberis). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Streptomyces (например, S. ambofaciens, S. achromogenes, S. avermitilis, S. coelicolor, S. aureofaciens, S. aureus, S. fungicidicus, S. Griseus и S. lividans). В некоторых вариантах осуществления бактериальная клетка-хозяин относится к виду Zymomonas (например, Z. mobilis и Z. lipolytica).In some other embodiments, the host cell is a prokaryotic cell. Suitable prokaryotic cells include, but are not limited to, gram-positive, gram-negative and gram-variable bacterial cells. Any suitable bacterial organism finds use in the present invention, including but not limited to Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Acinetobacter, Acidothermus, Arthrobacter, Azobacter, Bacillus, Bifidobacterium, Brevibacterium, Butyrivibrio, Buchnera, Campestris, Camplyobacter, Clostridium, Corynebacterium, Chromatium , Coprococcus, Escherichia, Enterococcus, Enterobacter, Erwinia, Fusobacterium, Faecalibacterium, Francisella, Flavobacterium, Geobacillus, Haemophilus, Helicobacter, Klebsiella, Lactobacillus, Lactococcus, Ilyobacter, Micrococcus, Microbacterium, Mesorhizobium, Methylobacterium, Methylobacterium, Mycobacterium, Neisseria, Pantoea, Pseudomonas , Prochlorococcus, Rhodobacter, Rhodopseudomonas, Rhodopseudomonas, Roseburia, Rhodospirillum, Rhodococcus, Scenedesmus, Streptomyces, Streptococcus, Synecoccus, Saccharomonospora, Staphylococcus, Serratia, Salmonella, Shigella, Thermoanaerobacterium, Tropheryma, Tularensis, Temecula, Therm osynechococcus, Thermococcus, Ureaplasma, Xanthomonas, Xylella , Yersinia and Zymomonas. In some embodiments, the host cell is a species of Agrobacterium, Acinetobacter, Azobacter, Bacillus, Bifidobacterium, Buchnera, Geobacillus, Campylobacter, Clostridium, Corynebacterium, Escherichia, Enterococcus, Erwinia, Flavobacterium, Lactobacillus, Lactococcus, Pantoea, Pseudomonas, Staphylococcus, Salmonella, Streptococcus, Streptomyces or Zymomonas. In some embodiments, the host bacterial strain is not pathogenic to humans. In some embodiments, the host bacterial strain is a commercial strain. Many commercial bacterial strains are known and are suitable for the present invention. In some embodiments of the present invention, the bacterial host is an Agrobacterium species (eg, A. radiobacter, A. rhizogenes, and A. rubi). In some embodiments of the present invention, the bacterial host cell is an Arthrobacter species (e.g., A. aurescens, A. citreus, A. globiformis, A. hydrocarboglutamicus, A. mysorens, A. nicotianae, A. paraffineus, A. protophonniae, A. roseoparqffinus, A. sulfureus and A. ureafaciens). In some embodiments of the present invention, the bacterial host cell is a Bacillus species (e.g., B. thuringensis, B. anthracis, B. megaterium, B. subtilis, B. lentus, B. circulans, B. pumilus, B. lautus, B. .coagulans, B. brevis, B. firmus, B. alkaophius, B. licheniformis, B. clausii, B. stearothermophilus, B. halodurans and B. amyloliquefaciens). In some embodiments, the host cell is a commercial strain of Bacillus, including but not limited to B. subtilis, B. pumilus, B. licheniformis, B. megaterium, B. clausii, B. stearothermophilus, or B. amyloliquefaciens. In some embodiments, the Bacillus host cells are B. subtilis, B. licheniformis, B. megaterium, B. stearothermophilus, and/or B. amyloliquefaciens. In some embodiments, the bacterial host cell is a Clostridium species (eg, C. acetobutylicum, C. tetani E88, C. lituseburense, C. saccharobutylicum, C. perfringens, and C. beijerinckii). In some embodiments, the bacterial host cell is a Corynebacterium species (eg, C. glutamicum and C. acetoacidophilum). In some embodiments, the bacterial host cell is an Escherichia species (eg, E. coli). In some embodiments, the bacterial host cell is an Erwinia species (eg, E. uredovora, E. carotovora, E. ananas, E. herbicola, E. punctata, and E. terreus). In some embodiments, the bacterial host cell is a Pantoea species (eg, P. Citrea and P. agglomerans). In some embodiments, the bacterial host cell is a Pseudomonas species (eg, P. putida, P. aeruginosa, P. mevalonii, and P. sp. D-01 10). In some embodiments, the bacterial host cell is a Streptococcus species (eg, S. equisimiles, S. Pyogenes, and S. uberis). In some embodiments, the bacterial host cell is a Streptomyces species (e.g., S. ambofaciens, S. achromogenes, S. avermitilis, S. coelicolor, S. aureofaciens, S. aureus, S. fungicidicus, S. griseus, and S. lividans ). In some embodiments, the bacterial host cell is a Zymomonas species (eg, Z. mobilis and Z. lipolytica).
Образцовой клеткой-хозяином является Escherichia coli W3110. Экспрессирующий вектор создавали, функционально связывая полинуклеотид, кодирующий усовершенствованную PGA, в плазмиду pCK110900, функционально связанную с промотор lac под управлением репрессора lad. Экспрессирующий вектор также содержал участок начала репликации Р15а и ген устойчивости к хлорамфениколу. Клетки, содержащие рассматриваемый полинуклеотид в Escherichia coli W3110, выделяли через отбор клеток с использованием хлорамфеникола.The model host cell is Escherichia coli W3110. An expression vector was created by operably linking a polynucleotide encoding an improved PGA into plasmid pCK110900, operably linked to the lac promoter under the control of the lad repressor. The expression vector also contained the P15a origin of replication and the chloramphenicol resistance gene. Cells containing the polynucleotide in question in Escherichia coli W3110 were isolated through cell selection using chloramphenicol.
Многие прокариотические и эукариотические штаммы, которые находят использование в настоящем изобретении, легко доступны для публики во многих коллекциях культур, таких как American Type Culture Collection (ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSM), Cen- 23 043748 traalbureau Voor Schimmelcultures (CBS) и Agricultural Research Service Patent Culture Collection, NorthernMany prokaryotic and eukaryotic strains that find use in the present invention are readily available to the public in many culture collections, such as the American Type Culture Collection (ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSM), Cen- 23 043748 traalbureau Voor Schimmelcultures (CBS) and Agricultural Research Service Patent Culture Collection, Northern
Regional Research Center (NRRL).Regional Research Center (NRRL).
В некоторых вариантах осуществления клетки-хозяева генетически модифицируют, чтобы они имели характеристики, которые усовершенствуют секрецию белка, стабильность белка и/или другие свойства, желательные для экспрессии и/или секреции белка. Генетическую модификацию можно осуществлять с помощью приемов генетической инженерии и/или классических микробиологических приемов (например, химический или УФ мутагенез и последующий отбор). В действительности, в некоторых вариантах осуществления комбинации приемов рекомбинантной модификации и классического отбора используют для получения клеток-хозяев. Используя рекомбинантную технологию, молекулы нуклеиновой кислоты можно вводить, удалять, ингибировать или модифицировать таким образом, который ведет к увеличенному выходу варианта(ов) PGA в клетке-хозяине и/или в среде для культивирования. Например, нокаут функции Alp1 ведет к клетке с протеазной недостаточностью, а нокаут функции pyr5 ведет к клетке с фенотипом дефицита пиримидина. В одном подходе генетической инженерии гомологичную рекомбинацию используют для того, чтобы индуцировать модификации целевого гена посредством конкретного направленного воздействия на ген in vivo, чтобы подавлять экспрессию кодируемого белка. В альтернативных подходах находят использование миРНК, антисмысловая и/или рибозимная технология при ингибировании экспрессии гена. В данной области известны различные способы для снижения экспрессии белка в клетках, включая в качестве неограничивающих примеров делецию целиком или частично гена, кодирующего белок, и сайт-специфический мутагенез для нарушения экспрессии или активности продукта гена. (см., например, Chaveroche et al., Nucl. Acids Res., 28:22 e97 [2000]; Cho et al., Molec. Plant Microbe Interact., 19:7-15 [2006]; Maruyama and Kitamoto, Biotechnol Lett., 30:1811-1817 [2008]; Takahashi et al., Mol. Gen. Genom., 272: 344-352 [2004]; и You et al., Arch. Micriobiol.,191:615-622 [2009], все они включены по ссылке в настоящее описание). Также находит применение случайный мутагенез, за которым следует скрининг желаемых мутаций (см., например, Combier et al., FEMS Microbiol. Lett., 220:141-8 [2003]; и Firon et al., Eukary. Cell 2:247-55 [2003], обе включены по ссылке).In some embodiments, host cells are genetically modified to have characteristics that improve protein secretion, protein stability, and/or other properties desired for protein expression and/or secretion. Genetic modification can be carried out using genetic engineering techniques and/or classical microbiological techniques (for example, chemical or UV mutagenesis and subsequent selection). In fact, in some embodiments, combinations of recombinant modification and classical selection techniques are used to obtain host cells. Using recombinant technology, nucleic acid molecules can be introduced, removed, inhibited or modified in a manner that leads to increased yield of PGA variant(s) in the host cell and/or culture medium. For example, knockout of Alp1 function leads to a cell with protease deficiency, and knockout of pyr5 function leads to a cell with a pyrimidine deficiency phenotype. In one genetic engineering approach, homologous recombination is used to induce modifications of a target gene by specifically targeting the gene in vivo to inhibit expression of the encoded protein. Alternative approaches include the use of siRNA, antisense and/or ribozyme technology to inhibit gene expression. Various methods are known in the art to reduce protein expression in cells, including, but not limited to, deletion of all or part of the gene encoding the protein and site-directed mutagenesis to disrupt the expression or activity of the gene product. (See, for example, Chaveroche et al., Nucl. Acids Res., 28:22 e97 [2000]; Cho et al., Molec. Plant Microbe Interact., 19:7-15 [2006]; Maruyama and Kitamoto, Biotechnol Lett., 30:1811-1817 [2008]; Takahashi et al., Mol. Gen. Genom., 272: 344-352 [2004]; and You et al., Arch. Micriobiol., 191:615-622 [2009], all of which are incorporated by reference herein). Random mutagenesis followed by screening for desired mutations is also used (see, for example, Combier et al., FEMS Microbiol. Lett., 220:141-8 [2003]; and Firon et al., Eukary. Cell 2:247 -55 [2003], both included by reference).
Введение вектора или конструкции ДНК в клетку-хозяина можно выполнять с использованием любого подходящего известного в данной области способа, включая в качестве неограничивающих примеров трансфекцию с фосфатом кальция, опосредованную DEAE-декстраном трансфекцию, PEGопосредованную трансформацию, электропорацию или другие обычные приемы, известные в данной области.Introduction of a vector or DNA construct into a host cell can be accomplished using any suitable method known in the art, including, but not limited to, calcium phosphate transfection, DEAE-dextran-mediated transfection, PEG-mediated transformation, electroporation, or other conventional techniques known in the art. .
В некоторых вариантах осуществления сконструированные клетки-хозяева (т.е. рекомбинантные клетки-хозяева) по настоящему изобретению культивируют в стандартных питательных средах модифицированных по ситуации для активации промоторов, отбора трансформантов или амплификации полинуклеотида PGA. Условия культивирования, такие как температура, рН и т.п., представляют собой то, что использовали ранее для клетки-хозяина, выбранной для экспрессии, и они общеизвестны специалистам в данной области. Как отмечено, многие стандартные источники и тексты доступны для культивирования и получения многих клеток, включая клетки, происходящие от бактерий, растений, животных (в частности, млекопитающих) и архебактерий.In some embodiments, engineered host cells (ie, recombinant host cells) of the present invention are cultured in standard culture media modified as appropriate for promoter activation, transformant selection, or PGA polynucleotide amplification. Culture conditions such as temperature, pH, etc. are those previously used for the host cell selected for expression and are well known to those skilled in the art. As noted, many standard sources and texts are available for the culture and production of many cells, including cells derived from bacteria, plants, animals (particularly mammals), and archaebacteria.
В некоторых вариантах осуществления клетки, экспрессирующие полипептиды вариантов PGA по изобретению, растят в условиях порционной или непрерывной ферментации. Классическая порционная ферментация представляет собой закрытую систему, в которой композиции среды задают в начале ферментации и не подвергают искусственным изменениям в ходе ферментации. Вариацией порционной системы является порционная ферментация с подпиткой, которая также находит применение в настоящем изобретении. В этой вариации субстрат добавляют частями по мере протекания ферментации. Порционные системы с подпиткой можно использовать, когда катаболитная репрессия вероятно ингибирует метаболизм клеток и когда желательно иметь ограниченные количества субстрата в среде. Порционная ферментация и порционная ферментация с подпиткой являются обычными и хорошо известными в данной области. Непрерывная ферментация представляет собой открытую систему, где определенную среду для ферментации непрерывно добавляют в биореактор и одновременно равное количество кондиционированной среды удаляют для обработки. Непрерывная ферментация в целом поддерживает культуры при постоянной высокой плотности, где клетки прежде всего находятся в логарифмической фазе роста. Системы непрерывной ферментации стремятся поддерживать условия устойчивого роста. Способы с модулирующими питательными веществами и факторами роста для непрерывного процесса ферментации, а также приемы максимизации скорости образования продукта, хорошо известны в области промышленной микробиологии.In some embodiments, cells expressing PGA variant polypeptides of the invention are grown under batch or continuous fermentation conditions. Classic batch fermentation is a closed system in which the composition of the medium is set at the beginning of fermentation and is not subject to artificial changes during fermentation. A variation of the batch system is fed-batch fermentation, which also finds use in the present invention. In this variation, the substrate is added in portions as fermentation progresses. Fed-batch systems can be used when catabolite repression is likely to inhibit cell metabolism and when it is desirable to have limited amounts of substrate in the medium. Batch fermentation and fed-batch fermentation are common and well known in the art. Continuous fermentation is an open system where a specified fermentation medium is continuously added to the bioreactor and simultaneously an equal amount of conditioned medium is removed for processing. Continuous fermentation generally maintains cultures at a constant high density, where cells are primarily in logarithmic growth phase. Continuous fermentation systems strive to maintain sustainable growth conditions. Techniques with modulating nutrients and growth factors for a continuous fermentation process, as well as techniques for maximizing the rate of product formation, are well known in the field of industrial microbiology.
В некоторых вариантах осуществления настоящего изобретения, бесклеточные системы транскрипции/трансляции находят использование при получении варианта(ов) PGA. Несколько систем коммерчески доступны, и способы общеизвестны специалистам в данной области.In some embodiments of the present invention, cell-free transcription/translation systems are used in the production of PGA variant(s). Several systems are commercially available and the methods are well known to those skilled in the art.
Настоящее изобретение предусматривает способы получения полипептидов вариантов PGA или их биологически активных фрагментов. В некоторых вариантах осуществления способ включает: предоставление клетки-хозяина, трансформированной полинуклеотидом, кодирующим аминокислотную последовательность, которая обладает по меньшей мере приблизительно 70% (или по меньшей мере прибли- 24 043748 зительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99%) идентичностью последовательностей с SEQ ID № 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160, и содержит по меньшей мере одну мутацию, как предусмотрено в настоящем описании; культивирование трансформированной клетки-хозяина в среде для культивирования в условиях, в которых клетка-хозяин экспрессирует кодируемый полипептид варианта PGA; и необязательно извлечение или выделение экспрессируемого полипептида варианта PGA и/или извлечение или выделение среды для культивирования, содержащей экспрессируемый полипептид варианта PGA. В некоторых вариантах осуществления способы дополнительно предусматривают необязательный лизис трансформированных клеток-хозяев после экспрессии кодируемого полипептида PGA и необязательно извлечение и/или выделение экспрессируемого полипептида варианта PGA из клеточного лизата. Настоящее изобретение дополнительно предусматривает способы получения полипептида варианта PGA, включающие культивирование клетки-хозяина, трансформированной полипептидом варианта PGA, в условиях, подходящих для продуцирования полипептида варианта PGA, и извлечение полипептида варианта PGA. Обычно, извлечение или выделение полипептида PGA происходит из культуральной среды клетки-хозяина, клетки-хозяина или обеих с использованием приемов извлечения белка, которые хорошо известны в данной области, включая те, что описаны в настоящем описании. В некоторых вариантах осуществления клетки-хозяева собирают посредством центрифугирования, разрушают физическими или химическими средствами и получаемый неочищенный экстракт сохраняют для дальнейшей очистки. Микробные клетки, используемые при экспрессии белков, можно разрушать любым удобным способом, включая в качестве неограничивающих примеров циклическое замораживание-оттаивание, обработку звуком, механическое разрушение и/или использование средств для лизиса клеток, а также многими другими подходящими способами, хорошо известными специалистам в данной области.The present invention provides methods for producing PGA variant polypeptides or biologically active fragments thereof. In some embodiments, the method includes: providing a host cell transformed with a polynucleotide encoding an amino acid sequence that has at least about 70% (or at least about 75%, at least about 80%, about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%) sequence identity to SEQ ID No. 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/or 160, and contains at least one mutation as provided herein; culturing the transformed host cell in a culture medium under conditions in which the host cell expresses the encoded PGA variant polypeptide; and optionally recovering or isolating the expressed PGA variant polypeptide and/or recovering or isolating a culture medium containing the expressed PGA variant polypeptide. In some embodiments, the methods further comprise optionally lysing transformed host cells following expression of the encoded PGA polypeptide and optionally extracting and/or isolating the expressed PGA variant polypeptide from the cell lysate. The present invention further provides methods for producing a PGA variant polypeptide, comprising culturing a host cell transformed with a PGA variant polypeptide under conditions suitable for producing a PGA variant polypeptide, and recovering the PGA variant polypeptide. Typically, recovery or isolation of the PGA polypeptide occurs from the culture medium of the host cell, the host cell, or both, using protein recovery techniques that are well known in the art, including those described herein. In some embodiments, host cells are collected by centrifugation, disrupted by physical or chemical means, and the resulting crude extract is stored for further purification. Microbial cells used in the expression of proteins can be disrupted by any convenient method, including, but not limited to, freeze-thaw cycling, sonication, mechanical disruption, and/or the use of cell lysis agents, as well as many other suitable methods well known to those skilled in the art. areas.
Сконструированные ферменты PGA, экспрессируемые в клетке-хозяине, можно извлекать из клеток и/или среда для культивирования с использованием любого одного или нескольких общеизвестных приемов для очистки белка, включая, среди прочего, обработку лизоцимом, обработку звуком, фильтрование, высаливание, ультрацентрифугирование и хроматографию. Подходящие растворы для лизирования и высокоэффективного экстрагирования белков из бактерий, таких как Е. coli, коммерчески доступны под торговым названием CelLytic В™ (Sigma-Aldrich).The engineered PGA enzymes expressed in the host cell can be recovered from the cells and/or culture medium using any one or more conventional protein purification techniques including, but not limited to, lysozyme treatment, sonication, filtration, salting out, ultracentrifugation, and chromatography . Suitable solutions for lysing and highly efficient extraction of proteins from bacteria such as E. coli are commercially available under the trade name CelLytic B™ (Sigma-Aldrich).
Таким образом, в некоторых вариантах осуществления получаемый полипептид извлекают/выделяют и необязательно очищают любыми из многих известных в данной области способов. Например, в некоторых вариантах осуществления полипептид выделяют из питательной среды с помощью стандартных процедур, включая в качестве неограничивающих примеров центрифугирование, фильтрование, экстрагирование, распылительную сушку, испарение, хроматографию (например, ионообменную, аффинную, гидрофобного взаимодействия, хроматофокусирование и эксклюзионную) или преципитацию. В некоторых вариантах осуществления стадии повторной укладки белка используют, по желанию, по заврешении конфигурация зрелого белка. Кроме того, в некоторых вариантах осуществления высокоэффективную жидкостную хроматографию (HPLC) используют на конечных стадиях очистки. Например, в некоторых вариантах осуществления известные в данной области способы находят использование в настоящем изобретении (см., например, Parry et al., Biochem. J., 353:117 [2001]; и Hong et al., Appl. Microbiol. Biotechnol., 73:1331 [2007], обе включены в настоящее описание посредством ссылки). В действительности, любые подходящие способы очистки, известные в данной области, находят использование в настоящем изобретении.Thus, in some embodiments, the resulting polypeptide is recovered/isolated and optionally purified by any of many methods known in the art. For example, in some embodiments, the polypeptide is isolated from the culture medium using standard procedures, including, but not limited to, centrifugation, filtration, extraction, spray drying, evaporation, chromatography (e.g., ion exchange, affinity, hydrophobic interaction, chromatofocusing and size exclusion) or precipitation. In some embodiments, protein refolding steps optionally utilize the mature protein configuration upon completion. Additionally, in some embodiments, high performance liquid chromatography (HPLC) is used in the final purification steps. For example, in some embodiments, methods known in the art are used in the present invention (see, for example, Parry et al., Biochem. J., 353:117 [2001]; and Hong et al., Appl. Microbiol. Biotechnol ., 73:1331 [2007], both incorporated herein by reference). In fact, any suitable purification methods known in the art find use in the present invention.
Хроматографические приемы для выделения полипептида PGA включают, но не ограничиваясь этим, хроматографию с обращенной фазой высокоэффективную жидкостную хроматографию, ионообменную хроматографию, электрофорез в геле и аффинную хроматографию. Условия для очистки конкретного фермента зависят отчасти от таких факторов, как суммарный заряд, гидрофобность, гидрофильность, молекулярная масса, молекулярная форма и т.д., которые известны специалистам в данной области.Chromatographic techniques for isolating PGA polypeptide include, but are not limited to, reverse phase chromatography, high performance liquid chromatography, ion exchange chromatography, gel electrophoresis, and affinity chromatography. The conditions for purifying a particular enzyme depend in part on factors such as net charge, hydrophobicity, hydrophilicity, molecular weight, molecular shape, etc., which are known to those skilled in the art.
В некоторых вариантах осуществления аффинные приемы находят использование при выделении усовершенствованных ферментов PGA. Для очистки аффинной хроматографией можно использовать любое антитело, которое специфически связывает полипептид PGA. Для получения антител различных животных-хозяев, включая в качестве неограничивающих примеров кроликов, мышей, крыс и т.д., можно иммунизировать посредством инъекции PGA. Полипептид PGA можно прикреплять к подходящему носителю, такому как BSA, через функциональную группу боковой цепи или линкеры, прикрепленные к функциональной группе боковой цепи. Различные адъюванты можно использовать для увеличения иммунологического ответа, в зависимости от биологического вида хозяина, в том числе, в качестве неограничивающих примеров, Фрейнда (полный и неполный), минеральные гели, такие как гидроксид алюминия, поверхностно-активные вещества, такие как лизолецитин, полиолы Pluronic, полианионы, пептиды, масляные эмульсии, гемоцианин морского блюдца, динитрофенол и потенциально эффективные адъюванты человека, такие как BCG (бацилла Кальмета-Герена) и Corynebacterium parvum.In some embodiments, affinity techniques are used in the isolation of improved PGA enzymes. Any antibody that specifically binds a PGA polypeptide can be used for affinity chromatography purification. To obtain antibodies, various animal hosts, including but not limited to rabbits, mice, rats, etc., can be immunized by injection of PGA. The PGA polypeptide can be attached to a suitable carrier, such as BSA, through a side chain functional group or linkers attached to a side chain functional group. Various adjuvants can be used to enhance the immunological response, depending on the host species, including, but not limited to, Freund's (complete and incomplete), mineral gels such as aluminum hydroxide, surfactants such as lysolecithin, polyols Pluronic, polyanions, peptides, oil emulsions, limpet hemocyanin, dinitrophenol and potentially effective human adjuvants such as BCG (Bacillus Calmette-Guerin) and Corynebacterium parvum.
- 25 043748- 25 043748
В некоторых вариантах осуществления варианты PGA получают и используют в форме клеток, экспрессирующих ферменты, в виде неочищенных экстрактов или в виде выделенных или очищенных препаратов. В некоторых вариантах осуществления варианты PGA получают в виде лиофилизатов, в порошкообразной форме (например, ацетоновые порошки) или получают в виде растворов фермента. В некоторых вариантах осуществления варианты PGA находятся в форме по существу чистых препаратов.In some embodiments, PGA variants are prepared and used in the form of enzyme-expressing cells, as crude extracts, or as isolated or purified preparations. In some embodiments, PGA variants are prepared as lyophilisates, in powder form (eg, acetone powders), or are prepared as enzyme solutions. In some embodiments, the PGA variants are in the form of substantially pure preparations.
В некоторых вариантах осуществления полипептиды PGA прикрепляют к любой подходящей твердой подложке. Твердые подложки включают, но не ограничиваясь этим, твердую фазу, поверхность и/или мембрану. Твердые носители включают, но не ограничиваясь этим, органические полимеры, такие как полистирол, полиэтилен, полипропилен, полифторэтилен, полиэтиленокси и полиакриламид, а также их сополимеры и привитые полимеры. Твердый носитель также может быть неорганическим, например, стеклом, диоксидом кремния, стеклом с контролируемым размером пор (CPG), диоксидом кремния обращенной фазы или металлом, таким как золото или платина. Конфигурация субстрата может быть в форме бусин, сфер, частиц, гранул, геля, мембраны или поверхности. Поверхности могут быть плоскими, по существу плоскими или не плоскими. Твердые носители могут быть пористыми или не пористыми и могут иметь набухающие или не набухающие характеристики. Твердый носитель можно выполнять в форме лунки, впадины или другого контейнера, сосуда, признака или местоположения. Множество опор можно выполнять в массиве в различных местоположениях, с возможностью обращения для роботизированной доставки реактивов или с помощью способов и/или инструментов обнаружения.In some embodiments, the PGA polypeptides are attached to any suitable solid support. Solid supports include, but are not limited to, a solid phase, a surface and/or a membrane. Solid carriers include, but are not limited to, organic polymers such as polystyrene, polyethylene, polypropylene, polyfluoroethylene, polyethyleneoxy and polyacrylamide, as well as copolymers and graft polymers thereof. The solid support may also be inorganic, such as glass, silica, controlled pore glass (CPG), reverse phase silica, or a metal such as gold or platinum. The substrate configuration can be in the form of beads, spheres, particles, granules, gel, membrane or surface. The surfaces may be planar, substantially planar, or non-planar. Solid carriers may be porous or non-porous and may have swelling or non-swelling characteristics. The solid carrier may be in the form of a well, depression, or other container, vessel, feature, or location. The plurality of supports may be arranged in an array at different locations, reversible for robotic delivery of reagents or by sensing methods and/or tools.
В некоторых вариантах осуществления иммунологические способы используют для того, чтобы очищать варианты PGA. В одном подходе антитело, образованное против полипептида варианта PGA (например, против полипептида, содержащего любую из SEQ ID №№ 2, 4, 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 и/или 160, и/или его иммуногенного фрагмента), с использованием стандартных способов иммобилизуют на бусах, смешивают с клеточными культуральными средами в условиях, в которых связывают вариант PGA, и осаждают. В связанном подходе применение находит иммунохроматография.In some embodiments, immunological methods are used to purify PGA variants. In one approach, an antibody raised against a PGA variant polypeptide (e.g., against a polypeptide comprising any of SEQ ID NOs: 2, 4, 12, 24, 40, 56, 70, 82, 100, 108, 110, 116, 136, 154 and/or 160 and/or an immunogenic fragment thereof), using standard methods, are immobilized on beads, mixed with cell culture media under conditions in which the PGA variant is bound, and precipitated. A related approach finds application in immunochromatography.
В некоторых вариантах осуществления варианты PGA экспрессируют в виде слитого белка, содержащего неферментативную часть. В некоторых вариантах осуществления последовательность варианта PGA сливают с облегчающим очистку доменом. Как используют в настоящем описании, термин облегчающий очистку домен относится к домену, который опосредует очистку полипептида, с которым его сливают. Подходящие домены для очистки включают, но не ограничиваясь этим, металл-хелатирующие пептиды, гистидин-триптофановые модули, которые допускают очистку на иммобилизованных металлах, последовательность, которая связывает глутатион (например, GST), гемагглютининовую метку (НА) (соответствующую эпитопу, получаемому из белка гемагглютинина гриппа; см., например, Wilson et al., Cell 37:767 [1984]), последовательности мальтозусвязывающего белка, эпитоп FLAG, используемый в системе удлинения/аффинной очистки FLAGS (например, системе, доступной в Immunex Corp), и т.п. Один экспрессирующий вектор, рассматриваемый для использования в композициях и способах, описанных в настоящем описании, обеспечивает экспрессию слитого белка, содержащего полипептид по изобретению, слитый с полигистидиновой областью, отделенной сайтом расщепления энтерокиназы. Гистидиновые остатки облегчают очистку на IMIAC (аффинная хроматография на иммобилизованных ионах металла; см., например, Porath et al., Prot. Exp. Purif., 3:263-281 [1992]) тогда как сайт расщепления энтерокиназы предоставляет средство для отделения полипептида варианта PGA от слитого белка. Векторы pGEX (Promega) также можно использовать для того, чтобы экспрессировать чужеродные полипептиды в виде слитых белков с глутатион-S-трансферазой (GST). В целом, такие слитые белки растворимы и могут быть легко очищены от лизированных клеток посредством адсорбции на лиганд-агарозгных бусах (например, глутатион-агарозных в случае слияния с GST), после чего следует элюирование в присутствии свободного лиганда.In some embodiments, PGA variants are expressed as a fusion protein containing a non-enzymatic portion. In some embodiments, the PGA variant sequence is fused to a purification-facilitating domain. As used herein, the term purification facilitating domain refers to a domain that mediates the purification of the polypeptide to which it is fused. Suitable domains for purification include, but are not limited to, metal-chelating peptides, histidine-tryptophan modules that allow purification on immobilized metals, a sequence that binds glutathione (e.g., GST), a hemagglutinin tag (HA) (corresponding to an epitope derived from influenza hemagglutinin protein; see, for example, Wilson et al., Cell 37:767 [1984]), maltose-binding protein sequences, the FLAG epitope used in the FLAGS extension/affinity purification system (for example, the system available from Immunex Corp), and etc. One expression vector contemplated for use in the compositions and methods described herein provides expression of a fusion protein comprising a polypeptide of the invention fused to a polyhistidine region separated by an enterokinase cleavage site. Histidine residues facilitate IMIAC (immobilized metal ion affinity chromatography; see, e.g., Porath et al., Prot. Exp. Purif., 3:263-281 [1992]) purification, while the enterokinase cleavage site provides a means for polypeptide separation PGA variant from the fusion protein. pGEX vectors (Promega) can also be used to express foreign polypeptides as glutathione S-transferase (GST) fusion proteins. In general, such fusion proteins are soluble and can be easily purified from lysed cells by adsorption onto ligand-agarose beads (eg, glutathione-agarose in the case of a GST fusion), followed by elution in the presence of free ligand.
Экспериментальная частьexperimental part
Различные признаки и варианты осуществления раскрытия проиллюстрированы в следующих репрезентативных примерах, которые предусмотрены в качестве иллюстрации и не ограничения.Various features and embodiments of the disclosure are illustrated in the following representative examples, which are provided by way of illustration and not limitation.
Далее в раскрытии экспериментов применяют следующие сокращения: м.д. (миллионная доля); М (молярный); мМ (миллимолярный), мкМ (микромолярный); нМ (наномолярный); моль (моли); г (грамм); мг (миллиграмм); мкг (микрограмм); л (литр); мл (миллилитр); см (сантиметр); мм (миллиметр); мкм (микрометр); с (секунда); мин (минута); ч (час); Ед (единица); MW (молекулярная масса); об./мин (обороты в минуту); °С (градус Цельсия); RT (комнатная температура); CDS (кодирующая последовательность); ДНК (дезоксирибонуклеиновая кислота); РНК (рибонуклеиновая кислота); а.к. (аминокислота); ТВ (среда ТВ; 12 г/л бактотриптона, 24 г/л дрожжевого экстракта, 4 мл/л глицерина, 65 мМ фосфат калия, рН 7,0, 1 мМ MgSO4); САМ (хлорамфеникол); PMBS (сульфат полимиксина В); IPTG (изопропилтиогалактозид); TFA (трифторуксусная кислота); CHES (2-циклогексиламино)этансульфоновая кислота; HPLC (высокоэффективная жидкостная хроматография); FIOPC (кратность усовершенствования относительно положительного контроля); НТР (высокая пропускная способность); LB (бульон Лурия); Codexis (Codexis, Inc., Redwood City, CA); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Millipore (Millipore, Corp., Billerica MA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Daicel (Daicel, WestFurther, in the disclosure of experiments, the following abbreviations are used: ppm. (ppm); M (molar); mM (millimolar), µM (micromolar); nM (nanomolar); mole(s); g (gram); mg (milligram); mcg (microgram); l (liter); ml (milliliter); cm (centimeter); mm (millimetre); µm (micrometer); s(second); min (minute); h (hour); Unit (unit); MW (molecular weight); rpm (revolutions per minute); °C (degrees Celsius); RT (room temperature); CDS (coding sequence); DNA (deoxyribonucleic acid); RNA (ribonucleic acid); a.k. (amino acid); TV (TV medium; 12 g/L bactotryptone, 24 g/L yeast extract, 4 ml/L glycerol, 65 mM potassium phosphate, pH 7.0, 1 mM MgSO 4 ); CAM (chloramphenicol); PMBS (polymyxin B sulfate); IPTG (isopropylthiogalactoside); TFA (trifluoroacetic acid); CHES (2-cyclohexylamino)ethanesulfonic acid; HPLC (high performance liquid chromatography); FIOPC (fold improvement relative to positive control); HTR (high throughput); LB (Luria broth); Codexis (Codexis, Inc., Redwood City, CA); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Millipore (Millipore, Corp., Billerica MA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Daicel (Daicel, West
- 26 043748- 26 043748
Chester, PA); Genetix (Genetix USA, Inc., Beaverton, OR); Molecular Devices (Molecular Devices, LLC,Chester, PA); Genetix (Genetix USA, Inc., Beaverton, OR); Molecular Devices (Molecular Devices, LLC,
Sunnyvale, CA); Applied Biosystems (Applied Biosystems, часть Life Technologies, Corp., Grand Island, NY),Sunnyvale, CA); Applied Biosystems (Applied Biosystems, part of Life Technologies, Corp., Grand Island, NY),
Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (часть Thermo Fisher Scientific, Waltham, MA); (Infors; Infors-HT, Bottmingen/Basel, Switzerland); Corning (Corning, Inc., Palo Alto, CA); и BioRad (Bio-Rad Laboratories, Hercules, CA); Microfluidics (Microfluidics Corp., Newton, MA).Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (part of Thermo Fisher Scientific, Waltham, MA); (Infors; Infors-HT, Bottmingen/Basel, Switzerland); Corning (Corning, Inc., Palo Alto, CA); and BioRad (Bio-Rad Laboratories, Hercules, CA); Microfluidics (Microfluidics Corp., Newton, MA).
Пример 1. Экспрессионные хозяева Е.coli, содержащие гены рекомбинантных PGA.Example 1. E. coli expression hosts containing recombinant PGA genes.
Исходные ферменты PGA, используемые для полученяи вариантов по настоящему изобретению, получали или из панели ацилаз Codex® (планшет панели PGA; Codexis) или вариантов, раскрытых в публикации заявки на патент США совместного владения № 2016/0326508. Планшет панели PGA содержит совокупность сконструированных полипептидов PGA, которые имеют усовершенствованные свойства, по сравнению с PGA дикого типа Kluyvera citrophila. Ген PGA дикого типа представляет собой гетеродимер, состоящий из альфа-субъединицы (23,8 кДа) и бета-субъединицы (62,2 кДа), которые связаны с помощью спейсерной области из 54 а.к. Из-за присутствия спейсерной области, стадия аутопроцессинга необходима для того, чтобы формировать активный белок. В ходе разработки настоящего изобретения, ген дикого типа модифицировали для устранения спейсерной области, таким образом устраняя стадию аутопроцессинга. Планшет панели PGA (Codexis) содержит варианты PGA, которые не содержат спейсерную область (см., например, публикацию заявки на патент США 2010/0143968 А1). Кодирующие PGA гены клонировали в экспрессирующий вектор pCK110900 (см. фиг. 3 в публикации заявки на патент США № 2006/0195947), функционально связанный с промотором lac под управлением репрессора lacl. Экспрессирующий вектор также содержит участок начала репликации Р15а и ген устойчивости к хлорамфениколу. Получаемые плазмиды трансформировали в Е.coli W3110 с использованием стандартных известных в данной области способов. Трансформанты выделяли, подвергая клетки отбору с хлорамфениколом, как известно в данной области (см., например, патент США № 8383346 и WO2010/144103).The parent PGA enzymes used to make the variants of the present invention were obtained from either the Codex® acylase panel (PGA panel plate; Codexis) or the variants disclosed in co-owned US Patent Application Publication No. 2016/0326508. The PGA panel plate contains a collection of engineered PGA polypeptides that have improved properties compared to wild-type Kluyvera citrophila PGA. The wild-type PGA gene is a heterodimer consisting of an alpha subunit (23.8 kDa) and a beta subunit (62.2 kDa), which are linked by a 54-aa spacer region. Due to the presence of a spacer region, an autoprocessing step is required in order to form the active protein. During the development of the present invention, the wild type gene was modified to eliminate the spacer region, thereby eliminating the autoprocessing step. The PGA panel plate (Codexis) contains PGA variants that do not contain a spacer region (see, for example, US patent application publication 2010/0143968 A1). The PGA encoding genes were cloned into the expression vector pCK110900 (see Fig. 3 in US Patent Application Publication No. 2006/0195947), operably linked to the lac promoter under the control of the lacl repressor. The expression vector also contains the P15a origin of replication and the chloramphenicol resistance gene. The resulting plasmids were transformed into E. coli W3110 using standard methods known in the art. Transformants were isolated by subjecting cells to selection with chloramphenicol, as is known in the art (see, for example, US patent No. 8383346 and WO2010/144103).
Пример 2. Получение НТР PGA-содержащих влажных клеточных осадковExample 2. Preparation of NTP PGA-containing wet cell sediments
Клетки Е.coli, содержащие кодирующие рекомбинантную PGA гены из моноклональных колоний, инокулировали в 180 мкл LB, содержащего 1% глюкозу и 30 мкг/мл хлорамфеникола в лунках 96луночных микротитровальных планшетов с мелкими лунками. Планшеты закупоривали О2проницаемыми уплотнениями и культуры выращивали в течение ночи при 30°С, 200 об./мин и 85% влажности. Затем 10 мкл каждой клеточной культуры переносили в лунки 96-луночных планшетов с глубокими лунками, содержащих 390 мл ТВ и 30 мкг/мл САМ. Планшеты с глубокими лунками закупоривали О2-проницаемыми уплотнениями и инкубировали при 30°С, 250 об./мин и 85% влажности, пока не достигали OD6000,6-0,8. Затем клеточные культуры индуцировали с использованием IPTG до конечной концентрации 1 мМ и инкубировали в течение ночи при тех же условиях как исходно использовали. Затем клетки осаждали с использованием центрифугирования на 4000 об./мин в течение 10 мин. Супернатанты выбрасывали, а осадки замораживали при -80°С перед лизисом.E. coli cells containing recombinant PGA-encoding genes from monoclonal colonies were inoculated in 180 μl of LB containing 1% glucose and 30 μg/ml chloramphenicol in the wells of 96-well microtiter plates with fine wells. The plates were sealed with O 2 permeable seals and cultures were grown overnight at 30°C, 200 rpm and 85% humidity. Then, 10 μl of each cell culture was transferred into the wells of 96-well deep well plates containing 390 ml TB and 30 μg/ml CAM. Deep well plates were sealed with O 2 -permeable seals and incubated at 30°C, 250 rpm and 85% humidity until OD6000.6-0.8 was reached. Cell cultures were then induced using IPTG to a final concentration of 1 mM and incubated overnight under the same conditions as originally used. Cells were then pelleted using centrifugation at 4000 rpm for 10 min. Supernatants were discarded and pellets were frozen at −80°C before lysis.
Пример 3. Получение НТР PGA-содержащих клеточных лизатовExample 3. Preparation of NTP PGA-containing cell lysates
Сначала 200 мкл лизирующего буфера, содержащего 10 мМ буфера Tris-HCl, рН 7,5, 1 мг/мл лизоцима и 0,5 мг/мл PMBS, добавляли к клеточной массе в каждой лунке, полученной, как описано в примере 2. Клетки лизировали при комнатной температуре в течение 2 ч при встряхивании на настольном встряхивателе. Затем планшет центрифугировали в течение 15 мин на 4000 об./мин и при 4°С. Затем прозрачные супернатанты использовали в биокаталитических реакциях для того, чтобы определять уровни их активности.First, 200 μl of lysis buffer containing 10 mM Tris-HCl buffer, pH 7.5, 1 mg/ml lysozyme and 0.5 mg/ml PMBS was added to the cell mass in each well prepared as described in example 2. Cells lysed at room temperature for 2 h with shaking on a tabletop shaker. The plate was then centrifuged for 15 min at 4000 rpm and 4°C. The clear supernatants were then used in biocatalytic reactions to determine their activity levels.
Пример 4. Получение лиофилизированных лизатов из культур во встряхиваемых колбах (SF).Example 4: Preparation of lyophilized lysates from shake flask (SF) cultures.
Выбранные НТР культуры, которые растили как описано выше, высевали на планшеты с LB агаром с 1% глюкозы и 30 мкг/мл САМ и растили в течение ночи при 37°С. Одну колонию из каждой культуры переносили в 6 мл LB с 1% глюкозы и 30 мкг/мл САМ.Selected NTP cultures, which were grown as described above, were plated on LB agar plates with 1% glucose and 30 μg/ml CAM and grown overnight at 37°C. One colony from each culture was transferred to 6 ml LB with 1% glucose and 30 μg/ml CAM.
Культуры выращивали в течение 18 ч при 30°С, 250 об./мин и пересевали приблизительно 1:50 в 250 мл ТВ, содержащей 30 мкг/мл САМ, до конечной OD600 0,05. Культуры выращивали в течение приблизительно 195 минут при 30°С, 250 об./мин, до OD600 0,6-0,8 и индуцировали с использованием 1 мМ IPTG. Затем культуры выращивали в течение 20 ч при 30°С, 250 об./мин. Культуры центрифугировали 4000 об./минх20 мин. Супернатант выбрасывали и осадки ресуспендировали в 30 мл 20 мМ TRIS-HCl, рН 7,5. Клетки осаждали (4000 об./минх20 мин) и замораживали при -80°С на 120 мин. Замороженные осадки ресуспендировали в 30 мл 20 мМ TRIS-HCl, рН 7,5 и лизировали с использованием обрабатывающей системы Microfluidizer® (Microfluidics) при 18000 фунтов/дюйм2. Лизаты осаждали (10000 об./минх60 мин) и супернатанты замораживали и лиофилизировали для того, чтобы создавать ферменты встряхиваемых колб (SF).Cultures were grown for 18 h at 30°C, 250 rpm and subcultured approximately 1:50 in 250 ml TB containing 30 μg/ml CAM to a final OD600 of 0.05. Cultures were grown for approximately 195 minutes at 30°C, 250 rpm, to an OD600 of 0.6-0.8 and induced using 1 mM IPTG. The cultures were then grown for 20 h at 30°C, 250 rpm. Cultures were centrifuged at 4000 rpm for 20 min. The supernatant was discarded and the pellets were resuspended in 30 ml of 20 mM TRIS-HCl, pH 7.5. Cells were pelleted (4000 rpm x 20 min) and frozen at -80°C for 120 min. Frozen pellets were resuspended in 30 ml of 20 mM TRIS-HCl, pH 7.5 and lysed using a Microfluidizer® Processing System (Microfluidics) at 18,000 psi. Lysates were pelleted (10,000 rpm x 60 min) and supernatants were frozen and lyophilized to generate shake flask (SF) enzymes.
Пример 5. Усовершенствования в ацилировании инсулина в положениях А1, В1 и В29 относительно SEQ ID № 4Example 5 Improvements in Insulin Acylation at Positions A1, B1 and B29 relative to SEQ ID No. 4
SEQ ID № 4 выбирали в качестве родительского фермента на основе результатов скрининга вариантов, раскрытых в публикации заявки на патент США совместного владения № 2016/0326508, для получения В29-деацилированного продукта. Библиотеки сконструированных генов получали с использованиемSEQ ID No. 4 was selected as the parent enzyme based on the results of screening variants disclosed in joint US Patent Application Publication No. 2016/0326508 to obtain the B29 deacylated product. Libraries of engineered genes were prepared using
- 27 043748 луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций).- 27 043748 well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations).
Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
Каждая реакционная лунка содержала 200 мкл 0,1 М CHES, рН 10, 10 г/л инсулина, 17 г/л метилфенилацетата и 20 мкл НТР супернатанта. НТР планшеты инкубировали во встряхивателе Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 300 об./мин, в течение 20 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 минут с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.Each reaction well contained 200 μl of 0.1 M CHES, pH 10, 10 g/l insulin, 17 g/l methylphenylacetate, and 20 μl of HTP supernatant. NTP plates were incubated in a Thermotron® shaker (3 mm amplitude, model no. AJ185, Infors) at 30°C, 300 rpm, for 20 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Активность относительно SEQ ID № 4 (активность FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 4. Результаты показаны в табл. 5.1. Процент превращения вычисляли посредством деления площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта как наблюдали по HPLC анализу. В табл. 5.2 приведены результаты, показывающие избирательность вариантов относительно SEQ ID № 4.The activity relative to SEQ ID No. 4 (FIOP activity) was calculated as the percent conversion of the product formed by the variant relative to the percent conversion provided by SEQ ID No. 4. The results are shown in table. 5.1. The percent conversion was calculated by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis. In table 5.2 shows the results showing the selectivity of the variants relative to SEQ ID No. 4.
Таблица 5.1. Активность вариантов относительно SEQ ID № 4Table 5.1. Activity of variants relative to SEQ ID No. 4
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 4 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,5 раза увеличенная активность; ++ > чем в 2,5 раза, но меньше чем в 5 раз увеличенная активность; +++ > чем в 5 раз увеличенная активность, но меньше чем в 10 раз; ++++ > чем в 10 раз. 1 Levels of increased activity were set relative to the reference polypeptide of SEQ ID No. 4 and were determined as follows: + > 1.2-fold but less than 2.5-fold increased activity; ++ > more than 2.5 times, but less than 5 times increased activity; +++ > more than 5 times increased activity, but less than 10 times; ++++ > than 10 times.
Таблица 5.2. Избирательность вариантов относительно SEQ ID № 4Table 5.2. Selectivity of variants relative to SEQ ID No. 4
1 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 4 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,5 раза увеличенная избирательность; + + > чем в 2,5 раза, но меньше чем в 5 раз увеличенная избирательность; +++ > чем в 5 раз увеличенная избирательность, но меньше чем в 10 раз; ++++ > чем в 10 раз. 1 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 4 and were determined as follows: + > 1.2-fold but less than 2.5-fold increased selectivity; + + > more than 2.5 times, but less than 5 times increased selectivity; +++ > more than 5 times increased selectivity, but less than 10 times; ++++ > than 10 times.
Пример 6. Усовершенствование ацилирования инсулина в положениях А1, В1 и В29 по сравнению с SEQ ID № 12 в высокопропускном скринингеExample 6: Improvement of Insulin Acylation at Positions A1, B1 and B29 Compared to SEQ ID No. 12 in a High Throughput Screen
SEQ ID № 12 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 5, (т.е., наилучший фермент, идентифицированный при ацилировании инсулина в положении В29). Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций).SEQ ID No. 12 was selected as the next parent enzyme based on the results described in Example 5 (ie, the best enzyme identified for acylation of insulin at position B29). Libraries of engineered genes were prepared using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations).
Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
Скрининг каждого варианта осуществляли в 200 мкл реакции, состоящей из 10 г/л инсулина, 0,1 М TRIS буфера рН 9,25, 20% ацетонитрила, 17 г/л метилфенилацетата и 10 мкл осветленного лизата, в течение 5 ч при 30°С. 96-луночные планшеты закупоривали теплом и инкубировали во встряхивателеScreening of each variant was carried out in a 200 μl reaction consisting of 10 g/l insulin, 0.1 M TRIS buffer pH 9.25, 20% acetonitrile, 17 g/l methylphenylacetate and 10 μl clarified lysate for 5 hours at 30° WITH. 96-well plates were heat sealed and incubated in a shaker
- 28 043748- 28 043748
Thermotron® на 100 об./мин. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.Thermotron® at 100 rpm. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min using a benchtop shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 12 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 12. Эти результаты представлены в табл. 6.1, 6.2, 6.3, 6.4, 6.5, 6.6 и 6.7. Процент превращения вычисляли посредством деления площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 12 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 12. These results are presented in table. 6.1, 6.2, 6.3, 6.4, 6.5, 6.6 and 6.7. The percent conversion was calculated by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Процент избирательности относительно SEQ ID № 12 (процент избирательности FIOP) вычисляли как процент избирательности продукта, образуемого вариантом, относительно процента избирательности, обеспечиваемого с помощью SEQ ID № 12. Результаты представлены в табл. 6.1, 6.2, 6.3, 6.4, 6.5, 6.6 и 6.7. Процент избирательности вычисляли посредством деления площади пика продукта на сумму площадей пиков продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage selectivity relative to SEQ ID No. 12 (FIOP selectivity percentage) was calculated as the percentage selectivity of the product formed by the variant relative to the percentage selectivity provided by SEQ ID No. 12. The results are presented in table. 6.1, 6.2, 6.3, 6.4, 6.5, 6.6 and 6.7. The percent selectivity was calculated by dividing the peak area of the product by the sum of the peak areas of the product and the impurities/by-product as observed by HPLC analysis.
Таблица 6.1. Активность и избирательность вариантов, ацилирующих по участку А1, относительно SEQ ID № 12Table 6.1. Activity and selectivity of variants acylating at the A1 site relative to SEQ ID No. 12
1 Уровни увеличенной активности или избирательности определяли относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 1,0 раза, но меньше чем в 1,5 раза увеличены; ++ > чем в 1,5 раза, но меньше чем в 2,0 раза; +++ > чем в 2,0 раза. 1 Levels of increased activity or selectivity were determined relative to the reference polypeptide of SEQ ID No. 12 and were defined as follows: + > 1.0-fold but less than 1.5-fold increased; ++ > more than 1.5 times, but less than 2.0 times; +++ > than 2.0 times.
- 29 043748- 29 043748
Таблица 6.2. Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 12Table 6.2. Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 12
- 30 043748- 30 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 4,0 раза увеличены; ++ > чем в 4,0 раза, но меньше чем в 6,0 раза; +++ > чем в 6,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 4.0-fold increased; ++ > more than 4.0 times, but less than 6.0 times; +++ > than 6.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 5,0 раза увеличе- 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > greater than 2.0-fold but less than 5.0-fold increased
- 31 043748 ны; ++ > чем в 5,0 раза, но меньше чем в 10,0 раза; +++ > чем в 10,0 раза, но меньше чем в 15 раз;- 31 043748 us; ++ > more than 5.0 times, but less than 10.0 times; +++ > than 10.0 times, but less than 15 times;
++++ > чем в 15 раз.++++ > than 15 times.
Таблица 6.3. Активность и избирательность вариантов, ацилирующих по участкам А1 и В29, относительно SEQ ID № 12Table 6.3. Activity and selectivity of variants acylating at sites A1 and B29 relative to SEQ ID No. 12
- 32 043748- 32 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 5,0 раза увеличены; ++ > чем в 5,0 раза, но меньше чем в 10,0 раза; +++ > чем в 10,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 5.0-fold increased; ++ > more than 5.0 times, but less than 10.0 times; +++ > than 10.0 times.
Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 5,0 раза увеличены; ++ > чем в 5,0 раза, но меньше чем в 7,0 раза; +++ > чем в 7,0 раза.Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 5.0-fold increased; ++ > more than 5.0 times, but less than 7.0 times; +++ > than 7.0 times.
- 33 043748- 33 043748
Таблица 6.4. Активность и избирательность вариантов, ацилирующих по участкам А1 и В1, относительно SEQ ID № 12Table 6.4. Activity and selectivity of variants acylating at sites A1 and B1 relative to SEQ ID No. 12
- 34 043748- 34 043748
- 35 043748- 35 043748
- 36 043748- 36 043748
- 37 043748- 37 043748
- 38 043748- 38 043748
- 39 043748- 39 043748
- 40 043748- 40 043748
- 41 043748 1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 10,0 раза увеличены; ++ > чем в 10,0 раза, но меньше чем в 50,0 раза; +++ > чем в 50,0 раза, но меньше чем в 100 раз; ++++ >- 41 043748 1 Levels of increased activity were established relative to the reference polypeptide from SEQ ID No. 12 and were determined as follows: + > more than 2.0-fold, but less than 10.0-fold increased; ++ > more than 10.0 times, but less than 50.0 times; +++ > more than 50.0 times, but less than 100 times; ++++ >
чем 100.than 100.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 10,0 раза увеличены; ++ > чем в 10,0 раза, но меньше чем в 50,0 раза; +++ > чем в 50,0 раза, но меньше чем в 100 раз; ++++ > чем 100. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 10.0-fold increased; ++ > more than 10.0 times, but less than 50.0 times; +++ > more than 50.0 times, but less than 100 times; ++++ > than 100.
Таблица 6.5. Активность и избирательность вариантов, ацилирующих по участкам А1 и В29, относительно SEQ ID № 12Table 6.5. Activity and selectivity of variants acylating at sites A1 and B29 relative to SEQ ID No. 12
- 42 043748- 42 043748
- 43 043748- 43 043748
- 44 043748- 44 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 10,0 раза увеличены; ++ > чем в 10,0 раза, но меньше чем в 50,0 раза; +++ > чем в 50,0 раза, но меньше чем в 100 раз; ++++ > чем 100. 1 Levels of increased activity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 10.0-fold increased; ++ > more than 10.0 times, but less than 50.0 times; +++ > more than 50.0 times, but less than 100 times; ++++ > than 100.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 10,0 раза увеличены; ++ > чем в 10,0 раза, но меньше чем в 50,0 раза; +++ > чем в 50,0 раза, но меньше чем в 100 раз; ++++ > Чем 100. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 10.0-fold increased; ++ > more than 10.0 times, but less than 50.0 times; +++ > more than 50.0 times, but less than 100 times; ++++ > Than 100.
- 45 043748- 45 043748
Таблица 6.6. Активность и избирательность вариантов, ацилирующих по участкам А1, В1 и В29, относительно SEQ ID № 12Table 6.6. Activity and selectivity of variants acylating at sites A1, B1 and B29, relative to SEQ ID No. 12
- 46 043748- 46 043748
- 47 043748- 47 043748
- 48 043748- 48 043748
- 49 043748- 49 043748
- 50 043748- 50 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 10,0 раза увеличены; ++ > чем в 10,0 раза, но меньше чем в 50,0 раза; +++ > чем в 50,0 раза, но меньше чем в 100 раз; ++++ > чем 100. 1 Levels of increased activity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 10.0-fold increased; ++ > more than 10.0 times, but less than 50.0 times; +++ > more than 50.0 times, but less than 100 times; ++++ > than 100.
Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 10,0 раза увеличены; ++ > чем в 10,0 раза, но меньше чем в 50,0 раза; +++ > чем в 50,0 раза, но меньше чем в 100 раз; ++++ > чем 100.Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 10.0-fold increased; ++ > more than 10.0 times, but less than 50.0 times; +++ > more than 50.0 times, but less than 100 times; ++++ > than 100.
- 51 043748- 51 043748
Таблица 6.7. Активность и избирательность вариантов, ацилирующих по участку В1, относительно SEQ ID № 12Table 6.7. Activity and selectivity of variants acylating at the B1 site relative to SEQ ID No. 12
- 52 043748- 52 043748
- 53 043748- 53 043748
- 54 043748- 54 043748
- 55 043748- 55 043748
- 56 043748- 56 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 5,0 раза увеличены; ++ > чем в 5,0 раза, но меньше чем в 10,0 раза; +++ > чем в 10,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 5.0-fold increased; ++ > more than 5.0 times, but less than 10.0 times; +++ > than 10.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 2,0 раза, но меньше чем в 5,0 раза увеличены; ++ > чем в 5,0 раза, но меньше чем в 7,0 раза; +++ > чем в 7,0 раза. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 2.0-fold but less than 5.0-fold increased; ++ > more than 5.0 times, but less than 7.0 times; +++ > than 7.0 times.
Пример 7. Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 12Example 7: Improvement in Insulin Acylation at Position B29 Compared to SEQ ID No. 12
Ацилирование по В29 четырьмя вариантами, перечисленными в табл. 7.1, тестировали в масштабе встряхиваемой колбы. Порошки встряхиваемых колб получали, как описано в примере 4. Реакции осуществляли в 96-луночных планшетах с глубокими лунками, каждая содержит 200 мкл 0,2 М TRIS, рН 9,25, 20% ацетонитрила, 10 г/л инсулина, 17 г/л метилфенилацетата и 0,9 г/л лиофилизированного порошка фермента, восстановленного в 10 мМ TRIS, рН 7,5. НТР планшеты закупоривали теплом и инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 5 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.Acylation at B29 with four options listed in table. 7.1 was tested on a shake flask scale. Shake flask powders were prepared as described in Example 4. Reactions were carried out in 96-well deep well plates, each containing 200 μl of 0.2 M TRIS, pH 9.25, 20% acetonitrile, 10 g/l insulin, 17 g/l l methylphenylacetate and 0.9 g/l lyophilized enzyme powder reconstituted in 10 mM TRIS, pH 7.5. NTR plates were heat sealed and incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm, for 5 h. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min. using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 12 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 12. Результаты представлены в табл. 7.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 12 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 12. The results are presented in table. 7.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Процент избирательности относительно SEQ ID № 12 (процент избирательности FIOP) вычисляли как процент избирательности продукта, образуемого вариантом, относительно процента избирательности, обеспечиваемого с помощью SEQ ID № 12. Процент избирательности вычисляли посредством деления площади пика продукта на сумму площадей пиков продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage selectivity relative to SEQ ID No. 12 (FIOP selectivity percentage) was calculated as the percentage selectivity of the product produced by the variant relative to the percentage selectivity provided by SEQ ID No. 12. The percentage selectivity was calculated by dividing the peak area of the product by the sum of the peak areas of the product and the impurities/by-product product as observed by HPLC analysis.
- 57 043748- 57 043748
Таблица 7.1. Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 12Table 7.1. Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 12
Y27Т;V28А;G71Н;D74G;К103Y27Т;V28А;G71Н;D74G;К103
Е;W119Y;L253Y;F256R;N348E;W119Y;L253Y;F256R;N348
Н;T352K;A373R;S374T;S390H;T352K;A373R;S374T;S390
К;G444N;A451K;N494D;Q547K;G444N;A451K;N494D;Q547
К; А616Y;S646D;TO; A616Y;S646D;
Различия аминокислот (относительно SEQ ID № 12)Amino Acid Differences (relative to SEQ ID No. 12)
D709R;D709R;
D709K;D709K;
Процент превращени ацилированConversion percentage acylated
Процент избирательн ости ацилированиPercentage of acylation selectivity
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 10,0 раза, но меньше чем в 50,0 раза увеличены; ++ > чем в 50,0 раза, но меньше чем в 100,0 раза; +++ > чем в 100,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 10.0-fold but less than 50.0-fold increased; ++ > more than 50.0 times, but less than 100.0 times; +++ > than 100.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: + > чем в 10,0 раза, но меньше чем в 50,0 раза увеличены; ++ > чем в 50,0 раза, но меньше чем в 100,0 раза; +++ > чем в 100,0 раза. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 12 and were determined as follows: + > 10.0-fold but less than 50.0-fold increased; ++ > more than 50.0 times, but less than 100.0 times; +++ > than 100.0 times.
Пример 8. Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 108 в высокопропускном скринингеExample 8: Improvement of Insulin Acylation at Position B29 Compared to SEQ ID No. 108 in a High Throughput Screen
SEQ ID № 108 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 7. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.SEQ ID No. 108 was selected as the next parent enzyme based on the results described in Example 7. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,1 М TRIS, рН 9,25, 20% ацетонитрила, 25 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 3 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.HTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.1 M TRIS, pH 9.25, 20% acetonitrile, 25 g/l insulin, 17 g/l methylphenylacetate, and 10 μl of NTR supernatant. NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 3 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker. Then, 400 μL of water was added and mixed for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 108 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 108. Результаты представлены в табл. 8.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 108 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 108. The results are presented in table. 8.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
- 58 043748- 58 043748
Таблица 8.1. Активность вариантов, ацилирующих по участку В29, относительно SEQ ID № 108Table 8.1. Activity of variants acylating at the B29 site relative to SEQ ID No. 108
- 59 043748- 59 043748
- 60 043748- 60 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 108 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза, но меньше чем в 8,0 раза; ++++ > чем в 8,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 108 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times, but less than 8.0 times; ++++ > than 8.0 times.
Пример 9. Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 24 в высокопропускном скринингеExample 9: Improvement of Insulin Acylation at Position B29 Compared to SEQ ID No. 24 in a High Throughput Screen
SEQ ID № 24 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 8. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.SEQ ID No. 24 was selected as the next parent enzyme based on the results described in Example 8. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,2 М TRIS, 20% ацетонитрила, 25 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта (начальный рН перед добавлением лизата составлял 9,4). НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 3 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 минут и загружали в HPLC для анализа.HTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.2 M TRIS, 20% acetonitrile, 25 g/l insulin, 17 g/l methylphenylacetate, and 10 μl of HTR supernatant (initial pH before addition of lysate was 9.4). NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 3 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker. Then, 400 μL of water was added and mixed for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 minutes and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 24 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 24. Результаты представлены в табл. 9.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта иThe percentage conversion relative to SEQ ID No. 24 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 24. The results are presented in table. 9.1. The percentage of conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and
- 61 043748 примесей/побочного продукта, как наблюдали по HPLC анализу.- 61 043748 impurities/by-product as observed by HPLC analysis.
Таблица 9.1. Активность вариантов, ацилирующих по участку В29, относительно SEQ ID № 24Table 9.1. Activity of variants acylating at the B29 site relative to SEQ ID No. 24
- 62 043748- 62 043748
- 63 043748- 63 043748
- 64 043748- 64 043748
Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 24 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза.Levels of increased activity were set relative to the reference polypeptide of SEQ ID No. 24 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times.
Пример 10. Эффект добавления гистидиновой метки в SEQ ID № 82Example 10 Effect of Adding a Histidine Tag to SEQ ID NO: 82
Ацилирование по В29 для SEQ ID № 82, как описано в примере 9, и SEQ ID № 110, которая содержит метку из шести гистидинов на С-конце, сравнивали в масштабе встряхиваемой колбы. Порошки встряхиваемых колб получали, как описано в примере 4. Реакции осуществляли в 96-луночных планшетах с глубокими лунками, каждая содержала 200 мкл, состоящих из 0,2 М TRIS, рН 9,25, 20% ацетонитрила, 25 г/л инсулина, 17 г/л метилфенилацетата и 0,3-10 г/л лиофилизированного порошка фермента, восстановленного в 10 мМ TRIS, рН 7,5. НТР планшеты закупоривали теплом и инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 3 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа. На фиг. 2 приведен график, показывающий результаты. Как показано, добавление гистидиновой метки оказывало минимальный эффект на фермент относительно версии без гистидиновой метки.The B29 acylation of SEQ ID No. 82, as described in Example 9, and SEQ ID No. 110, which contains a six-histidine tag at the C-terminus, were compared on a shake flask scale. Shake flask powders were prepared as described in Example 4. Reactions were carried out in 96-well deep well plates, each containing 200 μl, consisting of 0.2 M TRIS, pH 9.25, 20% acetonitrile, 25 g/l insulin, 17 g/l methyl phenylacetate and 0.3-10 g/l lyophilized enzyme powder reconstituted in 10 mM TRIS, pH 7.5. NTR plates were heat sealed and incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm, for 3 h. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min. using a table shaker. Then, 400 μL of water was added and mixed for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis. In fig. Figure 2 is a graph showing the results. As shown, the addition of a histidine tag had minimal effect on the enzyme relative to the version without the histidine tag.
Пример 11. Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 110 в высокопропускном скринингеExample 11: Improvement of Insulin Acylation at Position B29 Compared to SEQ ID No. 110 in a High Throughput Screen
SEQ ID № 110 выбирали в качестве родительского фермента после того, как было показано, что гистидиновая метка оказывает минимальное влияние на активность SEQ ID № 82. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций).SEQ ID No. 110 was selected as the parent enzyme after the histidine tag was shown to have minimal effect on the activity of SEQ ID No. 82. Libraries of engineered genes were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations).
Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но с использованием 400 мкл лизирующего буфера вместо 200 мкл.The polypeptides encoded by each gene were prepared in the NTP as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,2 М TRIS, 20% ацетонитрила, 25 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта (начальный рН перед добавлением лизата составлял 9,4). НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 2 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин сHTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.2 M TRIS, 20% acetonitrile, 25 g/l insulin, 17 g/l methylphenylacetate, and 10 μl of HTR supernatant (initial pH before addition of lysate was 9.4). NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 2 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min with
- 65 043748 использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.- 65 043748 using a table shaker. Then, 400 μL of water was added and mixed for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 110 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 110. Результаты представлены в табл. 9.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 110 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 110. The results are presented in table. 9.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Таблица 11.1. Активность вариантов, ацилирующих по участку В29, относительно SEQ ID № 110Table 11.1. Activity of variants acylating at the B29 site relative to SEQ ID No. 110
- 66 043748- 66 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 110 и определяли следующим образом: + > чем в 1,0 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза, но меньше чем в 8,0 раза; ++++ > чем в 8,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 110 and were determined as follows: + > 1.0-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times, but less than 8.0 times; ++++ > than 8.0 times.
Пример ^.Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 40 в высокопропускном скринингеExample ^: Improvement of insulin acylation at position B29 compared to SEQ ID No. 40 in a high-throughput screen
SEQ ID № 40 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 11. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но с использованием 400 мкл лизирующего буфера, вместо 200 мкл.SEQ ID No. 40 was selected as the next parent enzyme based on the results described in Example 11. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTP as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,2 М TRIS, 20% ацетонитрила, 25 г/л инсулина, 17 г/л метилфенилацетата и 80 мкл НТР супернатанта (начальный рН перед добавлением лизата составлял 9,4). НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 2 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин сHTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.2 M TRIS, 20% acetonitrile, 25 g/l insulin, 17 g/l methylphenylacetate, and 80 μl of HTR supernatant (initial pH before addition of lysate was 9.4). NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 2 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min with
- 67 043748 использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.- 67 043748 using a table shaker. Then, 400 μL of water was added and mixed for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 40 (процент превращения (FIOP)) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 40. Результаты представлены в табл. 12.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The conversion percentage relative to SEQ ID No. 40 (FIOP) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 40. The results are presented in table. 12.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Процент избирательности относительно SEQ ID № 40 (процент избирательности FIOP) вычисляли как процент избирательности продукта, образуемого вариантом, относительно процента избирательности, обеспечиваемого с помощью SEQ ID № 40. Процент избирательности вычисляли посредством деления площади пика продукта на сумму площадей пиков продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage selectivity relative to SEQ ID No. 40 (FIOP selectivity percentage) was calculated as the percentage selectivity of the product produced by the variant relative to the percentage selectivity provided by SEQ ID No. 40. The percentage selectivity was calculated by dividing the peak area of the product by the sum of the peak areas of the product and the impurities/by-product product as observed by HPLC analysis.
Таблица 12.1. Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 40Table 12.1. Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 40
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 40 и определяли следующим образом: + > чем в 1,0 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза, но меньше чем в 8,0 раза; ++++ > чем в 8,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 40 and were determined as follows: + > 1.0-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times, but less than 8.0 times; ++++ > than 8.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 40 и определяли следующим образом: + > чем в 1,0 раза, но меньше чем в 2,0 раза увеличе- 68 043748 ны; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза, но меньше чем в 8,0 раза; 2 Levels of increased selectivity were established relative to the reference polypeptide from SEQ ID No. 40 and were determined as follows: + > 1.0-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times, but less than 8.0 times;
++++ > чем в 8,0 раза.++++ > than 8.0 times.
Пример ^.Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 56 в высокопропускном скринингеExample ^: Improvement of insulin acylation at position B29 compared to SEQ ID No. 56 in a high-throughput screen
SEQ ID № 56 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 12. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но с использованием 400 мкл лизирующего буфера, вместо 200 мкл.SEQ ID No. 56 was selected as the next parent enzyme based on the results described in Example 12. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTP as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,2 М TRIS, 10% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта (начальный рН перед добавлением лизата составлял 9,4). НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 3 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и разводили еще 2 раза в воде перед загрузкой в HPLC для анализа.HTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.2 M TRIS, 10% acetonitrile, 50 g/l insulin, 17 g/l methylphenylacetate, and 10 μl of HTR supernatant (initial pH before addition of lysate was 9.4). NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 3 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker Then, 400 μL of water was added and mixed for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min and diluted 2 more times in water before loading into HPLC for analysis.
Процент превращения относительно SEQ ID № 56 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 56, и представлен далее в таблице. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percent conversion relative to SEQ ID No. 56 (FIOP conversion percent) was calculated as the percent conversion of the product formed by the variant relative to the percent conversion provided by SEQ ID No. 56 and is presented in the table below. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Процент избирательности относительно SEQ ID № 56 (процент избирательности FIOP) вычисляли как процент избирательности продукта, образуемого вариантом, относительно процента избирательности, обеспечиваемого с помощью SEQ ID № 56. Результаты представлены в табл. 13.1. Процент избирательности вычисляли посредством деления площади пика продукта на сумму площадей пиков продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage selectivity relative to SEQ ID No. 56 (FIOP selectivity percentage) was calculated as the percentage selectivity of the product formed by the variant relative to the percentage selectivity provided by SEQ ID No. 56. The results are presented in table. 13.1. The percent selectivity was calculated by dividing the peak area of the product by the sum of the peak areas of the product and the impurities/by-product as observed by HPLC analysis.
- 69 043748- 69 043748
Таблица 13.1. Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 56Table 13.1. Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 56
- 70 043748- 70 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 56 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза, но меньше чем в 8,0 раза; ++++ > чем в 8,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 56 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times, but less than 8.0 times; ++++ > than 8.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 56 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 4,0 раза; +++ > чем в 4,0 раза, но меньше чем в 8,0 раза; ++++ > чем в 8,0 раза. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 56 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 4.0 times; +++ > than 4.0 times, but less than 8.0 times; ++++ > than 8.0 times.
- 71 043748- 71 043748
Пример 14. Усовершенствование ацилирования инсулина в положении А1 по сравнению с SEQ ID № 70 в высокопропускном скринингеExample 14: Improvement of Insulin Acylation at Position A1 Compared to SEQ ID No. 70 in a High Throughput Screen
SEQ ID № 70 выбирали в качестве дополнительного родительского фермента на основе результатов, описанных в примере 7. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но используя 400 мкл лизирующего буфера вместо 200 мкл.SEQ ID No. 70 was selected as the additional parent enzyme based on the results described in Example 7. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками, содержащими 200 мкл 0,1 М Tris-HCl, pH 9,25, 20% ацетонитрила, 20 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР лизата. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 5 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин, разводили 2 раза в воде и загружали в HPLC для анализа.NTR reactions were carried out in 96-well deep well plates containing 200 μl of 0.1 M Tris-HCl, pH 9.25, 20% acetonitrile, 20 g/l insulin, 17 g/l methylphenylacetate and 10 μl of HTR lysate. NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 5 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker. The plates were then centrifuged at 4000 rpm for 5 min, diluted 2 times in water and loaded into HPLC for analysis.
Процент превращения относительно SEQ ID № 70 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 70. Результаты представлены в табл. 14.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 70 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 70. The results are presented in table. 14.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Таблица 14.1. Активность вариантов, ацилирующих по участку А1, относительно SEQ ID № 70Table 14.1. Activity of variants acylating at the A1 site relative to SEQ ID No. 70
- 72 043748- 72 043748
- 73 043748- 73 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 70 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 1,5 раза увеличены; ++ > чем в 1,5 раза, но меньше чем в 2,0 раза; +++ > чем в 2,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 70 and were determined as follows: + > 1.2-fold but less than 1.5-fold increased; ++ > more than 1.5 times, but less than 2.0 times; +++ > than 2.0 times.
- 74 043748- 74 043748
Пример 15. Усовершенствование ацилирования инсулина в положении А1 по сравнению с SEQ ID № 116 в высокопропускном скринингеExample 15 Improvement in insulin acylation at position A1 compared to SEQ ID No. 116 in a high throughput screen
SEQ ID № 116 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 14. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но используя 400 мкл лизирующего буфера вместо 200 мкл.SEQ ID No. 116 was selected as the next parent enzyme based on the results described in Example 14. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTP as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками, содержащим 200 мкл 0,25 М Tris-HCl, pH 9,25, 20% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР лизата. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин в течение 4 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин, разводили 24х в воде и загружали в HPLC для анализа.HTP reactions were carried out in 96-well deep well plates containing 200 μl of 0.25 M Tris-HCl, pH 9.25, 20% acetonitrile, 50 g/L insulin, 17 g/L methylphenylacetate, and 10 μL HTP lysate. NTP plates were incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm for 4 h. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min using a tabletop shaker . The plates were then centrifuged at 4000 rpm for 5 min, diluted 24x in water and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 116 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 116. Результаты представлены в табл. 15.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 116 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 116. The results are presented in table. 15.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Таблица 15.1. Активность вариантов, ацилирующих по участку А1, относительно SEQ ID № 116Table 15.1. Activity of variants acylating at the A1 site relative to SEQ ID No. 116
- 75 043748- 75 043748
- 76 043748- 76 043748
- 77 043748- 77 043748
- 78 043748- 78 043748
- 79 043748- 79 043748
- 80 043748- 80 043748
- 81 043748- 81 043748
- 82 043748- 82 043748
- 83 043748- 83 043748
- 84 043748- 84 043748
- 85 043748- 85 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 116 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 1,5 раза увеличены; ++ > чем в 1,5 раза, но меньше чем в 2,0 раза; +++ > чем в 2,0 раза, но меньше чем в 5,0 раза; ++++ > чем в 5,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 116 and were determined as follows: + > 1.2-fold but less than 1.5-fold increased; ++ > more than 1.5 times, but less than 2.0 times; +++ > more than 2.0 times, but less than 5.0 times; ++++ > than 5.0 times.
Пример 16. Эффект добавления гистидиновой метки, оказываемый на SEQ ID № 136Example 16: Effect of adding a histidine tag on SEQ ID NO: 136
Ацилирование по А1 для SEQ ID № 136 (описано в примере 15) и SEQ ID № 142, которая содержит метку из шести гистидинов на С-конце SEQ ID № 136, сравнивали в масштабе встряхиваемой колбы. Порошки встряхиваемых колб получали, как описано в примере 4. Реакции осуществляли в 96-луночных планшетах с глубокими лунками, содержащими 200 мкл 0,25 М Tris-HCl, рН 9,25, 20% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 0,05-0,5 г/л лиофилизированного порошка фермента. Планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 4 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали вThe A1 acylation of SEQ ID No. 136 (described in Example 15) and SEQ ID No. 142, which contains a six-histidine tag at the C-terminus of SEQ ID No. 136, were compared on a shake flask scale. Shake flask powders were prepared as described in Example 4. Reactions were carried out in 96-well deep well plates containing 200 μl of 0.25 M Tris-HCl, pH 9.25, 20% acetonitrile, 50 g/l insulin, 17 g /l methylphenylacetate and 0.05-0.5 g/l lyophilized enzyme powder. The plates were incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm, for 4 hours. Reactions were quenched using 200 μl of acetonitrile and mixed in
- 86 043748 течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин, разводили 20х в воде и загружали в HPLC для анализа. Результаты представлены на фиг. 3. Как показано на этой фиг. , добавление гистидиновой метки оказывало минимальный эффект на фермент относительно версии без гистидиновой метки.- 86 043748 for 5 minutes using a table shaker. The plates were then centrifuged at 4000 rpm for 5 min, diluted 20x in water and loaded onto HPLC for analysis. The results are presented in Fig. 3. As shown in this FIG. , the addition of a histidine tag had minimal effect on the enzyme relative to the version without the histidine tag.
Пример 17. Усовершенствование ацилирования инсулина в положениях А1 и В29 по сравнению с SEQ ID № 40 в высокопропускном скринингеExample 17: Improvement of Insulin Acylation at Positions A1 and B29 Compared to SEQ ID No. 40 in a High Throughput Screen
SEQ ID № 40 выбирали в качестве дополнительного родительского фермента на основе результатов, описанных в примере 11. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.SEQ ID No. 40 was selected as the additional parent enzyme based on the results described in Example 11. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками, каждая содержала 200 мкл, содержащих 0,2 М TRIS, рН 9,25, 20% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин в течение 2 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.NTR reactions were carried out in 96-well deep well plates, each containing 200 μl containing 0.2 M TRIS, pH 9.25, 20% acetonitrile, 50 g/l insulin, 17 g/l methylphenylacetate and 10 μl NTR supernatant. NTP plates were incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm for 2 h. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min using a tabletop shaker . The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 40 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 40. Результаты представлены в табл. 17.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 40 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 40. The results are presented in table. 17.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Процент избирательности относительно SEQ ID № 40 (процент избирательности FIOP) вычисляли как процент избирательности продукта, образуемого вариантом, относительно процента избирательности, обеспечиваемого с помощью SEQ ID № 40. Результаты представлены в табл. 17.1. Процент избирательности вычисляли посредством деления площади пика продукта на сумму площадей пиков продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage selectivity relative to SEQ ID No. 40 (FIOP selectivity percentage) was calculated as the percentage selectivity of the product formed by the variant relative to the percentage selectivity provided by SEQ ID No. 40. The results are presented in table. 17.1. The percent selectivity was calculated by dividing the peak area of the product by the sum of the peak areas of the product and the impurities/by-product as observed by HPLC analysis.
- 87 043748- 87 043748
Таблица 17.1. Активность и избирательность вариантов, ацилирующих по участку В29, ________________относительно SEQ ID № 40________________Table 17.1. The activity and selectivity of variants acylating at the B29 site ________________ relative to SEQ ID No. 40________________
- 88 043748- 88 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 40 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 5,0 раза увеличены; ++ > 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 40 and were determined as follows: + > 1.2-fold but less than 5.0-fold increased; ++ >
- 89 043748 чем в 5,0 раза, но меньше чем в 10,0 раза; +++ > чем в 10,0 раза, но меньше чем в 20,0 раза; ++++ >- 89 043748 than 5.0 times, but less than 10.0 times; +++ > than 10.0 times, but less than 20.0 times; ++++ >
чем в 20,0 раза.than 20.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 40 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 5,0 раза увеличены; ++ > чем в 5,0 раза, но меньше чем в 10,0 раза; +++ > чем в 10,0 раза, но меньше чем в 20,0 раза; ++++ > чем в 20,0 раза. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 40 and were determined as follows: + > 1.2-fold but less than 5.0-fold increased; ++ > more than 5.0 times, but less than 10.0 times; +++ > than 10.0 times, but less than 20.0 times; ++++ > than 20.0 times.
Пример 18. Усовершенствование ацилирования инсулина в положениях А1 и В29 по сравнению с SEQ ID № 154 в высокопропускном скринингеExample 18: Improvement of Insulin Acylation at Positions A1 and B29 Compared to SEQ ID No. 154 in a High Throughput Screen
SEQ ID № 154 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 17. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.SEQ ID No. 154 was selected as the next parent enzyme based on the results described in Example 17. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками, каждая содержала 200 мкл, содержащих 0,2 М TRIS, рН 9,25, 20% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 2 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.NTR reactions were carried out in 96-well deep well plates, each containing 200 μl containing 0.2 M TRIS, pH 9.25, 20% acetonitrile, 50 g/l insulin, 17 g/l methylphenylacetate and 10 μl NTR supernatant. NTR plates were incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm, for 2 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 154 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 154. Результаты представлены в табл. 18.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 154 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 154. The results are presented in table. 18.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Процент избирательности относительно SEQ ID № 154 (процент избирательности FIOP) вычисляли как процент избирательности продукта, образуемого вариантом, относительно процента избирательности, обеспечиваемого с помощью SEQ ID № 154. Результаты представлены в табл. 18.1. Процент избирательности вычисляли посредством деления площади пика продукта на сумму площадей пиков продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage selectivity relative to SEQ ID No. 154 (FIOP selectivity percentage) was calculated as the percentage selectivity of the product formed by the variant relative to the percentage selectivity provided by SEQ ID No. 154. The results are presented in table. 18.1. The percent selectivity was calculated by dividing the peak area of the product by the sum of the peak areas of the product and the impurities/by-product as observed by HPLC analysis.
- 90 043748- 90 043748
Таблица 18.1. Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 154Table 18.1. Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 154
- 91 043748- 91 043748
- 92 043748- 92 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 40 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 3,0 раза; +++ > чем в 3,0 раза, но меньше чем в 5,0 раза; ++++ > чем в 5,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 40 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 3.0 times; +++ > than 3.0 times, but less than 5.0 times; ++++ > than 5.0 times.
Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 40 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 3,0 раза; +++ > чем в 3,0 раза, но меньше чем в 5,0 раза; ++++ > чем в 5,0 раза.Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 40 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 3.0 times; +++ > than 3.0 times, but less than 5.0 times; ++++ > than 5.0 times.
Пример 19. Усовершенствование ацилирования инсулина в положениях А1 и В1 по сравнению с SEQ ID № 12 в высокопропускном скринингеExample 19: Improvement of Insulin Acylation at Positions A1 and B1 Compared to SEQ ID No. 12 in a High Throughput Screen
SEQ ID № 12 выбирали в качестве дополнительного родительского фермента на основе результатов, описанных в примере 7. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.SEQ ID No. 12 was selected as the additional parent enzyme based on the results described in Example 7. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками, содержащими 200 мкл 0,1 М TRIS, рН 9,25, 20% ацетонитрила, 10 г/л инсулина, 17 г/л метилфенилацетата и 10 мкл НТР супернатанта. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин в течение 5 ч. Реакции гасили с использованием 200 мкл ацетонитрила или диметилацетамид и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.NTR reactions were carried out in 96-well deep well plates containing 200 μl of 0.1 M TRIS, pH 9.25, 20% acetonitrile, 10 g/l insulin, 17 g/l methylphenylacetate and 10 μl of NTR supernatant. NTR plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm for 5 hours. Reactions were quenched using 200 μl of acetonitrile or dimethylacetamide and mixed for 5 min using table shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 12 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспе- 93 043748 чиваемого с помощью SEQ ID № 12. Результаты представлены в табл. 19.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percent conversion relative to SEQ ID No. 12 (FIOP conversion percent) was calculated as the percent conversion of the product formed by the variant relative to the percent conversion provided by SEQ ID No. 12. The results are presented in Table 1. 19.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Таблица 19.1. Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 12Table 19.1. Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 12
- 94 043748- 94 043748
1 Уровни увеличенной активности или избирательности определяли относительно эталонного полипептида из SEQ ID № 12 и определяли следующим образом: ”+” > чем в 2,0 раза, но меньше чем в 5 раз увеличены; ++ > чем в 5 раз, но меньше чем в 10 раз; +++ > чем в 10 раз, но меньше чем в 15 раз: ”++++” > чем в 15 раз. 1 Levels of increased activity or selectivity were determined relative to the reference polypeptide of SEQ ID No. 12 and were defined as follows: “+” > 2.0-fold but less than 5-fold increased; ++ > more than 5 times, but less than 10 times; +++ > than 10 times, but less than 15 times: ”++++” > than 15 times.
-95043748-95043748
Пример 20. Усовершенствование ацилирования инсулина в положении В29 в присутствии фенилуксусной кислоты по сравнению с SEQ ID № 56 с высокой пропускной способностьюExample 20: Improvement of Insulin Acylation at Position B29 in the Presence of Phenylacetic Acid Compared to High Throughput SEQ ID No. 56
SEQ ID № 56 выбирали в качестве дополнительного родительского фермента на основе результатов, описанных в примере 12. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но с использованием 400 мкл лизирующего буфера вместо 200 мкл.SEQ ID No. 56 was selected as the additional parent enzyme based on the results described in Example 12. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTP as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,2 М TRIS, 10% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата, 12,5 или 15 г/л фенилуксусной кислоты и 10 мкл НТР супернатанта (начальный рН перед добавлением лизата составлял 9,4). НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин в течение 3 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем добавляли 400 мкл воды и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об. /мин в течение 5 мин и разводили еще в 2 раза в воде перед загрузкой в HPLC для анализа.HTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.2 M TRIS, 10% acetonitrile, 50 g/l insulin, 17 g/l methylphenylacetate, 12.5 or 15 g/l phenylacetic acid and 10 μl of HTR supernatant (initial pH before addition of lysate was 9.4). NTP plates were incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm for 3 h. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 min using a tabletop shaker . Then, 400 μL of water was added and mixed for 5 min using a table shaker. Then the plates were centrifuged at 4000 rpm. /min for 5 min and diluted another 2-fold in water before loading into HPLC for analysis.
Процент превращения относительно SEQ ID № 56 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 56. Результаты представлены в табл. 20.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 56 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 56. The results are presented in table. 20.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Таблица 20.1. Активность и избирательность вариантов, ацилирующих по участку В29, __________________относительно SEQ ID № 56__________________Table 20.1. The activity and selectivity of variants acylating at the B29 site are __________________ relative to SEQ ID No. 56__________________
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 56 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 56 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > than 2.0 times.
Пример 21. Аналитическое обнаружение инсулина и его ацилированных продуктов.Example 21. Analytical detection of insulin and its acylated products.
Данные, описанные в примерах 5-18, собирали с использованием аналитических способов в табл. 21.1, 21.2, 21.3, 21.4 и 21.5. Все способы, предусмотренные в настоящем описании, находят использование при анализе вариантов, получаемых с использованием настоящего изобретения. Однако не предусмотрено, что способы, описанные в настоящем описании, являются исключительными способами в применении к анализу вариантов, предусмотренных в настоящем описании и/или получаемых с использованием способов, предусмотренных в настоящем описании. Результаты, предстаывленные на фиг. 1, соответствуют порядку элюирования соединений для этих способов.The data described in examples 5-18 were collected using the analytical methods in table. 21.1, 21.2, 21.3, 21.4 and 21.5. All methods provided in the present description find use in the analysis of variants obtained using the present invention. However, it is not intended that the methods described herein are exclusive methods as applied to the analysis of the variants provided herein and/or obtained using the methods provided herein. The results presented in Fig. 1 correspond to the elution order of the compounds for these methods.
- 96 043748- 96 043748
Таблица. 21.1. Аналитический способTable. 21.1. Analytical method
Таблица 21.2. Аналитический способTable 21.2. Analytical method
- 97 043748- 97 043748
Таблица 21.3. Аналитический способTable 21.3. Analytical method
Таблица 21.4. Аналитический способTable 21.4. Analytical method
- 98 043748- 98 043748
Таблица 21.5. Аналитический способTable 21.5. Analytical method
Пример 22. Усовершенствование ацилирования инсулина в положениях А1 и В2 9 по сравнению с SEQ ID № 160 в высокопропускном скринингеExample 22: Improvement of Insulin Acylation at A1 and B2 Positions 9 Compared to SEQ ID No. 160 in a High Throughput Screen
SEQ ID № 160 выбирали в качестве дополнительного родительского фермента на основе результатов, описанных в примере 18. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3.SEQ ID No. 160 was selected as the additional parent enzyme based on the results described in Example 18. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTR as described in Example 2, and soluble lysates were created as described in Example 3.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками, каждая содержала 200 мкл, состоящих из 0,5 М TRIS, рН 10,0, 20% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 5-10 мкл НТР супернатанта. НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 2 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 мин и загружали в HPLC для анализа.NTR reactions were carried out in 96-well deep well plates, each containing 200 μl, consisting of 0.5 M TRIS, pH 10.0, 20% acetonitrile, 50 g/l insulin, 17 g/l methylphenylacetate and 5-10 μl NTR of the supernatant. NTR plates were incubated in Thermotron® shakers (3 mm amplitude, model no. AJ185, Infors) at 30°C, 100 rpm, for 2 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker. The plates were then centrifuged at 4000 rpm for 5 min and loaded onto HPLC for analysis.
Процент превращения относительно SEQ ID № 160 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 160. Результаты представлены в табл. 22.1. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percentage conversion relative to SEQ ID No. 160 (FIOP conversion percentage) was calculated as the percentage conversion of the product formed by the variant relative to the percentage conversion provided by SEQ ID No. 160. The results are presented in table. 22.1. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
- 99 043748- 99 043748
Таблица 22.1. Активность и избирательность вариантов, ацилирующих по участкам А1 и В29, относительно SEQ ID № 160Table 22.1. Activity and selectivity of variants acylating at sites A1 and B29 relative to SEQ ID No. 160
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 160 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 3,0 раза; +++ > чем в 3,0 раза, но меньше чем в 5,0 раза; ++++ > чем в 5,0 раза. 1 Levels of increased activity were set relative to the reference polypeptide from SEQ ID No. 160 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 3.0 times; +++ > than 3.0 times, but less than 5.0 times; ++++ > than 5.0 times.
2 Уровни увеличенной избирательности устанавливали относительно эталонного полипептида из SEQ ID № 160 и определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем в 2,0 раза, но меньше чем в 3,0 раза; +++ > чем в 3,0 раза, но меньше чем в 5,0 раза; ++++ > чем в 5,0 раза. 2 Levels of increased selectivity were set relative to the reference polypeptide of SEQ ID No. 160 and were determined as follows: + > 1.2-fold but less than 2.0-fold increased; ++ > more than 2.0 times, but less than 3.0 times; +++ > than 3.0 times, but less than 5.0 times; ++++ > than 5.0 times.
- 100 043748- 100 043748
Пример 23. Усовершенствование ацилирования инсулина в положении В29 по сравнению с SEQ ID № 100 в высокопропускном скринингеExample 23: Improvement of Insulin Acylation at Position B29 Compared to SEQ ID No. 100 in a High Throughput Screen
SEQ ID № 100 выбирали в качестве следующего родительского фермента на основе результатов, описанных в примере 13. Библиотеки сконструированных генов получали с использованием луночных приемов (например, насыщающий мутагенез и рекомбинация предварительно идентифицированных полезных мутаций). Полипептиды, кодируемые каждым геном, получали в НТР, как описано в примере 2, а растворимые лизаты создавали, как описано в примере 3, но с использованием 400 мкл лизирующего буфера, вместо 200 мкл.SEQ ID No. 100 was selected as the next parent enzyme based on the results described in Example 13. Engineered gene libraries were generated using well techniques (eg, saturation mutagenesis and recombination of previously identified beneficial mutations). The polypeptides encoded by each gene were prepared in the NTP as described in Example 2, and soluble lysates were created as described in Example 3, but using 400 μl of lysis buffer instead of 200 μl.
НТР реакции осуществляли в 96-луночных планшетах с глубокими лунками. Каждая реакционная лунка содержала 200 мкл 0,5 М TRIS, 20% ацетонитрила, 50 г/л инсулина, 17 г/л метилфенилацетата и 40 мкл НТР супернатанта (начальный рН перед добавлением лизата=10). НТР планшеты инкубировали во встряхивателях Thermotron® (амплитуда 3 мм, модель № AJ185, Infors) при 30°С, 100 об./мин, в течение 5 ч. Реакции гасили с использованием 200 мкл ацетонитрила и перемешивали в течение 5 мин с использованием настольного встряхивателя. Добавляли 400 мкл воды и планшеты снова перемешивали в течение 5 мин с использованием настольного встряхивателя. Затем планшеты центрифугировали на 4000 об./мин в течение 5 минут и разбавляли еще в 2 раза в воде перед загрузкой в HPLC для анализа.HTR reactions were carried out in 96-well plates with deep wells. Each reaction well contained 200 μl of 0.5 M TRIS, 20% acetonitrile, 50 g/l insulin, 17 g/l methylphenylacetate and 40 μl of HTR supernatant (initial pH before addition of lysate=10). NTP plates were incubated in Thermotron® shakers (amplitude 3 mm, model no. AJ185, Infors) at 30°C, 100 rpm, for 5 hours. Reactions were quenched using 200 μl of acetonitrile and mixed for 5 minutes using a benchtop shaker. 400 μl of water was added and the plates were mixed again for 5 min using a table shaker. The plates were then centrifuged at 4000 rpm for 5 minutes and diluted an additional 2-fold in water before loading into HPLC for analysis.
Процент превращения относительно SEQ ID № 100 (процент превращения FIOP) вычисляли как процент превращения продукта, образуемого вариантом, относительно процента превращения, обеспечиваемого с помощью SEQ ID № 100, и он показан далее в таблице. Процент превращения количественно определяли делением площади пика продукта на сумму площадей пиков субстрата, продукта и примесей/побочного продукта, как наблюдали по HPLC анализу.The percent conversion relative to SEQ ID No. 100 (FIOP conversion percent) was calculated as the percent conversion of the product formed by the variant relative to the percent conversion provided by SEQ ID No. 100 and is shown below in the table. The percent conversion was quantified by dividing the peak area of the product by the sum of the peak areas of the substrate, product, and impurities/by-product as observed by HPLC analysis.
Таблица 23.1. Активность и избирательность вариантов, ацилирующих по участку В29, _____________ относительно SEQ ID № 100________________Table 23.1. The activity and selectivity of variants acylating at site B29 are _____________ relative to SEQ ID No. 100________________
- 101 043748- 101 043748
1 Уровни увеличенной активности устанавливали относительно эталонного полипептида из SEQ ID № 100, который демонстрировал превращение 33,9±1,4%. Усовершенствования эффективности определяли следующим образом: + > чем в 1,2 раза, но меньше чем в 2,0 раза увеличены; ++ > чем 2. 1 Levels of increased activity were established relative to the reference polypeptide from SEQ ID No. 100, which showed a conversion of 33.9 ± 1.4%. Efficiency improvements were defined as: + > greater than 1.2 times but less than 2.0 times increased; ++ > than 2.
- 102 043748- 102 043748
Таблица 23.2Table 23.2
Активность и избирательность вариантов, ацилирующих по участку В29, относительно SEQ ID № 100Activity and selectivity of variants acylating at the B29 site relative to SEQ ID No. 100
- 103 -- 103 -
Claims (6)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/442,810 | 2017-01-05 | ||
US62/472,055 | 2017-03-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA043748B1 true EA043748B1 (en) | 2023-06-19 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11180747B2 (en) | Variant penicillin-G acylases | |
US12084697B2 (en) | Penicillin-G acylases | |
US11965192B2 (en) | Penicillin-G acylases | |
US20230272363A1 (en) | Penicillin-g acylases | |
EA043748B1 (en) | PENICILLIN G ACYLASES |