CN111757891B - 索马鲁肽、利拉鲁肽和glp-1的化学-酶法合成 - Google Patents
索马鲁肽、利拉鲁肽和glp-1的化学-酶法合成 Download PDFInfo
- Publication number
- CN111757891B CN111757891B CN201980014900.2A CN201980014900A CN111757891B CN 111757891 B CN111757891 B CN 111757891B CN 201980014900 A CN201980014900 A CN 201980014900A CN 111757891 B CN111757891 B CN 111757891B
- Authority
- CN
- China
- Prior art keywords
- gly
- glu
- ala
- ser
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 title claims description 52
- 108010019598 Liraglutide Proteins 0.000 title claims description 51
- 229960002701 liraglutide Drugs 0.000 title claims description 51
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 title claims description 23
- 101710198884 GATA-type zinc finger protein 1 Proteins 0.000 title claims 2
- 230000015572 biosynthetic process Effects 0.000 title description 39
- 238000003786 synthesis reaction Methods 0.000 title description 37
- 102100025101 GATA-type zinc finger protein 1 Human genes 0.000 title 1
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 278
- 238000005859 coupling reaction Methods 0.000 claims abstract description 126
- 238000010168 coupling process Methods 0.000 claims abstract description 118
- 230000008878 coupling Effects 0.000 claims abstract description 117
- 238000000034 method Methods 0.000 claims abstract description 100
- 150000001413 amino acids Chemical class 0.000 claims abstract description 83
- 210000004899 c-terminal region Anatomy 0.000 claims abstract description 75
- 239000012038 nucleophile Substances 0.000 claims abstract description 67
- 150000002148 esters Chemical group 0.000 claims abstract description 62
- 125000006239 protecting group Chemical group 0.000 claims abstract description 46
- 150000007970 thio esters Chemical group 0.000 claims abstract description 46
- 108010033276 Peptide Fragments Proteins 0.000 claims abstract description 22
- 102000007079 Peptide Fragments Human genes 0.000 claims abstract description 22
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical group CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 claims abstract description 20
- 125000000524 functional group Chemical group 0.000 claims abstract description 12
- 150000001412 amines Chemical class 0.000 claims abstract description 9
- 230000002255 enzymatic effect Effects 0.000 claims description 69
- 102000003960 Ligases Human genes 0.000 claims description 59
- 108090000364 Ligases Proteins 0.000 claims description 59
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 57
- 108010056079 Subtilisins Proteins 0.000 claims description 47
- 102000005158 Subtilisins Human genes 0.000 claims description 47
- -1 phenylthiocarbamoyl Chemical group 0.000 claims description 45
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 45
- 125000000446 sulfanediyl group Chemical group *S* 0.000 claims description 40
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 claims description 22
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 7
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 claims description 5
- 229920001184 polypeptide Polymers 0.000 claims description 5
- YQZVQKYXWPIKIX-UHFFFAOYSA-N 2-[2-[2-[[2-[2-(2-aminoethoxy)ethoxy]acetyl]amino]ethoxy]ethoxy]acetic acid Chemical compound NCCOCCOCC(=O)NCCOCCOCC(O)=O YQZVQKYXWPIKIX-UHFFFAOYSA-N 0.000 claims description 3
- 125000000539 amino acid group Chemical group 0.000 abstract description 59
- 235000001014 amino acid Nutrition 0.000 description 88
- 229940024606 amino acid Drugs 0.000 description 80
- 230000035772 mutation Effects 0.000 description 53
- 239000000047 product Substances 0.000 description 49
- 125000003275 alpha amino acid group Chemical group 0.000 description 48
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 37
- 102000004190 Enzymes Human genes 0.000 description 30
- 108090000790 Enzymes Proteins 0.000 description 30
- 239000012634 fragment Substances 0.000 description 29
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 27
- 239000000243 solution Substances 0.000 description 25
- 108090000623 proteins and genes Proteins 0.000 description 23
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 21
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 18
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 18
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 17
- 239000000203 mixture Substances 0.000 description 16
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 15
- 108090000787 Subtilisin Proteins 0.000 description 15
- 239000000872 buffer Substances 0.000 description 15
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 14
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 14
- 238000003776 cleavage reaction Methods 0.000 description 14
- 102000035195 Peptidases Human genes 0.000 description 13
- 108091005804 Peptidases Proteins 0.000 description 13
- 239000004365 Protease Substances 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 13
- 230000007017 scission Effects 0.000 description 13
- 239000007858 starting material Substances 0.000 description 13
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 12
- 125000003277 amino group Chemical group 0.000 description 11
- 238000009833 condensation Methods 0.000 description 11
- 230000005494 condensation Effects 0.000 description 11
- 239000000194 fatty acid Substances 0.000 description 11
- 238000002953 preparative HPLC Methods 0.000 description 11
- 235000018102 proteins Nutrition 0.000 description 11
- 102000004169 proteins and genes Human genes 0.000 description 11
- 235000014113 dietary fatty acids Nutrition 0.000 description 10
- 229930195729 fatty acid Natural products 0.000 description 10
- 150000004665 fatty acids Chemical class 0.000 description 10
- 238000007306 functionalization reaction Methods 0.000 description 10
- QKFJKGMPGYROCL-UHFFFAOYSA-N phenyl isothiocyanate Chemical compound S=C=NC1=CC=CC=C1 QKFJKGMPGYROCL-UHFFFAOYSA-N 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- 238000000855 fermentation Methods 0.000 description 9
- 230000004151 fermentation Effects 0.000 description 9
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 9
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 9
- 239000002243 precursor Substances 0.000 description 9
- 239000012429 reaction media Substances 0.000 description 9
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 8
- 239000011347 resin Substances 0.000 description 8
- 229920005989 resin Polymers 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- 108010038807 Oligopeptides Proteins 0.000 description 7
- 102000015636 Oligopeptides Human genes 0.000 description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 7
- 235000008206 alpha-amino acids Nutrition 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 125000002843 carboxylic acid group Chemical group 0.000 description 7
- 229940098779 methanesulfonic acid Drugs 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 6
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000010511 deprotection reaction Methods 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 230000007062 hydrolysis Effects 0.000 description 6
- 238000006460 hydrolysis reaction Methods 0.000 description 6
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 6
- 238000010647 peptide synthesis reaction Methods 0.000 description 6
- 229930182852 proteinogenic amino acid Natural products 0.000 description 6
- 239000011541 reaction mixture Substances 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- ZGYICYBLPGRURT-UHFFFAOYSA-N tri(propan-2-yl)silicon Chemical compound CC(C)[Si](C(C)C)C(C)C ZGYICYBLPGRURT-UHFFFAOYSA-N 0.000 description 6
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 5
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 5
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 5
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 5
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 5
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 5
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 5
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 5
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 5
- 125000000217 alkyl group Chemical group 0.000 description 5
- 239000012431 aqueous reaction media Substances 0.000 description 5
- 239000007864 aqueous solution Substances 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 229940117953 phenylisothiocyanate Drugs 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 238000010532 solid phase synthesis reaction Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000002194 synthesizing effect Effects 0.000 description 5
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 4
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 4
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 4
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 4
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 125000002252 acyl group Chemical group 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 239000012043 crude product Substances 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000003480 eluent Substances 0.000 description 4
- 238000012262 fermentative production Methods 0.000 description 4
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 125000002924 primary amino group Chemical class [H]N([H])* 0.000 description 4
- 102220281620 rs551111938 Human genes 0.000 description 4
- 108010004034 stable plasma protein solution Proteins 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 102220499814 Carbonic anhydrase 2_N62A_mutation Human genes 0.000 description 3
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 3
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 3
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 3
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 3
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 3
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 3
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 3
- 150000001576 beta-amino acids Chemical class 0.000 description 3
- 150000003857 carboxamides Chemical group 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000002473 insulinotropic effect Effects 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- BJGJOZOJZZPFSE-UHFFFAOYSA-N methylsulfanylimino(sulfanylidene)methane Chemical compound CSN=C=S BJGJOZOJZZPFSE-UHFFFAOYSA-N 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 3
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 3
- 235000016491 selenocysteine Nutrition 0.000 description 3
- 229940055619 selenocysteine Drugs 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000007086 side reaction Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 2
- DEUJSGDXBNTQMY-UHFFFAOYSA-N 1,2,2-trifluoroethanol Chemical compound OC(F)C(F)F DEUJSGDXBNTQMY-UHFFFAOYSA-N 0.000 description 2
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 2
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 2
- MZGXHCHKGRQLHR-UHFFFAOYSA-N 5-(dimethylamino)-n-(4-isothiocyanatophenyl)naphthalene-1-sulfonamide Chemical compound C1=CC=C2C(N(C)C)=CC=CC2=C1S(=O)(=O)NC1=CC=C(N=C=S)C=C1 MZGXHCHKGRQLHR-UHFFFAOYSA-N 0.000 description 2
- HWFBOFAKQCMAPO-UHFFFAOYSA-N 7-isothiocyanato-2,1,3-benzoxadiazole-4-sulfonamide Chemical group NS(=O)(=O)C1=CC=C(N=C=S)C2=NON=C12 HWFBOFAKQCMAPO-UHFFFAOYSA-N 0.000 description 2
- SUOZAUUDBKHLHQ-UHFFFAOYSA-N 7-isothiocyanato-n,n-dimethyl-2,1,3-benzoxadiazole-4-sulfonamide Chemical compound CN(C)S(=O)(=O)C1=CC=C(N=C=S)C2=NON=C12 SUOZAUUDBKHLHQ-UHFFFAOYSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 2
- 101800001415 Bri23 peptide Proteins 0.000 description 2
- 101800000655 C-terminal peptide Proteins 0.000 description 2
- 102400000107 C-terminal peptide Human genes 0.000 description 2
- XTHFKEDIFFGKHM-UHFFFAOYSA-N Dimethoxyethane Chemical compound COCCOC XTHFKEDIFFGKHM-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 2
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 2
- 239000006173 Good's buffer Substances 0.000 description 2
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 150000008575 L-amino acids Chemical group 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 2
- LGDSHSYDSCRFAB-UHFFFAOYSA-N Methyl isothiocyanate Chemical compound CN=C=S LGDSHSYDSCRFAB-UHFFFAOYSA-N 0.000 description 2
- FXHOOIRPVKKKFG-UHFFFAOYSA-N N,N-Dimethylacetamide Chemical compound CN(C)C(C)=O FXHOOIRPVKKKFG-UHFFFAOYSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SECXISVLQFMRJM-UHFFFAOYSA-N N-Methylpyrrolidone Chemical compound CN1CCCC1=O SECXISVLQFMRJM-UHFFFAOYSA-N 0.000 description 2
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 235000021314 Palmitic acid Nutrition 0.000 description 2
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- DKGAVHZHDRPRBM-UHFFFAOYSA-N Tert-Butanol Chemical compound CC(C)(C)O DKGAVHZHDRPRBM-UHFFFAOYSA-N 0.000 description 2
- 102000005488 Thioesterase Human genes 0.000 description 2
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- MJBBMTOGSOSAKJ-HJXMPXNTSA-N Trp-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MJBBMTOGSOSAKJ-HJXMPXNTSA-N 0.000 description 2
- LDMUNXDDIDAPJH-VMBFOHBNSA-N Trp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LDMUNXDDIDAPJH-VMBFOHBNSA-N 0.000 description 2
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 2
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 2
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 108010064997 VPY tripeptide Proteins 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 150000001371 alpha-amino acids Chemical class 0.000 description 2
- 150000001408 amides Chemical group 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000012412 chemical coupling Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 239000006184 cosolvent Substances 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 125000004185 ester group Chemical group 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 229960000789 guanidine hydrochloride Drugs 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000017730 intein-mediated protein splicing Effects 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 150000002540 isothiocyanates Chemical class 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 238000005897 peptide coupling reaction Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000006340 racemization Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- 235000017557 sodium bicarbonate Nutrition 0.000 description 2
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- 108020002982 thioesterase Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 238000000825 ultraviolet detection Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 125000001782 α-aminoisobutyric acid group Chemical group [H]N(*)C(C(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- URQNDMXCKJEUEW-DEOSSOPVSA-N (2s)-2-amino-6-[[(4-methylphenyl)-diphenylmethyl]amino]hexanoic acid Chemical compound C1=CC(C)=CC=C1C(NCCCC[C@H](N)C(O)=O)(C=1C=CC=CC=1)C1=CC=CC=C1 URQNDMXCKJEUEW-DEOSSOPVSA-N 0.000 description 1
- GOPWHXPXSPIIQZ-FQEVSTJZSA-N (4s)-4-(9h-fluoren-9-ylmethoxycarbonylamino)-5-[(2-methylpropan-2-yl)oxy]-5-oxopentanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CCC(O)=O)C(=O)OC(C)(C)C)C3=CC=CC=C3C2=C1 GOPWHXPXSPIIQZ-FQEVSTJZSA-N 0.000 description 1
- 125000006273 (C1-C3) alkyl group Chemical group 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000006701 (C1-C7) alkyl group Chemical group 0.000 description 1
- BDNKZNFMNDZQMI-UHFFFAOYSA-N 1,3-diisopropylcarbodiimide Chemical compound CC(C)N=C=NC(C)C BDNKZNFMNDZQMI-UHFFFAOYSA-N 0.000 description 1
- JFLSOKIMYBSASW-UHFFFAOYSA-N 1-chloro-2-[chloro(diphenyl)methyl]benzene Chemical compound ClC1=CC=CC=C1C(Cl)(C=1C=CC=CC=1)C1=CC=CC=C1 JFLSOKIMYBSASW-UHFFFAOYSA-N 0.000 description 1
- HBEDSQVIWPRPAY-UHFFFAOYSA-N 2,3-dihydrobenzofuran Chemical compound C1=CC=C2OCCC2=C1 HBEDSQVIWPRPAY-UHFFFAOYSA-N 0.000 description 1
- AOQBFUJPFAJULO-UHFFFAOYSA-N 2-(4-isothiocyanatophenyl)isoindole-1-carbonitrile Chemical compound C1=CC(N=C=S)=CC=C1N1C(C#N)=C2C=CC=CC2=C1 AOQBFUJPFAJULO-UHFFFAOYSA-N 0.000 description 1
- HOZZVEPRYYCBTO-UHFFFAOYSA-N 2-(9h-fluoren-9-ylmethoxycarbonylamino)-2-methylpropanoic acid Chemical compound C1=CC=C2C(COC(=O)NC(C)(C)C(O)=O)C3=CC=CC=C3C2=C1 HOZZVEPRYYCBTO-UHFFFAOYSA-N 0.000 description 1
- ALHCLEQKEZOJIY-UHFFFAOYSA-N 2-(aminomethyl)-5-methoxyphenol Chemical group COC1=CC=C(CN)C(O)=C1 ALHCLEQKEZOJIY-UHFFFAOYSA-N 0.000 description 1
- XQPYRJIMPDBGRW-UHFFFAOYSA-N 2-[2-[2-(9h-fluoren-9-ylmethoxycarbonylamino)ethoxy]ethoxy]acetic acid Chemical compound C1=CC=C2C(COC(=O)NCCOCCOCC(=O)O)C3=CC=CC=C3C2=C1 XQPYRJIMPDBGRW-UHFFFAOYSA-N 0.000 description 1
- QCHPKSFMDHPSNR-UHFFFAOYSA-N 3-aminoisobutyric acid Chemical compound NCC(C)C(O)=O QCHPKSFMDHPSNR-UHFFFAOYSA-N 0.000 description 1
- DBTMQODRSDEGRZ-UHFFFAOYSA-N 9h-fluoren-9-ylmethyl n-(2-oxoethyl)carbamate Chemical compound C1=CC=C2C(COC(=O)NCC=O)C3=CC=CC=C3C2=C1 DBTMQODRSDEGRZ-UHFFFAOYSA-N 0.000 description 1
- NTFTULBKHJJQAW-HNNXBMFYSA-N 9h-fluoren-9-ylmethyl n-[(2s)-4-methyl-1-oxopentan-2-yl]carbamate Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CC(C)C)C=O)C3=CC=CC=C3C2=C1 NTFTULBKHJJQAW-HNNXBMFYSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- IAUSCRHURCZUJP-CIUDSAMLSA-N Ala-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CS)C(O)=O IAUSCRHURCZUJP-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- DDPKBJZLAXLQGZ-KBIXCLLPSA-N Ala-Val-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DDPKBJZLAXLQGZ-KBIXCLLPSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical group [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 1
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 1
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101000642797 Bacillus amyloliquefaciens Subtilisin BPN' Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100337060 Caenorhabditis elegans glp-1 gene Proteins 0.000 description 1
- 101100455752 Caenorhabditis elegans lys-3 gene Proteins 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-N Carbamic acid Chemical compound NC(O)=O KXDHJXZQYSOELW-UHFFFAOYSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- 101000788682 Homo sapiens GATA-type zinc finger protein 1 Proteins 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 239000006177 biological buffer Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 108091006116 chimeric peptides Proteins 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- ZYBWTEQKHIADDQ-UHFFFAOYSA-N ethanol;methanol Chemical compound OC.CCO ZYBWTEQKHIADDQ-UHFFFAOYSA-N 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 235000020845 low-calorie diet Nutrition 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- BNJOQKFENDDGSC-UHFFFAOYSA-N octadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCCCC(O)=O BNJOQKFENDDGSC-UHFFFAOYSA-N 0.000 description 1
- 239000012044 organic layer Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000037081 physical activity Effects 0.000 description 1
- 235000017807 phytochemicals Nutrition 0.000 description 1
- 229930000223 plant secondary metabolite Natural products 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 125000001554 selenocysteine group Chemical group [H][Se]C([H])([H])C(N([H])[H])C(=O)O* 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 150000003354 serine derivatives Chemical class 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 108010037022 subtiligase Proteins 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- FZQIQTXXAATZOS-UHFFFAOYSA-N tert-butyl n-[(4-isothiocyanatophenyl)methyl]carbamate Chemical compound CC(C)(C)OC(=O)NCC1=CC=C(N=C=S)C=C1 FZQIQTXXAATZOS-UHFFFAOYSA-N 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 150000003558 thiocarbamic acid derivatives Chemical class 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 125000004044 trifluoroacetyl group Chemical group FC(C(=O)*)(F)F 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000004260 weight control Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/605—Glucagons
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
- C12N9/54—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21062—Subtilisin (3.4.21.62)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Endocrinology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及一种制备包含序列Pq‑Wv‑His‑X‑Glu‑Gly‑Thr‑Phe‑Thr‑Ser‑Asp‑Val‑Ser‑Ser‑Tyr‑Leu‑Glu‑Gly‑Gln‑Ala‑Ala‑Y‑Glu‑Phe‑Ile‑Ala‑Trp‑Leu‑Val‑Z‑Gly‑Arg‑Gly的偶联产物的方法,所述方法包括将(a)包含由式Pq‑Wv‑His‑X‑Glu‑(硫)酯表示的第一肽片段的肽C‑末端酯或硫酯和(b)包含第二肽片段的具有N‑末端未保护的胺的肽亲核试剂酶法偶联,所述第二肽片段包含序列H‑Gly‑Thr‑Phe‑Thr‑Ser‑Asp‑Val‑Ser‑Ser‑Tyr‑Leu‑Glu‑Gly‑Gln‑Ala‑Ala‑Y‑Glu‑Phe‑Ile‑Ala‑Trp‑Leu‑Val‑Z‑Gly‑Arg‑Gly,其中‑P表示在所述肽C‑末端酯或硫酯的N‑末端α‑氨基官能团处的保护基团,并且q是具有1或0的值的整数;‑W表示一个或多个可能相同或不同的氨基酸残基,并且v是代表氨基酸残基W的数目的具有1或更大的值的整数;‑X是Ala或α‑氨基异丁酸单元(Aib);‑Y是Lys,所述Lys具有游离的侧链ε‑氨基或被保护基团保护的侧链ε‑氨基或者用氨基酸或另一个官能团官能化的侧链ε‑氨基;‑Z是Arg或Lys。
Description
本发明涉及一种方法,其中在连接酶存在下采用酶法进行肽片段偶联,以合成包含序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽。
包含氨基酸序列H-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly-OH的几种肽在本领域中公知为促胰岛素肽。这些肽包括GLP-1、利拉鲁肽和索马鲁肽。
人类GLP-1(胰高血糖素样肽-1)具有式H-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Gly-OH。
利拉鲁肽是一种Arg20-GLP-1同源物,其在上述序列的第20位中赖氨酸的ε-氨基上被Glu隔开的棕榈酸取代。因此,利拉鲁肽具有式H-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(Pal-γ-Glu)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH(也参见图1,所有手性氨基酸残基都是L-氨基酸残基)。在Lys(Pal-γ-Glu)中,Lys残基的ε-氨基与γ-Glu羧基侧链相连,并且所述Glu被N-棕榈酰化。
索马鲁肽具有式H-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH。在本文中,Aib是α-氨基异丁酸残基并且AEEA-AEEA-γ-Glu-17-羧基十七烷酰基是N-(17-羧基-1-氧络十七烷基)-L-γ-谷氨酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基(也参见图2,所有手性氨基酸残基都是L-氨基酸残基)。
这些肽可以例如用于治疗II型糖尿病。此外,例如利拉鲁肽可用于肥胖症的治疗,作为用于成年患者长期体重控制的低卡路里饮食和增加体育活动的注射辅助剂。
用于合成肽、包括寡肽如GLP-1、利拉鲁肽和索马鲁肽的方法在本领域中是已知的。合成促胰岛素肽例如GLP-1及其同源物的方法描述在WO2007147816和WO2016/046753中。作为天然存在的肽的GLP-1可以通过重组基因技术即在生物细胞中例如在酵母细胞中发酵生产(参见例如WO2016/046753)。促胰岛素肽的发酵生产的大规模使用具有优势。然而,这种技术对于在实践中可以在工业规模上生产的肽来说也有限制。例如,如果可能的话,发酵生产在其氨基酸序列中包含非蛋白原性氨基酸的肽是一种挑战。例如,索马鲁肽的氨基酸序列包含非蛋白原性的α-氨基异丁酸(Aib)残基。
此外,GLP-1同源物如索马鲁肽和利拉鲁肽在它们的序列中的氨基酸的侧链基团处被官能化。在索马鲁肽和利拉鲁肽的情况下,Lys20的侧链ε-氨基已被官能化。这种侧链的功能化需要通过化学手段来进行。当化学偶联时,可能难以区分N-末端α-氨基官能团和需要进行官能化的侧链官能团,例如如果羧酸将要被偶联到Lys20(γ-Glu-OH)侧链的Glu的α-氨基官能团的情况。此外,在制备索马鲁肽时,人们应该考虑到将要偶联到索马鲁肽的氨基酸序列的AEEA-AEEA-γ-Glu-17-羧基十七烷酰基部分具有三个不同的羧酸官能团,其中只有γ-Glu羧酸需要被偶联。需要保护基团策略。在偶联活化的(任选地保护的)AEEA-AEEA-γ-Glu-17-羧基十七烷酰基后,应该将含有Aib残基的肽片段偶联到N-末端。这通常在第4位与第5位之间进行,即通过具有第1-4位氨基酸残基的肽与具有第5-31位氨基酸残基的肽的偶联,因为在活化Gly4时不发生消旋。第1-4位肽应该在N-末端处以及至少在3Glu的侧链官能团处被保护,以避免副反应(例如聚合)。将未保护的肽的发酵与受保护的肽的化学偶联相组合是一种挑战,因为两者的溶解性非常不同(水相比于有机溶剂)。在化学缩合反应后,需要除去所述保护基团,导致多步骤合成策略。
在WO2016/046753的“背景技术”中详细描述了适合的制备方法,尤其是重组方法,在固相支持物上的顺序合成,涉及将含有第1-10位氨基酸残基的肽序列偶联到含有第11-31位氨基酸残基的序列的利拉鲁肽的固相合成,或涉及制备含有第1-4位、第15-16位和第17位至第31位氨基酸残基的肽序列,将含有第15-16位氨基酸残基与含有第17-31位氨基酸残基的肽偶联,并在与含有第1-4位氨基酸残基的肽偶联之前顺序添加氨基酸的利拉鲁肽的固相合成。根据WO2016/046753,GLP-1肽在包含液相或固相肽合成或其组合的过程中制备,其中所述过程包括将片段偶联在末端Gly残基处的最终偶联步骤,并且其中至少一个片段通过至少两个子片段的偶联来制备。具体来说,利拉鲁肽通过将His-Ala-Glu-Gly与Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(Pal-Glu-OX)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH偶联来获得。在这个序列中,X表示H或用于Gluα-羧酸基团的保护基团。
如从WO2016/046753的“背景技术”得出的,对于发现用于合成GLP-1和GLP样肽例如利拉鲁肽或索马鲁肽的新方法仍存在需求,以提供更好、更高效且廉价的方法或提供可以更容易纯化的产品,以便获得具有提高的产率和纯度的产品。具体来说,它表示需要提供一种特别是在工业规模上制备GLP-1和同源物例如利拉鲁肽或索马鲁肽的方法,所述方法应该不需要使用有毒或在其他方面不理想的试剂即可获得良好产率,并且可以容易纯化以获得纯度高的产品。
GLP-1或其同源物如利拉鲁肽或索马鲁肽的化学-酶法合成在WO2007147816和WO2016/046753中均未提到,两者都聚焦于全化学合成。
然而,正如也在上述现有技术中讨论的,肽的全化学合成具有缺点。
与化学偶联相反,酶催化的肽偶联完全没有消旋,并且与化学肽合成相比具有几个其他优点,例如在偶联过程中在侧链官能团上不存在副反应。对于工业应用来说,基于动力学方法即使用酰基供体C-末端酯的酶法肽合成概念最具有吸引力(参见例如N.Sewald和H.-D.Jakubke,在《肽:化学和生物学》(Peptides:Chemistry and Biology),第一次重印,Ed.Wiley-VCH Verlag GmbH,Weinheim 2002中)。
在水性溶液中使用酶法偶联的问题在于水的存在倾向于促进水解而不是偶联。关于寡肽片段在水性溶液中的酶法缩合已发表了一些报告(Kumaran等,Protein Science,2000,9,734;等,Bioorg.Med.Chem.1998,6,891;Homandberg等,Biochemistry,1981,21,3387;Komoriya等,Int.J.Pep.Prot.Res.1980,16,433)。
Wells等人(US 5,403,737)发现,寡肽在水性溶液中的酶法缩合可以通过改变枯草杆菌蛋白酶BPN’这种来自于解淀粉芽孢杆菌(Bacillus amyloliquefaciens)的枯草杆菌蛋白酶(SEQ ID NO:2)的活性位点得到显著改进。当引入两个突变即S221C和P225A时,获得了被称为枯草杆菌连接酶(subtiligase)的枯草杆菌蛋白酶BPN’变体,其与野生型枯草杆菌蛋白酶BPN’相比具有提高500倍的合成与水解比率(S/H比率)。在进一步实验中,Wells等人向枯草杆菌连接酶添加了5个另外的突变,以使所述酶更加稳定(Proc.Natl.Acad.Sci.USA,1994,91,12544)。被称为稳定连接酶(stabiligase)的新变体对十二烷基硫酸钠和盐酸胍显示出适度提高的抗性,但水解仍然是主要的副反应。
在WO 2016/056913中,通过提供具有特定突变的枯草杆菌蛋白酶BPN’变体或其同源物,提供了在将酶例如枯草杆菌连接酶或稳定连接酶用于水性环境中的(寡)肽合成时遇到的不想要的高水解活性的一种解决方案。这些变体或同源物特别适合于通过偶联第一肽片段和第二肽片段来催化肽的合成,其中所述第一片段是肽C-末端酯或硫酯,并且所述第二片段是具有N-末端未保护的胺的肽亲核试剂。
发明人考虑了从WO2007147816或WO2016/046753中提到的肽片段开始,将酶法片段缩合应用于合成GLP-1、利拉鲁肽和索马鲁肽,例如通过将具有利拉鲁肽、索马鲁肽或GLP-1的第1-10位氨基酸残基的肽C-末端(硫)酯酶法偶联到含有第11-31位氨基酸残基的肽亲核试剂,或通过将具有利拉鲁肽、索马鲁肽或GLP-1的第1-4位氨基酸残基的肽C-末端(硫)酯酶法偶联到含有第5-31位氨基酸残基的肽亲核试剂。然后他们进一步设想了如果需要的话,至少相对长的亲核试剂可以通过发酵高效制备,然后可以将可能包含非蛋白原性Aib的相对短的(硫)酯与所述亲核试剂酶法偶联。
然而,他们的结论是这不太有效。对于具有第1-10位氨基酸残基的肽C-末端(硫)酯与含有第11-31位氨基酸残基的肽亲核试剂的偶联来说,原因之一被认为是在P1’和P2’两者处存在丝氨酸,发明人发现这对肽亲核试剂来说是不利的。缺少有效偶联的其他可能的原因可能是在所述肽C-末端(硫)酯的P4处存在非疏水氨基酸(苏氨酸)。对于具有第1-4位氨基酸残基的肽C-末端(硫)酯与含有第5-31位氨基酸残基的肽亲核试剂的偶联来说,发明人的结论是特别是在所述肽C-末端(硫)酯的P4处组氨酸的存在和/或P1处甘氨酸的存在对有效偶联有害。发明人发现,可以在连接酶存在下,并且也在水性反应介质中通过酶法偶联制备诸如GLP-1、利拉鲁肽和索马鲁肽的肽,但对于在科学考虑的基础上设计的几个过程来说产率出人意料地低,例如考虑到连接酶如枯草杆菌蛋白酶变体或其同源物有利于在肽C-末端酯或硫酯的S4位置(从C-末端末端起第四个氨基酸)处具有疏水性氨基酸残基的C-末端肽(硫)酯的偶联。
其中尤其是尝试了从相应的3-mer C-末端酯和28-mer肽亲核试剂、从相应的4-mer C-末端酯和27-mer肽亲核试剂、从相应的5-mer C-末端酯和26-mer肽亲核试剂和从相应的6-mer C-末端酯和25-mer肽亲核试剂采用酶法制备索马鲁肽的氨基酸序列。这些尝试没有成功。对于4-mer和27-mer的酶法偶联来说,有鉴于在用于酶识别的相关位置即P3位置(从C-末端末端起第三个氨基酸)处存在非蛋白原性Aib,这是预料之中的,但所述5-mer+26-mer片段和6-mer+25-mer片段被认为是有希望在连接酶存在下偶联的片段(也参见实施例7)。
本发明的目的是提供一种酶法合成GLP-1或其同源物、特别是索马鲁肽或利拉鲁肽的新方法。总体来说,对于用于这些肽的可选的酶法肽合成过程存在需求,特别是为了扩展用于制备它们的工具选项。具体来说,本发明的目的是提供一种方法,其克服了上面提到的或在上面引用的现有技术中讨论的一个或多个问题,更特别是具有提高的总产率或提高的选择性。
从下面的描述可以看出可能作为本发明的主题的一个或多个其他目的。
现在已令人吃惊地发现,这些目的中的一个或多个通过一种方法得以满足,其中,在包括通过片段缩合的肽的酶法合成的方法中制备了GLP-1或其同源物,其中将两个特定肽片段在连接酶、特别是枯草杆菌蛋白酶变体或同源物存在下偶联。
因此,本发明涉及一种制备包含序列Pq-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的偶联产物的方法,所述方法包括将以下(a)和(b)酶法偶联:
(a)包含由式Pq-Wv-His-X-Glu-(硫)酯表示的第一肽片段的肽C-末端酯或硫酯,和
(b)包含第二肽片段的具有N-末端未保护的胺的肽亲核试剂,所述第二胎片段包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly,
其中
-P表示在所述肽C-末端酯或硫酯的N-末端α-氨基官能团处的保护基团,并且q是具有1或0的值的整数;
-W表示一个或多个可能相同或不同的α-氨基酸残基,并且v是代表α-氨基酸残基W的数目的具有1或更大的值的整数;
-X是Ala或α-氨基异丁酸单元(Aib);
-Y是Lys,所述Lys具有游离的侧链ε-氨基或被保护基团保护的侧链ε-氨基或者用氨基酸或另一个官能团官能化的侧链ε-氨基,所述另一个官能团特别是选自γ-Glu-OH、Pal-γ-Glu-OH、AEEA-AEEA-γ-Glu-OH和AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH的官能团,其中Pal是棕榈酰基,并且AEEA-AEEA是2-[2-(2-氨基乙氧基)乙氧基]乙酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基;
-Z是Arg或Lys;
所述酶法偶联由连接酶催化。
因此,在特定实施方式中,本发明的方法还包括:
从所述包含序列Pq-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的产物除去所述“Pq-Wv”部分,以便获得具有序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽,其中P、q、v、W、X、Y和Z如上所定义。
因此,本发明所述的方法特别适合于偶联产物的合成,从所述偶联产物可以通过除去Pq-Wv获得生物活性肽例如用于索马鲁肽或利拉鲁肽的肽序列、索马鲁肽本身、利拉鲁肽本身。
因此,本发明还涉及一种用于合成包含序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽的方法,其中,从本发明的方法中获得的包含序列Pq-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly(其中P、q、v、W、X、Y和Z如上文为所述方法所定义)的偶联产物除去所述“Pq-Wv”部分,并获得包含序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽。
所述“Pq-Wv”部分的去除通常通过Edman型反应来实现,其中P是Edman型保护基团,并且氨基酸残基W通过随后将基团P偶联到N-末端W并切掉基团P-W,被一个接一个地(作为P-W)除去,进一步的详情参见下文。
本发明允许以高产率合成感兴趣的肽。纯化相对容易,并且肽的高纯度是可行的。鉴于使用其他片段的酶法偶联时有不令人满意的结果,特别令人吃惊的是,当在水性反应介质中进行时,本发明的方法也允许以高得率合成感兴趣的肽(连接产物)。
这在不需要肽片段上的任何侧链保护基团并且不需要为所述片段中的一个或两个提供官能团以提高溶解性(例如肽骨架酰胺官能团上的2-羟基-4-甲氧基苯甲基酰胺基或相应片段的不参与偶联反应的末端处极性氨基酸的肽标签)的情况下实现,尽管在特定实施方式中可以使用保护基团或增强溶解性的基团。不需溶解性增强基团的高S/H比率是令人吃惊的,因为肽亲核试剂的溶解性非常低。
本发明的另一个优点在于它允许发酵生产所述(4-31)-mer肽亲核试剂,然后可以将它方便地与所述C-末端肽(硫)酯偶联。在最终肽产物的“Y”需要具有官能化的ε-氨基以便例如合成索马鲁肽或利拉鲁肽时,所述官能化可以在酶法偶联之前或之后提供给所述肽亲核试剂。
特别令人吃惊的是,根据本发明的方法允许以高产率合成感兴趣的肽(连接产物),即使在P2位置处的氨基酸残基(X)是Aib时。毕竟,这是一种非蛋白原性的α,α-二烷基氨基酸,并且令人吃惊的是,这个氨基酸在对连接酶例如枯草杆菌蛋白酶或其变体或同源物的底物识别来说关键的位置处的存在对所述偶联没有不利影响。
本发明的另一个优点在于它在肽合成中提供灵活性,因为在本发明的方法中索马鲁肽和利拉鲁肽两者所需的肽亲核试剂的氨基酸序列是相同的。因此,人们可以制备肽亲核试剂的储用物,其一部分可用于生产索马鲁肽,一部分可用于生产利拉鲁肽。因此,单一发酵反应系统足以用于生产两种产品。此外,在酶法偶联之前通过发酵制备肽片段的方法中,所述片段的制备通常是限制步骤。因此,保持一种储用亲核试剂用于制备可以从该储用亲核试剂相对快地合成的索马鲁肽和利拉鲁肽两者的能力增添了灵活性,因为人们可以对一种或另一种产品的需求变化做出响应以快速地调整产品量。
特别是,已发现可以使用枯草杆菌蛋白酶BPN’变体来偶联其中Y是侧链ε-氨基已用氨基酸或另一个官能团官能化的Lys的肽亲核试剂,正如在本文别处更详细描述的。其中偶联使用Y是侧链ε-氨基已被官能化的Lys的肽亲核试剂进行的方法的优选实施方式,也在下文中进一步详细描述。
出于本发明的目的,“合成与水解比率”(S/H比率)意味着酶法合成的(寡)肽产物的量除以其酯或硫酯基团已被水解的(寡)肽C-末端酯或硫酯的量。关于确定S/H比率的进一步详情,参考WO 2016/056913。
当在本文中使用时,术语“或”被定义为“和/或”,除非另有规定或从上下文看出它意味着“不是……就是……”。
当在本文中使用时,没有具体数目的指称被定义为“至少一个”,除非另有规定或从上下文看出它应该仅仅指单数。
当用单数指称名词(例如化合物、添加剂等)时,意味着也包括复数,除非从上下文看出它应该仅仅指单数。
术语“pH”在本文中用于表观pH,即使用标准的校准过的pH电极测得的pH。
处于本发明的目的,“肽”意味着由两个或更多个氨基酸构成的任何链。因此,肽通常至少在概念上是由两个或更多个氨基羧酸分子(即氨基酸),通过从一个氨基酸的羰基碳到另一个氨基酸的氮原子形成共价键并在形式上失去水而构成的酰胺。术语“肽”通常适用于由α-氨基酸形成的结构,尽管肽可能包含其他氨基酸例如一个或多个β-氨基酸和/或一个或多个γ-氨基酸。
术语“肽片段”或“片段”是指参比于具有确定序列的更长的肽,具有部分氨基酸序列的肽。肽的氨基酸序列被称为一级结构。在一个实施方式中,肽基本上不含二级结构并且基本上不含三级结构。
在一个实施方式中,已在根据本发明的方法中合成或将要在所述方法中偶联的肽基本上由氨基酸残基构成。例如,GLP-1由氨基酸残基构成。在另一个实施方式中,肽基本上由氨基酸单元和保护基团构成。
在另一个实施方式中,已在根据本发明的方法中合成或将要在所述方法中偶联的肽是肽链与另一个残基例如脂肪酸的偶联物。这些肽被称为脂肽。脂肪酸可例如用于改变溶解性。适合的脂肪酸的实例是C8-C24饱和脂肪酸和C8-C24不饱和脂肪酸。如果需要,在所述肽与脂肪酸之间提供极性连接物,以例如提高在水性环境中的溶解性。利拉鲁肽和索马鲁肽是作为肽链与脂肪酸的偶联物的肽。索马鲁肽在所述肽与脂肪酸之间包含极性连接物。
通常,肽(所述术语包括寡肽、蛋白质和嵌合肽)包含多达约35000个氨基酸单元,特别是3-20000、更特别是4-1000或5-500个氨基酸单元。根据本发明所述的连接酶可用于合成His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly之外的其他肽。这些肽优选地包含500个或更少、特别是200个或更少、更特别是100个或更少的氨基酸单元。在特别优选实施方式中,所述合成的肽包含至少10个氨基酸单元,更特别地至少15个氨基酸、至少25个氨基酸或至少40个氨基酸。来自于这些肽的片段可以在广范围内选择;片段的长度可以为至少2、特别是至少5、更特别是至少10,其中上限由所述合成的肽的长度决定。
在本发明的上下文中,“寡肽”意味着由2-200个氨基酸单元构成,特别是由5-100个氨基酸单元构成,更特别是由10-50个氨基酸单元构成的肽。
出于本发明的目的,“肽键”意味着(i)一个α-氨基酸的α-氨基端或一个β-氨基酸的β-氨基端与(ii)另一个α-氨基酸的α-羧基端或另一个β-氨基酸的β-羧基端之间的酰胺键。优选地,肽键在一个α-氨基酸的α-氨基端与另一个α-氨基酸的α-羧基端之间。
在本发明的上下文中,“氨基酸侧链”意味着任何蛋白原性或非蛋白原性的氨基酸侧链。
蛋白原性氨基酸是由遗传密码编码的氨基酸。蛋白原性氨基酸包括:丙氨酸(Ala),缬氨酸(Val),亮氨酸(Leu),异亮氨酸(Ile),丝氨酸(Ser),苏氨酸(Thr),甲硫氨酸(Met),半胱氨酸(Cys),天冬酰胺(Asn),谷氨酰胺(Gln),酪氨酸(Tyr),色氨酸(Trp),甘氨酸(Gly),天冬氨酸(Asp),谷氨酸(Glu),组氨酸(His),赖氨酸(Lys),精氨酸(Arg),脯氨酸(Pro)和苯丙氨酸(Phe)。硒代半胱氨酸(Sec,U)是结构对应于半胱氨酸的氨基酸,前提是它含有硒代替硫原子。蛋白原性氨基酸是所述氨基酸的L-立体异构体(除了不具有立体异构形式的甘氨酸之外)。
在根据本发明所述的方法中特别感兴趣的非蛋白原性氨基酸是2-氨基异丁酸(Aib),其形成索马鲁肽的肽链的一部分。
术语“(硫)酯”在本文中用作短语“酯或硫酯”的简称。
术语“N-末端保护”在本文中用于指示肽的N-末端胺基、通常为N-末端α-胺基被提供有保护基团,通常至少基本上保护所述N-末端胺基以免偶联到另一个肽或同一个肽分子的C-C-末端羧基。
术语“C-末端保护”在本文中用于指示肽的C-末端羧基、通常为C-末端α-羧基被提供有保护基团,通常基本上保护所述羧基以免偶联到另一个肽或同一个肽分子的N-末端胺基。
当在本文中针对蛋白质或多肽、特别是酶例如连接酶使用时,术语“突变的”或“突变”意味着野生型或天然存在的蛋白质或多肽序列中的至少一个氨基酸已通过编码这些氨基酸的核酸的突变而被不同氨基酸替代,插入到所述序列中,附连到所述序列或从所述序列缺失。突变是本领域中公知的方法,并且包括例如利用PCR或通过寡核苷酸介导的突变的定点突变,正如在Sambrook等,《分子克隆实验指南》(Molecular Cloning-A LaboratoryManual)第二版,Vol.1-3(1989)中所描述的。当在本文中针对基因使用时,术语“突变的”或“突变”意味着该基因的核酸序列或其调控序列中的至少一个核苷酸通过突变已被不同核苷酸代替,已插入到所述序列中,以附连到所述序列或已从所述序列缺失,引起具有定性或定量改变的功能的蛋白质序列的转录或引起该基因的敲除。
在本说明书中,表示氨基酸替换的简写使用被替换的氨基酸的单字母编码,后面跟有指示在蛋白质氨基酸序列中做出所述替换的位置的数字。这个数字是野生型氨基酸序列的氨基酸位置。因此对于突变的氨基酸序列来说,它是对应于在野生型酶中具有该数字的位置的氨基酸位置。由于在较低位置处的一个或多个其他突变(添加、插入、缺失等),实际位置不一定相同。专业技术人员能够使用公知的比对技术例如NEEDLE来确定所述相应的位置。所述数字后面跟有代替所述野生型氨基酸的氨基酸的单字母编码。例如,S221C表示在对应于第221位的位置处丝氨酸被替换成半胱氨酸。X被用于指示在所述待替换的氨基酸之外的任何其他蛋白原性氨基酸。例如,S221X表示在对应于第221位的位置处丝氨酸被替换成任何其他蛋白原性氨基酸。
术语“连接酶”在本文中用于指在两个肽的偶联中具有催化活性的酶,其通过将第一个肽的C-末端与另一个肽的N-末端偶联而催化肽键的形成。通常,本发明(在本发明的方法中使用)的连接酶就将由式Pq-Wv-His-X-Glu-(硫)酯表示的肽与由式H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly表示的肽亲核试剂偶联而言具有连接酶活性。因此,在本发明的上下文中,“肽亲核试剂”或“肽亲核试剂片段”指示具有参与酶催化的偶联、即参与所述肽键形成的游离N-末端的肽。优选地,所述连接酶是枯草杆菌蛋白酶BPN’(SEQ ID NO:2)的变体。
正如由Schechter和Berger所定义的,包括连接酶在内的蛋白酶中的活性位点残基由被称为亚位点的毗连的口袋构成。每个亚位点口袋结合到肽底物序列中的相应残基,其在这里被称为序列位置。根据这个定义,将所述底物序列中的氨基酸残基从切割位点向外连续编号为...-P4-P3-P2-P1-P1'-P2'-P3'-P4'-...(切断的键位于P1与P1'位置之间),而活性位点中的亚位点(口袋)被相应地标为...-S4-S3-S2-S1-S1'-S2'-S3'-S4'-...(Schechter和Berger,Biochem Biophys Res Commun.1967 Apr 20;27(2):157-62)。应该指出,不是所有的蛋白酶都具有所有所述亚位点。例如,在本发明的枯草杆菌蛋白酶BPN’变体或其同源物中可能不存在S3’和/或S4’口袋。
出于本发明的目的,“S1、S2、S3和S4口袋”是指蛋白酶(特别是连接酶)的与肽酰基供体的氨基酸相互作用的氨基酸。所述酰基供体肽的C-末端氨基酸(第一个氨基酸;P1)与所述蛋白酶的S1口袋中的氨基酸相互作用。所述酰基供体肽的倒数第二个氨基酸(从C-末端起第二个氨基酸;P2)与所述蛋白酶的S2口袋中的氨基酸相互作用,第三个氨基酸(P3)与S3以及第四个氨基酸(P4)与S4口袋相互作用。蛋白酶的S1-S4结合口袋由几个氨基酸定义,所述氨基酸在蛋白酶的一级结构中可能远离,但在三维空间中接近。出于本发明的目的,S1’和S2’口袋意味着蛋白酶的与肽亲核试剂的N-末端氨基酸相互作用的氨基酸。所述肽亲核试剂的N-末端氨基酸与所述蛋白酶的S1’口袋中的氨基酸相互作用。所述肽亲核试剂的N-末端倒数第二个氨基酸与所述蛋白酶的S2’口袋中的氨基酸相互作用。蛋白酶的S1’和S2’结合口袋由几个氨基酸定义,所述氨基酸在蛋白酶的一级结构中可能远离,但在三维空间中接近。
当参考括号之间的酶类别(EC)提及一种酶时,所述酶类别是在国际生物化学和分子生物学联合会命名委员会(NC-IUBMB)提供的酶命名法的基础上将所述酶分类在其中或可以分类在其中的类别,所述命名法可以在http://www.chem.qmul.ac.uk/iubmb/enzyme/处找到。旨在也包括(目前)未被分类到具体类别中但可以如此分类的其他适合的酶。
肽或酶的同源物通常具有与所述肽或酶相同的目标功能,例如能够催化相同的反应,特别是根据本发明的方法的酶法偶联。
氨基酸或核苷酸序列当表现出一定水平的相似性时,被称为是同源的。两个同源序列是近缘还是更加远缘,由分别为高或低的“百分同一性”或“百分相似性”指示。
术语“同源性”、“百分同源性”、“百分同一性”或“百分相似性”在本文中可互换使用。出于本发明的目的,在这里定义,为了确定两个氨基酸序列的百分同一性,出于最佳比较的目的将完整序列进行比对。为了优化两个序列之间的比对,可以在被比较的两个序列中的任一个中引入空位。这样的比对在待比较的序列的全长上进行。可选地,比对可以在更短的长度上,例如在约20个、约50个或约100个或更多的核酸或氨基酸上进行。同一性百分率是所述两个序列之间在所报道的对齐区域上一致的匹配的百分率。
两个序列之间的序列比较和百分同一性的确定可以使用数学算法来完成。专业技术人员将会认识到下述事实,即几种不同的计算机程序可用于比对两个序列并确定两个序列之间的同源性(Kruskal,J.B.(1983)“序列比较概述”(An overview of sequencecomparison),在D.Sankoff和J.B.Kruskal主编的《时间扭曲、字符串编辑和大分子:序列比较的理论和实践》(Time warps,string edits and macromolecules:the theory andpractice of sequence comparison)pp.1-44Addison Wesley中)。两个氨基酸序列之间的百分同一性可以使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,pp 443-453)。所述Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本发明的目的,使用来自于EMBOSS软件包的NEEDLE程序(2.8.0或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)pp 276—277,http://emboss.bioinformatics.nl/)。对于蛋白质序列来说,将EBLOSUM62用于替换矩阵。可以指定其他矩阵。用于氨基酸序列比对的可选参数是10的空位开放罚分和0.5的空位延伸罚分。专业技术人员将会认识到,所有这些不同的参数将产生略微不同的结果,但在使用不同算法时,两个序列的总体同一性百分率不会显著改变。
两个比对序列之间的同源性或同一性如下计算:用比对中在两个序列中显示出一致的氨基酸的相应位置的数目,除以减去比对中的空位总数之后的比对总长度。本文中所定义的同一性可以使用NOBRIEF选项从NEEDLE获得,并在程序的输出中将其标记为“最长同一性”。出于本发明的目的,两个序列之间的同一性(同源性)水平按照“最长同一性”的定义来计算,这可以通过使用程序NEEDLE来进行。
多肽序列、特别是酶序列,还可以作为“查询序列”用于针对序列数据库进行搜索,以例如鉴定其他家族成员或相关序列。这种搜索可以使用BLAST程序来进行。用于进行BLAST分析的软件可通过美国国家生物技术信息中心(http://www.ncbi.nlm.nih.gov)公开获得。BLASTP用于氨基酸序列。BLAST程序使用下述默认值:
-开放空位的成本:对于蛋白质来说缺省值=11
-延长空位的成本:对于蛋白质来说缺省值=1
-预期值:缺省值=10
-字长:对于megablast来说缺省值=28/对于蛋白质来说缺省值=3
此外,通过BLAST程序来确定查询氨基酸序列与检索到的同源序列之间的局部同一性(同源性)程度。然而,仅比较那些给出高于一定阈值的匹配的序列区段。因此,所述程序仅为这些匹配区段计算同一性。因此,以这种方式计算出一致性被称为局部一致性。
术语“同源物”在本文中特别用于指肽、更特别是酶,其与跟所述同源物肽或酶比较的肽、特别是酶具有至少50%、优选地至少60%、更优选地至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。显然,所述序列同一性低于100%。序列同一性百分率取决于与所述同源物比较的肽(酶)的突变数目和长度。在“最长同一性”比对中,缺失不被考虑在内。
出于本发明的目的,“缩合”是指在肽的C-末端羧基官能团与亲核试剂、特别是另一个肽的N-末端胺官能团之间形成新的酰胺键。
术语肽的“类似物”特别用于作为所述肽的结构同源物和/或功能同源物的肽。功能同源物具有相同的体内靶(例如细胞膜上相同的靶受体);结构同源物在氨基酸序列上具有高度相似性。肽的功能同源物与跟它们是其同源物的肽可能在整个氨基酸序列上具有例如约50%或更低得相对低的氨基酸序列同一性,但在所述氨基酸序列的区段例如靠近N-末端部分或靠近C-末端部分中具有高的序列同一性(以及因此高的结构相似性)。具体来说,结构同源物包含的氨基酸序列与跟它们是其同源物的肽的氨基酸序列具有至少60%、更特别是至少70%、优选地至少80%、更优选地至少90%的序列同一性、更优选地至少95%的序列同一性。出于简明清晰地描述的目的,在本文中作为相同或不同实施方式的一部分对特点进行描述,然后应该认识到,本发明的范围可以包括具有所有或某些被描述的特点的组合的实施方式。本文中使用的在本文中未具体定义的术语如WO 2016/056913中所定义,或者如果在其中未定义,则按照常识使用。
用于酶法偶联的肽C-末端酯或硫酯包含第一肽片段,所述片段包含氨基酸序列-His-X-Glu-,即肽例如GLP-1、索马鲁肽和利拉鲁肽的第1位、第2位和第3位氨基酸残基。Glu的α-羧酸被(硫)酯化,并且His的α-氨基通过氨基酸残基W的α-羧酸官能团经肽键结合到氨基酸残基W。另外的氨基酸残基Wv的存在将3-mer His-X-Glu有效延长到四聚体(如果v=1)或更大的肽(如果v>1)。已发现这种延长对于所述肽C-末端酯或硫酯与肽亲核试剂的有效酶法偶联来说是重要的。因此,用于酶法偶联的肽C-末端酯或硫酯由式Pq-Wv-His-X-Glu-(硫)酯表示。在这里,X是Ala或α-氨基异丁酸残基(Aib)。在这里,v是表示氨基酸残基W的数目的整数,具有至少1、通常为1-10、优选为1-4、更优选为1、2或3、最优选为1的值。在其中Pq-W-His-X-Glu-(硫)酯是所述第一肽片段的氨基酸序列并且q是0或1的酶法偶联中,获得了特别好的结果。因此,单个氨基酸残基W的存在通常对有效的酶法偶联来说是足够的。如果需要,可以存在一个或更多个另外的氨基酸残基W,以例如改变在反应介质中的溶解性。然而,这一般来说是不需要的,特别是在水性反应介质中不需要。
每个W可以相同或不同。通常每个W表示蛋白原性氨基酸残基。为了获得特别好的酶法偶联,特别是在使用枯草杆菌蛋白酶变体或同源物时,至少与His-X-Glu-的His形成肽键的W选自Phe、Leu、Ile、Val、Ala、Tyr、Met、Pro和Trp。在特别优选实施方式中,至少与His-X-Glu-的His相邻的W是选自Phe、Leu、Ile和Val的相对大的疏水氨基酸残基。最优选地,至少所述与所述His相邻的W是Phe。
原则上,为了在酶法偶联期间进行N-末端胺保护,可以使用任何保护基团,例如在WO 2016/056913中所描述的,例如Cbz、Boc、For、Fmoc或Ac。然而,为了获得具有序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽,在所述酶法偶联后需要除去氨基酸残基W。为此目的,根据本发明,通常使用Edman型保护基团(P)(也参见下文)。本发明人发现,这种基团也特别适合作为保护基团用于酶法偶联反应期间肽C-末端(硫)酯的N-末端α-胺官能团,或用于根据本发明通过所述偶联反应形成的肽的侧链(例如氨基酸残基Y的侧链)处的(进一步)官能化。在酶法偶联期间可以存在保护基团P(q=1)。然而,在其中P不存在(q=0)的酶法偶联中,也获得了良好结果。因此,在酶法偶联后(如果有的话,在Y的进一步官能化之前或之后)引入Edman型基团P,并将其用于移除氨基酸残基W。
在使用Edman型部分时适合的保护条件和用于从所述肽切割P-W的适合条件包括本领域中公知的在Edman型降解方法中使用这类部分的条件。P向所述肽的N-末端α-氨基官能团的标记,以本身已知的方式,在已知用于所述P的Edman型方法的基础上,通常在弱碱性条件例如约pH 8下实现。P-W从所述肽的N-末端α-氨基官能团的切割,以本身已知的方式,在已知用于所述P的Edman型方法的基础上,通常在酸性条件下,通常在约4或更低、特别是约3或更低例如0-2范围内的pH下实现。例如,可以使用三氟乙酸(TFA)。
因此,可以通过连接氨基酸残基标记到肽的N-末端α-氨基官能团并与所述连接氨基酸残基一起切除的适合的保护性部分,在本文中也被称为“Edman型保护基团”。
已发现取代的硫代氨甲酰基(P)作为Edman型保护基团特别有效,并且通常也有助于在水性反应介质中的良好溶解性。所述取代的硫代氨甲酰基可以是芳香族的或脂族的。优选地,所述取代的硫代氨甲酰基是芳基取代的硫代氨甲酰基或烷基取代的硫代氨甲酰基。特别优选的芳基取代的硫代氨甲酰基是C6-C12-芳基取代的硫代氨甲酰基,更特别是苯基硫代氨甲酰基(PTC)。特别优选的烷基取代的硫代氨甲酰基是C1-C6-烷基取代的硫代氨甲酰基,更特别是甲基硫代氨甲酰基(MTC)。用于引入取代的硫代氨甲酰基的优选异硫氰酸酯的其他实例是在H.Matsunaga,T.Santa,K.Hagiwara,H.Homma,K.Imai,S.Uzu,K.Nakashima,S.Akiyama,Anal.Chem.1995,67,4276中提到的那些,例如FITC、BAMPITC、DNTC、DNSAPITC、丹磺酰基氨基-PITC、3-POPIC、4-POPIC、CIPIC和7-[(N,N-二甲基氨基)磺酰基]-2,1,3-苯并噁二唑-4-基异硫氰酸酯(DBD-NCS),参见第4276页的左栏和右栏的桥接段落,通过引用并入本文。另一个优选实例是7-氨基磺酰基-4-(2,1,3-苯并噁二唑基)-异硫氰酸酯(ABD-NCS)。
取代的硫代氨甲酰基可以通过将N-末端α-氨基官能团与相应的异硫氰酸酯在(微)碱性条件下反应,提供到所述胺官能团。因此,苯基硫代氨甲酰基(PTC)可以使用苯基异硫氰酸酯(PITC)引入,并且甲基硫代氨甲酰基(MTC)可以使用甲基异硫氰酸酯(MITC)引入。在酸性条件下,这些取代的硫代氨甲酰基与它们附连的α-氨基酸一起以噻唑啉酮衍生物的形式从所述肽切下。
作为取代的硫代氨甲酰基部分的替代物,适合于使用Edman型降解方法对肽中的氨基酸进行测序的另一个部分可以以类似的方式用作保护基团,即通过连接氨基酸用所述部分标记所述肽C-末端(硫)酯的N-末端α-胺官能团,并在与所述肽亲核试剂酶法偶联后,将所述部分与所述连接氨基酸残基一起从偶联产物的其余部分上切下。
已发现,这种使用Edman型保护基团提供N-末端保护的新方式与例如Fmoc相比,在水性反应体系中的溶解性方面具有优势。已发现在使用固相合成时,与例如Boc相比在相容性方面具有优势。Edman型保护基团例如取代的硫代氨甲酰基部分在中性或碱性pH下特别好地起到保护基团的作用,并且可以在酸性pH下容易地移除。因此,这种基团通常使用在中性或碱性pH下的偶联反应中,所述偶联反应使用在这种pH下具有良好的S/H比率的连接酶例如枯草杆菌蛋白酶BPN’变体或同源物,正如在本文中别处更详细描述的。
此外,可以通过超过一个氨基酸(即通过肽链Wv,其中v>1)将Edman型保护基团连接到所述肽C-末端(硫)酯。然后,可以以在肽测序方法中使用的相似的方式,通过用部分P标记并切掉所述部分加氨基酸的多个循环来移除所述连接氨基酸。另外的连接氨基酸的使用不是必需的,但如果需要的话它们可用于例如改变所述肽C-末端(硫)酯在所选反应介质中的溶解性。
作为一般性说明:除了可用于移除氨基酸部分W的Edman型保护基团P之外,使用Edman型保护基团对所述肽(硫)酯进行N-末端保护,在其中Y包含带有需要被偶联到脂肪酸例如棕榈酸的游离α-氨基官能团的Lys(γ-Glu-OH)部分,或者如果Y包含带有需要被偶联到脂肪酸例如17-羧基-十七烷酸的游离α-氨基官能团的Lys(AEEA-AEEA-γ-Glu-OH)部分等的方法中特别有用。
此外,观察到使用不具有受保护的侧链官能团的肽C-末端(硫)酯时获得了特别好的结果。然而,在一个实施方式中,所述肽C-末端(硫)酯的侧链官能团、特别是3Glu的侧链,被提供有保护基团。适合的保护基团对于本领域技术人员来说是已知的。例如羧酸基团可以用环己基、苯甲基或烯丙基保护。
所述肽C-末端(硫)酯通常是活化的(硫)酯,即它含有可以参与酶法偶联反应的羧基酯或羧基硫酯。原则上,可以使用任何(取代或未取代的)烷基或(取代或未取代的)芳基(硫)酯。可以参与酶法偶联反应的(硫)酯的典型实例是甲基-、乙基-、丙基-、异丙基-、苯基-、苯甲基-(例如对羧基-苯甲基-)、2,2,2-三氯乙基-、2,2,2-三氟乙基-、氰基甲基-和羧酰胺基甲基-(硫)酯。
使用由式肽-(C=O)-O-CX1X2-C(=O)N-R1R2表示的羧酰胺基甲基-类型的酯(Cam-酯)获得了特别好的结果。在这里,每个X1和X2独立地表示氢原子或烷基。当X1和X2两者都是氢原子(肽-(C=O)-O-CH2-C(=O)N-R1R2)时,获得了良好结果。在这里R1表示氢原子或烷基,并且R2表示氢原子或烷基或具有C-末端羧基酰胺或羧酸官能团的氨基酸或肽残基,任选地在所述氨基酸的侧链官能团上或在所述氨基酸的侧链官能团中的一个或多个上被保护。在这里,每个烷基可以独立地表示(取代或未取代的)C1-C7烷基,优选为(取代或未取代的)直链C1-C6烷基,更优选为(取代或未取代的)直链C1-C3烷基,最优选为甲基。具体来说,在本发明的一种方法中获得了良好结果,在所述方法中R1和R2两者都表示氢原子,或者其中R1表示氢原子,并且R2表示具有C-末端羧基酰胺或羧酸官能团的氨基酸或肽残基,任选地在所述氨基酸的侧链官能团上或在所述氨基酸的侧链官能团中的一个或多个上被保护。
使用Cam-AA1-AA2-酯时特别有利的,其中AA1是第一氨基酸残基并且AA2是第二氨基酸残基。在这里,AA1是疏水性氨基酸残基例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、甲硫氨酸或色氨酸单元。AA2是碱性氨基酸残基例如精氨酸或赖氨酸单元。特别优选的是Cam-Phe-Arg和Cam-Phe-Lys。所述AA1和AA2通常具有游离的侧链官能团,即其不含保护基团或另一个残基。
使用羧基取代的苯甲基酯、特别是使用由式肽-(C=O)-O-CH2-C6H4-CO2E表示的对-羧基取代的苯甲基酯,也已获得了特别好的结果,其中E表示氢原子、带正电荷的盐离子例如铵离子或具有C-末端羧基酰胺或羧酸官能团的氨基酸或肽残基,任选地在所述氨基酸的侧链官能团上或在所述氨基酸的侧链官能团中的一个或多个上被保护。使用由式肽-(C=O)-O-CH2-C6H4-CO2E表示的对羧基取代的苯甲基酯也获得了良好结果,其中E如上所定义,并且其中苯环(上式中的C6H4)中的一个或多个氢原子被取代基例如羟基、烷氧基、芳氧基或卤素代替。
所述肽C-末端(硫)酯的活化的C-末端(硫)酯基团可以使用固相合成以高的产率和纯度合成,并且没有消旋。使用其中R1表示氢原子并且R2表示具有C-末端羧酸官能团的氨基酸或肽残基,任选地在所述氨基酸的侧链官能团上或在所述氨基酸的侧链官能团中的一个或多个上被保护的羧酰胺基甲基类型的(硫)酯的另一个优点在于,它们的活化的C-末端酯或硫酯基团可以使用廉价且工业上可获得的2-氯三苯甲基氯树脂来合成。
所述肽C-末端(硫)酯的活化的C-末端(硫)酯基团也可以通过溶液相合成或通过发酵,即使用微生物来合成。正如本领域中公知的,发酵过程包括在好氧或厌氧条件下生产化合物即肽。使用发酵获得肽(硫)酯的可靠方法是通过所谓的内含肽表达(参见例如E.K.Lee,Journal of Chemical Technology and Biotechnology,2010,9,11-18)。不同的内含肽表达系统试剂盒是可商购的(例如IMPACTTM试剂盒)。用于肽(硫)酯的发酵生产的其他方法在本领域中是已知的。
所述具有N-末端未保护的胺的肽亲核试剂包含氨基酸序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-AlaAla-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly(“第二肽片段”)。使用其中将所述序列作为肽亲核试剂的氨基酸序列的肽亲核试剂获得了特别好的结果。本发明的特别重要的优点是在水性系统中,所述酶法偶联也良好工作,而不需用肽标签或另一种衍生物延长所述C-末端以增强所述肽亲核试剂的溶解性和反应性。
在一个实施方式中,所述肽亲核试剂被C-末端保护。在另一个实施方式中,它不含C-末端保护。
具体来说,使用不具有受保护的侧链官能团的肽亲核试剂获得了良好结果。
在一个实施方式中,所述肽亲核试剂的一个或多个侧链官能团(特别是一个或多个羟基、羧基或胺基)被提供有保护基团。适合的保护基团对于本领域技术人员来说是已知的。羧酸基团可以例如用环己基、苯甲基或烯丙基保护;胺官能团可以例如用烯丙基氧基羰基或三氟乙酰基保护。
所述肽亲核试剂可以使用本领域中已知的方法例如固相合成、溶液相合成或通过发酵来合成。
正如上文提到的,Y是Lys,其Lys侧链ε-氨基可以用保护基团保护。然而,保护侧链ε-氨基对于获得令人满意的偶联产率和速率来说通常不是必需的,特别是如果使用枯草杆菌蛋白酶或其同源物作为连接酶的话不是必需的。具体来说,本文中所描述的枯草杆菌蛋白酶BPN’变体或同源物也适合于在位置Y处的Lys的ε-氨基不含保护基团的情况下偶联两个片段。
因此,所述肽亲核试剂的Y通常是具有游离侧链ε-氨基或具有官能化的侧链ε-氨基的赖氨酸残基。
所述肽C-末端(硫)酯与肽亲核试剂的酶法偶联产生具有至少一个另外的氨基酸残基W和任选的基团P的肽,即它产生包含Pq-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的偶联产物。
因此,所述偶联产物可以由式(i)表示:
P-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly。
为了获得具有式His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽,通常使用适合于所述基团P的Edman型切割条件,将P-W从具有所述式(i)的肽切下。这种切割产生由式Wv-1-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly表示的肽。
如果v大于1,其他W通过下述方法来移除:首先将基团P偶联到该肽的N-末端α-胺官能团,由此获得P-Wv-1-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly。通过从所述肽切除P-W,获得由式Wv-2-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly表示的另一个肽。然后可以重复所述P的偶联和随后P-W的切除,直至获得感兴趣的肽,通常为具有序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽。
可选地,所述肽C-末端(硫)酯与肽亲核试剂的酶法偶联产生具有至少一个另外的氨基酸残基W而没有P基团的肽(对于肽C-末端酯或硫酯来说当q=0时)。这种偶联产物可以由式(ii)表示:
Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly。
在Y具有带有游离α-胺官能团的γ-Glu的情况下,这种方法不太适合,因为这个胺官能团可能参与所述酶法偶联反应。然而,在其他情况下这种方法工作良好,例如当Y是具有游离ε-胺官能团的Lys时(在这种情况下pH通常被选择成使得ε-胺官能团被质子化)或当Y用脂肪酸完全官能化以便获得索马鲁肽或利拉鲁肽时。然后可以以与为式(i)表示的偶联产物所描述的类似的方式除去任何氨基酸残基W,即通过用Edman型保护基团P标记N-末端W以产生由式P-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly表示的产物,并切掉P-W以获得由式Wv-1-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly表示的肽。然后可以重复所述P的偶联和随后P-W的切除,直至获得感兴趣的肽,通常为具有序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽。
通过所述酶法偶联获得的偶联产物可以是所述感兴趣的肽(在除去保护基团后),例如如果GLP-1是所述待合成的感兴趣的肽或者如果所述肽亲核试剂的Y已经包含获得利拉鲁肽或索马鲁肽所需的官能化的话。可选地,所述通过酶法偶联获得的产物可以随后经历其他反应以将其官能化,特别是用氨基酸或另一个官能团,更特别是选自Pal-γ-Glu-OH和AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH的官能团,其中Pal是棕榈酰基并且AEEA-AEEA是2-[2-(2-氨基乙氧基)乙氧基]乙酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基。将Y的游离ε-氨基侧链官能化以得到利拉鲁肽或索马鲁肽或提供适合于合成利拉鲁肽或索马鲁肽的肽亲核试剂的方式,可以基于本领域中公知的方法,或者可以基于本文中引用的文献中描述的技术。具体来说,可以使用基于US 6,451,974 B1的官能化方案。
在优选实施方式中,本发明涉及一种合成索马鲁肽或偶联产物的方法,所述偶联产物在除去Pq-Wv并且如果仍然需要的话将Y官能化后产生索马鲁肽。执行所述方法以提供索马鲁肽或用于制备索马鲁肽的偶联产物,存在几种特别优选的可能性。
实现这一点的第一个特别优选的实施方式包括由连接酶催化的以下(a)和(b)的酶法偶联:
(a)包含序列Pq-Wv-His-Aib-Glu-(硫)酯的肽C-末端酯或硫酯,和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)。
这种方法不需Y的酶后官能化即可产生索马鲁肽。所述酶法偶联可以在存在P(q=1)或不存在P(q=0)的情况下进行以得到高产率的所需肽。如果在酶法偶联期间P不存在,可以将所述偶联产物用Edman型保护基团P标记,随后可以将P-W从所述偶联肽切除。因此在实践中,在所述酶法偶联期间通常存在Edman型保护基团P以便生产索马鲁肽,因为这个基团为除去氨基酸残基Wv所需。
提供索马鲁肽或用于制备索马鲁肽的偶联产物的第二个特别优选的方法包括由连接酶催化的以下(a)和(b)的酶法偶联:
(a)包含序列P-Wv-His-Aib-Glu-(硫)酯的肽C-末端酯或硫酯,和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是Lys(AEEA-AEEA-γ-Glu-OH)。
由此形成了包含式P-Wv-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(AEEA-AEEA-γ-Glu–OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽偶联产物。
接下来,为Lys(AEEA-AEEA-γ-Glu-OH)提供17-羧基十七烷酰基,以获得P-Wv-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly。这可以使用本身已知的用于制备索马鲁肽的反应条件来进行。然后在所述脂肪酸偶联后,使用如本文中别处所描述的Edman型方法除去P-Wv,以获得索马鲁肽。
提供索马鲁肽或用于制备索马鲁肽的偶联产物的第三个特别优选的方法包括由连接酶催化的以下(a)和(b)的酶法偶联:
(a)包含序列Pq-Wv-His-Aib-Glu-(硫)酯的肽C-末端酯或硫酯,和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是具有游离或受保护的ε-氨基侧链的赖氨酸残基,随后为所述Lys的ε-氨基侧链提供AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH基团。
在不存在P基团的情况下,所述酶法偶联和为所述Lysε-胺官能团提供AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH基团也以高产率实现。所述P基团在酶法偶联和/或官能化期间可能已经存在,但通常仅为除去氨基酸残基W所需。人们可以在酶法偶联之后但在所述Lysε-胺官能团的官能化之前除去氨基酸残基W。然而,首先提供Glu-脂肪酸阻断,然后使用Edman型保护基团(P)切割掉W是可行的。
此外,根据本发明,在利拉鲁肽和相应的可以在除去Pq-Wv后从其制备利拉鲁肽的偶联产物的合成中获得了良好结果。
在第一个有利实施方式中,利拉鲁肽(或可以从其制备利拉鲁肽的偶联产物)的制备包括由连接酶催化的以下(a)和(b)的酶法偶联:
(a)包含序列Pq-Wv-His-Ala-Glu-(硫)酯的肽C-末端酯或硫酯,和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是Lys(Pal-γ-Glu-OH)。
在这里,在所述酶法偶联期间,当q=0时也获得了良好结果。基团P可以在酶法偶联进行期间存在。如果在所述酶法偶联期间q=0,则在酶法偶联后将Edman型基团P提供到N-末端α-氨基官能团以除去任何氨基酸残基W,以便获得利拉鲁肽。出于实践原因,这类基团P通常在所述酶法偶联进行期间存在。
在第二个有利实施方式中,利拉鲁肽(或可以从其制备利拉鲁肽的偶联产物)的制备包括由连接酶催化的以下(a)和(b)的酶法偶联:
(a)包含序列P-Wv-His-Ala-Glu(硫)酯的肽C-末端酯或硫酯,和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂;
由此获得由式P-Wv-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly表示的肽,然后为所述肽的所述Lys(γ-Glu-OH)提供棕榈酰基基团(Pal),以获得P-Wv-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(Pal-γ-Glu)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly。然后使用如本文中别处所描述的Edman型方法除去P-Wv,以获得利拉鲁肽。
在第三个有利实施方式中,利拉鲁肽(或可以从其制备利拉鲁肽的偶联产物)的制备包括由连接酶催化的以下(a)和(b)的酶法偶联:
(a)包含序列Pq-Wv-His-Ala-Glu-(硫)酯的肽C-末端酯或硫酯,和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是具有游离或受保护的ε-氨基侧链的赖氨酸残基;随后为所述ε-氨基侧链提供Pal-γ-Glu-OH。Pq-Wv可以在上文中描述的方法的基础上移除。
此外,根据本发明所述的方法特别适合于制备GLP-1。这种方法通常包括Pq-Wv-His-Ala-Glu-(硫)酯与Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Gly的酶法偶联。Pq-Wv可以在上文中描述的方法的基础上移除。
用于催化所述肽C-末端(硫)酯与肽亲核试剂的偶联的连接酶,可以是在通过催化所述肽C-末端(硫)酯的C-末端与所述肽亲核试剂的N-末端之间的肽键形成而在偶联两种肽中具有催化活性的任何连接酶,其中在所使用的反应介质中所述偶联产物的偶联相比于水解的S/H比率大于1。通常,所述连接酶可以被分类为丝氨酸蛋白酶,其通常可以被分类在EC 3.4.21中。通常,它具有顺序为Asp、His和Ser的催化三元组。
具体来说,在根据本发明的方法中使用的连接酶是分离的酶。因此,它从其已在其中表达的生物体、通常为重组生物体分离,如果它已在生物体中生产的话,或相应地从它已在其中合成的反应介质中分离。
具体来说,出于本发明的目的,本发明的酶在采取粗品形式或通过任何适合的技术例如Smith和Johnson,Gene 67:31-40(1988)中公开的一步纯化法基本上纯化的情况下,被认为是分离的。
具体来说,所述连接酶可以是丝氨酸内切蛋白酶。所述连接酶在所使用的反应介质中,特别是在包含水的反应介质、更特别是水性介质中,通常具有大于1、优选为2或更大、特别是5或更大的S/H比率。该商的上限值并不重要;实际上,它可以是例如100或更小,特别是20或更小。至少与枯草杆菌蛋白酶BPN’相比,所述在根据本发明的方法中使用的连接酶通常具有提高的“合成与水解比率”(S/H比率)。
至少在实施例中所描述的条件下,根据本发明的(在本发明的方法中使用的)连接酶的S/H比率除以枯草杆菌蛋白酶BPN’的S/H比率通常大于100,优选为250或更大,更优选为500或更大,特别是1000或更大。该商的上限值并不重要;它可能接近无限。
具体来说,使用枯草杆菌蛋白酶BPN’变体或其同源物获得了非常好的结果。
特别是在包含水作为主要溶剂(例如以总液体计50-100wt.%)的反应介质中进行酶法偶联时,发现根据WO 2016/056913的枯草杆菌蛋白酶BPN’变体或其同源物特别适合。所述出版物的内容通过引用并入本文,特别是正如在其权利要求书中所描述的关于枯草杆菌蛋白酶BPN’变体或同源物的详情。
因此,通常,用于所述偶联反应的连接酶是枯草杆菌蛋白酶BPN’变体或其同源物,其与由SEQ ID NO:2表示的枯草杆菌蛋白酶BPN’或其同源物序列相比包含下述突变:
-对应于第75-83位的氨基酸的缺失;
-对应于S221的氨基酸位置处的突变,所述突变是S221C或S221硒代半胱氨酸;
-优选地,在对应于P225的氨基酸位置处的突变;
其中所述氨基酸位置按照由SEQ ID NO:2表示的枯草杆菌蛋白酶BPN’的序列来定义。
在根据本发明的方法中使用的其他优选连接酶可以包含一个或多个另外的突变,特别是在本文中别处或在通过引用并入本文的WO 2016/056913中所鉴定的一个或多个其他突变。
在对应于所述连接酶、特别是枯草杆菌蛋白酶BPN’变体或其同源物的S221的氨基酸位置处的突变优选为S221C。
在对应于P225的氨基酸位置处的突变通常对于酶法偶联的S/H比率来说是有利的。所述突变通常选自P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H、P225Q,优选地选自P225N、P225D、P225S、P225C和P225G,更优选为P225N或P225D,最优选为P225N。
为了获得良好的酶稳定性,所述连接酶、特别是枯草杆菌蛋白酶BPN’变体或其同源物优选地包含一个或多个突变,所述突变选自在对应于SEQ ID NO:2的Q2、S3、P5、S9、I31、K43、M50、A73、S188、Q206、N212、N218、T254和Q271的氨基酸位置处的突变。
在对应于Q2的位置处的优选突变对应于Q2K。
在对应于S3的位置处的优选突变对应于S3C。
在对应于P5的位置处的优选突变对应于P5S。
在对应于S9的位置处的优选突变对应于S9A。
在对应于I31的位置处的优选突变对应于I31L。
在对应于K43的位置处的优选突变对应于K43N。
在对应于M50的位置处的优选突变对应于M50F。
在对应于A73的位置处的优选突变对应于A73L。
在对应于S188的位置处的优选突变对应于S188P。
在对应于Q206的位置处的优选突变对应于Q206C。
在对应于N212的位置处的优选突变对应于N212G。
在对应于T254的位置处的优选突变对应于T254A。
在对应于Q271的位置处的优选突变对应于Q271E。
在特别优选实施方式中,所述连接酶、特别是枯草杆菌蛋白酶BPN’变体或其同源物包含所述选自对应于Q2、S3、P5、S9、I31、K43、M50、A73、S188、Q206、N212、T254和Q271的位置处的突变中的至少6个、优选地至少8个、更优选地至少10个、特别是12个、13个或14个突变。这对于包含水作为主要或唯一溶剂的反应介质中的酶稳定性来说是特别优选的。与枯草杆菌蛋白酶BPN’相比,所述连接酶可以具有其他突变,只要它在根据本发明的肽的制备中具有酶促片段缩合活性(偶联活性)即可,特别是在本文中引用的参考文献中所描述的一个或多个其他突变。
代替枯草杆菌蛋白酶BPN’,作为根据本发明的酶、特别是本发明的枯草杆菌蛋白酶BPN’变体的同源物可以通过突变从其衍生的模板酶,可以是其他枯草杆菌蛋白酶,特别是与枯草杆菌蛋白酶BPN’具有至少50%同源性的枯草杆菌蛋白酶。
适合的枯草杆菌蛋白酶的序列可以从2014年8月11日可用的UNIPROT序列数据库(http://www.uniprot.org/),通过用枯草杆菌蛋白酶BPN’(SEQ ID NO:2)作为查询序列对所述数据库进行BLAST来检索。然而,序列检索不限于UNIPROT也不限于所述日期。本领域技术人员知道如何查询可选的序列存储库或通过测序收集另外的同源物序列(参见例如Zooming in on metagenomics:molecular microdiversity of Subtilisin Carlsbergin soil.Gabor E,Niehaus F,Aehle W,Eck J.J Mol Biol.2012Apr 20;418(1-2):16-20)。具体来说,本发明还涉及变体,其至少具有对应于枯草杆菌蛋白酶BPN’的L75直至并包括G83的氨基酸的所述缺失,对应于枯草杆菌蛋白酶BPN’中第21位的位置处的半胱氨酸或硒代半胱氨酸,以及提出的权利要求1中所述其他突变中的至少一个。
枯草杆菌蛋白酶BPN’的序列在SEQ ID NO:2(成熟形式)中给出。编码枯草杆菌蛋白酶BPN’的第-107至275位氨基酸的基因提供在SEQ ID NO:1中。枯草杆菌蛋白酶BPN’变体或同源物可以基于根据WO 2016/056913所述的酶,前提是它具有上面提到的突变。
在有利实施方式中,所述连接酶是一种枯草杆菌蛋白酶BPN’变体,其具有对应于野生型枯草杆菌蛋白酶BPN’(成熟的)的第75-83位的氨基酸的缺失、突变S221C和在对应于M222、Y217、P225、F189、N218、E156、G166和N62的氨基酸位置处的一个或多个其他突变,优选为至少3个其他突变,特别是5-8个其他突变。在这些突变中,具有对应于M222P、Y217H、P225N、F189W、N218D、E156N、G166E、N62A的突变获得了特别好的结果。SEQ ID NO:3示出了根据本发明的具有Ca2+结合环的缺失、S221C并具有所述其他突变的枯草杆菌蛋白酶BPN’变体(使用的)。包含His标签是为了便于纯化,对于连接酶活性来说并不需要。其他优选的酶可以包含一个或多个另外的突变,特别是在本文中别处或在通过引用并入本文的WO 2016/056913中所鉴定的一个或多个其他突变。
在特别有利的实施方式中,所述连接酶是具有SEQ ID NO:3、包含突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、Δ75-83、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、S221C、M222P、P225N、T254A、Q271E的枯草杆菌蛋白酶BPN’变体或其具有至少80%或85%或90%、优选地95%序列同一性的同源物,并任选地包含His标签。
在本发明的方法中,所述酶反应通常在包含水的流体中进行。优选地,所述反应在缓冲的流体中进行。以总液体计,水含量通常为10-100vol%,优选为20vol.%或更高,优选为40vol.%或更高,特别是50vol.%或更高,更特别是60vol.%或更高。在包含70-100vol%水、更特别是90-100vol.%、95-100vol.%或98-100vol.%水的反应介质中获得了特别好的结果。术语“水性”被用于至少基本上由水构成的介质。
原则上任何缓冲剂都是适合的。良好的缓冲剂对于本领域技术人员来说是已知的。参见例如David Sheehan,《物理生物化学》(Physical Biochemistry)第二版,Wiley-VCH Verlag GmbH,Weinheim 2009;http://www.sigmaaldrich.com/life-science/core-bioreagents/biological-buffers/learning-center/buffer-calculator.html。使用例如Good's缓冲剂如三甲基甘氨酸获得了特别好的结果。所述缓冲剂的浓度可以在宽广的限度内选择,例如在10-1000mM的范围内,特别是在25-500mM的范围内,更特别是在50-250mM的范围内。已发现相对低摩尔浓度的缓冲剂对于偶联其中Y是Lys(Pal-γ-Glu-OH)的肽亲核试剂等来说是有利的。
在根据本发明的方法中,用于偶联反应的缓冲剂的pH可以是至少5,特别是至少6,优选为至少7。所需的pH通常低于11,特别是低于10,甚至更优选低于9。通常,用于所述酶法偶联的最适pH在7至9之间。
由于高的S/H比率,通常不需要大大过量的肽C-末端酯或硫酯或肽亲核试剂即可在缩合反应中达到高产率。通常,它们以大约化学定量比率或以肽C-末端酯过量进行接触,特别是以1:1至5:1范围内的(a)肽C-末端酯或硫酯与(b)肽亲核试剂的摩尔比例。尽管使用化学定量比率获得了令人满意的结果,但已发现过量的肽C-末端(硫)酯对反应速率有利。因此,优选地(a)肽C-末端酯或硫酯与(b)肽亲核试剂的摩尔比例在1.05:1.0至4:1的范围内,更优选在1.1:1.0至3:1的范围内,甚至更优选在1.2:1.0至2.5:1.0的范围内,特别是在1.2:1.0至2.0:1.0的范围内。
在本发明的方法中,向在其中进行反应的流体添加添加剂,对提高所述肽片段的溶解性或提高反应产率来说可能是有利的。这些添加剂可以是盐或有机分子,例如盐酸胍、脲、十二烷基硫酸钠或吐温。然而,在全水性反应介质中,没有这些添加剂时也获得了良好的结果,例如在其中Y是Lys(Pal-γ-Glu-OH)等的实施方式中。
所述反应可以在全水性液体中或在水和与水混溶的共溶剂的混合物中进行,所述共溶剂例如N,N-二甲基甲酰胺(DMF)、N-甲基-吡咯烷酮(NMP)、N,N-二甲基乙酰胺(DMA)、二甲基亚砜(DMSO)、乙腈、醚例如四氢呋喃(THF)、2-甲基-四氢呋喃(Me-THF)或1,2-二甲氧基乙烷或(卤代)醇例如甲醇、乙醇、异丙醇、叔丁醇、2,2,2-三氟乙醇(TFE)、1,1,1,3,3,3-六氟异丙醇或这些有机溶剂的混合物。取决于所述枯草杆菌蛋白酶BPN’变体的稳定性和肽底物的溶解性,共溶剂的量优选低于70vol%,更优选低于60vol%,甚至更优选低于50vol%,最优选低于40%。
原则上,酶促片段缩合期间的温度并不关键,只要所选择的温度使所使用的连接酶在其下显示出足够的活性和稳定性即可。这种温度可以按常规确定。通常,所述温度可以为至少-10℃,特别是至少0℃或至少10℃。通常,所述温度可以是70℃或更低,特别是60℃或更低或50℃或更低。对于特定连接酶和特定酶促片段缩合来说最适的温度条件,可以由本领域技术人员在常识和本文中公开的信息的基础上通过常规实验容易地鉴定。通常,有利情况下所述温度在20-50℃的范围内。
本发明还涉及Edman型试剂在包含通过片段缩合进行肽的酶法偶联的方法中的用途,其用于在肽的合成中提供保护基团。因此,本发明还涉及一种合成肽的方法,所述方法包括将(a)由式P-Wv-AAn-(硫)酯表示的肽C-末端酯或硫酯与(b)由式AAm表示的肽亲核试剂进行酶法偶联,所述偶联由连接酶、优选为例如本文中别处所描述的枯草杆菌蛋白酶BPN’变体或同源物催化。
在这里,P表示如上所定义的Edman型保护基团,优选为硫代氨甲酰基基团。P与所述肽的N-末端的偶联以本身已知的方式,在已知用于所述P的Edman型方法的基础上,通常在弱碱性条件例如约pH 8下完成。在这里,v是至少1,通常优选为1-10,优选为1-5,更优选为1、2或3,最优选为1的整数,并且v表示氨基酸残基W的数目,其中每个W可以相同或不同,并且优选如上文所定义。每个AA代表氨基酸残基,n是表示所述肽C-末端酯或硫酯的氨基酸残基数目的整数,并且m是表示所述肽亲核试剂的氨基酸残基数目的整数。通常,为了允许被所述连接酶识别,n与v之和为至少4。优选地,n在3-200的范围内,特别是在3-50的范围内,更特别是在3-25的范围内。在特定实施方式中,n为至少4、至少6、至少8、至少10、至少15或至少20。优选地,m在3-200的范围内,特别是在5-50的范围内,更特别是在8-30的范围内。在特定实施方式中,m为至少4、至少10、至少15或至少20。
对所述偶联产物P-Wv-AAn-AAm进行切割反应,在其中形成肽Wv-1-AAn-AAm。通常,在酸性条件下完成切割。如果v-1>0,随后将基团P偶联到在肽Wv-1-AAn-AAm的N-末端位置处的W以形成P-Wv-1-AAn-AAm,然后将P-W切除。然后重复这个循环直至获得由式AAn-AAm表示的肽。
现在将通过下述实施例说明本发明,但本发明不限于此。
实施例
连接酶的生产
突变、克隆和表达
SEQ ID NO:1示出了编码枯草杆菌蛋白酶BPN’的第-107位至第275位氨基酸的野生型基因。在这里呈现了编码第-107位至第-1位的氨基酸的密码子。这些氨基酸包含在完全成熟后被切除的信号序列、前序列和原序列。SEQ ID NO:2示出了成熟的野生型枯草杆菌蛋白酶BPN’(即不含第-107位至第-1位的氨基酸)。用于所述实施例的连接酶示出于SEQ IDNO:3中。与成熟的野生型枯草杆菌蛋白酶BPN’相比,该连接酶具有突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、Δ75-83、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、S221C、M222P、P225N、T254A和Q271E。此外,为了便于快速和高效的纯化,如在SEQ ID NO:3中所示在第275位氨基酸之后附连C-末端His-标签。相应的氨基酸序列按照枯草杆菌蛋白酶BPN’编号方案来编号。因此,为了维持所使用的连接酶的枯草杆菌蛋白酶BPN’编号,所述编号从74跳到83。
为用于下述合成实施例的连接酶编码的基因从GenScript获得。使用基于MluI和BamHI位点的载体将所述基因克隆(由GenScript)在pUB-110大肠杆菌-枯草芽孢杆菌穿梭载体(pBES)中。在所述穿梭载体中,所述基因的表达在aprE启动子的控制之下。所述载体含有用于芽孢杆菌的pUB复制原点和卡那霉素抗性标志物。所述载体还含有用于在大肠杆菌中维持的ColE1复制原点和氨苄青霉素抗性标志物。将得到的质粒pBES-连接酶HIS在大肠杆菌TOP10中繁殖,并转化到枯草芽孢杆菌GX4935(trpC2 metB10 lys-3ΔnprEΔaprE)中。
连接酶的生产和纯化
将含有具有感兴趣的枯草杆菌蛋白酶变体基因的质粒的枯草芽孢杆菌的微生物单菌落接种在含有卡那霉素(10μg/mL)的5mL LB中,在37℃下在摇床中培养。向增补有抗生素(10μg/mL卡那霉素)和氨基酸(100mg/L Trp、100mg/L Met和100mg/L Lys)的30mLTerrific Broth培养基添加0.6mL所述过夜培养物。将细胞在37℃下在摇床(200rpm)中生长48h。通过离心(15min,4,000rpm,4℃)收获细胞。倾倒出培养基(30mL),并在SartoriusVivaspin 15R装置(15mL,10kDa截留分子量)上在两个离心步骤(15min,4000rpm,4℃)中浓缩。然后将浓缩的培养基(0.5mL)在三次洗涤/浓缩步骤(14mL缓冲液A,10min,4,000rpm,4℃)中更换为缓冲液A(25mM三甲基甘氨酸,pH 7.5,0.5M NaCl)。对于His-标签纯化来说,将Talon树脂(2.5mL,Clonetech)添加到塑料柱筒。将所述树脂用20mL MilliQ水洗涤并用20mL缓冲液A平衡。将促酶装载到柱上并用5mL缓冲液A洗涤。酶用15mL缓冲液B(25mM三甲基甘氨酸,pH 7.5,0.5M NaCl,500mM咪唑)洗脱。将洗脱液在Sartorius Vivaspin 15R(15mL,10kDa截留分子量)上通过离心(15min,4000rpm,4℃)进行浓缩,并将缓冲液在三次洗涤/浓缩步骤(15mL缓冲液,10min,4,000rpm,4℃)中更换为25mM三甲基甘氨酸,pH 7.5。
蛋白质的纯度通过SDS-PAGE进行分析,并且酶浓度如WO2016056913(A1)中所述来确定。纯度超过90%。将获得的含有约2mg/mL得到的酶的水性溶液(25mM三甲基甘氨酸,pH7.5)原样用于寡肽片段缩合。
酶促片段缩合实施例
材料和方法
除非另有说明,否则化学品从商业化来源获得并且未进一步纯化直接使用。在所有酶促片段缩合中使用SEQ ID:3的连接酶。分析HPLC在Agilent 1260infinity液相色谱上操作,使用反相柱(Phenomenex,C18,5μm粒度,250×4.6mm)在40℃下进行。UV检测使用UV-VIS 204Linear光谱仪在220nm处进行。梯度程序是:0-25min,从5%线性梯度匀变到98%洗脱剂B;25.1-30min,5%洗脱剂B(洗脱剂A:0.5mL/L甲磺酸(MSA)的H2O溶液,洗脱剂B:0.5mL/L MSA的乙腈溶液)。流速在0-25.1min时为1mL/min,在25.2-29.8min时为2mL/min,然后在30min时返回到1mL/min直至停止。进样体积为10μL。制备HPLC在Varian PrepStar系统上操作,使用固定相柱(Phenomenex,C18,10μm粒度,250×50mm)进行。LC-MS在Agilent1200系列液相色谱上,使用反相柱(Phenomenex,C18,5μm粒度,150×4.6mm)在40℃下进行。UV检测和梯度程序如分析HPLC所述。分子量使用Agilent 6130四极LC/MS系统来确定。
方案1:Fmoc-羟基乙酸的合成
将2-羟基乙酸叔丁酯(2.5g)溶解在吡啶(15ml)和二氯甲烷(DCM,30ml)的混合物中。然后在0℃下逐滴添加Fmoc-氯(5g)的无水DCM(15ml)溶液。将反应混合物在室温搅拌24小时。在真空下除去溶剂并将残留物重新溶解在DCM(40ml)中,用1M碳酸氢钠溶液(20mL)洗涤两次,用盐水溶液(20ml)洗涤两次,在无水硫酸镁上干燥并浓缩。将得到的Fmoc-羟基乙酸叔丁酯(4g)溶解在三氟乙酸(TFA)、三异丙基甲硅烷(TIS)和水(95/2.5/2.5,v/v/v,15mL)中并搅拌120min。在真空下除去溶剂,并将粘稠的残留物重新溶解在5%碳酸氢钠溶液(150ml)中,用二乙醚(75ml)洗涤3次。然后将水性溶液与乙酸乙酯(45mL)混合并用40%磷酸在0℃下酸化至pH=2。收集有机层并用无水硫酸镁干燥。在真空下除去溶剂,得到终产物Fmoc-羟基乙酸(Fmoc-GA)。
方案2:寡肽-OCam-Leu-OH酯的合成
将1克预载样的Fmoc-Leu-Wang树脂(载样量为0.81mmol/克)用DCM(2x2min,10mL)和N,N′-二甲基甲酰胺(DMF,2x 2min,10mL)洗涤,并使用哌啶/DMF(1/5,v/v,2x 8min,10mL)进行Fmoc去保护。在用DMF(6x 2min,10mL)洗涤后,在DMF(45min,10mL)中使用2-(1H-苯并三唑-1-基)-1,1,3,3-四甲基六氟磷酸脲(HBTU,4当量)、OxymaPure(4当量)和二异丙基乙胺(DIPEA,8当量)将Fmoc-GA(4当量)偶联到所述树脂。在用DMF(2x 2min,10mL)洗涤后,使用哌啶/DMF(1/5,v/v,2x 8min,10mL)对树脂进行Fmoc去保护。通过在DMF(2x 60min,10mL)中使用4当量Fmoc-Xxx-OH、4当量N,N′-二异丙基碳二亚胺(DIC)和0.1当量4-二甲基氨基吡啶(DMAP)进行第一个Fmoc保护的氨基酸的偶联,形成了Cam-Leu-OH酯。在这里以及在本公开的其他部分中,“Xxx”代表一个氨基酸(可变,正如在下面实施例中的序列中所指示的)。对于索马鲁肽的起始原料来说,使用可商购的Fmoc-Aib-OH构件。
在用DMF(6x 2min,10mL)洗涤后,遵照标准的SPPS流程来延长所述肽(WengC.Chan和Peter White,OUP Oxford,2000)。从树脂切割和侧链去保护使用TFA/TIS/水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用甲基叔丁基醚(MTBE)/正庚烷(1/1,v/v,50mL)沉淀粗品肽。通过离心收集所述沉淀的肽,并用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)冷冻干燥。将所述粗产物通过制备HPLC进行纯化,然后将纯的级分冷冻干燥。
方案3:寡肽C-末端酸亲核试剂的合成
将1克预载样的Fmoc-Gly-Wang树脂(载样量为0.30mmol/克)用DCM(2x2min、10mL)和DMF(2x 2min,10mL)洗涤,并使用哌啶/DMF(1/5,v/v,2x 8min,10mL)进行Fmoc去保护。遵照标准的SPPS流程来延长所述肽(Weng C.Chan和Peter White,OUP Oxford,2000)。从树脂切割和侧链去保护使用TFA/TIS/水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗品肽。通过离心收集所述沉淀的肽,并用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)冷冻干燥。将所述粗产物通过制备HPLC进行纯化,然后将纯的级分冷冻干燥。
方案4:H-Xxx-1His-2Ala-3Glu-OCam-Leu-OH和H-Xxx-1His-2Aib-3Glu-OCam-Leu-OH的PTC(苯基硫代氨甲酰基)保护
将100mg H-Xxx-1His-2Ala-3Glu-OCam-Leu-OH或100mg H-Xxx-1His-2Aib-3Glu-OCam-Leu-OH溶解在10mL吡啶/水(1/1,v/v)中。向该混合物添加25mg苯基异硫氰酸酯(PITC),并将所述溶液在环境温度下搅拌14小时。将所述粗反应混合物用50mL水稀释并用50mL DCM洗涤三次。将水层通过制备HPLC进行纯化,然后将纯的级分冷冻干燥。
代替苯基异硫氰酸酯,使用苯基硫代氨甲酰基(PTC)保护的肽,可以使用其他Edman试剂,例如甲基异硫氰酸酯(MITC),使用甲基硫代氨甲酰基(MTC)保护的肽。
方案5:含有Pal-γ-Glu的肽的合成
遵照通用方案3,使用可商购的Fmoc-Lys(Pal-γ-Glu-OtBu)-OH构件。
方案6:索马鲁肽片段H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH的合成
遵照通用方案3,使用可商购的Fmoc-20Lys(Mtt)-OH和Boc-4Gly-OH构件。在Boc-4-31-Wang片段的SPPS后,使用10mL TIS/TFA/DCM(1/1/48,v/v/v,3x15min)除去Mtt保护基团。将标准的SPPS程序用于Fmoc-AEEA-OH(两次)、Fmoc-Glu-OtBu和17-羧基十七烷酰基-OtBu的偶联。从树脂切割和侧链去保护使用TFA/TIS/水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗品肽。通过离心收集所述沉淀的肽,并用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)冷冻干燥。将所述粗产物通过制备HPLC进行纯化,然后将纯的级分冷冻干燥。
实施例1:
使用3-mer+28-mer方法的利拉鲁肽前体PTC-Xxx-利拉鲁肽-1-31-OH的酶法合成
在HPLC小瓶中,将10mg PTC-Phe-1His-2Ala-3Glu-OCam-Leu-OH(即提供利拉鲁肽的第1-3位氨基酸残基的3-mer)和10mg H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH(即提供利拉鲁肽的第4-31位氨基酸残基的28-mer)溶解在475μL水中。向该混合物添加25μL pH 9.0的1M三甲基甘氨酸缓冲液,并使用3MNaOH溶液将pH调整到8.7。随后,添加10μL TCEP(三(2-羧基乙基)膦)溶液(100mg/mL,在水中)和10μL连接酶溶液(10mg/mL)。将所述混合物留在环境温度下反应。每15分钟取出10μL反应混合物并在5vol%MSA的980μL乙腈/水(2/1,v/v)溶液中淬灭,并使用LC-MS进行分析。
在90分钟后所有Cam-酯起始原料已被消耗,并将产物和胺28-mer起始原料的峰进行积分。连接产物PTC-Phe-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH为82面积%,剩余的H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH起始原料为18面积%。
通过制备HPLC获得产物PTC-Phe-利拉鲁肽-1-31-OH,然后将纯的级分冷冻干燥。
在如上所述的反应后,使用其中Xxx=Tyr、Leu或Val的PTC-Xxx-1His-2Ala-3Glu-OCam-Leu-OH或使用MTC-Phe-1His-2Ala-3Glu-OCam-Leu-OH获得了几乎一致的结果。
实施例2:
使用3-mer+28-mer方法的索马鲁肽前体PTC-Phe-索马鲁肽-1-31-OH的酶法合成
在HPLC小瓶中,将10mg PTC-Phe-1His-2Aib-3Glu-OCam-Leu-OH(即提供索马鲁肽的第1-3位氨基酸残基的3-mer)和10mg H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH(即提供索马鲁肽的第4-31位氨基酸残基的28-mer)溶解在475μL水中。向该混合物添加25μL pH 9.0的1M三甲基甘氨酸缓冲液,并使用3MNaOH溶液将pH调整到8.7。随后,添加10μL TCEP(三(2-羧基乙基)膦)溶液(100mg/mL,在水中)和10μL连接酶溶液(10mg/mL)。将所述混合物留在环境温度下反应。每15分钟取出10μL反应混合物并在5vol%MSA的980μL乙腈/水(2/1,v/v)溶液中淬灭,并使用LC-MS进行分析。
在90分钟后所有Cam-酯起始原料已被消耗,并将产物和胺27-mer起始原料的峰进行积分。连接产物PTC-Phe-1His-2Aib-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH为80面积%,剩余的H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH起始原料为20面积%。
通过制备HPLC获得产物PTC-Phe-索马鲁肽-1-31-OH,然后将纯的级分冷冻干燥。
实施例3:使用来自于实施例1的PTC-Phe-利拉鲁肽-1-31-OH前体合成H-利拉鲁
肽-1-31-[20Lys(Pal-γ-Glu)]-OH和使用来自于实施例2的PTC-Phe-索马鲁肽-1-31-OH前
体合成H-索马鲁肽-1-31-[20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)]-OH
将2mg PTC-Phe-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH溶解在500μL水和500μL吡啶中。向该溶液添加2mgPal-Glu-γ-羟基琥珀酰亚胺酯(Pal-Glu-OSu),并将所述混合物留在环境温度下反应5小时,然后在真空中蒸发掉溶剂。将粗产物PTC-Phe-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH溶解在5vol%三氟乙酸的水溶液中,用于PTC-Phe基团的切除(去保护)。
在完成(15min)后,获得产物H-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH,通过制备HPLC进行纯化,然后将纯的级分冷冻干燥。
以相似的方式,从实施例2的前体PTC-Phe-1His-2Aib-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH,使用17-叔丁基-羧基十七烷酰基-Glu-γ-AEEA-AEEA-OSu,然后进行tBu和PTC-Phe-基团的TFA去保护,合成了索马鲁肽。
实施例4:
使用3-mer+28-mer方法的利拉鲁肽前体PTC-Xxx-利拉鲁肽-1-31-[20Lys(Pal-γ-
Glu)]-OH的酶法合成
在HPLC小瓶中,将10mg PTC-Phe-1His-2Ala-3Glu-OCam-Leu-OH和10mg H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH溶解在475μL水中。向该混合物添加25μL pH 9.0的1M三甲基甘氨酸缓冲液,并使用3MNaOH溶液将pH调整到8.7。随后,添加10μL TCEP(三(2-羧基乙基)膦)溶液(100mg/mL,在水中)和10μL连接酶溶液(10mg/mL)。将所述混合物留在环境温度下反应。每15分钟取出10μL反应混合物并在5vol%MSA的980μL乙腈/水(2/1,v/v)溶液中淬灭,并使用LC-MS进行分析。
在90分钟后所有Cam-酯起始原料已被消耗,并将产物和胺28-mer起始原料的峰进行积分。连接产物PTC-Phe-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH为74面积%,剩余的H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH起始原料为26面积%。
产物PTC-Phe-利拉鲁肽-1-31-[20Lys(Pal-γ-Glu)]-OH可以通过制备HPLC来获得,然后将纯的级分冷冻干燥。
在如上所述的反应后,使用其中Xxx=Tyr、Leu或Val的PTC-Xxx-1His-2Ala-3Glu-OCam-Leu-OH或使用MTC-Phe-1His-2Ala-3Glu-OCam-Leu-OH获得了几乎一致的结果。
实施例5:
使用3-mer+28-mer方法的索马鲁肽前体PTC-Phe-索马鲁肽-1-31-[20Lys(AEEA-
AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)]-OH的酶法合成
在HPLC小瓶中,将10mg PTC-Phe-1His-2Aib-3Glu-OCam-Leu-OH和10mg H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH溶解在475μL水中。向该混合物添加25μL pH 9.0的1M三甲基甘氨酸缓冲液,并使用3M NaOH溶液将pH调整到8.7。随后,添加10μL TCEP(三(2-羧基乙基)膦)溶液(100mg/mL,在水中)和10μL连接酶溶液(10mg/mL)。将所述混合物留在环境温度下反应。每15分钟取出10μL反应混合物并在5vol%MSA的980μL乙腈/水(2/1,v/v)溶液中淬灭,并使用LC-MS进行分析。
在90分钟后所有Cam-酯起始原料已被消耗,并将产物和胺28-mer起始原料的峰进行积分。连接产物PTC-Phe-1His-2Aib-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH为86面积%,剩余的H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH起始原料为14面积%。
产物PTC-Phe-索马鲁肽-1-31-[20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)]-OH可以通过制备HPLC来获得,然后将纯的级分冷冻干燥。
实施例6:使用来自于实施例4的PTC-Phe-利拉鲁肽-1-31-[20Lys(Pal-γ-Glu)]-
OH前体合成H-利拉鲁肽-1-31-[20Lys(Pal-γ-Glu)]-OH和使用来自于实施例5的PTC-Phe-
索马鲁肽-1-31-[20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)]-OH前体合成H-索
马鲁肽-1-31-[20Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)]-OH
将10mg PTC-Phe-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH溶解在95vol%三氟乙酸的水溶液中,用于PTC-Phe基团的切除(去保护)。
在完成(15min)后,获得产物H-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH,通过制备HPLC进行纯化,然后将纯的级分冷冻干燥。
以相似的方式,从前体PTC-Phe-1His-2Aib-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AE EA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH合成了索马鲁肽。
比较例7:使用可选的偶联位置合成PTC-Phe-索马鲁肽-1-31-OH
使用实施例1的条件研究了几个不同的偶联位置。
1.3-mer+28-mer方法:H-1His-2Aib-3Glu-OCam-Leu-OH+H-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH。偶联失败。
2.4-mer+27-mer方法:PTC-Phe-1His-2Aib-3Glu-4Gly-OCam-Leu-OH+H-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH。偶联失败。
3.5-mer+26-mer方法:PTC-Phe-1His-2Aib-3Glu-4Gly-5Thr-OCam-Leu-OH+H-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH。偶联失败。
4.6-mer+25-mer方法:PTC-Phe-1His-2Aib-3Glu-4Gly-5Thr-6Phe-OCam-Leu-OH+H-7Thr-8Ser-9Asp-10Val-11Ser-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH。偶联失败。
序列
SEQ ID NO:1:编码枯草杆菌蛋白酶BPN’的-107至275位氨基酸的野生型基因
ENA|K02496|K02496.1 B.解淀粉芽孢杆菌枯草杆菌蛋白酶BPN'
GTGAGAGGCAAAAAAGTATGGATCAGTTTGCTGTTTGCTTTAGCGTTAATCTTTACGATGGCGTTCGGCAGCACATCCTCTGCCCAGGCGGCAGGGAAATCAAACGGGGAAAAGAAATATATTGTCGGGTTTAAACAGACAATGAGCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAAAAAGGCGGGAAAGTGCAAAAGCAATTCAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGAATTGAAAAAAGACCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACATGCGTACGCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCCCCTGCTCTGCACTCTCAAGGCTACACTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCATCCTGATTTAAAGGTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACGGAACTCACGTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCCAAGCGCATCACTTTACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATCATTAACGGAATCGAGTGGGCGATCGCAAACAATATGGACGTTATTAACATGAGCCTCGGCGGACCTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTCGTTGCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGTAAATACCCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAGGACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATACGGGGCGTACAACGGTACGTCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTTCTAAGCACCCGAACTGGACAAACACTCAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTTGGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGTACAGGCGGCAGCTCAGTAA。
SEQ ID NO:2:野生型枯草杆菌蛋白酶BPN’(成熟的)
>SUBT_BACAM成熟的解淀粉芽孢杆菌枯草杆菌蛋白酶BPN'1至275
>sp|P00782|108-382
AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQDNNSHGTHVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFSSVGPELDVMAPGVSIQSTLPGNKYGAYNGTSMASPHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLINVQAAAQ。
SEQ ID NO:3:具有突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F,N62A、A73L、Δ75-83、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、S221C、M222P、P225N、T254A和Q271E以及His标签的枯草杆菌蛋白酶BPN’变体
AKCVSYGVAQIKAPALHSQGYTGSNVKVAVLDSGIDSSHPDLNVAGGASFVPSETNPFQDNASHGTHVAGTVLAVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNNGTSGSSSTVEYPAKYPSVIAVGAVDSSNQRAPWSSVGPELDVMAPGVSICSTLPGGKYGAHDGTCPASNHVAGAAALILSKHPNWTNTQVRSSLENTATKLGDSFYYGKGLINVEAAAQHHHHHH。
序列表
<110> 恩细贝普有限公司
<120> 索马鲁肽、利拉鲁肽和GLP-1的化学-酶法合成
<130> FK19045-02-PAT-WO
<150> EP 18161081.7
<151> 2018-03-09
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 1149
<212> DNA
<213> 解淀粉芽孢杆菌(Bacillus amyloliquefaciens)
<220>
<221> CDS
<222> (322)..(1149)
<400> 1
gtgagaggca aaaaagtatg gatcagtttg ctgtttgctt tagcgttaat ctttacgatg 60
gcgttcggca gcacatcctc tgcccaggcg gcagggaaat caaacgggga aaagaaatat 120
attgtcgggt ttaaacagac aatgagcacg atgagcgccg ctaagaagaa agatgtcatt 180
tctgaaaaag gcgggaaagt gcaaaagcaa ttcaaatatg tagacgcagc ttcagctaca 240
ttaaacgaaa aagctgtaaa agaattgaaa aaagacccga gcgtcgctta cgttgaagaa 300
gatcacgtag cacatgcgta cgcgcagtcc gtgccttacg gcgtatcacaa 351
Ala Gln Ser Val Pro Tyr Gly Val Ser Gln
1 5 10
att aaa gcc cct gct ctg cac tct caa ggc tac act gga tca aat gtt 399
Ile Lys Ala Pro Ala Leu His Ser Gln Gly Tyr Thr Gly Ser Asn Val
15 20 25
aaa gta gcg gtt atc gac agc ggt atc gat tct tct cat cct gat tta 447
Lys Val Ala Val Ile Asp Ser Gly Ile Asp Ser Ser His Pro Asp Leu
30 35 40
aag gta gca ggc gga gcc agc atg gtt cct tct gaa aca aat cct ttc 495
Lys Val Ala Gly Gly Ala Ser Met Val Pro Ser Glu Thr Asn Pro Phe
45 50 55
caa gac aac aac tct cac gga act cac gtt gcc ggc aca gtt gcg gct 543
Gln Asp Asn Asn Ser His Gly Thr His Val Ala Gly Thr Val Ala Ala
60 65 70
ctt aat aac tca atc ggt gta tta ggc gtt gcg cca agc gca tca ctt 591
Leu Asn Asn Ser Ile Gly Val Leu Gly Val Ala Pro Ser Ala Ser Leu
75 80 85 90
tac gct gta aaa gtt ctc ggt gct gac ggt tcc ggc caa tac agc tgg 639
Tyr Ala Val Lys Val Leu Gly Ala Asp Gly Ser Gly Gln Tyr Ser Trp
95 100 105
atc att aac gga atc gag tgg gcg atc gca aac aat atg gac gtt att 687
Ile Ile Asn Gly Ile Glu Trp Ala Ile Ala Asn Asn Met Asp Val Ile
110 115 120
aac atg agc ctc ggc gga cct tct ggt tct gct gct tta aaa gcg gca 735
Asn Met Ser Leu Gly Gly Pro Ser Gly Ser Ala Ala Leu Lys Ala Ala
125 130 135
gtt gat aaa gcc gtt gca tcc ggc gtc gta gtc gtt gcg gca gcc ggt 783
Val Asp Lys Ala Val Ala Ser Gly Val Val Val Val Ala Ala Ala Gly
140 145 150
aac gaa ggc act tcc ggc agc tca agc aca gtg ggc tac cct ggt aaa 831
Asn Glu Gly Thr Ser Gly Ser Ser Ser Thr Val Gly Tyr Pro Gly Lys
155 160 165 170
tac cct tct gtc att gca gta ggc gct gtt gac agc agc aac caa aga 879
Tyr Pro Ser Val Ile Ala Val Gly Ala Val Asp Ser Ser Asn Gln Arg
175 180 185
gca tct ttc tca agc gta gga cct gag ctt gat gtc atg gca cct ggc 927
Ala Ser Phe Ser Ser Val Gly Pro Glu Leu Asp Val Met Ala Pro Gly
190 195 200
gta tct atc caa agc acg ctt cct gga aac aaa tac ggg gcg tac aac 975
Val Ser Ile Gln Ser Thr Leu Pro Gly Asn Lys Tyr Gly Ala Tyr Asn
205 210 215
ggt acg tca atg gca tct ccg cac gtt gcc gga gcg gct gct ttg att 1023
Gly Thr Ser Met Ala Ser Pro His Val Ala Gly Ala Ala Ala Leu Ile
220 225 230
ctt tct aag cac ccg aac tgg aca aac act caa gtc cgc agc agt tta 1071
Leu Ser Lys His Pro Asn Trp Thr Asn Thr Gln Val Arg Ser Ser Leu
235 240 245 250
gaa aac acc act aca aaa ctt ggt gat tct ttc tac tat gga aaa ggg 1119
Glu Asn Thr Thr Thr Lys Leu Gly Asp Ser Phe Tyr Tyr Gly Lys Gly
255 260 265
ctg atc aac gta cag gcg gca gct cag taa 1149
Leu Ile Asn Val Gln Ala Ala Ala Gln
270 275
<210> 2
<211> 275
<212> PRT
<213> 解淀粉芽孢杆菌(Bacillus amyloliquefaciens)
<400> 2
Ala Gln Ser Val Pro Tyr Gly Val Ser Gln Ile Lys Ala Pro Ala Leu
1 5 10 15
His Ser Gln Gly Tyr Thr Gly Ser Asn Val Lys Val Ala Val Ile Asp
20 25 30
Ser Gly Ile Asp Ser Ser His Pro Asp Leu Lys Val Ala Gly Gly Ala
35 40 45
Ser Met Val Pro Ser Glu Thr Asn Pro Phe Gln Asp Asn Asn Ser His
50 55 60
Gly Thr His Val Ala Gly Thr Val Ala Ala Leu Asn Asn Ser Ile Gly
65 70 75 80
Val Leu Gly Val Ala Pro Ser Ala Ser Leu Tyr Ala Val Lys Val Leu
85 90 95
Gly Ala Asp Gly Ser Gly Gln Tyr Ser Trp Ile Ile Asn Gly Ile Glu
100 105 110
Trp Ala Ile Ala Asn Asn Met Asp Val Ile Asn Met Ser Leu Gly Gly
115 120 125
Pro Ser Gly Ser Ala Ala Leu Lys Ala Ala Val Asp Lys Ala Val Ala
130 135 140
Ser Gly Val Val Val Val Ala Ala Ala Gly Asn Glu Gly Thr Ser Gly
145 150 155 160
Ser Ser Ser Thr Val Gly Tyr Pro Gly Lys Tyr Pro Ser Val Ile Ala
165 170 175
Val Gly Ala Val Asp Ser Ser Asn Gln Arg Ala Ser Phe Ser Ser Val
180 185 190
Gly Pro Glu Leu Asp Val Met Ala Pro Gly Val Ser Ile Gln Ser Thr
195 200 205
Leu Pro Gly Asn Lys Tyr Gly Ala Tyr Asn Gly Thr Ser Met Ala Ser
210 215 220
Pro His Val Ala Gly Ala Ala Ala Leu Ile Leu Ser Lys His Pro Asn
225 230 235 240
Trp Thr Asn Thr Gln Val Arg Ser Ser Leu Glu Asn Thr Thr Thr Lys
245 250 255
Leu Gly Asp Ser Phe Tyr Tyr Gly Lys Gly Leu Ile Asn Val Gln Ala
260 265 270
Ala Ala Gln
275
<210> 3
<211> 272
<212> PRT
<213> 人工序列
<220>
<223> 枯草杆菌蛋白酶B变体(mutant subtilisin B)
<220>
<221> MISC_FEATURE
<222> (267)..(272)
<223> His-标签
<400> 3
Ala Lys Cys Val Ser Tyr Gly Val Ala Gln Ile Lys Ala Pro Ala Leu
1 5 10 15
His Ser Gln Gly Tyr Thr Gly Ser Asn Val Lys Val Ala Val Leu Asp
20 25 30
Ser Gly Ile Asp Ser Ser His Pro Asp Leu Asn Val Ala Gly Gly Ala
35 40 45
Ser Phe Val Pro Ser Glu Thr Asn Pro Phe Gln Asp Asn Ala Ser His
50 55 60
Gly Thr His Val Ala Gly Thr Val Leu Ala Val Ala Pro Ser Ala Ser
65 70 75 80
Leu Tyr Ala Val Lys Val Leu Gly Ala Asp Gly Ser Gly Gln Tyr Ser
85 90 95
Trp Ile Ile Asn Gly Ile Glu Trp Ala Ile Ala Asn Asn Met Asp Val
100 105 110
Ile Asn Met Ser Leu Gly Gly Pro Ser Gly Ser Ala Ala Leu Lys Ala
115 120 125
Ala Val Asp Lys Ala Val Ala Ser Gly Val Val Val Val Ala Ala Ala
130 135 140
Gly Asn Asn Gly Thr Ser Gly Ser Ser Ser Thr Val Glu Tyr Pro Ala
145 150 155 160
Lys Tyr Pro Ser Val Ile Ala Val Gly Ala Val Asp Ser Ser Asn Gln
165 170 175
Arg Ala Pro Trp Ser Ser Val Gly Pro Glu Leu Asp Val Met Ala Pro
180 185 190
Gly Val Ser Ile Cys Ser Thr Leu Pro Gly Gly Lys Tyr Gly Ala His
195 200 205
Asp Gly Thr Cys Pro Ala Ser Asn His Val Ala Gly Ala Ala Ala Leu
210 215 220
Ile Leu Ser Lys His Pro Asn Trp Thr Asn Thr Gln Val Arg Ser Ser
225 230 235 240
Leu Glu Asn Thr Ala Thr Lys Leu Gly Asp Ser Phe Tyr Tyr Gly Lys
245 250 255
Gly Leu Ile Asn Val Glu Ala Ala Ala Gln His His His His His His
260 265 270
<210> 4
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 共有肽片段(consensus peptide fragment)
<220>
<221> VARIANT
<222> (2)..(2)
<223> 也可能是α-氨基异丁酸单元
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Lys具有游离的侧链ε-氨基或被保护基团保护的侧链ε-氨基或被氨基酸或另一官能团官能化的侧链ε-氨基
<220>
<221> VARIANT
<222> (28)..(28)
<223> 也可能是K
<400> 4
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Asn Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25 30
<210> 5
<211> 31
<212> PRT
<213> 智人(Homo sapiens)
<400> 5
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Asn Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 6
<211> 31
<212> PRT
<213> 智人(Homo sapiens)
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Lys 为 Lys(Pal-γ-Glu)-
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Lys 为 Lys(Pal-γ-Glu)
<400> 6
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Asn Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 7
<211> 31
<212> PRT
<213> 智人(Homo sapiens)
<220>
<221> MOD_RES
<222> (2)..(2)
<223> bAib
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Lys 为 Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)
<400> 7
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Asn Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 8
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 制备利拉鲁肽的偶联试剂
<400> 8
His Ala Glu Gly
1
<210> 9
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> 制备利拉鲁肽的偶联试剂
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Lys 为 Lys(Pal-Glu-OX),其中X为H或保护基团
<400> 9
Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Asn Ala Ala Lys
1 5 10 15
Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25
<210> 10
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> 偶联产物
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 可能具有保护基团
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 一个或多个α-氨基酸
<220>
<221> MOD_RES
<222> (3)..(3)
<223> 可能是α-氨基异丁酸
<220>
<221> MOD_RES
<222> (21)..(21)
<223> 可能具有游离的侧链ε-氨基或被保护基团保护的侧链ε-氨基或被氨基酸或另一官能团官能化的侧链ε-氨基
<220>
<221> VARIANT
<222> (29)..(29)
<223> 可能是Lys
<400> 10
Xaa His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu
1 5 10 15
Gly Asn Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25 30
Claims (9)
1.制备序列为Pq-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的偶联产物的方法,所述方法包括将以下(a)和(b)酶法偶联:
(a)包含由式Pq-Wv-His-X-Glu-(硫)酯表示的第一肽片段的肽C-末端酯或硫酯;和
(b)包含第二肽片段的具有N-末端未保护的胺的肽亲核试剂,所述第二肽片段的序列为H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly,
其中
-P为苯基硫代氨甲酰基,并且q为1;
-W为Phe,并且v为1;
-X是Ala或α-氨基异丁酸单元(Aib);
-Y是Lys,所述Lys具有游离的侧链ε-氨基或被保护基团保护的侧链ε-氨基或者用氨基酸或另一个官能团官能化的侧链ε-氨基,所述另一个官能团选自γ-Glu-OH、Pal-γ-Glu-OH、AEEA-AEEA-γ-Glu-OH和AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH的官能团,其中Pal是棕榈酰基,并且AEEA-AEEA是2-[2-(2-氨基乙氧基)乙氧基]乙酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基;
-Z是Arg或Lys;
所述肽C-末端酯或硫酯的酯或硫酯为Cam-Leu-OH-ester;
所述酶法偶联由连接酶催化,其中所述连接酶是由SEQ ID NO:3所示的枯草杆菌蛋白酶BPN’变体;
所述偶联产物为索马鲁肽、利拉鲁肽或GLP-1。
2.根据权利要求1所述的方法,其还包括从所述序列为Pq-Wv-His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的产物除去“Pq-Wv”部分,以便获得具有序列His-X-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-
Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Z-Gly-Arg-Gly的肽,其中P、q、v、W、X、Y和Z如权利要求1中所定义。
3.根据权利要求1所述的方法,其包括将以下(a)和(b)酶法偶联合成索马鲁肽:
(a)由式Pq-Wv-His-Aib-Glu-(硫)酯表示的肽C-末端酯或硫酯;和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是Lys(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)。
4.根据权利要求1所述的方法,其包括将以下(a)和(b)酶法偶联合成索马鲁肽:
(a)由式P-Wv-His-Aib-Glu-(硫)酯表示的肽C-末端酯或硫酯;和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是Lys(AEEA-AEEA-γ-Glu-OH),由此形成由式P-Wv-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(AEEA-AEEA-γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly表示的肽,然后为Lys(AEEA-AEEA-γ-Glu-OH)提供17-羧基十七烷酰基,以获得P-Wv-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Ly s(AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly。
5.根据权利要求1所述的方法,其包括将以下(a)和(b)酶法偶联合成索马鲁肽:
(a)由式Pq-Wv-His-Aib-Glu-(硫)酯表示的肽C-末端酯或硫酯;和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是具有游离或受保护的侧链ε-氨基的赖氨酸残基,然后为Lys侧链ε-氨基提供AEEA-AEEA-γ-Glu-N-17-羧基十七烷酰基-OH基团。
6.根据权利要求1所述的方法,其包括将以下(a)和(b)酶法偶联合成利拉鲁肽:
(a)由式Pq-Wv-His-Ala-Glu-(硫)酯表示的肽C-末端酯或硫酯;和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是Lys(Pal-γ-Glu-OH)。
7.根据权利要求1所述的方法,其包括将以下(a)和(b)酶法偶联合成利拉鲁肽:
(a)由式P-Wv-His-Ala-Glu(硫)酯表示的肽C-末端酯或硫酯;和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂;由此获得由式P-Wv-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gl y-Arg-Gly表示的肽,然后为所述肽的所述Lys(γ-Glu-OH)提供棕榈酰基,以获得P-Wv-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-GIn-Ala-Ala-Lys(Pal-γ-Glu-OH)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly。
8.根据权利要求1所述的方法,其包括将以下(a)和(b)酶法偶联合成利拉鲁肽:
(a)由式Pq-Wv-His-Ala-Glu-(硫)酯表示的肽C-末端酯或硫酯;和
(b)包含序列H-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Y-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的肽亲核试剂,其中Y是具有游离或受保护的侧链ε-氨基的赖氨酸残基;然后为所述侧链ε-氨基提供Pal-γ-Glu-OH。
9.一种枯草杆菌蛋白酶BPN’变体,其氨基酸序列为SEQ ID NO:3所示的序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18161081.7 | 2018-03-09 | ||
EP18161081 | 2018-03-09 | ||
PCT/EP2019/055918 WO2019170895A1 (en) | 2018-03-09 | 2019-03-08 | Chemo-enzymatic synthesis of semaglutide, liraglutide and glp-1 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111757891A CN111757891A (zh) | 2020-10-09 |
CN111757891B true CN111757891B (zh) | 2024-09-27 |
Family
ID=61800261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980014900.2A Active CN111757891B (zh) | 2018-03-09 | 2019-03-08 | 索马鲁肽、利拉鲁肽和glp-1的化学-酶法合成 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10858414B2 (zh) |
EP (1) | EP3762408A1 (zh) |
CN (1) | CN111757891B (zh) |
WO (1) | WO2019170895A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110590934B (zh) * | 2019-09-25 | 2020-12-08 | 北京乐普医药科技有限公司 | 一种glp-1化合物 |
CN110922470A (zh) * | 2019-12-26 | 2020-03-27 | 杭州肽佳生物科技有限公司 | 一种索玛鲁肽的制备方法 |
CN113667006B (zh) * | 2020-05-14 | 2024-04-19 | 鲁南制药集团股份有限公司 | 一种索马鲁肽二肽侧链的制备方法 |
US20240043897A1 (en) | 2021-02-12 | 2024-02-08 | Fresenius Kabi Ipsum S.R.L. | Subtilisin variants and their use |
WO2024112617A2 (en) * | 2022-11-21 | 2024-05-30 | Eli Lilly And Company | Process for preparing a gip/glp1 dual agonist |
WO2024133313A1 (en) | 2022-12-19 | 2024-06-27 | Enzypep B.V. | Thermostable subtilisin variants and their use |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102286092A (zh) * | 2011-09-14 | 2011-12-21 | 深圳翰宇药业股份有限公司 | 利拉鲁肽的固相合成方法 |
CN103189389A (zh) * | 2011-09-03 | 2013-07-03 | 深圳市健元医药科技有限公司 | 新的glp-ⅰ类似物及其制备方法和用途 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69131834T2 (de) | 1990-08-09 | 2000-05-31 | Genentech, Inc. | Serinproteasevarianten mit peptidligase aktivität |
US6451974B1 (en) | 1999-03-17 | 2002-09-17 | Novo Nordisk A/S | Method of acylating peptides and novel acylating agents |
US6541235B1 (en) * | 2000-09-29 | 2003-04-01 | University Of Maryland Biotechnology Institute | Calcium free subtilisin mutants |
RS51281B (sr) | 2006-06-23 | 2010-12-31 | F. Hoffmann-La Roche Ag. | Sinteza insulinotropičnog peptida |
WO2014199397A2 (en) * | 2013-06-11 | 2014-12-18 | Mylan Laboratories Ltd | Process for the preparation of liraglutide |
GR20140100479A (el) * | 2014-09-23 | 2016-05-05 | Novetide, Ltd., | Συνθεση λιραγλουτιδης |
CA2962903C (en) * | 2014-10-10 | 2023-01-10 | Enzypep B.V. | Peptide fragment condensation and cyclisation using a subtilisin variant with improved synthesis over hydrolysis ratio |
WO2017007324A1 (en) | 2015-07-09 | 2017-01-12 | Enzypep B.V. | Designing an enzymatic peptide fragment condensation strategy |
WO2018032521A1 (zh) * | 2016-08-19 | 2018-02-22 | 深圳市健元医药科技有限公司 | 一种利拉鲁肽的合成方法 |
US20190185836A1 (en) * | 2016-09-02 | 2019-06-20 | The Regents Of The University Of California | Engineered subtiligase variants for versatile, site-specific labeling of proteins |
-
2019
- 2019-03-08 US US16/349,106 patent/US10858414B2/en active Active
- 2019-03-08 EP EP19709055.8A patent/EP3762408A1/en active Pending
- 2019-03-08 WO PCT/EP2019/055918 patent/WO2019170895A1/en unknown
- 2019-03-08 CN CN201980014900.2A patent/CN111757891B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103189389A (zh) * | 2011-09-03 | 2013-07-03 | 深圳市健元医药科技有限公司 | 新的glp-ⅰ类似物及其制备方法和用途 |
CN102286092A (zh) * | 2011-09-14 | 2011-12-21 | 深圳翰宇药业股份有限公司 | 利拉鲁肽的固相合成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111757891A (zh) | 2020-10-09 |
US10858414B2 (en) | 2020-12-08 |
EP3762408A1 (en) | 2021-01-13 |
WO2019170895A1 (en) | 2019-09-12 |
US20200262886A1 (en) | 2020-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111757891B (zh) | 索马鲁肽、利拉鲁肽和glp-1的化学-酶法合成 | |
CN111819191B (zh) | 利拉鲁肽、索马鲁肽和glp-1的化学酶促合成 | |
US10253061B2 (en) | Peptide fragment condensation and cyclisation using a subtilisin variant with improved synthesis over hydrolysis ratio | |
US10752931B2 (en) | Designing an enzymatic peptide fragment condensation strategy | |
US10336994B2 (en) | Subtilisin variants having a mutation in the S2 or S2# pocket | |
WO2022171667A1 (en) | Subtilisin variants and their use | |
US9598714B2 (en) | Side-chain protected oligopeptide fragment condensation using subtilisins in organic solvents | |
CN117098843A (zh) | 枯草杆菌蛋白酶变体及其用途 | |
WO2017222369A1 (en) | Enzymatic coupling of (oligo)peptides to the b-chain of an insulin receptor ligand | |
WO2024133313A1 (en) | Thermostable subtilisin variants and their use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240201 Address after: Italy, Milan Applicant after: Freseniuskabi Co.,Ltd. Country or region after: Italy Address before: Geleen Applicant before: ENZYPEP B.V. Country or region before: Netherlands |
|
GR01 | Patent grant | ||
GR01 | Patent grant |