KR20230152811A - 변이체 actriib 단백질 및 이의 용도 - Google Patents
변이체 actriib 단백질 및 이의 용도 Download PDFInfo
- Publication number
- KR20230152811A KR20230152811A KR1020237036672A KR20237036672A KR20230152811A KR 20230152811 A KR20230152811 A KR 20230152811A KR 1020237036672 A KR1020237036672 A KR 1020237036672A KR 20237036672 A KR20237036672 A KR 20237036672A KR 20230152811 A KR20230152811 A KR 20230152811A
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- seq
- actriib
- polypeptide
- fusion protein
- Prior art date
Links
- 101100437153 Rattus norvegicus Acvr2b gene Proteins 0.000 title claims abstract 7
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 549
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 309
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 291
- 229920001184 polypeptide Polymers 0.000 claims description 290
- 150000001413 amino acids Chemical class 0.000 claims description 191
- 238000006467 substitution reaction Methods 0.000 claims description 179
- -1 109 Chemical compound 0.000 claims description 18
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 239000003446 ligand Substances 0.000 abstract description 120
- 230000000694 effects Effects 0.000 abstract description 60
- 238000000034 method Methods 0.000 abstract description 41
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 13
- 210000003205 muscle Anatomy 0.000 abstract description 12
- 230000001105 regulatory effect Effects 0.000 abstract description 11
- 210000001519 tissue Anatomy 0.000 abstract description 10
- 210000000988 bone and bone Anatomy 0.000 abstract description 7
- 230000012010 growth Effects 0.000 abstract description 7
- 210000003743 erythrocyte Anatomy 0.000 abstract description 6
- 239000000203 mixture Substances 0.000 abstract description 5
- 210000000845 cartilage Anatomy 0.000 abstract description 4
- 238000012216 screening Methods 0.000 abstract description 4
- 150000001875 compounds Chemical class 0.000 abstract description 3
- 201000010099 disease Diseases 0.000 abstract description 3
- 230000002401 inhibitory effect Effects 0.000 abstract description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- 230000001737 promoting effect Effects 0.000 abstract description 2
- 108010057453 activin receptor type II-B Proteins 0.000 description 443
- 235000001014 amino acid Nutrition 0.000 description 419
- 108020001507 fusion proteins Proteins 0.000 description 235
- 102000037865 fusion proteins Human genes 0.000 description 235
- 229940024606 amino acid Drugs 0.000 description 190
- 239000012634 fragment Substances 0.000 description 145
- 108090000623 proteins and genes Proteins 0.000 description 145
- 102000004169 proteins and genes Human genes 0.000 description 132
- 235000018102 proteins Nutrition 0.000 description 131
- 102100027647 Activin receptor type-2B Human genes 0.000 description 98
- 230000000875 corresponding effect Effects 0.000 description 97
- 150000007523 nucleic acids Chemical class 0.000 description 90
- 230000004927 fusion Effects 0.000 description 85
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 83
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 82
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 82
- 239000000488 activin Substances 0.000 description 75
- 108010059616 Activins Proteins 0.000 description 73
- 102100026818 Inhibin beta E chain Human genes 0.000 description 73
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 68
- 239000004472 Lysine Substances 0.000 description 68
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 67
- 230000015572 biosynthetic process Effects 0.000 description 63
- 108091028043 Nucleic acid sequence Proteins 0.000 description 58
- 108010029485 Protein Isoforms Proteins 0.000 description 57
- 102000001708 Protein Isoforms Human genes 0.000 description 57
- 230000027455 binding Effects 0.000 description 57
- 101000799193 Homo sapiens Activin receptor type-1C Proteins 0.000 description 53
- 210000004027 cell Anatomy 0.000 description 52
- 101000799140 Homo sapiens Activin receptor type-1 Proteins 0.000 description 51
- 230000003993 interaction Effects 0.000 description 48
- 239000002243 precursor Substances 0.000 description 48
- 239000000833 heterodimer Substances 0.000 description 44
- 101000799189 Homo sapiens Activin receptor type-1B Proteins 0.000 description 41
- 108010057429 activin receptor type II-A Proteins 0.000 description 41
- 101000712669 Homo sapiens TGF-beta receptor type-2 Proteins 0.000 description 40
- 108010063130 Type II Bone Morphogenetic Protein Receptors Proteins 0.000 description 40
- 230000000295 complement effect Effects 0.000 description 39
- 230000004048 modification Effects 0.000 description 38
- 238000012986 modification Methods 0.000 description 38
- 101000984546 Homo sapiens Bone morphogenetic protein receptor type-1B Proteins 0.000 description 37
- 108010076504 Protein Sorting Signals Proteins 0.000 description 37
- 230000035772 mutation Effects 0.000 description 37
- 102000039446 nucleic acids Human genes 0.000 description 37
- 108020004707 nucleic acids Proteins 0.000 description 37
- 102220578642 Chorion-specific transcription factor GCMb_K74M_mutation Human genes 0.000 description 35
- 101000934638 Homo sapiens Bone morphogenetic protein receptor type-1A Proteins 0.000 description 35
- 235000018417 cysteine Nutrition 0.000 description 32
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 32
- 241000282414 Homo sapiens Species 0.000 description 31
- 239000002773 nucleotide Substances 0.000 description 31
- 125000003729 nucleotide group Chemical group 0.000 description 31
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 30
- 230000014509 gene expression Effects 0.000 description 29
- 102000005962 receptors Human genes 0.000 description 29
- 108020003175 receptors Proteins 0.000 description 29
- 230000011664 signaling Effects 0.000 description 28
- 125000000539 amino acid group Chemical group 0.000 description 26
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 25
- 102100034111 Activin receptor type-1 Human genes 0.000 description 23
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 23
- 230000013595 glycosylation Effects 0.000 description 23
- 238000006206 glycosylation reaction Methods 0.000 description 23
- 102100021886 Activin receptor type-2A Human genes 0.000 description 22
- 102100025422 Bone morphogenetic protein receptor type-2 Human genes 0.000 description 22
- 235000013922 glutamic acid Nutrition 0.000 description 22
- 239000004220 glutamic acid Substances 0.000 description 22
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 21
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 21
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 21
- 229940112869 bone morphogenetic protein Drugs 0.000 description 21
- 102100033455 TGF-beta receptor type-2 Human genes 0.000 description 20
- 102100034135 Activin receptor type-1C Human genes 0.000 description 19
- 102100027052 Bone morphogenetic protein receptor type-1B Human genes 0.000 description 19
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 18
- 102100034134 Activin receptor type-1B Human genes 0.000 description 18
- 102100025423 Bone morphogenetic protein receptor type-1A Human genes 0.000 description 18
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 18
- 235000003704 aspartic acid Nutrition 0.000 description 18
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 18
- 239000000306 component Substances 0.000 description 18
- 102220638160 Arylamine N-acetyltransferase 1_R64K_mutation Human genes 0.000 description 17
- 102220525561 Coiled-coil domain-containing protein 200_A24N_mutation Human genes 0.000 description 17
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 17
- 230000002378 acidificating effect Effects 0.000 description 17
- 230000001965 increasing effect Effects 0.000 description 17
- GPTFURBXHJWNHR-UHFFFAOYSA-N protopine Chemical compound C1=C2C(=O)CC3=CC=C4OCOC4=C3CN(C)CCC2=CC2=C1OCO2 GPTFURBXHJWNHR-UHFFFAOYSA-N 0.000 description 16
- 241000894007 species Species 0.000 description 16
- 239000004475 Arginine Substances 0.000 description 15
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 15
- 102220567352 Ornithine decarboxylase antizyme 1_K74F_mutation Human genes 0.000 description 15
- 102220633854 PRKCA-binding protein_D80A_mutation Human genes 0.000 description 15
- 102220577876 Poly(rC)-binding protein 1_W78A_mutation Human genes 0.000 description 15
- 102220469872 Protein argonaute-3_E37A_mutation Human genes 0.000 description 15
- 239000004473 Threonine Substances 0.000 description 15
- 102220479829 Voltage-dependent L-type calcium channel subunit beta-2_R56K_mutation Human genes 0.000 description 15
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 15
- 102220004761 rs33990858 Human genes 0.000 description 15
- 102220005147 rs34173382 Human genes 0.000 description 15
- 102220125519 rs562411087 Human genes 0.000 description 15
- 102200089383 rs57977969 Human genes 0.000 description 15
- 102200151008 rs863225226 Human genes 0.000 description 15
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 14
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 14
- 101100490437 Mus musculus Acvrl1 gene Proteins 0.000 description 14
- 102220610729 Myogenic factor 5_L79P_mutation Human genes 0.000 description 14
- 102220495689 Putative uncharacterized protein FLJ43944_R40A_mutation Human genes 0.000 description 14
- 102220479051 CD59 glycoprotein_L79D_mutation Human genes 0.000 description 13
- 108091006020 Fc-tagged proteins Proteins 0.000 description 13
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 13
- 102220542870 Presenilins-associated rhomboid-like protein, mitochondrial_L79E_mutation Human genes 0.000 description 13
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 13
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 13
- 102220469729 Voltage-dependent L-type calcium channel subunit beta-2_D54K_mutation Human genes 0.000 description 13
- 230000001086 cytosolic effect Effects 0.000 description 13
- 102220100897 rs201542692 Human genes 0.000 description 13
- 102000035160 transmembrane proteins Human genes 0.000 description 13
- 108091005703 transmembrane proteins Proteins 0.000 description 13
- 102220575187 Egl nine homolog 1_F82A_mutation Human genes 0.000 description 12
- 102000007474 Multiprotein Complexes Human genes 0.000 description 12
- 108010085220 Multiprotein Complexes Proteins 0.000 description 12
- 102220496976 Platelet-activating factor acetylhydrolase 2, cytoplasmic_L79A_mutation Human genes 0.000 description 12
- 230000006698 induction Effects 0.000 description 12
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 11
- 235000004279 alanine Nutrition 0.000 description 11
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 11
- 102100040896 Growth/differentiation factor 15 Human genes 0.000 description 10
- 101000937269 Homo sapiens Activin receptor type-2B Proteins 0.000 description 10
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 description 10
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 10
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 10
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 10
- 108010023082 activin A Proteins 0.000 description 10
- 208000035475 disorder Diseases 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 239000000710 homodimer Substances 0.000 description 10
- 102000045412 human ACVR2B Human genes 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 229960000187 tissue plasminogen activator Drugs 0.000 description 10
- 108060003951 Immunoglobulin Proteins 0.000 description 9
- 241000269370 Xenopus <genus> Species 0.000 description 9
- 238000004587 chromatography analysis Methods 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 102000055895 human ACVR1C Human genes 0.000 description 9
- 102000018358 immunoglobulin Human genes 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 102100028726 Bone morphogenetic protein 10 Human genes 0.000 description 8
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 8
- 101000695367 Homo sapiens Bone morphogenetic protein 10 Proteins 0.000 description 8
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 8
- 230000004988 N-glycosylation Effects 0.000 description 8
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 8
- 108010023079 activin B Proteins 0.000 description 8
- 230000004071 biological effect Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 230000002209 hydrophobic effect Effects 0.000 description 8
- 102100022525 Bone morphogenetic protein 6 Human genes 0.000 description 7
- 102100040898 Growth/differentiation factor 11 Human genes 0.000 description 7
- 102100040892 Growth/differentiation factor 2 Human genes 0.000 description 7
- 102100035364 Growth/differentiation factor 3 Human genes 0.000 description 7
- 102100035363 Growth/differentiation factor 7 Human genes 0.000 description 7
- 101000693801 Homo sapiens Anti-Muellerian hormone type-2 receptor Proteins 0.000 description 7
- 101000899390 Homo sapiens Bone morphogenetic protein 6 Proteins 0.000 description 7
- 101000893585 Homo sapiens Growth/differentiation factor 2 Proteins 0.000 description 7
- 101001023986 Homo sapiens Growth/differentiation factor 3 Proteins 0.000 description 7
- 101001023968 Homo sapiens Growth/differentiation factor 7 Proteins 0.000 description 7
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 7
- 150000001720 carbohydrates Chemical group 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 239000004474 valine Substances 0.000 description 7
- 229960004295 valine Drugs 0.000 description 7
- CJLHTKGWEUGORV-UHFFFAOYSA-N Artemin Chemical compound C1CC2(C)C(O)CCC(=C)C2(O)C2C1C(C)C(=O)O2 CJLHTKGWEUGORV-UHFFFAOYSA-N 0.000 description 6
- 102100024506 Bone morphogenetic protein 2 Human genes 0.000 description 6
- 102100024505 Bone morphogenetic protein 4 Human genes 0.000 description 6
- 102100035368 Growth/differentiation factor 6 Human genes 0.000 description 6
- 101000762366 Homo sapiens Bone morphogenetic protein 2 Proteins 0.000 description 6
- 101000762379 Homo sapiens Bone morphogenetic protein 4 Proteins 0.000 description 6
- 101001023964 Homo sapiens Growth/differentiation factor 6 Proteins 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 229960000310 isoleucine Drugs 0.000 description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- VYXXMAGSIYIYGD-NWAYQTQBSA-N propan-2-yl 2-[[[(2R)-1-(6-aminopurin-9-yl)propan-2-yl]oxymethyl-(pyrimidine-4-carbonylamino)phosphoryl]amino]-2-methylpropanoate Chemical compound CC(C)OC(=O)C(C)(C)NP(=O)(CO[C@H](C)Cn1cnc2c(N)ncnc12)NC(=O)c1ccncn1 VYXXMAGSIYIYGD-NWAYQTQBSA-N 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 6
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 5
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 5
- 101000970954 Homo sapiens Activin receptor type-2A Proteins 0.000 description 5
- 101000712674 Homo sapiens TGF-beta receptor type-1 Proteins 0.000 description 5
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 5
- 102000049307 human ACVR1B Human genes 0.000 description 5
- 102000052842 human TGFBR1 Human genes 0.000 description 5
- 230000003834 intracellular effect Effects 0.000 description 5
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000017854 proteolysis Effects 0.000 description 5
- 210000002027 skeletal muscle Anatomy 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 102220556625 Acyl-coenzyme A thioesterase 11_K55A_mutation Human genes 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 4
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 4
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 4
- 101710194452 Growth/differentiation factor 11 Proteins 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 206010028289 Muscle atrophy Diseases 0.000 description 4
- 230000004989 O-glycosylation Effects 0.000 description 4
- 102000043168 TGF-beta family Human genes 0.000 description 4
- 108091085018 TGF-beta family Proteins 0.000 description 4
- 125000003368 amide group Chemical group 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000000423 cell based assay Methods 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 229940028334 follicle stimulating hormone Drugs 0.000 description 4
- 102000054953 human ACVR1 Human genes 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000003716 mesoderm Anatomy 0.000 description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 4
- 201000000585 muscular atrophy Diseases 0.000 description 4
- 201000006938 muscular dystrophy Diseases 0.000 description 4
- 150000008163 sugars Chemical class 0.000 description 4
- 208000011580 syndromic disease Diseases 0.000 description 4
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 4
- 102100026376 Artemin Human genes 0.000 description 3
- 101710205806 Artemin Proteins 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 102100028727 Bone morphogenetic protein 15 Human genes 0.000 description 3
- 102100024504 Bone morphogenetic protein 3 Human genes 0.000 description 3
- 102100022526 Bone morphogenetic protein 5 Human genes 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 101100179813 Drosophila melanogaster Actbeta gene Proteins 0.000 description 3
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 3
- 102000016970 Follistatin Human genes 0.000 description 3
- 108010014612 Follistatin Proteins 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- 102100035379 Growth/differentiation factor 5 Human genes 0.000 description 3
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 3
- 108010054147 Hemoglobins Proteins 0.000 description 3
- 102000001554 Hemoglobins Human genes 0.000 description 3
- 101000695360 Homo sapiens Bone morphogenetic protein 15 Proteins 0.000 description 3
- 101000762375 Homo sapiens Bone morphogenetic protein 3 Proteins 0.000 description 3
- 101000899388 Homo sapiens Bone morphogenetic protein 5 Proteins 0.000 description 3
- 101000893545 Homo sapiens Growth/differentiation factor 11 Proteins 0.000 description 3
- 101001023988 Homo sapiens Growth/differentiation factor 5 Proteins 0.000 description 3
- 101000692878 Homo sapiens Regulator of MON1-CCZ1 complex Proteins 0.000 description 3
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 102100021584 Neurturin Human genes 0.000 description 3
- 108010015406 Neurturin Proteins 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 102000046299 Transforming Growth Factor beta1 Human genes 0.000 description 3
- 101800002279 Transforming growth factor beta-1 Proteins 0.000 description 3
- 102000056172 Transforming growth factor beta-3 Human genes 0.000 description 3
- 108090000097 Transforming growth factor beta-3 Proteins 0.000 description 3
- 210000000577 adipose tissue Anatomy 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 230000022159 cartilage development Effects 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000022811 deglycosylation Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000037257 muscle growth Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 230000022379 skeletal muscle tissue development Effects 0.000 description 3
- 230000000087 stabilizing effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 150000003573 thiols Chemical class 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- UBWXUGDQUBIEIZ-UHFFFAOYSA-N (13-methyl-3-oxo-2,6,7,8,9,10,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-17-yl) 3-phenylpropanoate Chemical compound CC12CCC(C3CCC(=O)C=C3CC3)C3C1CCC2OC(=O)CCC1=CC=CC=C1 UBWXUGDQUBIEIZ-UHFFFAOYSA-N 0.000 description 2
- 102000005606 Activins Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 206010006895 Cachexia Diseases 0.000 description 2
- 102220578645 Chorion-specific transcription factor GCMb_N65A_mutation Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 2
- 102100029379 Follistatin-related protein 3 Human genes 0.000 description 2
- 102100039939 Growth/differentiation factor 8 Human genes 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101001062529 Homo sapiens Follistatin-related protein 3 Proteins 0.000 description 2
- 108091006905 Human Serum Albumin Proteins 0.000 description 2
- 102000008100 Human Serum Albumin Human genes 0.000 description 2
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 2
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 2
- 101100369076 Mus musculus Tdgf1 gene Proteins 0.000 description 2
- 208000029578 Muscle disease Diseases 0.000 description 2
- 108010056852 Myostatin Proteins 0.000 description 2
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 2
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 2
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 2
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 2
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 2
- 102000044547 Nodal Human genes 0.000 description 2
- 108700024442 Nodal Proteins 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 208000001132 Osteoporosis Diseases 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102220558380 Pre-mRNA-splicing factor ATP-dependent RNA helicase PRP16_F82K_mutation Human genes 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 241000220317 Rosa Species 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 102000007374 Smad Proteins Human genes 0.000 description 2
- 108010007945 Smad Proteins Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102000011117 Transforming Growth Factor beta2 Human genes 0.000 description 2
- 101800000304 Transforming growth factor beta-2 Proteins 0.000 description 2
- 108010051765 Type I Bone Morphogenetic Protein Receptors Proteins 0.000 description 2
- 102000000523 Type II Activin Receptors Human genes 0.000 description 2
- 108010041546 Type II Activin Receptors Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- 208000007502 anemia Diseases 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 125000005587 carbonate group Chemical group 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 230000000254 damaging effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 2
- 230000007783 downstream signaling Effects 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000001125 extrusion Methods 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 150000002338 glycosides Chemical class 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 229960002591 hydroxyproline Drugs 0.000 description 2
- 238000005462 in vivo assay Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000000893 inhibin Substances 0.000 description 2
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 description 2
- 150000002614 leucines Chemical class 0.000 description 2
- 150000002632 lipids Chemical group 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 229950006780 n-acetylglucosamine Drugs 0.000 description 2
- 230000004766 neurogenesis Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000011164 ossification Effects 0.000 description 2
- 201000008482 osteoarthritis Diseases 0.000 description 2
- 210000000963 osteoblast Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000000059 patterning Methods 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 102220157866 rs147372618 Human genes 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- ITMCEJHCFYSIIV-UHFFFAOYSA-N triflic acid Chemical compound OS(=O)(=O)C(F)(F)F ITMCEJHCFYSIIV-UHFFFAOYSA-N 0.000 description 2
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 229910052720 vanadium Inorganic materials 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 238000011100 viral filtration Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 1
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- CVOFKRWYWCSDMA-UHFFFAOYSA-N 2-chloro-n-(2,6-diethylphenyl)-n-(methoxymethyl)acetamide;2,6-dinitro-n,n-dipropyl-4-(trifluoromethyl)aniline Chemical compound CCC1=CC=CC(CC)=C1N(COC)C(=O)CCl.CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O CVOFKRWYWCSDMA-UHFFFAOYSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- 208000037415 AIDS wasting syndrome Diseases 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 102000018918 Activin Receptors Human genes 0.000 description 1
- 108010052946 Activin Receptors Proteins 0.000 description 1
- 101710173011 Activin receptor type-1B Proteins 0.000 description 1
- 101710173005 Activin receptor type-1C Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 208000000103 Anorexia Nervosa Diseases 0.000 description 1
- 241000256844 Apis mellifera Species 0.000 description 1
- 244000186140 Asperula odorata Species 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 201000006935 Becker muscular dystrophy Diseases 0.000 description 1
- 208000031648 Body Weight Changes Diseases 0.000 description 1
- 208000010392 Bone Fractures Diseases 0.000 description 1
- 102100028728 Bone morphogenetic protein 1 Human genes 0.000 description 1
- 108090000654 Bone morphogenetic protein 1 Proteins 0.000 description 1
- 101000937267 Bos taurus Activin receptor type-2B Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241000202252 Cerberus Species 0.000 description 1
- 102220601920 Cerebral dopamine neurotrophic factor_S169N_mutation Human genes 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000004420 Creatine Kinase Human genes 0.000 description 1
- 108010042126 Creatine kinase Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100037241 Endoglin Human genes 0.000 description 1
- 108010036395 Endoglin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010074864 Factor XI Proteins 0.000 description 1
- 102220568165 Fatty acid-binding protein, adipocyte_P76L_mutation Human genes 0.000 description 1
- 108010087819 Fc receptors Proteins 0.000 description 1
- 102000009109 Fc receptors Human genes 0.000 description 1
- 101150050927 Fcgrt gene Proteins 0.000 description 1
- 108010012820 Follistatin-Related Proteins Proteins 0.000 description 1
- 102000019203 Follistatin-Related Proteins Human genes 0.000 description 1
- 206010017076 Fracture Diseases 0.000 description 1
- 208000036119 Frailty Diseases 0.000 description 1
- 235000008526 Galium odoratum Nutrition 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 208000002705 Glucose Intolerance Diseases 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 208000003577 HIV wasting syndrome Diseases 0.000 description 1
- 101000961145 Homo sapiens Immunoglobulin heavy constant gamma 3 Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 102000009490 IgG Receptors Human genes 0.000 description 1
- 108010073807 IgG Receptors Proteins 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 102100039348 Immunoglobulin heavy constant gamma 3 Human genes 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 206010024305 Leukaemia monocytic Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000043129 MHC class I family Human genes 0.000 description 1
- 108091054437 MHC class I family Proteins 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 208000029725 Metabolic bone disease Diseases 0.000 description 1
- 102100026632 Mimecan Human genes 0.000 description 1
- 102100025748 Mothers against decapentaplegic homolog 3 Human genes 0.000 description 1
- 101710143111 Mothers against decapentaplegic homolog 3 Proteins 0.000 description 1
- 208000026072 Motor neurone disease Diseases 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 208000010428 Muscle Weakness Diseases 0.000 description 1
- 208000021642 Muscular disease Diseases 0.000 description 1
- 206010028372 Muscular weakness Diseases 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000002481 Myositis Diseases 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102000007072 Nerve Growth Factors Human genes 0.000 description 1
- 102100037224 Noncompact myelin-associated protein Human genes 0.000 description 1
- 101710184695 Noncompact myelin-associated protein Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 208000011623 Obstructive Lung disease Diseases 0.000 description 1
- 239000004235 Orange GGN Substances 0.000 description 1
- 101800002327 Osteoinductive factor Proteins 0.000 description 1
- 206010049088 Osteopenia Diseases 0.000 description 1
- 101150012394 PHO5 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010030544 Peptidyl-Lys metalloendopeptidase Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100490435 Rattus norvegicus Acvr1c gene Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 208000005770 Secondary Hyperparathyroidism Diseases 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 102100033456 TGF-beta receptor type-1 Human genes 0.000 description 1
- 108090001109 Thermolysin Proteins 0.000 description 1
- 102000002933 Thioredoxin Human genes 0.000 description 1
- 208000026062 Tissue disease Diseases 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108010011702 Transforming Growth Factor-beta Type I Receptor Proteins 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 102000019044 Type I Bone Morphogenetic Protein Receptors Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 206010047626 Vitamin D Deficiency Diseases 0.000 description 1
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000003098 androgen Substances 0.000 description 1
- 208000022531 anorexia Diseases 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000010056 antibody-dependent cellular cytotoxicity Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 206010003549 asthenia Diseases 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 230000004579 body weight change Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 102220370152 c.131G>C Human genes 0.000 description 1
- 102220384347 c.298A>G Human genes 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 208000003295 carpal tunnel syndrome Diseases 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000006369 cell cycle progression Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 206010061428 decreased appetite Diseases 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 230000004821 effect on bone Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 210000001900 endoderm Anatomy 0.000 description 1
- 230000009786 epithelial differentiation Effects 0.000 description 1
- 230000010437 erythropoiesis Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 208000020694 gallbladder disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 201000003617 glucocorticoid-induced osteoporosis Diseases 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 230000002710 gonadal effect Effects 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000011132 hemopoiesis Effects 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 108091008042 inhibitory receptors Proteins 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 230000017687 left/right axis specification Effects 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 210000000982 limb bud Anatomy 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 230000004132 lipogenesis Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000012900 molecular simulation Methods 0.000 description 1
- 201000006894 monocytic leukemia Diseases 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 208000005264 motor neuron disease Diseases 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 230000009753 muscle formation Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 208000018360 neuromuscular disease Diseases 0.000 description 1
- 208000013315 neuromuscular junction disease Diseases 0.000 description 1
- 230000006576 neuronal survival Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 208000030212 nutrition disease Diseases 0.000 description 1
- 210000001706 olfactory mucosa Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000007261 regionalization Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 102220220520 rs1060503090 Human genes 0.000 description 1
- 102220278863 rs1395998044 Human genes 0.000 description 1
- 102220125997 rs141863326 Human genes 0.000 description 1
- 102220288227 rs141863326 Human genes 0.000 description 1
- 102220039284 rs199473359 Human genes 0.000 description 1
- 102220036189 rs273585616 Human genes 0.000 description 1
- 102220058274 rs45617634 Human genes 0.000 description 1
- 102200108223 rs869312782 Human genes 0.000 description 1
- 208000001076 sarcopenia Diseases 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 210000003594 spinal ganglia Anatomy 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 125000005931 tert-butyloxycarbonyl group Chemical group [H]C([H])([H])C(OC(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 230000004584 weight gain Effects 0.000 description 1
- 235000019786 weight gain Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/71—Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/06—Antianaemics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/30—Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Animal Behavior & Ethology (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Cell Biology (AREA)
- Molecular Biology (AREA)
- Toxicology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Diabetes (AREA)
- Hematology (AREA)
- Neurology (AREA)
- Physical Education & Sports Medicine (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Epidemiology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
특정 양태에서, 본 발명은 적혈구 또는 뼈, 연골, 근육, 지방 및/또는 신경 조직과 같은 조직의 성장을 조절 (촉진 또는 억제)하기 위한 조성물 및 방법을 제공한다. 본 발명은 또한 ActRIIB 단백질 및/또는 ActRIIB 리간드의 활성을 조절하는 화합물을 스크리닝하는 방법을 제공한다. 본원에서 제공된 조성물 및 방법은 ActRIIB 단백질 및/또는 ActRIIB 리간드의 비정상적인 활성과 관련된 질환을 치료하는데 유용하다.
Description
관련 출원들에 대한 교차-참조
본 출원은 2016년 10월 5일자로 제출된 미국 가출원 일련번호 62/404,718에 대한 우선권을 주장한다. 상기 출원 명세서는 이의 전문이 본 명세서의 참고자료에 편입된다.
발명의 배경
형질변환 성장 인자-베타 (TGF-베타) 슈퍼패밀리는 공통의 서열 요소들과 구조적 모티프를 공유하는 다양한 성장 인자들을 함유한다. 이들 단백질은 척추동물과 비척추동물 모두에서 대규모 다양한 세포 유형에서 생물학적 효과를 발휘하는 것으로 알려져 있다. 슈퍼패밀리의 구성원들은 패턴 형성 및 조직 특화에 있어서 배발달 동안 중요한 기능을 수행하고, 지질생성, 근육 형성, 연골 형성, 심장 형성, 조혈, 신경 발생 및 상피 세포 분화를 비롯한 다양한 분화 과정에 영향을 줄 수 있다. 이 패밀리는 BMP/GDF와 TGF-베타/액티빈/BMP10 브랜치로 두 가지로 크게 나뉘어 지는데, 그 구성원들은 다양하고 상보적인 효과를 지니고 있다. TGF-베타 패밀리의 구성요소의 활성을 조절함으로써, 유기체에서 유의적인 생리학적 변화를 야기시키는 것이 대개 가능하다. 예를 들면, 피에몬테(Piedmontese) 및 벨기에 푸른 소(Blue cattle) 품종은 근육량의 상당한 증가를 야기하는 GDF8 (미오스태틴으로도 불림) 유전에 기능-소실(loss-of-function) 돌연변이를 휴대한다. Grobet et al., Nat Genet. 1997, 17(1):71-4. 더욱이, 인간에 있어서, GDF8의 비활성 대립유전자는 증가된 근육량과 연관있으며, 보고에 따르면 예외적으로 강한 힘과 관련있다. Schuelke et al., N Engl J Med 2004, 350:2682-8.
적혈구 수준, 뼈, 연골 및 기타 조직의 변화는 적절한 TGF-베타 계열 구성원이 중재하는 신호를 항진하거나 또는 길항함으로써 이루어질 수 있다. 따라서, TGF-베타 신호생성의 강력한 조절제로서 작용하는 약제에 대한 필요성이 존재한다.
발명의 요약
특정 양태에서, 본 명세서는 변이체 ActRIIB 폴리펩티드, 구체적으로 변이체 ActRIIB 동종다량체 단백질 및 변이체 ActRIIB 이종다량체 단백질을 제시한다. 실시예들에 의해 증명된 바와 같이, 하나 또는 그 이상의 ActRIIB-결합 리간드에 대하여 변경된 결합친화력을 나타내는 여러 변형된 ActRIIB 폴리펩티드가 확인되었다. 리간드 결합 활성을 감소시키고, 증가시키는 ActRIIB 변이체들이 확인되었다. 이러한 변이체는 다양한 용도에서 상응하는 비변형된 ActRIIB 폴리펩티드에 비해 선택적으로 리간드를 증가 또는 감소 시키는데 특히 유용할 수 있다. 예를 들면, 변이체 ActRIIB 폴리펩티드의 일부가 예를 들어, 적혈구 및 헤모글로빈 수준을 증가시킬 뿐만 아니라 체중 (예: 근육량)을 증가시키는 능력을 비롯한, 다양한 생체 내 효과를 갖는다는 것이 실시예들에서 추가로 입증된다. 따라서, 변이체 ActRIIB 폴리펩티드는 예를 들어, 본원에 기술된 것을 포함하는 다양한 치료학적 적용에 유용해야 한다.
특정 양태에서, 본 명세서는 서열 번호: 2의 아미노산 20-29중 어느 하나 (가령, 20, 21, 22, 23, 24, 25, 26, 27, 28, 또는 29)에서 시작하고, 그리고 서열 번호: 2의 아미노산 109-134중 어느 하나 (가령, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 또는 134)에서 종료되는 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 변이체 ActRIIB 폴리펩티드, 이때 상기 폴리펩티드는 K55, F82, L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82로 구성된 군에서 선택된 서열 번호: 2의 위치에서 하나 또는 그 이상의 아미노산 치환을 포함하는 변이체 ActRIIB 폴리펩티드, 뿐만 아니라 하나 또는 그 이상의 이러한 ActRIIB 폴리펩티드를 포함하는 이종다량체 복합체에 관계한다. 일부 구체예들에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 29-109에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 2의 25-131에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 2의 20-134에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 53의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 12의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 5의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 K55에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 K55A이다. 일부 구체예들에서, 상기 치환은 K55E이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 L79D이다. 일부 구체예들에서, 상기 치환은 L79E이다. 일부 구체예들에서, 상기 치환은 L79P이다. 일부 구체예들에서, 상기 치환은 L79A이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 F82에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 F82I이다. 일부 구체예들에서, 상기 치환은 F82K이다. 일부 구체예들에서, 상기 치환은 F82A이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 A24에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 A24N이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 K74에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74F이다. 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74I이다. 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74Y이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 D80에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 D80A이다. 일부 구체예들에서, 상기 치환은 D80F이다. 일부 구체예들에서, 상기 치환은 D80K이다. 일부 구체예들에서, 상기 치환은 D80G이다. 일부 구체예들에서, 상기 치환은 D80M이다. 일부 구체예들에서, 상기 치환은 D80I이다. 일부 구체예들에서, 상기 치환은 D80N이다. 일부 구체예들에서, 상기 치환은 D80R이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 R64에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 R64K이다. 일부 구체예들에서, 상기 치환은 R64N이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 P129에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 P129S이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 P130에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 P130A이다. 일부 구체예들에서, 상기 치환은 P130R이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 E37에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 E37A이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 R40에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 R40AD54이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 D54에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 D54AD54이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 R56에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 R56A이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 W78에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 W78A이다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 31의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 K55에 상응하는 아미노산 위치에서 알라닌을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 33의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 K55에 상응하는 아미노산 위치에서 알라닌을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 34의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 K55에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 36의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 K55에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 37의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 F82에 상응하는 아미노산 위치에서 이소류신을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 39의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 F82에 상응하는 아미노산 위치에서 이소류신을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 40의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 F82에 상응하는 아미노산 위치에서 리신을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 42의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 F82에 상응하는 아미노산 위치에서 리신을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 43의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 45의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 46의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 48의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 49의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 50의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 51의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 상기 ActRIIB 폴리펩티드는 서열 번호: 52의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 변이체 ActRIIB 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 글루탐산을 포함한다.
특정 양태에서, 본 명세서의 변이체 ActRIIB 폴리펩티드는 동종이량체를 형성한다. 일부 구체예들에서, 변이체 ActRIIB 폴리펩티드는 공유적 상호작용을 통하여 이종이량체를 형성할 수 있다. 일부 구체예들에서, 변이체 ActRIIB 폴리펩티드는 비-공유적 상호작용을 통하여 이종이량체를 형성할 수 있다. 일부 구체예들에서, 변이체 ActRIIB 폴리펩티드는 공유적 상호작용 및 비-공유적 상호작용 모두를 통하여 이종이량체를 형성할 수 있다.
특정 양태에서, 동종다량체(가령, 동종이량체)를 포함한, 변이체 ActRIIB 폴리펩티드는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드에 결합한다. 일부 구체예들에서, 동종다량체(가령, 동종이량체)를 포함한, 변이체 ActRIIB 폴리펩티드는 적어도 1 x 10-7 M의 KD 로 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드에 결합한다. 일부 구체예들에서, 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드는 다음으로 구성된 군에서 선택된다: BMP6, BMP7, BMP9, BMP10, GDF3, GDF7, GDF8, GDF11, GDF15, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 AE, 액티빈 BC, 및 액티빈 BE.
특정 양태에서, 동종다량체(가령, 동종이량체)를 포함한, 변이체 ActRIIB 폴리펩티드는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드를 억제한다. 일부 구체예들에서, 동종다량체(가령, 동종이량체)를 포함한, 변이체 ActRIIB 폴리펩티드는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드의 신호생성을 억제한다. 일부 구체예들에서, 변이체 ActRIIB 폴리펩티드는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드의 Smad 신호생성을 억제한다. 일부 구체예들에서, 동종다량체(가령, 동종이량체)를 포함한, 변이체 ActRIIB 폴리펩티드는 세포-기반 검정에서 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드의 신호생성을 억제한다. 일부 구체예들에서, 동종다량체(가령, 동종이량체)를 포함한, 변이체 ActRIIB 폴리펩티드는 다음으로 구성된 군에서 선택된 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드를 억제한다: BMP6, BMP7, BMP9, BMP10, GDF3, GDF7, GDF8, GDF11, GDF15, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 AE, 액티빈 BC, 및 액티빈 BE.
특정 양태에서, 본 명세서는 적어도 하나의 변이체 ActRIIB 폴리펩티드 (가령, 본 명세서에서 기술된 하나 또는 그 이상의 변이체 ActRIIB 폴리펩티드)를 포함하는 이종다량체에 관계한다. 예를 들면, 일부 구체예들에서, 본 명세서의 이종다량체 단백질은 제 1 ActRIIB 폴리펩티드 및 제 2 ActRIIB 폴리펩티드를 포함하고, 이때 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 20-29중 어느 하나 (가령, 20, 21, 22, 23, 24, 25, 26, 27, 28, 또는 29)에서 시작하고, 그리고 서열 번호: 2의 아미노산 109-134중 어느 하나 (가령, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 또는 134)에서 종료되는 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하고, 그리고 A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82로 구성된 군에서 선택된 서열 번호: 2 아미노산에 상응하는 위치에서 하나 또는 그 이상의 아미노산 치환을 포함하며, 이때 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 20-29중 어느 하나 (가령, 20, 21, 22, 23, 24, 25, 26, 27, 28, 또는 29)에서 시작하고, 그리고 서열 번호: 2의 아미노산 109-134중 어느 하나 (가령, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 또는 134)에서 종료되는 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하고, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드와 비교하여 상이한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 아미노산 29-109에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 서열 번호: 2의 29-109에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 25-131에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 서열 번호: 2의 25-131에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 20-134에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 서열 번호: 2의 25-131에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 53의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 서열 번호: 53의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 5의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 서열 번호: 5의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 12의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 서열 번호: 12의 아미노산 서열에 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 K55에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 K55A이다. 일부 구체예들에서, 상기 치환은 K55E이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 L79에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 L79D이다. 일부 구체예들에서, 상기 치환은 L79E이다. 일부 구체예들에서, 상기 치환은 L79P이다. 일부 구체예들에서, 상기 치환은 L79A이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 F82에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 F82I이다. 일부 구체예들에서, 상기 치환은 F82K이다. 일부 구체예들에서, 상기 치환은 F82A이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 A24에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 A24N이다. 일부 구체예들에서, 상기 폴리펩티드는 서열 번호: 2의 K74에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74F이다. 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74I이다. 일부 구체예들에서, 상기 치환은 K74A이다. 일부 구체예들에서, 상기 치환은 K74Y이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 D80에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 D80A이다. 일부 구체예들에서, 상기 치환은 D80F이다. 일부 구체예들에서, 상기 치환은 D80K이다. 일부 구체예들에서, 상기 치환은 D80G이다. 일부 구체예들에서, 상기 치환은 D80M이다. 일부 구체예들에서, 상기 치환은 D80I이다. 일부 구체예들에서, 상기 치환은 D80N이다. 일부 구체예들에서, 상기 치환은 D80R이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 R64에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 R64K이다. 일부 구체예들에서, 상기 치환은 R64N이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 P129에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 P129S이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 P130에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 P130A이다. 일부 구체예들에서, 상기 치환은 P130R이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 E37에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 E37A이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 R40에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 R40AD54이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 D54에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 D54AD54이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 R56에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 R56A이다. 일부 구체예들에서, 상기 제 1 폴리펩티드는 서열 번호: 2의 W78에 상응하는 아미노산 위치에서 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 치환은 W78A이다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82로 구성된 군에서 선택된 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 예를 들면, 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 서열에 대하여 A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, K55A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A로 구성된 군에서 선택된 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형과 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서의 ActRIIB 폴리펩티드는 변이체 ActRIIB 폴리펩티드를 포함하여, ActRIIB 폴리펩티드 도메인과 하나 또는 그 이상의 이종성(heterologous) 도메인을 포함하는 융합 단백질이다. 일부 구체예들에서, ActRIIB 폴리펩티드는 ActRIIB-Fc 융합 단백질이다. 일부 구체예들에서, ActRIIB-Fc 융합 단백질은 상기 ActRIIB 폴리펩티드 도메인과 하나 또는 그 이상의 이종성 도메인 또는 Fc 도메인 사이에 위치한 링커 도메인을 더 포함한다. 일부 구체예들에서, 상기 링커 도메인은 다음으로부터 선택된다: TGGG, TGGGG, SGGGG, GGGGS, GGG, GGGG, SGGG, 및 GGGGS.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 13의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 13의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 14의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 14의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 15의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 15의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 16의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 16의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 17의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 17의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 18의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 19의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 19의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 18의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 20의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 21의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 21의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 20의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 22의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 23의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 23의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 22의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 22의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 25의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 25의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 24의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 26의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 27의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 27의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 26의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관계하며, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 28의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 29의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 132에 시스테인, 아미노산 위치 138에 글루탐산, 아미노산 위치 144에 트립토판, 그리고 아미노산 위치 217에 아스파르트산을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 127에 시스테인, 아미노산 위치 144에 세린, 아미노산 위치 146에 알라닌, 아미노산 위치 162에 아르기닌, 아미노산 위치 179에 아르기닌, 그리고 아미노산 위치 185에 발린을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관한 것이며, 이때 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 28의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 29의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 132에 시스테인, 아미노산 위치 138에 글루탐산, 아미노산 위치 144에 트립토판, 그리고 아미노산 위치 217에 아스파르트산을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 127에 시스테인, 아미노산 위치 144에 세린, 위치 146에 알라닌, 아미노산 위치 162에 아르기닌, 아미노산 위치 179에 아르기닌, 그리고 아미노산 위치 185에 발린을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관한 것이며, 이때 상기 제 2 ActRIIB-Fc 융합 단백질, 이때 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 30의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 23의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 132에 시스테인, 아미노산 위치 144에 트립토판, 그리고 아미노산 위치 435에 아르기닌을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 127에 시스테인, 아미노산 위치 144에 세린, 아미노산 위치 146에 알라닌, 그리고 아미노산 위치 185에 발린을 포함한다.
특정 양태에서, 본 명세서는 제 1 ActRIIB-Fc 융합 단백질 및 제 2 ActRIIB-Fc 융합 단백질을 포함하는 ActRIIB 이종다량체 단백질에 관한 것이며, 이때 상기 제 2 ActRIIB-Fc 융합 단백질은 서열 번호: 30의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함하며, 그리고 상기 제 1 ActRIIB-Fc 융합 단백질은 서열 번호: 23의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 Fc 도메인을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 132에 시스테인, 아미노산 위치 144에 트립토판, 그리고 아미노산 위치 435에 아르기닌을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB-Fc 융합 단백질 Fc 도메인은 아미노산 위치 127에 시스테인, 아미노산 위치 144에 세린, 아미노산 위치 146에 알라닌, 그리고 아미노산 위치 185에 발린을 포함한다.
특정 양태에서, 본 명세서는 서열 번호: 33의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 1 ActRIIB 폴리펩티드, 그리고 서열 번호: 5의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 2 ActRIIB 폴리펩티드를 포함하는 이종다량체에 관한 것이며, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드의 아미노산 서열을 포함하지 않는다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 알라닌을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 알라닌을 포함하지 않는다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 리신을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서는 서열 번호: 36의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 1 ActRIIB 폴리펩티드, 그리고 서열 번호: 5의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 2 ActRIIB 폴리펩티드를 포함하는 이종다량체에 관한 것이며, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드의 아미노산 서열을 포함하지 않는다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 글루탐산을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 글루탐산을 포함하지 않는다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 리신을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서는 서열 번호: 39의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 1 ActRIIB 폴리펩티드, 그리고 서열 번호: 5의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 2 ActRIIB 폴리펩티드를 포함하는 이종다량체에 관한 것이며, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드의 아미노산 서열을 포함하지 않는다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 82에 상응하는 아미노산 위치에 이소류신을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 82에 상응하는 아미노산 위치에 이소류신을 포함하지 않는다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 페닐알라닌을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2에서 L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78및 D80중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, 그리고 D80R. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2에서 L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, 및 D80중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, 그리고 D80R. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서는 서열 번호: 42의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 1 ActRIIB 폴리펩티드, 그리고 서열 번호: 5의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 2 ActRIIB 폴리펩티드를 포함하는 이종다량체에 관한 것이며, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드의 아미노산 서열을 포함하지 않는다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 82에 상응하는 아미노산 위치에 리신을 포함한다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 82에 상응하는 아미노산 위치에 리신을 포함하지 않는다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 55에 상응하는 아미노산 위치에 페닐알라닌을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2에서 L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78및 D80중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, 그리고 D80R. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2에서 L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, 및 D80중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79A, L79D, L79E, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, 그리고 D80R. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서는 서열 번호: 45의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 1 ActRIIB 폴리펩티드, 그리고 서열 번호: 48의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 2 ActRIIB 폴리펩티드를 포함하는 이종다량체에 관한 것이며, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드의 아미노산 서열을 포함하지 않는다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 79에 상응하는 아미노산 위치에 산성 아미노산을 포함한다. 일부 구체예들에서, 상기 산성 아미노산은 아스파르트산이다. 일부 구체예들에서, 상기 산성 아미노산은 글루탐산이다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 79에 상응하는 아미노산 위치에 산성 아미노산 (가령, 아스파르트산 또는 글루탐산)을 포함하지 않는다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 79에 상응하는 아미노산 위치에 류신을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 촉진시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드 및/또는 상기 제 2 ActRIIB 폴리펩티드는 이종다량체 형성을 억제시키는 하나 또는 그 이상의 아미노산 변형을 포함한다. 일부 구체예들에서, 상기 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서는 서열 번호: 50의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 1 ActRIIB 폴리펩티드, 그리고 서열 번호: 52의 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 제 2 ActRIIB 폴리펩티드를 포함하는 이종다량체에 관한 것이며, 이때 상기 제 1 ActRIIB 폴리펩티드는 상기 제 2 ActRIIB 폴리펩티드의 아미노산 서열을 포함하지 않는다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 79에 상응하는 아미노산 위치에 산성 아미노산을 포함한다. 일부 구체예들에서, 상기 산성 아미노산은 아스파르트산이다. 일부 구체예들에서, 상기 산성 아미노산은 글루탐산이다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 79에 상응하는 아미노산 위치에 산성 아미노산 (가령, 아스파르트산 또는 글루탐산)을 포함하지 않는다. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2의 아미노산 위치 79에 상응하는 아미노산 위치에 류신을 포함한다. 일부 구체예들에서, 상기 제 1 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, L79P, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A. 일부 구체예들에서, 상기 제 2 ActRIIB 폴리펩티드는 서열 번호: 2에서 F82, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82중 어느 하나에 상응하는 아미노산 위치에서 하나 또는 그 이상의 아미노산 치환을 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 아미노산 치환은 다음으로 구성된 군에서 독립적으로 선택된다: A24N, K74A, R64K, R64N, K74A, P129S, P130A, P130R, E37A, R40A, D54A, R56A, K74F, K74I, K74Y, W78A, D80A, D80F, D80G, D80I, D80K, D80M, D80M, D80N, D80R, 및 F82A.
특정 구체예들에서, 본 명세서는 본원에 개시된 임의의 ActRIIB 폴리펩티드와 다음으로 이루어진 군으로부터 선택된 제 2 폴리펩티드를 포함하는 이종다량체 단백질을 제공한다: ALK1, ALK2, ALK3, ALK4, ALK5, ALK6, ALK7, ActRIIA, TGFBRII, BMPRII, 그리고 MISRII 폴리펩티드, 또는 이의 기능적 단편들. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK1 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK1 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 54에 대하여 최소한 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK1 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 54, 55, 56, 57, 60, 그리고 61중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK2 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK2 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 64 또는 65의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK2 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 64, 65, 66, 67, 70, 그리고 71중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK3 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK3 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 74의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK3 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 74, 75, 76, 77, 80, 또는 81의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK4 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK4 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 84 또는 85의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK4 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 84, 86, 85, 87, 88, 89, 92, 및 93의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK5 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK5 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 96 또는 97의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK5 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 96, 98, 97, 99, 100, 101, 104, 및 105의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK6 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK6 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 108 또는 110의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK6 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 108, 109, 110, 111, 112, 113, 116 및 117의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK7 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK7 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 120, 121, 또는 122의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK7 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 120, 123, 124, 125, 121, 126, 122, 127, 128, 129, 130, 133 및 134의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ActRIIA 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ActRIIA 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 137의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ActRIIA 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 137, 138, 139, 140, 141, 144 및 145의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 TGFBRII 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 TGFBRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 204의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 TGFBRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 161, 162, 160, 163, 164, 165, 166, 167, 172, 173, 174 및 175의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 BMPRII 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 BMPRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 148 또는 149의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 BMPRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 148, 150, 149, 151, 152, 153, 156, 그리고 157의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 MISRII 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 MISRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 180, 181, 또는 182의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 MISRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 180, 183, 181, 184, 182, 그리고 185145의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다.
특정 양태에서, 본 명세서의 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드에 결합한다. 일부 구체예들에서, 본 명세서의 이종다량체는 적어도 1 x 10-7 M의 KD 로 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드에 결합한다. 일부 구체예들에서, 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드는 다음으로 구성된 군에서 선택된다: BMP6, BMP7, BMP9, BMP10, GDF3, GDF7, GDF8, GDF11, GDF15, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 AE, 액티빈 BC, 및 액티빈 BE.
특정 양태에서, 본 명세서의 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드를 억제한다. 일부 구체예들에서, 본 명세서의 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드의 신호생성을 억제한다. 일부 구체예들에서, 본 명세서의 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드의 Smad 신호생성을 억제한다. 일부 구체예들에서, 본 명세서의 이종다량체는 세포-기반 검정에서 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드의 신호생성을 억제한다. 일부 구체예들에서, 본 명세서의 이종다량체는 다음으로 구성된 군에서 선택된 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드를 억제한다: BMP6, BMP7, BMP9, BMP10, GDF3, GDF7, GDF8, GDF11, GDF15, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 AE, 액티빈 BC, 및 액티빈 BE.
특정 양태에서, 본 명세서는 변이체 ActRIIB 폴리펩티드를 포함한 ActRIIB 폴리펩티드, 뿐만 아니라 상기의 것을 포함하는 동종다량체 및 이종다량체에 관계하며, 이때 상기 폴리펩티드는 다음으로 구성된 군에서 선택된 하나 또는 그 이상의 아미노산 변형을 포함한다: 당화된 아미노산, 페길화된 아미노산, 파르네실화된 아미노산, 아세틸화된 아미노산, 바이오티닐화된 아미노산, 그리고 지질 모이어티에 접합된 아미노산. 일부 구체예들에서, 본 명세서의 ActRIIB 폴리펩티드는 당화되고, CHO 세포에서 폴리펩티드로부터 얻을 수 있는 당화 패턴을 갖는다.
특정 구체예들에서, 본 명세서는 본원에 개시된 임의의 ActRIIB 폴리펩티드와 다음으로 이루어진 군으로부터 선택된 제 2 폴리펩티드를 포함하는 이종다량체 단백질을 제공한다: ALK1, ALK2, ALK3, ALK4, ALK5, ALK6, ALK7, ActRIIA, TGFBRII, BMPRII, 그리고 MISRII 폴리펩티드, 또는 이의 기능적 단편들. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK1 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK1 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 54에 대하여 최소한 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK1 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 54, 55, 56, 57, 58, 59, 60, 61, 62, 및 63중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK2 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK2 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 64 또는 65의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK2 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 64, 65, 66, 67, 68, 69, 70, 71, 72, 및 73의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK3 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK3 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 74의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK3 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 74, 75, 76, 77, 80, 또는 81의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK4 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK4 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 84 또는 85의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK4 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 84, 86, 85, 87, 88, 89, 90, 91, 92, 93, 94 및 95의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK5 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK5 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 96 또는 97의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK5 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 96, 98, 97, 99, 100, 101, 102, 103, 104, 105, 106, 및 107의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK6 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK6 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 108 또는 110의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK6 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 및 119의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ALK7 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ALK7 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 120, 121, 또는 122의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ALK7 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 120, 123, 124, 125, 121, 126, 122, 127, 128, 129, 130, 131, 132, 133, 134, 135, 및 136의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 ActRIIA 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 ActRIIA 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 137의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 ActRIIA 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 및 147의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 TGFBRII 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 TGFBRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 204의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 TGFBRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 161, 162, 160, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 및 179의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 BMPRII 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 BMPRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 148 또는 149의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 BMPRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 148, 150, 149, 151, 152, 153, 154, 155, 156, 157, 158 및 159의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 제 2 폴리펩티드는 MISRII 폴리펩티드 또는 이의 기능적 단편들이다. 일부 구체예들에서, 상기 MISRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 180, 181, 또는 182의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다. 일부 구체예들에서, 상기 MISRII 폴리펩티드 또는 이의 기능적 단편은 서열 번호: 180, 183, 181, 184, 182, 185, 186, 187, 188, 189, 190, 191, 192, 및 193의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열, 또는 이의 기능적 단편들을 포함한다.
특정 양태에서, 본 명세서는 변이체 ActRIIB 폴리펩티드, 뿐만 아니라 상기 동일한 것을 포함하는 동종다량체 및 이종다량체를 포함하는, ActRIIB 폴리펩티드와 약학적으로 수용가능한 담체를 포함하는 약학 제제에 관계한다. 일부 구체예들에서, 하나 또는 그 이상의 ActRIIB 이종이량체를 포함하는 약학 제제는 약 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 미만, 또는 약 1% 미만의 동종다량체를 포함한다.
특정 양태에서, 본 명세서는 본 명세서에서 기술된 바와 같이 상기 하나 또는 그 이상의 ActRIIB 폴리펩티드(들)에 대한 코딩 서열을 포함하는 단리된 및/또는 재조합 핵산에 관계한다. 예를 들면, 일부 구체예들에서, 본 명세서는 서열 번호: 3, 10, 31, 35, 38, 41, 44, 또는 47중 어느 하나에 상응하는 핵산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 단리된 및/또는 재조합 핵산에 관계한다. 일부 구체예들에서, 본 명세서의 단리된 및/또는 재조합 폴리뉴클레오티드 서열은 본 명세서에서 기술된 코딩 서열(가령, 서열 번호: 3, 10, 31, 35, 38, 41, 44, 또는 47중 어느 하나에 상응하는 핵산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 핵산)에 작동가능하도록 연계된 프로모터 서열을 포함한다. 일부 구체예들에서, 본 명세서는 본 명세서에서 기술된 단리된 및/또는 재조합 핵산(가령, 서열 번호: 3, 10, 31, 35, 38, 41, 44, 또는 47중 어느 하나에 상응하는 핵산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 핵산)을 포함하는 벡터에 관계한다. 일부 구체예들에서, 본 명세서는 본 명세서에서 기술된 단리된 및/또는 재조합 폴리뉴클레오티드 서열 (가령, 서열 번호: 3, 10, 31, 35, 38, 41, 44, 또는 47중 어느 하나에 상응하는 핵산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 핵산)을 포함하는 세포에 관계한다. 일부 구체예들에서, 상기 세포는 CHO 세포다. 일부 구체예들에서, 상기 세포는 COS 세포다.
특정 양태에서, 본 명세서는 본 명세서에서 기술된 바와 같이, 변이체 ActRIIB 폴리펩티드를 비롯한 ActRIIB 폴리펩티드 뿐만 아니라 이와 같은 동일한 것들을 포함하는 동종다량체 및 이종다량체를 만드는 방법에 관계한다. 이런 방법은 본원에서 개시된 핵산 중에서 한 가지를 적합한 세포 (가령, CHO 세포 또는 COS 세포)에서 발현하는 것을 포함할 수 있다. 이러한 방법은 다음을 포함할 수 있다: a) 가용성 ActRIIB 폴리펩티드의 발현에 적합한 조건하에 세포를 배양하고, 이때 전술한 세포는 ActRIIB 폴리펩티드 발현 구조체를 포함한다. 일부 구체예들에서, 상기 방법은 발현된 ActRIIB 폴리펩티드를 회수하는 것을 더 포함한다. ActRIIB 폴리펩티드는 세포 배양액으로부터 단백질을 획득하기 위한 널리 공지된 기술 중에서 한 가지를 이용하여, 미가공, 부분적으로 정제된, 또는 고도로 정제된 분획물로서 회수될 수 있다.
일부 구체예들에서, 본 명세서는 환자에게서 적혈구 세포 수준 또는 헤모글로빈 수준을 증가시키는 방법에 관계하는데, 이 방법은 본 명세서에서 기술된 바와 같이, 변이체 ActRIIB 폴리펩티드를 포함한, ActRIIB 폴리펩티드 뿐만 아니라 상기 동일한 것을 포함하는 동종다량체 및 이종다량체를 이를 필요로 하는 환자에게 투여하는 것을 포함한다.
일부 구체예들에서, 본 명세서는 환자에게서 빈혈 또는 빈혈과 연관된 장애 (가령, 본 명세서에서 기술된 것들)를 치료하는 방법에 관계하는데, 이 방법은 본 명세서에서 기술된 바와 같이, 변이체 ActRIIB 폴리펩티드를 포함한, ActRIIB 폴리펩티드 뿐만 아니라 상기 동일한 것을 포함하는 동종다량체 및 이종다량체를 이를 필요로 하는 환자에게 투여하는 것을 포함한다.
일부 구체예들에서, 본 명세서는 환자에게서 근육량 및/또는 근육 강도를 증가시키는 방법에 관계하는데, 이 방법은 본 명세서에서 기술된 바와 같이, 변이체 ActRIIB 폴리펩티드를 포함한, ActRIIB 폴리펩티드 뿐만 아니라 상기 동일한 것을 포함하는 동종다량체 및 이종다량체를 이를 필요로 하는 환자에게 투여하는 것을 포함한다.
일부 구체예들에서, 본 명세서는 환자에게서 근육-관련된 장애를 치료하는 방법에 관계하는데, 이 방법은 본 명세서에서 기술된 바와 같이, 변이체 ActRIIB 폴리펩티드를 포함한, ActRIIB 뿐만 아니라 상기 동일한 것을 포함하는 동종다량체 및 이종다량체를 이를 필요로 하는 환자에게 투여하는 것을 포함한다. 일부 구체예들에서, 상기 장애는 바람직하지 않는 수준의 낮은 근육 성장 및/또는 근력 약화와 관련된다. 이러한 장애는 근육 위축, 근이영양증, 근위축성 측삭 경화증 (ALS) 및 근육 소모 장애(가령, 악액질, 식욕 부진, DMD 증후군, BMD 증후군, AIDS 낭비 증후군, 근이영양증, 신경근 질환, 운동 신경 질환, 신경근 접합부 질환 및 염증성 근육병증))를 포함한다.
일부 구체예들에서, 본 명세서는 체지방 함량을 감소시키거나 체지방 함량의 증가율을 감소시키는 방법, 그리고 비만, 비-인슐린 의존성 진성 당뇨병 (NIDDM), 심혈관 질환, 암, 고혈압, 골관절염, 뇌졸중, 호흡기 질환 및 담낭 질환과 같은 바람직하지 못한 체중 증가와 연관된 질환 치료 방법에 관계하는데, 이 방법은 본 명세서에서 설명된 바와 같이, 변이체 ActRIIB 폴리펩티드 뿐만 아니라 상기 동일한 것을 포함하는 동종다량체 및 이종다량체를 포함하는 ActRIIB를 이를 필요로 하는 환자에게 투여하는 것을 포함한다.
도 1 은 제 1 변이체 ActRIIB 폴리펩티드 ("X"로 나타냄)와 제 2 변이체 ActRIIB 폴리펩티드 ("Y"로 나타냄) 또는 변형안된 ActRIIB 폴리펩티드 ("Y"로 나타냄)를 포함하는 이형(heteromeric) 단백질 복합체의 도식적 예시를 보여준다. 기술된 구체예에서, 상기 제 1 변이체 ActRIIB 폴리펩티드는 상호작용 쌍의 제1구성요소("C1")를 포함하는 융합 폴리펩티드의 일부이며, 그리고 제 2 변이체 ActRIIB 폴리펩티드 또는 변형안된 ActRIIB 폴리펩티드는 상호작용 쌍의 제 2구성요소 ("C2")를 포함하는 융합 폴리펩티드의 일부다. 적합한 상호작용 쌍은 예를 들면, 중쇄 및/또는 경쇄 면역글로불린 상호작용 쌍, 절두(truncations), 및 본 명세서에서 설명된 바와 같은 이의 변이체들 [가령, Spiess et al (2015) Molecular Immunology 67(2A): 95-106]을 포함한다. 각 융합 폴리펩티드에서, 링커는 상기 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드 및 상호작용 쌍의 대응하는 구성요소 사이에 위치할 수 있다. 상호작용 쌍의 제1과 제2 구성요소들은 비유도될 수 있는데, 이것은 상기 쌍의 구성원들이 실제적인 선호 없이 서로 연관되거나 또는 자가-연관될 수 있고, 그리고 따라서, 이들은 동일하거나 상이한 아미노산 서열을 가질 수 있다는 것을 의미한다. 도 1a 참고. 대안으로, 상호작용 쌍의 첫 번째와 두 번째 구성원은 유도된(비대칭) 쌍일 수 있는데, 이것은 상기 쌍의 구성원들이 자가 연관보다는 서로에 선호적으로 연관된다는 것을 의미한다. 도 1b.
도 2은 다중 ActRIIB 및 ActRIIA 결정 구조의 복합 분석에 근거하여, 리간드(상자로 표시됨)와 직접 접촉하기 위하여, 본 명세서에서 추측된 잔기를 갖는 인간 ActRIIA의 세포외 도메인과 인간 ActRIIB의 세포외 도메인의 정렬을 나타낸다.
도 3은 세포 내 도메인이 없는 다양한 척추 동물 ActRIIB 전구체 단백질, 세포 내 도메인이 없는 인간 ActRIIA 전구체 단백질 및 콘센서스 ActRII 전구체 단백질의 다중 서열 정렬을 보여준다.
도 4는 Clustal 2.1을 이용하여 인간 IgG 아이소타입으로부터 Fc 도메인의 복수 서열 정렬을 보여준다. 힌지 영역은 점선 밑줄에 의해 표시된다. 이중 밑줄은 비대칭 사슬 짝짓기를 증진하기 위해 IgG1 Fc (서열 번호: 13)에서 조작될 수 있는 위치 및 다른 아이소타입 IgG4(서열 번호: 17), IgG2(서열 번호: 14)및 IgG3(서열 번호: 15)에 대하여 상응하는 위치의 실례를 나타낸다.
도 5 는 인간 ActRIIB 세포외 도메인 폴리펩티드 (서열 번호: 1)의 아미노산 서열을 나타내는데, 이때 번호매김은 천연 인간 ActRIIB 전구체 서열 (서열 번호: 2 참조)에 기초한다.
도 6 은 인간 ActRIIB 전구체 단백질의 아미도산 서열 (서열 번호: 2; NCBI 참조 서열 NP_001097.2)을 보여준다. 신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 도메인은 굵은 체로 표시되며(서열 번호: 1로도 지칭됨), 그리고 잠재적인 내인성 N-연계된 당화 부위는 박스로 표시된다.
도 7 은 인간 ActRIIB(20-134) 세포외 도메인 폴리펩티드를 인코딩하는 핵산 서열을 보여준다.
도 8 은 인간 ActRIIB 전구체 단백질을 인코딩하는 핵산 서열을 보여준다. 서열 번호: 4는 NCBI 참조 서열 NM_001106의 뉴클레오티드 25-1560로 구성된다.
도 9 는 37℃에서 표면 플라스몬 공명으로 측정하였을 때, 변이체 또는 변형안된 ActRIIB 도메인을 포함하는동종이량체 Fc-융합 단백질의 리간드 별합 역동학에 대한 값을 나타낸다. 아미노산 번호매김은 서열 번호: 2에 기초한다.
도 10 은 25℃에서 표면 플라스몬 공명으로 측정하였을 때, 변이체 또는 변형안된 ActRIIB 도메인을 포함하는동종이량체 Fc-융합 단백질의 리간드 별합 역동학에 대한 값을 나타낸다. 아미노산 번호매김은 서열 번호: 2에 기초한다.
도 11은 비이클 또는 변이체 또는 변형안된 ActRIIB 도메인을 포함하는 동종이량체 Fc-융합 단백질로 처리된 야생형 마우스의 기선으로부터 체중 변화를 보여준다.
도 12는 비이클 또는 변이체 또는 변형안된 ActRIIB 도메인을 포함하는 동종이량체 Fc-융합 단백질로 처리된 야생형 마우스에서 헤모글로빈 농도를 나타낸다.
도 13은 ActRIIB-Fc, ActRIIA-Fc 또는 ActRIIB (F82I)-Fc로 1 일째 및 15 일째에 9 mg/kg (s.c.)으로 처리된 시노몰구스(cynomolgus) 원숭이에서 적혈구 수치를 나타낸다. ActRIIB (F82I)-Fc 처리는 ActRIIB-Fc (음성 대조군)에 비교하여, ActRIIA-Fc (양성 대조군)와 유사한 양으로 RBC 수치를 증가시켰다.
도 2은 다중 ActRIIB 및 ActRIIA 결정 구조의 복합 분석에 근거하여, 리간드(상자로 표시됨)와 직접 접촉하기 위하여, 본 명세서에서 추측된 잔기를 갖는 인간 ActRIIA의 세포외 도메인과 인간 ActRIIB의 세포외 도메인의 정렬을 나타낸다.
도 3은 세포 내 도메인이 없는 다양한 척추 동물 ActRIIB 전구체 단백질, 세포 내 도메인이 없는 인간 ActRIIA 전구체 단백질 및 콘센서스 ActRII 전구체 단백질의 다중 서열 정렬을 보여준다.
도 4는 Clustal 2.1을 이용하여 인간 IgG 아이소타입으로부터 Fc 도메인의 복수 서열 정렬을 보여준다. 힌지 영역은 점선 밑줄에 의해 표시된다. 이중 밑줄은 비대칭 사슬 짝짓기를 증진하기 위해 IgG1 Fc (서열 번호: 13)에서 조작될 수 있는 위치 및 다른 아이소타입 IgG4(서열 번호: 17), IgG2(서열 번호: 14)및 IgG3(서열 번호: 15)에 대하여 상응하는 위치의 실례를 나타낸다.
도 5 는 인간 ActRIIB 세포외 도메인 폴리펩티드 (서열 번호: 1)의 아미노산 서열을 나타내는데, 이때 번호매김은 천연 인간 ActRIIB 전구체 서열 (서열 번호: 2 참조)에 기초한다.
도 6 은 인간 ActRIIB 전구체 단백질의 아미도산 서열 (서열 번호: 2; NCBI 참조 서열 NP_001097.2)을 보여준다. 신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 도메인은 굵은 체로 표시되며(서열 번호: 1로도 지칭됨), 그리고 잠재적인 내인성 N-연계된 당화 부위는 박스로 표시된다.
도 7 은 인간 ActRIIB(20-134) 세포외 도메인 폴리펩티드를 인코딩하는 핵산 서열을 보여준다.
도 8 은 인간 ActRIIB 전구체 단백질을 인코딩하는 핵산 서열을 보여준다. 서열 번호: 4는 NCBI 참조 서열 NM_001106의 뉴클레오티드 25-1560로 구성된다.
도 9 는 37℃에서 표면 플라스몬 공명으로 측정하였을 때, 변이체 또는 변형안된 ActRIIB 도메인을 포함하는동종이량체 Fc-융합 단백질의 리간드 별합 역동학에 대한 값을 나타낸다. 아미노산 번호매김은 서열 번호: 2에 기초한다.
도 10 은 25℃에서 표면 플라스몬 공명으로 측정하였을 때, 변이체 또는 변형안된 ActRIIB 도메인을 포함하는동종이량체 Fc-융합 단백질의 리간드 별합 역동학에 대한 값을 나타낸다. 아미노산 번호매김은 서열 번호: 2에 기초한다.
도 11은 비이클 또는 변이체 또는 변형안된 ActRIIB 도메인을 포함하는 동종이량체 Fc-융합 단백질로 처리된 야생형 마우스의 기선으로부터 체중 변화를 보여준다.
도 12는 비이클 또는 변이체 또는 변형안된 ActRIIB 도메인을 포함하는 동종이량체 Fc-융합 단백질로 처리된 야생형 마우스에서 헤모글로빈 농도를 나타낸다.
도 13은 ActRIIB-Fc, ActRIIA-Fc 또는 ActRIIB (F82I)-Fc로 1 일째 및 15 일째에 9 mg/kg (s.c.)으로 처리된 시노몰구스(cynomolgus) 원숭이에서 적혈구 수치를 나타낸다. ActRIIB (F82I)-Fc 처리는 ActRIIB-Fc (음성 대조군)에 비교하여, ActRIIA-Fc (양성 대조군)와 유사한 양으로 RBC 수치를 증가시켰다.
상세한 설명
1.
개요
특정 양태에서, 본 발명은 ActRIIB 폴리펩티드에 관계한다. 본 명세서에서 사용된 바와 같이, 임의의 종으로부터 유도된 액티빈 수용체 유형 IIB (ActRIIB) 단백질 및 ActRIIB-관련된 단백질의 패밀리를 나타낸다. ActRIIB 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 특이성을 갖는 세포질 도메인을 포함하는 모든 막경유 단백질이다. ActRIIB 전구체 단백질의 아미도산 서열 (서열 번호: 2)은 도6에 나타낸다.
용어 "ActRIIB 폴리펩티드"는 ActRIIB 구성요소의 임의의 자연 발생성 폴리펩티드, 뿐만 아니라 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함하는 폴리펩티드를 지칭할 때 사용된다. 예를 들면, ActRIIB 폴리펩티드는 ActRIIB 폴리펩티드의 서열에 최소한 약 80% 동일한, 그리고 바람직하게는 최소한 85%, 90%, 95%, 97%, 99% 또는 그 이상의 동일성을 갖는 임의 공지의 ActRIIB 서열로부터 유도된 폴리펩티드를 포함한다.
특정 구체예에서, 본 발명은 가용성 ActRIIB 폴리펩티드에 관계한다. 본원에서 기술된 바와 같이, 용어 "가용성 ActRIIB 폴리펩티드"는 ActRIIB 단백질의 세포외 도메인을 포함하는 폴리펩티드를 일반적으로 지칭한다. 용어 "가용성 ActRIIB 폴리펩티드"는 본 명세서에서 사용된 바와 같이, ActRIIB 단백질의 임의의 자연 발생적 세포외 도미인, 뿐만 아니라 유용한 활성을 보유하는 이의 임의의 변이체 (돌연변이체, 단편, 및 펩티드 유사체를 포함함)를 포함한다. 예를 들면, ActRIIB 단백질의 세포외 도메인은 리간드에 결합하고, 일반적으로 가용성이다. 예시적인 가용성 ActRIIB 폴리펩티드는 도 5 뿐만 아니라 서열 번호: 53에 나타낸 ActRIIB 세포외 도메인 (서열 번호: 1)을 포함한다. 다른 예시적인 가용성 ActRIIB 폴리펩티드는 ActRIIB 단백질의 세포외 도메인에 추가하여, 신호 서열을 포함한다 (실시예 1 참고). 상기 신호 서열은 ActRIIB의 천연 신호 서열, 또는 조직 플라스 미노겐 활성제 (TPA) 신호 서열 또는 꿀벌 멜라틴 신호 서열과 같은 다른 단백질의 신호 서열일 수 있다.
TGF-β 신호는 리간드 자극 시 하류 SMAD 단백질을 인산화시키고, 활성화시키는 유형 I 및 유형 II 세린/트레오닌 키나제 수용체의 이형 복합체에 의해 매개된다(, 2000, Nat. Rev. Mol. Cell Biol. 1:169-178).이들 유형 I 및 유형 II 수용체는 모두 시스테인-풍부한 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 그리고 예측된 세린/트레오닌 특이성을 갖는 세포질 도메인으로 구성된 막경유 단백질이다. 유형 I 수용체는 신호생성에 필수적이며, 그리고 유형 II 수용체는 리간드의 결합에 필요하다. 유형 I 및 유형 II 액티빈 수용체는 리간드 결합 후 안정적 복합체를 형성하여, 유형 II 수용체에 의한 유형 I 수용체가 인산화된다.
2가지 관련된 유형 II 수용체, ActRIIA 및 ActRIIB는 액티빈의 유형 II 수용체로 확인되었다 (Mathews and Vale, 1991, Cell 65:973-982; Attisano et al., 1992, Cell 68: 97-108). 액티빈 외에도, ActRIIA와 ActRIIB는 BMP7, Nodal, GDF8, 및 GDF11을 비롯한 여러 다른 TGF-β 계열 단백질과 생화학적으로 상호작용할 수 있다 (Yamashita et al., 1995, J. Cell Biol. 130:217-226; Lee and McPherron, 2001, Proc. Natl. Acad. Sci. 98:9306-9311; Yeo and Whitman, 2001, Mol. Cell 7: 949-957; Oh et al., 2002, Genes Dev. 16:2749-54). 출원인은 가용성 ActRIIA-Fc 융합 단백질 및 ActRIIB-Fc 융합 단백질은 생체 내에서 실질적으로 상이한 효과를 갖는다는 것을 발견하였는데, ActRIIB-Fc는 골격근에 대한 주요 효과를 갖고, ActRIIA-Fc는 뼈에 대한 주요 효과를 갖는다.
특정 구체예들에서, 본 발명은 대상 ActRIIB 폴리펩티드 (가령, 가용성 ActRIIB 폴리펩티드)로 ActRIIB 수용체의 리간드(또한 ActRIIB 리간드로 또한 지칭됨)를 길항하는 것에 관계한다. 따라서, 본 발명의 조성물 및 방법은 ActRIIB 수용체의 하나 또는 그 이상의 리간드의 비정상적 활성과 연합된 장애를 치료하는데 유용하다. ActRIIB 수용체의 예시적인 리간드는 일부 TGF-β 패밀리 구성요소, 이를 테면 액티빈, Nodal, GDF8, GDF11, 그리고 BMP7을 포함한다.
액티빈은 이량체 폴리펩티드 성장 인자이고, TGF-베타 수퍼 패밀리에 속한다. 2개의 밀접하게 관련된 β 소단위 (βAβA, βBβB, 및 βAβB)의 동형/이형이량체인 3가지 액티빈(A, B, 및 AB)가 있다. TGF-베타 슈퍼패밀리에서, 액티빈은 난소 및 태반 세포에서 호르몬 생성을 자극하고, 신경 세포 생존을 지원하고, 세포 유형에 따라 세포주기 진행에 긍정적 또는 부정적 영향을 미칠 수 있고, 그리고 적어도 양서류 태아에서 중배엽 분화를 유도할 수 있는 독특하고 다기능적 요소다 (DePaolo et al., 1991, Proc SocEp Biol Med. 198:500-512; Dyson et al., 1997, Curr Biol. 7:81-84; Woodruff, 1998, Biochem Pharmacol. 55:953-963). 더욱이, 자극된 인간 단핵구 백혈병 세포는 액티빈 A에 대해 동일한 것으로 밝혀졌다 (Murata et al., 1988, PNAS, 85:2434). 액티빈 A는 골수에서 적혈구 생성의 자연 조절 인자로 작용한다고 제안되었다. 몇몇 조직에서, 액티빈 신호전달은 이것의 관련된 이형이량체, 인히빈에 의해 길항된다. 예를 들면, 뇌하수체로부터 난포-자극 호르몬 (FSH) 분비 동안, 액티빈은 FSH 합성 및 분비를 촉진시키지만, 한편 인히빈은 FSH 합성 및 분비를 저해시킨다. 액티빈 생활성을 조절하고 및/또는 액티빈에 결합하는 다른 단백질은 폴리스태틴 (FS), 폴리스태틴-관련된 단백질 (FSRP), 및 α2-마크로글로블린, Cerberus, 그리고 엔도글린(endoglin)을 포함한다.
Nodal 단백질은 중배엽 및 내배엽 유도 그리고 형성, 뿐만 아니라 후속적인 축 구조의 조직화, 이를 테면, 조기 배발생에서 심장 및 위의 조직화에 기능을 한다. 발생중인 척추 배아의 배쪽 조직은 주변 세포를 모집하여 비-축척 배아 구조를 형성하는 동안, 척주 및 척추 전판의 축 구조에 주로 기여한다는 것이 증명되었다. Nodal은 타입 I 및 타입 II 수용체 모두와 SMAD 단백질로 알려진 세포내 작동체(effectors)를 통하여 신호생성을 하는 것으로 보인다. ActRIIA 및 ActRIIB는 nodal의 타입 II 수용체로 기능을 한다는 사상은 최근 연구에 의해 뒷받침된다(Sakuma et al., Genes Cells. 2002, 7:401-12). Nodal 리간드들은 Smad2를 인산화시키는 액티빈 타입 I 및 타입 II 수용체를 활성화시키는 이들의 공-인자들 (가령, cripto)과 상호작용한다고 제안되었다. Nodal 단백질은 중배엽 형성, 전방 패턴화 및 좌우 축 사양을 포함하여 초기 척추 배아에 중요한 여러 가지 사건에 연루되어 있다. 실험적 증거에 의하면, Nodal 신호생성은 이전에 액티빈 및 TGF-베타에 특이적으로 반응하는 것으로 보이는 루시퍼라제(luciferase) 리포터인 pAR3-Lux를 활성화시킨다는 사실이 입증되었다. 그러나, Nodal은 뼈 형성 단백질에 특이적으로 반응하는 리포터인, pTlx2-Lux는 유도할 수 없다. 최근 결과는 Nodal 신호생성은 액티빈-베타 경로 Smad2와 Smad3에 의해 중재된다는 직접적인 생화학적 증거를 제공한다. 추가 증거에서 나타낸 바와 같이, 세포외 cripto 단백질은 Nodal 신호생성에 필요하며, 이는 액티빈 또는 TGF-베타 신호생성과 구별된다.
성장 및 분화 인자-8 (GDF8)은 또한 미오스태틴으로 알려져 있다. GDF8은 골격근량의 음성 조절인자다. GDF8은 골발생중인 그리고 성인 골격근에서 상당히 발현된다. 유전자삽입 마우스에서 GDF8 null 돌연변이는 골격근의 눈에 띄는 비대 및다형성을 특징으로 한다(McPherron et al., Nature, 1997, 387:83-90). 소에서 GDF8의 자연 발생 돌연변이에서 골격근량의 비슷한 증가가 있고 (Ashmore et al., 1974, Growth, 38:501-507; Swatland and Kieffer, J. Anim. Sci., 1994, 38:752-757; McPherron and Lee, Proc. Natl. Acad. Sci. USA, 1997, 94:12457-12461; 그리고 Kambadur et al., Genome Res., 1997, 7:910-915), 그리고 인간에서 현저하게 나타난다(Schuelke et al., N Engl J Med 2004;350:2682-8). 연구에 따르면, 사람의 HIV 감염과 관련된 근육 소모는 GDF8 단백질 발현 증가를 수반한다(Gonzalez-Cadavid et al., PNAS, 1998, 95:14938-43). 또한, GDF8은 근육 특이적 효소 (예: 크레아틴 키나제)의 생산을 조절하고, 근섬유 세포 증식을 조절할 수 있다 (WO 00/43781). GDF8 프로펩티드(propeptide)는 성숙한 GDF8 도메인 이량체에 비공유 결합하여, 그 생물학적 활성을 불활성화시킬 수 있다. (Miyazono et al. (1988) J. Biol. Chem., 263: 6407-6415; Wakefield et al. (1988) J. Biol. Chem., 263; 7646-7654; 그리고 Brown et al. (1990) Growth Factors, 3: 35-43). GDF8 또는 구조적으로 관련된 단백질에 결합하고, 이들의 생물학적 활성을 억제시키는 다른 단백질은 폴리스태틴, 그리고 잠재적으로, 폴리스태틴-관련된 단백질을 포함한다(Gamer et al. (1999) Dev. Biol., 208: 222-232).
또한 MP11로 알려진, 성장 및 분화 인자-11 (GDF11)은 또한 분비된 단백질이다 (McPherron et al., 1999, Nat. Genet. 22: 260-264). GDF11은 마우스 발생 동안 꼬리싹(tail bud), 팔다리싹(limb bud), 상악 및 하악 아치, 그리고 후근 신경절에서 발현되는 분비 단백질이다(Nakashima et al., 1999, Mech. Dev. 80: 185-189). GDF11은 중배엽 및 신경 조직 모두에서 패턴화에 독특한 역할을 한다(Gamer et al., 1999, Dev Biol., 208:222-32). GDF11은 병아리 날개 발달에있어서 연골 형성 및 근형성의 음성 조절자인 것으로 나타났다(Gamer et al., 2001, Dev Biol. 229:407-20). 근육에서 GDF11의 발현은 GDF8과 유사한 방식으로 근육 성장을 조절하는 역할을 암시한다. 또한, 뇌에서 GDF11의 발현은 GDF11이 또한 신경계의 기능과 관련된 활성을 가질 수 있음을 시사한다. 흥미로운 것은, GDF11은 후각 상피의 신경 발생을 억제하는 것으로 밝혀졌다(Wu et al., 2003, Neuron. 37:197-207). 따라서, GDF11은 근육 질환 및 신경 퇴행성 질환(가령, 근위축성 측색 경화증)과 같은 질병의 치료에서 시험관내 및 생체내 적용될 수 있다.
골형성 단백질-1 (OP-1)로도 불리는 뼈 형태생성 단백질(BMP7)은 연골 및 뼈 형성을 유도하는 것으로 잘 알려져 있다. 또한, BMP7은 다양한 생리학적 과정을 조절한다. 예를 들면, BMP7은 상피 골 형성의 현상을 담당하는 골 유도 인자일 수 있다. BMP7은 칼슘 조절과 뼈 항상성(homeostasis)에 역할을 한다는 것을 발견했다. 액티빈과 마찬가지로, BMP7은 타입 II 수용체, ActRIIA 및 IIB에 결합한다. 그러나, BMP7 및 액티빈은 이형화학성 수용체 복합체 안으로 별개의 타입 I 수용체들을 모집한다. 관찰된 주요 BMP7 타입 I 수용체는 ALK2이었고, 액티빈은 ALK4 (ActRIIB)에 배타적으로 결합하였다. BMP7 및 액티빈은 별개의 생물학적 반응을 유도하였고, 상이한 Smad 경로들을 활성화시켰다 (Macias-Silva et al., 1998, J Biol Chem. 273:25628-36).
특정 양태에서, 본 발명은 ActRIIB 활성과 관련된 임의의 공정에서, 일반적으로 ActRIIB 리간드 신호생성을 길항하기 위하여 특정 ActRIIB 폴리펩티드 (가령, 가용성 ActRIIB 폴리펩티드)의 사용에 관계한다. 임의선택적으로, 본 발명의 ActRIIB 폴리펩티드는 ActRIIB 수용체의 하나 또는 그 이상의 리간드, 이를 테면 액티빈, Nodal, GDF8, 그리고 GDF11을 길항할 수 있고, 그리고 따라서 추가 장애의 치료에 유용할 수 있다.
따라서, 본 발명은 비정상 활성의 ActRIIB 또는 ActRIIB 리간드와 연관된 질병 또는 상태의 치료 또는 예방에서 ActRIIB 폴리펩티드의 사용을 고려한다. ActRIIB 또는 ActRIIB 리간드는 많은 중요한 생물학적 과정의 조절에 관여한다. 이러한 과정에서 주요 기능으로 인해 치료 개입의 바람직한 목표가 될 수 있다. 예를 들면, ActRIIB 폴리펩티드 (가령, 가용성 ActRIIB 폴리펩티드)는 인간 또는 동물의 장애 또는 상태를 치료하는 데 사용될 수 있다. 이러한 장애 또는 상태의 예로는 2 형 당뇨병, 내당능 장애, 대사 증후군 (예 : 증후군 X) 및 외상 (예 : 화상 또는 질소 불균형)에 의해 유도되는 인슐린 내성과 같은 대사 장애; 지방 조직 장애 (예를 들어, 비만); 근육 및 영양 장애, 예컨대 근이영양증 (Duchenne 근이영양증 포함); 근위축성 측삭 경화증 (ALS); 근육 위축; 장기 위축; 여림; 수근관 증후군; 울혈성 폐색성 폐 질환; 근육감소증, 악액질 (cachexia) 및 기타 근육 소모 증후군을 포함한다. 다른 예로는 골다공증, 특히 노인 및/또는 폐경 후 여성에서 골다공증; 글루코코르티코이드-유도된 골다공증; 골감감소증; 골관절염; 및 골다공증-관련 골절을 포함한다. 또 다른 예로는 만성 글루코코르티코이드 치료, 조기 성선 기능 부전, 안드로겐 억제, 비타민 D 결핍, 이차 부갑상선기능항진증, 영양 결핍 및 신경성 식욕 부진으로 인한 뼈 질량 감소를 포함한다. 이러한 장애 및 상태는 아래 "예시적 치료적 용도"에서 논의된다.
이 발명에서 사용된 용어는 일반적으로 본 개시 내용 및 각 용어가 사용되는 특정 상황에서 당해 분야의 통상적인 의미를 갖는다. 특정 용어는 발명의 구성 및 방법을 설명하고, 이를 작성하고 사용하는 방법에 대해 당업자에게 추가 지침을 제공하기 위해 아래 또는 다른 곳에서 논의된다. 어떤 용어의 사용의 범위나 의미는 그것이 사용되는 특정 상황에서 명백해질 것이다.
"약" 및 "대략적으로"는 일반적으로 측정의 성질 또는 정밀도를 고려하여 측정된 양에 대한 허용 오차를 의미한다. 전형적으로, 예시적인 오차도는 주어진 값 또는 값 범위의 20퍼센트(%) 이내, 바람직하게는 10 % 이내, 보다 바람직하게는 5 % 이내이다.
대안으로, 그리고 특히 생물학적 계통에서, 용어 "약" 및 "대략적으로"는 주어진 값의 크기의 차수, 바람직하게는 5 배 이내,보다 바람직하게는 2 배 이내의 값을 의미 할 수 있다. 본원에서 주어진 수치는 다르게 언급되지 않는 한, 대략적인 것이며, "약" 또는 "대략적으로"라는 용어는 명시적으로 언급되지 않은 경우, 유추될 수 있음을 의미한다.
본 발명의 방법은 하나 이상의 돌연변이체 (서열 변이체)와 비-변형 (야생형) 서열을 포함하는 서열을 서로 비교하는 단계를 포함할 수 있다. 이러한 비교는 전형적으로, 예를 들어, 당해 분야에 잘 공지된 서열 정렬 프로그램 및/또는 알고리즘 (예를 들어, BLAST, FASTA 및 MEGALIGN 그리고 다수)을 사용하여 중합체 서열의 정렬을 포함한다. 숙련된 당업자는 돌연변이가 잔기 삽입 또는 결실을 포함하는 그러한 정렬에서, 서열 정렬은 삽입되거나 결실된 잔기를 함유하지 않는 중합체 서열에서 "갭" (전형적으로-또는 "A"로 표시됨)을 도입할 수 있음을 인지할 것이다.
모든 문법적 형태 및 단어 변이에서 "상동성(Homologous)"이란 동일한 유기체 종에서 슈퍼패밀리의 단백질을 포함하는 "공통적인 진화 기원"을 포함하는 두개 단백질간의 상관관계를 지칭하거나, 뿐만 아니라 상이한 유기체 종의 상동성 단백질을 지칭한다. 이러한 단백질 (및 이의 인코딩 핵산)은 서열 상동성을 갖고, 동일성 (%) 또는 특정 잔기 또는 모티프 및 보존된 위치의 존재 여부와 관계없이, 서열 유사성에 의해 반영되는 바와 같은 서열 상동성을 갖는다.
용어 "서열 유사성(sequence similarity)"은 모든 문법적 형태에서 일반적인 진화론적 기원을 공유하거나 공유하지 않을 수 있는 핵산 또는 아미노산 서열 간의 동일성 또는 일치 정도를 의미한다.
그러나, 일반적인 용도 및 당해 출원에서, "상동성"이라는 용어는 "매우"와 같은 부사로 수식될 때 서열 유사성을 지칭할 수 있고, 일반적인 진화적 기원과 관련 될 수도 있고 또는 그렇지 않을 수 도 있다.
"항진하다(agonize)"는 모든 문법적 형태로 단백질 및/또는 유전자를 활성화 (예 : 단백질의 유전자 발현을 활성화 또는 증폭하거나 비활성 단백질을 활성화 상태로 유도함으로써)하거나 단백질 및 단백질을 증가시키는 과정을 의미한다.
"길항하다(antagonize)"는 모든 문법적 형태로 단백질 및/또는 유전자를 억제(예 : 단백질의 유전자 발현을 억제 또는 감소시키거나 활성 단백질을 비활성화 상태로 유도함으로써)하거나 단백질 및 단백질을 감소시키는 과정을 의미한다.
명세서 및 청구 범위에 걸쳐 수치와 관련하여 사용되는 용어 "약(about)" 및 "대략적으로(approximately)"이란 당업자에게 친숙하고 수용가능한 정확도의 구간을 나타낸다. 일반적으로 이러한 정확도 간격은 ± 10 %이며, 대안으로, 그리고 특히 생물학적 계통에서, 용어 "약" 및 "대략"은 주어진 값의 크기의 차수, 바람직하게는 ≤5 배,보다 바람직하게는 ≤2 배 이내의 값을 의미 할 수 있다.
여기에 개시된 수치 범위는 범위를 정의하는 수치를 포함한다.
용어 "a" 및 "an"은 용어가 사용된 문맥이 명확하게 달리 지시하지 않는 한, 복수형을 포함한다. 용어 "하나 또는 이상의" 및 "최소 하나의 "는 물론 호환할 수 있는 용어로 "하나"(또는 "하나")라는 용어를 사용할 수 있다. 더욱이, 본 명세서에서 사용된 "및/또는"이란 둘 또는 그 이상의 특정 특징 또는 구성 요소의 각각의 구체적인 설명으로서 취해질 것이다. 따라서, 구절에서 사용된 용어 "및/또는", 이를 테면 "A 및/또는 B"는 "A와 B", "A 또는 B", "A" (단독), 및 "B" (단독)을 포함한다. 마찬가지로, "A, B, 및/또는 C"와 같은 문구에 사용된 "및/또는"이라는 용어는 다음 각 측면을 포함하는 것으로 의도된다: A, B, 및 C; A, B, 또는 C; A 또는 C; A 또는 B; B 또는 C; A와 C; A와 B; B와 C; A (단독); B (단독); 및 C (단독).
2.
ActRIIB 폴리펩티드
특정 양태에서, 본 발명은 ActRIIB 변이체 폴리펩티드 (가령, 가용성 ActRIIB 폴리펩티드)에 관계한다. 임의선택적으로, 단편, 기능적 변이체 및 변형된 형태는 상응하는 야생형 ActRIIB 폴리펩티드와 유사하거나 또는 동일한 생물학적 활성을 갖는다. 예를 들면, 본 발명의 ActRIIB 변이체는 ActRIIB 리간드 (가령, 액티빈 A, 액티빈 AB, 액티빈 B, Nodal, GDF8, GDF11 또는 BMP7)에 결합하고, 이의 기능을 억제할 수 있다. 임의선택적으로, ActRIIB 폴리펩티드는 뼈, 연골, 근육 또는 지방과 같은 조직의 성장을 조절한다. 예시적인 ActRIIB 폴리펩티드는 인간 ActRIIB 전구체 폴리펩티드 (서열 번호: 2), 그리고 가용성 인간 ActRIIB 폴리펩티드 (가령, 서열 번호: 1, 5, 6 및 12)를 포함한다.
본 명세서는 ActRIIB의 기능적으로 활성인 부분 및 변종을 확인한다. 본 출원인은 Hilden 등(Blood. 1994 Apr 15; 83 (8) : 2163-70)이 개시한 서열을 갖는 Fc 융합 단백질은 서열 번호: 2의 아미노산 64에 상응하는 위치에 알라닌을 갖고, 액티빈 및 GDF11에 대하여 상대적으로 낮은 친화도를 갖는다는 것을 확인하였다. 대조적으로, 위치 64에 아르기닌 (R64)을 갖는 동일한 Fc 융합 단백질은 액티빈과 GDF-11에 대하여 낮은 나노몰에서 높은 피코몰 범위의 친화력을 갖는다. 따라서, R64를 갖는 서열은 본 명세서에서 인간 ActRIIB의 야생형 기준 서열로 이용된다.
Attisano et al. (Cell. 1992 Jan 10;68(1):97-108)는 ActRIIB의 세포외 도메인의 C-말단에서 프롤린 매듭의 결손은 액티빈에 대한 수용체의 친화력을 감소 시킨다는 것을 보여 주었다. WO2008097541에서 개시된 데이터에서 서열 번호: 2의 아미노산 20-119을 함유하는 ActRIIB-Fc 융합 단백질, "ActRIIB(20-119)-Fc"는 ActRIIB(20-134)-Fc와 비교하여 GDF11 및 액티빈에 감소된 결합을 가지며, 이는 프롤린 매듭 영역과 완벽한 막에 인접한(juxtamembrane) 도메인을 포함한다. 그러나, ActRIIB(20-129)-Fc 단백질은 비록 프롤린 매듭 영역이 파괴되었지만, 야생형에 비교하여 유사하지만, 다소 감소된 활성을 유지한다. 따라서, 아미노산 134, 133, 132, 131, 130 및 129에서 종료되는 ActRIIB 세포외 도메인은 모두 활성인 것으로 예상되지만, 134 또는 133에서 종료되는 구조체는 대부분 활성일 것이다. 유사하게, 잔기 129-134중 임의의 위치에서 돌연변이는 큰 폭으로 리간드 결합 친화력을 변경시키지 않을 것으로 예상된다. 이를 뒷받침하는 것으로, P129 및 P130의 돌연변이는 실질적으로 리간드 결합을 감소시키지 않는다. 따라서, ActRIIB-Fc 융합 단백질은 아미노산 109 (최종 시스테인)와 같이 빨리 종료될 수 있지만, 그러나, 109와 119에서, 또는 그 사이에서 종료되는 형태는 감소된 리간드 결합을 갖는 것으로 예상된다. 아미노산 119는 잘 보존되지 않고, 따라서 용이하게 변경 또는 절두된다. 128 또는 그 이후에 끝나는 형태는 리간드 결합 활성을 유지한다. 119 또는 127에서 또는 이들 사이에서 끝나는 양식은 중간수준의 결합 기능을 갖는다. 이들중 임의의 것은 임상 또는 실험 환경에 따라 바람직하게 사용될 수 있다.
ActRIIB의 N-말단에서, 아미노산 29 또는 그 전에 시작하는 단백질은 리간드 결합 활성을 보유하는 것으로 예상된다. 아미노산 29는 초기 시스테인을 나타낸다. 위치 24에서 알라닌-에서-아스파라긴으로의 돌연변이는 리간드 결합에 실질적인 영향없이 N-연계된 당화 서열을 도입한다. 이로써 신호 절단(cleavage) 펩티드와 아미노산 20-29에 상응하는 시스테인 교차(cross)-연계된 영역에서 돌연변이는 잘 용인된다는 것이 확인된다. 특히, 위치 20, 21, 22, 23 및 24에서 시작하는 구조체는 활성을 유지할 것이고, 위치 25, 26, 27, 28 및 29에서 시작하는 구조체 또한 활성을 유지할 것으로 예상된다. WO2008097541의 데이터에서 22, 23, 24 또는 25에서 시작하는 구조체가 최고 활성을 갖게 될 것이라는 놀라는 것을 증명한다.
이와 함께, ActRIIB의 활성 부분은 서열 번호:2의 아미노산 29-109를 포함하며, 그리고 구조체들은 예를 들면, 아미노산 20-29에 상응하는 잔기에서 시작하고, 아미노산 109-134에 상응하는 위치에서 종료될 수 있다. 다른 예들은 위치 20-29 또는 21-29에서 시작하고, 119-134, 119-133 또는 129-134, 129-133의 위치에서 종료되는 구조체들을 포함한다. 다른 예들은 20-24 (또는 21-24, 또는 22-25)의 위치에서 시작하고, 109-134 (또는 109-133), 119-134 (또는 119-133) 또는 129-134 (또는 129-133)의 위치에서 종료되는 구조체들을 포함한다. 이 범위 안에 변이체들, 특히, 서열 번호: 4의 대응하는 부분에 최소한 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 변이체들이 특히 고려된다.
본 명세서는 도 2에서 나타낸 것과 같이, 복합(composite) ActRIIB의 분석 결과를 포함하는데, 상기 리간드 결합 포켓은 잔기 Y31, N33, N35, L38 내지 T41, E47, E50, Q53 내지 K55, L57, H58, Y60, S62, K74, W78 내지 N83, Y85, R87, A92, 및 E94 내지 F101에 의해 부분적으로 한정됨을 나타낸다. 이들 위치에서, 비록 K74A 돌연변이는 R40A, K55A, F82A 및 L79 위치의 돌연변이와 마찬가지로 잘 용인되지만, 보존 돌연변이가 용인될 것으로 예상된다. R40은 제노푸스(Xenopus)에서 K이며, 이 위치에서 염기성 아미노산이 용인됨을 나타낸다. Q53은 소의 ActRIIB에서 R이며, 제노푸스 ActRIIB에서 K이고, 따라서 R, K, Q, N 및 H를 포함하는 아미노산이 이 위치에서 용인될 것이다. 따라서, 활성 ActRIIB 변이체 단백질의 일반 형태는 아미노산 29-109를 포함하지만, 그러나 임의선택적으로 20-24 또는 22-25의 범위 위치에서 시작하고, 129-134의 범위 위치에서 종료되며, 그리고 리간드 결합 포켓에서 단지 1, 2, 5, 10 또는 15개의 보존적 아미노산 변화를 포함하며, 그리고 리간드 결합 포켓의 위치 40, 53, 55, 74, 79 및/또는 82에서 0, 1 또는 그 이상의 비-보존적 변경(alterations)을 포함하는 것이다. 이러한 단백질은 서열 번호: 2의 아미노산 29-109의 서열과 80 %, 90 %, 95 % 또는 99% 이상의 서열 동일성을 보유할 수 있다. 가변성이 특히 잘 용인될 수 있는 결합 포켓 외부의 위치는 세포외 도메인의 아미노 및 카르복시 말단 (상기 언급 한 바와 같음), 그리고 위치 42-46 및 65-73을 함한다. 위치 65에서 아스파라긴에서-알라닌으로의 변경(N65A)은 A64 배경에서 리간드 결합을 실질적으로 개선시키고, 따라서 R64 베경에서 리간드 결합에 유해한 효과를 가지지 않는 것으로 예상된다. 이 변화는 아마도 A64 배경에서 N65의 당화를 제거하여, 이 영역에서의 중요한 변화가 용인될 수 있음을 보여준다. R64A 변화가 잘 용인되지는 않지만, R64K는 잘 용인되고, 따라서 H와 같은 또 다른 염기성 잔기는 64 번 위치에서 용인될 수 있다.
ActRIIB는 거의 모든 동물간에 잘-보존되며, 세포외 도메인의 큰 스트레취(stretches)는 완벽하게 보존된다. 도 3 참고 ActRIIB에 결합하는 많은 리간드들이 매우 보존되어 있다. 따라서, 다양한 척추 동물로부터의 ActRIIB 서열의 비교는 잔류 물에 대한 통찰력을 제공한다. 따라서, 활성을 가진 인간 ActRIIB 변이체 폴리펩티드는 다른 척추 동물 ActRIIB의 서열의 상응하는 위치에 하나 또는 그 이상의 아미노산을 포함할 수 있거나, 또는 인간 또는 다른 척추 동물 서열에서와 유사한 잔기를 포함할 수 있다. 다음 실시예들은 활성 ActRIIB 변이체를 정의하는 접근법을 설명한다. L46은 제노푸스 ActRIIB에서 발린이며, 따라서 이 위치는 변경될 수 있고, 임의선택적으로 또다른 소수성 잔기, 이를 테면 V, I 또는 F로 변경될 수 있거나, 또는 비-극성 잔기, 이를 테면 A로 변경될 수 있다. E52는 제노푸스에서 K이며, 이것은 이 부위가 다양한 광범위한 변화, 가령, 극성 잔기, 이를 테면 E, D, K, R, H, S, T, P, G, Y 그리고 아마도 A를 포함하는 변화를 용인할 것임을 나타낸다. T93은 제노푸스에서 K이며, 이것은 이 위치에서 다양한 구조적 변이를 용인하는데, 극성 잔기, 이를 테면 S, K, R, E, D, H, G, P, G 및 Y를 선호함을 나타낸다. F108은 제노푸스에서 Y이며, 따라서 Y 또는 다른 소수성 기, 이를 테면 I, V 또는 L이 용인되어야 함을 나타낸다. E111은 제노푸스에서 K이며, 이것은 이 위치에서 D, R, K 및 H, 뿐만 아니라 Q와 N을 포함하는 하전된 잔기가 용인될 수 있음을 나타낸다. R112는 제노푸스에서 K이며, 이것은 이 위치에서 R 및 H를 포함하는 염기성 잔기가 용인됨을 나타낸다. 위치 119의 A는 상대적으로 덜 보존되며, 설치류에서는 P이고, 제노푸스에서는 V이며, 따라서 이 위치는 기본적으로 임의의 아미노산이 용인되어야 함을 나타낸다.
WO2008097541에서 개시된 데이터는 추가적인 N-연계된 당화 부위 (N-X-S/T)의 추가로 상기 ActRIIB(R64)-Fc 형태와 비교하여, ActRIIB-Fc 융합 단백질의 활성에 영향을 미치지 않는다는 것을 입증한다. 다른 NX (T/S) 서열은 42-44 (NQS) 및 65-67 (NSS)에서 발견되지만, 후자는 64 위치에서 R로 효율적으로 당화되지 않을 수 있다. N-X-S/T 서열은 일반적으로 도 2에 정의된 리간드 결합 포켓 외부의 위치에 도입될 수 있다. 비-내인성 N-X-S/T 서열의 도입에 특히 적합한 부위는 아미노산 20-29, 20-24, 22-25, 109-134, 120-134 또는 129-134를 포함한다. N-X-S/T 서열은 또한 ActRIIB 서열과 Fc 또는 다른 융합 성분 사이의 링커 내로 도입될 수 있다. 이러한 부위는 기존 S 또는 T에 대하여 올바른 위치에 N을 도입하거나, 또는 기존 N에 대응하는 위치에 S 또는 T를 도입함으로써, 최소한의 노력으로 도입될 수 있다. 따라서, 따라서, N-연계된 당화 부위를 생성시키는 바람직한 변경은 다음과 같다: A24N, R64N, S67N (N65A 변경과 복합 가능), E106N, R112N, G120N, E123N, P129N, A132N, R112S 및 R112T. 당화될 것으로 예측되는 임의의 S는 당화로 인한 보호 때문에, 면역원성 부위를 생성하지 않고 T로 변형될 수 있다. 마찬가지로, 당화될 것으로 예측되는 임의의 T는 S로 변형될 수 있다 따라서, 변경 S67T 및 S44T가 고려된다. 마찬가지로, A24N 변이체에서 S26T 변경이 이용될 수 있다. 따라서, ActRIIB 변이체는 하나 또는 그 이상의 추가적인, 비-내인성 N-연계된 당화 콘센수스 서열을 포함할 수 있다.
위치 L79는 액티빈-미오스태틴 (GDF-11) 변경된 결합 성질을 부여하기 위해 변경될 수 있다. L79A 또는 L79P는 GDF-11 결합을 액틴빈 결합보다 더 많이 감소시킨다. L79E 또는 L79D는 GDF-11 결합을 유지한다. 놀라운 것은, 상기 L79E 및 L79D 변이체는 상당히 감소된 액티빈 결합을 보유한다. 생체 내 실험은 이러한 비-액티빈 수용체가 근육 질량을 증가시키는 중요한 능력을 보유하지만, 다른 조직에 대한 영향을 감소시키는 것을 나타낸다. 이들 데이터는 액티빈에 대한 영향이 감소된 폴리펩티드를 수득하기 위한 바람직함 및 실현 가능성을 입증한다.
설명된 변형은 다양한 방식으로 결합될 수 있다. 추가적으로, 본 명세서에서 기술된 돌연변이 유발 프로그램의 결과는 ActRIIB에서 종종 보존에 유익한 아미노산 위치들이 있음을 나타낸다. 이들은 위치 64 (염기성 아미노산), 위치 80 (산성 또는 소수성 아미노산), 위치 78 (소수성, 특히 트립토판), 위치 37 (산성, 특히 아스파르트산 또는 글루탐산), 위치 56 (염기성 아미노산), 위치 60 (소수성 아미노산, 특히 페닐알라닌 또는 티로신)을 포함한다. 따라서, 본 명세서에서 기술된 각 변이체에서, 본 명세서는 보존될 수 있는 아미노산 틀(framework)을 제공한다. 보존되는 것이 바람직할 수 있는 기타 위치는 다음과 같다: 위치 52 (산성 아미노산), 위치 55 (염기성 아미노산), 위치 81 (산성), 98 (극성 또는 하전된, 특히 E, D, R 또는 K).
특정 구체예들에서, 상기 ActRIIB 폴리펩티드의 단리된 단편은 ActRIIB 폴리펩티드를 코딩하는 핵산 (가령, 서열 번호: 3 및 4)의 상응하는 단편으로부터 재조합적으로 생산된 폴리펩티드를 스크리닝함으로써 수득할 수 있다. 또한, 단편은 통상의 Merrifield 고체상 f-Moc 또는 t-Boc 화학과 같은 당업계에 공지된 기술을 사용하여 화학적으로 합성될 수 있다. 단편은 (재조합 또는 화학 합성에 의해) 생성될 수 있고, 예를 들어, ActRIIB 단백질 또는 ActRIIB 리간드의 길항제 (억제제) 또는 항진제 (활성화제)로서 기능할 수 있는 펩티드 단편을 동정하기 위해 시험될 수 있다.
특정 구체예들에서, ActRIIB 폴리펩티드의 기능적 변이체는 서열 번호: 1, 2 및 53에서 선택된 아미노산 서열과 적어도 75 % 동일한 아미노산 서열을 갖는다. 특정 경우, 기능적 변이체는 서열 번호: 1, 2 및 53으로부터 선택되는 아미노산 서열과 적어도 80 %, 85 %, 90 %, 95 %, 97 %, 98 %, 99 % 또는 100 % 동일한 아미노산 서열을 갖는다.
특정 구체예들에서, 본 발명은 치료 효과 또는 안정성을 강화시킬 목적으로(가령, 생체외 반감기 및/또는 단백질분해에 대한 저항성), ActRIIB폴리펩티드의 구조를 변경시켜 기능적 변이체의 제조를 고려한다. 변형된 ActRIIB 폴리펩티드는 또한 예를 들어, 아미노산 치환, 결실 또는 첨가에 의해 생산될 수 있다. 예를 들면, 류신을 이소류신 또는 발린으로 치환, 아스파르테이트를 글루탐산염으로 치환, 트레오닌을 세린으로 치환, 또는 아미노산을 구조적으로 관련된 아미노산 (가령, 보존 돌연변이)으로 단리된 치환은 생성 분자의 생물학적 활성에 주요한 영향을 주지 않을 것으로 합리적으로 예측할 수 있다. 보존 치환은 아미노산 측쇄가 관련된 아미노산 패밀리 안에서 일어나는 것이다. 본 명세서의 ActRIIB 폴리펩티드의 아미노산 서열의 변화로 기능적 동소체가 생성되는 지의 여부는 변이체 ActRIIB 폴리펩티드가 이의 야생형 ActRIIB 폴리펩티드와 유사한 방식으로 세포 안에서 반응을 만드는 능력, 또는 하나 또는 그 이상의 리간드, 예를 들면, 액티빈, GDF11, 또는 GDF8에 야생형과 유사한 방식으로 결합하는 능력을 평가함으로써 용이하게 결정될 수 있다.
특정 특이적 구체예들에서, 본 발명은 ActRIIB 폴리펩티드의 세포외 도메인 (리간드-결합 도메인으로도 지칭됨)에서 돌연변이를 만들어, 상기 변이체 (또는 돌연변이체) ActRIIB 폴리펩티드가 변경된리간드-결합 활성 (가령, 결합 친화력 또는 결합 선택성)을 갖도록 하는 것을 고려한다. 특정 경우에, 이러한 변이체 ActRIIB 폴리펩티드는 특이적 리간드에 대하여 변경된(상승된 또는 감소된) 결합 친화력을 보유한다. 다른 경우에서, 상기 변이체 ActRIIB 폴리펩티드는 이들 리간드에 대하여 변경된 결합 선택성을 갖는다.
특정 구체예들에서, 본 발명은 상기 폴리펩티드의 당화를 변경시키기 위하여, 상기 ActRIIB 폴리펩티드의 특이적 돌연변이를 고려한다. ActRIIB 폴리펩티드에서 예시적인 당화 부위는 도 6에 기술된다. 이러한 돌연변이는 하나 또는 그 이상의 당화 부위, 이를 테면 O-연계된 또는 N-연계된 당화 부위를 도입 또는 제거하도록 선택될 수 있다. 아스파라긴-연계된 당화 인지 부위는 일반적으로 적절한 세포의 당화 효소에 의해 특이적으로 인지되는 삼펩티드 서열, 아스파라긴-X-트레오닌 (여기에서 "X"는 임의의 아미노산임)이다. 이러한 변형은 하나 또는 그 이상의 세린 또는 트레오닌 잔기를 상기 야생형 ActRIIB 폴리펩티드(O-연계된 당화 부위의 경우)에 추가 또는 치환시켜 만들 수도 있다 . 당화 인지 부위의 제1 또는 제3 아미노산 위치중 하나 또는 둘 모두에서 다양한 아미노산 치환 또는 결손 (및/또는 제 2 위치에서 아미노산 결손)으로 변형된 삼펩티드 서열에서 비-당화가 초래된다. ActRIIB 폴리펩티드의 탄소화물 모이어티의 수를 증가시키는 다른 수단은 상기 단백질에 화학 또는 효소적으로 글리코시드를 결합시키는 것이다 . 이용되는 결합 방식에 따라, 이들 당(들)은 (a) 아르기닌 및 히스티딘; (b) 자유 카르복실기; (c) 자유 술포히드릴기, 이를 테면 시스테인의 기; (d) 자유 히드록실 기, 이를 테면 세린, 트레오닌, 또는 히드록시프롤린; (e) 방향족 잔기, 이를 테면 페닐알라닌, 티로신, 또는 트립토탄의 기; 또는 (f) 글루타민의 아미드 기에 부착될 수 있다. 이 방법은 1987년 9월 11일자로 공개된 WO 87/05330, 그리고 Aplin and Wriston (1981) CRC Crit. Rev. Biochem., pp. 259-306에서 기술되며, 이들은 본 명세서에 참고자료에 편입된다. ActRIIB 폴리펩티드 상에 있는 하나 또는 그 이상의 탄수화물 모이어티는 화학적 및/또는 효소적으로 제거될 수 있다 . 화학적 탈당화는 예를 들면, 트리플루오로메탄설폰산 또는 이에 등가의 화합물에 대한 ActRIIB 폴리펩티드의 노출을 필요할 수 있다. 이 처리는 아미노산 서열을 손상시키지 않으면서, 연계당 (N-아세틸 글루코사민 또는 N-아세틸 갈락토사민)을 제외한 대부분 또는 모든 당을 절단하게 된다. 화학적 탈당화는 다음에 추가로 기술된다:Hakimuddin et al. (1987) Arch. Biochem. Biophys. 259:52 및 Edge et al. (1981) Anal. Biochem. 118:131. ActRIIB 폴리펩티드상의 탄수화물 모이어티의 효소 절단은 Thotakura et al. (1987) Meth. Enzymol. 138:350에서 설명된 바와 같이, 다양한 엔도-및 엑소-글리코시다제의 사용에 의해 이루어질 수 있다. 포유류, 효모, 곤충 및 식물 세포는 모두 펩티드의 아미노산 서열에 의해 영향을 받을 수 있는 상이한 당화 패턴을 도입시킬 수 있기 때문에 ActRIIB 폴리펩티드의 서열은 이용되는 발현계 유형에 따라 적절하게 조정될 수 있다. 일반적으로, ActRIIB 폴리펩티드는 적절한 당화를 제공하는 포유류 세포계, 이를 테면 HEK293 또는 CHO 세포계에서 발현될 수 있지만, 다른 포유류 발현 세포계 또한 마찬가지로 유용할 것으로 예상된다.
본의 개시는 변이체, 선택적으로 절두 변이체를 포함하는 ActRIIB 폴리펩티드의 복합 변이체의 세트를 생성하는 방법을 추가로 고려하고; 복합 돌연변이체의 풀(pool)은 기능적 변이체 서열을 확인하는데 특히 유용하다. 이러한 복합 라이브러리들을 스크리닝하는 목적은 변경된 성질, 이를 테면 변경된 약동학적 또는 변경된 리간드 결합을 갖는 ActRIIB 폴리펩티드들 변이체를 만들기 위함을 수도 있다. 다양한 스크리닝 분석이 하기에 제공되며, 이러한 분석을 이용하여 변이체들을 평가할 수 있다. 예를 들면, ActRIIB 폴리펩티드 변이체는 ActRIIB 폴리펩티드에 결합하는 능력, ActRIIB 리간드가 ActRIIB 폴리펩티드에 결합을 방해하는 능력에 대하여 스크리닝될 수 있다.
ActRIIB 폴리펩티드 또는 이의 변이체의 활성은 세포-기반 또는 생체내 분석에서 또한 테스트될 수 있다. 예를 들면, 골아세포 또는 전구체에서 골 생산에 관련된 유전자의 발현에 있어서 ActRIIB 폴리펩티드 변이체의 효과가 평가될 수 있다. 이는 필요에 따라 하나 또는 그 이상의 재조합 ActRIIB 리간드 단백질 (가령, BMP7) 존재하에 실행될 수 있고, 그리고 세포는 ActRIIB 폴리펩티드 및/또는 이의 변이체, 그리고 임의선택적으로, ActRIIB 리간드를 만들기 위하여 형질감염될 수 있다. 마찬가지로, ActRIIB 폴리펩티드 는 마우스 또는 다른 동물에 투여되고, 그리고 하나 또는 그 이상의 뼈 특징, 이를 테면 밀도 또는 체적이 평가될 수 있다. 뼈 골절의 치유율도 평가할 수 있다. 유사하게, 상기 활성 of ActRIIB 폴리펩티드 또는 이의 변이체의 활성은 근육 세포, 지방 세포 및 신경 세포에서 이들 세포의 성장에 대한 임의의 효과, 예를 들어 하기 기재된 분석에 의해 시험 될 수 있다. 이러한 검정은 당업계에 잘 알려져 있고, 통상적이다. SMAD-반응성 리포터 유전자를 이러한 세포계에서 이용하여 하류 신호생성에 대한 효과를 모니터할 수 있다.
복합적으로-유도된 변이체는 자연 발생적 ActRIIB 폴리펩티드에 비교하여 선택적 능력을 보유하도록 만들어질 수 있다. 이러한 변이체 단백질은 재조합 DNA 구조체로부터 발현될 때, 유전자 요법 프로토콜에 이용될 수 있다. 마찬가지로, 돌연변이유발은 대응하는 야생형 ActRIIB 폴리펩티드와 상당히 상이한 세포내 반감기를 갖는 변이체를 만들 수 있다. 예를 들면, 변경된 단백질은 고유 ActRIIB 폴리펩티드의 파괴 또는 그렇지 않으면 불활성화를 초래하는 단백질분해 또는 다른 과정에 더 안정적이거나 덜 안정적이 될 수 있다. 이러한 변이체 및 이들을 코딩하는 유전자는 ActRIIB 폴리펩티드의 반감기를 조절함으로써 ActRIIB 폴리펩티드 복합체 수준을 변경 시키는데 이용될 수 있다. 예를 들면, 짧은 반감기는 더욱 일시적인 생물학적 효과를 일으킬 수 있고, 유도성 발현 시스템의 일부는 세포 안에 재조합 ActRIIB 폴리펩티드 수준을 더 엄밀하게 조절할 수 있다.
특정 구체예들에서, 상기 본 발명의 ActRIIB 폴리펩티드는 ActRIIB 폴리펩티드 내에 자연적으로 존재하는 것에 더하여 번역후 변형을 더욱 포함할 수 있다. 이러한 변형은 아세틸화, 카르복실화, 당화, 인산화, 지질화 및 아실화를 포함하나 이에 한정되지 않는다. 그 결과 변형된 ActRIIB 폴리펩티드는 비-아미노산 원소, 예를 들어 폴리에틸렌 글리콜, 지질, 다당류 또는 단당류 및 인산염을 포함할 수 있다. ActRIIB 폴리펩티드의 기능에 대하여 본 명세서에 기재된 바와 같이 다른 ActRIIB 폴리펩티드 변이체에서 이러한 비-아미노산 요소들의 효과를 테스트할 수 있다. ActRIIB 폴리펩티드가 초기 형태의 ActRIIB 폴리펩티드를 절단함으로써 세포에서 생산되는 경우, 해독 후 가공은 또한 단백질의 정확한 폴딩 및/또는 기능에 중요할 수 있다. 상이한 세포들 (가령, CHO, HeLa, MDCK, 293, WI38, NIH-3T3 또는 HEK293)은 이러한 해독후 활성에 대하여 특이적 세포 기전 및 특징들을 보유하고, 그리고 ActRIIB 폴리펩티드의 정확한 변형 및 프로세싱을 확보하도록 선택될 수 있다.
특정 양태에서, 상기 ActRIIB 폴리펩티드의 기능적 변이체 또는 변형된 형태는 상기 ActRIIB 폴리펩티드의 적어도 일부분을 포함하는 융합 단백질 및 하나 또는 그 이상의 융합 도메인을 포함한다. 이러한 융합 도메인의 잘 알려진 예로는 폴리히스티딘, Glu-Glu, 글루타티온 S-전달효소 (GST), 티오레독신, 단백질 A, 단백질 G,면역글로불린 중쇄 불변 영역 (가령, Fc), 말토즈 결합 단백질 (MBP), 또는 인간 혈청 알부민을 포함하나, 이에 국한되지 않는다. 융합 도메인은 원하는 특성을 부여하도록 선택될 수 있다. 예를 들면, 일부 융합 도메인은 친화력 크로마토그래피에 의한 융합 단백질의 단리에 특히 유용하다. 친화력 정제를 목적으로, 친화력 크로마토그래피를 위한 관련 매트릭스, 이를 테면 글루타티온-, 아밀라제-, 및 니켈-또는 코발트-접합된 수지가 이용된다. 이러한 매트릭스중 많은 것들이 '키트' 형태로 이용가능한데, 이를 테면 Pharmacia GST 정제 시스템 및 (HIS6) 융합 짝과 함께 유용한 QIAexpressTM 시스템(Qiagen)이 있다. 또다른 예로써, ActRIIB 폴리펩티드들의 탐지를 용이하게 하기 위하여 융합 도메인이 선택될 수 있다. 이러한 탐지 도메인의 예로는 다양한 형광 단백질 (가령, GFP) 뿐만 아니라 "에피토프 테그"를 포함하는데, 특이적 항체가 이용가능한 짧은 펩티드 서열이 일반적이다. 특정 단클론 항체에 용이하게 이용되는 잘 공지된 에피토프 테그는 FLAG, 인플루엔자 바이러스 헤마글루티닌 (HA), 및 c-myc 테그를 포함한다. 일부 경우에서 융합 도메인은 프로테아제 절단 부위, 이를 테면 인자(factor) Xa 또는 트롬빈에 대한 절단부위를 가지고, 이에 의해 관련 프로테아제가 이 융합 단백질을 부분적으로 절단하고, 이로 인하여 이로부터 재조합 단백질이 유리된다. 유리된 단백질은 후속 크로마토그래피 분리에 의해 융합 단백질로부터 단리될 수 있다. 특정 바람직한 구체예에서, ActRIIB 폴리펩티드는 생체 내에서 ActRIIB 폴리펩티드를 안정화시키는 도메인 ("안정화제" 도메인)과 융합된다. 안정화"란 파괴의 감소, 신장의 제거 감소 또는 다른 약동학 효과 때문인지 여부와 관계없이, 혈청 반감기를 증가시키는 모든 것을 의미한다. 면역글로불린의 Fc 부분과의 융합은 광범위한 단백질에 바람직한 약물 동력학적 특성을 부여하는 것으로 알려져 있다. 마찬가지로, 인간 혈청 알부민과의 융합은 바람직한 성질을 부여 할 수 있다. 선택될 수 있는 다른 유형의 융합 도메인은 다량체화 도메인(예 : 이합체화, 사량체화 등), 기능화 도메인 (근육 성장의 추가 자극과 같은 부가적인 생물학적 기능을 부여하는)을 포함한다.
특정 양태에서 본 명세서에서 기술된 폴리펩티드는 동종체(homomeric) 변이체 ActRIIB 폴리펩티드 형태일 수 있는데, 이는 단백질 복합체 내의 각각의 융합 폴리펩티드 사슬이 복합체 내의 임의의 다른 사슬과 동일한 ActRIIB 변이체를 포함한다는 것을 의미한다. 특정 양태에서, 본 명세서에서 기술된 폴리펩티드는 적어도 하나의 변형안된 ActRIIB 폴리펩티드 또는 상기 제 1 ActRIIB 변이체와 상이한 적어도 하나의 변이체와 공유적으로 또는 비-공유적으로 연합된 적어도 하나의 변이체 ActRIIB 폴리펩티드를 포함하는 이종다량체를 형성할 수 있다. 특정 양태에서, 본 명세서에서 기술된 폴리펩티드는 적어도 하나의 TGF-베타 슈퍼패밀리 유형 I 세린/트레오닌 키나제 수용체 폴리펩티드 (가령, ALK1, ALK2, ALK3, ALK4, ALK5, ALK6, 그리고 ALK7 폴리펩티드)-이들의 단편 및 변이체를 포함하여-와 공유적으로 또는 비-공유적으로 적어도 하나의 변이체 ActRIIB 폴리펩티드를 포함하는 이종다량체를 형성할 수 있다. 특정 양태에서, 본 명세서에서 기술된 폴리펩티드는 적어도 하나의 TGF-베타 슈퍼패밀리 유형 II 세린/트레오닌 키나제 수용체 폴리펩티드 (가령, ActRIIA, TGFBRII, BMPRII, 그리고 MISRII)-이들의 단편 및 변이체를 포함하여-와 공유적으로 또는 비-공유적으로 적어도 하나의 변이체 ActRIIB 폴리펩티드를 포함하는 이종다량체를 형성할 수 있다. 바람직하게는 본 명세서의 폴리펩티드들은 이형이량체를 형성하지만, 더욱 고차의 이형이량체들, 이를 테면, 이형삼량체, 이형사량체, 및 추가 올리고머 구조를 포함하나, 이에 한정되지 않은 것들이 포함된다. 일부 구체예들에서, 변이체 본 명세서의 ActRIIB 폴리펩티드는 적어도 하나의 다량체화 도메인을 포함한다. 본 명세서에서 공개된 바와 같이, 용어 "다량체화 도메인(multimerization domain)"은 최소한 제 1 폴리펩티드와 최소한 제 2 폴리펩티드 사이에 공유 또는 비-공유 상호작용을 촉진시키는 아미노산 또는 아미노산 서열을 지칭한다. 변이체 ActRIIB 폴리펩티드들은 다량체화 도메인에 공유적 또는 비-공유적으로 결합될 수 있다. 바람직하게는, 이형다량체 형성 (가령, 이형이량체 형성)을 촉진시키고, 임의선택적으로 동형다량체 형성 (가령, 동형이량체 형성)을 방해 또는 그렇지 않으면 이의 형성을 선호하지 않고, 이로 인하여 원하는 이형다량체가 증가되도록 하기 위하여, 다량체화 도메인은 제 1 폴리펩티드 (가령, 변이체 ActRIIB 폴리펩티드)와 제 2 폴리펩티드 (가령, 변형안된 ActRIIB 폴리펩티드 또는 상기 제 1 폴리펩티드에 존재하는 것과는 상이한 변이체 ActRIIB 폴리펩티드)간의 상호작용을 촉진시킨다(가령, 도 1 참고).
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK1-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK1-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK1-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK1-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK2-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK2-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK2-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK2-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK3-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK3-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK3-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK3-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK4-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK4-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK4-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK4-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK5-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK5-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK5-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK5-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK6-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK6-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK6-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK6-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ALK7-Fc 융합 단백질 및 적어도 하나의 ActRIIB-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ALK7-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ALK7-Fc:ActRIIB-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ALK7-Fc:ActRIIB-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ActRIIB-Fc 융합 단백질 및 적어도 하나의 ActRIIA-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ActRIIB-Fc:ActRIIA-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ActRIIB-Fc:ActRIIA-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ActRIIB-Fc:ActRIIA-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ActRIIB-Fc 융합 단백질 및 적어도 하나의 BMPRII-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ActRIIB-Fc:BMPRII-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ActRIIB-Fc:BMPRII-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ActRIIB-Fc:BMPRII-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ActRIIB-Fc 융합 단백질 및 적어도 하나의 TGFBRII-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ActRIIB-Fc:TGFBRII-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ActRIIB-Fc:TGFBRII-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ActRIIB-Fc:TGFBRII-Fc 이종다량체는 이종이량체이다.
특정 구체예들에서, 본 명세서는 적어도 하나의 ActRIIB-Fc 융합 단백질 및 적어도 하나의 MISRII-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, ActRIIB-Fc:MISRII-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들에 결합한다. 일부 구체예들에서, ActRIIB-Fc:MISRII-Fc 이종다량체는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드, 이를 테면 본 명세서에서 기술된 것들의 신호생성을 억제한다. 일부 구체예들에서, ActRIIB-Fc:MISRII-Fc 이종다량체는 이종이량체이다.
특정 양태에서, 본 명세서는 ALK1-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK1-Fc 융합 단백질은 서열 번호: 54의 아미노산 22-34중 어느 하나 (가령, 아미노산 잔기 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 그리고 34)에서 시작하고, 서열 번호: 54의 아미노산 95-118중 어느 하나 (가령, 아미노산 잔기 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 그리고 118)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK1 도메인을 포함한다. 일부 구체예들에서, 상기 ALK1-Fc 융합 단백질은 서열 번호: 54의 아미노산 22-118에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK1 도메인을 포함한다. 일부 구체예들에서, 상기 ALK1-Fc 융합 단백질은 서열 번호: 54의 아미노산 34-95에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK1 도메인을 포함한다. 일부 구체예들에서, 상기 ALK1-Fc 융합 단백질은 서열 번호: 54, 55, 56, 57, 58, 59, 60, 61, 62, 그리고 63중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK1 도메인을 포함한다.
대표적인 ALK1-Fc 융합 폴리펩티드 (서열 번호: 60)는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다.
성숙 ALK1-Fc 융합 단백질 서열 (서열 번호: 61)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
일부 구체예들에서, 상기 ALK1-Fc 융합 폴리펩티드 (서열 번호: 56)는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파르트산으로 대체됨)이 ALK1-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 56의 아미노산 서열이 제공될 수 있다.
ALK1-Fc 융합 단백질은 다음 핵산 (서열 번호: 258)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCGACCCTGT GAAGCCGTCT CGGGGCCCGC
101
TGGTGACCTG CACGTGTGAG AGCCCACATT GCAAGGGGCC TACCTGCCGG
151
GGGGCCTGGT GCACAGTAGT GCTGGTGCGG GAGGAGGGGA GGCACCCCCA
201
GGAACATCGG GGCTGCGGGA ACTTGCACAG GGAGCTCTGC AGGGGCCGCC
251
CCACCGAGTT CGTCAACCAC TACTGCTGCG ACAGCCACCT CTGCAACCAC
301
AACGTGTCCC TGGTGCTGGA GGCCACCCAA CCTCCTTCGG AGCAGCCGGG
351
AACAGATGGC CAGCTGGCCA CCGGTGGTGG AACTCACACA TGCCCACCGT
401
GCCCAGCACC TGAACTCCTG GGGGGACCGT CAGTCTTCCT CTTCCCCCCA
451
AAACCCAAGG ACACCCTCAT GATCTCCCGG ACCCCTGAGG TCACATGCGT
501
GGTGGTGGAC GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG
551
TGGACGGCGT GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG
601
TACAACAGCA CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA
651
CTGGCTGAAT GGCAAGGAGT ACAAGTGCAA GGTCTCCAAC AAAGCCCTCC
701
CAGCCCCCAT CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA
751
CCACAGGTGT ACACCCTGCC CCCATCCCGG GAGGAGATGA CCAAGAACCA
801
GGTCAGCCTG ACCTGCCTGG TCAAAGGCTT CTATCCCAGC GACATCGCCG
851
TGGAGTGGGA GAGCAATGGG CAGCCGGAGA ACAACTACGA CACCACGCCT
901
CCCGTGCTGG ACTCCGACGG CTCCTTCTTC CTCTATAGCG ACCTCACCGT
951
GGACAAGAGC AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC
1001
ATGAGGCTCT GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG
1051
GGT (서열 번호: 258)
성숙 ALK1-Fc 융합 단백질 서열 (서열 번호: 57)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 추가될 수 있다.
특정 양태에서, 본 명세서는 ALK2 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK2"는 임의의 종으로부터 그리고 돌연변이 유발 또는 다른 변형에 의해 그러한 ALK2 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-2 단백질의 패밀리를 나타낸다. ALK2에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK2 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK2 폴리펩티드"는 뿐만 아니라 ALK2 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이 체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 ALK2 전구체 단백질 서열 (NCBI Ref Seq NP_001096.1)은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK2 폴리펩티드 서열은 다음과 같다:
MEDEKPKVNPKLYMCVCEGLSCGNEDHCEGQQCFSSLSINDGFHVYQKGCFQVYEQGKMTCKTPPSPGQAVECCQGDWCNRNITAQLPTKGKSFPGTQNFHLE (서열 번호: 65)
인간 ALK2 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 217에 나타내며, 이는 Genbank 기준 서열 NM_001105.4의 뉴클레오티드 431-1957에 상응한다. 세포외 ALK2 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 218과 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK2 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK2 폴리펩티드들 (가령, ALK2 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK2의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK4 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 64 또는 65서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK2 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 64 또는 65서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK2 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK2-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK2-Fc 융합 단백질은 서열 번호: 64의 아미노산 22-34중 어느 하나 (가령, 아미노산 잔기 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 및 35)에서 시작하고, 서열 번호: 64의 아미노산 95-118중 어느 하나 (가령, 아미노산 잔기 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 및 123)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK2 도메인을 포함한다. 일부 구체예들에서, 상기 ALK2-Fc 융합 단백질은 서열 번호: 64의 아미노산 35-99에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK2 도메인을 포함한다. 일부 구체예들에서, 상기 ALK2-Fc 융합 단백질은 서열 번호: 64의 아미노산 21-123에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK2 도메인을 포함한다. 일부 구체예들에서, 상기 ALK2-Fc 융합 단백질은 서열 번호: 64, 65, 66, 67, 68, 69, 70, 71, 72, 및 73중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK2 도메인을 포함한다.
일부 구체예들에서, 상기 ALK2-Fc 융합 단백질은 TPA 리더를 이용하며, 다음과 같다(서열 번호: 66):
신호 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정 다른 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파르트산으로 대체됨)이 ALK1-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 66의 아미노산 서열이 제공될 수 있다.
ALK2-Fc 융합 단백질은 다음 핵산 (서열 번호: 244)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCATGGAAGA TGAGAAGCCC AAGGTCAACC
101
CCAAACTCTA CATGTGTGTG TGTGAAGGTC TCTCCTGCGG TAATGAGGAC
151
CACTGTGAAG GCCAGCAGTG CTTTTCCTCA CTGAGCATCA ACGATGGCTT
201
CCACGTCTAC CAGAAAGGCT GCTTCCAGGT TTATGAGCAG GGAAAGATGA
251
CCTGTAAGAC CCCGCCGTCC CCTGGCCAAG CTGTGGAGTG CTGCCAAGGG
301
GACTGGTGTA ACAGGAACAT CACGGCCCAG CTGCCCACTA AAGGAAAATC
351
CTTCCCTGGA ACACAGAATT TCCACTTGGA GACCGGTGGT GGAACTCACA
401
CATGCCCACC GTGCCCAGCA CCTGAACTCC TGGGGGGACC GTCAGTCTTC
451
CTCTTCCCCC CAAAACCCAA GGACACCCTC ATGATCTCCC GGACCCCTGA
501
GGTCACATGC GTGGTGGTGG ACGTGAGCCA CGAAGACCCT GAGGTCAAGT
551
TCAACTGGTA CGTGGACGGC GTGGAGGTGC ATAATGCCAA GACAAAGCCG
601
CGGGAGGAGC AGTACAACAG CACGTACCGT GTGGTCAGCG TCCTCACCGT
651
CCTGCACCAG GACTGGCTGA ATGGCAAGGA GTACAAGTGC AAGGTCTCCA
701
ACAAAGCCCT CCCAGCCCCC ATCGAGAAAA CCATCTCCAA AGCCAAAGGG
751
CAGCCCCGAG AACCACAGGT GTACACCCTG CCCCCATCCC GGGAGGAGAT
801
GACCAAGAAC CAGGTCAGCC TGACCTGCCT GGTCAAAGGC TTCTATCCCA
851
GCGACATCGC CGTGGAGTGG GAGAGCAATG GGCAGCCGGA GAACAACTAC
901
GACACCACGC CTCCCGTGCT GGACTCCGAC GGCTCCTTCT TCCTCTATAG
951
CGACCTCACC GTGGACAAGA GCAGGTGGCA GCAGGGGAAC GTCTTCTCAT
1001
GCTCCGTGAT GCATGAGGCT CTGCACAACC ACTACACGCA GAAGAGCCTC
1051
TCCCTGTCTC CGGGT (서열 번호: 244)
성숙 ALK2-Fc 융합 단백질 서열 (서열 번호: 67)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 추가될 수 있다.
1 MEDEKPKVNP KLYMCVCEGL SCGNEDHCEG QQCFSSLSIN DGFHVYQKGC
51 FQVYEQGKMT CKTPPSPGQA VECCQGDWCN RNITAQLPTK GKSFPGTQNF
101 HLETGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR TPEVTCVVVD
151 VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN
201 GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR EEMTKNQVSL
* 251 TCLVKGFYPS DIAVEWESNG QPENNYDTTP PVLDSDGSFF LYSDLTVDKS
301 RWQQGNVFSC SVMHEALHNH YTQKSLSLSP G (서열 번호: 67)
비대칭 Fc 융합 단백질을 이용한 이형다량체 복합체들의 형성을 촉진시키는 또다른 방법에서, 상보적 소수성 상호작용과 추가적인 분자간 이황화결합을 도입하도록 Fc 도메인이 변경된다.
일부 구체예들에서, 상기 ALK2-Fc 융합 폴리펩티드 (서열 번호: 70)는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환이 ALK2-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 또한, Fc 도메인의 C-말단 라이신 잔기는 결실될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 70의 아미노산 서열이 제공된다.
성숙 ALK2-Fc 융합 단백질 서열 (서열 번호: 71)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
MEDEKPKVNP KLYMCVCEGL SCGNEDHCEG QQCFSSLSIN DGFHVYQKGC
51
FQVYEQGKMT CKTPPSPGQA VECCQGDWCN RNITAQLPTK GKSFPGTQNF
101
HLETGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR TPEVTCVVVD
151
VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN
201
GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVCTLPPSR EEMTKNQVSL
251
SCAVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF LVSKLTVDKS
301
RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK (서열 번호: 71)
특정 양태에서, 본 명세서는 ALK2 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK2"는 임의의 종으로부터 그리고 돌연변이 유발 또는 다른 변형에 의해 그러한 ALK2 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-2 단백질의 패밀리를 나타낸다. ALK2에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK2 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK2 폴리펩티드"는 뿐만 아니라 ALK2 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이 체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
대표적인 인간 ALK2 전구체 단백질 서열 (NCBI Ref Seq NP_001096.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK2 폴리펩티드 서열은 다음과 같다:
MEDEKPKVNPKLYMCVCEGLSCGNEDHCEGQQCFSSLSINDGFHVYQKGCFQVYEQGKMTCKTPPSPGQAVECCQGDWCNRNITAQLPTKGKSFPGTQNFHLE (서열 번호: 65)
인간 ALK2 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 217에 나타내며, 이는 Genbank 기준 서열 NM_001105.4의 뉴클레오티드 431-1957에 상응한다. 세포외 ALK2 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 218과 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK2 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK2 폴리펩티드들 (가령, ALK2 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK2의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK4 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 64 또는 65서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK2 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 64 또는 65서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK2 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK3 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK3"은 임의의 종으로부터 그리고 이 유발 또는 다른 변형에 의해 그러한 ALK3 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-3 단백질의 패밀리를 나타낸다. ALK3에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK3 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK3 폴리펩티드"는 뿐만 아니라 ALK3 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이 체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 ALK3 전구체 단백질 서열 (NCBI Ref Seq NP_004320.2)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
A 프로세스된 세포외 ALK3 폴리펩티드 서열은 다음과 같다:
인간 ALK3 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 219에 나타내며, 이는 Genbank 기준 서열 NM_004329.2의 뉴클레오티드 549-2144에 상응한다. 신호 서열은 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다. 세포외 인간 ALK3 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 220과 같다.
활성 (가령, 리간드 결합) ALK3 폴리펩티드의 일반적인 형태는 서열 번호: 74의 아미노산 위치 25-31중 임의의 위치 (가령, 위치 25, 26, 27, 28, 29, 30, 또는 31)에서 시작하고, 서열 번호: 74의 아미노산 위치 140-152중 임의의 위치 (가령, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 또는 152)에서 종료되는 폴리펩티드를 포함하는 것이다. 미국 특허 제 8,338,377 호 (이의 교시는 그 전체가 본 명세서에 참고로 포함됨)를 참조한다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK3 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK3 폴리펩티드들 (가령, ALK3 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK3의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK3 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 74의 아미노산 위치 25-31중 임의의 것 (가령, 위치 25, 26, 27, 28, 29, 30, 또는 31)에서 시작하고, 서열 번호: 74 의 아미노산 위치 140-153중 임의의 것(가령, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 또는 152)에서 종료되는 아미노산을 포함하는, 하나의 ALK3 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 74, 75, 76, 77, 80, 또는 81의 아미노산 서열에 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 적어도 하나의 ALK3 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 74, 75, 76, 77, 80, 또는 81서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 또는 99% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK3 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK3-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK3-Fc 융합 단백질은 서열 번호: 74의 아미노산 24-61중 어느 하나 (가령, 아미노산 잔기 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 및 61)에서 시작하고, 서열 번호: 74의 아미노산 130-152 중 어느 하나 (가령, 아미노산 잔기 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 및 152)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK3 도메인을 포함한다. 일부 구체예들에서, 상기 ALK3-Fc 융합 단백질은 서열 번호: 74의 아미노산 61-130에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK3 도메인을 포함한다. 일부 구체예들에서, 상기 ALK3-Fc 융합 단백질은 서열 번호: 74의 아미노산 24-152에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK3 도메인을 포함한다. 일부 구체예들에서, 상기 ALK3-Fc 융합 단백질은 서열 번호: 74, 75, 76, 77, 78, 79, 80, 81, 82, 그리고 83중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK3 도메인을 포함한다.
일부 구체예들에서, 상기 ALK3-Fc 융합 단백질은 TPA 리더를 이용하며, 다음과 같다:
리더 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIB-Fc:ALK3-Fc이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파트르산으로 대체됨)이 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 76의 아미노산 서열이 제공될 수 있다.
ALK3-Fc 융합 단백질은 다음 핵산 (서열 번호: 245)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCCAGAATCT GGATAGTATG CTTCATGGCA
101
CTGGGATGAA ATCAGACTCC GACCAGAAAA AGTCAGAAAA TGGAGTAACC
151
TTAGCACCAG AGGATACCTT GCCTTTTTTA AAGTGCTATT GCTCAGGGCA
201
CTGTCCAGAT GATGCTATTA ATAACACATG CATAACTAAT GGACATTGCT
251
TTGCCATCAT AGAAGAAGAT GACCAGGGAG AAACCACATT AGCTTCAGGG
301
TGTATGAAAT ATGAAGGATC TGATTTTCAG TGCAAAGATT CTCCAAAAGC
351
CCAGCTACGC CGGACAATAG AATGTTGTCG GACCAATTTA TGTAACCAGT
401
ATTTGCAACC CACACTGCCC CCTGTTGTCA TAGGTCCGTT TTTTGATGGC
451
AGCATTCGAA CCGGTGGTGG AACTCACACA TGCCCACCGT GCCCAGCACC
501
TGAACTCCTG GGGGGACCGT CAGTCTTCCT CTTCCCCCCA AAACCCAAGG
551
ACACCCTCAT GATCTCCCGG ACCCCTGAGG TCACATGCGT GGTGGTGGAC
601
GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG TGGACGGCGT
651
GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG TACAACAGCA
701
CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA CTGGCTGAAT
751
GGCAAGGAGT ACAAGTGCAA GGTCTCCAAC AAAGCCCTCC CAGCCCCCAT
801
CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA CCACAGGTGT
851
ACACCCTGCC CCCATCCCGG GAGGAGATGA CCAAGAACCA GGTCAGCCTG
901
ACCTGCCTGG TCAAAGGCTT CTATCCCAGC GACATCGCCG TGGAGTGGGA
951
GAGCAATGGG CAGCCGGAGA ACAACTACGA CACCACGCCT CCCGTGCTGG
1001
ACTCCGACGG CTCCTTCTTC CTCTATAGCG ACCTCACCGT GGACAAGAGC
1051
AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC ATGAGGCTCT
1101
GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG GGT
(서열 번호: 245)
성숙 ALK3-Fc 융합 단백질 서열 (서열 번호: 77)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 추가될 수 있다.
1
GAQNLDSMLH GTGMKSDSDQ KKSENGVTLA PEDTLPFLKC YCSGHCPDDA
51
INNTCITNGH CFAIIEEDDQ GETTLASGCM KYEGSDFQCK DSPKAQLRRT
* 101
IECCRTNLCN QYLQPTLPPV VIGPFFDGSI RTGGGTHTCP PCPAPELLGG
151
PSVFLFPPKP KDTLMISRTP EVTCVVVDVS HEDPEVKFNW YVDGVEVHNA
201
KTKPREEQYN STYRVVSVLT VLHQDWLNGK EYKCKVSNKA LPAPIEKTIS
251
KAKGQPREPQ VYTLPPSREE MTKNQVSLTC LVKGFYPSDI AVEWESNGQP
301
ENNYDTTPPV LDSDGSFFLY SDLTVDKSRW QQGNVFSCSV MHEALHNHYT
351
QKSLSLSPG (서열 번호: 77)
상보적 형태의 ALK3-Fc 융합 폴리펩티드 (서열 번호: 80)은 다음과 같다:
리더 서열 및 링커는 밑줄로 표시된다. 본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환이 ALK3-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 80의 아미노산 서열이 제공된다.
성숙 ALK3-Fc 융합 단백질 서열 (서열 번호: 81)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신(K)이 제거될 수 있다.
1
GAQNLDSMLH GTGMKSDSDQ KKSENGVTLA PEDTLPFLKC YCSGHCPDDA
51
INNTCITNGH CFAIIEEDDQ GETTLASGCM KYEGSDFQCK DSPKAQLRRT
101
IECCRTNLCN QYLQPTLPPV VIGPFFDGSI RTGGGTHTCP PCPAPELLGG
151
PSVFLFPPKP KDTLMISRTP EVTCVVVDVS HEDPEVKFNW YVDGVEVHNA
201
KTKPREEQYN STYRVVSVLT VLHQDWLNGK EYKCKVSNKA LPAPIEKTIS
251
KAKGQPREPQ VCTLPPSREE MTKNQVSLSC AVKGFYPSDI AVEWESNGQP
301
ENNYKTTPPV LDSDGSFFLV SKLTVDKSRW QQGNVFSCSV MHEALHNHYT
351
QKSLSLSPGK (서열 번호: 81)
특정 측면들에 있어서, 본 명세서는 ALK4 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK4"는 임의의 종으로부터 그리고 이 유발 또는 다른 변형에 의해 그러한 ALK4 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-4 단백질의 패밀리를 나타낸다. ALK4에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK4 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK4 폴리펩티드"는 뿐만 아니라 ALK4 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이 체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 ALK4 전구체 단백질 서열 (NCBI Ref Seq NP_004293)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 인간 ALK4 폴리펩티드 서열은 다음과 같다:
SGPRGVQALLCACTSCLQANYTCETDGACMVSIFNLDGMEHHVRTCIPKVELVPAGKPFYCLSSEDLRNTHCCYTDYCNRIDLRVPSGHLKEPEHPSMWGPVE (서열 번호: 86)
인간 ALK4 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 221에 나타내며, 이는 Genbank 기준 서열 NM_004302.4의 뉴클레오티드 78-1592에 상응한다. 세포외 ALK4 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 222와 같다.
인간 ALK4 전구체 단백질 서열의 대체 아이소폼, 아이소폼 C (NCBI Ref Seq NP_064733.3)은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK4 폴리펩티드 서열 (아이소폼 C)는 다음과 같다:
SGPRGVQALLCACTSCLQANYTCETDGACMVSIFNLDGMEHHVRTCIPKVELVPAGKPFYCLSSEDLRNTHCCYTDYCNRIDLRVPSGHLKEPEHPSMWGPVE (서열 번호: 87)
인간 ALK4 전구체 단백질(아이소폼 C)을 인코드하는 핵산 서열은 서열 번호: 223에 나타내며, 이는 Genbank 기준 서열 NM_020328.3의 뉴클레오티드 78-1715에 상응한다. 세포외 ALK4 폴리펩티드(아이소폼 C)를 인코드하는 핵산 서열은 서열 번호: 224와 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK4 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK4 폴리펩티드들 (가령, ALK4 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK4의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK4 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 84, 86, 85, 87, 88, 89, 92, 또는 93서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK4 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 84, 86, 85, 87, 88, 89, 92, 또는 93서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK4 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK4-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK4-Fc 융합 단백질은 서열 번호: 84 또는 85의 아미노산 22-34중 어느 하나 (가령, 아미노산 잔기 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34)에서 시작하고, 서열 번호: 84 또는 85의 아미노산 101-126중 어느 하나 (가령, 아미노산 잔기 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 및 126)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK4 도메인을 포함한다. 일부 구체예들에서, 상기 ALK4-Fc 융합 단백질은 서열 번호: 84 또는 85의 아미노산 34-101에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK4 도메인을 포함한다. 일부 구체예들에서, 상기 ALK4-Fc 융합 단백질은 서열 번호: 84 또는 85의 아미노산 23-126에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK4 도메인을 포함한다. 일부 구체예들에서, 상기 ALK3-Fc 융합 단백질은 서열 번호: 84, 86, 85, 87, 88, 89, 90, 91, 92, 93, 94, 그리고 95중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK3 도메인을 포함한다.
특정 구체예들에서, 상기 폴리펩티드는 다음과 같은 ALK4-Fc 융합 폴리펩티드 (서열 번호: 88)를 포함한다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파르트산으로 대체됨)이 ALK4-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 88의 아미노산 서열이 제공될 수 있다.
ALK4-Fc 융합 단백질은 다음 핵산 (서열 번호: 243)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCCGGGCC CCGGGGGGTC CAGGCTCTGC
101
TGTGTGCGTG CACCAGCTGC CTCCAGGCCA ACTACACGTG TGAGACAGAT
151
GGGGCCTGCA TGGTTTCCAT TTTCAATCTG GATGGGATGG AGCACCATGT
201
GCGCACCTGC ATCCCCAAAG TGGAGCTGGT CCCTGCCGGG AAGCCCTTCT
251
ACTGCCTGAG CTCGGAGGAC CTGCGCAACA CCCACTGCTG CTACACTGAC
301
TACTGCAACA GGATCGACTT GAGGGTGCCC AGTGGTCACC TCAAGGAGCC
351
TGAGCACCCG TCCATGTGGG GCCCGGTGGA GACCGGTGGT GGAACTCACA
401
CATGCCCACC GTGCCCAGCA CCTGAACTCC TGGGGGGACC GTCAGTCTTC
451
CTCTTCCCCC CAAAACCCAA GGACACCCTC ATGATCTCCC GGACCCCTGA
501
GGTCACATGC GTGGTGGTGG ACGTGAGCCA CGAAGACCCT GAGGTCAAGT
551
TCAACTGGTA CGTGGACGGC GTGGAGGTGC ATAATGCCAA GACAAAGCCG
601
CGGGAGGAGC AGTACAACAG CACGTACCGT GTGGTCAGCG TCCTCACCGT
651
CCTGCACCAG GACTGGCTGA ATGGCAAGGA GTACAAGTGC AAGGTCTCCA
701
ACAAAGCCCT CCCAGCCCCC ATCGAGAAAA CCATCTCCAA AGCCAAAGGG
751
CAGCCCCGAG AACCACAGGT GTACACCCTG CCCCCATCCC GGGAGGAGAT
801
GACCAAGAAC CAGGTCAGCC TGACCTGCCT GGTCAAAGGC TTCTATCCCA
851
GCGACATCGC CGTGGAGTGG GAGAGCAATG GGCAGCCGGA GAACAACTAC
901
GACACCACGC CTCCCGTGCT GGACTCCGAC GGCTCCTTCT TCCTCTATAG
951
CGACCTCACC GTGGACAAGA GCAGGTGGCA GCAGGGGAAC GTCTTCTCAT
1001
GCTCCGTGAT GCATGAGGCT CTGCACAACC ACTACACGCA GAAGAGCCTC
1051
TCCCTGTCTC CGGGT (서열 번호:243)
성숙 ALK4-Fc 융합 폴리펩티드 (서열 번호: 89)는 다음과 같고, 임의선택적으로 C-말단에 리신이 추가된다.
1
SGPRGVQALL CACTSCLQAN YTCETDGACM VSIFNLDGME HHVRTCIPKV
51
ELVPAGKPFY CLSSEDLRNT HCCYTDYCNR IDLRVPSGHL KEPEHPSMWG
101
PVETGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR TPEVTCVVVD
151
VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN
201
GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR EEMTKNQVSL
251
TCLVKGFYPS DIAVEWESNG QPENNYDTTP PVLDSDGSFF LYSDLTVDKS
301
RWQQGNVFSC SVMHEALHNH YTQKSLSLSP G (서열 번호: 89)
일부 구체예들에서, 상기 ALK4-Fc 융합 폴리펩티드 (또는 본 명세서에서 기술된 임의의 Fc 융합 폴리펩티드)는 조직 플라스미노겐 활성자 (TPA) 리더: MDAMKRGLCCVLLLCGAVFVSP (서열 번호: 246)를 이용한다.
일부 구체예들에서, 상기 ALK4-Fc 융합 폴리펩티드 (서열 번호: 92)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
리더 서열 및 링커는 밑줄로 표시된다. 본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환이 ALK4-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 92의 아미노산 서열이 제공된다.
성숙 ALK4-Fc 융합 단백질 서열은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
SGPRGVQALL CACTSCLQAN YTCETDGACM VSIFNLDGME HHVRTCIPKV
51
ELVPAGKPFY CLSSEDLRNT HCCYTDYCNR IDLRVPSGHL KEPEHPSMWG
101
PVETGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR TPEVTCVVVD
151
VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN
201
GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVCTLPPSR EEMTKNQVSL
251
SCAVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF LVSKLTVDKS
301
RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK (서열 번호: 93)
다양한 ActRIIB-Fc:ALK4-Fc 복합체들의 정제는 다음중 3개 또는 그 이상이 임의의 순서로 포함된 일련의 컬럼 크로마토그래피에 의해 실행될 수 있다: 단백질 A 크로마토그래피, Q 세파로즈 크로마토그래피, 페닐세파로즈 크로마토그래피, 크기 압출 크로마토그래피, 및 양이온 교환 크로마토그래피. 상기 정제는 바이러스 여과 및 완충액 교환으로 완성될 수 있다.
일부 구체예들에서, 상기 ALK4-Fc 융합 폴리펩티드 (서열 번호: 247)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
리더 서열 및 링커는 밑줄로 표시된다. 본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환(티로신을 시스테인으로, 트레오닌을 세린으로, 류신을 알라닌으로, 티로신을 발린으로 치환함으로써)이 ALK4-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 상기 ALK4-Fc:ActRIIB-Fc 이종이량체의 정제를 용이하게 하기 위하여, 2개의 아미노산 치환 (아스파라긴을 아르기닌으로, 그리고 아스파르트산을 아르기닌으로 치환)이 ALK4-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 247의 아미노산 서열이 제공된다.
ALK4-Fc 융합 폴리펩티드는 다음 핵산 (서열 번호: 248)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCCGGGCC CCGGGGGGTC CAGGCTCTGC
101
TGTGTGCGTG CACCAGCTGC CTCCAGGCCA ACTACACGTG TGAGACAGAT
151
GGGGCCTGCA TGGTTTCCAT TTTCAATCTG GATGGGATGG AGCACCATGT
201
GCGCACCTGC ATCCCCAAAG TGGAGCTGGT CCCTGCCGGG AAGCCCTTCT
251
ACTGCCTGAG CTCGGAGGAC CTGCGCAACA CCCACTGCTG CTACACTGAC
301
TACTGCAACA GGATCGACTT GAGGGTGCCC AGTGGTCACC TCAAGGAGCC
351
TGAGCACCCG TCCATGTGGG GCCCGGTGGA GACCGGTGGT GGAACTCACA
401
CATGCCCACC GTGCCCAGCA CCTGAACTCC TGGGGGGACC GTCAGTCTTC
451
CTCTTCCCCC CAAAACCCAA GGACACCCTC ATGATCTCCC GGACCCCTGA
501
GGTCACATGC GTGGTGGTGG ACGTGAGCCA CGAAGACCCT GAGGTCAAGT
551
TCAACTGGTA CGTGGACGGC GTGGAGGTGC ATAATGCCAA GACAAAGCCG
601
CGGGAGGAGC AGTACAACAG CACGTACCGT GTGGTCAGCG TCCTCACCGT
651
CCTGCACCAG GACTGGCTGA ATGGCAAGGA GTACAAGTGC AAGGTCTCCA
701
ACAAAGCCCT CCCAGCCCCC ATCGAGAAAA CCATCTCCAA AGCCAAAGGG
751
CAGCCCCGAG AACCACAGGT GTGCACCCTG CCCCCATCCC GGGAGGAGAT
801
GACCAAGAAC CAGGTCAGCC TGTCCTGCGC CGTCAAAGGC TTCTATCCCA
851
GCGACATCGC CGTGGAGTGG GAGAGCCGCG GGCAGCCGGA GAACAACTAC
901
AAGACCACGC CTCCCGTGCT GGACTCCCGC GGCTCCTTCT TCCTCGTGAG
951
CAAGCTCACC GTGGACAAGA GCAGGTGGCA GCAGGGGAAC GTCTTCTCAT
1001
GCTCCGTGAT GCATGAGGCT CTGCACAACC ACTACACGCA GAAGAGCCTC
1051
TCCCTGTCTC CGGGTAAA (서열 번호: 248)
성숙 ALK4-Fc 융합 폴리펩티드 서열은 다음 (서열 번호: 249)과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
SGPRGVQALL CACTSCLQAN YTCETDGACM VSIFNLDGME HHVRTCIPKV
51
ELVPAGKPFY CLSSEDLRNT HCCYTDYCNR IDLRVPSGHL KEPEHPSMWG
101
PVETGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR TPEVTCVVVD
151
VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN
201
GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVCTLPPSR EEMTKNQVSL
251
SCAVKGFYPS DIAVEWESRG QPENNYKTTP PVLDSRGSFF LVSKLTVDKS
301
RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK (서열 번호: 249)
이 ALK4-Fc 융합 폴리펩티드는 다음 핵산 (서열 번호: 250)에 의해 인코드된다:
1
TCCGGGCCCC GGGGGGTCCA GGCTCTGCTG TGTGCGTGCA CCAGCTGCCT
51
CCAGGCCAAC TACACGTGTG AGACAGATGG GGCCTGCATG GTTTCCATTT
101
TCAATCTGGA TGGGATGGAG CACCATGTGC GCACCTGCAT CCCCAAAGTG
151
GAGCTGGTCC CTGCCGGGAA GCCCTTCTAC TGCCTGAGCT CGGAGGACCT
201
GCGCAACACC CACTGCTGCT ACACTGACTA CTGCAACAGG ATCGACTTGA
251
GGGTGCCCAG TGGTCACCTC AAGGAGCCTG AGCACCCGTC CATGTGGGGC
301
CCGGTGGAGA CCGGTGGTGG AACTCACACA TGCCCACCGT GCCCAGCACC
351
TGAACTCCTG GGGGGACCGT CAGTCTTCCT CTTCCCCCCA AAACCCAAGG
401
ACACCCTCAT GATCTCCCGG ACCCCTGAGG TCACATGCGT GGTGGTGGAC
451
GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG TGGACGGCGT
501
GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG TACAACAGCA
551
CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA CTGGCTGAAT
601
GGCAAGGAGT ACAAGTGCAA GGTCTCCAAC AAAGCCCTCC CAGCCCCCAT
651
CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA CCACAGGTGT
701
GCACCCTGCC CCCATCCCGG GAGGAGATGA CCAAGAACCA GGTCAGCCTG
751
TCCTGCGCCG TCAAAGGCTT CTATCCCAGC GACATCGCCG TGGAGTGGGA
801
GAGCCGCGGG CAGCCGGAGA ACAACTACAA GACCACGCCT CCCGTGCTGG
851
ACTCCCGCGG CTCCTTCTTC CTCGTGAGCA AGCTCACCGT GGACAAGAGC
901
AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC ATGAGGCTCT
951
GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG GGTAAA
(서열 번호: 250)
특정 구체예들에서, 상기 ALK4-Fc 융합 폴리펩티드는 서열 번호: 92 (상기에 나타냄)이며, 이것은 본 명세서에서 기술된 특정 Fc 융합 폴리펩티드의 이종이량체 형성을 유도하기 위한 4개의 아미노산 치환을 포함하며, 그리고 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
이 ALK4-Fc 융합 폴리펩티드는 다음 핵산 (서열 번호: 251)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCCGGGCC CCGGGGGGTC CAGGCTCTGC
101
TGTGTGCGTG CACCAGCTGC CTCCAGGCCA ACTACACGTG TGAGACAGAT
151
GGGGCCTGCA TGGTTTCCAT TTTCAATCTG GATGGGATGG AGCACCATGT
201
GCGCACCTGC ATCCCCAAAG TGGAGCTGGT CCCTGCCGGG AAGCCCTTCT
251
ACTGCCTGAG CTCGGAGGAC CTGCGCAACA CCCACTGCTG CTACACTGAC
301
TACTGCAACA GGATCGACTT GAGGGTGCCC AGTGGTCACC TCAAGGAGCC
351
TGAGCACCCG TCCATGTGGG GCCCGGTGGA GACCGGTGGT GGAACTCACA
401
CATGCCCACC GTGCCCAGCA CCTGAACTCC TGGGGGGACC GTCAGTCTTC
451
CTCTTCCCCC CAAAACCCAA GGACACCCTC ATGATCTCCC GGACCCCTGA
501
GGTCACATGC GTGGTGGTGG ACGTGAGCCA CGAAGACCCT GAGGTCAAGT
551
TCAACTGGTA CGTGGACGGC GTGGAGGTGC ATAATGCCAA GACAAAGCCG
601
CGGGAGGAGC AGTACAACAG CACGTACCGT GTGGTCAGCG TCCTCACCGT
651
CCTGCACCAG GACTGGCTGA ATGGCAAGGA GTACAAGTGC AAGGTCTCCA
701
ACAAAGCCCT CCCAGCCCCC ATCGAGAAAA CCATCTCCAA AGCCAAAGGG
751
CAGCCCCGAG AACCACAGGT GTGCACCCTG CCCCCATCCC GGGAGGAGAT
801
GACCAAGAAC CAGGTCAGCC TGTCCTGCGC CGTCAAAGGC TTCTATCCCA
851
GCGACATCGC CGTGGAGTGG GAGAGCAATG GGCAGCCGGA GAACAACTAC
901
AAGACCACGC CTCCCGTGCT GGACTCCGAC GGCTCCTTCT TCCTCGTGAG
951
CAAGCTCACC GTGGACAAGA GCAGGTGGCA GCAGGGGAAC GTCTTCTCAT
1001
GCTCCGTGAT GCATGAGGCT CTGCACAACC ACTACACGCA GAAGAGCCTC
1051
TCCCTGTCTC CGGGTAAA (서열 번호: 251)
성숙 ALK4-Fc 융합 폴리펩티드 서열은 서열 번호: 93(상기에 나타냄)과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
이 ALK4-Fc 융합 폴리펩티드는 다음 핵산 (서열 번호: 252)에 의해 인코드된다:
1
TCCGGGCCCC GGGGGGTCCA GGCTCTGCTG TGTGCGTGCA CCAGCTGCCT
51
CCAGGCCAAC TACACGTGTG AGACAGATGG GGCCTGCATG GTTTCCATTT
101
TCAATCTGGA TGGGATGGAG CACCATGTGC GCACCTGCAT CCCCAAAGTG
151
GAGCTGGTCC CTGCCGGGAA GCCCTTCTAC TGCCTGAGCT CGGAGGACCT
201
GCGCAACACC CACTGCTGCT ACACTGACTA CTGCAACAGG ATCGACTTGA
251
GGGTGCCCAG TGGTCACCTC AAGGAGCCTG AGCACCCGTC CATGTGGGGC
301
CCGGTGGAGA CCGGTGGTGG AACTCACACA TGCCCACCGT GCCCAGCACC
351
TGAACTCCTG GGGGGACCGT CAGTCTTCCT CTTCCCCCCA AAACCCAAGG
401
ACACCCTCAT GATCTCCCGG ACCCCTGAGG TCACATGCGT GGTGGTGGAC
451
GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG TGGACGGCGT
501
GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG TACAACAGCA
551
CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA CTGGCTGAAT
601
GGCAAGGAGT ACAAGTGCAA GGTCTCCAAC AAAGCCCTCC CAGCCCCCAT
651
CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA CCACAGGTGT
701
GCACCCTGCC CCCATCCCGG GAGGAGATGA CCAAGAACCA GGTCAGCCTG
751
TCCTGCGCCG TCAAAGGCTT CTATCCCAGC GACATCGCCG TGGAGTGGGA
801
GAGCAATGGG CAGCCGGAGA ACAACTACAA GACCACGCCT CCCGTGCTGG
851
ACTCCGACGG CTCCTTCTTC CTCGTGAGCA AGCTCACCGT GGACAAGAGC
901
AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC ATGAGGCTCT
951
GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG GGTAAA
(서열 번호: 252)
다양한 ALK4-Fc:ActRIIB-Fc 복합체들의 정제는 다음중 3개 또는 그 이상이 임의의 순서로 포함된 일련의 컬럼 크로마토그래피에 의해 실행될 수 있다: 단백질 A 크로마토그래피, Q 세파로즈 크로마토그래피, 페닐세파로즈 크로마토그래피, 크기 압출 크로마토그래피, 에피토프-기반 친화성 크로마토 그래피 (예를 들어, 항체 또는 ALK4 또는 ActRIIB상의 에피토프에 대해 지시된 항체 또는 기능적으로 동등한 리간드) 및 다중형태 크로마토 그래피 (예를 들어, 정전기 및 소수성 리간드를 모두 함유하는 수지와 함께). 상기 정제는 바이러스 여과 및 완충액 교환으로 완성될 수 있다.
특정 측면들에 있어서, 본 명세서는 ALK5 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK5"는 임의의 종으로부터 그리고 이 유발 또는 다른 변형에 의해 그러한 ALK5 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-5 단백질의 패밀리를 나타낸다. ALK5에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK5 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK5 폴리펩티드"는 뿐만 아니라 ALK5 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이 체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 ALK5 전구체 단백질 서열 (NCBI Ref Seq NP_004603.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK5 폴리펩티드 서열은 다음과 같다:
AALLPGATALQCFCHLCTKDNFTCVTDGLCFVSVTETTDKVIHNSMCIAEIDLIPRDRPFVCAPSSKTGSVTTTYCCNQDHCNKIELPTTVKSSPGLGPVEL (서열 번호: 98)
인간 ALK5 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 225에 나타내며, 이는 Genbank 기준 서열 NM_004612.2의 뉴클레오티드 77-1585에 상응한다. 세포외 인간 ALK5 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 226과 같다.
인간 ALK5 전구체 단백질 서열의 대체 아이소폼, 아이소폼 2 (NCBI Ref Seq XP_005252207.1)은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK5 폴리펩티드 서열 (아이소폼 2)는 다음과 같다:
AALLPGATALQCFCHLCTKDNFTCVTDGLCFVSVTETTDKVIHNSMCIAEIDLIPRDRPFVCAPSSKTGSVTTTYCCNQDHCNKIELPTTGPFSVKSSPGLGPVEL (서열 번호: 99)
인간 ALK5 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 227에 나타내며, 이는 Genbank 기준 서열 XM_005252150.1의 뉴클레오티드 77-1597에 상응한다. 세포외 ALK5 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 228과 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK5 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK5 폴리펩티드들 (가령, ALK5 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK5의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK5 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 96, 98, 97, 또는 99서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK5 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 96, 98, 97, 또는 99서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK5 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK5-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK5-Fc 융합 단백질은 서열 번호: 96 또는 97의 아미노산 25-36중 어느 하나 (가령, 아미노산 잔기 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 및 36)에서 시작하고, 서열 번호: 96 또는 97의 아미노산 106-126중 어느 하나 (가령, 아미노산 잔기 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 및 126)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK5 도메인을 포함한다. 일부 구체예들에서, 상기 ALK5-Fc 융합 단백질은 서열 번호: 96 또는 97의 아미노산 36-106에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK5 도메인을 포함한다. 일부 구체예들에서, 상기 ALK5-Fc 융합 단백질은 서열 번호: 96 또는 97의 아미노산 25-126에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK5 도메인을 포함한다. 일부 구체예들에서, 상기 ALK5-Fc 융합 단백질은 서열 번호: 96, 98, 97, 99, 100, 101, 102, 103, 104, 105, 106, 및 107중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK5 도메인을 포함한다.
상보적 ALK5-Fc 융합 단백질은 TPA 리더를 이용하며, 다음과 같다 (서열 번호: 100):
신호 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIB-Fc:ALK5-Fc이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파트르산으로 대체됨)이 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 100의 아미노산 서열이 제공될 수 있다.
ALK5-Fc 융합 단백질은 다음 핵산 (서열 번호: 253)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCGCGCTGCT CCCGGGGGCG ACGGCGTTAC
101
AGTGTTTCTG CCACCTCTGT ACAAAAGACA ATTTTACTTG TGTGACAGAT
151
GGGCTCTGCT TTGTCTCTGT CACAGAGACC ACAGACAAAG TTATACACAA
201
CAGCATGTGT ATAGCTGAAA TTGACTTAAT TCCTCGAGAT AGGCCGTTTG
251
TATGTGCACC CTCTTCAAAA ACTGGGTCTG TGACTACAAC ATATTGCTGC
301
AATCAGGACC ATTGCAATAA AATAGAACTT CCAACTACTG TAAAGTCATC
351
ACCTGGCCTT GGTCCTGTGG AAACCGGTGG TGGAACTCAC ACATGCCCAC
401
CGTGCCCAGC ACCTGAACTC CTGGGGGGAC CGTCAGTCTT CCTCTTCCCC
451
CCAAAACCCA AGGACACCCT CATGATCTCC CGGACCCCTG AGGTCACATG
* 501
CGTGGTGGTG GACGTGAGCC ACGAAGACCC TGAGGTCAAG TTCAACTGGT
551
ACGTGGACGG CGTGGAGGTG CATAATGCCA AGACAAAGCC GCGGGAGGAG
601
CAGTACAACA GCACGTACCG TGTGGTCAGC GTCCTCACCG TCCTGCACCA
651
GGACTGGCTG AATGGCAAGG AGTACAAGTG CAAGGTCTCC AACAAAGCCC
701
TCCCAGCCCC CATCGAGAAA ACCATCTCCA AAGCCAAAGG GCAGCCCCGA
751
GAACCACAGG TGTACACCCT GCCCCCATCC CGGGAGGAGA TGACCAAGAA
801
CCAGGTCAGC CTGACCTGCC TGGTCAAAGG CTTCTATCCC AGCGACATCG
* 851
CCGTGGAGTG GGAGAGCAAT GGGCAGCCGG AGAACAACTA CGACACCACG
901
CCTCCCGTGC TGGACTCCGA CGGCTCCTTC TTCCTCTATA GCGACCTCAC
951
CGTGGACAAG AGCAGGTGGC AGCAGGGGAA CGTCTTCTCA TGCTCCGTGA
1001
TGCATGAGGC TCTGCACAAC CACTACACGC AGAAGAGCCT CTCCCTGTCT
1051
CCGGGT (서열 번호: 253)
성숙 ALK5-Fc 융합 단백질 서열 (서열 번호: 101)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 추가될 수 있다.
1
ALLPGATALQ CFCHLCTKDN FTCVTDGLCF VSVTETTDKV IHNSMCIAEI
51
DLIPRDRPFV CAPSSKTGSV TTTYCCNQDH CNKIELPTTV KSSPGLGPVE
101
TGGGTHTCPP CPAPELLGGP SVFLFPPKPK DTLMISRTPE VTCVVVDVSH
151
EDPEVKFNWY VDGVEVHNAK TKPREEQYNS TYRVVSVLTV LHQDWLNGKE
201
YKCKVSNKAL PAPIEKTISK AKGQPREPQV YTLPPSREEM TKNQVSLTCL
251
VKGFYPSDIA VEWESNGQPE NNYDTTPPVL DSDGSFFLYS DLTVDKSRWQ
301
QGNVFSCSVM HEALHNHYTQ KSLSLSPG (서열 번호: 101)
비대칭 Fc 융합 단백질을 이용한 이형다량체 복합체들의 형성을 촉진시키는 또다른 방법에서, 상보적 소수성 상호작용과 추가적인 분자간 이황화결합을 도입하도록 Fc 도메인이 변경된다.
일부 구체예들에서, 상기 ALK5-Fc 융합 폴리펩티드 (서열 번호: 104)는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환이 ALK5-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 또한, Fc 도메인의 C-말단 라이신 잔기는 결실될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 104의 아미노산 서열이 제공된다.
성숙 ALK5-Fc 융합 단백질 서열 (서열 번호: 105)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
ALLPGATALQ CFCHLCTKDN FTCVTDGLCF VSVTETTDKV IHNSMCIAEI
51
DLIPRDRPFV CAPSSKTGSV TTTYCCNQDH CNKIELPTTV KSSPGLGPVE
101
TGGGTHTCPP CPAPELLGGP SVFLFPPKPK DTLMISRTPE VTCVVVDVSH
151
EDPEVKFNWY VDGVEVHNAK TKPREEQYNS TYRVVSVLTV LHQDWLNGKE
201
YKCKVSNKAL PAPIEKTISK AKGQPREPQV CTLPPSREEM TKNQVSLSCA
251
VKGFYPSDIA VEWESNGQPE NNYKTTPPVL DSDGSFFLVS KLTVDKSRWQ
301
QGNVFSCSVM HEALHNHYTQ KSLSLSPGK (서열 번호: 105)
특정 측면들에 있어서, 본 명세서는 ALK6 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK6"는 임의의 종으로부터 그리고 이 유발 또는 다른 변형에 의해 그러한 ALK6 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-6 단백질의 패밀리를 나타낸다. ALK6에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK6 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK6 폴리펩티드"는 뿐만 아니라 ALK6 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이체, 단편, 융합체 및 펩티드 유사체를 포함)를 포함한다.
인간 ALK6 전구체 단백질 서열 (NCBI Ref Seq NP_001194.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK6 폴리펩티드 서열은 다음과 같다:
KKEDGESTAPTPRPKVLRCKCHHHCPEDSVNNICSTDGYCFTMIEEDDSGLPVVTSGCLGLEGSDFQCRDTPIPHQRRSIECCTERNECNKDLHPTLPPLKNRDFVDGPIHHR (서열 번호: 109)
ALK6 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 229에 나타내며, 이는 Genbank 기준 서열 NM_001203.2의 뉴클레오티드 275-1780에 상응한다. 세포외 ALK6 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 230과 같다.
인간 ALK6 전구체 단백질 서열의 대체 아이소폼, 아이소폼 2 (NCBI Ref Seq NP_001243722.1)은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK6 폴리펩티드 서열 (아이소폼 2)는 다음과 같다:
NFLDNMLLRSAGKLNVGTKKEDGESTAPTPRPKVLRCKCHHHCPEDSVNNICSTDGYCFTMIEEDDSGLPVVTSGCLGLEGSDFQCRDTPIPHQRRSIECCTERNECNKDLHPTLPPLKNRDFVDGPIHHR (서열 번호: 111)
인간 ALK6 전구체 단백질(아이소폼 2)을 인코드하는 핵산 서열은 서열 번호: 231에 나타내며, 이는 Genbank 기준 서열 NM_001256793.1의 뉴클레오티드 22-1617에 상응한다. 세포외 ALK6 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 232와 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK6 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK6 폴리펩티드들 (가령, ALK6 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK6의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK6 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 108, 109, 110, 또는 111서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK6 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 108, 109, 110, 또는 111서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK6 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK6-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 108의 아미노산 14-32중 어느 하나 (가령, 아미노산 잔기 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 및 32)에서 시작하고, 서열 번호: 108의 아미노산 102-126중 어느 하나 (가령, 아미노산 잔기 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 및 126)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK6 도메인을 포함한다. 일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 108의 아미노산 32-102에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK3 도메인을 포함한다. 일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 108의 아미노산 14-126에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK6 도메인을 포함한다. 일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 서열 번호: 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 그리고 119중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK6 도메인을 포함한다.
일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 110의 아미노산 26-62중 어느 하나 (가령, 아미노산 잔기 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 및 62)에서 시작하고, 서열 번호: 110의 아미노산 132-156 중 어느 하나 (가령, 아미노산 잔기 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 및 156)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK6 도메인을 포함한다. 일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 110의 아미노산 62-132에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK6 도메인을 포함한다. 일부 구체예들에서, 상기 ALK6-Fc 융합 단백질은 서열 번호: 110의 아미노산 26-156에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK6 도메인을 포함한다.
상보적 ALK6-Fc 융합 단백질은 TPA 리더를 이용하며, 다음과 같다 (서열 번호: 112):
신호 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIB-Fc:ALK6-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파트르산으로 대체됨)이 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 112의 아미노산 서열이 제공될 수 있다.
ALK6-Fc 융합 단백질은 다음 핵산 (서열 번호: 254)에 의해 인코드된다:
성숙 ALK6-Fc 융합 단백질 서열 (서열 번호: 113)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 추가될 수 있다.
1
KKEDGESTAP TPRPKVLRCK CHHHCPEDSV NNICSTDGYC FTMIEEDDSG
51
LPVVTSGCLG LEGSDFQCRD TPIPHQRRSI ECCTERNECN KDLHPTLPPL
101
KNRDFVDGPI HHRTGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR
151
TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV
201
LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR
251
EEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYDTTP PVLDSDGSFF
301
LYSDLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP G
(서열 번호: 113)
비대칭 Fc 융합 단백질을 이용한 이형다량체 복합체들의 형성을 촉진시키는 또다른 방법에서, 상보적 소수성 상호작용과 추가적인 분자간 이황화결합을 도입하도록 Fc 도메인이 변경될 수 있다.
상보적 형태의 ALK6-Fc 융합 폴리펩티드 (서열 번호: 116)는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환이 ALK6-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 또한, Fc 도메인의 C-말단 라이신 잔기는 결실될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 116의 아미노산 서열이 제공된다.
성숙 ALK6-Fc 융합 단백질 서열 (서열 번호: 117)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
KKEDGESTAP TPRPKVLRCK CHHHCPEDSV NNICSTDGYC FTMIEEDDSG
51
LPVVTSGCLG LEGSDFQCRD TPIPHQRRSI ECCTERNECN KDLHPTLPPL
101
KNRDFVDGPI HHRTGGGTHT CPPCPAPELL GGPSVFLFPP KPKDTLMISR
151
TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV
201 LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVCTLPPSR
251
EEMTKNQVSL SCAVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF
301
LVSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP GK
(서열 번호: 117)
특정 측면들에 있어서, 본 명세서는 ALK7 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ALK7"은 임의의 종으로부터 그리고 이 유발 또는 다른 변형에 의해 그러한 ALK7 단백질로부터 유래된 변이체로부터 액티빈 수용체-유사 키나제-7 단백질의 패밀리를 나타낸다. ALK7에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ALK7 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ALK7 폴리펩티드"는 뿐만 아니라 ALK7 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 ALK7의 4 개의 자연 발생적 아이소폼이 기술되었다. 인간 ALK7 아이소폼 1 전구체 단백질 (NCBI Ref Seq NP_660302.2)의 서열은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 ALK7 아이소폼 1 폴리펩티드 서열은 다음과 같다:
ELSPGLKCVCLLCDSSNFTCQTEGACWASVMLTNGKEQVIKSCVSLPELNAQVFCHSSNNVTKTECCFTDFCNNITLHLPTASPNAPKLGPME (서열 번호: 123)
인간 ALK7 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 233에 나타내며, 이는 Genbank 기준 서열 NM_145259.2의 뉴클레오티드 244-1722에 상응한다. 프로세스된 세포외 ALK7 폴리펩티드(아이소폼 1)를 인코드하는 핵산 서열은 서열 번호: 234와 같다.
인간 ALK7의 대체 아이소폼, 아이소폼 2 (NCBI Ref Seq NP_001104501.1)의 아미노산 서열(서열 번호: 124)은 다음과 같이, 이의 프로세스된 형태이며, 이때 세포외 도메인은 굵게 표시된다.
세포외 ALK7 폴리펩티드 (아이소폼 2)의 아미노산 서열은 다음과 같다:
MLTNGKEQVIKSCVSLPELNAQVFCHSSNNVTKTECCFTDFCNNITLHLPTASPNAPKLGPME (서열 번호: 125).
프로세스된 ALK7 폴리펩티드 (아이소폼 2)를 인코딩하는 서열은 하기 서열 번호: 235에 나타내며, NCBI 참조 서열 NM_001111031.1의 뉴클레오티드 279-1607에 상응한다
세포외 ALK7 폴리펩티드 (아이소폼 2)를 인코드하는 핵산 서열은 서열 번호: 236과 같다.
대체 인간 ALK7 전구체 단백질, 아이소폼 3 (NCBI Ref Seq NP_001104502.1)의 아미노산 서열은 다음과 같고 (서열 번호: 121), 여기에서 신호 펩티드는 단일 밑줄로 표시된다.
프로세스된 ALK7 폴리펩티드 (아이소폼 3)의 아미노산 서열은 다음과 같다 (서열 번호: 126). 이 아이소폼은 막 횡단 도메인이 없으므로, 그 전체가 가용성이 될 수 있다고 제안된다(Roberts et al., 2003, Biol Reprod 68:1719-1726). 서열 번호: 126의 N-말단 변이체가 다음에 기술된 바와 같이 예상된다.
프로세스안된 ALK7 폴리펩티드 전구체 단백질 (아이소폼 3)를 인코딩하는 핵산 서열은 서열 번호: 237에 나타내며, NCBI 참조 서열 NM_001111032.1의 뉴클레오티드 244-1482에 상응한다. 프로세스된 ALK7 폴리펩티드 (아이소폼 3)를 인코딩하는 핵산 서열은 서열 번호: 238에 나타낸다.
대체 인간 ALK7 전구체 단백질, 아이소폼 4 (NCBI Ref Seq NP_001104503.1)의 아미노산 서열은 다음과 같고 (서열 번호: 122), 여기에서 신호 펩티드는 단일 밑줄로 표시된다.
프로세스된 ALK7 폴리펩티드 (아이소폼 4)의 아미노산 서열은 다음과 같다 (서열 번호: 127). ALK7 아이소폼 3과 같이, 아이소폼 4는 막 횡단 도메인이 없으므로, 그 전체가 가용성이 될 수 있다고 제안된다(Roberts et al., 2003, Biol Reprod 68:1719-1726). 서열 번호: 127의 N-말단 변이체가 다음에 기술된 바와 같이 예상된다.
프로세스안된 ALK7 폴리펩티드 전구체 단백질 (아이소폼 4)를 인코딩하는 핵산 서열은 서열 번호: 239에 나타내며, NCBI 참조 서열 NM_001111033.1의 뉴클레오티드 244-1244에 상응한다. 프로세스된 ALK7 폴리펩티드 (아이소폼 4)를 인코딩하는 핵산 서열은 서열 번호: 240에 나타낸다.
랫에서의 전장 ALK7 (아이소폼 1)의 신호 서열 (NCBI 참조 서열 NP_620790.1 참조) 및 인간과 렛 ALK7 사이의 고도의 서열 동일성에 기초하여, 인간 ALK7 아이소폼 1의 프로세스된 형태는 다음(서열 번호: 128)과 같다고 예측된다.
프로세스된 ALK7 아이소폼 1의 활성 변이체는 서열 번호: 123의 N-말단에서 1, 2, 3, 4, 5, 6, 또는 7개의 아미노산이 절두되고, 서열 번호: 128의 N-말단에서 1 또는 2개의 아미노산이 절두되는 것으로 예상된다. 서열 번호: 128과 일관되게, 류신은 인간 ALK7 아이소폼 3 (서열 번호: 126) 및 인간 ALK7 아이소폼 4 (서열 번호: 127)의 프로세스된 형태에서 N-말단 아미노산인 것으로 추가 예상된다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ALK7 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ALK7 폴리펩티드들 (가령, ALK7 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ALK7의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ALK7 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 120, 123, 129, 130, 124, 125, 121, 126, 122, 127, 128, 133, 또는 134서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK7 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 120, 123, 129, 130, 124, 125, 121, 126, 122, 127, 128, 133, 또는 134서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ALK7 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 ALK7-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ALK7-Fc 융합 단백질은 서열 번호: 120, 121, 또는 122의 아미노산 21-28중 어느 하나 (가령, 아미노산 잔기 21, 22, 23, 24, 25, 26, 27, 및 28)에서 시작하고, 서열 번호: 120, 121, 또는 122의 아미노산 92-113중 어느 하나 (가령, 아미노산 잔기 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 및 113)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK7 도메인을 포함한다. 일부 구체예들에서, 상기 ALK7-Fc 융합 단백질은 서열 번호: 120, 121, 또는 122의 아미노산 28-92에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK7 도메인을 포함한다. 일부 구체예들에서, 상기 ALK7-Fc 융합 단백질은 서열 번호: 120, 121, 또는 122의 아미노산 21-113에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK7 도메인을 포함한다. 일부 구체예들에서, 상기 ALK7-Fc 융합 단백질은 서열 번호: 서열 번호: 서열 번호: 120, 123, 124, 125, 121, 126, 122, 127, 128, 129, 130, 131, 132, 133, 134, 135, 그리고 136중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ALK7 도메인을 포함한다.
일부 구체예들에서, 상기 ALK7-Fc 융합 단백질은 TPA 리더를 이용하며, 다음과 같다(서열 번호: 129):
신호 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIB-Fc:ALK7-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (리신이 아스파트르산으로 대체됨)이 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 129의 아미노산 서열이 제공될 수 있다.
ALK7-Fc 융합 단백질은 다음 핵산 (서열 번호: 255)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCGGACTGAA GTGTGTATGT CTTTTGTGTG
101
ATTCTTCAAA CTTTACCTGC CAAACAGAAG GAGCATGTTG GGCATCAGTC
151
ATGCTAACCA ATGGAAAAGA GCAGGTGATC AAATCCTGTG TCTCCCTTCC
201
AGAACTGAAT GCTCAAGTCT TCTGTCATAG TTCCAACAAT GTTACCAAAA
251
CCGAATGCTG CTTCACAGAT TTTTGCAACA ACATAACACT GCACCTTCCA
301
ACAGCATCAC CAAATGCCCC AAAACTTGGA CCCATGGAGA CCGGTGGTGG
351
AACTCACACA TGCCCACCGT GCCCAGCACC TGAACTCCTG GGGGGACCGT
401
CAGTCTTCCT CTTCCCCCCA AAACCCAAGG ACACCCTCAT GATCTCCCGG
451
ACCCCTGAGG TCACATGCGT GGTGGTGGAC GTGAGCCACG AAGACCCTGA
501
GGTCAAGTTC AACTGGTACG TGGACGGCGT GGAGGTGCAT AATGCCAAGA
551
CAAAGCCGCG GGAGGAGCAG TACAACAGCA CGTACCGTGT GGTCAGCGTC
601
CTCACCGTCC TGCACCAGGA CTGGCTGAAT GGCAAGGAGT ACAAGTGCAA
651
GGTCTCCAAC AAAGCCCTCC CAGCCCCCAT CGAGAAAACC ATCTCCAAAG
701
CCAAAGGGCA GCCCCGAGAA CCACAGGTGT ACACCCTGCC CCCATCCCGG
751
GAGGAGATGA CCAAGAACCA GGTCAGCCTG ACCTGCCTGG TCAAAGGCTT
801
CTATCCCAGC GACATCGCCG TGGAGTGGGA GAGCAATGGG CAGCCGGAGA
851
ACAACTACGA CACCACGCCT CCCGTGCTGG ACTCCGACGG CTCCTTCTTC
901
CTCTATAGCG ACCTCACCGT GGACAAGAGC AGGTGGCAGC AGGGGAACGT
951
CTTCTCATGC TCCGTGATGC ATGAGGCTCT GCACAACCAC TACACGCAGA
1001
AGAGCCTCTC CCTGTCTCCG GGT (서열 번호: 255)
성숙 ALK7-Fc 융합 단백질 서열 (서열 번호: 130)은 다음과 같이 예상되고, 임의선택적으로 C-말단으로부터 리신이 추가될 수 있다.
1
GLKCVCLLCD SSNFTCQTEG ACWASVMLTN GKEQVIKSCV SLPELNAQVF
51
CHSSNNVTKT ECCFTDFCNN ITLHLPTASP NAPKLGPMET GGGTHTCPPC
101
PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE DPEVKFNWYV
151
DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY KCKVSNKALP
201
APIEKTISKA KGQPREPQVY TLPPSREEMT KNQVSLTCLV KGFYPSDIAV
251
EWESNGQPEN NYDTTPPVLD SDGSFFLYSD LTVDKSRWQQ GNVFSCSVMH
301
EALHNHYTQK SLSLSPG (서열 번호: 130)
상보적 형태의 ALK7-Fc 융합 폴리펩티드 (서열 번호: 133)는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환이 ALK7-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 또한, Fc 도메인의 C-말단 라이신 잔기는 결실될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 133의 아미노산 서열이 제공된다.
성숙 ALK7-Fc 융합 단백질 서열 (서열 번호: 134)은 다음과 같을 것으로 예상되고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
GLKCVCLLCD SSNFTCQTEG ACWASVMLTN GKEQVIKSCV SLPELNAQVF
51
CHSSNNVTKT ECCFTDFCNN ITLHLPTASP NAPKLGPMET GGGTHTCPPC
101
PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE DPEVKFNWYV
151
DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY KCKVSNKALP
201
APIEKTISKA KGQPREPQVC TLPPSREEMT KNQVSLSCAV KGFYPSDIAV
251
EWESNGQPEN NYKTTPPVLD SDGSFFLVSK LTVDKSRWQQ GNVFSCSVMH
301
EALHNHYTQK SLSLSPGK (서열 번호: 134)
특정 구체예들에서, 본 명세서는 ActRIIA 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "ActRIIA"는 임의의 종으로부터 그리고 이 유발 또는 다른 변형에 의해 그러한 ActRIIA 단백질로부터 유래된 변이체로부터 액티빈 수용체 유형 IIA (ActRIIA) 단백질의 패밀리를 나타낸다. ActRIIA에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. ActRIIA 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "ActRIIA 폴리펩티드"는 뿐만 아니라 ActRIIA 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이 체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다. 이러한 변이체 ActRIIA 폴리펩티드들의 예는 본 명세서 뿐만 아니라 국제 특허 출원 공개 번호. WO 2006/012627에서 제공되며, 이들은 전문이 본 명세서의 참고자료에 편입된다.
인간 ActRIIA 전구체 단백질 서열은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시되며; 잠재적인 내인성 N-연계된 당화 부위는 이중 밑줄로 표시된다.
프로세스된 세포외 인간 ActRIIA 폴리펩티드 서열은 다음과 같다:
ILGRSETQECLFFNANWEKDRTNQTGVEPCYGDKDKRRHCFATWKNISGSIEIVKQGCWLDDINCYDRTDCVEKKDSPEVYFCCCEGNMCNEKFSYFPEMEVTQPTSNPVTPKPP (서열 번호: 138)
세포외 도메인의 C-말단 "꼬리(tail)"는 단일 밑줄로 나타낸다. 결손된 "꼬리"를 갖는 서열(Δ15 서열)은 다음과 같다:
ILGRSETQECLFFNANWEKDRTNQTGVEPCYGDKDKRRHCFATWKNISGSIEIVKQGCWLDDINCYDRTDCVEKKDSPEVYFCCCEGNMCNEKFSYFPEM (서열 번호: 139)
인간 ActRIIA 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 241에 나타내며, 이는 Genbank 기준 서열 NM_001616.4의 뉴클레오티드 159-1700에 상응한다. 세포외 ActRIIA 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 242와 같다.
활성 (가령, 리간드 결합) ActRIIA 폴리펩티드의 일반적인 형태는 서열 번호: 137의 아미노산 위치 30에서 시작하고, 서열 번호: 137의 아미노산 위치 110에서 종료되는 폴리펩티드를 포함하는 것이다. 따라서, 본 명세서의 ActRIIA 폴리펩티드는 서열 번호: 137의 아미노산 30-110에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 폴리펩티드를 포함할 수 있다. 임의선택적으로, 본 명세서의 ActRIIA 폴리펩티드는 서열 번호: 137의 아미노산 12-82에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하고, 임의선택적으로 1-5 (가령, 1, 2, 3, 4, 또는 5) 또는 3-5 (가령, 3, 4, 또는 5) 범위의 위치에서 시작되고, 그리고 위치 110-116 (가령, 110, 111, 112, 113, 114, 115, 또는 116) 또는 110-115 (가령, 110, 111, 112, 113, 114, 또는 115)에서 종료되며, 그리고 리간드 결합 포켓에서 단지 1, 2, 5, 10 또는 15개의 보존적 아미노산 변화를 포함하며, 그리고 서열 번호: 137에 대하여 리간드 결합 포켓의 위치 40, 53, 55, 74, 79 및/또는 82에서 0, 1 또는 그 이상의 비-보존적 변경을 포함하는, 폴리펩티드를 포함한다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 ActRIIA 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 ActRIIA 폴리펩티드들 (가령, ActRIIA 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, ActRIIA의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 ActRIIA 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 137, 138, 139, 140, 141, 144, 또는 145의 아미노산 서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ActRIIA 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 137, 138, 139, 140, 141, 144, 또는 145의 아미노산 서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 ActRIIA 폴리펩티드를 포함한다.
특정 양태에서, 본 명세서는 ActRIIA-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 ActRIIA-Fc 융합 단백질은 서열 번호: 137의 아미노산 21-30중 어느 하나 (가령, 아미노산 잔기 1, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30)에서 시작하고, 서열 번호: 137의 아미노산 110-135 중 어느 하나 (가령, 아미노산 잔기 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134 또는 135)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ActRIIA 도메인을 포함한다. 일부 구체예들에서, 상기 ActRIIA-Fc 융합 단백질은 서열 번호: 137의 아미노산 30-110에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ActRIIA 도메인을 포함한다. 일부 구체예들에서, 상기 ActRIIA-Fc 융합 단백질은 서열 번호: 137의 아미노산 21-135에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ActRIIA 도메인을 포함한다. 일부 구체예들에서, 상기 ActRIIA-Fc 융합 단백질은 서열 번호: 서열 번호: 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 및 147중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, ActRIIA 도메인을 포함한다.
상기 ActRIIA-Fc 폴리펩티드 서열 (서열 번호: 140)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIA-Fc:ActRIIB-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (산성 아미노산이 리신으로 대체됨)이 ActRIIA 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 140의 아미노산 서열이 제공된다.
이 ActRIIA-Fc 융합 단백질은 다음의 핵산 서열 (서열 번호: 256)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCGCTATACT TGGTAGATCA GAAACTCAGG
101
AGTGTCTTTT CTTTAATGCT AATTGGGAAA AAGACAGAAC CAATCAAACT
151
GGTGTTGAAC CGTGTTATGG TGACAAAGAT AAACGGCGGC ATTGTTTTGC
201
TACCTGGAAG AATATTTCTG GTTCCATTGA AATAGTGAAA CAAGGTTGTT
251
GGCTGGATGA TATCAACTGC TATGACAGGA CTGATTGTGT AGAAAAAAAA
301
GACAGCCCTG AAGTATATTT CTGTTGCTGT GAGGGCAATA TGTGTAATGA
351
AAAGTTTTCT TATTTTCCGG AGATGGAAGT CACACAGCCC ACTTCAAATC
401
CAGTTACACC TAAGCCACCC ACCGGTGGTG GAACTCACAC ATGCCCACCG
451
TGCCCAGCAC CTGAACTCCT GGGGGGACCG TCAGTCTTCC TCTTCCCCCC
501
AAAACCCAAG GACACCCTCA TGATCTCCCG GACCCCTGAG GTCACATGCG
551
TGGTGGTGGA CGTGAGCCAC GAAGACCCTG AGGTCAAGTT CAACTGGTAC
601
GTGGACGGCG TGGAGGTGCA TAATGCCAAG ACAAAGCCGC GGGAGGAGCA
651
GTACAACAGC ACGTACCGTG TGGTCAGCGT CCTCACCGTC CTGCACCAGG
701
ACTGGCTGAA TGGCAAGGAG TACAAGTGCA AGGTCTCCAA CAAAGCCCTC
751
CCAGCCCCCA TCGAGAAAAC CATCTCCAAA GCCAAAGGGC AGCCCCGAGA
801
ACCACAGGTG TACACCCTGC CCCCATCCCG GAAGGAGATG ACCAAGAACC
851
AGGTCAGCCT GACCTGCCTG GTCAAAGGCT TCTATCCCAG CGACATCGCC
901
GTGGAGTGGG AGAGCAATGG GCAGCCGGAG AACAACTACA AGACCACGCC
951
TCCCGTGCTG AAGTCCGACG GCTCCTTCTT CCTCTATAGC AAGCTCACCG
1001
TGGACAAGAG CAGGTGGCAG CAGGGGAACG TCTTCTCATG CTCCGTGATG
1051
CATGAGGCTC TGCACAACCA CTACACGCAG AAGAGCCTCT CCCTGTCTCC
1101
GGGTAAA (서열 번호: 256)
성숙 ActRIIA-Fc 융합 폴리펩티드(서열 번호: 141)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
ILGRSETQEC LFFNANWEKD RTNQTGVEPC YGDKDKRRHC FATWKNISGS
51
IEIVKQGCWL DDINCYDRTD CVEKKDSPEV YFCCCEGNMC NEKFSYFPEM
101
EVTQPTSNPV TPKPPTGGGT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI
151
SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV
201
SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP
251
SRKEMTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLKSDGS
301
FFLYSKLTVD KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK
(서열 번호: 141)
상기 ActRIIA-Fc 폴리펩티드 서열 (서열 번호: 144)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIA-Fc:ALK4-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (세린이 시스테인으로 그리고 트레오닌이 트립토판으로 대체됨)이 상기 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 144의 아미노산 서열이 제공된다.
성숙 ActRIIA-Fc 융합 폴리펩티드(서열 번호: 145)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
ILGRSETQEC LFFNANWEKD RTNQTGVEPC YGDKDKRRHC FATWKNISGS
51
IEIVKQGCWL DDINCYDRTD CVEKKDSPEV YFCCCEGNMC NEKFSYFPEM
101
EVTQPTSNPV TPKPPTGGGT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI
151
SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV
201
SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP
251
CREEMTKNQV SLWCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS
301
FFLYSKLTVD KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK
(서열 번호: 145)
특정 측면들에 있어서, 본 명세서는 BMPRII 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "BMPRII"는 임의의 종으로부터 뼈 형태생성 단백질 수용체 유형 II (BMPRII) 단백질과 이러한 BMPRII 단백질로부터 돌연변이 또는 다른 변형에 의해 유래된 변이체 패밀리를 나타낸다. BMPRII에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. BMPRII 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "BMPRII 폴리펩티드"는 뿐만 아니라 BMPRII 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 BMPRII 전구체 단백질 서열 (NCBI Ref Seq NP_001195.2)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 BMPRII 폴리펩티드 서열은 다음과 같다:
SQNQERLCAFKDPYQQDLGIGESRISHENGTILCSKGSTCYGLWEKSKGDINLVKQGCWSHIGDPQECHYEECVVTTTPPSIQNGTYRFCCCSTDLCNVNFTENFPPPDTTPLSPPHSFNRDET (서열 번호: 150)
BMPRII 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 205에 나타내며, 이는 Genbank 기준 서열 NM_001204.6의 뉴클레오티드 1149-4262에 상응한다. 세포외 BMPRII 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 206과 같다.
대체 아이소폼 of BMPRII의 대체 아이소폼, 아이소폼 2 (GenBank: AAA86519.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 BMPRII 폴리펩티드 서열 (아이소폼 2)는 다음과 같다:
SQNQERLCAFKDPYQQDLGIGESRISHENGTILCSKGSTCYGLWEKSKGDINLVKQGCWSHIGDPQECHYEECVVTTTPPSIQNGTYRFCCCSTDLCNVNFTENFPPPDTTPLSPPHSFNRDET (서열 번호: 151)
인간 BMPRII 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 207에 나타내며, 이는 Genbank 기준 서열 U25110.1의 뉴클레오티드 163-1752에 상응한다. 신호 서열은 밑줄로 표시된다. 세포외 BMPRII 폴리펩티드 (아이소폼 2)를 인코드하는 핵산 서열은 서열 번호: 208과 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 BMPRII 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 BMPRII 폴리펩티드들 (가령, BMPRII 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, BMPRII의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 BMPRII 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 148, 150, 149, 151, 152, 153, 156, 또는 157서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 BMPRII 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 148, 150, 149, 151, 152, 153, 156, 또는 157서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 BMPRII 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 BMPRII-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 BMPRII-Fc 융합 단백질은 서열 번호: 148 또는 149의 아미노산 27-34중 어느 하나 (가령, 아미노산 잔기 27, 28, 29, 30, 31, 32, 33, 및 34)에서 시작하고, 서열 번호: 148 또는 149의 아미노산 123-150 중 어느 하나 (가령, 아미노산 잔기 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 및 150)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, BMPRII 도메인을 포함한다. 일부 구체예들에서, 상기 BMPRII-Fc 융합 단백질은 열 번호: 148 또는 149의 아미노산 34-123에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, BMPRII 도메인을 포함한다. 일부 구체예들에서, 상기 BMPRII-Fc 융합 단백질은 열 번호: 148 또는 149의 아미노산 27-150에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, BMPRII 도메인을 포함한다. 일부 구체예들에서, 상기 BMPRII-Fc 융합 단백질은 서열 번호: 서열 번호: 서열 번호: 148, 150, 149, 151, 152, 153, 154, 155, 156, 157, 158, 그리고 159중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, BMPRII 도메인을 포함한다.
상기 BMPRII-Fc 폴리펩티드 서열 (서열 번호: 152)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 BMPRII-Fc:ActRIIB-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (산성 아미노산이 리신으로 대체됨)이 BMPRII-Fc 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 152의 아미노산 서열이 제공된다.
이 BMPRII-Fc 융합 단백질은 다음의 핵산 서열 (서열 번호: 257)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCGCAGAA TCAAGAACGC CTATGTGCGT
101
TTAAAGATCC GTATCAGCAA GACCTTGGGA TAGGTGAGAG TAGAATCTCT
151
CATGAAAATG GGACAATATT ATGCTCGAAA GGTAGCACCT GCTATGGCCT
201
TTGGGAGAAA TCAAAAGGGG ACATAAATCT TGTAAAACAA GGATGTTGGT
251
CTCACATTGG AGATCCCCAA GAGTGTCACT ATGAAGAATG TGTAGTAACT
301
ACCACTCCTC CCTCAATTCA GAATGGAACA TACCGTTTCT GCTGTTGTAG
351
CACAGATTTA TGTAATGTCA ACTTTACTGA GAATTTTCCA CCTCCTGACA
401
CAACACCACT CAGTCCACCT CATTCATTTA ACCGAGATGA GACCGGTGGT
451
GGAACTCACA CATGCCCACC GTGCCCAGCA CCTGAACTCC TGGGGGGACC
501
GTCAGTCTTC CTCTTCCCCC CAAAACCCAA GGACACCCTC ATGATCTCCC
551
GGACCCCTGA GGTCACATGC GTGGTGGTGG ACGTGAGCCA CGAAGACCCT
601
GAGGTCAAGT TCAACTGGTA CGTGGACGGC GTGGAGGTGC ATAATGCCAA
651
GACAAAGCCG CGGGAGGAGC AGTACAACAG CACGTACCGT GTGGTCAGCG
701
TCCTCACCGT CCTGCACCAG GACTGGCTGA ATGGCAAGGA GTACAAGTGC
751
AAGGTCTCCA ACAAAGCCCT CCCAGCCCCC ATCGAGAAAA CCATCTCCAA
801
AGCCAAAGGG CAGCCCCGAG AACCACAGGT GTACACCCTG CCCCCATCCC
851
GGAAGGAGAT GACCAAGAAC CAGGTCAGCC TGACCTGCCT GGTCAAAGGC
901
TTCTATCCCA GCGACATCGC CGTGGAGTGG GAGAGCAATG GGCAGCCGGA
951
GAACAACTAC AAGACCACGC CTCCCGTGCT GAAGTCCGAC GGCTCCTTCT
1001
TCCTCTATAG CAAGCTCACC GTGGACAAGA GCAGGTGGCA GCAGGGGAAC
1051
GTCTTCTCAT GCTCCGTGAT GCATGAGGCT CTGCACAACC ACTACACGCA
1101
GAAGAGCCTC TCCCTGTCTC CGGGTAAA (서열 번호: 257)
성숙 BMPRII-Fc 융합 폴리펩티드(서열 번호: 153)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
SQNQERLCAF KDPYQQDLGI GESRISHENG TILCSKGSTC YGLWEKSKGD
51
INLVKQGCWS HIGDPQECHY EECVVTTTPP SIQNGTYRFC CCSTDLCNVN
101
FTENFPPPDT TPLSPPHSFN RDETGGGTHT CPPCPAPELL GGPSVFLFPP
151
KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ
201
YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE
251
PQVYTLPPSR KEMTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP
301
PVLKSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP
351
GK (서열 번호: 153)
상기 BMPRII-Fc 폴리펩티드 서열 (서열 번호: 156)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 BMPRII-Fc:ALK4-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (세린이 시스테인으로 그리고 트레오닌이 트립토판으로 대체됨)이 상기 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 156의 아미노산 서열이 제공된다.
성숙 BMPRII-Fc 융합 폴리펩티드(서열 번호: 157)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신(K)이 제거될 수 있다.
특정 측면들에 있어서, 본 명세서는 TGFBRII 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "TGFBRII"는 임의의 종으로부터 형질전환 성장 인자-베타 수용체 II (TGFBRII) 단백질과 이러한 단백질로부터 돌연변이 유발 또는 다른 변형에 의해 유래된 변이체 패밀리를 지칭한다. TGFBRII에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. TGFBRII 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "TGFBRII 폴리펩티드"는 뿐만 아니라 TGFBRII 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 TGFBRII 전구체 단백질 서열 (NCBI Ref Seq NP_003233.4)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 TGFBRII 폴리펩티드 서열은 다음과 같다:
TIPPHVQKSVNNDMIVTDNNGAVKFPQLCKFCDVRFSTCDNQKSCMSNCSITSICEKPQEVCVAVWRKNDENITLETVCHDPKLPYHDFILEDAASPKCIMKEKKKPGETFFMCSCSSDECNDNIIFSEEYNTSNPDLLLVIFQ (서열 번호: 195)
TGFBRII 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 196에 나타내며, 이는 Genbank 기준 서열 NM_003242.5의 뉴클레오티드 383-2083에 상응한다. 세포외 TGFBRII 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 197와 같다.
TGFBRII의 대체 아이소폼, 아이소폼 A (NP_001020018.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 TGFBRII 폴리펩티드 서열 (아이소폼 A)는 다음과 같다:
TIPPHVQKSDVEMEAQKDEIICPSCNRTAHPLRHINNDMIVTDNNGAVKFPQLCKFCDVRFSTCDNQKSCMSNCSITSICEKPQEVCVAVWRKNDENITLETVCHDPKLPYHDFILEDAASPKCIMKEKKKPGETFFMCSCSSDECNDNIIFSEEYNTSNPDLLLVIFQ (서열 번호: 199)
상기 TGFBRII 전구체 단백질 (아이소폼 A)를 인코드하는 핵산 서열은 서열 번호: 202에 나타내며, 이는 Genbank 참조 서열 NM_001024847.2의 뉴클레오티드 383-2158에 상응한다. 프로세스된 세포외 TGFBRII 폴리펩티드 (아이소폼 A)를 인코드하는 핵산 서열은 서열 번호: 203에 나타낸다.
전술한 TGFβRII 아이소폼 (서열 번호: 194, 195, 198, 그리고 199)은 TGFβRII 아이소폼 C에서 자연적으로 발생되는 것과 같이 (Konrad et al., BMC Genomics 8:318, 2007), TGFβRII ECD의 C-말단 부근에 위치한 글루탐산염 잔기 쌍 (서열 번호: 194의 위치 151과 152; 서열 번호: 195의 위치 129와 130; 서열 번호: 198의 위치 176과 177; 또는 서열 번호: 199의 위치 154와 155) 사이의 36개 아미노산(서열 번호: 204)의 삽입을 포함할 수 있다.
GRCKIRHIGS NNRLQRSTCQ NTGWESAHVM KTPGFR (서열 번호: 204)
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 TGFBRII 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 TGFBRII 폴리펩티드들 (가령, TGFBRII 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, TGFBRII의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 TGFBRII 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 상기에서 설명된 서열 번호: 204의 삽입과 함께, 또는 삽입없이, 서열 번호: 194, 195, 198, 또는 199서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 최소한 하나의 TGFBRII 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체 복합체는 서열 번호: 204의 삽입과 함께, 또는 삽입없이, 서열 번호: 194, 195, 198, 또는 199서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 최소한 하나의 TGFBRII 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 TGFBII-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 TGFBII-Fc 융합 단백질은 서열 번호: 160의 아미노산 23-44중 어느 하나 (가령, 아미노산 잔기 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43 또는 44)에서 시작하고, 서열 번호: 160의 아미노산 168-191 중 어느 하나 (가령, 아미노산 잔기 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190 또는 191)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBII도메인을 포함한다. 일부 구체예들에서, 상기 TGFBRII-Fc 융합 단백질은 서열 번호: 160의 아미노산 44-168에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBRII 도메인을 포함한다. 일부 구체예들에서, 상기 TGFBRII-Fc 융합 단백질은 서열 번호: 160의 아미노산 23-191에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBRII 도메인을 포함한다. 일부 구체예들에서, 상기 TGFBRII-Fc 융합 단백질은 서열 번호: 서열 번호: 서열 번호: 161, 162, 160, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 및 179중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBRII 도메인을 포함한다. 일부 구체예들에서, 상기 TGFBII-Fc 융합 단백질은 서열 번호: 161의 아미노산 23-51중 어느 하나 (가령, 아미노산 잔기 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 및 51)에서 시작하고, 서열 번호: 160의 아미노산 143-166 중 어느 하나 (가령, 아미노산 잔기 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 및 166)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBII도메인을 포함한다. 일부 구체예들에서, 상기 TGFBRII-Fc 융합 단백질은 서열 번호: 161의 아미노산 51-143에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBRII 도메인을 포함한다. 일부 구체예들에서, 상기 TGFBRII-Fc 융합 단백질은 서열 번호: 161의 아미노산 23-166에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, TGFBRII 도메인을 포함한다.
인간 TGFBRII 전구체 단백질 서열 (NCBI Ref Seq NP_003233.4)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 TGFBRII 폴리펩티드 서열은 다음과 같다:
TIPPHVQKSVNNDMIVTDNNGAVKFPQLCKFCDVRFSTCDNQKSCMSNCSITSICEKPQEVCVAVWRKNDENITLETVCHDPKLPYHDFILEDAASPKCIMKEKKKPGETFFMCSCSSDECNDNIIFSEEYNTSNPDLLLVIFQ (서열 번호: 162)
TGFBRII의 대체 아이소폼, 아이소폼 A (NP_001020018.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 TGFBRII 폴리펩티드 서열 (아이소폼 A)는 다음과 같다:
TIPPHVQKSDVEMEAQKDEIICPSCNRTAHPLRHINNDMIVTDNNGAVKFPQLCKFCDVRFSTCDNQKSCMSNCSITSICEKPQEVCVAVWRKNDENITLETVCHDPKLPYHDFILEDAASPKCIMKEKKKPGETFFMCSCSSDECNDNIIFSEEYNTSNPDLLLVIFQ (서열 번호: 163)
TGFβRIIshort-Fc 폴리펩티드 서열 (서열 번호: 164)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 TGFβRIIshort-Fc:ActRIIB-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (산성 아미노산이 리신으로 대체됨)이 TGFβRIIshort-Fc 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 164의 아미노산 서열이 제공된다.
TGFβRIIshort-Fc 융합 단백질은 다음의 핵산 서열 (서열 번호: 259)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCACGATCCC ACCGCACGTT CAGAAGTCGG
101
TTAATAACGA CATGATAGTC ACTGACAACA ACGGTGCAGT CAAGTTTCCA
151
CAACTGTGTA AATTTTGTGA TGTGAGATTT TCCACCTGTG ACAACCAGAA
201
ATCCTGCATG AGCAACTGCA GCATCACCTC CATCTGTGAG AAGCCACAGG
251
AAGTCTGTGT GGCTGTATGG AGAAAGAATG ACGAGAACAT AACACTAGAG
301
ACAGTTTGCC ATGACCCCAA GCTCCCCTAC CATGACTTTA TTCTGGAAGA
351
TGCTGCTTCT CCAAAGTGCA TTATGAAGGA AAAAAAAAAG CCTGGTGAGA
401
CTTTCTTCAT GTGTTCCTGT AGCTCTGATG AGTGCAATGA CAACATCATC
451
TTCTCAGAAG AATATAACAC CAGCAATCCT GACACCGGTG GTGGAACTCA
501
CACATGCCCA CCGTGCCCAG CACCTGAACT CCTGGGGGGA CCGTCAGTCT
551
TCCTCTTCCC CCCAAAACCC AAGGACACCC TCATGATCTC CCGGACCCCT
601
GAGGTCACAT GCGTGGTGGT GGACGTGAGC CACGAAGACC CTGAGGTCAA
651
GTTCAACTGG TACGTGGACG GCGTGGAGGT GCATAATGCC AAGACAAAGC
701
CGCGGGAGGA GCAGTACAAC AGCACGTACC GTGTGGTCAG CGTCCTCACC
751
GTCCTGCACC AGGACTGGCT GAATGGCAAG GAGTACAAGT GCAAGGTCTC
801
CAACAAAGCC CTCCCAGCCC CCATCGAGAA AACCATCTCC AAAGCCAAAG
851
GGCAGCCCCG AGAACCACAG GTGTACACCC TGCCCCCATC CCGGAAGGAG
901
ATGACCAAGA ACCAGGTCAG CCTGACCTGC CTGGTCAAAG GCTTCTATCC
951
CAGCGACATC GCCGTGGAGT GGGAGAGCAA TGGGCAGCCG GAGAACAACT
1001
ACAAGACCAC GCCTCCCGTG CTGAAGTCCG ACGGCTCCTT CTTCCTCTAT
1051
AGCAAGCTCA CCGTGGACAA GAGCAGGTGG CAGCAGGGGA ACGTCTTCTC
1101
ATGCTCCGTG ATGCATGAGG CTCTGCACAA CCACTACACG CAGAAGAGCC
1151
TCTCCCTGTC TCCGGGTAAA (서열 번호: 259)
성숙 TGFβRIIshort-Fc 융합 폴리펩티드 (서열 번호: 165)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
TIPPHVQKSV NNDMIVTDNN GAVKFPQLCK FCDVRFSTCD NQKSCMSNCS
51
ITSICEKPQE VCVAVWRKND ENITLETVCH DPKLPYHDFI LEDAASPKCI
* 101
MKEKKKPGET FFMCSCSSDE CNDNIIFSEE YNTSNPDTGG GTHTCPPCPA
151
PELLGGPSVF LFPPKPKDTL MISRTPEVTC VVVDVSHEDP EVKFNWYVDG
201
VEVHNAKTKP REEQYNSTYR VVSVLTVLHQ DWLNGKEYKC KVSNKALPAP
251
IEKTISKAKG QPREPQVYTL PPSRKEMTKN QVSLTCLVKG FYPSDIAVEW
301
ESNGQPENNY KTTPPVLKSD GSFFLYSKLT VDKSRWQQGN VFSCSVMHEA
351
LHNHYTQKSL SLSPGK (서열 번호: 165)
TGFβRIIlong-Fc 폴리펩티드 서열 (서열 번호: 166)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 TGFβRIIlong-Fc:ActRIIB-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (산성 아미노산이 리신으로 대체됨)이 TGFβRIIlong-Fc 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 166의 아미노산 서열이 제공된다.
TGFβRIIlong-Fc 융합 단백질은 다음의 핵산 서열 (서열 번호: 260)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCACGATCCC ACCGCACGTT CAGAAGTCGG
101
ATGTGGAAAT GGAGGCCCAG AAAGATGAAA TCATCTGCCC CAGCTGTAAT
151
AGGACTGCCC ATCCACTGAG ACATATTAAT AACGACATGA TAGTCACTGA
201
CAACAACGGT GCAGTCAAGT TTCCACAACT GTGTAAATTT TGTGATGTGA
251
GATTTTCCAC CTGTGACAAC CAGAAATCCT GCATGAGCAA CTGCAGCATC
301
ACCTCCATCT GTGAGAAGCC ACAGGAAGTC TGTGTGGCTG TATGGAGAAA
351
GAATGACGAG AACATAACAC TAGAGACAGT TTGCCATGAC CCCAAGCTCC
401
CCTACCATGA CTTTATTCTG GAAGATGCTG CTTCTCCAAA GTGCATTATG
451
AAGGAAAAAA AAAAGCCTGG TGAGACTTTC TTCATGTGTT CCTGTAGCTC
501
TGATGAGTGC AATGACAACA TCATCTTCTC AGAAGAATAT AACACCAGCA
551
ATCCTGACAC CGGTGGTGGA ACTCACACAT GCCCACCGTG CCCAGCACCT
601
GAACTCCTGG GGGGACCGTC AGTCTTCCTC TTCCCCCCAA AACCCAAGGA
651
CACCCTCATG ATCTCCCGGA CCCCTGAGGT CACATGCGTG GTGGTGGACG
701
TGAGCCACGA AGACCCTGAG GTCAAGTTCA ACTGGTACGT GGACGGCGTG
751
GAGGTGCATA ATGCCAAGAC AAAGCCGCGG GAGGAGCAGT ACAACAGCAC
801
GTACCGTGTG GTCAGCGTCC TCACCGTCCT GCACCAGGAC TGGCTGAATG
851
GCAAGGAGTA CAAGTGCAAG GTCTCCAACA AAGCCCTCCC AGCCCCCATC
901
GAGAAAACCA TCTCCAAAGC CAAAGGGCAG CCCCGAGAAC CACAGGTGTA
951
CACCCTGCCC CCATCCCGGA AGGAGATGAC CAAGAACCAG GTCAGCCTGA
1001
CCTGCCTGGT CAAAGGCTTC TATCCCAGCG ACATCGCCGT GGAGTGGGAG
1051
AGCAATGGGC AGCCGGAGAA CAACTACAAG ACCACGCCTC CCGTGCTGAA
1101
GTCCGACGGC TCCTTCTTCC TCTATAGCAA GCTCACCGTG GACAAGAGCA
1151
GGTGGCAGCA GGGGAACGTC TTCTCATGCT CCGTGATGCA TGAGGCTCTG
1201
CACAACCACT ACACGCAGAA GAGCCTCTCC CTGTCTCCGG GTAAA
(서열 번호: 260)
성숙 TGFβRIIlong-Fc 융합 폴리펩티드 (서열 번호: 167)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
TIPPHVQKSD VEMEAQKDEI ICPSCNRTAH PLRHINNDMI VTDNNGAVKF
51
PQLCKFCDVR FSTCDNQKSC MSNCSITSIC EKPQEVCVAV WRKNDENITL
101
ETVCHDPKLP YHDFILEDAA SPKCIMKEKK KPGETFFMCS CSSDECNDNI
151
IFSEEYNTSN PDTGGGTHTC PPCPAPELLG GPSVFLFPPK PKDTLMISRT
201
PEVTCVVVDV SHEDPEVKFN WYVDGVEVHN AKTKPREEQY NSTYRVVSVL
251
TVLHQDWLNG KEYKCKVSNK ALPAPIEKTI SKAKGQPREP QVYTLPPSRK
301
EMTKNQVSLT CLVKGFYPSD IAVEWESNGQ PENNYKTTPP VLKSDGSFFL
351
YSKLTVDKSR WQQGNVFSCS VMHEALHNHY TQKSLSLSPG K
(서열 번호: 167)
비대칭 Fc 융합 단백질을 이용한 이형다량체 복합체들의 형성을 촉진시키는 제2의 방법에서, 상보적 소수성 상호작용과 추가적인 분자간 이황화결합을 도입하도록 Fc 도메인이 변경된다.
TGFβRIIshort-Fc 폴리펩티드 서열 (서열 번호: 172)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 TGFβRIIshort-Fc:ActRIIB-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (세린이 시스테인으로 그리고 트레오닌이 트립토판으로 대체됨)이 상기 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 172의 아미노산 서열이 제공된다.
성숙 TGFβRIIshort-Fc 융합 폴리펩티드 (서열 번호: 173)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
TIPPHVQKSV NNDMIVTDNN GAVKFPQLCK FCDVRFSTCD NQKSCMSNCS
51
ITSICEKPQE VCVAVWRKND ENITLETVCH DPKLPYHDFI LEDAASPKCI
101
MKEKKKPGET FFMCSCSSDE CNDNIIFSEE YNTSNPDTGG GTHTCPPCPA
151
PELLGGPSVF LFPPKPKDTL MISRTPEVTC VVVDVSHEDP EVKFNWYVDG
201
VEVHNAKTKP REEQYNSTYR VVSVLTVLHQ DWLNGKEYKC KVSNKALPAP
251
IEKTISKAKG QPREPQVYTL PPCREEMTKN QVSLWCLVKG FYPSDIAVEW
301
ESNGQPENNY KTTPPVLDSD GSFFLYSKLT VDKSRWQQGN VFSCSVMHEA
351
LHNHYTQKSL SLSPGK (서열 번호: 173)
본원에서 개시된 특정 Fc 융합 폴리펩티드와 이종이량체 형성을 유도하기 위하여, 2개의 아미노산 치환이 ALK1-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다.
일부 구체예들에서, TGFβRIIlong-Fc 폴리펩티드 서열 (서열 번호: 174)은 하기에 나타낸다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 가능한 동형이량체 복합체보다는 TGFβRIIlong-Fc:ActRIIB-Fc 이형이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (세린이 시스테인으로 그리고 트레오닌이 트립토판으로 대체됨)이 상기 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 174의 아미노산 서열이 제공된다.
성숙 TGFβRIIlong-Fc 융합 폴리펩티드 (서열 번호: 175)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
TIPPHVQKSD VEMEAQKDEI ICPSCNRTAH PLRHINNDMI VTDNNGAVKF
51
PQLCKFCDVR FSTCDNQKSC MSNCSITSIC EKPQEVCVAV WRKNDENITL
101
ETVCHDPKLP YHDFILEDAA SPKCIMKEKK KPGETFFMCS CSSDECNDNI
151
IFSEEYNTSN PDTGGGTHTC PPCPAPELLG GPSVFLFPPK PKDTLMISRT
201
PEVTCVVVDV SHEDPEVKFN WYVDGVEVHN AKTKPREEQY NSTYRVVSVL
251
TVLHQDWLNG KEYKCKVSNK ALPAPIEKTI SKAKGQPREP QVYTLPPCRE
301
EMTKNQVSLW CLVKGFYPSD IAVEWESNGQ PENNYKTTPP VLDSDGSFFL
351
YSKLTVDKSR WQQGNVFSCS VMHEALHNHY TQKSLSLSPG K
(서열 번호: 175)
특정 측면들에 있어서, 본 명세서는 MISRII 폴리펩티드를 포함하는 단백질 복합체들에 관계한다. 본 명세서에서 사용된 바와 같이, 용어 "MISRII"는 임의의 종으로부터 Mㆌllerian 억제 물질 수용체 유형 II (MISRII) 단백질과 이러한 MISRII 단백질로부터 돌연변이 또는 다른 변형에 의해 유래된 변이체 패밀리를 나타낸다. MISRII에 대한 언급은 현재 확인된 형태중 하나를 참조로 한다. MISRII 패밀리의 구성요소는 시스테인-풍부 영역을 갖는 리간드-결합 세포외 도메인, 막경유 도메인, 및 예상 세린/트레오닌 키나제 활성을 갖는 세포질 도메인을 포함하는 막경유 단백질이다.
용어 "MISRII 폴리펩티드"는 뿐만 아니라 MISRII 패밀리 구성원의 자연 발생적 폴리펩티드를 포함하는 폴리펩티드 뿐만 아니라, 유용한 활성을 보유하는 그의 임의의 변이체 (돌연변이체, 단편, 융합체 및 펩티드 유사체를 포함함)를 포함한다.
인간 MISRII 전구체 단백질 서열 (NCBI Ref Seq NP_065434.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 MISRII 폴리펩티드 서열은 다음과 같다:
PPNRRTCVFFEAPGVRGSTKTLGELLDTGTELPRAIRCLYSRCCFGIWNLTQDRAQVEMQGCRDSDEPGCESLHCDPSPRAHPSPGSTLFTCSCGTDFCNANYSHLPPPGSPGTPGSQGPQAAPGESIWMAL (서열 번호: 183)
MISRII 전구체 단백질을 인코드하는 핵산 서열은 서열 번호: 209에 나타내며, 이는 Genbank 기준 서열 NM_020547.2의 뉴클레오티드 81-1799에 상응한다. 세포외 인간 MISRII 폴리펩티드를 인코드하는 핵산 서열은 서열 번호: 210과 같다.
인간 MISRII 전구체 단백질 서열의 대체 아이소폼, 아이소폼 2 (NCBI Ref Seq NP_001158162.1)은 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 MISRII 폴리펩티드 서열 (아이소폼 2)는 다음과 같다:
PPNRRTCVFFEAPGVRGSTKTLGELLDTGTELPRAIRCLYSRCCFGIWNLTQDRAQVEMQGCRDSDEPGCESLHCDPSPRAHPSPGSTLFTCSCGTDFCNANYSHLPPPGSPGTPGSQGPQAAPGESIWMAL (서열 번호: 184)
상기 MISRII 전구체 단백질 (아이소폼 2)을 인코드하는 핵산 서열은 서열 번호: 211에 나타내며, Genbank 참조 서열 NM_001164690.1의 뉴클레오티드 81-1514에 상응한다. 프로세스된 가용성 (세포외) 인간 MISRII 폴리펩티드 (아이소폼 2)를 인코드하는 핵산 서열은 서열 번호: 212와 같다.
인간 MISRII 전구체 단백질 서열의 대체 아이소폼, 아이소폼 3 (NCBI Ref Seq NP_001158163.1)는 다음과 같다:
신호 펩티드는 단일 밑줄로 표시되어 있고; 세포외 영역은 굵은 체로 표시된다.
프로세스된 세포외 MISRII 폴리펩티드 서열 (아이소폼 3)는 다음과 같다:
PPNRRTCVFFEAPGVRGSTKTLGELLDTGTELPRAIRCLYSRCCFGIWNLTQDRAQVEMQGCRDSDEPGCESLHCDPSPRAHPSPGSTLFTCSCGTDFCNANYSHLPPPGSPGTPGSQGPQAAPGESIWMAL (서열 번호: 185)
인간 MISRII 전구체 단백질 (아이소폼 3)을 인코드하는 핵산 서열은 서열 번호: 213에 나타내며, Genbank 참조 서열 NM_001164691.1의 뉴클레오티드 81-1514에 상응한다. 프로세스된 가용성 (세포외) 인간 MISRII 폴리펩티드 (아이소폼 3)를 인코드하는 핵산 서열은 서열 번호: 214와 같다.
특정 구체예들에 있어서, 본 명세서는 최소한 하나의 MISRII 폴리펩티드를 포함하는 이형다량체에 관계하며, 여기에는 이의 단편들, 기능성 변이체들 그리고 변형된 형태들이 포함된다. 바람직하게는 본 발명의 용도에 이용되는 MISRII 폴리펩티드들 (가령, MISRII 폴리펩티드를 포함하는 이형다량체들과 이의 용도들)은 가용성 (가령, MISRII 의 세포외 도메인)이다. 다른 바람직한 구체예들에서, 본 발명의 용도에 이용되는 MISRII 폴리펩티드들은 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하고 및/또는 활성 (가령, Smad 2/3 및/또는 Smad 1/5/8 신호생성 유도)을 억제(길항)한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 180, 183, 181, 184, 182, 또는 185의 아미노산 서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 MISRII 폴리펩티드를 포함한다. 일부 구체예들에서, 본 명세서의 이종다량체는 서열 번호: 180, 183, 181, 184, 182, 또는 185의 아미노산 서열에 대하여 최소한 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100% 동일한 동일한 아미노산 서열을 포함하는 최소한 하나의 MISRII 폴리펩티드로 구성되거나, 또는 기본적으로 구성된다.
특정 양태에서, 본 명세서는 MISRII-Fc 융합 단백질을 포함하는 이종다량체에 관계한다. 일부 구체예들에서, 상기 MISRII-Fc 융합 단백질은 서열 번호: 180, 181, 또는 182의 아미노산 17-24중 어느 하나 (가령, 아미노산 잔기 17, 18, 19, 20, 21, 22, 23, 및 24)에서 시작하고, 서열 번호: 180, 181, 또는 182의 아미노산 116-149중 어느 하나 (가령, 아미노산 잔기 116, 117, 118, 119, 120, 121, 122 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 및 149)에서 종료되는 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, MISRII 도메인을 포함한다. 일부 구체예들에서, 상기 MISRII-Fc 융합 단백질은 열 번호: 180, 181, 또는 182의 아미노산 24-116에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, MISRII 도메인을 포함한다. 일부 구체예들에서, 상기 MISRII-Fc 융합 단백질은 열 번호: 180, 181, 또는 182의 아미노산 17-149에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, MISRII 도메인을 포함한다. 일부 구체예들에서, 상기 MISRII-Fc 융합 단백질은 서열 번호: 서열 번호: 서열 번호: 180, 183, 181, 184, 182, 185, 186, 187, 188, 189, 190, 191, 192, 그리고 193중 어느 하나의 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, MISRII 도메인을 포함한다.
일부 구체예들에서, 본 명세서는 치료 효과 또는 안정성을 강화시킬 목적으로 (가령, 반감기 증가 및 단백질분해에 대한 저항성 증가), TGF-베타 슈퍼패밀리 유형 I 수용체 폴리펩티드 (가령, ALK1, ALK2, ALK3, ALK4, ALK5, ALK6, 그리고 ALK7) 및/또는 TGF-베타 슈퍼패밀리 유형 II 수용체 폴리펩티드 (가령, ActRIIA, ActRIIB, TGFBRII, BMPRII, 그리고 MISRII)의 구조를 변경시켜 기능적 변이체의 제조를 고려한다. 아미노산 치환, 결손, 추가, 또는 이의 조합들에 의해 변이체들이 만들어질 수 있다. 예를 들면, 류신을 이소류신 또는 발린으로 치환, 아스파르테이트를 글루탐산염으로 치환, 트레오닌을 세린으로 치환, 또는 아미노산을 구조적으로 관련된 아미노산 (가령, 보존 돌연변이)으로 단리된 치환은 생성 분자의 생물학적 활성에 주요한 영향을 주지 않을 것으로 합리적으로 예측할 수 있다. 보존 치환은 아미노산 측쇄가 관련된 아미노산 패밀리 안에서 일어나는 것이다. 본 명세서의 폴리펩티드의 아미노산 서열의 변화로 기능적 동소체가 생성되는 지의 여부는 생성된 변이체 폴리펩티드가 이의 야생형 폴리펩티드와 유사한 방식으로 세포 안에서 반응을 만드는 능력, 또는 예를 들면, BMP2, BMP2/7, BMP3, BMP4, BMP4/7, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP9, BMP10, GDF3, GDF5, GDF6/BMP13, GDF7, GDF8, GDF9b/BMP15, GDF11/BMP11, GDF15/MIC1, TGF-β1, TGF-β2, TGF-β3, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 AE, 액티빈 BC, 액티빈 BE, nodal, 신경아교세포-유도된 신경영샹성 인자 (GDNF), 뉴르투린, 아르테민, 페르세핀, MIS, 및 Lefty을 포함하는 하나 또는 그 이상의 TGF-베타 슈퍼패밀리 리간드들에 결합하는 능력을 평가함으로써 용이하게 결정될 수 있다.
일부 구체예들에서, 본 명세서는 치료 효과 또는 안정성을 강화시킬 목적으로(가령, 반감기 증가 및/또는 단백질분해에 대한 저항성 증가), TGF-베타 슈퍼패밀리 유형 I 수용체 폴리펩티드 및/또는 TGF-베타 슈퍼패밀리 유형 II 수용체 폴리펩티드의 구조를 변형시킴으로써, 기능적 변이체의 제조를 고려한다.
특정 구체예들에서, 본 명세서는 상기 폴리펩티드의 당화를 변경시키기 위하여, 본 명세서의 TGF-베타 슈퍼패밀리 유형 I 수용체 폴리펩티드 (가령, ALK1, ALK2, ALK3, ALK4, ALK5, ALK6, 그리고 ALK7) 및/또는 TGF-베타 슈퍼패밀리 유형 II 수용체 폴리펩티드 (가령, ActRIIA, ActRIIB, TGFBRII, BMPRII, 그리고 MISRII)의 특이적 돌연변이를 고려한다. 이러한 돌연변이는 하나 또는 그 이상의 당화 부위, 이를 테면 O-연계된 또는 N-연계된 당화 부위를 도입 또는 제거하도록 선택될 수 있다. 아스파라긴-연계된 당화 인지 부위는 일반적으로 적절한 세포의 당화 효소에 의해 특이적으로 인지되는 삼펩티드 서열, 아스파라긴-X-트레오닌 또는 아스파라긴-X-세린 (여기에서 "X"는 임의의 아미노산임)이다. 이러한 변형은 하나 또는 그 이상의 세린 또는 트레오닌 잔기를 상기 폴리펩티드(O-연계된 당화 부위의 경우)에 추가 또는 치환시켜 만들 수도 있다. 당화 인지 부위의 제1 또는 제3 아미노산 위치중 하나 또는 둘 모두에서 다양한 아미노산 치환 또는 결손 (및/또는 제 2 위치에서 아미노산 결손)으로 변형된 삼펩티드 서열에서 비-당화가 초래된다. 폴리펩티드의 탄소화물 모이어티의 수를 증가시키는 다른 수단은 상기 단백질에 화학 또는 효소적으로 글리코시드를 결합시키는 것이다. 이용되는 결합 방식에 따라, 이들 당(들)은 (a) 아르기닌 및 히스티딘; (b) 자유 카르복실기; (c) 자유 술포히드릴기, 이를 테면 시스테인의 기; (d) 자유 히드록실 기, 이를 테면 세린, 트레오닌, 또는 히드록시프롤린; (e) 방향족 잔기, 이를 테면 페닐알라닌, 티로신, 또는 트립토탄의 기; 또는 (f) 글루타민의 아미드 기에 부착될 수 있다. 폴리펩티드 상에 있는 하나 또는 그 이상의 탄수화물 모이어티는 화학적 및/또는 효소적으로 제거될 수 있다. 화학적 탈당화는 예를 들면, 트리플루오로메탄설폰산 또는 이에 등가의 화합물에 대한 폴리펩티드의 노출을 필요할 수 있다. 이 처리는 아미노산 서열을 손상시키지 않으면서, 연계당 (N-아세틸 글루코사민 또는 N-아세틸 갈락토사민)을 제외한 대부분 또는 모든 당을 절단하게 된다. 폴리펩티드상의 탄수화물 모이어티의 효소 절단은 Thotakura et al. [Meth. Enzymol. (1987) 138:350].에서 설명된 바와 같이, 다양한 엔도-및 엑소-글리코시다제의 사용에 의해 이루어질 수 있다. 포유류, 효모, 곤충 및 식물 세포는 모두 펩티드의 아미노산 서열에 의해 영향을 받을 수 있는 상이한 당화 패턴을 도입시킬 수 있기 때문에 폴리펩티드의 서열은 이용되는 발현계 유형에 따라 적절하게 조정될 수 있다. 일반적으로, 인간에 사용하기 위한 본 명세서의 TGF-베타 슈퍼패밀리 유형 I 및 II 수용체 복합체는 적절한 당화를 제공하는 포유류 세포계, 이를 테면 HEK293 또는 CHO 세포계에서 발현될 수 있지만, 다른 포유류 발현 세포계 또한 마찬가지로 유용할 것으로 예상된다
본 명세서는 돌연변이체, 구체적으로 본 명세서에서 기술된 TGF-베타 슈퍼패밀리 유형 I 수용체 폴리펩티드 (가령, ALK1, ALK2, ALK3, ALK4, ALK5, ALK6, 그리고 ALK7) 및/또는 TGF-베타 슈퍼패밀리 유형 II 수용체 폴리펩티드 (가령, ActRIIA, ActRIIB, TGFBRII, BMPRII, 그리고 MISRII)의 복합 돌연변이체, 뿐만 아니라 절두 돌연변이체를 만드는 방법 또한 고려한다. 복합 돌연변이체의 푸울은 기능적으로 활성 (가령, 리간드 결합) TGF-베타 슈퍼패밀리 유형 I 및/또는 TGF-베타 슈퍼패밀리 유형 II 수용체 서열을 동정하는데 특히 유용하다. 이러한 복합 라이브러리들을 스크리닝하는 목적은 변경된 성질, 이를 테면 변경된 약동학적 또는 변경된 리간드 결합을 갖는 폴리펩티드들 변이체를 만들기 위함을 수도 있다.. 다양한 스크리닝 분석이 하기에 제공되며, 이러한 분석을 이용하여 변이체들을 평가할 수 있다. TGF-베타 슈퍼패밀리 리간드가 TGF-베타 슈퍼패밀리 수용체에 결합하는 것을 방지하기 위하여, 및/또는 TGF-베타 슈퍼패밀리 리간드에 의해 야기되는 신호생성을 간섭하기 위하여, 예를 들면, TGF-베타 슈퍼패밀리 유형 I 및 II 수용체 복합체 변이체는 TGF-베타 슈퍼패밀리 리간드 (가령, BMP2, BMP2/7, BMP3, BMP4, BMP4/7, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP9, BMP10, GDF3, GDF5, GDF6/BMP13, GDF7, GDF8, GDF9b/BMP15, GDF11/BMP11, GDF15/MIC1, TGF-β1, TGF-β2, TGF-β3, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 BC, 액티빈 AE, 액티빈 BE, nodal, 신경아교세포-유도된 신경영샹성 인자 (GDNF), 뉴르투린, 아르테민, 페르세핀, MIS, 및 Lefty)에 결합하는 능력에 대하여 스크리닝될 수 있다.
본 명세서의 TGF-베타 슈퍼패밀리 이종다량체의 활성은 예를 들면, 세포-기반 또는 생체내 분석에서 또한 테스트될 수 있다. 예를 들면, 근육 세포에서 근육 생성과 관련된 유전자의 발현 또는 단백질의 활성에 있어서 이종다량체 복합체의 효과가 평가될 수 있다. 이것은 필요에 따라, 하나 또는 그 이상의 재조합 TGF-베타 슈퍼패밀리 리간드 단백질 (가령, BMP2, BMP2/7, BMP3, BMP4, BMP4/7, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP9, BMP10, GDF3, GDF5, GDF6/BMP13, GDF7, GDF8, GDF9b/BMP15, GDF11/BMP11, GDF15/MIC1, TGF-β1, TGF-β2, TGF-β3, 액티빈 A, 액티빈 B, 액티빈 C, 액티빈 E, 액티빈 AB, 액티빈 AC, 액티빈 BC, 액티빈 AE, 액티빈 BE, nodal, 신경아교세포-유도된 신경영샹성 인자 (GDNF), 뉴르투린, 아르테민, 페르세핀, MIS, 및 Lefty)의 존재하에 실행될 수 있고, 그리고 TGF-베타 슈퍼패밀리 유형 I 및 II 수용체 복합체, 그리고 임의선택적으로, TGF-베타 슈퍼패밀리 리간드를 만들기 위하여 세포는 형질감염될 수 있다. 마찬가지로, 본 명세서의 이종다량체 복합체는 마우스 또는 다른 동물에게 투여될 수 있으며, 하나 또는 그 이상의 측정, 이를 테면 근육 형성 및 강도는 당분야에서 인지된 방법들을 이용하여 평가될 수 있다. 유사하게, 이형다량체, 또는 이의 변이체들의 활성은 골모세포, 지방세포, 및/또는 이들 세포의 성생에 임의의 효과를 위한 신경 세포에서 예를 들면, 본 명세서에서 설명된 바와 같이 분석과 당분야의 공통적인 지식에 의해 테스트될 수 있다. SMAD-반응성 리포터 유전자를 이러한 세포계에서 이용하여 하류 신호생성에 대한 효과를 모니터할 수 있다.
기준 TGF-베타 슈퍼패밀리 이형다량체와 비교하여 선택성이 증가된 또는 전반적으로 효능이 증가된 복합-유도된 변이체가 만들어질 수 있다. 이러한 변이체들은 재조합 DNA 구조체로부터 발현될 때, 유전자 요법 프로토콜에 이용될 수 있다. 마찬가지로, 돌연변이유발은 대응하는 변형안된 TGF-베타 슈퍼패밀리 이종다량체와 상당히 상이한 세포내 반감기를 갖는 변이체를 만들 수 있다. 예를 들면, 변형된 단백질은 변형되지 않은 폴리펩티드의 파괴 또는 그렇지 않으면 불활성화를 초래하는 단백질분해 또는 다른 세포 과정에 더 안정적이거나 덜 안정적이 될 수 있다. 이러한 변이체 및 이들을 코딩하는 유전자는 폴리펩티드의 반감기를 조절함으로써 폴리 펩티드 복합체 수준을 변경 시키는데 이용 될 수 있다. 예를 들면, 짧은 반감기는 더욱 일시적인 생물학적 효과를 일으킬 수 있고, 유도성 발현 시스템의 일부는 세포 안에 재조합 폴리펩티드 복합체 수준을 더 엄밀하게 조절할 수 있다. Fc 융합 단백질에서, 예를 들면, 면역원성, 반감기, 및 용해도를 포함하는 TGF-베타 슈퍼패밀리 이종다량체 복합체의 하나 또는 그 이상의 활성을 변경시키기 위하여 링커(존재한다면) 및/또는 Fc 부분에 돌연변이를 만들 수 있다.
본 명세서의 이종다량체.당업계에 공지된 많은 방법을 사용하여 본 발명의 명세서의 이종다량체를 생성시킬 수 있다. 예를 들면, 제 1 폴리펩티드 (가령, 변이체 ActRIIB)에 있는 자연 발생적 아미노산을 자유 티올-함유하는 잔기, 이를 테면 시스테인로 대체하여, 이러한 자유 티올이 제 2 폴리펩티드 (가령, 가령, 변형안된 ActRIIB 폴리펩티드 또는 상기 제 1 폴리펩티드에 존재하는 것과는 상이한 변이체 ActRIIB 폴리펩티드)에 있는 또다른 자유 티올-함유하는 잔기과 반응하고, 이황화결합이 제 1 폴리펩티드와 제 2 폴리펩티드들 사이에 형성되도록 함으로써, 비-자연 발생적 이황화결합이 구축될 수 있다. 이형다량체 형성을 촉진시키는 상호작용의 추가 예로는 Kjaergaard et al., WO2007147901에서 설명된 이온 상호작용; Kannan et al., U.S.8,592,562에서 설명된 정전기적 스티어링; Christensen et al., U.S.20120302737에서 설명된 코일드-코일 상호작용; Pack & Plueckthun,(1992) Biochemistry 31: 1579-1584에서 설명된 류진 지퍼; Pack et al., (1993) Bio/Technology 11: 1271-1277에서 설명된 나선-턴-나선 모티프를 포함하나, 이에 국한되지 않는다. 다양한 세그먼트(segments)의 연계는 가령, 공유 결합 이를 테면 화학적 교차-연계, 펩티드 링커, 이황화물 다리 등을 통하여 얻어지거나, 또는 친화력 상호작용, 이를 테면 아비딘-비오틴 또는 류신 지퍼 기술에 의해 획득될 수 있다.
특정 측면들에 있어서, 다량체화 도메인은 상호작용 짝의 하나의 성분을 포함할 수 있다. 일부 구체예들에 있어서, 본 명세서의 폴리펩티드들은 단백질 복합체들은 제 2 폴리펩티드와 공유 또는 비-공유적으로 연합된 제 1 폴리펩티드를 포함하는 단백질 복합체를 형성할 수 있으며, 이때 제 1 폴리펩티드는 변이체 ActRIIB 폴리펩티드와 상기 상호작용 짝(pair)의 제 1 구성요소의 아미노산 서열을 포함하며, 그리고 제 2 폴리펩티드는변형안된 ActRIIB 폴리펩티드, 또는 상기 제1 폴리펩티드에 존제하는 것과는 상이한 변이체 ActRIIB 폴리펩티드의 아미노산 서열을 포함하고, 그리고 상기 상호작용 짝의 제 2 구성요소의 아미노산 서열을 포함한다. 상기 상호작용 짝은 복합체, 구체적으로, 이형이량체 복합체 복합체를 형성하기 위하여 상호작용하는 임의의 2개 폴리펩티드 서열일 수 있지만, 작업 구체예에서는 또한 동형이량체 복합체를 형성하는 상호작용 짝이 이용될 수도 있다. 개선된 성질/활성 이를 테면, 증가된 혈청 반감기를 부여하거나, 또는 개선된 성질/활성을 제공하기 위하여 또다른 모이어티가 부착된 어뎁터로 작용하는 상호작용 짝이 선택될 수 있다. 예를 들면, 폴리에틸렌 글리콜 모이어티는 개선된 성질/활성, 이를 테면 개선된 혈청 반감기를 제공하기 위하여 상호작용 짝의 한 성분 또는 양쪽 성분에 부착될 수 있다.
상호작용 짝의 제 1 및 제 2 구성요소는 비대칭 짝일 수도 있는데, 이것은 구성요소들이 자가-연합보다는 서로 선호적으로 연합된다는 것을 의미한다. 따라서, 비대칭 상호작용 짝의 제 1 및 제2 구성요소들은 이형이량체 복합체를 만들 수 있다. (가령, 도 1b 참고). 대안으로, 상호작용 쌍은 비유도될 수 있는데, 이것은 상기 쌍의 구성원들이 실제적인 선호 없이 서로 연관되거나 또는 자가-연관될 수 있고, 그리고 따라서, 동일하거나 상이한 아미노산 서열을 가질 수 있다는 것을 의미한다(가령, 도 1a 참고). 따라서, 비유도된 상호작용 쌍의 첫 번째와 두 번째 구성원은 연관하여 동종이합체성 복합체 또는 이형이합체성 복합체를 형성할 수 있다. 임의선택적으로, 상호작용 짝(가령, 비대칭 짝 또는 비유도 상호작용 짝)의 제 1 구성 요소는 상호작용 짝의 제 2 구성요소와 공유적으로 연합한다. 임의선택적으로, 상호작용 짝(가령, 비대칭 짝 또는 비유도 상호작용 짝)의 제 1 구성 요소는 상호작용 짝의 제 2 구성요소와 비-공유적으로 연합한다.
특정한 실례로서, 본 발명은 면역글로불린의 불변 도메인, 예를 들면, 면역글로불린의 CH1, CH2 또는 CH3 도메인 또는 Fc를 포함하는 폴리펩티드에 융합된 변이체 ActRIIB 폴리펩티드 또는 변형안된 ActRIIB 폴리펩티드를 포함하는 융합 단백질을 제공한다. 인간 IgG1, IgG2, IgG3, 및 IgG4로부터 유도된 Fc 도메인이 본 명세서에서 제공된다. CDC 또는 ADCC 활성을 감소시키는 다른 돌연변이들이 공지되어 있고, 집합적으로 이들 임의의 변이체은 본 명세서에 포함되며, 본 명세서의 이형이량체의 유익한 성분으로 이용될 수 있다. 임의선택적으로, 서열 번호: 13의 IgG1 Fc 도메인은 잔기, 이를 테면 Asp-265, Lys-322, 및 Asn-434 (대응하는 전장 IgG1에 따라 번호매김됨)에서 하나 또는 그 이상의 돌연변이를 갖는다. 특정 경우들에서, 하나 또는 그 이상의 이들 돌연변이 (가령, Asp-265 돌연변이)를 갖는 변이체 Fc 도메인은 야생형 Fc 도메인와 비교하여 Fcγ 수용체에 대한 결합 능력이 감소된다. 다른 경우들에서, 하나 또는 그 이상의 이들 돌연변이 (가령, Asn-434 돌연변이)를 갖는 변이체 Fc 도메인은 야생형 Fc 도메인와 비교하여 MHC 부류 I-관련된 Fc-수용체 (FcRN)에 결합하는 능력이 증가된다.
인간 IgG1 (G1Fc)의 Fc 부분에 이용될 수 있는 고유한 아미노산 서열은 하기에 예시된다 (서열 번호: 13). 점선은 힌지 영역을 나타내며, 직선은 자연 발생적 변이체를 갖는 위치를 나타낸다. 부분적으로, 본 명세서는 서열 번호: 13에 대하여 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나, 이들로 필수적으로 구성되거나, 또는 구성되는 폴리펩티드를 제공한다. G1Fc에서 자연 발생적 변이체는 서열 번호: 13에서 이용된 넘버링 체계에 따라 E134D 및 M136L을 포함할 수 있다(Uniprot P01857 참고).
인간 IgG2 (G2Fc)의 Fc 부분에 이용될 수 있는 고유한 아미노산 서열은 하기에 예시된다 (서열 번호: 14). 점선은 힌지 영역을 나타내며, 이중 밑줄은 이 서열에서 데이터 베이스가 충돌하는 위치를 나타낸다 (UniProt P01859). 부분적으로, 본 명세서는 서열 번호: 14에 대하여 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나, 이들로 필수적으로 구성되거나, 또는 구성되는 폴리펩티드를 제공한다.
인간 IgG3 (G3Fc)의 Fc 부분에 이용도리 수 있는 2가지 예시 아미노산 서열을 하기에 나타낸다. G3Fc의 힌지 영역은 다른 Fc 쇄의 길이의 최대 4배가 될 수 있고, 유사한 17개-잔기 세그먼트를 앞세우고, 3개의 동일한 15개-잔기 세그먼트를 포함한다. 하기에 나타낸 제 1 G3Fc 서열(서열 번호: 15)은 단일 15개-잔기 세그먼트로 구성된 짧은 힌지 영역을 포함하며, 반면 제 2 G3Fc 서열 (서열 번호: 16)은 전장 힌지 영역을 포함한다. 각 경우에서, 점선은 힌지 영역을 나타내며, 직선은 UniProt P01859에 따른 자연 발생적 변이체를 갖는 위치를 나타낸다. 부분적으로, 본 명세서는 서열 번호: 15 및 16에 대하여 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나, 이들로 필수적으로 구성되거나, 또는 구성되는 폴리펩티드를 제공한다.
G3Fc (예를 들면, Uniprot P01860)에서 자연 발생적 변이체들은 서열 번호: 15에 이용된 넘버링 체계로 전환될 때 E68Q, P76L, E79Q, Y81F, D97N, N100D, T124A, S169N, S169del, F221Y를 포함하며, 본 명세서는 이들 변이중 하나 또는 그 이상을 함유하는 G3Fc 도메인이 포함된 융합 단백질을 제공한다. 또한, 인간 면역글로불린 IgG3 유전자 (IGHG3)는 상이한 힌지 길이에 의해 특징화되는 구조적 다형태를 나타낸다[Uniprot P01859]. 특히, 변이체 WIS는 대부분의 V 영역과 모든 CH1 영역이 부족하다. 힌지 영역에 정상적으로 존재하는 11개에 추가하여 위치 7에 여분의 쇄간 이황화결합이 있다. 변이체 ZUC는 대부분의 V 영역, 모든 CH1 영역, 그리고 일부 힌지가 부족하다. 변이체 OMM은 대립형질 형태 또는 또다른 감마 쇄 하위부류를 나타낼 수 있다. 본 명세서는 하나 또는 그 이상의 이들 변이체를 함유하는 G3Fc 도메인이 포함된 추가적인 융합 단백질을 제공한다.
인간 IgG4 (G4Fc)의 Fc 부분에 이용될 수 있는 고유한 아미노산 서열은 하기에 예시된다 (서열 번호: 17). 점선은 힌지 영역을 나타낸다. 부분적으로, 본 명세서는 서열 번호: 17에 대하여 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나, 이들로 필수적으로 구성되거나, 또는 구성되는 폴리펩티드를 제공한다.
Fc 도메인 안에 다양하게 조작된 돌연변이는 G1Fc 서열 (서열 번호: 13)에 대하여 나타내며, G2Fc, G3Fc, 및 G4Fc에서 유사 돌연변이는 도 4에서 G1Fc와의 배열로부터 유도될 수 있다. 부등한 힌지 길이로 인해, 아이소타입 정렬 (도 4)에 근거된 유사한 Fc 위치는 서열 번호: 13, 14, 15, 그리고 17에서 상이한 아미노산 번호를 소유한다. 힌지, CH2, 및 CH3 영역 (가령, 서열 번호: 13, 14, 15, 16, 또는 17)으로 구성된 면역글로불린 서열에서 주어진 아미노산 위치는 Uniprot 데이타베이스와 같이, IgG1 중쇄 불변 도메인 (CH1, 힌지, CH2, 및 CH3 영역으로 구성됨) 전체를 포괄할 때, 동일한 위치가 아닌 상이한 번호로 확인될 것이라는 것을 또한 인지할 수 있을 것이다 예를 들면, 인간 G1Fc 서열 (서열 번호: 13), 인간 IgG1 중쇄 불변 도메인 (Uniprot P01857), 및 인간 IgG1 중쇄에서 선택된 CH3 위치 간의 대응성은 다음과 같다.
단일 세포계로부터 비대칭 면역글로불린-기반의 단백질의 대량 생산에서 발생되는 문제는 "쇄 연합 문제"로 알려져 있다. 이중특이적 항체의 생산에서 주로 직면하는 바와 같이, 쇄 연합 문제는 상이한 중쇄 및/또는 경쇄가 단일 세포주에서 생성될 때 본질적으로 얻어지는 다수의 조합 중에서 원하는 다중 결합 단백질을 효율적으로 생산하려는 도전에 관한 것이다 [Klein et al (2012) mAbs 4:653-663 참고]. 이 문제는 두 개의 다른 중쇄와 두 개의 다른 경쇄가 동일한 세포에서 생산될 때 가장 심각한데, 이 경우 일반적으로 단 하나만을 원할 때, 총 16 개의 가능한 사슬 조합이 있다 (비록 일부는 동일하지만). 그럼에도 불구하고, 동일한 원리는 오직 2 개의 상이한 (비대칭) 중쇄를 혼입시키는 원하는 다중쇄 융합 단백질의 수율 감소를 설명한다.
허용가능한 수율로 바람직한 비대칭 융합 단백질을 생산하기 위해 단일 세포주에서 Fc-함유 융합 폴리펩티드 쇄의 바람직한 페어링을 증가시키는 다양한 방법이 당업계에 공지되어있다[예를 들면, Klein et al (2012) mAbs 4:653-663; 및 Spiess et al (2015) Molecular Immunology 67(2A): 95-106 참고]. Fc-함유 쇄들의 바람직한 페어링을 얻는 방법은 하전-기반의 페어링 (정전기적 스티어링), "노브-인투-홀(knobs-into-holes)" 입체적 페어링, SEEDbody 페어링, 및 류신 지퍼-기반의 페어링을 포함하나, 이에 국한되지 않는다.[예를 들면, Ridgway et al (1996) Protein Eng 9:617-621; Merchant et al (1998) Nat Biotech 16:677-681; Davis et al (2010) Protein Eng Des Sel 23:195-202; Gunasekaran et al (2010); 285:19637-19646; Wranik et al (2012) J Biol Chem 287:43331-43339; US5932448; WO 1993/011162; WO 2009/089004, 및 WO 2011/034605 참고 본원에서 기술된 바와 같이, 이들 방법을 이용하여, 변이체 ActRIIB 폴리펩티드 및 또다른, 임의선택적으로 상이한, 변이체 ActRIIB 폴리펩티드 또는 변형안된 ActRIIB 폴리펩티드를 포함하는 이종다량체를 만들 수 있다.
예를 들면, 이를 테면 Arathoon et al., U.S.7,183,076 및 Carter et al., U.S.5,731,168에서 설명된 바와 같이, 구멍에 맞는 돌기(protuberance-into-cavity) (노브-인투-홀) 상보적 영역을 작제함으로써 특정 폴리펩티드간의 상호작용이 촉진될 수 있다. "돌기(Protuberances)"는 제 1 폴리펩티드 (가령, 제 1 상호작용 짝)의 경계면의 작은 아미노산 측쇄를 더 큰 측쇄 (가령, 티로신 또는 트립토판)로 대체함으로써 구축된다. 상기 돌기에 동일한 또는 더 작은 크기의 상보적 "구멍"은 제 2 폴리펩티드 (가령, 제 2 상호작용 짝)의 경계면에서 큰 아미노산 측쇄를 더 작은 측쇄 (가령, 알라닌 또는 트레오닌)로 대체함으로써 임의선택적으로 만든다. 제 1 또는 제 2 폴리펩티드의 경계면에 적절하게 위치되고, 적합한 크기의 돌기 또는 구멍이 존재하는 경우, 인접한 경계면에서 각각 대응하는 구멍 또는 돌기만 제조하면 된다.
중성 pH (7.0)에서, 아스파르트산 및 글루탐산은 음으로 하전되며, 리신, 아르기닌 및 히스티딘은 양으로 하전된다. 이들 하전된 잔기를 이용하여 이형이량체 형성을 촉진시키고, 동시에 동형이량체 형성을 방해할 수 있다. 인력 상호작용은 반대 하전 간에 일어나며, 척력 상호작용은 유사한 하전 사이에 발생된다. 부분적으로, 본 명세서에서 공개된 단백질 복합체들은 하전된 경계면 잔기의 부위 지향된 돌연변이유발을 실행함으로써,이형다량체 형성 (가령, 이형이량체 형성)을 촉진시키는 인력 상호작용, 그리고 임의선택적으로 동형이량체 형성 (가령, 동형이량체 형성)을 방해하는 척력 상호작용을 이용한다.
예를 들면, IgG1 CH3 도메인 경계면은 도메인-도메인 상호작용: Asp356-Lys439', Glu357-Lys370', Lys392-Asp399', 및 Asp399-Lys409' [제 2 쇄에서 잔기 넘버링은 (')로 표시됨]에 관여하는 4가지 독특한 하전 잔기 짝을 포함한다. IgG1 CH3 영역의 잔기를 지정하기 위해 여기에 사용된 넘버링 체계는 Kabat의 EU 번호 체계에 부합함을 유의해야 한다. CH3-CH3 도메인 상호 작용에 존재하는 2-배 대칭 때문에, 각각의 독특한 상호 작용은 구조에서 두 번 나타난다 (가령, Asp-399-Lys409' 및 Lys409-Asp399'). 야생형 서열, K409-D399'는 이형이량체와 동형이량체 형성을 모두 선호한다. 제 1 쇄에서 전하 극성을 전환시키는 단일 돌연변이 (예 : K409E; 양전하를 음전하로)는 제 1 쇄 동형이량체 형성에 바람직하지 않은 상호 작용을 유도한다. 부적절한 상호작용은 동일한 전하 사이에 발생하는 척력 작용으로 인해 발생한다(음성-음성; K409E-D399'과 D399-K409E'). 제 2 쇄에서 전하 극성을 전환시키는 단일 돌연변이 (D399K'; 음전하를 양전하로)는 제 2 쇄 동형이량체 형성에 바람직하지 않은 상호 작용을 유도한다(K409'-D399K'와 D399K-K409') . 그러나, 동시에 이들 두 돌연변이 (K409E와 D399K')는 이형이량체 형성에 대한 우호적인 상호작용 (K409E-D399K'와 D399-K409')을 유도한다.
이형이량체 형성 및 동형이량체 방지에 있어서 정전기 스티어링 효과는 추가적인 전하 잔기의 돌연변이에 의해 추가로 강화될 수 있는데, 이들은 제 2 쇄에서 예를 들면, Arg355 및 Lys360을 포함하는 반대 하전된 잔기와 페어링되거나, 또는 되지 않을 수 있다. 상기 이종다량체의 이종다량체 형성을 향상시키기 위해 단독으로 또는 조합하여 사용될 수 있는 가능한 전하 변화 돌연변이를 열거한다.
일부 구체예들에 있어서, 본 출원의 융합 단백질에서 CH3-CH3 경계면을 만드는 하나 또는 그 이상의 잔기는 하전된 아미노산으로 대체되고, 따라서 상호작용은 정전기적으로 비선호적으로 된다. 예를 들면, 경계면에 있는 양-하전된 아미노산 (가령, 리신, 아르기닌, 또는 히스티딘)은 음으로 하전된 아미노산 (가령, 아스파르트산 또는 글루탐산)으로 대체된다. 전술한 치환에 대한 대안으로, 또는 이와 복합되어, 경계면에서 음으로-하전된 아미노산은 양으로-하전된 아미노산으로 대체된다. 특정 구체예들에 있어서, 상기 아미노산은 원하는 하전 특징을 갖는 비-자연 발생적 아미노산으로 대체된다. 음으로 하전된 잔기 (Asp 또는 Glu)를 His으로 돌연변이시키면, 측쇄 부피가 증가되고, 이는 입체적 문제를 야기할 수 있음을 주지해야 한다. 더욱이, His 양성자 공여자-및 수용자-형태는 국소 환경에 따라 달라진다. 이러한 문제는 설계 전략과 함께 고려되어야 한다. 경계면 잔기는 인간 및 마우스 IgG 하위부류에서 매우 보존되어 있기 때문에, 본 명세서에서 공개된 정전기 스티어링 효과는 인간 및 마우스 IgG1, IgG2, IgG3, 및 IgG4에 적용될 수 있다. 이 전략은 또한 CH3 도메인 경계면에서 하전되지 않은 잔기를 하전된 잔기로 변형시키는 것으로 확장될 수 있다.
부분적으로, 본 명세서는 전하 페어링 (정전기적 스티어링)에 근거하여 상보적으로 작제된 Fc 서열을 이용한 비대칭 Fc-함유 폴리펩티드 쇄들의 바람직한 페어링을 제공한다. 정전 상보성을 갖는 한 쌍의 Fc 서열 중에서 하나는 임의선택적 링커가 있거나 또는 없이, 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드에 임의적으로 융합되어, 변이체 ActRIIB-Fc 또는 변형안된 ActRIIB-Fc 융합 폴리펩티드를 만들 수 있다. 이 단일 쇄는 원하는 다중-쇄 구조체(가령, 변이체 ActRIIB-Fc 이종다량체) 생성을 선호하는 상기 제 1 Fc 서열에 상보적인 Fc 서열과 함께 선택 세포에서 공동-발현될 수 있다. 정전기적 스티어링에 기반을 둔 본 실시예에서, 서열 번호: 200 [인간 G1Fc(E134K/D177K)] 및 서열 번호: 201 [인간 G1Fc(K170D/K187D)]는 상보적 Fc 서열의 예가 되며, 이때 조작된 아미노산 치환은 이중 밑줄로 나타내며, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드는 서열 번호: 18 또는 서열 번호: 19에 융합될 수 있지만, 이들 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG2Fc, hG3Fc, 또는 hG4Fc의 대응하는 위치에서 아미노산 치환 (도 4)으로 상보적 Fc 짝이 생성되며, 이는 하기 상보적 hG1Fc 짝(서열 번호: 18 및 19)을 대신하여 이용될 수 있음을 인지할 것이다.
부분적으로, 본 명세서는 입체적 상보성에 근거하여 상보적으로 작제된 Fc 서열을 이용한 비대칭 Fc-함유 폴리펩티드 쇄들의 바람직한 페어링을 제공한다. 부분적으로, 본 명세서는 입체적 상보성의 예로써 노브-인투-홀 페어링(knobs-into-holes pairing)을 제공한다. 공간적 상보성을 갖는 한 쌍의 Fc 서열 중에서 하나는 임의선택적 링커가 있거나 또는 없이, 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드에 임의적으로 융합되어, 변이체 ActRIIB-Fc 또는 변형안된 ActRIIB-Fc 융합 폴리펩티드를 만들 수 있다. 이 단일 쇄는 원하는 다중-쇄 구조체 생성을 선호하는 제1 Fc에 상보적인 Fc 서열과 함께 선택 세포에서 공동-발현될 수 있다. 노브-인투-홀 대합에 근거된 이러한 실례에서, 서열 번호: 20 [인간 G1Fc(T144Y)] 및 서열 번호: 21 [인간 G1Fc(Y185T)]는 상보성 Fc 서열의 실례인데, 여기서 가공된 아미노산 치환은 이중 밑줄 표시되고, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드는 서열 번호: 20 또는 서열 번호:21에 융합될 수 있지만, 둘 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG2Fc, hG3Fc, 또는 hG4Fc의 대응하는 위치에서 아미노산 치환 (도 4)으로 상보적 Fc 짝이 생성되며, 이는 하기 상보적 hG1Fc 짝(서열 번호: 20 및 21)을 대신하여 이용될 수 있음을 인지할 것이다.
조작된 이황화결합과 복합된 노브-인투-홀 페어링에 근거한 Fc 상보성의 예는 서열 번호: 22 [hG1Fc(S132C/T144W)] 및 서열 번호: 23 [hG1Fc(Y127C/T144S/L146A/Y185V)]에서 공개된다. 상기 조작된 아미노산 치환은 이중 밑줄로 나타내며, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드는 서열 번호: 22 또는 서열 번호: 23에 융합될 수 있지만, 이들 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG2Fc, hG3Fc, 또는 hG4Fc의 대응하는 위치에서 아미노산 치환 (도 4)으로 상보적 Fc 짝이 생성되며, 이는 하기 상보적 hG1Fc 짝(서열 번호: 22 및 23)을 대신하여 이용될 수 있음을 인지할 것이다.
부분적으로, 본 명세서는 인간 IgG의 β-가닥 세그먼트와 IgA CH3 도메인이 서로 맞물리게 되도록 작제된 Fc 서열을 이용한 비대칭 Fc-함유 폴리펩티드 쇄들의 바람직한 페어링을 제공한다 이러한 방법들은 가닥-교환 조작된(engineered) 도메인 (SEED) CH3 이형이량체를 이용하여 SEEDbody 융합 단백질이 형성되는 것을 포함한다 [예를 들면, Davis et al (2010) Protein Eng Design Sel 23:195-202 참고]. SEEDbody 상보성을 갖는 한 쌍의 Fc 서열 중에서 하나는 임의선택적 링커가 있거나 또는 없이, 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드에 임의적으로 융합되어, 변이체 ActRIIB-Fc 또는 변형안된 ActRIIB-Fc 융합 폴리펩티드를 만들 수 있다. 이 단일 쇄는 원하는 다중-쇄 구조체 생성을 선호하는 제1 Fc에 상보적인 Fc 서열과 함께 선택 세포에서 공동-발현될 수 있다. SEEDbody (Sb) 대합에 근거된 이러한 실례에서, 서열 번호: 29 [hG1Fc(SbAG)] 및 서열 번호: 30 [hG1Fc(SbGA)]은 상보성 IgG Fc 서열의 실례인데, 여기서 IgA Fc로부터 가공된 아미노산 치환은 이중 밑줄 표시되고, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드는 서열 번호: 24 또는 서열 번호: 25에 융합될 수 있지만 둘 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG1Fc, hG2Fc, hG3Fc, 또는 hG4Fc의 대응하는 위치에서 아미노산 치환 (도 4)으로 Fc 단량체가 생성되며, 이는 하기 상보적 IgG-IgA 쌍(서열 번호: 24 및 25)을 대신하여 이용될 수 있음을 인지할 것이다.
부분적으로, 본 명세서는 Fc CH3 도메인의 C-말단에 부착된 절단가능한 류신 지퍼 도메인를 갖는 비대칭 Fc-함유 폴리펩티드 쇄의 바람직한 페어링을 제공한다. 류신 지퍼의 부착은 이형이량체성 항체 중쇄들의 선호적 어셈블리를 제공하는데 충분하다. 가령, Wranik et al (2012) J Biol Chem 287:43331-43339 참고. 본 명세서에서 기술된 바와 같이, 류신 지퍼-형성 가닥에 부착된 Fc 서열 쌍중 하나는 임의선택적 링커가 있거나 또는 없이, 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드에 임의적으로 융합되어, 변이체 ActRIIB-Fc 또는 변형안된 ActRIIB-Fc 융합 폴리펩티드를 만들 수 있다. 이 단일 쇄는 원하는 다중-쇄 구조체 생성을 선호하는 상보적 류신 지퍼-형성 가닥에 부착된 Fc 서열과 함께 선택 세포에서 공동-발현될 수 있다. 정제 후 박테리아 엔도단백질분해효소 Lys-C로 이 구조체의 단백질분해성 절단으로 류신 지퍼 도메인이 방출되며, 고유의 Fc의 구조와 동일한 Fc 구조체가 생성된다. 류신 지퍼 페어링에 기반을 둔 본 실시예에서, 서열 번호: 26 [hG1Fc-Ap1 (산성)] 및 서열 번호: 27 [hG1Fc-Bp1 (염기성)]는 상보적 IgG Fc 서열의 예가 되며, 이때 조작된 상보적 류신 지퍼 서열은 밑줄로 표시되며, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 야생형 ActRIIB 폴리펩티드는 서열 번호: 26 또는 서열 번호: 27에 융합될 수 있지만, 이들 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG1Fc, hG2Fc, hG3Fc, 또는 hG4Fc에 임의선택적 링커와 함께 또는 링커없이 부착된 류신 지퍼-형성 서열 (도 4)은 하기 상보적 류신 지퍼-형성 짝(서열 번호: 26 및 27)에 이용될 수 있는 Fc 단량체를 만들 수 있음을 인지할 것이다.
1
THTCPPCPAP ELLGGPSVFL FPPKPKDTLM ISRTPEVTCV VVDVSHEDPE
51
VKFNWYVDGV EVHNAKTKPR EEQYNSTYRV VSVLTVLHQD WLNGKEYKCK
101
VSNKALPAPI EKTISKAKGQ PREPQVYTLP PSREEMTKNQ VSLTCLVKGF
151
YPSDIAVEWE SNGQPENNYK TTPPVLDSDG SFFLYSKLTV DKSRWQQGNV
201
FSCSVMHEAL HNHYTQKSLS LSPGKGGSAQ LEKELQALEK ENAQLEWELQ
251
ALEKELAQGA T (서열 번호: 26)
1
THTCPPCPAP ELLGGPSVFL FPPKPKDTLM ISRTPEVTCV VVDVSHEDPE
51
VKFNWYVDGV EVHNAKTKPR EEQYNSTYRV VSVLTVLHQD WLNGKEYKCK
101
VSNKALPAPI EKTISKAKGQ PREPQVYTLP PSREEMTKNQ VSLTCLVKGF
151
YPSDIAVEWE SNGQPENNYK TTPPVLDSDG SFFLYSKLTV DKSRWQQGNV
201
FSCSVMHEAL HNHYTQKSLS LSPGKGGSAQ LKKKLQALKK KNAQLKWKLQ
251
ALKKKLAQGA T (서열 번호: 27)
부분적으로, 본 명세서는 원하는 이형 종의 정제를 용이하게 하기 위하여, Fc 도메인에 추가 돌연변이와 함께 복합되어, 상기 기술된 방법에 의해여 비대칭 Fc-함유 폴리펩티드 쇄의 바람직한 페어링을 제공한다. 실시예는 하나의 Fc-함유 폴리펩티드 쇄에서 2개의 음전하 아미노산(아스파르트산 또는 글루탐산)과 상보적 Fc-함유 폴리펩티드 쇄에서 2개의 양전하 아미노산(가령, 아르기닌)의 추가 치환과 함께 (서열 번호: 28-29), 서열 번호: 22 및 23에 기재된 바와 같이, 조작된 이황화결합과 복합하여 노브-인투-홀 페어링에 기초하여 Fc 도메인의 상보성을 이용한다. 이러한 4 가지 아미노산 치환은 등전점 또는 순(net) 분자 전하의 차이에 기초하여, 이종 폴리펩티드 혼합물로부터 원하는 이종(heteromeric) 융합 단백질의 선택적 정제를 용이하게 한다. 상기 조작된 아미노산 치환은 이중 밑줄로 나타내며, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드는 서열 번호: 28 또는 서열 번호: 29에 융합될 수 있지만, 이들 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG2Fc, hG3Fc, 또는 hG4Fc의 대응하는 위치에서 아미노산 치환 (도 4)으로 상보적 Fc 짝이 생성되며, 이는 하기 상보적 hG1Fc 짝(서열 번호: 28-29)을 대신하여 이용될 수 있음을 인지할 것이다.
또다른 실시예는 하나의 Fc-함유 폴리펩티드 쇄 (서열 번호: 30)의 위치 213에서 히스티딘을 아르기닌으로 치환과 함께, 서열 번호: 22-23에 기술된 바와 같이, 조작된 이황화결합과 복합된 노브-인투-홀 페어링에 기초한 Fc 도메인의 상보성과 관련된다. 이 치환 (Kabat et al.의 번호매김 시스템에서 H435R)은 단백질 A에 대한 친화력 차이에 근거하여 바람직하지 못한 동종이량체로부터 원하는 이종이량체의 분리를 용이하게 한다. 조작된 아미노산 치환은 이중 밑줄로 나타내며, 그리고 이 구조체의 제 1 변이체 ActRIIB 폴리펩티드, 제 2 변이체 ActRIIB 폴리펩티드, 또는 변형안된 ActRIIB 폴리펩티드는 서열 번호: 30 또는 서열 번호: 23에 융합될 수 있지만, 이들 모두에 융합되지는 않는다. 고유의 hG1Fc, 고유의 hG2Fc, 고유의 hG3Fc, 및 고유의 hG4Fc 간에 아미노산 동일성 수준이 높다면, hG2Fc, hG3Fc, 또는 hG4Fc의 대응하는 위치에서 아미노산 치환 (도 4)으로 상보적 Fc 짝이 생성되며, 이는 서열 번호:30(하기)과 서열 번호:23의 상보적 hG1Fc 짝을 대신하여 이용될 수 있음을 인지할 것이다.
Fc 도메인 안에 다양하게 조작된 돌연변이는 G1Fc 서열 (서열 번호: 13)에 대하여 상기에 나타낸다. G2Fc, G3Fc, 및 G4Fc에서 유사 돌연변이는 도 4에서 G1Fc와의 배열로부터 유도될 수 있다. 부등한 힌지 길이로 인해, 아이소타입 정렬 (도 4)에 근거된 유사한 Fc 위치는 다음의 표에 요약된 바와 같이, 서열 번호: 13, 14, 15, 16, 그리고 17에서 상이한 아미노산 번호를 소유한다.
융합 단백질의 상이한 요소들(가령, 면역글로불린 Fc 융합 단백질)은 원하는 기능성과 일관된 방식으로 정렬될 수 있음을 인지할 것이다. 예를 들면, ActRIIB 폴리펩티드 도메인은 이종성 도메인의 C 말단에 배치될 수 있거나, 또는 대안으로, 이종성 도메인은 ActRIIB 폴리펩티드 도메인의 C 말단에 배치될 수 있다. ActRIIB 폴리펩티드 도메인과 이종성 도메인은 융합 단백질 내에서 인접할 필요가 없고, 그리고 추가 도메인 또는 아미노산 서열이 어느 한쪽 도메인의 C-또는 N 말단에 또는 이들 도메인 사이에 포함될 수 있다.
예를 들면, ActRIIB 폴리펩티드는 A-B-C 형태로 아미노산 서열을 포함할 수 있다. B 부분은 ActRIIB 폴리펩티드 도메인에 상응한다. A와 C 부분은 독립적으로 0, 1, 또는 하나 이상의 아미노산일 수 있고, A와 C 부분 모두 존재하는 경우 B에 대하여 이종성(heterologous)이다. A 및/또는 C 부분은 B 부분에 링커 서열을 경유하여 부착될 수 있다. 링커는 글리신 (가령, 2-10개, 2-5개, 2-4개, 2-3개 글리신 잔기)이 많거나, 또는 글리신과 프롤린 잔기가 많을 수 있고, 예를 들면, 트레오닌/세린 및 글리신의 단일 서열 또는 트레오닌/세린 및/또는 글리신의 반복 서열을 포함할 수 있고, 가령, GGG (서열 번호: 261), GGGG (서열 번호: 262), TGGGG (서열 번호: 263), SGGGG (서열 번호: 264), TGGG (서열 번호: 265), 또는 SGGG (서열 번호: 266) 단일항(singlets), 또는 반복부(repeats)를 포함할 수 있다. 특정 구체예들에 있어서, ActRIIB 융합 단백질은 A-B-C 형태로 아미노산 서열을 포함할 수 있는데, 이때 A는 리더(신호) 서열이며, B는 ActRIIB 폴리펩티드 도메인으로 구성되며, 그리고 C는 생체내 안정성, 생체내 반감기, 취입/투여, 조직 국소화 또는 분포, 단백질 복합체 형성, 및/또는 정제중 하나 또는 그 이상을 강화하는 폴리펩티드 부분이다. 특정 구체예들에 있어서, ActRIIB 융합 단백질은 A-B-C 형태로 아미노산 서열을 포함할 수 있는데, 이때 A는 TPA 리더 서열이며, B는 ActRIIB 수용체 폴리펩티드 도메인으로 구성되며, 그리고 C는 면역글로불린 Fc 도메인이다.
특정 구체예들에 있어서, 본 발명의 ActRIIB 폴리펩티드는 이 변이체 ActRIIB 폴리펩티드를 안정시킬 수 있는 하나 또는 그 이상의 변형을 내포한다. 예를 들면, 이러한 변형은 변이체 ActRIIB 폴리펩티드의 시험관내 반감기를 강화시키고, 변이체 ActRIIB 폴리펩티드의 순환 반감기를 강화시키고 및/또는 변이체 ActRIIB 폴리펩티드의 단백질분해를 감소시킨다. 이러한 안정화 변형에는 융합 단백질 (예를 들면, 변이체 ActRIIB 폴리펩티드 도메인 및 안정화제 도메인을 포함하는 융합 단백질), 당화 부위의 변형 (예를 들면, 변이체 ActRIIB 폴리펩티드에 당화 부위 추가 포함), 및 탄수화물 모이어티의 변형 (예를 들면, 변이체 ActRIIB 폴리펩티드로부터 탄수화물 모이어티 제거 포함)이 포함되나, 이에 국한되지 않는다. 융합 단백질의 경우, 변이체 ActRIIB 폴리펩티드는 이러한 IgG 분자 (예를 들어, Fc 도메인)와 같은 안정화 도메인에 융합된다. 본 명세서에서 사용된 바와 같이, 용어 "안정화 도메인"은 융합 단백질인 경우 융합 도메인 (가령, Fc 도메인)을 지칭하고, 뿐만 아니라 비단백질성(nonproteinaceous) 변형 이를 테면 탄수화물 모이어티, 또는 비단백질성 폴리머, 이를 테면 폴리에틸렌 글리콜을 또한 포함한다.
특정 구체예들에서, 본 발명은 다른 단백질로부터 단리된, 또는 그렇지 않으면, 다른 단백질이 실질적으로 존재하지 않는, 이용 가능한 단리된 및/또는 정제된 변이체 ActRIIB 폴리펩티드를 만든다.
특정 구체예들에서, 본 발명의 ActRIIB 폴리펩티드 (변형안된 또는 변형된)는 당분야에 공지된 다양한 기술에 의해 만들어질 수 있다. 예를 들면, 이러한 ActRIIB 폴리펩티드는 표준 단백질 화학 기술, 예를 들면, Bodansky, M. Principles of Peptide Synthesis, Springer Verlag, Berlin (1993) 및 Grant G. A. (ed.), Synthetic Peptides: A User's Guide, W. H. Freeman and Company, New York (1992)에서 설명된 것들을 이용하여 합성될 수 있다. 이에 더하여, 자동화된 펩티드 합성장치는 상업적으로 가용하다 (가령, Advanced ChemTech Model 396; Milligen/Biosearch 9600). 대안으로, 상기 ActRIIB 폴리펩티드, 이의 단편 또는 이의 변이체들은 당분야에 공지된 다양한 발현 시스템 [가령, 대장균(E. coli), 중국 헴스터 난소 (CHO) 세포, COS 세포, 베큘로바이러스]을 이용하여 재조합적으로 만들어질 수 있다(하기 참고). 추가 구체예에서, 변형된 또는 변형되지 않은 ActRIIB 폴리펩티드는 예로서, 프로테아제, 예를 들면, 트립신, 서몰리신, 키모트립신, 펩신, 또는 대합된 염기성 아미노산 전환 효소 (PACE)를 이용함으로써 자연 발생적 또는 재조합적으로 생산된 전장 ActRIIB 폴리펩티드의 소화에 의해 생산될 수 있다. 단백질분해가능한 절단 부위는 컴퓨터 분석(시판되는 소프트웨어, 가령, MacVector, Omega, PCGene, Molecular Simulation, Inc.)을 이용하여 식별해낼 수 있다. 대안으로, 이러한 ActRIIB 폴리펩티드는 이를 테면 당분야에 공지된 표준 기술, 이를 테면 화학적 절단(가령, 시아노겐 브롬화물, 히드록실아민)에 의해 자연 발생적 또는 재조합적으로 생산된 전장의 ActRIIB 폴리펩티드로부터 만들어질 수 있다.
3.
ActRIIB 폴리펩티드를 인코드하는 핵산
특정 양태에서, 본 발명은 본 명세서에서 기재된 임의의 변이체를 포함하여, 상기 ActRIIB 폴리펩티드 (가령, 가용성 ActRIIB 폴리펩티드)중 임의의 것을 인코드하는 단리된 및/또는 재조합 핵산을 제공한다. 예를 들면, 서열 번호: 4은 자연 발생적 ActRIIB 전구체 폴리펩티드를 인코드하며, 서열 번호: 3는 가용성 ActRIIB 폴리펩티드를 인코드한다. 대상 핵산은 단일-가닥이거나 또는 이중 가닥일 수 있다. 이러한 핵산은 DNA 또는 RNA 분자일 수 있다. 이들 핵산은 예를 들면, ActRIIB 폴리펩티드를 만드는 방법, 또는 직접적인 치료 물질(가령, 유전자 요법 방법)로써 이용될 수 있다.
특정 양태에서, ActRIIB 폴리펩티드를 인코드하는 핵산은 서열 번호: 3의 변이체인 핵산을 포함하는 것으로 이해된다. 변이체 뉴클레오티드 서열은 하나 또는 그 이상의 뉴클레오티드 치환, 부가 또는 결실에 의해 다른 서열, 예를 들면, 대립형질 변이체를 포함하고; 그리고, 이런 이유로, 서열 번호: 4의 뉴클레오티드 서열과 상이한 코딩 서열을 포함한다.
특정 구체예들에서, 본 발명은 서열 번호: 3에 대하여 적어도 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일한 단리된 또는 재조합 핵산 서열을 제공한다. 당업자는 서열 번호: 3, 그리고 서열 번호: 3의 변이체에 상보적인 핵산 서열 또한 본 발명의 범위 안에 있음을 인지할 수 있을 것이다. 추가 구체예들에서, 본 발명의 핵산 서열은 단리되거나, 재조합되거나, 및/또는 이종성 뉴클레오티드 서열에 융합되거나 또는 DNA 라이브러리 안에 있을 수 있다.
다른 구체예들에 있어서, 본 명세서 핵산은 또한, 고도로 엄격한 조건 하에, 서열 번호: 3에서 지정된 뉴클레오티드 서열, 서열 번호: 3의 보체 서열, 또는 이들의 단편에 혼성화하는 뉴클레오티드 서열을 포함한다. 상기에서 논의된 바와 같이, 당업자는 DNA 혼성화를 촉진시키는 적절한 엄격 조건은 가변적일 수 있다는 것을 용이하게 이해할 것이다. 당업자는 DNA 혼성화를 촉진시키는 적절한 엄격 조건은 가변적일 수 있다는 것을 용이하게 이해할 것이다. 예를 들면, 6.0 x 염화나트륨/구연산나트륨 (SSC)에서 약 45 ℃에서 혼성화, 이어서 50 ℃에서 2.0 x SSC의 세척으로 실행할 수 있다. 예를 들면, 세척 단계에서 염 농도는 50 ℃에서 약 2.0 x SSC의 낮은 엄격성으로부터 50 ℃에서 0.2 x SSC의 높은 엄격성에서 선택될 수 있다. 또한, 세척 단계의 온도는 약 22 ℃의 낮은 엄격성 조건으로부터 약 65 ℃의 높은 엄격성 조건으로 증가될 수 있다. 온도 및 염이 변화될 수 있거나, 또는 다른 변수가 변화되는 동안 온도 또는 염 농도는 일정하게 유지될 수 있다. 한 구체예에서, 본 발명은 실온에서 6 x SSC의 낮은 엄격성 조건하에 혼성화되고, 이어서 실온에서 2 x SSC에서 세척된 핵산을 제공한다.
유전자 코드에서 축중성으로 인해 서열 번호: 3에서 진술된 바와 같은 핵산과 상이한 단리된 핵산 역시 본 발명의 범위 내에 있다. 예를 들면, 다수의 아미노산이 하나 이상의 삼중항으로 지정된다. 동일한 아미노산을 특정하는 코돈, 또는 동의코돈 (예를 들면, CAU와 CAC는 히스티딘의 경우 동의코돈임)으로 이 단백질의 아미노산 서열에 영향을 주지 않은 "침묵(silent)" 돌연변이가 된다. 그러나, 포유류 세포 중에 본 단백질의 아미노산 서열의 변화를 유도하는 DNA 서열 다형성이 존재할 것으로 기대된다. 당업자는 특정 단백질을 코딩하는 핵산의 하나 이상의 뉴클레오티드 (뉴클레오티드의 최대 약 3 내지 5 %)에서의 이러한 변이가 자연 대립 유전자 변이로 인해 주어진 종의 개체들 사이에 존재할 수 있음을 인식할 것이다. 임의의 모든 이런 뉴클레오티드 변이 및 결과의 아미노산 다형성은 본 발명의 범위 안에 있다.
일정한 구체예에서, 본 발명의 재조합 핵산은 발현 구조체 내에서 하나 또는 그 이상의 조절 뉴클레오티드 서열에 작동가능하게 연결될 수 있다. 조절 뉴클레오티드 서열은 일반적으로, 발현에 이용된 숙주 세포에 적합할 것이다. 다양한 숙주 세포에 있어서 다수 유형의 적절한 발현 벡터 및 적합한 조절 서열이 당분야에 공지되어 있다. 전형적으로, 전술한 하나 또는 그 이상의 조절 뉴클레오티드 서열은 프로모터 서열, 리더 또는 신호 서열, 리보좀 결합 부위, 전사 개시 및 종료 서열, 해독 개시 및 종료 서열, 및 인핸서 또는 활성자 서열을 포함하나, 이에 국한되지 않는다. 당분야에 공지된 구성 또는 유도성 프로모터는 본 발명에서 고려된다. 상기 프로모터는 자연 발생적 프로모터이거나, 또는 하나 이상의 프로모터 요소들이 복합된 하이브리드 프로모터일 수 있다. 발현 구조체는 세포 안 에피좀 상에, 이를 테면 플라스미드로 존재하거나, 또는 발현 구조체는 염색체 안에 삽입될 수 있다. 바람직한 구체예들에 있어서, 발현 벡터는 선택가능한 표지 유전자를 포함하여, 형질전환된 숙주 세포의 선별이 가능하다. 선택가능한 표지 유전자는 당분야에 공지되어 있으며, 이용되는 숙주 세포에 따라 가변적일 것이다.
본 발명의 특정 양상에서, 주제 핵산은 ActRIIB 폴리펩티드 폴리펩티드를 인코딩하고 최소한 하나의 조절 서열에 작동가능하게 연결된 뉴클레오티드 서열을 포함하는 발현 벡터에서 제공된다. 조절 서열은 당분야에서 인식되고, 그리고 변이체 ActRIIB 폴리펩티드의 발현을 주도하도록 선별된다. 따라서, 용어 조절 서열은 프로모터, 인핸서, 및 기타 발현 조절 요소들을 포함한다. 예시적인 조절 서열은 Goeddel; Gene Expression Technology: Methods in Enzymology, Academic Press, San Diego, CA (1990)에서 설명되고 있다. 가령, 자신에게 작동가능하게 연결될 때 DNA 서열의 발현을 제어하는 임의의 매우 다양한 발현 제어 서열이 변이체 ActRIIB 폴리펩티드를 인코딩하는 DNA 서열을 발현하기 위해 이들 벡터에서 이용될 수 있다. 이러한 유용한 발현 조절 서열은, 예를 들면, SV40의 초기 및 후기 프로머터, tet 프로모터, 아데노바이러스 또는 사이토메갈로바이러스 즉각 초기 프로모터, RSV 프로모터, lac 시스템, trp 시스템, TAC 또는 TRC 시스템, T7 RNA 중합효소에 의해 발현이 지시되는 T7 프로모터, 파아지 람다의 주요 오퍼레이터 및 프로모터 영역, fd 피복 단백질의 조절 영역, 3-포스포글리세레이트 키나제 또는 다른 글리콜분해 효소의 프로모터, 산 포스파타제의 프로모터, 가령, Pho5, 효모 α-메이팅 인자들의 프로모터, 베큘로바이러스 시스템의 폴리헤드곤 프로모터, 또는 진핵 세포 또는 이의 바이러스의 발현을 제어하는 것으로 알려진 기타 서열, 및 다양한 이의 조합들을 포함한다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택 및/또는 발현되기를 원하는 단백질의 유형과 같은 인자에 좌우될 수 있음을 알아야 한다. 더욱이, 벡터의 복사체 수, 복사체 수를 조절하는 능력, 그리고 이 벡터에 의해 인코드되는 임의의 다른 단백질, 가령, 항생제 표지 등의 발현이 또한 고려된다.
본 발명의 재조합 핵산은 원핵 또는 진핵 세포 (효모, 조류, 곤충 또는 포유류), 또는 이둘 모두에서 발현하는데 적합한 벡터에 클론된 유전자 또는 이의 일부분을 결찰시킴으로써 만들어질 수 있다. 재조합 변이체 ActRIIB 폴리펩티드의 생산을 위한 발현 수송체는 플라스미드 및 다른 벡터를 포함한다. 예를 들면, 적합한 벡터는 다음의 유형의 플라스미드를 포함한다: 원핵 세포, 이를 테면 대장균에서 발현을 위한 pBR322-유도된 플라스미드, pEMBL-유도된 플라스미드, pEX-유도된 플라스미드, pBTac-유도된 플라스미드 및 pUC-유도된 플라스미드.
일부 포유류 발현 벡터는 박테리아에서 벡터의 증식을 실행하는 원핵(prokaryotic) 서열과 진핵 세포에서 발현된 진핵(eukaryotic) 전사 단위를 모두 포함한다. pcDNAI/amp, pcDNAI/neo, pRc/CMV, pSV2gpt, pSV2neo, pSV2-dhfr, pTk2, pRSVneo, pMSG, pSVT7, pko-neo 및 pHyg 유도된 벡터는 진핵 세포의 형질감염에 적합한 포유류 발현 벡터의 예들이다. 이들 벡터중 일부는 박테리아 플라스미드, 이를 테면 pBR322의 서열로 변형되어, 진핵 세포와 원핵 세포 모두에서 복제 및 약물 저항성 선별이 가능하다. 대안으로, 바이러스, 이를 테면 소의 유두종 바이러스 (BPV-1), 또는 Epstein-Barr 바이러스 (pHEBo, pREP-유도된 그리고 p205)의 유도체들이 진핵 세포에서 단백질의 일시적 발현에 이용될 수 있다. 다른 바이러스 (레트로바이러스 포함) 발현 시스템의 예는 하기 유전자 요법 운반 시스템의 설명에서 찾아볼 수 있다. 플라스미드의 준비 및 숙주 유기체의 형질전환에 이용되는 다양한 방법들이 당분야에 공지되어 있다. 원핵 세포와 진핵 세포 모두에 적합한 다른 발현 시스템, 뿐만 아니라 전반적인 재조합 과정은 Molecular Cloning A Laboratory Manual, 2nd Ed., ed. by Sambrook, Fritsch and Maniatis (Cold Spring Harbor Laboratory Press, 1989) Chapters 16 and 17.을 참고한다. 일부 경우들에 있어서, 베큘로바이러스 발현 시스템의 사용에 의해 재조합 폴리펩티드를 발현시키는 것이 바람직할 수 있다. 이러한 베큘로바이러스 발현 시스템의 예로는 pVL-유도된 벡터 (이를 테면 pVL1392, pVL1393 및 pVL941), pAcUW-유도된 벡터 (이를 테면 pAcUW1), 및 pBlueBac-유도된 벡터 (이를 테면 β-gal 함유 pBlueBac III)을 포함한다.
바람직한 구체예에서, 벡터, 예를 들면, Pcmv-스크립트 벡터 (Stratagene, La Jolla, Calif.), pcDNA4 벡터 (Invitrogen, Carlsbad, Calif.) 및 pCI-neo 벡터 (Promega, Madison, Wisc.)는 CHO 세포에서 대상 변이체 ActRIIB 폴리펩티드를 생산하도록 설계될 것이다. 명백한 바와 같이, 주제 유전자 구조체는 예로서, 정제를 위한 융합 단백질 또는 변이체 단백질을 비롯한 단백질을 생산하기 위해, 배양액에서 증식된 세포에서 대상 변이체 ActRIIB 폴리펩티드의 발현을 유발하는데 이용될 수 있다.
본 발명은 하나 또는 그 이상의 ActRIIB 폴리펩티드들에 대한 코딩 서열(가령, 서열 번호:4)이 포함된 재조합 유전자로 형질감염된 숙주 세포에 또한 관계한다. 상기 숙주 세포는 임의의 원핵 세포 또는 진핵 세포일 것이다. 예를 들면, 본 발명의 ActRIIB 폴리펩티드는 박테리아 세포, 이를 테면 대장균, 곤충 세포 (가령, 베큘로바이러스 발현 시스템을 이용), 효모, 또는 포유류 세포에서 발현될 수 있다. 당업자들에게는 다른 적합한 숙주 세포들이 또한 알려져 있다.
따라서, 본 발명는 대상 변이체 ActRIIB 폴리펩티드를 생산하는 방법과 더욱 관련된다. 가령, ActRIIB 폴리펩티드를 인코딩하는 발현 벡터로 형질감염된 숙주 세포는 ActRIIB 폴리펩티드의 발현이 발생하도록 허용하는 적절한 조건 하에 배양될 수 있다. 상기 ActRIIB 폴리펩티드는 분비되고, 이 ActRIIB 폴리펩티드를 함유하는 세포와 배지 혼합물로부터 단리될 수 있다. 대안으로, 상기 ActRIIB 폴리펩티드는 세포질 내 또는 막 분획 내에 보유될 수 있고, 세포는 수거되고, 용해되고, 단백질은 단리 될 수 있다. 세포 배양물은 숙주 세포, 배지 및 다른 부산물을 포함한다. 세포 배양에 적합한 배지는 당분야에 공지되어 있다. 대상 ActRIIB 폴리펩티드들은 이온-교환 크로마토그래피, 겔 여과 크로마토그래피, 한외여과, 전기영동, ActRIIB 폴리펩티드의 특정 에피토프에 특이적인 항체를 이용한 면역친화력 정제를 포함하는 단백질을 정제하는데 공지된 기술을 이용하여, 세포 배양 배지, 숙주 세포, 또는 이 둘 모두로부터 단리될 수 있다. 바람직한 구체예에서, 상기 변이체 ActRIIB 폴리펩티드는 폴리펩티드는 정제를 용이하게 하는 도메인을 함유하는 융합 단백질이다.
다른 구체예에서, 재조합 변이체 ActRIIB 폴리펩티드의 원하는 부분의 N 말단에서 정제 리더 서열, 예를 들면, 폴리-(His)/엔테로키나아제 개열 부위 서열을 코딩하는 융합 유전자는 Ni2+ 금속 수지를 이용한 친화성 크로마토그래피에 의한 발현된 융합 단백질의 정제를 허용할 수 있다. 이후, 정제 리더 서열은 정제된 ActRIIB 폴리펩티드 및 이의 이종다량체를 제공하기 위해, 엔테로키나아제로 처리에 의해 차후 제거될 수 있다(가령, Hochuli et al., (1987) J. Chromatography 411:177; and Janknecht et al., PNAS USA 88:8972 참고).
융합 유전자를 만드는 기술은 공지되어 있다. 기본적으로, 상이한 폴리펩티드 서열을 인코드하는 다양한 DNA 단편의 결합은 결찰을 위한 블런트-단부 또는 스태거(stagger)-단부를 이용, 적절한 말단을 제공하기 위한 제한효소 절단, 바람직하지 못한 결합 및 효소적 결찰을 피하기 위하여 적절한 알칼리 포스포타제 처리와 같은 코헤시브 단부(cohesive ends)의 메우기를 이용하는 통상의 기술에 따라 실행된다. 또다른 구체예에서, 융합 유전자는 자동화된 DNA 합성기가 포함된 통상적인 기술에 의해 합성될 수 있다. 대안으로, 유전자 단편들의 PCR 증폭은 2개의 연속 유전자 단편 간에 상보적 오버헹(overhangs)을 만드는 엥커 프라이머를 이용하여 실행되고, 후속적으로 어닐링시켜 키메라 유전자 서열을 만들 수 있다 (예를 들면, Current Protocols in Molecular Biology, eds. Ausubel et al., John Wiley & Sons: 1992 참고).
4.
스크리닝 분석
특정 양태에서, 본 발명은 상기 변이체 ActRIIB 폴리펩티드의 항진제 또는 길항제인 화합물(물질)을 동정하는데 대상 변이체 ActRIIB 폴리펩티드 (가령, 가용성 ActRIIB 폴리펩티드)를 이용하는 것에 관계한다. 이 스크리닝을 통하여 확인된 화합물은 조직, 이를 테면 뼈, 연골, 근육, 지방, 및/또는 뉴런을 조작하는 이들의 능력, 조직 성장을 조절하는 이들의 능력을 평가하기 위하여 테스트될 수 있다. 임의선택적으로, 이들 화합물은 생체내에서 조직 성장을 조절하는 능력을 평가하기 위하여, 동물 모델에서 추가 테스트될 수 있다.
상기 변이체 ActRIIB 폴리펩티드를 표적으로 함으로써, 조직 성장을 조절하는 치료 물질을 스크리닝하는 다수의 접근법이 있다. 특정 구체예들에서, 뼈, 연골, 근육, 지방, 및/또는 뉴런의 성장에서 ActRIIB-중재된 효과를 교란시키는 물질을 동정하기 위하여 화합물들의 고효율 스크리닝이 수행될 수 있다. 특정 구체예들에서, 이 분석은 ActRIIB 폴리펩티드가 이의 결합 파트너, 이를 테면 ActRIIB 리간드 (가령, 액티빈, Nodal, GDF8, GDF11 또는 BMP7)에 결합하는 것을 특이적으로 억제 또는 감소시키는 화합물을 스크리닝 및 동정하기 위하여 실행된다. 대안으로, 상기 분석은 ActRIIB 폴리펩티드가 이의 결합 단백질, 이를 테면 ActRIIB 리간드에 대한 결합을 향상시키는 화합물을 동정하는데 사용될 수 있다. 추가 구체예에서, ActRIIB 폴리펩티드와 상호 작용하는 능력에 의해 이 화합물이 동정될 수 있다.
다양한 분석 포맷이 충분할 것이며, 본원 명세서에 비추어 여기에 명백하게 기술되지 않은 것들은 당업자에 의해 이해될 것이다. 본 명세서에서 기술된 바와 같이, 본 발명의 테스트 화합물 (물질)은 임의의 조합적 화학 방법에 의해 생성 될 수 있다. 대안으로, 본 화합물은 생체내 또는 시험관내에서 합성된 자연 발생 생체 분자일 수 있다. 조직 성장의 조절자로서 작용하는 능력에 대하여 테스트되는 화합물 (물질)은 예를 들어, 박테리아, 효모, 식물 또는 다른 유기체 (예 : 천연 생성물)에 의해 생성될 수 있고, 화학적으로 만들어질 수 있거나 (예 펩티도모방체를 포함하는 소분자), 또는 재조합 적으로 생산 될 수 있다. 본 발명에 의해 고려되는 테스트 화합물은 비-펩티딜 유기 분자, 펩티드, 폴리펩티드, 펩티이드 모방체, 당, 호르몬 및 핵산 분자를 포함한다. 특정 구체예에서, 상기 테스트 물질은 분자량이 약 2,000 달톤 미만인 작은 유기 분자이다.
본 발명의 테스트 화합물은 단일의 별개 엔터티로 제공되거나, 또는 조합 화학에 의해 만들어진, 더 큰 복합체 라이브러리로 제공될 수 있다. 이들 라이브러리는 예를 들어, 알코올, 알킬 할로겐화물, 아민, 아미드, 에스테르, 알데히드, 에테르 및 다른 부류의 유기 화합물을 포함 할 수 있다. 테스트 화합물을 테스트 시스템에 제시하는 것은 분리된 형태 또는 화합물의 혼합물로서, 특히 초기 스크리닝 단계에서 제시할 수 있다. 임의선택적으로, 상기 화합물은 임의로 다른 화합물로 유도체화 될 수 있고, 이 화합물의 단리를 용이하게 하는 유도체화 기를 가질 수 있다. 유도체화기의 비-제한적인 예는 바이오틴, 플루오레세인, 디옥시게닌, 녹색 형광 단백질, 동위 원소, 폴리히스티딘, 자성 비드, 글루타티온 S-전이효소(GST), 광활성 가교제 또는 이들의 임의 조합물을 포함한다.
화합물 및 천연 추출물의 라이브러리를 테스트하는 많은 약물-스크리닝 프로그램에서, 주어진 시간 동안 조사되는 화합물의 수를 최대화하기 위해서는 고-처리량 분석이 바람직하다. 정제되거나 반-정제된 단백질로 유도될 수 있는 것과 같이, 세포가 없는 시스템에서 수행되는 분석은 테스트 화합물에 의해 중재되는 분자 표적의 신속한 개발 및 변경의 상대적으로 용이한 탐지를 가능하게 하기 위해 생성 될 수 있다는 점에서 종종 "1 차" 스크린으로 선호된다. 더욱이, 테스트 화합물의 세포 독성 또는 생물이용성의 효과는 시험관 시스템에서 일반적으로 무시될 수 있지만, 대신 이 분석은 ActRIIB 폴리펩티드와 이의 결합 단백질 (가령, ActRIIB 리간드) 간의 결합 친화력의 변경으로 현시될 수 있는, 분자 표적 상에 약물의 효과에 주로 집중한다.
단지 설명하기 위해, 본 발명의 예시적인 스크리닝 분석에서, 목적 화합물은 분석 의도에 적합하다면, ActRIIB 폴리펩티드 리간드에 통상적으로 결합 할 수 있는, 분리 및 정제된 ActRIIB 폴리펩티드에 접촉시킨다. 상기 화합물과 ActRIIB 폴리펩티드의 혼합물에 ActRIIB 리간드를 함유하는 조성물을 추가한다. ActRIIB/ActRIIB 리간드 복합체의 탐지 및 정량화는 ActRIIB 폴리펩티드와 이의 결합 단백질 사이에 복합체 형성을 억제(또는 강화)하는데 있어서 이 화합물의 효과를 측정하는 수단을 제공한다. 화합물의 효능은 다양한 농도의 테스트 화합물을 사용하여 얻은 데이터로부터 용량-반응 곡선을 생성함으로써 평가할 수 있다. 더욱이, 대조 분석을 수행하여 비교를 위한 기준을 제공할 수도 있다. 예를 들면, 대조군 분석에서, 단리 및 정제된 ActRIIB/ActRIIB 리간드가 ActRIIB 폴리펩티드를 함유하는 조성물에 첨가되고, ActRIIB/ActRIIB 리간드 복합체의 형성은 테스트 화합물의 부재하에 정량화된다. 일반적으로, 반응물이 혼합되는 순서는 다양할 수 있고, 동시에 혼합될 수 있음을 이해할 것이다. 또한, 정제된 단백질 대신에, 세포 추출물 및 용해물을 사용하여 적절한 무-세포 검정 시스템을 만들 수 있다.
상기 ActRIIB 폴리펩티드와 이의 결합 단백질 사이에 복합체 형성은 다양한 기술에 의해 탐지될 수 있다. 예를 들면, 복합체 형성의 조절은 예를 들면, 탐지가능하도록 라벨된 단백질 이를 테면 방사능라벨된 (가령, 32P, 35S, 14C 또는 3H), 형광으로 라벨된 (가령, FITC), 또는 효소적으로 라벨된 ActRIIB 폴리펩티드 또는 이의 결합 단백질을 이용하거나, 면역분석에 의해, 또는 크로마토그래피 탐지에 의해 정량화될 수 있다.
특정 구체예들에 있어서, 본 발명은 ActRIIB 폴리펩티드와 이의 결합 단백질 간에 상호작용을 직접적으로, 또는 간접적으로 측정함에 있어서, 형광 편광 분석 및 형광 공명 에너지 전달 (FRET) 분석의 이용을 고려한다. 더욱이, 다른 방식의 탐지, 이를 테면 광학 도파관(waveguides) (PCT 공개 WO 96/26432 및 U.S. Pat. No. 5,677,196), 표면 플라스몬 공명 (SPR), 표면 전하 센서, 및 표면력 센서등은 본 발명의 많은 구체예에 양립가능하다.
더욱이, 본 명세서는 ActRIIB 폴리펩티드와 이의 결합 단백질 사이의 상호작용을 파괴 또는 강화시키는 물질들을 동정하기 위한 "2-하이브리드 분석"으로 알려진 상호작용 트랩 분석의 사용을 고려한다. 가령, U.S. Pat. No. 5,283,317; Zervos et al. (1993) Cell 72:223-232; Madura et al. (1993) J Biol Chem 268:12046-12054; Bartel et al. (1993) Biotechniques 14:920-924; 및 Iwabuchi et al. (1993) Oncogene 8:1693-1696 참고. 특정 구체예에서, 본 발명은 ActRIIB 폴리펩티드와 이의 결합 단백질 간의 상호작용을 해리시키는 화합물 (가령, 소분자 또는 펩티드)를 동정하기 위한 역 2-하이브리드 시스템의 사용을 고려한다. 예를 들면, Vidal and Legrain, (1999) Nucleic Acids Res 27:919-29; Vidal and Legrain, (1999) Trends Biotechnol 17:374-81; and U.S. Pat. Nos. 5,525,490; 5,955,280; 및 5,965,368 참고.
특정 구체예들에 있어서, 상기 대상 화합물은 본 발명의 변이체 ActRIIB 폴리펩티드와 상호작용하는 능력에 의해 동정된다. 상기 화합물과 상기 변이체 ActRIIB 폴리펩티드 간의 상호작용은 공유 또는 비-공유적일 수 있다. 예를 들면, 광-가교, 방사능라벨된 리간드 결합, 및 친화력 크로마토그래피가 포함된 시험관내 생화학적 방법을 이용하여 단백질 수준에서 이러한 상호작용이 동정될 수 있다(Jakoby WB et al. (1974) Methods in Enzymology 46:1). 특정 경우에서, 상기 화합물은 기전-기반의 분석, 이를 테면 변이체 ActRIIB 폴리펩티드에 결합하는 화합물을 탐지하는 분석에서 스크리닝될 수 있다. 이 분석은 고형-상 또는 유체-상 결합 사건을 포함할 수 있다. 대안으로, 변이체 ActRIIB 폴리펩티드를 인코드하는 유전자는 리포터 시스템 (가령, β-갈락토시다제, 루시퍼라제, 또는 녹색 형광 단백질)과 함께 세포 안으로 형질감염되고, 라이브러리, 바람직하게는 고처리량 스크리닝 또는 이 라이브러리의 개별 구성요소들에 대하여 스크리닝될 수 있다. 다른 기전-기반의 결합 분석이 이용될 수 있는데, 예를 들면, 자유 에너지의 변화를 탐지하는 결합 분석이 이용될 수 있다. 결합 분석은 웰, 비드 또는 칩에 고정된 표적으로 또는 고정된 항체에 의해 포집된 표적 또는 모세관 전기영동에 의해 해리되는 표적으로 실행될 수 있다. 상기 결합된 화합물은 발색 또는 형광 또는 표면 플라스몬 공명을 이용하여 탐지될 수 있다.
특정 양태에서, 본 발명은 ActRIIB 폴리펩티드 및/또는 ActRIIB 리간드의 기능을 길함함으로써, 근육 성장을 자극하고, 근육량을 증가시키기 위한 방법 및 물질을 제공한다. 따라서, 동정된 모든 화합물은 생체 내 또는 생체 내에서 전체 세포 또는 조직에서 검사하여 근육 성장을 조절하는 능력을 확인한다. 당해 분야에 공지된 다양한 방법이 이 목적을 위해 이용될 수 있다. 예를 들면, 본 발명의 방법은 ActRIIB 리간드 (예를 들어, GDF8)에 결합함으로써 활성화된 ActRIIB 단백질을 통한 신호 전달이 감소되거나 억제되도록 수행된다. 유기체 내의 근육 조직의 성장은 대응하는 유기체 (또는 유기체의 집단)의 근육 질량과 비교하여 유기체에서 증가된 근육 질량을 초래할 것이며, ActRIIB 단백질을 통한 신호 전달은 그다지 효과가 없었다는 것이 인지될 것이다.
예를 들면, 근육 세포 성장/증식에 대한 변이체 ActRIIB 폴리펩티드 또는 시험 화합물의 영향은 근원 세포의 증식과 관련된 Pax-3 및 Myf-5의 유전자 발현을 측정하고, 근육 분화와 연관된 MyoD의 유전자 발현을 측정음으로써, 평가될 수 있다 (가령, Amthor et al., Dev Biol. 2002, 251:241-57). GDF8은 Pax-3 및 Myf-5의 유전자 발현을 하향-조절하고, MyoD의 유전자 발현을 억제하는 것으로 알려져 있다. 상기 변이체 ActRIIB 폴리펩티드 또는 시험 화합물은 GDF8의 이러한 활성에 길항할 것으로 예상된다. 세포 기반 분석법의 또 다른 예는 ActRIIB 폴리펩티드 또는 시험 화합물의 존재 하에 C(2)C(12) 근육아세포와 같은 근육 아세포의 증식을 측정하는 것을 포함한다(가령, Thomas et al., J Biol Chem. 2000, 275:40235-43).
본 발명은 또한 근육 질량 및 강도를 측정하기 위한 생체 내 분석을 고려한다. 예를 들면, Whittemore et al. (Biochem Biophys Res Commun. 2003, 300:965-71)는 마우스에서 증가된 골격근 질량 및 증가된 그립 강도를 측정하는 방법을 개시한다. 임의선택적으로, 이 방법은 근육 질환 또는 상태, 예를 들어 근육량이 제한되는 질병에 대한 시험 화합물 (예를 들어, 변이체 ActRIIB 폴리펩티드)의 치료 효과를 결정하는데 사용될 수 있다.
특정 양태에서, 본 발명은 뼈 형성을 조절 (자극 또는 억제)하고 뼈 질량을 증가시키기 위한 방법 및 물질을 제공한다. 따라서, 동정된 모든 화합물은 생체 내 또는 생체 내에서 전체 세포 또는 조직에서 검사하여 골 또는 연골 성장을 조절하는 능력을 확인한다. 당해 분야에 공지된 다양한 방법이 이 목적을 위해 이용될 수 있다.
예를 들면, 골격 또는 연골 성장에 대한 변이체 ActRIIB 폴리펩티드 또는 시험 화합물의 효과는 Msx2의 유도 또는 골아 세포로의 골재 세포로의 분화를 세포 기반 분석법으로 측정함으로써 결정될 수 있다 (가령, Daluiski et al., Nat Genet. 2001, 27(1):84-8; Hino et al., Front Biosci. 2004, 9:1520-9 참고). 세포-기반 검정의 또 다른 예는 중간엽 전구 세포 및 조골 세포에서 ActRIIB 폴리펩티드 및 시험 화합물의 골 형성 활성을 분석하는 것을 포함한다. 설명하자면, ActRIIB 폴리펩티드를 발현하는 재조합 아데노바이러스는 다능성 간엽 전구체 C3H10T1/2 세포, 골아전구세포 C2C12 세포, 및 조골 세포 TE-85 세포를 감염 시키도록 구성되었다. 골 형성 활성은 알칼라인 포스파타제, 오스테오칼신 및 매트릭스 광물의 유도를 측정하여 결정된다(가령, Cheng et al., J bone Joint Surg Am. 2003, 85-A(8):1544-52 참고).
본 발명은 뼈 또는 연골 성장을 측정하기 위한 생체 내 분석을 고려한다. 예를 들면, Namkung-Matthai et al., Bone, 28:80-86 (2001) 는 골절 후의 초기의 뼈 회복을 연구한 쥐 골다공증 모델을 개시하고 있다. Kubo et al., Steroid Biochemistry & Molecular Biology, 68:197-202 (1999)는 또한 골절 후반기의 뼈 회복을 연구하는 쥐 골다공증 모델을 개시하고 있다. 이들 참고 문헌은 골다공증 성 골절에 대한 연구를 위한 렛 모델의 공개를 위해 본원에서 참고로 인용된다. 특정 양태에서, 본 발명은 당 업계에 공지된 골절 치유 분석법을 사용한다. 이러한 분석은 골절 기술, 조직학 분석 및 생체 역학 분석을 포함하며, 이는 예를 들어 골절의 정도를 측정할 뿐만 아니라 복구 과정을 일으키는 실험 프로토콜의 공개한 U.S. 특허 No. 6,521,750(그 전체가 참고 문헌으로 인용된다)에 기술된 것들을 포함한다.
특정 양태에서, 본 발명은 체중 증가 및 비만을 조절하기 위한 방법 및 물질을 제공한다. 세포 수준에서, 지방 세포의 증식과 분화는 비만의 발달에 중요하며, 이는 지방 세포 (지방 세포)를 추가로 생성시킨다. 따라서, 동정된 화합물은 시험 관내 또는 생체 내에서 전체 세포 또는 조직에서 시험하여 지방 세포 증식 또는 분화를 측정함으로써 지방 생성을 조절하는 능력을 확인한다. 당해 분야에 공지된 다양한 방법이 이 목적을 위해 이용될 수 있다. 예를 들면, 지방생성에 대한 변이체 ActRIIB 폴리펩티드 (예를 들어, 가용성 ActRIIB 폴리펩티드) 또는 시험 화합물의 효과는 세포 기반 검정법에서 성숙한 지방 세포로의 3T3-L1 전-지방 세포의 분화를 측정함으로써 결정될 수 있는데, 이를 테면, Oil Red O 착색 소낭에서의 트리아실 글리세롤의 축적 및 FABP (aP2/422) 및 PPARγ2와 같은 특정 지방 세포 표식의 출현을 관찰함으로써 확인되었다. 예를 들면, Reusch et al., 2000, Mol Cell Biol. 20:1008-20; Deng et al., 2000, Endocrinology. 141:2370-6; Bell et al., 2000, Obes Res. 8:249-54 참고. 세포-기반 검정의 또 다른 예는 브로모데옥시우리딘 (BrdU)-양성 세포를 모니터링함으로써, 지방 세포 또는 지방 세포 전구체 세포 (예를 들어, 3T3-L1 세포)의 증식에서 변형된 ActRIIB 폴리펩티드 및 시험 화합물의 역할을 분석하는 것을 포함한다. 예를 들면, Pico et al., 1998, Mol Cell Biochem. 189:1-7; Masuno et al., 2003, Toxicol Sci. 75:314-20 참고.
본 발명의 스크리닝 검정은 본 발명의 ActRIIB 폴리펩티드 및 ActRIIB 폴리펩티드의 변이체 뿐만 아니라, ActRIIB 폴리펩티드의 작용제 및 길항제를 포함하는 임의의 시험 화합물에 적용된다는 것을 인지할 것이다. 또한, 이러한 스크리닝 검정은 약물 표적 검증 및 품질 관리 목적에 유용하다.
6.
예시적인 치료 용도
특정 구체예들에서, 본 발명의 조성물 (가령, 변이체 ActRIIB 단백질, 동종체 또는 이형 형태)은 ActRIIB 및/또는 ActRIIB 리간드 (가령, GDF8 또는 GDF11)의 비정상 활성과 연합된 질환 또는 상태를 치료 또는 예방하는데 이용될 수 있다. 이들 질환, 장애들 또는 상태는 일반적으로 "ActRIIB-연합된 상태"로 본 명세서에서 지칭된다. 특정 구체예들에서, 본 발명은 상기에서 기술된 바와 같이 치료요법적으로 효과량의 변이체 ActRIIB 단백질 (가령, ALK4:ActRIIB 이형다량체 이를 테면 ALK4:ActRIIB 이형이량체)을 이를 필요로 하는 개인에게 투여함으로써, 이를 필요로 하는 개체를 치료 또는 예방하는 방법을 제공한다. 이들 방법은 특히 예를 들면, 동물 특히, 인간의 치료 및 예방을 목적으로 한다. 용어 "피험자", "개인", 또는 "환자"는 명세서를 통하여 호환되며, 일반적으로 포유류를 지칭한다. 포유류는 길들여진 동물 (예를 들면, 소, 양, 고양이, 개 및 말), 영장류 (예를 들면, 인간 및 비-인간 영장류, 이를 테면 원숭이), 토끼, 그리고 설치류 (예를 들면, 마우스 및 렛(rats))을 포함하나, 이에 국한되지 않는다.
본 명세서에서 사용된 바와 같이, 장애 또는 상태를 "방지하는" 치료는 통계적 시료에서 처리안된 대조 시료와 비교하여 처리된 시료에서 장애 또는 상태의 발생이 감소되거나, 또는 처리안된 대조 시료와 비교하여 장애 또는 상태의 하나 또는 그 이상의 증상의 개시를 지연시키거나 또는 그 중증도를 감소시키는 화합물을 지칭한다. 본원에 사용된 용어 "치료하는"이란 일단 특정 상태가 확립된 후, 명명된 상태의 개선 또는 제거 또는 예방을 포함한다.
ActRIIB와 ActRIIB 리간드 간 내인성 복합체는 조직 성장 뿐만 아니라 이를 테면 다양한 구조의 정확한 형성과 같은 초기 발달과정, 또는 성 발달, 뇌하수체 호르몬 생성 그리고 뼈 및 연골 생성을 포함하는 발달 후 하나 이상의 능력에서 필수적인 역할을 한다. 따라서, ActRIIB-연합된 상태는 비정상적 조직 성장 및 발달 결함을 포함한다. 또한, ActRIIB-연합된 상태눈 세포 성장 및 분화 장애, 이를 테면 염증, 알레르기, 자가면역 질환, 감염성 질환 및 종양을 포함하나, 이에 국한되지 않는다.
예시적인ActRIIB-연합된 상태는 신경근 장애들 (가령, 근위축병 및 근육 위축), 울혈성 폐쇄성 폐 질환 (및 COPD와 연합된 근육 소모), 근육 소비 증후군, 근육감소증, 악액질, 지방 조직 장애들 (가령, 비만), 타입 2 당뇨병 (NIDDM, 성인-개시 당뇨병), 및 뼈 퇴행성 질환 (가령, 골다공증)을 포함한다. 다른 예시적인 ActRIIB-연합된 상태는 근육퇴행성 및 신경근 장애들, 조직 복구 (가령, 상처 치류), 신경퇴행성 질환 (가령, 근위축성 측색 경화증), 및 면역학적 장애들 (가령, 림프구의 비정상적 증식 또는 기능과 관련된 장애들), 그리고 지방 세포의 비정상적인 증식과 관련된 비만 또는 장애를 포함한다.
특정 구체예들에서, 본 발명 (가령, 변이체 ActRIIB 단백질)의 조성물은 근위축병 치료의 일부분으로 이용된다. 용어 "근위축병"은 골격근 및 때때로 심장과 호흡기 근육이 점진적으로 약화되고, 악화되는 것을 특징으로 하는 퇴행성 근육 질환을 말한다. 근위축병은 근육의 미세한 변화로 시작하는 점진적 근육 소모 및 약화를 특징으로 하는 유전적 질환이다. 근육이 시간이 지남에 따라 퇴화됨으로써, 사람의 근력은 감소된다. 대상 변이체 ActRIIB 단백질이 포함된 치료에 의해 치료될 수 있는 예시적인 근위축병은 다음을 포함한다: 듀시엔 근위축병 (DMD), 베커 근위축병 (BMD), 에메리-드레이푸스 근위축병 (EDMD), 사지연결근육(limb-girdle) 근위축병 (LGMD), 안면견갑상완 근위축병 (FSH 또는 FSHD) (또한 랑도우지-데제린으로도 알려짐), 근긴장 이영양증 (MMD); 또한 스테인에르트(Steinert)의 질환으로도 알려짐), 눈인두 근위축병 (OPMD), 말단근위축병 (DD), 선천적 근위축병 (CMD)을 포함한다.
듀시엔 근위축병 (DMD)은 1860년대 프랑스 신경학자 Guillaume Benjamin Amand Duchenne에 의해 처음으로 기술되었다. 베커 근위축병 (BMD)은 독일 의사 Peter Emil Becker의 이름을 따서 부른 것으로, 그는 1950 년대에 DMD 변종을 최초로 기술했다. DMD는 남성에서 가장 흔히 유행하는 유전 질환 중 하나로, 3,500명중 한 명 꼴로 영향을 준다. DMD는 X 염색체의 짧은 팔에 위치한 디스트로핀 유전자가 파괴되어 있을 때 발생한다. 남성은 X 염색체의 사본 하나만 가지고 있기 때문에, 은 디스트로핀 유전자의 사본 하나만 가지고 있다. 디스트로핀 단백질이 없으면, 수축과 이완주기 동안 근육이 쉽게 손상된다. 질병의 초기에 근육이 재생 작용에 의해 보상되지만, 나중에 근육 전구 세포는 진행되는 손상을 따라 잡을 수 없으며 건강한 근육은 기능이 없는 섬유-지방 조직으로 대체된다.
BMD는 디스트로핀 유전자에서 상이한 돌연변이로 인한 것이다. BMD 환자는 약간의 디스트로핀을 가지고 있지만, 불충분하거나 질이 낮다. 일부 디스트로핀의 존재는 BMD 환자에서 근육을 DMD 사람의 근육만큼 나쁘게 또는 빠르게 퇴행하는 것으로부터 보호한다.
예를 들면, 연구에 따르면, 생체 내에서 GDF8의 기능을 차단하거나 제거하면 DMD 및 BMD 환자의 특정 증상을 효과적으로 치료할 수 있음이 입증되었다. 따라서, 대상 변이체 ActRIIB 단백질은 GDF8 억제제 (길항제)로 작용하여, DMD 및 BMD 환자의 생체에서 GDF8 및/또는 ActRIIB의 기능을 차단시키는 대체 수단을 구성한다.
유사하게, 대상 변이체 ActRIIB 단백질은 근육 성장을 필요로 하는 다른 질환 상태에서 근육량을 증가시키는 효과적인 수단을 제공할 수 있다. 예를 들면, 루게릭 질환 (운동 뉴런 질환)으로 불리는, ALS는 뇌를 골근육에 연결시키는 CNS 성분인 운동 뉴런을 공격하는 만성적, 진행성 및 난치성 CNS 장애다. ALS에서 운동 뉴런은 악화되고 결국 죽고, 사람의 뇌는 정상적으로 기능을 발휘하고 경고를 받지만, 움직이는 명령은 결코 근육에 도달하지 않는다. ALS를 얻게 되는 대부분의 사람들 연령은 40 세에서 70 세 사이다. 약화되는 첫 번째 운동 뉴런은 팔이나 다리로 이끄는 운동 뉴런이다. ALS 환자는 걷는데 어려움을 겪을 수도 있고, 물건을 떨어 뜨릴 수도 있고, 넘어질 수도 있고, 발음이 분명하지 않거나, 웃거나 우는 것이 통제가 되지 않을 수 있다. 궁극적으로, 팔다리의 근육은 사용하지 않음으로써 위축되기 시작한다. 이 근력 약화는 쇠약 해지고 휠체어가 필요하거나 침대에서 기능을 수행 할 수 없게 된다. 대부분의 ALS 환자는 호흡 부전, 또는 질병 발생 후 3 ~ 5 년내 폐렴 같은 인공 호흡기 합병증으로 사망한다.
변이체 ActRIIB 단백질-유도된 증가된 근육량은 또한 근육 소모 질환을 앓고 있는 사람들에게 도움이 될 수 있다. Gonzalez-Cadavid et al. (supra)는 GDF8 발현은 사람의 무-지방량과 반비례하며, GDF8 유전자 발현의 증가는 AIDS 소모성 증후군 남성의 체중 감소와 관련이 있다고 보고하였다. AIDS 환자에서 GDF8의 기능을 억제함으로써, AIDS 환자의 삶의 질을 크게 향상시키면서, AIDS 증상을 적어도 완전히 제거되지는 못하더라도 완화시킬 수 있다.
GDF8 기능의 상실은 영양 섭취 감소 없이, 지방 손실과 관련되기 때문에(Zimmers et al., supra; McPherron and Lee, supra), 대상 변이체 ActRIIB 단백질은 비만 및 타입 2 당뇨병의 발달을 지연 또는 방지하기 위한 치료물질로 추가 이용될 수 있다.
암성 식욕부진-악액질 증후군은 암의 가장 쇠약하고 생명을 위협하는 양상 중 하나다. 암 식욕부진-악액질 증후군에서 점진적 체중 감소는 많은 종류의 암의 공통적인 특징이고, 화학 요법에 대한 저조한 반응의 원인으로써, 비슷한 종양이 있지만 체중 감소가 없는 환자보다 생존 기간이 짧아지게 되는 원인이 된다. 식욕 부진, 지방과 근육 조직의 낭비, 심리적 고통, 그리고 낮은 삶의 질과 관련하여 악액질은 암과 숙주 사이의 복합적인 상호 작용으로 발생한다. 이것은 암 환자의 가장 흔한 사망 원인 중 하나이며, 사망자의 80 %에서 존재한다. 이것은 단백질, 탄수화물 및 지방 신진 대사에 영향을 미치는 대사성 혼란의 복잡한 예가 된다. 종양은 직접 및 간접적 비정상 모두를 일으키고, 식욕 부진 및 체중 감소를 초래한다. 현재, 이 과정을 조절하거나 역전시킬 수 있는 치료법은 없다. 암 식욕부진-악액질 증후군은 사이토킨 생산, 지질 동원 및 단백질 분해-유도 인자의 방출 및 중개 대사의 변화에 영향을 미친다. 비록 식욕 부진은 일반적이지만, 식이 섭취량 감소만으로는 암 환자에서 볼 수 있는 신체 조성 변화를 설명할 수 없으며, 영양 섭취를 늘리는 것으로 소비 증후군을 역전시킬 수 없다. 질병이 발생하기 전 6개월 이내 몸무게의 5% 이상의 비자발적인 체중 감소가 6 개월 이내에 발생할 경우 암 환자에서 악액질되어야 한다.
성체 마우스에서 GDF8의 전신 과발현이 인간 악액질 증후군에서 볼 수 있는 것과 유사한 심한 근육 및 지방 손실을 유도하는 것으로 밝혀졌기 때문에(Zimmers et al., supra), 대상 변이체 ActRIIB 단백질은 근육 성장이 요구되는 악액질 증후군의 증상을 예방, 치료 또는 경감 시키는데 유리하게 사용될 수 있다.
다른 구체예들에서, 본 발명은 뼈 및/또는 연골 형성을 유도하는 방법, 뼈 손실을 방지하는 방법, 뼈의 무기화를 증가시키는 방법, 뼈의 탈회를 방지하는 방법 및/또는 뼈의 밀도를 증가시키는 방법을 제공한다. 예를 들면, 대상 변이체 ActRIIB 단백질은 인간 및 다른 동물에서 골다공증 치료 및 뼈 골절 및 연골 결손 치료에 응용할 수 있다. 변이체 ActRIIB 단백질은 골다공증 발병에 대한 보호 수단으로서, 준임상적 저 골밀도로 진단된 환자에게 유용할 수 있다.
하나의 특이적 구체예에서, 본 발명의 방법 및 조성물은 인간 및 다른 동물의 뼈 골절 및 연골 결함 치료에 의학적 유용성이 있을 수 있다. 이 방법 및 조성물은 폐쇄 및 개방 골절 감소 및 인공 관절의 개선된 고정에서 예방 용도로 사용될 수 있다. 골 형성제에 의해 유발된 신생 골 형성은 선천성, 외상-유도된 또는 종양 절제술로 인한 두개 안면 결함의 치료에 기여하며, 미용 성형 수술에도 또한 유용하다. 더욱이, 본 발명의 방법 및 조성물은 치주 질환의 치료 및 다른 치아 복구 과정에서 사용될 수 있다. 특정 경우에서, 대상 변이체 ActRIIB 단백질은 뼈 형성 세포를 끌어들이고, 뼈 형성 세포의 성장을 자극하거나, 뼈 형성 세포의 전구 세포 분화를 유도하는 환경을 제공 할 수 있다. 본 발명의 변이체 ActRIIB 단백질은 골다공증 치료에 또한 유용할 수 있다. 또한, 변이체 ActRIIB 단백질은 연골 결함의 복구 및 골관절염의 예방/역전에 이용될 수 있다.
또다른 특이적 구체예에서, 본 발명은 골절 및 연골 및/또는 골 결손 또는 치주 질환과 관련된 다른 상태를 치료하기 위한 치료 방법 및 조성물을 제공한다. 본 발명은 상처 치유 및 조직 복구를 위한 치료 방법 및 조성물을 추가로 제공한다. 상처의 종류에는 화상, 절개 및 궤양이 포함되지만, 이에 국한되지는 않는다. 가령, PCT 공개 번호. WO84/01106 참고. 이러한 조성물들은 약학으로 수용가능한 비이클, 운반체, 또는 매트릭스에 혼합된 본 발명의 변이체 ActRIIB 단백질 길항제의 치료 효과량을 포함한다.
또다른 특이적 구체예에서, 본 발명의 방법 및 변이체 ActRIIB 단백질은 뼈 소실을 야기하는 상태, 이를 테면 골다공증, 부갑상선항진증, 쿠싱 질환, 갑상선항진증, 만성 설사 상태 또는 흡수불량, 신요세관산증, 또는 신경성 식욕부진에 적용될 수 있다. 여성이거나, 체중이 적고, 좌식 생활 방식을 선호하는 것은 골다공증(골 미네랄 밀도 감소로 골절 위험으로 이어짐)의 위험 요소라는 것을 많은 사람들이 알고 있다. 그러나, 골다공증은 또한 특정 약물의 장기간 사용으로 발생할 수 있다. 약물 또는 다른 의학적 상태로 인한 골다공증은 2 차 골다공증으로 알려져 있다. 쿠싱 질환으로 알려진 상태에서는 신체가 생성하는 과량의 코티솔이 골다공증과 골절을 유발한다. 이차성 골다공증과 관련된 가장 흔한 약물은 부신피질 호르몬에 의해 자연적으로 생성되는 호르몬인 코티솔처럼 작용하는 약물의 부류인 코르티코스테로이드이다. 적절한 수준의 갑상선 호르몬(갑상선에 의해 생성되는)이 골격 형성에 필요하지만, 과도한 갑상선 호르몬은 시간이 지남에 따라 뼈 질량을 감소시킬 수 있다. 알루미늄을 함유한 제산제는 신장 문제가 있는 사람, 특히 투석중인 사람이 과다 복용했을 때 뼈가 소실될 수 있다. 2차 골다공증을 야기할 수 있는 다른 약물로는 발작을 예방하는데 이용되는 페니토인 (Dilantin) 및 바르비투레이트; 메토트렉세이트 (Rheumatrex, Immunex, Folex PFS), 일부 관절염, 암 및 면역장애용 약물; 사이클로스포린 (Sandimmune, Neoral), 일부 자가면역 질환을 치료하고, 장기 이식 환자에서 면역계를 억제하는데 이용되는 약물; 전립선 암 및 자궁내막증 치료에 이용되는 황체형성 호르몬-방출 호르몬 항진제 (Lupron, Zoladex); 헤파린(Calciparine, Liquaemin), 항응고 약물; 그리고 고콜레스테롤을 치료하는데 이용되는 콜레스티라민 (Questran) 및 콜레스티폴 (Colestid)을 포함한다.. 잇몸 질환은 입안에 있는 유해 박테리아가 우리 몸을 강제로 방어하기 때문에 골 손실을 유발한다. 박테리아는 잇몸 아래에 독소와 효소를 생성하여 만성 감염을 일으킨다.
추가 구체예에서, 본 발명의 상기 변이체 ActRIIB 단백질은 비정상적이거나 원치않는 뼈 성장과 관련된 질병 또는 장애를 치료하기 위한 방법 및 치료제를 제공한다. 예를 들면, 진행성 골화성 섬유이형성증(FOP)으로 알려진 질병을 가진 환자는 운동을 막는 비정상적인 "제2 골격"을 성장시킨다. 추가적으로, 고관절 대체 수술 후 비정상적인 뼈의 성장이 일어나서 수술 결과를 망칠 수 있다. 이것은 본 방법 및 조성물이 치료 학적으로 유용할 수 있는 병리학적 뼈 성장 및 상황의 좀더 일반적인 예이다. 동일한 방법 및 조성물들은 다른 형태의 비정상적 뼈 성장 (가령, 외상, 화상 또는 척수 손상 후 뼈의 병리학적 성장)을 치료하고), 그리고 전이성 전립선 암 또는 골육종과의 연관하여 볼 수 있는 비정상적인 뼈 성장과 관련된 바람직하지 않은 상태를 치료 또는 예방하는데 유용 할 수 있다.
다른 구체예들에 있어서, 변이체 ActRIIB 단백질은 동물의 체지방 함량을 조절하고, 이와 관련된 상태, 특히 이와 관련된 건강을 해치는 상태를 치료 또는 예방하는데 사용될 수 있다. 본 발명에 따르면, 체중을 조절(관리)하는 것은 체중을 줄이거나 늘리거나, 체중 증가속도를 줄이거나 늘리거나, 체중 감소 속도를 줄이거나 늘리는 것을 의미 할 수 있으며, 체중을 적극적으로 유지하거나, 또는 (예 : 그렇지 않으면 체중을 증가시키거나 감소시킬 수 있는 외부 또는 내부 영향에 대해).크게 변화시키지 않을 수도 있다. 본 발명의 한 구체예는 변이체 ActRIIB 단백질을 필요로 하는 동물(가령, 인간)에게 투여함으로써 체중을 조절하는 것에 관계한다.
하나의 특이적 구체예에서, 본 발명은 동물의 체중 감소 및/또는 체중 증가를 감소시키기 위해, 보다 구체적으로는 비만의 위험이 있거나 비만으로 고통받는 환자의 비만을 치료 또는 개선하기 위해 사용될 수 있는 방법 및 화합물에 관한 것이다. 또다른 특이적 구체예에서, 본 발명은 체중의 증가 또는 유지할 수 없는 동물(예를 들어, 소모성 증후군을 가진 동물)을 치료하는 방법 및 화합물 에 관한 것이다. 그러한 방법은 체중 및/또는 체질량을 증가시키거나, 체중 및/또는 체질량 손실을 감소시키거나, 바람직하지 않게 낮거나 (예를 들어, 건강에 해로운) 체중 및/또는 체질량과 관련된 상태를 개선 시키는데 효과적이다.
특정 양태에서, 변이체 ActRIIB 단백질은 적혈구 수준을 증가시키고, 빈혈을 치료 또는 예방하며, 및/또는 이를 필요로 하는 대상에서 비효율적인 적혈구를 치료 또는 예방하는데 사용될 수 있다. 특정 양태에서, 본 명세서의 변이체 ActRIIB 단백질은 적혈구 수준을 증가시키기 위한 통상적인 치료 방법, 특히 다중요인 기원의 빈혈을 치료하는데 사용되는 방법과 조합하여 사용될 수 있다. 적혈구 수준을 증가시키기 위한 통상적인 치료 접근법은 예를 들어 적혈구 수혈, 하나 이상의 EPO 수용체 활성화제의 투여, 조혈 줄기 세포 이식, 면역 억제 생물 제제 및 약물 (예 : 코르티코 스테로이드)을 포함한다. 특정 구체예들에서, 본 명세서의 변이체 ActRIIB 단백질은 이를 필요로 하는 대상에서 빈혈 치료 또는 예방하는데 사용될 수 있다. 특정 구체예들에서, 본 명세서의 변이체 ActRIIB 단백질은 비효율적인 적혈구 생성증 및/또는 비효율적인 적혈구 생성과 관련된 장애를 치료 또는 예방하기 위해 사용될 수 있다. 특정 양태에서, 본 명세서의 변이체 ActRIIB 단백질은 빈혈 또는 비효과적인 적혈구 생성 장애의 치료 또는 예방을 위한 통상적인 치료 방법, 특히 다중 요인 기원의 빈혈 치료에 사용되는 것들과 조합하여 사용될 수 있다.
본 명세서에서 사용된 바와 같이, 장애 또는 상태를 "방지하는" 치료는 통계적 시료에서 처리안된 대조 시료와 비교하여 처리된 시료에서 장애 또는 상태의 발생이 감소되거나, 또는 처리안된 대조 시료와 비교하여 장애 또는 상태의 하나 또는 그 이상의 증상의 개시를 지연시키거나 또는 그 중증도를 감소시키는 화합물을 지칭한다.
본원에 사용된 용어 "치료하는"은 특정 상태가 일단 확립되면 그 상태의 개선 또는 제거를 포함한다.
어느 경우에나, 예방 또는 치료는 의사 또는 다른 건강 관리 제공자에 의해 제공된 진단 및 치료제 투여의 의도된 결과로 식별 될 수 있다.
일반적으로, 본 명세서에서 설명된 질환 또는 상태의 치료 또는 예방은 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 "유효량"을 투여하여 이루어진다. 물질의 유효량이란 필요한 치료 또는 예방 결과를 달성하는데 필요한 투여량 및 필요한 시간 동안 효과적인 양을 지칭한다. 본 발명의 약제의 "치료학적 유효량"은 질환 상태, 개체의 나이, 성별 및 체중, 및 개체에서 원하는 반응을 유도하는 약제의 능력에 따라 달라질 수 있다. 물질의 "예방차원의 유효량"이란 원하는 예방 결과를 달성하는데 필요한 투여량 및 필요한 시간 동안 효과적인 양을 지칭한다.
특정 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 건강한 개인 및 선택된 환자 집단에서 적혈구, 헤모글로빈 또는 망상 적혈구 수준을 높이기 위해 사용될 수 있다. 적절한 환자 모집단의 예로는 적혈구가 적거나 헤모글로빈 수치가 낮은 환자, 예를 들어 빈혈 환자, 그리고 바람직하지 않은 적혈구 또는 헤모글로빈 수치를 생성 할 위험이 있는 환자, 예를 들어 대수술을 받기 시작하는 환자 또는 실질적으로 혈액 손실로 이어질 수 있는 다른 수술을 받는 환자들을 포함한다. 한 구체예에서, 적절한 적혈구 수준을 가진 환자는 적혈구 수준을 높이기 위해 하나 또는 그 이상의 변형 ActRIIB 단백질로 치료되고, 그 다음, 채혈하여 나중에 수혈에 사용하기 위해 혈액을 저장한다.
본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질, 임의선택적으로 EPO 수용체 활성물질과 복합되어, 빈혈 환자에서 적혈구 세포 수준, 헤모글로빈 수준, 및/또는 헤마토크릿 수준을 증가시키는데 이용될 수 있다. 사람의 헤모글로빈 및/또는 헤마토크릿 수준을 관찰할 때, 적절한 연령 및 성별 범주에서 정상 수준보다 낮은 수준은 개인차가 고려되지만, 빈혈을 나타낼 수 있다. 예를 들면, 10-12.5 g/dl, 전형적으로 약 11.0 g/dl의 헤모글로빈 수준은 건강 성인에서 정상 범위 내에 있는 것으로 간주되며, 치료 측면에서 목표 수치가 낮으면 심장 혈관 부작용이 줄어들 수 있다 [가령, Jacobs et al. (2000) Nephrol Dial Transplant 15, 15-19 참고]. 대안으로, 헤마토크릿 수준(세포가 차지하는 혈액 샘플의 부피의 백분율)을 빈혈의 척도로 사용할 수 있다. 건강한 사람의 헤마토크릿 수준은 성인 남성의 경우 약 41-51 %이고, 성인 여성의 경우 35-45 %이다. 특정 구체예들에서, 환자는 적혈구, 헤모글로빈 및/또는 헤마토크릿의 목표 수준으로 환자를 회복시키려는 투약 요법으로 치료될 수 있다. 헤모글로빈 및 헤마토크릿 수준은 사람마다 다르므로, 최적으로 표적 헤모글로빈 및/또는 헤마토크릿 수치를 각 환자 별로 개별화시킬 수 있다.
빈혈은 조직 손상, 감염 및/또는 만성 질환, 특히 암을 가진 환자에서 빈번하게 관찰된다. 일부 피험자에서, 빈혈은 낮은 에리스로포이에틴 수치 및/또는 골수 내 에리트로포이에틴에 대한 부적절한 반응으로 구별된다 [가령, Adamson (2008) Harrison's Principles of Internal Medicine, 17th ed.; McGraw Hill, New York, pp 628-634 참고]. 빈혈의 잠재적 원인으로는 혈액 상실, 영양 결핍 (예 : 단백질의 식이 섭취 감소), 약물 반응, 골수와 관련된 다양한 문제 및 많은 질병이 있다. 좀더 구체적으로, 빈혈은 예를 들어, 골수 이식을 포함하는 다양한 장애 및 상태와 관련되어 있다; 예를 들면, 골수 이식; 고형 종양 (예를 들어, 유방암, 폐암 및 결장암); 림프계의 종양 (예를 들어, 만성 림프구 백혈병, 비-홉킨스 림프종 및 호지킨 림프종); 조혈계의 종양 (예컨대, 백혈병, 골수이형성 증후군 및 다발성 골수종); 방사선 요법; 화학 요법 (예, 백금 함유 요법); 류마티스성 관절염, 다른 염증성 관절염, 전신성 홍반성 루푸스 (SLE), 급성 또는 만성 피부 질환 (예, 건선), 염증성 장 질환 (예를 들어, 크론병 및 궤양성 대장염)을 포함하지만, 이에 한정되지 않는 염증성 및 자가 면역 질환; 특발성 또는 선천성 질환을 포함한 급성 또는 만성 신장 질환 또는 부전; 급성 또는 만성 간 질환; 급성 또는 만성 출혈; 환자의 동종 항체 또는 자가 항체 및/또는 종교적 이유로 (예 : 여호와의 증인) 적혈구 수혈이 불가능한 상황; 감염 (예, 말라리아 및 골수염); 예를 들어, 겸상 적혈구 질환 (빈혈), 지중해빈혈; 약물 사용 또는 남용 (예 : 알코올 남용); 수혈을 피하는 어떤 원인으로부터의 빈혈이 있는 소아 환자; 고령 환자 또는 순환기 과부하에 대한 우려로 수혈을 받지 못하는 빈혈이 있는 심폐 질환이 있는 환자 [가령, Adamson (2008) Harrison's Principles of Internal Medicine, 17th ed.; McGraw Hill, New York, pp 628-634 참고]. 일부 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 본 명세서에 개시된 하나 이상의 장애 또는 상태와 관련된 빈혈을 치료 또는 예방하는데 사용될 수 있다.
많은 요인들이 암-관련 빈혈에 기여할 수 있다. 일부는 질병 과정 자체 및 인터루킨-1, 인터페론 감마 및 종양 괴사 인자와 같은 염증성 사이토킨의 생성과 관련이 있다 [Bron et al. (2001) Semin Oncol 28(Suppl 8):1-6]. 그것의 효과중, 염증은 중요한 철 조절 펩티드 헵시딘(hepcidin)을 유도하고, 그로 인하여 대식 세포에서 철 배출을 금지하고 일반적으로 적혈구 생성을 위한 철 가용성을 제한한다 [가령, Ganz (2007) J Am Soc Nephrol 18:394-400 참고]. 다양한 경로를 통한 혈액 손실 또한 암 관련 빈혈의 원인이 될 수 있다. 암 진행으로 인한 빈혈의 유병률은 암 유형에 따라 다르며, 전립선 암 5 %에서 다발성 골수종의 90 %까지 다양하다. 암-관련 빈혈은 피로 회복, 삶의 질 감소, 치료 효능 감소, 사망률 증가 등 환자에게 중대한 결과를 초래한다. 일부 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 암-관련된 빈혈을 치료하는데 이용될 수 있다.
과소증식성(hypoproliferative) 빈혈은 일차 장애 또는 골수의 부전으로 발생할 수 있다. 과소증식성 빈혈은 만성 질환의 빈혈, 신장병의 빈혈, 저혈압 상태와 관련된 빈혈 및 암과 관련된 빈혈을 포함한다. 이러한 유형의 각각에서, 내인성 에리트로포에틴 수치는 관찰된 빈혈의 정도에 대해 부적절하게 낮다. 다른 과소증식성 빈혈에는 초기 단계의 철분-결핍 빈혈 및 골수 손상으로 인한 빈혈이 있다. 이러한 유형에서 내인성 에리트로포에틴 수치는 빈혈의 정도에 따라 적절히 상승된다. 저명한 예로는 암 및/또는 화학 요법 약물 또는 암 방사선 치료로 인한 골수 억제이다. 임상 시험에 대한 광범위한 검토에서, 화학요법 후 환자의 100 %에서 경미한 빈혈이 발생할 수 있고, 그 중 80 %에서 중증의 빈혈이 발생할 수 있음을 알았다[가령, Groopman et al. (1999) J Natl Cancer Inst 91:1616-1634 참고]. 골수 억제 약물은 예를 들면 다음과 같다: 1) 질소 머스타드 (예 : 멜팔란) 및 니트로소우레아 (예 : 스트렙토조신)와 같은 알킬화제; 2) 엽산 길항제 (예 : 메토트렉세이트), 퓨린 유사체 (예 : 티오구아닌) 및 피리미딘 유사체 (예, 겜시타빈)와 같은 대사 물질; 3) 세포독성 항생제, 예컨대 안트라사이클린 (예컨대, 독소루비신); 4) 키나제 억제제 (예 : 게피티닙); 5) 탁산 (예 : 파클리탁셀) 및 빈카 알칼로이드 (예 : 비노렐빈)와 같은 유사 분열 억제제; 6) 모노클로날 항체 (예 : 리툭시맵); 그리고 7) 토포아이소머라제 억제제 (예 : 토포테칸 및 에토포사이드). 또한, 낮은 대사율을 초래하는 상태는 경증부터 중등도의 과소증식성 빈혈을 유발할 수 있다. 이러한 상태중 내분비 결핍 상태가 있다. 예를 들면, 빈혈은 애디슨 병, 갑상선 기능 항진증, 부갑상선 기능 항진증 또는 에스트로겐으로 거세되거나 치료된 남성에게서 발생할 수 있다. 일부 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 과소증식성 빈혈 치료에 이용될 수 있다.
만성 신장 질환은 종종 과소증식성 빈혈과 연관되며, 빈혈의 정도는 신장 손상 수준에 따라 다르다. 이러한 빈혈은 주로 적혈구 생성의 부적절한 생산과 적혈구의 생존 감소로 인한 것이다. 만성 신장 질환은 보통 환자의 생존을 위해 투석이나 신장 이식이 필요한 시점에서 수십 년 또는 수십 년에 걸쳐 점진적으로 말기 (Stage-5) 병으로 진행된다. 빈혈은 종종 이 과정 초기에 발병하며, 질병이 진행됨에 따라 악화된다. 신장 질환의 빈혈의 임상 결과는 잘 기록되어 있으며, 좌심실 비대의 발달, 인지 기능의 손상, 삶의 질 감소 및 면역 기능의 변화가 포함된다 [가령, Levin et al. (1999) Am J Kidney Dis 27:347-354; Nissenson (1992) Am J Kidney Dis 20(Suppl 1):21-24; Revicki et al. (1995) Am J Kidney Dis 25:548-554; Gafter et al., (1994) Kidney Int 45:224-231 참고]. 일부 구체예들에서, 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 급성 또는 만성 신장 질환 또는 부전과 관련된 빈혈을 치료하는 데 사용될 수 있다.
외상이나 산후 출혈과 같이 충분한 양의 급성 혈액 손실로 인한 빈혈은 출혈성 급성 후천성 빈혈으로 알려져 있다. 급성 혈액 손실은 다른 혈액 성분과 함께 RBCs의 비율적 고갈 때문에, 초기에는 빈혈없이 혈액량 감소를 일으킨다. 그러나, 혈액량 감소증은 혈관 밖에서 혈관으로 유체를 이동시키는 생리적 메커니즘을 빠르게 유발하여 혈액 희석 및 빈혈을 유발한다. 만성적인 경우, 혈액 손실은 점차적으로 신체 철 저장소를 고갈시키고, 결국 철 결핍으로 이어진다. 일부 구체예들에서, 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 급성 혈액 손실로 인한 빈혈 치료에 사용할 수 있다.
철-결핍 빈혈은 음성적 철 균형 및 철-부족 조혈을 포함하는 철분 결핍증의 단계적인 진행의 최종 단계이다. 철분 결핍은 임신, 부적절한 식이, 장 흡수 장애, 급성 또는 만성 염증, 급성 또는 만성 출혈과 같은 상태에서 볼 수 있듯이 철 수요 증가, 철분 섭취 감소 또는 철 손실 증가로 인해 발생할 수 있다. 이런 종류의 경증부터 중등도의 빈혈증에서, 골수는 과소증식성을 유지하며, RBC 형태는 대체로 정상이고; 그러나 경미한 빈혈증 조차도 소적혈구 저색소성 적혈구를 유발할 수 있고, 그리고 심한 철분 결핍성 빈혈로의 전환은 골수의 과다 증식과 점점 더 널리 퍼진 소적혈구 및 저색소성 적혈구를 동반한다[가령, Adamson (2008) Harrison's Principles of Internal Medicine, 17th ed.; McGraw Hill, New York, pp 628-634 참고]. 철-결핍성 빈혈에 대한 적절한 치료법은 경구용 철 제제, 비경 구용 철 제제 및 주요한 재래식 수단으로써 RBC 수혈과 함께, 그 원인과 중증도에 따라 달라진다. 일부 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 만성 철-결핍 치료에 이용될 수 있다.
골수이형성 증후군 (myelodysplastic syndrome, MDS)은 골수 혈액 세포의 비효율적인 생산과 급성 골수성 백혈병으로의 변형 위험을 특징으로 하는 다양한 혈액학적 상태의 집합이다. MDS 환자에서, 혈액 줄기 세포는 건강한 적혈구, 백혈구 또는 혈소판으로 성숙하지 않는다. MDS 장애에는 예를 들어, 난치성 빈혈, 관상 철아구(sideroblasts)와 함께 난치성 빈혈, 과도한 돌발을 동반한 난치성 빈혈, 다중 형성장애와 함께 난치성 빈혈, 단리된 5q 염색체 이상과 관련된 골수 이형성 증후군이 포함된다. 이러한 질환이 조혈 세포의 양과 질 모두에서 돌이킬 수 없는 결점으로 나타나기 때문에, 대부분의 MDS 환자는 만성 빈혈을 앓고 있다. 따라서, MDS 환자는 결국 적혈구 수준을 높이기 위해, 수혈 및/또는 성장 인자 (예 : 적혈구 생성 인자 또는 G-CSF)로의 치료를 필요로 한다. 그러나, 많은 MDS 환자는 이러한 치료법의 빈도로 인해 부작용이 발생한다. 예를 들면, 적혈구 수혈을 자주 받는 환자는 여분의 철분 축적으로 인해 조직과 기관 손상을 입을 수 있다. 따라서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 MDS 환자를 치료하는데 이용될 수 있다. 특정 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질을 임의선택적으로 EPO 수용체 활성물질과 복합 이용함으로써, MDS를 앓고 있는 환자를 치료할 수 있다. 다른 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질 및 MDS를 치료하는 하나 또는 그 이상의 추가 치료 물질, 예를 들면, 탈리도미드, 레날리도미드, 아자시타딘, 데시타빈, 에리트로포에틴, 데페록사민, 안티티모사이트 글로블린, 그리고 필그라스트림(G-CSF)을 포함한 물질과 복합하여 MDS를 앓고 있는 환자를 치료할 수 있다.
철 동역학 연구(ferrokinetic studies)에 근거하여 재생불량 빈혈, 출혈, 또는 말초 용혈과는 기본적으로 구별되는[가령, Ricketts et al. (1978) Clin Nucl Med 3:159-164 참고], 비효율적인 적혈구생성은 빈혈의 다양한 집단을 기술하는데, 성숙한 적혈구의 생산은 골수에 존재하는 적혈구아세포(erythroblast)의 수를 감안할 때 예상보다 적다 [Tanno et al. (2010) Adv Hematol 2010:358283]. 이러한 빈혈에서 조직 저산소증은 성숙한 적혈구의 비효율적인 생산으로 인해 에리트로포에틴 수치가 상승함에도 불구하고 여전히 존재한다. 에리트로포에틴 수치가 높아지면 적혈구아세포가 엄청나게 팽창하여 골수외 적혈구 생성으로 인한 비장 비대 (비장 확대) [가령, Aizawa et al. (2003) Am J Hematol 74:68-72 참고], 적혈구아세포-유도된 뼈 병리 [가령, Di Matteo et al. (2008) J Biol Regul Homeost Agents 22:211-216 참고], 그리고 치료요법적 RBC 수혈없이도, 조직 철 과부하 [가령, Pippard et al. (1979) Lancet 2:819-821 참고]로 이어지게 되는 악순환이 결국 발생한다. 따라서, 적혈구 생성능을 증가시킴으로써, 본원의 변이체 ActRIIB 단백질은 전술한 사이클을 파괴할 수 있고, 따라서 기저 빈혈 뿐만 아니라 상승된 에리트로포에틴 수준, 비장 비대, 뼈 병리 및 조직 철 과다의 합병증을 경감시킬 수 있다. 일부 구체예들에서, 하나 또는 그 이상의 변이체 ActRIIB 단백질을 이용하여, 빈혈 및 상승된 EPO 수준을 포함하는 비효과적인 적혈구 생성, 뿐만 아니라 비장비대, 적혈구아세포-유발 뼈 병리, 철 과다 및 이들의 수반 병리와 같은 합병증을 치료 또는 예방하는데 사용될 수 있다. 비장비대가 있는 경우, 그러한 병리에는 흉부 또는 복부 통증 및 망상 내피 증식이 포함된다. 골수 형성 조혈은 비장에서 뿐만 아니라 다른 조직에서 골수외 조혈성 의사종양(pseudotumors)의 형태로 발생할 수 있다 [가령, Musallam et al. (2012) Cold Spring Harb Perspect Med 2:a013482 참고]. 적혈구아세포에 의해 유발된 뼈 병리에서, 수반되는 병리학은 낮은 뼈 미네랄 밀도, 골다공증 및 뼈 통증을 포함한다 [가령, Haidar et al. (2011) Bone 48:425-432 참고]. 철분 과부하가 있을 경우, 수반되는 병리학은 헵시딘 억제 및 식이 철분의 과다흡수 [가령, Musallam et al. (2012) Blood Rev 26(Suppl 1):S16-S19 참고], 다발성 내분비 및 간 섬유증/간경변증 [가령, Galanello et al. (2010) Orphanet J Rare Dis 5:11 참고], 그리고 철-과부하 심근 병증 [Lekawanvijit et al., 2009, Can J Cardiol 25:213-218]을 포함한다.
비효율적인 적혈구 생성의 가장 흔한 원인은 지중해빈혈, 유전성 혈색소 병증이며, 이때 고유의 알파-및 베타-헤모글로빈 쇄의 불균형은 적혈구아세포 성숙동안 증가된 세포자멸로 이어진다 [가령, Schrier (2002) Curr Opin Hematol 9:123-126 참고]. 지중해빈혈은 전 세계적으로 가장 빈번한 유전질환 중 하나이며, 역학적인 패턴의 변화는 미국 및 전세계적으로 증가되는 공중 보건 문제에 기여할 것으로 예측된다[Vichinsky (2005) Ann NY Acad Sci 1054:18-24]. 지중해빈혈 증후군은 그 심각도에 따라 명명된다. 따라서, α-지중해빈혈은 마이너(minor) α-지중해빈혈 (α-지중해빈혈 성향(trait)으로도 알려짐; 2개의 영향을 받은 α-글로빈 유전자), 헤모글로빈 H 질환 (3개의 영향을 받은 α-글로빈 유전자), 그리고 메이져(major) α-지중해빈혈 (태아수종(hydrops fetalis)으로도 알려짐; 4개의 영향을 받은 α-글로빈 유전자)를 포함한다. β-지중해빈혈은 β-지중해빈혈 마이너 (β-지중해빈혈 성향으로도 알려짐; 한개의 영향을 받은 β-글로빈 유전자), 중간(intermedia) β-지중해빈혈 (2개의 영향을 받은 β-글로빈 유전자), 헤모글로빈 E 지중해빈혈 (2개의 영향을 받은 β-글로빈 유전자), 그리고 β-지중해빈혈 메이져 (Cooley's 빈혈로도 공지됨; 2개의 영향을 받은 β-글로빈 유전자는 β-글로빈 단백질의 완벽한 부재롤 초래한다). β-지중해빈혈은 여러 장기에 영향을 미치고, 상당한 병적 상태와 사망률과 관련이 있으며, 현재 평생 동안 치료해야 한다. 최근 몇 년 사이에 정기적인 수혈을 통해 철분의 킬레이트화와 함께 β-지중해빈혈 환자의 평균 수명이 연장되었지만, 수혈과 철분의 과도한 위장 흡수로 인한 철분 과다로 인해 심장병, 혈전증, 성선기능 저하증, 갑상선기능 저하증, 당뇨병, 골다공증 및 골감 감소증을 야기할 수 있다 [가령, Rund et al. (2005) N Engl J Med 353:1135-1146 참고]. 특정 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 지중해빈혈 증후군을 치료 또는 예방할 수 있다.
일부 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 지중해빈혈 증후군 이외에 비효과적인 적혈구생성 장애를 치료하는데 이용될 수 있다. 이러한 장애는 다음의 질환을 포함한다: 철적모구(siderblastic) 빈혈 (유전적 또는 후천적); 적혈구이형성(dyserythropoietic) 빈혈 (유형 I 및 II); 겸상적혈구 빈혈; 유전성 구상적혈구증(hereditary spherocytosis); 피루베이트 키나제 결핍결핍; 상태, 이를 테면 엽산 결핍 (선천적 질환, 감소된 섭취, 또는 증가된 요구로 인한), 코발아민 결핍 (선천적 질환, 악성(pernicious) 빈혈, 손상된 흡수, 췌장 기능부전, 또는 감소된 섭취), 특정 약물, 또는 설명불가능한 원인(선천적 적혈구생성이상 빈혈, 난치성 거대적혈구성 빈혈, 또는 적백혈병)에 의한 잠재적인 거대적혈구(megaloblastic) 빈혈; 골수로성 빈혈(myelophthisic anemias), 예를 들면, 골섬유증(골수화생) 및 골수황폐증(myelophthisis) 포함; 선천성 적혈구조혈성 포르피린증(congenital erythropoietic porphyria); 그리고 납 중독.
특정 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 비효율적인 적혈구 형성을 위한 보충 요법과 함께 사용될 수 있다. 그러한 치료법은 적혈구 또는 전체 혈액을 수혈하여 빈혈을 치료하는 것이다. 만성 또는 유전성 빈혈에서, 반복되는 수혈로 인해 철성 항상성에 대한 정상적인 기전이 압도되고, 결국 심장, 간 및 내분비샘과 같은 중요한 조직에 철분이 독성적으로 및 잠재적으로 치명적으로 축적된다. 따라서, 비효율적인 적혈구 생성증으로 인하여 만성적으로 고통받는 환자를 위한 보충 요법은 소변 및/또는 대변에서 철분 배설을 촉진시키고, 조직 철분 과다를 방지하거나 역전시키는 하나 또는 이상의 철-킬레이트 분자로 치료하는 것을 포함한다 [가령, Hershko (2006) Haematologica 91:1307-1312; Cao et al. (2011), Pediatr Rep 3(2):e17 참고]. 효과적인 철-킬레이트제는 철 이온에 선택적으로 결합하고 중화시킬 수 있어야 한고, 이는 산화된 형태의 비-트랜스페린 결합된 철은 히드록시 래디컬 및 산화 생성물의 촉매 생성을 통해 대부분의 철 독성을 설명한다 [가령, Esposito et al. (2003) Blood 102:2670-2677 참고]. 이들 물질은 구조적으로 다양하지만, 모두 화학량론적으로 1 : 1 (헥사덴테이트 물질), 2 : 1 (트리덴테이트) 또는 3 : 1 (바이덴테이트)에서 개별 철 원자와 함께, 중화 8 면체 배위 착물을 형성할 수 있는 산소 또는 질소 공여체 원자를 가지고 있다[Kalinowski et al. (2005) Pharmacol Rev 57:547-583]. 일반적으로, 효과적인 철-킬레이트화제는 비교적 낮은 분자량 (예, 700 달톤 미만)이며, 영향을 받는 조직에 접근할 수 있도록 물 및 지질 모두에 용해성을 갖는다. 철-킬레이트 분자의 특정 예로는 매일 비경구 투여가 요구되는 박테리아 기원의 헥사덴테이트 제제인 데페록사민(deferoxamine)과 구강 활성 합성 제제인 데페리프론(deferiprone) (바이덴테이드) 및 데페라시록스(deferasirox) (트리덴테이트)가 있다. 두 가지 철 킬레이트 제제의 당일 투여로 구성된 병용 요법은 킬 레이션 단독 요법에 반응이 없는 환자에게도 효과가 있으며, 디레록사민 단독만으로는 환자의 순응도가 떨어지는 문제를 극복하는 데에도 도움이 된다 [Cao et al. (2011) Pediatr Rep 3(2):e17; Galanello et al. (2010) Ann NY Acad Sci 1202:79-86].
본 명세서에서 사용된 바와 같이, "복합하여", "~의 조합" 또는 "공동 투여"는 제2 요법이 여전히 신체에서 효과적이도록 투여하는 임의의 형태를 의미한다 (예를 들어, 2개 화합물이 환자에서 동시에 효과적이며, 이들 두 화합물의 공조상승효과를 포함할 수 있음). 유효성은 혈액, 혈청 또는 혈장에서 측정가능한 약물 농도와 관련이 없을 수도 있다. 예를 들면, 상이한 치료 화합물은 동일한 제형 또는 별도 제형으로, 동시, 순차적 또는 상이한 일정에 의해 투여될 수 있다. 따라서, 그러한 치료를 받는 개인은 다른 치료법의 결합된 효과로부터 이익을 얻을 수 있다. 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 하나 또는 그 이상의 다른 추가적인 물질들 또는 보조 요법과 동시에, 이보다 앞서, 또는 후속적으로 투여될 수 있다. 일반적으로, 각각의 치료제는 특정 약제에 대해 결정된 투여량 및/또는 일정으로 투여될 것이다. 요법에서 사용하는 특정 조합은 본 명세서의 길항제와 치료 및/또는 얻을 수 있는 바람직한 치료 효과의 양립 가능성을 고려할 것이다.
특정 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 비효율적인 적혈구 형성을 위한 헵시딘 또는 헵시딘 항진제와 함께 사용될 수 있다. 간에서 주로 생산되는 순환하는 폴리펩티드인 헵시딘은 흡수성 장 세포, 간세포 및 대식세포에 국한된 철-배출 단백질인 페로포르틴(ferroportin)의 분해를 유도할 수 있는 능력으로 인해 철 대사의 마스터 조절자로 간주된다. 대체로, 헵시딘은 세포외 철의 이용 가능성을 감소시키므로, 헵시딘 항진용제는 비효율적인 적혈구 생성의 치료에 유익할 수 있다 [가령, Nemeth (2010) Adv Hematol 2010:750643 참고]. 이러한 견해는 β-지중해빈혈의 마우스 모델에서 증가된 헤파 시딘 발현의 유익한 효과에 의해 뒷받침된다 [Gardenghi et al. (2010) J Clin Invest 120:4466-4477].
본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 임의선택적으로 EPO 수용체 활성물질과 복합되어, 너무 작은 크기의(소세포성), 너무 큰 크기의 (거대 세포 성), 기형의, 또는 비정상적으로 착색된 (저색소성) RBC로 부분적으로 특징 지어지는 적혈구의 장애성 성숙의 빈혈을 치료하는데도 적합하다.
특정 구체예들에서, 본 명세서는 본 발명의 치료 유효량의 하나 또는 그 이상의 변이체 ActRIIB 단백질 및 EPO 수용체 활성화 제를 이를 필요로 하는 개체에게 투여함으로써 빈혈을 치료 또는 예방하는 방법을 제공한다. 특정 구체예들에서, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 EPO 수용체 활성제와 함께 사용하여, EPO의 부작용에 민감한 환자에서 이들 활성화제의 필요한 투여량을 감소시킬 수 있다. 이들 방법은 환자의 치료 및 예방 치료에 사용될 수 있다.
본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 특히 EPO 수용체 활성화제의 저용량 범위에서 적혈구의 증가를 달성하기 위해 EPO 수용체 활성화제와 조합하여 사용될 수 있다. 이는 고용량의 EPO 수용체 활성화제와 관련된 공지된 오프-타겟 효과 및 위험을 감소 시키는데 유익할 수 있다. EPO의 주요 부작용으로는 예를 들어, 헤마토크릿 또는 헤모글로빈 수준의 과도한 증가와 적혈구증이 포함된다. 헤마토크릿 수치가 상승하면, 고혈압 (특히 고혈압의 악화) 및 혈관 혈전증이 유발될 수 있다. 보고된 EPO의 다른 부작용 중 일부는 고혈압과 관련이 있으며, 두통, 인플루엔자-유사 증후군, 션트 차단, 혈전증으로 인한 심근경색 및 뇌경련, 고혈압 뇌증 및 적혈구 혈액 세포 부전이 있다. 가령, Singibarti (1994) J. Clin Investig 72(suppl 6), S36-S43; Horl et al. (2000) Nephrol Dial Transplant 15(suppl 4), 51-56; Delanty et al. (1997) Neurology 49, 686-689; and Bunn (2002) N Engl J Med 346(7), 522-523 참고).
단, 본 명세서의 변이체 ActRIIB 단백질은 EPO와 다른 기전에 의해 작용하지만, 이들 길항제는 EPO에 잘 반응하지 않는 환자에서 적혈구 및 헤모글로빈 수준을 증가시키는데 유용 할 수 있다. 예를 들면, 본 명세서의 길항제는 정상 수준에서 부터 증가된 용량의 EPO (> 300IU/kg/주)를 투여해도 목표 수준까지 헤모글로빈 수준을 증가시키지 못하는 환자에게 유익할 수 있다. 부적절한 EPO 반응을 겪는 환자는 모든 유형의 빈혈에서 발견되지만, 더 많은 수의 비-반응자는 암 환자 및 말기 신장질환 환자에게서 특별히 더 흔히 관찰된다. EPO에 대한 부적절한 반응은 구성적 (EPO를 사용한 첫 번째 치료시 관찰됨)이거나 후천적 (EPO 반복 치료시 관찰됨)일 수 있다.
특정 구체예들에서, 본 명세서는 환자의 하나 또는 그 이상의 혈액학적 매개변수를 측정함으로써 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료되었거나 또는 치료될 후보 를 관리하는 방법을 제공한다. 혈액학적 매개변수는 본 발명의 길항제로 치료될 후보인 환자에 대한 적절한 투약을 평가하고, 치료 중 혈액학적 매개변수를 모니터링하고, 본 명세서의 하나 또는 그 이상의 길항제로 치료하는 동안 투여량을 조절할지 여부 및/또는 본 명세서의 하나 또는 그 이상의 길항제의 적절한 유지 투여량을 평가하는데 사용될 수 있다. 하나 또는 그 이상의 혈액학적 매개변수가 정상 수준을 벗어나는 경우, 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질 투여를 감소, 지연 또는 종결시킬 수 있다.
본원에서 제공된 방법에 따라 측정될 수 있는 혈액학적 매개변수는 예를 들어 적혈구 수준, 혈압, 철 저장 및 당업계에서 인정된 방법을 사용하여 증가된 적혈구 수준과 상호 관련이 있는 체액에서 발견되는 다른 물질을 포함한다. 이러한 매개변수는 환자의 혈액 샘플을 사용하여 결정될 수 있다. 적혈구 세포 수준, 헤모글로빈 수준, 및/또는 헤마토크릿 수준의 증가는 혈압 증가의 원인일 수 있다.
한 구체예에서, 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료될 후보 환자에서 하나 또는 그 이상의 혈액학적 매개변수가 정상 범위를 벗어나거나 정상의 상측에 있는 경우, 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질 투여의 개시는 혈액학적 매개변수가 자연적으로 또는 치료적 중재를 통해 정상 수준 또는 허용 가능한 수준으로 되돌아 올 때까지 지연될 수 있다. 예를 들면, 후보 환자가 고혈압 또는 전-고혈압 환자인 경우, 환자는 혈압을 낮추기 위해 혈압 강하제로 치료할 수 있다. 환자의 상태에 알맞은 혈압 강하제를 사용할 수 있는데, 예를 들어, 이뇨제, 아드레날린 억제제(알파 차단제 및 베타 차단제 포함), 혈관 확장제, 칼슘 채널 차단제, 안지오텐신-전환 효소(ACE) 억제제, 또는 안지오텐신 II 수용체 차단제 등이 있다., 혈압은 식이 요법과 운동 요법을 사용하여 치료할 수도 있다. 유사하게, 후보자 환자가 정상보다 낮은 철 저장 또는 정상보다 낮은 철 저장을 가지고 있는 경우, 환자의 철 저장이 정상 수준 또는 수용 가능한 수준으로 회복 될 때까지, 환자는 적절한 식이 요법 및/또는 철 보충제를 사용하여 치료할 수 있다. 적혈구 수치 및/또는 헤모글로빈 수치가 정상보다 높은 환자의 경우, 공개된 ActRIIB 단백질의 하나 또는 이상의 변이체 ActRIIB 단백질의 투여는 수준이 정상 수준 또는 허용 수준으로 회복될 때까지 지연될 수 있다.
특정 구체예들에서, 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료될 후보 환자에서 하나 또는 그 이상의 혈액학적 매개변수가 정상 범위를 벗어나거나 정상의 상측에 있는 경우,투여 시작이 지연되지 않을 수도 있다. 그러나, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투여량 또는 투여 빈도는 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질이 투여시 발생되는 혈액학적 매개변수의 수용불가능한 증가 위험을 감소시킬 수 있는 양으로 설정될 수 있다. 대안으로, 이 환자를 위하여 바람직하지 않은 수준의 혈액학적 매개변수를 다루는 치료제와 함께 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질을 조합한 치료법을 개발할 수 있다. 예를 들면, 환자가 고혈압을 갖는 경우, 본 명세서의 하나 또는 이상의 변이체 ActRIIB 단백질 및 혈압 강하제의 투여를 포함하는 치료 요법이 설계될 수 있다. 바람직한 철 저장보다 낮은 철 저장을 갖는 환자의 경우, 하나 또는 그 이상의 변이체 ActRIIB 단백질 및 철 보충제의 치료 요법이 개발될 수 있다.
한 구체예에서, 하나 또는 그 이상의 혈액학적 매개변수들에 대한 기저 매개변수(baseline parameter) (들)은 이 기저 값에 근거하여 이 환자용으로 확립된 적절한 투여 섭생 및 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료될 후보 환자에 대해 확립될 수 있다. 대안으로, 환자의 병력에 근거하여 확립된 기저 매개변수를 사용하여 환자에 대한 적절한 길항제-투여 요법을 통지할 수 있다. 예를 들면, 건강한 환자가 정의된 정상 범위를 초과하는 확립된 기저 혈압을 갖는 경우, 이 환자의 혈압을 명세서의 하나 또는 그 이상의 길항제로 치료하기 전, 일반인에게 정상적인 것으로 간주되는 범위로 가져갈 필요는 없다. 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료하기 전, 하나 또는 그 이상의 혈액학적 매개변수에 대한 환자의 기저 값은 본 명세서의 하나 또는 그 이상의 길항제로 치료하는 동안 혈액학적 매개변수의 변화를 모니터링하기 위한 관련 비교 값으로 사용할 수도 있다.
특정 구체예들에서, 하나 또는 그 이상의 혈액학적 매개변수는 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료받는 환자에서 측정된다. 혈액학적 매개변수는 치료 중 환자를 모니터링하고, 본 명세서의 하나 또는 그 이상의 길항제 또는 다른 치료제와의 추가 투약으로 투약을 조정 또는 종료하는 데 사용할 수 있다. 예를 들면, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투여로 혈압, 적혈구 수치 또는 헤모글로빈 수치가 증가하거나, 또는 철 저장량이 감소한다면, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투여량은 하나 또는 그 이상의 혈액학적 매개변수에서 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 효과를 감소시키기 위하여 빈도 또는 그 양이 감소될 수 있다. 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투여로 인하여 하나 또는 그 이상의 혈액학적 매개변수가 환자에게 불리하도록 변화된다면, 본 명세서의 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 상기 혈액학적 매개변수(들)이 수용가능한 수준으로 회복될 때까지 일시적으로, 또는 영구적으로 중단될 수 있다. 유사하게, 하나 또는 그 이상의 혈액학적 매개변수가 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투여량 또는 투여 빈도를 줄인 후에도 허용 가능한 범위 내에 들지 않는다면, 투약이 종료될 수 있다. 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투여 감소 또는 종료에 추가 또는 대안으로, 이 환자는 예를 들어 혈압 강하제 또는 철 보충제와 같은 혈액학적 매개변수 (들)의 바람직하지 않은 수준을 다루는 추가의 치료제를 투여할 수 있다. 예를 들면, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질로 치료된 환자의 혈압이 상승되었고, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 동일한 수준으로 투여를 지속할 것이라면, 혈압-강하제를 치료 요법에 추가되며, 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투약이 감소되고 (가령, 양 및/또는 빈도), 혈압-강하제를 치료 요법에 추가되거나, 또는 본 명세서의 하나 또는 그 이상의 변이체 ActRIIB 단백질의 투약을 종료하고, 혈압-강하제로 이 환자를 치료할 수 있다.
7.
약학 조성물
특정 구체예들에서, 본 발명의 화합물 (가령, 변이체 ActRIIB 단백질, 동종체 또는 이형 형태)은 약학적으로 수용가능한 담체와 함께 제형화된다. 예를 들면, 변이체 ActRIIB 단백질은 단독으로 또는 약학 제제 (치료 조성물)의 성분으로서 투여될 수 있다. 대상 화합물은 인간 또는 동물 용 의약에 사용하기 위한 임의의 편리한 방법으로 투여 용으로 제형화될 수 있다.
특정 구체예들에 있어서, 본 명세서의 치료 방법은 상기 조성물을 국소적으로, 전신 투여하거나, 또는 임플란트 또는 장치로부터 국소적으로 투여하는 것을 포함한다. 투여 될 때, 본 발명에서 사용하기 위한 치료용 조성물은 물론 발열성 물질이 없는 생리적으로 허용되는 형태이다. 또한, 조성물은 표적 조직 부위 (예를 들어, 뼈, 연골, 근육, 지방 또는 뉴런), 예를 들어, 조직 손상을 갖는 부위로 전달하기 위해 점성 형태로 캡슐화되거나 주입되는 것이 바람직할 수 있다. 국소 투여는 상처 치유 및 조직 복구에 적합할 수 있다. 전술한 바와 같이, 상기 조성물에 전술한 변이체 ActRIIB 단백질 조성물 이외의 치료 학적으로 유용한 제제가 임의선택적으로 포함되거나, 또는 대안으로 또는 추가적으로 본 발명의 방법에서 대상 화합물(가령, 변이체 ActRIIB 단백질)과 동시에 또는 순차적으로 투여될 수 있다.
특정 구체예들에서, 본 발명의 조성물은 표적 조직 부위로 하나 또는 그 이상의 치료 화합물 (예를 들어, 변이체 ActRIIB 단백질)을 전달할 수 있는 매트릭스를 포함하고, 이는 발생하는 조직을 위한 구조를 제공하고, 신체 내로 최적으로 재흡수될 수 있다. 예를 들면, 상기 매트릭스는 상기 변이체 ActRIIB 단백질의 지연 방출을 제공할 수 있다. 이러한 매트릭스는 다른 이식된 의학 용도에 현재 사용되는 재질로 형성될 수 있다.
매트릭스 재질은 생체적합성, 생분해성, 기계적 성질, 미용적 외관 및 경계면 성질을 기반으로 선택될 수 있다. 해당 조성물의 특정 용도가 적절한 제형을 규정할 것이다. 상기 조성물에 대한 잠재적 매트릭스는 생분해가능하며, 화학적으로 황산칼슘, 인산삼칼슘, 히드록시아파타이트, 폴리락트산 및 폴리안하이드리드로 규정될 수 있다. 다른 잠재적 물질은 예를 들면, 뼈 또는 피부 콜라겐과 같이, 생분해가능하며, 생물학적으로 잘 규정된 물질이다. 또한 매트릭스는 순수 단백질 또는 세포외 매트릭스 성분들로 구성된다. 다른 잠재적 매트릭스는 비-생분해성이며, 화학적으로 예를 들면, 소결(sintered) 히드록시아파타이트, 바이오글라스, 알루미네이트 또는 기타 세라믹과 같이 비-생분해성이며, 화학적으로 규정된다. 매트릭스는 예를 들면, 폴리락트산 및 히드록시아파타이트 또는 콜라겐 및 인산삼칼슘과 같이 전술한 유형의 물질의 조합을 포함할 수도 있다. 바이오 세라믹은 공극 크기, 입자 크기, 입자 형태 및 생분해성을 변경시키기 위하여 조성물(예, 칼슘-알루미네이트-포스페이트) 및 공정이 변경될 수 있다.
특정 구체예들에서, 본 발명의 변이체 ActRIIB 단백질은 예를 들면, 캡슐, 카시에(cachets), 알약, 테블릿, 로젠지(풍미제 베이스, 이를 테면 보통 슈크로스 및 아카시아 또는 트라가탄 이용), 분말, 과립, 또는 수성 또는 비-수성 액체에 용액 또는 현탁액, 수중유(oil-in-water) 또는 유중수(water-in-oil) 에멀션, 또는 엘릭시르(elixir) 또는 시럽, 또는 당의정(pastilles) (비활성 베이스, 이를 테면 젤라틴 및 글리세린, 또는 슈크로스 및 아카시아 이용), 및/또는 구강 세척제 및 이와 유사한 것으로 경구 투여될 수 있는데, 이들 각각은 예정된 양의 활성 성분을 함유한다. 물질은 또한 볼루스(bolus), 연질약(electuary), 또는 페이스트로 또한 투여될 수 있다.
경구 투여용 고체 투약형 (캡슐, 정제, 환제, 당의정, 분말, 과립 및 이와 유사한 것등)에서, 본 발명의 하나 또는 그 이상의 변이체 ActRIIB 단백질은 하나 또는 그 이상의 약학적으로 수용가능한 담체, 이를 테면 시트르산 나트륨 또는 인산이칼슘, 및/또는 다음중 임의의 것과 혼합될 수 있다: (1) 충전제 또는 증량제, 이를 테면, 전분, 락토스, 수크로스, 글루코스, 만니톨 및/또는 규산; (2) 결합제, 예를 들어 카르복시 메틸셀룰로스, 알긴산염, 젤라틴, 폴리비닐 피롤리돈, 수크로즈 및/또는 아카시아; (3) 글리세롤과 같은 보습제; (4) 붕해제, 이를 테면, 한천-한천, 탄산칼슘, 감자 또는 타피오카 전분, 알긴산, 특정 실리케이트 및 탄산나트륨; (5) 파라핀과 같은 용액 지연제; (6) 흡수 촉진제, 예컨대 4가 암모늄 화합물; (7) 습윤제, 예를 들어, 세틸 알코올 및 글리세롤 모노스테아레이트; (8) 카올린 및 벤토나이트 점토와 같은 흡수제; (9) 윤활제, 이를 테면, 활석, 칼슘 스테아레이트, 마그네슘 스테아레이트, 고체 폴리에틸렌 글리콜, 소듐 라우릴 설페이트 및 이들의 혼합물; 및 (10) 착색제. 캡슐, 테블릿 및 알약의 경우, 상기 약학 조성물은 완충 물질을 또한 포함할 수 있다. 유사한 유형의 고형 조성물은 또한 락토오스 또는 유당 뿐만 아니라, 고-분자량 폴리에틸렌 글리콜 등과 같은 부형제를 사용하여 연질 및 경질-충전된 젤라틴 캡슐에서 충전제로서 사용될 수 있다.
경구 투여를 위한 액체 투약형은 약학으로 수용가능한 에멀션, 마이크로에멀션, 용액, 현탁액, 시럽 및 엘릭시르를 포함할 수 있다. 활성 성분에 추가하여, 액체 투약 형태는 당업계에서 일반적으로 사용되는 불활성 희석제를 함유할 수 있으며, 이를 테면 물 또는 기타 용매, 가용화 물질 및/또는 유화제, 이를 테면 에틸 알콜, 이소프로필 알콜, 에틸 카르보네이트, 에틸 아세테이트, 벤질 알콜, 벤질 벤조에이트, 프로필렌 글리콜, 1,3-부틸렌 글리콜, 오일 (특히, 면실유, 땅콩, 옥수수) 및 글리세롤, 테트라 하이드로푸릴 알콜, 폴리에틸렌 글리콜 및 소르비탄의 지방산 에스테르 및 이들의 혼합물이 된다. 불활성 희석제 외에도, 경구 조성물은 습윤제, 유화제 및 현탁제, 감미제, 향료, 착색제, 향료 및 방부제와 같은 보조제를 포함할 수 있다.
현탁액에는 활성 화합물에 추가하여, 현탁화제, 예컨대 에톡 시화 이소스테아릴 알코올, 폴리옥시에틸렌 소르비톨 및 소르 비탄 에스테르, 미세결정 셀룰로오스, 알루미늄 메타히드록 시드, 벤토나이트, 한천-한천 및 트라가탄 및 이들의 혼합물이 포함될 수 있다.
본원에 개시된 특정 조성물은 피부 또는 점막에 국소 투여될 수 있다. 국소 제제는 피부 또는 각질층 침투 증진제로서 효과적인 것으로 공지된 하나 또는 그 이상의 다양한 제제를 추가로 포함할 수 있다. 이들의 예는 2-피롤리돈, N-메틸-2-피롤리돈, 디메틸아세트아미드, 디메틸포름아미드, 프로필렌 글리콜, 메틸 또는 이소프로필 알코올, 디메틸 술폭시드 및 아존이다. 제형을 화장용으로 허용하기 위해, 추가의 제제가 추가로 포함될 수 있다. 이러한 예로는 지방, 왁스, 오일, 염료, 향료, 방부제, 안정제 및 계면 활성제가 있다. 당 업계에 공지된 것과 같은 각질 용해제가 또한 포함될 수 있다. 예로는 살리실산과 황이다.
국소 또는 경피 투여를 위한 투여 형태는 분말, 스프레이, 연고, 페이스트, 크림, 로션, 겔, 용액, 패치 및 흡입제를 포함한다. 활성 화합물은 약학적으로 허용 가능한 담체, 및 필요에 따라 임의의 보존제, 완충제 또는 추진체와 멸균 상태 하에서 혼합될 수 있다. 연고, 페이스트, 크림 및 젤은 본 발명의 화합물(가령, 변이체 ActRIIB 단백질)이외에 동물성 및 식물성 지방, 오일, 왁스, 파라핀, 전분, 트라가탄, 셀룰로오스 유도체, 폴리에틸렌 글리콜, 실리콘, 벤토나이트, 규산, 활석 및 산화 아연, 또는 이들의 혼합물을 포함할 수 있다.
분말 및 스프레이는 대상 화합물 이외에, 락토오스, 활석, 규산, 수산화 알루미늄, 규산 칼슘 및 폴리아미드 분말 또는 이들 물질의 혼합물과 같은 부형제를 함유할 수 있다. 스프레이는 클로로플루오로 탄화수소 및 부탄 및 프로판과 같은 휘발성 치환되지 않은 탄화수소와 같은 통상적인 추진체를 추가로 포함할 수 있다.
특정 구체예들에서, 비경구 투여에 적합한 약학 조성물들은 하나 또는 그 이상의 변이체 ActRIIB 단백질과 하나 이상의 약학적으로 허용되는 멸균 등장성 수성 또는 비수용액, 분산액, 현탁액 또는 유화액, 또는 사용 직전에 멸균 주사 용액 또는 분산액으로 재구성될 수 있는 멸균 분말을 포함할 수 있는데, 이들은 항산화제, 완충액, 정균제, 제제를 의도된 수용자의 혈액과 등장성으로 만드는 용질, 또는 현탁제 또는 증점제를 함유할 수 있다. 본 발명의 약학 조성물에 사용될 수 있는 적합한 수성 및 비수성 담체의 예는 물, 에탄올, 폴리올 (예를 들어, 글리세롤, 프로필렌 글리콜, 폴리에틸렌 글리콜 및 이와 유사한 것등) 및 이들의 적절한 혼합물, 식물성 오일, 이를 테면, 올리브 오일, 주사가능한 유기 에스테르, 이를 테면, 에틸 올레에이트)을 포함한다. 적절한 유동성은 예를 들어, 코팅 물질, 이를 테면, 레시틴의 사용, 분산액의 경우 요구되는 입자 크기의 유지 그리고 계면 활성제의 사용에 의해 유지될 수 있다.
본 발명의 조성물은 또한 방부제, 습윤제, 유화제 및 분산제와 같은 어쥬번트(adjuvants)를 함유할 수 있다. 미생물의 작용의 예방은 파라벤, 클로로부탄올 및 페놀 소르브산 및 이와 유사한 것을 비롯한 다양한 항박테리아 및 항진균제를 포함시킴으로써 확보될 수 있다. 조성물에 설탕, 염화나트륨 등의 등장화제를 포함시키는 것이 바람직할 수도 있다. 또한, 예를 들어, 모노스테아르산 알루미늄 및 젤라틴을 포함하는 흡수를 지연시키는 물질을 포함시킴으로써 주사가능한 약형의 연장된 흡수가 이루어질 수 있다.
투여 섭생은 본 발명의 대상 화합물 (가령, 변이체 ActRIIB 단백질)의 작용을 변형시키는 다양한 인자를 고려하는 주치의에 의해 결정될 것이다. 다양한 요인은 치료할 질병에 따라 달라진다. 근육 질환의 경우, 이러한 인자는 형성되기를 원하는 근육량, 질병에 가장 영향을 받는 근육, 악화된 근육의 상태, 환자의 연령, 성별 및 식이, 투여 시간을 포함할 수 있지만, 기타 임상 적 요인에 따라 달라질 수 있다. 최종 조성물에 기타 공지의 성장 인자를 추가하면 이 약형에 또한 영향을 줄 수 있다. 근육의 성장 및/또는 복구에 대한 주기적 평가 (예 : 강도 테스트, 근육 크기의 MRI 평가 및 근육 생검 분석)을 통해 진행 상황을 모니터링할 수 있다.
본 발명의 특정 구체예들에서, 하나 또는 그 이상의 변이체 ActRIIB 단백질은 함께 (동시에) 또는 상이한 시간 (순차적으로 또는 중첩)으로 투여될 수 있다. 또한, 변이체 ActRIIB 단백질은 다른 유형의 치료제, 예를 들어 연골-유도제, 뼈-유도제, 근육-유도제, 지방-감소제 또는 신경-유도제와 함께 투여될 수 있다. 두 가지 유형의 화합물은 동시에 또는 상이한 시간에 투여될 수 있다. 본 발명의 변이체 ActRIIB 단백질은 다른 치료제와 함께, 또는 아마도 상승적으로 작용할 수 있는 것으로 기대된다.
특정 예에서, 다양한 골 형성, 연골-유도 및 골-유도 인자, 특히 비스포스포네이트가 기재되어 있다. 가령, EP 특허 출원 번호 148,155 및 169,016 참고. 예를 들면, 대상 변이체 ActRIIB 단백질과 복합될 수 있는 다른 인자로는 표피 성장 인자 (EGF), 혈소판 유도 성장 인자 (PDGF), 형질 전환 성장 인자 (TGF-α 및 TGF-β) 및 인슐린-유사 성장 인자 (IGF)를 포함한다.
특정 구체예들에서, 본 발명은 또한 변이체 ActRIIB 단백질의 생체 내 생산을 위한 유전자 요법을 제공한다. 그러한 치료는 상기 나열된 바와 같은 장애를 갖는 세포 또는 조직 내로 상기 변이체 ActRIIB 폴리뉴클레오티드 서열을 도입함으로써 그의 치료 효과를 얻을 수 있다. 상기 상기 변이체 ActRIIB 폴리뉴클레오티드 서열의 전달은 예를 들어, 키메라 바이러스 또는 콜로이드성 분산 시스템과 같은 재조합 발현 벡터를 사용하여 달성 될 수 있다. 상기 변이체 ActRIIB 폴리뉴클레오티드 서열의 바람직한 치료 전달은 표적화된 리포좀을 사용하는 것이다.
본 명세서에서 교시된 바와 같이, 유전자 요법에 이용될 수 있는 다양한 바이러스 벡터는 아데노바이러스, 헤르페스 바이러스, 유두종, 또는 바람직하게는 RNA 바이러스, 이를 테면, 레트로바이러스를 포함한다. 레트로바이러스 벡터는 뮤린 또는 조류 레트로바이러스의 유도체다. 단일 외부 유전자가 삽입될 수 있는 레트로바이러스 벡터의 예로는 다음을 포함하나, 이에 국한되지 않는다: 몰로니 뮤린 백혈병 바이러스 (MoMuLV), 하베이 뮤린 육종 바이러스 (HaMuSV), 뮤린 유방 종양 바이러스 (MuMTV), 및 라우스 육종 바이러스 (RSV). 다수의 추가 레트로바이러스 벡터가 다중 유전자를 혼입할 수 있다. 이들 모든 벡터는 선택가능한 표지의 유전자를 전달 또는 혼입하여, 형질유도된 세포를 동정 및 생성할 수 있다. 레트로바이러스 벡터는 예를 들면, 당, 당지질, 또는 단백질을 부착시킴으로써, 표적-특이적으로 만들어질 수 있다. 항체를 이용한 바람직한 표적화가 이루어진다. 당업자는 특이적 폴리뉴클레오티드 서열을 레트로바이러스 게놈 안에 삽입시키거나 또는 바이러스 외피에 부착시켜, 상기 변이체 ActRIIB 폴리뉴클레오티드를 함유하는 레트로바이러스 벡터의 표적 특이적 운반이 가능하다는 것을 인지할 것이다. 하나의 바람직한 구체 예에서, 벡터는 뼈, 연골, 근육 또는 신경 세포/조직을 표적으로 한다.
대안으로, 조직 배양 세포는 통상적인 인산칼슘 형질감염에 의해 레트로바이러스 구조 유전자 (gag, pol, 및 env)를 인코드하는 플라스미드로 직접적으로 형질감염될 수 있다. 이들 세포는 관심 대상의 유전자를 함유하는 벡터 플라스미드로 형질감염된다. 생성 세포는 레트로바이러스 벡터를 배양 배지로 방출한다.
본 발명의 변이체 ActRIIB 폴리뉴클레오티드에 대한 또다른 표적화된 전달 시스템은 콜로이드성 분산 시스템이다. 콜로이드성 분산 시스템은 거대분자 복합체, 나노캡슐, 미소구, 비드, 그리고 수중유 에멀션, 미셀, 혼합 미셀 및 리포좀을 포함하는 지질-기반 시스템을 포함한다. 본 발명의 바람직한 콜로이드 시스템은 리포좀이다. 리포좀은 인공 막 소포로, 시험관 및 생체내 운반 비이클로 유용하다. RNA, DNA, 및 고유 비리온은 수성 내부에 포집되고, 생물학적 활성 형태로 세포로 운반된다 [가령, Fraley, et al. (1981) Trends Biochem. Sci., 6:77 참고]. 리포좀 비이클을 이용한 효과적인 유전자 전달 방법은 당분야에 공지되어 있다[ 가령, Mannino, et al. (1988) Biotechniques, 6:682, 1988 참고]. 리포좀의 조성물은 통상 인지질의 조합으로, 스테로이드, 특히 콜레스테롤을 포함할 수 있다. 다른 인지질 또는 다른 지질도 사용될 수 있다. 리포좀의 물리적 성질은 pH, 이온 강도 그리고 이가양이온 존재에 따라 달라진다.
리포좀 생산에 유용한 지질의 예는 포스파티딜 글리세롤, 포스파티딜콜린, 포스파티딜세린, 포스파티딜에탄올아민, 스핑 고지질, 세레브로시드 및 강글리오사이드와 같은 포스파티딜 화합물을 포함한다. 예시적인 인지질은 난 포스파티딜콜린, 디팔미토일 포스파티딜콜린 및 디스테아로일포스파티딜콜린을 포함한다. 리포좀의 표적화는 예를 들면, 장기(organ)-특이성, 세포-특이성, 및 소기관-특이성에 기반을 두고, 당분야에 공지되어 있다.
구체예
지금부터 본 발명이 일반적으로 기술되며, 단지 본 발명의 특정 구체예 및 실시 양태는 예시하기 위한 목적으로 포함되는 것으로, 이에 본 발명을 제한하려는 의도는 아니며, 하기 실시 예를 참조함으로써 보다 용이하게 이해될 것이다.
실시예 1. ActRIIB-Fc 융합 단백질의 생성
출원인은 최소의 링커 (3 개의 글리신 아미노산)를 사이에 두고 인간 G1Fc 도메인에 융합된 인간 ActRIIB의 세포외 도메인을 갖는 가용성 ActRIIB 융합 단백질을 제조하였다. 이 구조체는 ActRIIB-G1Fc로 지칭된다.
ActRIIB-G1Fc는 CHO 세포주로부터 정제된, 하기의 서열 번호: 5 (링커 밑줄이 있음)로 나타낸다:
GRGEAETRECIYYNANWELERTNQSGLERCEGEQDKRLHCYASWRNSSGTIELVKKGCWLDDFNCYDRQECVATEENPQVYFCCCEGNFCNERFTHLPEAGGPEVTYEPPPTAPTGGGTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK (서열 번호: 5)
상기 ActRIIB-G1Fc 단백질은 CHO 세포 계통에서 발현된다. 3가지 상이한 리더 서열이 고려되었다:
(i) 꿀벌 멜리틴 (HBML): MKFLVNVALVFMVVYISYIYA (서열 번호: 7)
(ii) 조직플라스미노겐활성제 (TPA): MDAMKRGLCCVLLLCGAVFVSP (서열 번호: 8)
(iii) 고유: mtapwvalallwgslcag (서열 번호: 9).
선택된 형태는 TPA 리더를 사용하며 다음과 같은 미처리 아미노산 서열을 갖는다:
MDAMKRGLCCVLLLCGAVFVSPGASGRGEAETRECIYYNANWELERTNQSGLERCEGEQDKRLHCYASWRNSSGTIELVKKGCWLDDFNCYDRQECVATEENPQVYFCCCEGNFCNERFTHLPEAGGPEVTYEPPPTAPTGGGTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK
(서열 번호: 6)
이 폴리펩티드는 다음의 핵산 서열 (서열 번호: 10)에 의해 인코딩된다:
A TGGATGCAAT GAAGAGAGGG CTCTGCTGTG TGCTGCTGCT GTGTGGAGCA GTCTTCGTTT CGCCCGGCGC CTCTGGGCGT GGGGAGGCTG AGACACGGGA GTGCATCTAC TACAACGCCA ACTGGGAGCT GGAGCGCACC AACCAGAGCG GCCTGGAGCG CTGCGAAGGC GAGCAGGACA AGCGGCTGCA CTGCTACGCC TCCTGGCGCA ACAGCTCTGG CACCATCGAG CTCGTGAAGA AGGGCTGCTG GCTAGATGAC TTCAACTGCT ACGATAGGCA GGAGTGTGTG GCCACTGAGG AGAACCCCCA GGTGTACTTC TGCTGCTGTG AAGGCAACTT CTGCAACGAG CGCTTCACTC ATTTGCCAGA GGCTGGGGGC CCGGAAGTCA CGTACGAGCC ACCCCCGACA GCCCCCACCG GTGGTGGAAC TCACACATGC CCACCGTGCC CAGCACCTGA ACTCCTGGGG GGACCGTCAG TCTTCCTCTT CCCCCCAAAA CCCAAGGACA CCCTCATGAT CTCCCGGACC CCTGAGGTCA CATGCGTGGT GGTGGACGTG AGCCACGAAG ACCCTGAGGT CAAGTTCAAC TGGTACGTGG ACGGCGTGGA GGTGCATAAT GCCAAGACAA AGCCGCGGGA GGAGCAGTAC AACAGCACGT ACCGTGTGGT CAGCGTCCTC ACCGTCCTGC ACCAGGACTG GCTGAATGGC AAGGAGTACA AGTGCAAGGT CTCCAACAAA GCCCTCCCAG CCCCCATCGA GAAAACCATC TCCAAAGCCA AAGGGCAGCC CCGAGAACCA CAGGTGTACA CCCTGCCCCC ATCCCGGGAG GAGATGACCA AGAACCAGGT CAGCCTGACC TGCCTGGTCA AAGGCTTCTA TCCCAGCGAC ATCGCCGTGG AGTGGGAGAG CAATGGGCAG CCGGAGAACA ACTACAAGAC CACGCCTCCC GTGCTGGACT CCGACGGCTC CTTCTTCCTC TATAGCAAGC TCACCGTGGA CAAGAGCAGG TGGCAGCAGG GGAACGTCTT CTCATGCTCC GTGATGCATG AGGCTCTGCA CAACCACTAC ACGCAGAAGA GCCTCTCCCT GTCTCCGGGT AAATGA (서열 번호: 10)
CHO-세포 생산된 물질의 N-말단 서열 분석은 주요 서열-GRGEAE (서열 번호: 11)로 나타내었다. 특히, 문헌에 보고된 다른 구조물은-SGR ... 서열로 시작한다.
정제는 다음중 3개 또는 그 이상이 임의의 순서로 포함된 일련의 컬럼 크로마토그래피에 의해 실행될 수 있다: 단백질 A 크로마토그래피, Q 세파로즈 크로마토그래피, 페닐세파로즈 크로마토그래피, 크기 압출 크로마토그래피, 및 양이온 교환 크로마토그래피. 상기 정제는 바이러스 여과 및 완충액 교환으로 완성될 수 있다.
상기 ActRIIB-Fc 융합 단백질은 또한 HEK293 세포 및 COS 세포에서 발현되었다. 모든 세포계통의 물질 및 적당한 배양 조건이 생체 내에서 근육 형성 활성을 갖는 단백질을 제공하였지만, 아마도 세포주 선별 및/또는 배양 조건과 관련하여 역가의 가변성이 관찰되었다.
실시예 2: 변이체 ActRIIB-Fc 단백질의 생성
출원인은 ActRIIB의 세포외 도메인에서 일련의 돌연변이 (서열 변이)를 만들었고, 임의의 링커에 의해 결합된 변이체 ActRIIB 세포외 도메인과 Fc 도메인을 포함하는, 가용성 동종이량체 융합 단백질로서 이들 변이체 폴리펩티드를 생산하였다. 배경이 되는 ActRIIB-Fc 융합체는 서열 번호: 5에 나타낸 바와 같은 ActRIIB-G1Fc이었다.
다양한 치환 돌연변이가 배경(background) ActRIIB-Fc 단백질에 도입되었다. 실시 예 1에 제시된 데이터에 기초하여, TPA 리더로 발현되는 경우, 이들 구조체는 N-말단 세린이 결핍될 것으로 예상된다. 돌연변이는 PCR 돌연변이 유발에 의해 ActRIIB 세포외 도메인에서 생성되었다. PCR 후, 단편을 Qiagen 컬럼으로 정제하고, SfoI 및 AgeI로 분해하고 겔 정제하였다. 이러한 단편을 결찰(ligation)시, 인간 IgG1과 융합 키메라를 생성하도록 발현 벡터 pAID4 (WO2006/012627 참조)에 결찰시켰다. 대장균(E. coli) DH5α 로의 형질전환시, 콜로니를 채취하고 DNA를 분리하였다. 뮤린 구조물 (mFc)의 경우, 인간 IgG1를 대신하여 뮤린 IgG2a로 대체되었다. 모든 돌연변이체는 서열이 검증되었다.
프로세스안된 ActRIIB(K55A)-G1Fc의 아미노산 서열을 하기에 나타낸다 (서열 번호 : 31). 신호 서열과 링커 서열은 실선 밑줄로 표시하고, K55A 치환은 이중밑줄로 표시된다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 31의 아미노산 서열이 제공된다.
ActRIIB(K55A)-G1Fc 융합 폴리펩티드는 다음의 핵산 서열 (서열 번호: 32)에 의해 인코딩된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCTGGGCG TGGGGAGGCT GAGACACGGG
101
AGTGCATCTA CTACAACGCC AACTGGGAGC TGGAGCGCAC CAACCAGAGC
151
GGCCTGGAGC GCTGCGAAGG CGAGCAGGAC GCCCGGCTGC ACTGCTACGC
201
CTCCTGGCGC AACAGCTCTG GCACCATCGA GCTCGTGAAG AAGGGCTGCT
251
GGCTAGATGA CTTCAACTGC TACGATAGGC AGGAGTGTGT GGCCACTGAG
301
GAGAACCCCC AGGTGTACTT CTGCTGCTGT GAAGGCAACT TCTGCAACGA
351
GCGCTTCACT CATTTGCCAG AGGCTGGGGG CCCGGAAGTC ACGTACGAGC
401
CACCCCCGAC AGCCCCCACC GGTGGTGGAA CTCACACATG CCCACCGTGC
451
CCAGCACCTG AACTCCTGGG GGGACCGTCA GTCTTCCTCT TCCCCCCAAA
501
ACCCAAGGAC ACCCTCATGA TCTCCCGGAC CCCTGAGGTC ACATGCGTGG
551
TGGTGGACGT GAGCCACGAA GACCCTGAGG TCAAGTTCAA CTGGTACGTG
601
GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG AGGAGCAGTA
651
CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT
701
GGCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA
751
GCCCCCATCG AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC
801
ACAGGTGTAC ACCCTGCCCC CATCCCGGGA GGAGATGACC AAGAACCAGG
851
TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT ATCCCAGCGA CATCGCCGTG
901
GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACAAGA CCACGCCTCC
951
CGTGCTGGAC TCCGACGGCT CCTTCTTCCT CTATAGCAAG CTCACCGTGG
1001
ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT
1051
GAGGCTCTGC ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCCCCGGG
1101
TAAA (서열 번호: 32)
성숙 ActRIIB(K55A)-G1Fc 융합 폴리펩티드 (서열 번호: 33)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDARLHC YASWRNSSGT
* 51
IELVKKGCWL DDFNCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPS
251
REEMTKNQVS LTCLVKGFYP SDIAVEWESN GQPENNYKTT PPVLDSDGSF
301
FLYSKLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PGK
(서열 번호: 33)
프로세스안된 ActRIIB(K55E)-G1Fc의 아미노산 서열을 하기에 나타낸다 (서열 번호 : 34). 신호 서열과 링커 서열은 실선 밑줄로 표시하고, K55E 치환은 이중밑줄로 표시된다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 34의 아미노산 서열이 제공된다.
ActRIIB(K55E)-G1Fc 융합 폴리펩티드는 다음의 핵산 서열 (서열 번호: 35)에 의해 인코딩된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCTGGGCG TGGGGAGGCT GAGACACGGG
101
AGTGCATCTA CTACAACGCC AACTGGGAGC TGGAGCGCAC CAACCAGAGC
151
GGCCTGGAGC GCTGCGAAGG CGAGCAGGAC GAGCGGCTGC ACTGCTACGC
201
CTCCTGGCGC AACAGCTCTG GCACCATCGA GCTCGTGAAG AAGGGCTGCT
251
GGCTAGATGA CTTCAACTGC TACGATAGGC AGGAGTGTGT GGCCACTGAG
301
GAGAACCCCC AGGTGTACTT CTGCTGCTGT GAAGGCAACT TCTGCAACGA
351
GCGCTTCACT CATTTGCCAG AGGCTGGGGG CCCGGAAGTC ACGTACGAGC
401
CACCCCCGAC AGCCCCCACC GGTGGTGGAA CTCACACATG CCCACCGTGC
451
CCAGCACCTG AACTCCTGGG GGGACCGTCA GTCTTCCTCT TCCCCCCAAA
501
ACCCAAGGAC ACCCTCATGA TCTCCCGGAC CCCTGAGGTC ACATGCGTGG
551
TGGTGGACGT GAGCCACGAA GACCCTGAGG TCAAGTTCAA CTGGTACGTG
601
GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG AGGAGCAGTA
651
CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT
701
GGCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA
751
GCCCCCATCG AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC
801
ACAGGTGTAC ACCCTGCCCC CATCCCGGGA GGAGATGACC AAGAACCAGG
851
TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT ATCCCAGCGA CATCGCCGTG
901
GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACAAGA CCACGCCTCC
951
CGTGCTGGAC TCCGACGGCT CCTTCTTCCT CTATAGCAAG CTCACCGTGG
1001
ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT
1051
GAGGCTCTGC ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCCCCGGG
1101
TAAA (서열 번호: 35)
성숙 ActRIIB(K55E)-G1Fc 융합 폴리펩티드 (서열 번호: 36)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDERLHC YASWRNSSGT
51
IELVKKGCWL DDFNCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPS
251
REEMTKNQVS LTCLVKGFYP SDIAVEWESN GQPENNYKTT PPVLDSDGSF
301
FLYSKLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PGK
(서열 번호: 36)
프로세스안된 ActRIIB(F82I)-G1Fc의 아미노산 서열을 하기에 나타낸다(서열 번호: 37). 신호 서열과 링커 서열은 실선 밑줄로 표시하고, F82I 치환은 이중밑줄로 표시된다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 37의 아미노산 서열이 제공된다.
ActRIIB(F82I)-G1Fc 융합 폴리펩티드는 다음의 핵산 서열 (서열 번호: 38)에 의해 인코딩된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCTGGGCG TGGGGAGGCT GAGACACGGG
101
AGTGCATCTA CTACAACGCC AACTGGGAGC TGGAGCGCAC CAACCAGAGC
151
GGCCTGGAGC GCTGCGAAGG CGAGCAGGAC AAGCGGCTGC ACTGCTACGC
201
CTCCTGGCGC AACAGCTCTG GCACCATCGA GCTCGTGAAG AAGGGCTGCT
251
GGCTAGATGA CATCAACTGC TACGATAGGC AGGAGTGTGT GGCCACTGAG
301
GAGAACCCCC AGGTGTACTT CTGCTGCTGT GAAGGCAACT TCTGCAACGA
351
GCGCTTCACT CATTTGCCAG AGGCTGGGGG CCCGGAAGTC ACGTACGAGC
401
CACCCCCGAC AGCCCCCACC GGTGGTGGAA CTCACACATG CCCACCGTGC
451
CCAGCACCTG AACTCCTGGG GGGACCGTCA GTCTTCCTCT TCCCCCCAAA
501
ACCCAAGGAC ACCCTCATGA TCTCCCGGAC CCCTGAGGTC ACATGCGTGG
551
TGGTGGACGT GAGCCACGAA GACCCTGAGG TCAAGTTCAA CTGGTACGTG
601
GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG AGGAGCAGTA
651
CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT
701
GGCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA
751
GCCCCCATCG AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC
801
ACAGGTGTAC ACCCTGCCCC CATCCCGGGA GGAGATGACC AAGAACCAGG
851
TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT ATCCCAGCGA CATCGCCGTG
901
GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACAAGA CCACGCCTCC
951
CGTGCTGGAC TCCGACGGCT CCTTCTTCCT CTATAGCAAG CTCACCGTGG
1001
ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT
1051
GAGGCTCTGC ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCTCCGGG
1101
TAAA (서열 번호: 38)
성숙 ActRIIB(F82I)-G1Fc 융합 폴리펩티드 (서열 번호: 39)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDKRLHC YASWRNSSGT
51
IELVKKGCWL DDINCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPS
251
REEMTKNQVS LTCLVKGFYP SDIAVEWESN GQPENNYKTT PPVLDSDGSF
301
FLYSKLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PGK
(서열 번호: 39)
프로세스안된 ActRIIB(F82K)-G1Fc의 아미노산 서열을 하기에 나타낸다(서열 번호: 40). 신호 서열과 링커 서열은 실선 밑줄로 표시하고, F82K 치환은 이중밑줄로 표시된다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 40의 아미노산 서열이 제공된다.
ActRIIB(F82K)-G1Fc 융합 폴리펩티드는 폴리펩티드는 다음의 핵산 서열 (서열 번호: 41)에 의해 인코딩된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCTGGGCG TGGGGAGGCT GAGACACGGG
101
AGTGCATCTA CTACAACGCC AACTGGGAGC TGGAGCGCAC CAACCAGAGC
151
GGCCTGGAGC GCTGCGAAGG CGAGCAGGAC AAGCGGCTGC ACTGCTACGC
201
CTCCTGGCGC AACAGCTCTG GCACCATCGA GCTCGTGAAG AAGGGCTGCT
251
GGCTAGATGA CAAGAACTGC TACGATAGGC AGGAGTGTGT GGCCACTGAG
301
GAGAACCCCC AGGTGTACTT CTGCTGCTGT GAAGGCAACT TCTGCAACGA
351
GCGCTTCACT CATTTGCCAG AGGCTGGGGG CCCGGAAGTC ACGTACGAGC
401
CACCCCCGAC AGCCCCCACC GGTGGTGGAA CTCACACATG CCCACCGTGC
451
CCAGCACCTG AACTCCTGGG GGGACCGTCA GTCTTCCTCT TCCCCCCAAA
501
ACCCAAGGAC ACCCTCATGA TCTCCCGGAC CCCTGAGGTC ACATGCGTGG
551
TGGTGGACGT GAGCCACGAA GACCCTGAGG TCAAGTTCAA CTGGTACGTG
601
GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG AGGAGCAGTA
651
CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT
701
GGCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA
751
GCCCCCATCG AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC
801
ACAGGTGTAC ACCCTGCCCC CATCCCGGGA GGAGATGACC AAGAACCAGG
851
TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT ATCCCAGCGA CATCGCCGTG
901
GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACAAGA CCACGCCTCC
951
CGTGCTGGAC TCCGACGGCT CCTTCTTCCT CTATAGCAAG CTCACCGTGG
1001
ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT
1051
GAGGCTCTGC ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCTCCGGG
1101
TAAA (서열 번호: 41)
성숙 ActRIIB(F82K)-G1Fc 융합 폴리펩티드 (서열 번호: 42)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDKRLHC YASWRNSSGT
51
IELVKKGCWL DDKNCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPS
251
REEMTKNQVS LTCLVKGFYP SDIAVEWESN GQPENNYKTT PPVLDSDGSF
301
FLYSKLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PGK
(서열 번호: 42)
구조체를 COS 또는 CHO 세포에서 발현시키고, 여과 및 단백질 A 크로마토그래피로 정제하였다. 일부의 경우, 검증은 정제된 단백질보다는 조건화된 배지를 사용하여 수행하였다. 리포터 유전자 분석을 위한 샘플의 순도는 SDS-PAGE 및 웨스턴 블롯 분석에 의해 평가되었다.
돌연변이체는 아래에 기술된 결합 분석법 및/또는 생물 검정법으로 시험하였다.
대안으로, 하기에 나타낸 바와 같이(서열 번호: 53), 유사한 돌연변이가 5 개의 아미노산의 N-말단 절두 및 3 개의 아미노산의 C-말단 절두를 갖는 ActRIIB 세포외 도메인으로 도입될 수 있다 . 이러한 절두된 ActRIIB 세포외 도메인은 서열 번호: 2에서 번호매김에 근거하여 ActRIIB(25-131)로 명명된다.
25
ETRECIYYNA NWELERTNQS GLERCEGEQD KRLHCYASWR NSSGTIELVK
75
KGCWLDDFNC YDRQECVATE ENPQVYFCCC EGNFCNERFT HLPEAGGPEV
125
TYEPPPT (서열 번호: 53)
대응하는 배경 융합 폴리펩티드, ActRIIB(25-131)-G1Fc는 하기(서열 번호: 12)에 나타낸다.
1
ETRECIYYNA NWELERTNQS GLERCEGEQD KRLHCYASWR NSSGTIELVK
51
KGCWLDDFNC YDRQECVATE ENPQVYFCCC EGNFCNERFT HLPEAGGPEV
101
TYEPPPTGGG THTCPPCPAP ELLGGPSVFL FPPKPKDTLM ISRTPEVTCV
151
VVDVSHEDPE VKFNWYVDGV EVHNAKTKPR EEQYNSTYRV VSVLTVLHQD
201
WLNGKEYKCK VSNKALPAPI EKTISKAKGQ PREPQVYTLP PSREEMTKNQ
251
VSLTCLVKGF YPSDIAVEWE SNGQPENNYK TTPPVLDSDG SFFLYSKLTV
301
DKSRWQQGNV FSCSVMHEAL HNHYTQKSLS LSPGK (서열 번호: 12)
실시예 3. 세포-기반 검정에서 변이체 ActRIIB-Fc 단백질의 활성
A204 세포-기반 검정을 이용하여 액티빈 A, GDF11 및 BMP9에 의한 신호생성에서 변이체 ActRIIB-Fc 단백질 간의 효과를 비교하였다. 간략하게 설명하면, 이 검증은 근육으로부터 유도된 인간 A204 횡문근육종 세포주 (ATCC®: HTB-82™)와 리포터 벡터 pGL3(CAGA)12 (Dennler et al., 1998, EMBO 17: 3091-3100), 뿐만 아니라 형질감염 효과를 조절하기 위한 Renilla 리포터 플라스미드 (pRLCMV)를 이용한다. CAGA12 모티프는 TGFβ-반응성 유전자 (예를 들면, PAI-1 유전자)에 존재하며, 이 벡터는 액티빈 A, GDF11, 그리고 BMP9를 포함하는 Smad2/3를 통한 신호생성을 할 수 있는 리간드에 일반적으로 사용된다.
1 일차, A-204 세포를 하나 이상의 48-웰 플레이트로 옮겼다. 2 일차에, 이들 세포에 10 μg pGL3(CAGA)12 또는 pGL3(CAGA)12(10 μg) + pRLCMV (1 μg) 및 Fugene로 형질감염되었다. 3 일차에, 0.1 % BSA를 함유하는 배지에서 희석된 리간드를 세포에 첨가하기 전, 1 시간 동안 ActRIIB-Fc 단백질과 예비-배양 하였다. 약 6 시간 후, 세포를 PBS로 헹구고 용해시켰다. 세포 용해물을 루시퍼라제 분석에서 Smad 활성화의 정도를 측정 하였다.
이 검증은 액티빈 A, GDF11, 그리고 BMP9에 의한 세포 신호 전달에 있어서 억제 효과에 대하여 변이체 ActRIIB-Fc 단백질을크리닝하는데 사용되었다. 인간 ActRIIB 세포외 도메인에 아미노산 치환을 혼입하는 동종이 량체 Fc 융합 단백질의 잠재력을 비-변형 인간 ActRIIB 세포외 도메인을 포함하는 Fc 융합 단백질의 효능과 비교 하였다.
위의 표에서 알 수 있듯이, ActRIIB 세포외 도메인의 단일 아미노산 치환은 세포-기반 리포터 유전자 분석에서 액티빈 A 또는 GDF11 억제와 BMP9 억제 사이의 균형을 변경시킬 수 있다. 변형안된 ActRIIB 세포외 도메인을 함유하는 융합 단백질과 비교하였을 때, 상기 변이체 ActRIIB(K55A)-Fc, ActRIIB(K55E)-Fc, ActRIIB(F82I)-Fc, 그리고 ActRIIB(F82K)-Fc는 BMP9 (증가된 IC50 값)의 억제에 효과가 덜하였지만, 액티빈 A 및 GDF11에 대한 억제는 기본적으로 감소되지 않고 유지한다.
이들 결과에서, 변이체 ActRIIB-Fc 단백질, 이를 테면 ActRIIB(K55A)-Fc, ActRIIB(K55E)-Fc, ActRIIB(F82I)-Fc, 그리고 ActRIIB(F82K)-Fc는 변형안된 ActRIIB 세포외 도메인을 포함하는 Fc 융합 단백질과 비교하였을 때, 액티빈 A 및 GDF11에 대한 더욱 선택적인 길항제임을 나타낸다. 따라서, 이들 변이체는 특정 용도에서 ActRIIB-Fc 보다 더 유용할 것이며, 이때 이러한 선택적 길항작용이 유익하다. 실시예들은 BMP9 및 잠재적으로 BMP10의 길항 작용을 감소시키면서, 하나 또는 그 이상의 액티빈 A, GDF8 및 GDF11의 길항 작용을 유지하는 것이 바람직한 치료학적 예를 포함한다.
실시예 4. 변이체 ActRIIB-Fc
동종이량체의 리간드 결합 프로파일
BiacoreTM-기반 결합 검정을 이용하여, 실시예 3에서 스크리닝된 특정 변이체 ActRIIB-Fc 단백질, 뿐만 아니라 이전에 평가되지 않은 다른 변이체 ActRIIB-Fc 단백질의 리간드 결합 동력학을 비교하였다. 테스트되는 ActRIIB-Fc 단백질은 항-Fc 항체를 이용하여 상기 시스템에 독립적으로 포집되어 있다. 그 다음 리간드들을 주입하고, 포집된 수용체 단백질 위로 흐르도록 하였다. 37℃ 에서 분석된 변이체 ActRIIB-Fc 단백질의 결과를 도 8에 나타낸다. 변형안된 ActRIIB 세포외 도메인을 포함하는 Fc-융합 단백질과 비교하여, 상기 변이체 단백질 ActRIIB(K55A)-Fc, ActRIIB(K55E)-Fc, ActRIIB(F82I)-Fc, 그리고 ActRIIB(F82K)-Fc는 GDF11보다는 BMP9에 대한 친화력이 훨씬 더 감소하였다. 25℃ 에서 분석된 추가적인 변이체 ActRIIB-Fc 단백질의 결과를 도 9에 나타낸다.
이 결과에서, K55A, K55E, F82I, 및 F82K은 액티빈 A 또는 GDF11에 대한 ActRIIB 친화력 감소보다 훨씬 더 크게 MP9에 대한 ActRIIB 결합 친화력을 감소시킨다는 것이 확인되었다. 따라서, 이들 변이체 ActRIIB-Fc 단백질은 특정 용도에서 변형안된 ActRIIB-Fc 단백질보다 더 유용할 것이며, 이때 이러한 선택적 길항작용이 유익하다. 실시예들은 BMP9의 길항 작용을 감소시키면서, 하나 또는 그 이상의 액티빈 A, 액티빈 B, GDF8 및 GDF11의 길항 작용을 유지하는 것이 바람직한 치료학적 예를 포함한다.
실시예 5. 마우스에서 변이체 ActRIIB-Fc 동종이량체의 활성
선택된 변이체 ActRIIB-G1Fc 동종이량체는 생체내 활성 프로파일의 차이를 조사하기 위하여 마우스에서 테스트되었다. 성체 야생형 C57BL/6 마우스 (n = 한 집단에 8마리 마우스)에게 ActRIIB(K55A)-Fc, ActRIIB(K55E)-Fc, ActRIIB(F82I)-Fc, ActRIIB(F82K)-Fc, 변형안된 ActRIIB-Fc, 또는 비이클을 4주간 주당 2회 10 mg/kg (i.p.)의 투여량으로 투여하였다. 연구 종점은 다음을 포함한다: 체중; CBC, 시작 및 연구 종료에 핵자기공명(NMR)에 의해 측정된 제지방량 및 지방총량.
비이클-처리된 대조군과 비교하여, 연구 전과정에 걸쳐 변형안된 ActRIIB-Fc로 마우스를 처리하면 체중 증가가 3배 이상되었다. ActRIIB (F82I)-Fc (25 %)에 의해 유발된 체중 증가는 변형되지 않은 ActRIIB-Fc (29 %)에 의해 유발된 것과 거의 동일했지만, 다른 변이체 ActRIIB-Fc 단백질은 12-17 % 범위의 체중 증가가 있었다 (도 10). NMR 분석 결과, ActRIIB (F82I)-Fc 처리가 아래 표와 같이 비이클 대비 제지방량(total lean mass)과 전체 지방량을 유의적으로 증가시켰다.
ActRIIB(F82I)-Fc는 ActRIIB-Fc에 의해 생성된 크기의 약 절반에 해당하는 제지방량과 지방량의 변화를 가져왔다. 제지방량 (전형적으로 마우스의 체중의 약 70%)이 지방량(전형적으로 체중의 약 10%)보다 훨씬 더 많기 때문에, 제지방 및 지방 조직에서 표준화된(백분율-기반) 변화는 이들 대응에서 절대 변화와는 상이하다는 점을 인지해야 한다. 비복근, 대퇴근, 및 흉근이 포함된 개별 골근육은 ActRIIB(F82I)-Fc를 이용한 치료 과정에서 비이클 대조와 비교하여 중량에서 모두 유의적으로 증가되었다.
평가된 상기 5개 ActRIIB-Fc 융합 단백질은 모두 비이클보다 적혈구 세포 매개변수 (RBC 카운트, 헤마토크릿, 그리고 헤모글로빈 농도)에 대하여 유의적으로 높은 값을 나타내었고, 그리고 이들 매개변수에 있어서 ActRIIB(F82I)-Fc 의 자극 효과는 변형안된 ActRIIB-Fc의 것들을 초과하였다 (도 11).
따라서, 변이체 ActRIIB 세포외 도메인을 포함하는 동종이량체 Fc-융합 단백질은 적혈구 세포 및 골 근육에서 유익한 동화 효과를 발휘할 수 있을 뿐만 아니라 변형안된 ActRIIB-Fc 동종이량체의 것과 유사하게 지방조직에는 이화작용을 나타낼 수 있다. 그러나, 변이체 ActRIIB-Fc 동종이량체는 변형안된 ActRIIB-Fc와 비교하여 BMP9에 감소된 친화력으로 결합하고, 따라서 혈관 신생과 같은 그 리간드에 의해 매개되는 과정의 억제는 감소될 것이다. 이 신규한 선택성은 예를 들면, 적혈구 세포 및 근육에는 자극 효과를, 그리고 변경된 혈관신생은 필요하지 않지만, 지방에는 저해 효과를 필요로 하는 환자의 치료에 유용할 것이다.
실시예 6. 비-인간 영장류에서 ActRIIB(F82I)-Fc 동종이량체의 활성
다음으로 출원인은 ActRIIB (F82I)-Fc 동종이량체가 비-인간 영장류의 RBC 매개 변수를 변경하는지 여부를 조사했다. 시노몰구스 원숭이(M. fascicularis)(n = 한 집단에 4마리 원숭이)를 29-일 연구에서 1일차, 15일차에 ActRIIB(F2I)-G1Fc, 변형안된 ActRIIB-G1Fc, 또는 변형안된 ActRIIA-G1Fc를 9 mg/kg (s.c.)으로 처리하였다. 도 12에 나타낸 바와 같이, ActRIIB (F82I)-Fc 처리는 ActRIIB-Fc (음성 대조군)에 비교하여, ActRIIA-Fc (양성 대조군)와 유사한 양으로 RBC 수치를 증가시켰다. 헤모글로빈 농도 및 헤마토크릿에 대해 유사한 결과가 얻어졌다 (데이터는 나타내지 않음). 이들 데이터에서 ActRIIB(F82I)-Fc 동종이량체는 변형안된 ActRIIB-Fc 동종이량체과는 상이한 생체내 활성을 보유한다는 것이 확인되었다.
실시예 7. ActRIIB-Fc:ActRIIB(L79E)-Fc 이종이량체의 생성
변형안된 인간 ActRIIB의 세포외 도메인과 위치 79에서 류신-글루탐산염 치환된 인간 ActRIIB를 포함하는 가용성 ActRIIB-Fc:ActRIIB(L79E)-Fc 이형 복합체의 생성을 고려하는데, 이들은 각각 세포외 도메인과 G1Fc 도메인 사이에 위치한 링커와 함께, G1Fc 도메인에 융합된다. 개별 구조체는 차례로 ActRIIB-Fc 융합 폴리펩티드와 ActRIIB(L79E)-Fc 융합 폴리펩티드로 지칭되며, 이들 각 서열은 하기에서 제시된다.
ActRIIB-Fc 또는 ActRIIB(L79E)-Fc 동형이량체 복합체와 반대로, ActRIIB-Fc:ActRIIB(L79E)-Fc 이형복합체의 형성을 촉진하는 방법은 비대칭 이형화학성 복합체 형성을 유도하기 위하여 Fc 도메인의 아미노산 서열에 변경을 도입시키는 것이다. Fc 도메인을 이용하여 비대칭 상호작용 짝을 만드는 많은 상이한 방법들이 본 명세서에서 설명된다.
한 가지 방법에서, 차례로 서열 번호: 43-45 및 46-48의 ActRIIB(L79E)-Fc 및 ActRIIB-Fc 폴리펩티드 서열에서 설명된 바와 같이, 하나의 Fc 도메인이 상호작용 면에 있는 양이온 아미노산을 도입시키도록 변경될 것이고, 한편 또다른 Fc 도메인은 이 상호작용 면에 음이온 아미노산을 도입시키도록 변경될 것이다. 상기 ActRIIB(L79E)-Fc 융합 폴리펩티드 및 ActRIIB-Fc 융합 폴리펩티드는 각각 PA 리더 (서열 번호: 8)를 이용한다.
상기 ActRIIB(L79E)-Fc 폴리펩티드 서열 (서열 번호: 43)는 하기에 나타낸다:
리더 (신호) 서열 및 링커는 선 밑줄로 표시하고,, 그리고 상기 L79E 치환은 이중밑줄로 표시된다. 가능한 동형이량체 복합체보다는 ActRIIB-Fc:ActRIIB(L79E)-Fc 이종이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (산성 아미노산이 리신으로 대체됨)이 ActRIIB 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 43의 아미노산 서열이 제공될 수 있다.
이 ActRIIB(L79E)-Fc 융합 단백질은 다음의 핵산 서열 (서열 번호: 44)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCTGGGCG TGGGGAGGCT GAGACACGGG
101
AGTGCATCTA CTACAACGCC AACTGGGAGC TGGAGCGCAC CAACCAGAGC
151
GGCCTGGAGC GCTGCGAAGG CGAGCAGGAC AAGCGGCTGC ACTGCTACGC
201
CTCCTGGCGC AACAGCTCTG GCACCATCGA GCTCGTGAAG AAGGGCTGCT
251
GGGAAGATGA CTTCAACTGC TACGATAGGC AGGAGTGTGT GGCCACTGAG
301
GAGAACCCCC AGGTGTACTT CTGCTGCTGT GAAGGCAACT TCTGCAACGA
351
GCGCTTCACT CATTTGCCAG AGGCTGGGGG CCCGGAAGTC ACGTACGAGC
401
CACCCCCGAC AGCCCCCACC GGTGGTGGAA CTCACACATG CCCACCGTGC
451
CCAGCACCTG AACTCCTGGG GGGACCGTCA GTCTTCCTCT TCCCCCCAAA
501
ACCCAAGGAC ACCCTCATGA TCTCCCGGAC CCCTGAGGTC ACATGCGTGG
551
TGGTGGACGT GAGCCACGAA GACCCTGAGG TCAAGTTCAA CTGGTACGTG
601
GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG AGGAGCAGTA
651
CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT
701
GGCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA
751
GCCCCCATCG AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC
801
ACAGGTGTAC ACCCTGCCCC CATCCCGGGA GGAGATGACC AAGAACCAGG
851
TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT ATCCCAGCGA CATCGCCGTG
901
GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACGACA CCACGCCTCC
951
CGTGCTGGAC TCCGACGGCT CCTTCTTCCT CTATAGCGAC CTCACCGTGG
1001
ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT
1051
GAGGCTCTGC ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCTCCGGG
1101
T (서열 번호: 44)
성숙 ActRIIB(L79E)-Fc 융합 폴리펩티드 (서열 번호: 45)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거된다.
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDKRLHC YASWRNSSGT
51
IELVKKGCWE DDFNCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPS
251
REEMTKNQVS LTCLVKGFYP SDIAVEWESN GQPENNYDTT PPVLDSDGSF
301
FLYSDLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PG
(서열 번호: 45)
ActRIIB-Fc 융합 폴리펩티드 (서열 번호: 46)의 상보적 형태는 다음과 같다:
리더 서열 및 링커 서열은 밑줄로 표시된다. 상기 서열 번호: 43 및 45의 ActRIIB(L79E)-Fc 융합 폴리펩티드와 함께 이형이량체 형성을 유도하기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (글루탐산염과 아스파르트산이 리신으로 대체됨)이 상기 ActRIIB-Fc 융합 폴리펩티드의 Fc 도메인으로 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 46의 아미노산 서열이 제공된다.
이 ActRIIB-Fc 융합 단백질은 핵산 (서열 번호: 47)에 의해 인코드된다:
1
ATGGATGCAA TGAAGAGAGG GCTCTGCTGT GTGCTGCTGC TGTGTGGAGC
51
AGTCTTCGTT TCGCCCGGCG CCTCTGGGCG TGGGGAGGCT GAGACACGGG
101
AGTGCATCTA CTACAACGCC AACTGGGAGC TGGAGCGCAC CAACCAGAGC
151
GGCCTGGAGC GCTGCGAAGG CGAGCAGGAC AAGCGGCTGC ACTGCTACGC
201
CTCCTGGCGC AACAGCTCTG GCACCATCGA GCTCGTGAAG AAGGGCTGCT
251
GGCTAGATGA CTTCAACTGC TACGATAGGC AGGAGTGTGT GGCCACTGAG
301
GAGAACCCCC AGGTGTACTT CTGCTGCTGT GAAGGCAACT TCTGCAACGA
351
GCGCTTCACT CATTTGCCAG AGGCTGGGGG CCCGGAAGTC ACGTACGAGC
401
CACCCCCGAC AGCCCCCACC GGTGGTGGAA CTCACACATG CCCACCGTGC
451
CCAGCACCTG AACTCCTGGG GGGACCGTCA GTCTTCCTCT TCCCCCCAAA
501
ACCCAAGGAC ACCCTCATGA TCTCCCGGAC CCCTGAGGTC ACATGCGTGG
551
TGGTGGACGT GAGCCACGAA GACCCTGAGG TCAAGTTCAA CTGGTACGTG
601
GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG AGGAGCAGTA
651
CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT
701
GGCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA
751
GCCCCCATCG AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC
801
ACAGGTGTAC ACCCTGCCCC CATCCCGGAA GGAGATGACC AAGAACCAGG
851
TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT ATCCCAGCGA CATCGCCGTG
901
GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACAAGA CCACGCCTCC
951
CGTGCTGAAG TCCGACGGCT CCTTCTTCCT CTATAGCAAG CTCACCGTGG
1001
ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT
1051
GAGGCTCTGC ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCTCCGGG
1101
TAAA (서열 번호: 47)
성숙 ActRIIB-Fc 융합 단백질 서열 (서열 번호: 48)은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDKRLHC YASWRNSSGT
51
IELVKKGCWL DDFNCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPS
251
RKEMTKNQVS LTCLVKGFYP SDIAVEWESN GQPENNYKTT PPVLKSDGSF
301
FLYSKLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PGK
(서열 번호: 48)
차례로 서열 번호: 45 및 서열 번호:48의 상기 ActRIIB(L79E)-Fc 및 ActRIIB-Fc 폴리펩티드는 CHO 세포계에서 공동-발현되고, 정제되어, ActRIIB-Fc:ActRIIB(L79E)-Fc을 포함하는 이형화학성 복합체가 생성될 수 있다.
비대칭 Fc 융합 단백질을 이용한 이형다량체 복합체들의 형성을 촉진시키는 또다른 방법에서, 차례로 서열 번호: 49-50 및 51-52의 ActRIIB(L79E)-Fc 및 ActRIIB-Fc 폴리펩티드 서열에서 설명된 바와 같이, 상보적 소수성 상호작용과 추가적인 분자간 이황화결합을 도입하도록 Fc 도메인이 변경된다. 상기 ActRIIB(L79E)-Fc 융합 폴리펩티드 및 ActRIIB-Fc 융합 폴리펩티드는 각각 PA 리더 (서열 번호: 8)를 이용한다.
상기 ActRIIB(L79E)-Fc 폴리펩티드 서열 (서열 번호: 49)는 하기에 나타낸다:
신호 서열과 링커 서열은 실선 밑줄로 표시하고, L79E 치환은 이중밑줄로 표시된다. 가능한 동형이량체 복합체보다는 상기 ActRIIB-Fc:ActRIIB(L79E)-Fc 이종이량체의 형성을 촉진시키기 위하여, 상기 이중 밑줄로 표시된 바와 같이, 2개의 아미노산 치환 (세린이 시스테인으로 그리고 트레오닌이 트립토판으로 대체됨)이 상기 융합 단백질의 Fc 도메인에 도입될 수 있다. 임의선택적으로 C-말단에 리신이 추가된, 서열 번호: 49의 아미노산 서열이 제공될 수 있다.
성숙 ActRIIB(L79E)-Fc 융합 폴리펩티드 (서열 번호: 50)는 다음과 같다:
1
GRGEAETREC IYYNANWELE RTNQSGLERC EGEQDKRLHC YASWRNSSGT
51
IELVKKGCWE DDFNCYDRQE CVATEENPQV YFCCCEGNFC NERFTHLPEA
101
GGPEVTYEPP PTAPTGGGTH TCPPCPAPEL LGGPSVFLFP PKPKDTLMIS
151
RTPEVTCVVV DVSHEDPEVK FNWYVDGVEV HNAKTKPREE QYNSTYRVVS
201
VLTVLHQDWL NGKEYKCKVS NKALPAPIEK TISKAKGQPR EPQVYTLPPC
251
REEMTKNQVS LWCLVKGFYP SDIAVEWESN GQPENNYKTT PPVLDSDGSF
301
FLYSKLTVDK SRWQQGNVFS CSVMHEALHN HYTQKSLSLS PG
(서열 번호: 50)
상보적 형태의 ActRIIB-Fc 융합 폴리펩티드 (서열 번호: 51)는 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
리더 서열 및 링커는 밑줄로 표시된다. 상기 서열 번호: 49-50의 상기 ActRIIB(L79E)-Fc 융합 폴리펩티드와 함께 이형이량체 형성을 유도하기 위하여, 4개의 아미노산 치환 (티로신은 시스테인으로, 트레오닌은 세린으로, 류신은 알라닌으로, 그리고 티로신은 발린으로 대체)이 상기 이중 밑줄로 표시된 바와 같이, 상기 ActRIIB-Fc 융합 폴리펩티드의 Fc 도메인 안으로 도입될 수 있다. 임의선택적으로 C-말단으로부터 리신이 제거된, 서열 번호: 51의 아미노산 서열이 제공된다.
성숙 ActRIIB-Fc 융합 단백질 서열은 다음과 같고, 임의선택적으로 C-말단으로부터 리신이 제거될 수 있다.
차례로 서열 번호: 50 및 서열 번호:52의 상기 ActRIIB(L79E)-Fc 및 ActRIIB-Fc 폴리펩티드는 CHO 세포계에서 공동-발현되고, 정제되어, ActRIIB-Fc:ActRIIB(L79E)-Fc을 포함하는 이형화학성 복합체가 생성될 수 있다.
다양한 ActRIIB-Fc:ActRIIB(L79E)-Fc 복합체들의 정제는 다음중 3개 또는 그 이상이 임의의 순서로 포함된 일련의 컬럼 크로마토그래피에 의해 실행될 수 있다: 단백질 A 크로마토그래피, Q 세파로즈 크로마토그래피, 페닐세파로즈 크로마토그래피, 크기 압출 크로마토그래피, 양이온 교환 크로마토 그래피, 다중형태 크로마토 그래피 (예를 들어, 정전기 및 소수성 리간드 모두를 함유하는 수지로), 및 에피토프-기반 친화성 크로마토 그래피 (예를 들어, 항체 또는 ActRIIB의 에피토프에 대항하여 지향된 기능적으로 동등한 리간드)를 포함한다. 상기 정제는 바이러스 여과 및 완충액 교환으로 완성될 수 있다.
실시예 8. ActRIIB-Fc:ActRIIB(L79E)-Fc 이형체의 리간드 결합 프로파일
BiacoreTM-기반 결합 분석을 이용하여 ActRIIB-Fc:ActRIIB(L79E)-Fc 이종이량체의 리간드 결합 역동학과 변형안된 ActRIIB-Fc 동종이량체의 것을 비교하였다. 융합 단백질은 항-Fc 항체를 이용하여 상기 시스템에 독립적으로 포집되어 있다. 이어서 리간드를 주입하고 37℃에서 포획 수용체 단백질 위로 흘려 보냈다. 결과는 아래 표에 요약되어 있고, 효과적인 리간드 트랩의 리간드 해리속도(kd)는 회색 음영으로 나타낸다.
이 실시예에서, 2 개의 ActRIIB 폴리펩티드 쇄 중 하나의 단일 아미노산 치환은 비-변형된 ActRIIB-Fc 동종이량체에 비해 Fc-융합 단백질의 리간드 결합 선택성을 변경시켰다. ActRIIB-Fc 동종이량체와 비교하였을 때, 상기 ActRIIB(L79E)-Fc 이종이량체는 대개 액티빈 B, GDF8, GDF11, 그리고 BMP6에 고-친화성 결합을 유지했지만, 액티빈 A 및 BMP10에 대한 약 10 배의 빠른 해리율 및 BMP9에 대한 결합 강도의 더 큰 감소를 나타냈다. 따라서, 변이체 ActRIIB-Fc 이형체는 특정 용도에서 변형안된 ActRIIB-Fc 동종이량체보다 더 유용할 것이며, 이때 이러한 선택적 길항작용이 유익하다. 실시예들은 액티빈 A, BMP9, 또는 BMP10의 길항 작용을 감소시키면서, 하나 또는 그 이상의 액티빈 B, GDF8, GDF11, 그리고 BMP6의 길항 작용을 유지하는 것이 바람직한 치료학적 예를 포함한다.
참고자료에 통합
여기에 언급된 모든 간행물 및 특허는 각각의 개별 간행물 또는 특허가 구체적으로 개별적으로 참조로 포함되도록 지시된 것처럼 본원에 참고로 인용된다. 주제의 특정 실시 예들이 논의되었지만, 상기 명세서는 예시적이고, 이에 한정되지 않는다. 본 명세서 및 청구 범위를 검토하면 많은 변형이 당업자에게 명백해질 것이다. 본 발명의 전체 범위는 그 균등 물의 전체 범위 및 명세서와 함께 청구항을 참조하여 그러한 변형과 함께 결정되어야 한다.
ATGGGTCGGGGGCTGCTCAGGGGCCTGTGGCCGCTGCACATCGTCCTGTGGACGCGTATCGCCAGC ACGATCCCACCGCACGTTCAGAAGTCGGTTAATAACGACATGATAGTCACTGACAACAACGGTGCAGTCAAGTTTCCACAACTGTGTAAATTTTGTGATGTGAGATTTTCCACCTGTGACAACCAGAAATCCTGCATGAGCAACTGCAGCATCACCTCCATCTGTGAGAAGCCACAGGAAGTCTGTGTGGCTGTATGGAGAAAGAATGACGAGAACATAACACTAGAGACAGTTTGCCATGACCCCAAGCTCCCCTACCATGACTTTATTCTGGAAGATGCTGCTTCTCCAAAGTGCATTATGAAGGAAAAAAAAAAGCCTGGTGAGACTTTCTTCATGTGTTCCTGTAGCTCTGATGAGTGCAATGACAACATCATCTTCTCAGAAGAATATAACACCAGCAATCCTGACTTGTTGCTAGTCATATTTCAAGTGACAGGCATCAGCCTCCTGCCACCACTGGGAGTTGCCATATCTGTCATCATCATCTTCTACTGCTACCGCGTTAACCGGCAGCAGAAGCTGAGTTCAACCTGGGAAACCGGCAAGACGCGGAAGCTCATGGAGTTCAGCGAGCACTGTGCCATCATCCTGGAAGATGACCGCTCTGACATCAGCTCCACGTGTGCCAACAACATCAACCACAACACAGAGCTGCTGCCCATTGAGCTGGACACCCTGGTGGGGAAAGGTCGCTTTGCTGAGGTCTATAAGGCCAAGCTGAAGCAGAACACTTCAGAGCAGTTTGAGACAGTGGCAGTCAAGATCTTTCCCTATGAGGAGTATGCCTCTTGGAAGACAGAGAAGGACATCTTCTCAGACATCAATCTGAAGCATGAGAACATACTCCAGTTCCTGACGGCTGAGGAGCGGAAGACGGAGTTGGGGAAACAATACTGGCTGATCACCGCCTTCCACGCCAAGGGCAACCTACAGGAGTACCTGACGCGGCATGTCATCAGCTGGGAGGACCTGCGCAAGCTGGGCAGCTCCCTCGCCCGGGGGATTGCTCACCTCCACAGTGATCACACTCCATGTGGGAGGCCCAAGATGCCCATCGTGCACAGGGACCTCAAGAGCTCCAATATCCTCGTGAAGAACGACCTAACCTGCTGCCTGTGTGACTTTGGGCTTTCCCTGCGTCTGGACCCTACTCTGTCTGTGGATGACCTGGCTAACAGTGGGCAGGTGGGAACTGCAAGATACATGGCTCCAGAAGTCCTAGAATCCAGGATGAATTTGGAGAATGTTGAGTCCTTCAAGCAGACCGATGTCTACTCCATGGCTCTGGTGCTCTGGGAAATGACATCTCGCTGTAATGCAGTGGGAGAAGTAAAAGATTATGAGCCTCCATTTGGTTCCAAGGTGCGGGAGCACCCCTGTGTCGAAAGCATGAAGGACAACGTGTTGAGAGATCGAGGGCGACCAGAAATTCCCAGCTTCTGGCTCAACCACCAGGGCATCCAGATGGTGTGTGAGACGTTGACTGAGTGCTGGGACCACGACCCAGAGGCCCGTCTCACAGCCCAGTGTGTGGCAGAACGCTTCAGTGAGCTGGAGCATCTGGACAGGCTCTCGGGGAGGAGCTGCTCGGAGGAGAAGATTCCTGAAGACGGCTCCCTAAACACTACCAAA (서열 번호: 196)
ACGATCCCACCGCACGTTCAGAAGTCGGTTAATAACGACATGATAGTCACTGACAACAACGGTGCAGTCAAGTTTCCACAACTGTGTAAATTTTGTGATGTGAGATTTTCCACCTGTGACAACCAGAAATCCTGCATGAGCAACTGCAGCATCACCTCCATCTGTGAGAAGCCACAGGAAGTCTGTGTGGCTGTATGGAGAAAGAATGACGAGAACATAACACTAGAGACAGTTTGCCATGACCCCAAGCTCCCCTACCATGACTTTATTCTGGAAGATGCTGCTTCTCCAAAGTGCATTATGAAGGAAAAAAAAAAGCCTGGTGAGACTTTCTTCATGTGTTCCTGTAGCTCTGATGAGTGCAATGACAACATCATCTTCTCAGAAGAATATAACACCAGCAATCCTGACTTGTTGCTAGTCATATTTCAA (서열 번호: 197)
ATGGGTCGGGGGCTGCTCAGGGGCCTGTGGCCGCTGCACATCGTCCTGTGGACGCGTATCGCCAGC ACGATCCCACCGCACGTTCAGAAGTCGGATGTGGAAATGGAGGCCCAGAAAGATGAAATCATCTGCCCCAGCTGTAATAGGACTGCCCATCCACTGAGACATATTAATAACGACATGATAGTCACTGACAACAACGGTGCAGTCAAGTTTCCACAACTGTGTAAATTTTGTGATGTGAGATTTTCCACCTGTGACAACCAGAAATCCTGCATGAGCAACTGCAGCATCACCTCCATCTGTGAGAAGCCACAGGAAGTCTGTGTGGCTGTATGGAGAAAGAATGACGAGAACATAACACTAGAGACAGTTTGCCATGACCCCAAGCTCCCCTACCATGACTTTATTCTGGAAGATGCTGCTTCTCCAAAGTGCATTATGAAGGAAAAAAAAAAGCCTGGTGAGACTTTCTTCATGTGTTCCTGTAGCTCTGATGAGTGCAATGACAACATCATCTTCTCAGAAGAATATAACACCAGCAATCCTGACTTGTTGCTAGTCATATTTCAAGTGACAGGCATCAGCCTCCTGCCACCACTGGGAGTTGCCATATCTGTCATCATCATCTTCTACTGCTACCGCGTTAACCGGCAGCAGAAGCTGAGTTCAACCTGGGAAACCGGCAAGACGCGGAAGCTCATGGAGTTCAGCGAGCACTGTGCCATCATCCTGGAAGATGACCGCTCTGACATCAGCTCCACGTGTGCCAACAACATCAACCACAACACAGAGCTGCTGCCCATTGAGCTGGACACCCTGGTGGGGAAAGGTCGCTTTGCTGAGGTCTATAAGGCCAAGCTGAAGCAGAACACTTCAGAGCAGTTTGAGACAGTGGCAGTCAAGATCTTTCCCTATGAGGAGTATGCCTCTTGGAAGACAGAGAAGGACATCTTCTCAGACATCAATCTGAAGCATGAGAACATACTCCAGTTCCTGACGGCTGAGGAGCGGAAGACGGAGTTGGGGAAACAATACTGGCTGATCACCGCCTTCCACGCCAAGGGCAACCTACAGGAGTACCTGACGCGGCATGTCATCAGCTGGGAGGACCTGCGCAAGCTGGGCAGCTCCCTCGCCCGGGGGATTGCTCACCTCCACAGTGATCACACTCCATGTGGGAGGCCCAAGATGCCCATCGTGCACAGGGACCTCAAGAGCTCCAATATCCTCGTGAAGAACGACCTAACCTGCTGCCTGTGTGACTTTGGGCTTTCCCTGCGTCTGGACCCTACTCTGTCTGTGGATGACCTGGCTAACAGTGGGCAGGTGGGAACTGCAAGATACATGGCTCCAGAAGTCCTAGAATCCAGGATGAATTTGGAGAATGTTGAGTCCTTCAAGCAGACCGATGTCTACTCCATGGCTCTGGTGCTCTGGGAAATGACATCTCGCTGTAATGCAGTGGGAGAAGTAAAAGATTATGAGCCTCCATTTGGTTCCAAGGTGCGGGAGCACCCCTGTGTCGAAAGCATGAAGGACAACGTGTTGAGAGATCGAGGGCGACCAGAAATTCCCAGCTTCTGGCTCAACCACCAGGGCATCCAGATGGTGTGTGAGACGTTGACTGAGTGCTGGGACCACGACCCAGAGGCCCGTCTCACAGCCCAGTGTGTGGCAGAACGCTTCAGTGAGCTGGAGCATCTGGACAGGCTCTCGGGGAGGAGCTGCTCGGAGGAGAAGATTCCTGAAGACGGCTCCCTAAACACTACCAAA (서열 번호: 202)
ACGATCCCACCGCACGTTCAGAAGTCGGATGTGGAAATGGAGGCCCAGAAAGATGAAATCATCTGCCCCAGCTGTAATAGGACTGCCCATCCACTGAGACATATTAATAACGACATGATAGTCACTGACAACAACGGTGCAGTCAAGTTTCCACAACTGTGTAAATTTTGTGATGTGAGATTTTCCACCTGTGACAACCAGAAATCCTGCATGAGCAACTGCAGCATCACCTCCATCTGTGAGAAGCCACAGGAAGTCTGTGTGGCTGTATGGAGAAAGAATGACGAGAACATAACACTAGAGACAGTTTGCCATGACCCCAAGCTCCCCTACCATGACTTTATTCTGGAAGATGCTGCTTCTCCAAAGTGCATTATGAAGGAAAAAAAAAAGCCTGGTGAGACTTTCTTCATGTGTTCCTGTAGCTCTGATGAGTGCAATGACAACATCATCTTCTCAGAAGAATATAACACCAGCAATCCTGACTTGTTGCTAGTCATATTTCAA (서열 번호: 203).
ATGACTTCCTCGCTGCAGCGGCCCTGGCGGGTGCCCTGGCTACCATGGACCATCCTGCTGGTCAGCACTGCGGCTGCTTCGCAGAATCAAGAACGGCTATGTGCGTTTAAAGATCCGTATCAGCAAGACCTTGGGATAGGTGAGAGTAGAATCTCTCATGAAAATGGGACAATATTATGCTCGAAAGGTAGCACCTGCTATGGCCTTTGGGAGAAATCAAAAGGGGACATAAATCTTGTAAAACAAGGATGTTGGTCTCACATTGGAGATCCCCAAGAGTGTCACTATGAAGAATGTGTAGTAACTACCACTCCTCCCTCAATTCAGAATGGAACATACCGTTTCTGCTGTTGTAGCACAGATTTATGTAATGTCAACTTTACTGAGAATTTTCCACCTCCTGACACAACACCACTCAGTCCACCTCATTCATTTAACCGAGATGAGACAATAATCATTGCTTTGGCATCAGTCTCTGTATTAGCTGTTTTGATAGTTGCCTTATGCTTTGGATACAGAATGTTGACAGGAGACCGTAAACAAGGTCTTCACAGTATGAACATGATGGAGGCAGCAGCATCCGAACCCTCTCTTGATCTAGATAATCTGAAACTGTTGGAGCTGATTGGCCGAGGTCGATATGGAGCAGTATATAAAGGCTCCTTGGATGAGCGTCCAGTTGCTGTAAAAGTGTTTTCCTTTGCAAACCGTCAGAATTTTATCAACGAAAAGAACATTTACAGAGTGCCTTTGATGGAACATGACAACATTGCCCGCTTTATAGTTGGAGATGAGAGAGTCACTGCAGATGGACGCATGGAATATTTGCTTGTGATGGAGTACTATCCCAATGGATCTTTATGCAAGTATTTAAGTCTCCACACAAGTGACTGGGTAAGCTCTTGCCGTCTTGCTCATTCTGTTACTAGAGGACTGGCTTATCTTCACACAGAATTACCACGAGGAGATCATTATAAACCTGCAATTTCCCATCGAGATTTAAACAGCAGAAATGTCCTAGTGAAAAATGATGGAACCTGTGTTATTAGTGACTTTGGACTGTCCATGAGGCTGACTGGAAATAGACTGGTGCGCCCAGGGGAGGAAGATAATGCAGCCATAAGCGAGGTTGGCACTATCAGATATATGGCACCAGAAGTGCTAGAAGGAGCTGTGAACTTGAGGGACTGTGAATCAGCTTTGAAACAAGTAGACATGTATGCTCTTGGACTAATCTATTGGGAGATATTTATGAGATGTACAGACCTCTTCCCAGGGGAATCCGTACCAGAGTACCAGATGGCTTTTCAGACAGAGGTTGGAAACCATCCCACTTTTGAGGATATGCAGGTTCTCGTGTCTAGGGAAAAACAGAGACCCAAGTTCCCAGAAGCCTGGAAAGAAAATAGCCTGGCAGTGAGGTCACTCAAGGAGACAATCGAAGACTGTTGGGACCAGGATGCAGAGGCTCGGCTTACTGCACAGTGTGCTGAGGAAAGGATGGCTGAACTTATGATGATTTGGGAAAGAAACAAATCTGTGAGCCCAACAGTCAATCCAATGTCTACTGCTATGCAGAATGAACGCAACCTGTCACATAATAGGCGTGTGCCAAAAATTGGTCCTTATCCAGATTATTCTTCCTCCTCATACATTGAAGACTCTATCCATCATACTGACAGCATCGTGAAGAATATTTCCTCTGAGCATTCTATGTCCAGCACACCTTTGACTATAGGGGAAAAAAACCGAAATTCAATTAACTATGAACGACAGCAAGCACAAGCTCGAATCCCCAGCCCTGAAACAAGTGTCACCAGCCTCTCCACCAACACAACAACCACAAACACCACAGGACTCACGCCAAGTACTGGCATGACTACTATATCTGAGATGCCATACCCAGATGAAACAAATCTGCATACCACAAATGTTGCACAGTCAATTGGGCCAACCCCTGTCTGCTTACAGCTGACAGAAGAAGACTTGGAAACCAACAAGCTAGACCCAAAAGAAGTTGATAAGAACCTCAAGGAAAGCTCTGATGAGAATCTCATGGAGCACTCTCTTAAACAGTTCAGTGGCCCAGACCCACTGAGCAGTACTAGTTCTAGCTTGCTTTACCCACTCATAAAACTTGCAGTAGAAGCAACTGGACAGCAGGACTTCACACAGACTGCAAATGGCCAAGCATGTTTGATTCCTGATGTTCTGCCTACTCAGATCTATCCTCTCCCCAAGCAGCAGAACCTTCCCAAGAGACCTACTAGTTTGCCTTTGAACACCAAAAATTCAACAAAAGAGCCCCGGCTAAAATTTGGCAGCAAGCACAAATCAAACTTGAAACAAGTCGAAACTGGAGTTGCCAAGATGAATACAATCAATGCAGCAGAACCTCATGTGGTGACAGTCACCATGAATGGTGTGGCAGGTAGAAACCACAGTGTTAACTCCCATGCTGCCACAACCCAATATGCCAATGGGACAGTACTATCTGGCCAAACAACCAACATAGTGACACATAGGGCCCAAGAAATGTTGCAGAATCAGTTTATTGGTGAGGACACCCGGCTGAATATTAATTCCAGTCCTGATGAGCATGAGCCTTTACTGAGACGAGAGCAACAAGCTGGCCATGATGAAGGTGTTCTGGATCGTCTTGTGGACAGGAGGGAACGGCCACTAGAAGGTGGCCGAACTAATTCCAATAACAACAACAGCAATCCATGTTCAGAACAAGATGTTCTTGCACAGGGTGTTCCAAGCACAGCAGCAGATCCTGGGCCATCAAAGCCCAGAAGAGCACAGAGGCCTAATTCTCTGGATCTTTCAGCCACAAATGTCCTGGATGGCAGCAGTATACAGATAGGTGAGTCAACACAAGATGGCAAATCAGGATCAGGTGAAAAGATCAAGAAACGTGTGAAAACTCCCTATTCTCTTAAGCGGTGGCGCCCCTCCACCTGGGTCATCTCCACTGAATCGCTGGACTGTGAAGTCAACAATAATGGCAGTAACAGGGCAGTTCATTCCAAATCCAGCACTGCTGTTTACCTTGCAGAAGGAGGCACTGCTACAACCATGGTGTCTAAAGATATAGGAATGAACTGTCTG (서열 번호: 205)
TCGCAGAATCAAGAACGGCTATGTGCGTTTAAAGATCCGTATCAGCAAGACCTTGGGATAGGTGAGAGTAGAATCTCTCATGAAAATGGGACAATATTATGCTCGAAAGGTAGCACCTGCTATGGCCTTTGGGAGAAATCAAAAGGGGACATAAATCTTGTAAAACAAGGATGTTGGTCTCACATTGGAGATCCCCAAGAGTGTCACTATGAAGAATGTGTAGTAACTACCACTCCTCCCTCAATTCAGAATGGAACATACCGTTTCTGCTGTTGTAGCACAGATTTATGTAATGTCAACTTTACTGAGAATTTTCCACCTCCTGACACAACACCACTCAGTCCACCTCATTCATTTAACCGAGATGAGACA (서열 번호: 206)
ATGACTTCCTCGCTGCAGCGGCCCTGGCGGGTGCCCTGGCTACCATGGACCATCCTGCTGGTCAGCACTGCGGCTGCTTCGCAGAATCAAGAACGGCTATGTGCGTTTAAAGATCCGTATCAGCAAGACCTTGGGATAGGTGAGAGTAGAATCTCTCATGAAAATGGGACAATATTATGCTCGAAAGGTAGCACCTGCTATGGCCTTTGGGAGAAATCAAAAGGGGACATAAATCTTGTAAAACAAGGATGTTGGTCTCACATTGGAGATCCCCAAGAGTGTCACTATGAAGAATGTGTAGTAACTACCACTCCTCCCTCAATTCAGAATGGAACATACCGTTTCTGCTGTTGTAGCACAGATTTATGTAATGTCAACTTTACTGAGAATTTTCCACCTCCTGACACAACACCACTCAGTCCACCTCATTCATTTAACCGAGATGAGACAATAATCATTGCTTTGGCATCAGTCTCTGTATTAGCTGTTTTGATAGTTGCCTTATGCTTTGGATACAGAATGTTGACAGGAGACCGTAAACAAGGTCTTCACAGTATGAACATGATGGAGGCAGCAGCATCCGAACCCTCTCTTGATCTAGATAATCTGAAACTGTTGGAGCTGATTGGCCGAGGTCGATATGGAGCAGTATATAAAGGCTCCTTGGATGAGCGTCCAGTTGCTGTAAAAGTGTTTTCCTTTGCAAACCGTCAGAATTTTATCAACGAAAAGAACATTTACAGAGTGCCTTTGATGGAACATGACAACATTGCCCGCTTTATAGTTGGAGATGAGAGAGTCACTGCAGATGGACGCATGGAATATTTGCTTGTGATGGAGTACTATCCCAATGGATCTTTATGCAAGTATTTAAGTCTCCACACAAGTGACTGGGTAAGCTCTTGCCGTCTTGCTCATTCTGTTACTAGAGGACTGGCTTATCTTCACACAGAATTACCACGAGGAGATCATTATAAACCTGCAATTTCCCATCGAGATTTAAACAGCAGAAATGTCCTAGTGAAAAATGATGGAACCTGTGTTATTAGTGACTTTGGACTGTCCATGAGGCTGACTGGAAATAGACTGGTGCGCCCAGGGGAGGAAGATAATGCAGCCATAAGCGAGGTTGGCACTATCAGATATATGGCACCAGAAGTGCTAGAAGGAGCTGTGAACTTGAGGGACTGTGAATCAGCTTTGAAACAAGTAGACATGTATGCTCTTGGACTAATCTATTGGGAGATATTTATGAGATGTACAGACCTCTTCCCAGGGGAATCCGTACCAGAGTACCAGATGGCTTTTCAGACAGAGGTTGGAAACCATCCCACTTTTGAGGATATGCAGGTTCTCGTGTCTAGGGAAAAACAGAGACCCAAGTTCCCAGAAGCCTGGAAAGAAAATAGCCTGGCAGTGAGGTCACTCAAGGAGACAATCGAAGACTGTTGGGACCAGGATGCAGAGGCTCGGCTTACTGCACAGTGTGCTGAGGAAAGGATGGCTGAACTTATGATGATTTGGGAAAGAAACAAATCTGTGAGCCCAACAGTCAATCCAATGTCTACTGCTATGCAGAATGAACGTAGG (서열 번호: 207)
TCGCAGAATCAAGAACGGCTATGTGCGTTTAAAGATCCGTATCAGCAAGACCTTGGGATAGGTGAGAGTAGAATCTCTCATGAAAATGGGACAATATTATGCTCGAAAGGTAGCACCTGCTATGGCCTTTGGGAGAAATCAAAAGGGGACATAAATCTTGTAAAACAAGGATGTTGGTCTCACATTGGAGATCCCCAAGAGTGTCACTATGAAGAATGTGTAGTAACTACCACTCCTCCCTCAATTCAGAATGGAACATACCGTTTCTGCTGTTGTAGCACAGATTTATGTAATGTCAACTTTACTGAGAATTTTCCACCTCCTGACACAACACCACTCAGTCCACCTCATTCATTTAACCGAGATGAGACA (서열 번호: 208)
ATGCTAGGGTCTTTGGGGCTTTGGGCATTACTTCCCACAGCTGTGGAAGCA CCCCCAAACAGGCGAACCTGTGTGTTCTTTGAGGCCCCTGGAGTGCGGGGAAGCACAAAGACACTGGGAGAGCTGCTAGATACAGGCACAGAGCTCCCCAGAGCTATCCGCTGCCTCTACAGCCGCTGCTGCTTTGGGATCTGGAACCTGACCCAAGACCGGGCACAGGTGGAAATGCAAGGATGCCGAGACAGTGATGAGCCAGGCTGTGAGTCCCTCCACTGTGACCCAAGTCCCCGAGCCCACCCCAGCCCTGGCTCCACTCTCTTCACCTGCTCCTGTGGCACTGACTTCTGCAATGCCAATTACAGCCATCTGCCTCCTCCAGGGAGCCCTGGGACTCCTGGCTCCCAGGGTCCCCAGGCTGCCCCAGGTGAGTCCATCTGGATGGCACTGGTGCTGCTGGGGCTGTTCCTCCTCCTCCTGCTGCTGCTGGGCAGCATCATCTTGGCCCTGCTACAGCGAAAGAACTACAGAGTGCGAGGTGAGCCAGTGCCAGAGCCAAGGCCAGACTCAGGCAGGGACTGGAGTGTGGAGCTGCAGGAGCTGCCTGAGCTGTGTTTCTCCCAGGTAATCCGGGAAGGAGGTCATGCAGTGGTTTGGGCCGGGCAGCTGCAAGGAAAACTGGTTGCCATCAAGGCCTTCCCACCGAGGTCTGTGGCTCAGTTCCAAGCTGAGAGAGCATTGTACGAACTTCCAGGCCTACAGCACGACCACATTGTCCGATTTATCACTGCCAGCCGGGGGGGTCCTGGCCGCCTGCTCTCTGGGCCCCTGCTGGTACTGGAACTGCATCCCAAGGGCTCCCTGTGCCACTACTTGACCCAGTACACCAGTGACTGGGGAAGTTCCCTGCGGATGGCACTGTCCCTGGCCCAGGGCCTGGCATTTCTCCATGAGGAGCGCTGGCAGAATGGCCAATATAAACCAGGTATTGCCCACCGAGATCTGAGCAGCCAGAATGTGCTCATTCGGGAAGATGGATCGTGTGCCATTGGAGACCTGGGCCTTGCCTTGGTGCTCCCTGGCCTCACTCAGCCCCCTGCCTGGACCCCTACTCAACCACAAGGCCCAGCTGCCATCATGGAAGCTGGCACCCAGAGGTACATGGCACCAGAGCTCTTGGACAAGACTCTGGACCTACAGGATTGGGGCATGGCCCTCCGACGAGCTGATATTTACTCTTTGGCTCTGCTCCTGTGGGAGATACTGAGCCGCTGCCCAGATTTGAGGCCTGACAGCAGTCCACCACCCTTCCAACTGGCCTATGAGGCAGAACTGGGCAATACCCCTACCTCTGATGAGCTATGGGCCTTGGCAGTGCAGGAGAGGAGGCGTCCCTACATCCCATCCACCTGGCGCTGCTTTGCCACAGACCCTGATGGGCTGAGGGAGCTCCTAGAAGACTGTTGGGATGCAGACCCAGAAGCACGGCTGACAGCTGAGTGTGTACAGCAGCGCCTGGCTGCCTTGGCCCATCCTCAAGAGAGCCACCCCTTTCCAGAGAGCTGTCCACGTGGCTGCCCACCTCTCTGCCCAGAAGACTGTACTTCAATTCCTGCCCCTACCATCCTCCCCTGTAGGCCTCAGCGGAGTGCCTGCCACTTCAGCGTTCAGCAAGGCCCTTGTTCCAGGAATCCTCAGCCTGCCTGTACCCTTTCTCCTGTG (서열 번호: 209)
CCCCCAAACAGGCGAACCTGTGTGTTCTTTGAGGCCCCTGGAGTGCGGGGAAGCACAAAGACACTGGGAGAGCTGCTAGATACAGGCACAGAGCTCCCCAGAGCTATCCGCTGCCTCTACAGCCGCTGCTGCTTTGGGATCTGGAACCTGACCCAAGACCGGGCACAGGTGGAAATGCAAGGATGCCGAGACAGTGATGAGCCAGGCTGTGAGTCCCTCCACTGTGACCCAAGTCCCCGAGCCCACCCCAGCCCTGGCTCCACTCTCTTCACCTGCTCCTGTGGCACTGACTTCTGCAATGCCAATTACAGCCATCTGCCTCCTCCAGGGAGCCCTGGGACTCCTGGCTCCCAGGGTCCCCAGGCTGCCCCAGGTGAGTCCATCTGGATGGCACTG (서열 번호: 210)
ATGCTAGGGTCTTTGGGGCTTTGGGCATTACTTCCCACAGCTGTGGAAGCACCCCCAAACAGGCGAACCTGTGTGTTCTTTGAGGCCCCTGGAGTGCGGGGAAGCACAAAGACACTGGGAGAGCTGCTAGATACAGGCACAGAGCTCCCCAGAGCTATCCGCTGCCTCTACAGCCGCTGCTGCTTTGGGATCTGGAACCTGACCCAAGACCGGGCACAGGTGGAAATGCAAGGATGCCGAGACAGTGATGAGCCAGGCTGTGAGTCCCTCCACTGTGACCCAAGTCCCCGAGCCCACCCCAGCCCTGGCTCCACTCTCTTCACCTGCTCCTGTGGCACTGACTTCTGCAATGCCAATTACAGCCATCTGCCTCCTCCAGGGAGCCCTGGGACTCCTGGCTCCCAGGGTCCCCAGGCTGCCCCAGGTGAGTCCATCTGGATGGCACTGGTGCTGCTGGGGCTGTTCCTCCTCCTCCTGCTGCTGCTGGGCAGCATCATCTTGGCCCTGCTACAGCGAAAGAACTACAGAGTGCGAGGTGAGCCAGTGCCAGAGCCAAGGCCAGACTCAGGCAGGGACTGGAGTGTGGAGCTGCAGGAGCTGCCTGAGCTGTGTTTCTCCCAGGTAATCCGGGAAGGAGGTCATGCAGTGGTTTGGGCCGGGCAGCTGCAAGGAAAACTGGTTGCCATCAAGGCCTTCCCACCGAGGTCTGTGGCTCAGTTCCAAGCTGAGAGAGCATTGTACGAACTTCCAGGCCTACAGCACGACCACATTGTCCGATTTATCACTGCCAGCCGGGGGGGTCCTGGCCGCCTGCTCTCTGGGCCCCTGCTGGTACTGGAACTGCATCCCAAGGGCTCCCTGTGCCACTACTTGACCCAGTACACCAGTGACTGGGGAAGTTCCCTGCGGATGGCACTGTCCCTGGCCCAGGGCCTGGCATTTCTCCATGAGGAGCGCTGGCAGAATGGCCAATATAAACCAGGTATTGCCCACCGAGATCTGAGCAGCCAGAATGTGCTCATTCGGGAAGATGGATCGTGTGCCATTGGAGACCTGGGCCTTGCCTTGGTGCTCCCTGGCCTCACTCAGCCCCCTGCCTGGACCCCTACTCAACCACAAGGCCCAGCTGCCATCATGGAAGCTGGCACCCAGAGGTACATGGCACCAGAGCTCTTGGACAAGACTCTGGACCTACAGGATTGGGGCATGGCCCTCCGACGAGCTGATATTTACTCTTTGGCTCTGCTCCTGTGGGAGATACTGAGCCGCTGCCCAGATTTGAGGCCTGCAGTCCACCACCCTTCCAACTGGCCTATGAGGCAGAACTGGGCAATACCCCTACCTCTGATGAGCTATGGGCCTTGGCAGTGCAGGAGAGGAGGCGTCCCTACATCCCATCCACCTGGCGCTGCTTTGCCACAGACCCTGATGGGC (서열 번호: 211)
CCCCCAAACAGGCGAACCTGTGTGTTCTTTGAGGCCCCTGGAGTGCGGGGAAGCACAAAGACACTGGGAGAGCTGCTAGATACAGGCACAGAGCTCCCCAGAGCTATCCGCTGCCTCTACAGCCGCTGCTGCTTTGGGATCTGGAACCTGACCCAAGACCGGGCACAGGTGGAAATGCAAGGATGCCGAGACAGTGATGAGCCAGGCTGTGAGTCCCTCCACTGTGACCCAAGTCCCCGAGCCCACCCCAGCCCTGGCTCCACTCTCTTCACCTGCTCCTGTGGCACTGACTTCTGCAATGCCAATTACAGCCATCTGCCTCCTCCAGGGAGCCCTGGGACTCCTGGCTCCCAGGGTCCCCAGGCTGCCCCAGGTGAGTCCATCTGGATGGCACTG (서열 번호: 212)
ATGCTAGGGTCTTTGGGGCTTTGGGCATTACTTCCCACAGCTGTGGAAGCACCCCCAAACAGGCGAACCTGTGTGTTCTTTGAGGCCCCTGGAGTGCGGGGAAGCACAAAGACACTGGGAGAGCTGCTAGATACAGGCACAGAGCTCCCCAGAGCTATCCGCTGCCTCTACAGCCGCTGCTGCTTTGGGATCTGGAACCTGACCCAAGACCGGGCACAGGTGGAAATGCAAGGATGCCGAGACAGTGATGAGCCAGGCTGTGAGTCCCTCCACTGTGACCCAAGTCCCCGAGCCCACCCCAGCCCTGGCTCCACTCTCTTCACCTGCTCCTGTGGCACTGACTTCTGCAATGCCAATTACAGCCATCTGCCTCCTCCAGGGAGCCCTGGGACTCCTGGCTCCCAGGGTCCCCAGGCTGCCCCAGGTGAGTCCATCTGGATGGCACTGGTGCTGCTGGGGCTGTTCCTCCTCCTCCTGCTGCTGCTGGGCAGCATCATCTTGGCCCTGCTACAGCGAAAGAACTACAGAGTGCGAGGTGAGCCAGTGCCAGAGCCAAGGCCAGACTCAGGCAGGGACTGGAGTGTGGAGCTGCAGGAGCTGCCTGAGCTGTGTTTCTCCCAGGTAATCCGGGAAGGAGGTCATGCAGTGGTTTGGGCCGGGCAGCTGCAAGGAAAACTGGTTGCCATCAAGGCCTTCCCACCGAGGTCTGTGGCTCAGTTCCAAGCTGAGAGAGCATTGTACGAACTTCCAGGCCTACAGCACGACCACATTGTCCGATTTATCACTGCCAGCCGGGGGGGTCCTGGCCGCCTGCTCTCTGGGCCCCTGCTGGTACTGGAACTGCATCCCAAGGGCTCCCTGTGCCACTACTTGACCCAGTACACCAGTGACTGGGGAAGTTCCCTGCGGATGGCACTGTCCCTGGCCCAGGGCCTGGCATTTCTCCATGAGGAGCGCTGGCAGAATGGCCAATATAAACCAGGTATTGCCCACCGAGATCTGAGCAGCCAGAATGTGCTCATTCGGGAAGATGGATCGTGTGCCATTGGAGACCTGGGCCTTGCCTTGGTGCTCCCTGGCCTCACTCAGCCCCCTGCCTGGACCCCTACTCAACCACAAGGCCCAGCTGCCATCATGGAAGACCCTGATGGGCTGAGGGAGCTCCTAGAAGACTGTTGGGATGCAGACCCAGAAGCACGGCTGACAGCTGAGTGTGTACAGCAGCGCCTGGCTGCCTTGGCCCATCCTCAAGAGAGCCACCCCTTTCCAGAGAGCTGTCCACGTGGCTGCCCACCTCTCTGCCCAGAAGACTGTACTTCAATTCCTGCCCCTACCATCCTCCCCTGTAGGCCTCAGCGGAGTGCCTGCCACTTCAGCGTTCAGCAAGGCCCTTGTTCCAGGAATCCTCAGCCTGCCTGTACCCTTTCTCCTGTG (서열 번호: 213)
CCCCCAAACAGGCGAACCTGTGTGTTCTTTGAGGCCCCTGGAGTGCGGGGAAGCACAAAGACACTGGGAGAGCTGCTAGATACAGGCACAGAGCTCCCCAGAGCTATCCGCTGCCTCTACAGCCGCTGCTGCTTTGGGATCTGGAACCTGACCCAAGACCGGGCACAGGTGGAAATGCAAGGATGCCGAGACAGTGATGAGCCAGGCTGTGAGTCCCTCCACTGTGACCCAAGTCCCCGAGCCCACCCCAGCCCTGGCTCCACTCTCTTCACCTGCTCCTGTGGCACTGACTTCTGCAATGCCAATTACAGCCATCTGCCTCCTCCAGGGAGCCCTGGGACTCCTGGCTCCCAGGGTCCCCAGGCTGCCCCAGGTGAGTCCATCTGGATGGCACTG (서열 번호: 214)
ATGACCTTGGGCTCCCCCAGGAAAGGCCTTCTGATGCTGCTGATGGCCTTGGTGACCCAGGGA GACCCTGTGAAGCCGTCTCGGGGCCCGCTGGTGACCTGCACGTGTGAGAGCCCACATTGCAAGGGGCCTACCTGCCGGGGGGCCTGGTGCACAGTAGTGCTGGTGCGGGAGGAGGGGAGGCACCCCCAGGAACATCGGGGCTGCGGGAACTTGCACAGGGAGCTCTGCAGGGGGCGCCCCACCGAGTTCGTCAACCACTACTGCTGCGACAGCCACCTCTGCAACCACAACGTGTCCCTGGTGCTGGAGGCCACCCAACCTCCTTCGGAGCAGCCGGGAACAGATGGCCAGCTGGCCCTGATCCTGGGCCCCGTGCTGGCCTTGCTGGCCCTGGTGGCCCTGGGTGTCCTGGGCCTGTGGCATGTCCGACGGAGGCAGGAGAAGCAGCGTGGCCTGCACAGCGAGCTGGGAGAGTCCAGTCTCATCCTGAAAGCATCTGAGCAGGGCGACAGCATGTTGGGGGACCTCCTGGACAGTGACTGCACCACAGGGAGTGGCTCAGGGCTCCCCTTCCTGGTGCAGAGGACAGTGGCACGGCAGGTTGCCTTGGTGGAGTGTGTGGGAAAAGGCCGCTATGGCGAAGTGTGGCGGGGCTTGTGGCACGGTGAGAGTGTGGCCGTCAAGATCTTCTCCTCGAGGGATGAACAGTCCTGGTTCCGGGAGACTGAGATCTATAACACAGTGTTGCTCAGACACGACAACATCCTAGGCTTCATCGCCTCAGACATGACCTCCCGCAACTCGAGCACGCAGCTGTGGCTCATCACGCACTACCACGAGCACGGCTCCCTCTACGACTTTCTGCAGAGACAGACGCTGGAGCCCCATCTGGCTCTGAGGCTAGCTGTGTCCGCGGCATGCGGCCTGGCGCACCTGCACGTGGAGATCTTCGGTACACAGGGCAAACCAGCCATTGCCCACCGCGACTTCAAGAGCCGCAATGTGCTGGTCAAGAGCAACCTGCAGTGTTGCATCGCCGACCTGGGCCTGGCTGTGATGCACTCACAGGGCAGCGATTACCTGGACATCGGCAACAACCCGAGAGTGGGCACCAAGCGGTACATGGCACCCGAGGTGCTGGACGAGCAGATCCGCACGGACTGCTTTGAGTCCTACAAGTGGACTGACATCTGGGCCTTTGGCCTGGTGCTGTGGGAGATTGCCCGCCGGACCATCGTGAATGGCATCGTGGAGGACTATAGACCACCCTTCTATGATGTGGTGCCCAATGACCCCAGCTTTGAGGACATGAAGAAGGTGGTGTGTGTGGATCAGCAGACCCCCACCATCCCTAACCGGCTGGCTGCAGACCCGGTCCTCTCAGGCCTAGCTCAGATGATGCGGGAGTGCTGGTACCCAAACCCCTCTGCCCGACTCACCGCGCTGCGGATCAAGAAGACACTACAAAAAATTAGCAACAGTCCAGAGAAGCCTAAAGTGATTCAA (서열 번호: 215)
GACCCTGTGAAGCCGTCTCGGGGCCCGCTGGTGACCTGCACGTGTGAGAGCCCACATTGCAAGGGGCCTACCTGCCGGGGGGCCTGGTGCACAGTAGTGCTGGTGCGGGAGGAGGGGAGGCACCCCCAGGAACATCGGGGCTGCGGGAACTTGCACAGGGAGCTCTGCAGGGGGCGCCCCACCGAGTTCGTCAACCACTACTGCTGCGACAGCCACCTCTGCAACCACAACGTGTCCCTGGTGCTGGAGGCCACCCAACCTCCTTCGGAGCAGCCGGGAACAGATGGCCAG (서열 번호: 216)
ATGGTAGATGGAGTGATGATTCTTCCTGTGCTTATCATGATTGCTCTCCCCTCCCCTAGT ATGGAAGATGAGAAGCCCAAGGTCAACCCCAAACTCTACATGTGTGTGTGTGAAGGTCTCTCCTGCGGTAATGAGGACCACTGTGAAGGCCAGCAGTGCTTTTCCTCACTGAGCATCAACGATGGCTTCCACGTCTACCAGAAAGGCTGCTTCCAGGTTTATGAGCAGGGAAAGATGACCTGTAAGACCCCGCCGTCCCCTGGCCAAGCCGTGGAGTGCTGCCAAGGGGACTGGTGTAACAGGAACATCACGGCCCAGCTGCCCACTAAAGGAAAATCCTTCCCTGGAACACAGAATTTCCACTTGGAGGTTGGCCTCATTATTCTCTCTGTAGTGTTCGCAGTATGTCTTTTAGCCTGCCTGCTGGGAGTTGCTCTCCGAAAATTTAAAAGGCGCAACCAAGAACGCCTCAATCCCCGAGACGTGGAGTATGGCACTATCGAAGGGCTCATCACCACCAATGTTGGAGACAGCACTTTAGCAGATTTATTGGATCATTCGTGTACATCAGGAAGTGGCTCTGGTCTTCCTTTTCTGGTACAAAGAACAGTGGCTCGCCAGATTACACTGTTGGAGTGTGTCGGGAAAGGCAGGTATGGTGAGGTGTGGAGGGGCAGCTGGCAAGGGGAGAATGTTGCCGTGAAGATCTTCTCCTCCCGTGATGAGAAGTCATGGTTCAGGGAAACGGAATTGTACAACACTGTGATGCTGAGGCATGAAAATATCTTAGGTTTCATTGCTTCAGACATGACATCAAGACACTCCAGTACCCAGCTGTGGTTAATTACACATTATCATGAAATGGGATCGTTGTACGACTATCTTCAGCTTACTACTCTGGATACAGTTAGCTGCCTTCGAATAGTGCTGTCCATAGCTAGTGGTCTTGCACATTTGCACATAGAGATATTTGGGACCCAAGGGAAACCAGCCATTGCCCATCGAGATTTAAAGAGCAAAAATATTCTGGTTAAGAAGAATGGACAGTGTTGCATAGCAGATTTGGGCCTGGCAGTCATGCATTCCCAGAGCACCAATCAGCTTGATGTGGGGAACAATCCCCGTGTGGGCACCAAGCGCTACATGGCCCCCGAAGTTCTAGATGAAACCATCCAGGTGGATTGTTTCGATTCTTATAAAAGGGTCGATATTTGGGCCTTTGGACTTGTTTTGTGGGAAGTGGCCAGGCGGATGGTGAGCAATGGTATAGTGGAGGATTACAAGCCACCGTTCTACGATGTGGTTCCCAATGACCCAAGTTTTGAAGATATGAGGAAGGTAGTCTGTGTGGATCAACAAAGGCCAAACATACCCAACAGATGGTTCTCAGACCCGACATTAACCTCTCTGGCCAAGCTAATGAAAGAATGCTGGTATCAAAATCCATCCGCAAGACTCACAGCACTGCGTATCAAAAAGACTTTGACCAAAATTGATAATTCCCTCGACAAATTGAAAACTGACTGT (서열 번호: 217)
ATGGAAGATGAGAAGCCCAAGGTCAACCCCAAACTCTACATGTGTGTGTGTGAAGGTCTCTCCTGCGGTAATGAGGACCACTGTGAAGGCCAGCAGTGCTTTTCCTCACTGAGCATCAACGATGGCTTCCACGTCTACCAGAAAGGCTGCTTCCAGGTTTATGAGCAGGGAAAGATGACCTGTAAGACCCCGCCGTCCCCTGGCCAAGCCGTGGAGTGCTGCCAAGGGGACTGGTGTAACAGGAACATCACGGCCCAGCTGCCCACTAAAGGAAAATCCTTCCCTGGAACACAGAATTTCCACTTGGAG (서열 번호: 218)
1 ATGCCTCAGC TATACATTTA CATCAGATTA TTGGGAGCCT ATTTGTTCAT CATTTCTCGT
61 GTTCAAGGA C AGAATCTGGA TAGTATGCTT CATGGCACTG GGATGAAATC AGACTCCGAC
121 CAGAAAAAGT CAGAAAATGG AGTAACCTTA GCACCAGAGG ATACCTTGCC TTTTTTAAAG
181 TGCTATTGCT CAGGGCACTG TCCAGATGAT GCTATTAATA ACACATGCAT AACTAATGGA
241 CATTGCTTTG CCATCATAGA AGAAGATGAC CAGGGAGAAA CCACATTAGC TTCAGGGTGT
301 ATGAAATATG AAGGATCTGA TTTTCAGTGC AAAGATTCTC CAAAAGCCCA GCTACGCCGG
361 ACAATAGAAT GTTGTCGGAC CAATTTATGT AACCAGTATT TGCAACCCAC ACTGCCCCCT
421 GTTGTCATAG GTCCGTTTTT TGATGGCAGC ATTCGATGGC TGGTTTTGCT CATTTCTATG
481 GCTGTCTGCA TAATTGCTAT GATCATCTTC TCCAGCTGCT TTTGTTACAA ACATTATTGC
541 AAGAGCATCT CAAGCAGACG TCGTTACAAT CGTGATTTGG AACAGGATGA AGCATTTATT
601 CCAGTTGGAG AATCACTAAA AGACCTTATT GACCAGTCAC AAAGTTCTGG TAGTGGGTCT
661 GGACTACCTT TATTGGTTCA GCGAACTATT GCCAAACAGA TTCAGATGGT CCGGCAAGTT
721 GGTAAAGGCC GATATGGAGA AGTATGGATG GGCAAATGGC GTGGCGAAAA AGTGGCGGTG
781 AAAGTATTCT TTACCACTGA AGAAGCCAGC TGGTTTCGAG AAACAGAAAT CTACCAAACT
841 GTGCTAATGC GCCATGAAAA CATACTTGGT TTCATAGCGG CAGACATTAA AGGTACAGGT
901 TCCTGGACTC AGCTCTATTT GATTACTGAT TACCATGAAA ATGGATCTCT CTATGACTTC
961 CTGAAATGTG CTACACTGGA CACCAGAGCC CTGCTTAAAT TGGCTTATTC AGCTGCCTGT
1021 GGTCTGTGCC ACCTGCACAC AGAAATTTAT GGCACCCAAG GAAAGCCCGC AATTGCTCAT
1081 CGAGACCTAA AGAGCAAAAA CATCCTCATC AAGAAAAATG GGAGTTGCTG CATTGCTGAC
1141 CTGGGCCTTG CTGTTAAATT CAACAGTGAC ACAAATGAAG TTGATGTGCC CTTGAATACC
1201 AGGGTGGGCA CCAAACGCTA CATGGCTCCC GAAGTGCTGG ACGAAAGCCT GAACAAAAAC
1261 CACTTCCAGC CCTACATCAT GGCTGACATC TACAGCTTCG GCCTAATCAT TTGGGAGATG
1321 GCTCGTCGTT GTATCACAGG AGGGATCGTG GAAGAATACC AATTGCCATA TTACAACATG
1381 GTACCGAGTG ATCCGTCATA CGAAGATATG CGTGAGGTTG TGTGTGTCAA ACGTTTGCGG
1441 CCAATTGTGT CTAATCGGTG GAACAGTGAT GAATGTCTAC GAGCAGTTTT GAAGCTAATG
1501 TCAGAATGCT GGGCCCACAA TCCAGCCTCC AGACTCACAG CATTGAGAAT TAAGAAGACG
1561 CTTGCCAAGA TGGTTGAATC CCAAGATGTA AAAATC (서열 번호: 219)
1 CAGAATCTGG ATAGTATGCT TCATGGCACT GGGATGAAAT CAGACTCCGA CCAGAAAAAG
61 TCAGAAAATG GAGTAACCTT AGCACCAGAG GATACCTTGC CTTTTTTAAA GTGCTATTGC
121 TCAGGGCACT GTCCAGATGA TGCTATTAAT AACACATGCA TAACTAATGG ACATTGCTTT
181 GCCATCATAG AAGAAGATGA CCAGGGAGAA ACCACATTAG CTTCAGGGTG TATGAAATAT
241 GAAGGATCTG ATTTTCAGTG CAAAGATTCT CCAAAAGCCC AGCTACGCCG GACAATAGAA
301 TGTTGTCGGA CCAATTTATG TAACCAGTAT TTGCAACCCA CACTGCCCCC TGTTGTCATA
361 GGTCCGTTTT TTGATGGCAG CATTCGA (서열 번호: 220)
ATGGCGGAGTCGGCCGGAGCCTCCTCCTTCTTCCCCCTTGTTGTCCTCCTGCTCGCCGGCAGCGGCGGG TCCGGGCCCCGGGGGGTCCAGGCTCTGCTGTGTGCGTGCACCAGCTGCCTCCAGGCCAACTACACGTGTGAGACAGATGGGGCCTGCATGGTTTCCATTTTCAATCTGGATGGGATGGAGCACCATGTGCGCACCTGCATCCCCAAAGTGGAGCTGGTCCCTGCCGGGAAGCCCTTCTACTGCCTGAGCTCGGAGGACCTGCGCAACACCCACTGCTGCTACACTGACTACTGCAACAGGATCGACTTGAGGGTGCCCAGTGGTCACCTCAAGGAGCCTGAGCACCCGTCCATGTGGGGCCCGGTGGAGCTGGTAGGCATCATCGCCGGCCCGGTGTTCCTCCTGTTCCTCATCATCATCATTGTTTTCCTTGTCATTAACTATCATCAGCGTGTCTATCACAACCGCCAGAGACTGGACATGGAAGATCCCTCATGTGAGATGTGTCTCTCCAAAGACAAGACGCTCCAGGATCTTGTCTACGATCTCTCCACCTCAGGGTCTGGCTCAGGGTTACCCCTCTTTGTCCAGCGCACAGTGGCCCGAACCATCGTTTTACAAGAGATTATTGGCAAGGGTCGGTTTGGGGAAGTATGGCGGGGCCGCTGGAGGGGTGGTGATGTGGCTGTGAAAATATTCTCTTCTCGTGAAGAACGGTCTTGGTTCAGGGAAGCAGAGATATACCAGACGGTCATGCTGCGCCATGAAAACATCCTTGGATTTATTGCTGCTGACAATAAAGATAATGGCACCTGGACACAGCTGTGGCTTGTTTCTGACTATCATGAGCACGGGTCCCTGTTTGATTATCTGAACCGGTACACAGTGACAATTGAGGGGATGATTAAGCTGGCCTTGTCTGCTGCTAGTGGGCTGGCACACCTGCACATGGAGATCGTGGGCACCCAAGGGAAGCCTGGAATTGCTCATCGAGACTTAAAGTCAAAGAACATTCTGGTGAAGAAAAATGGCATGTGTGCCATAGCAGACCTGGGCCTGGCTGTCCGTCATGATGCAGTCACTGACACCATTGACATTGCCCCGAATCAGAGGGTGGGGACCAAACGATACATGGCCCCTGAAGTACTTGATGAAACCATTAATATGAAACACTTTGACTCCTTTAAATGTGCTGATATTTATGCCCTCGGGCTTGTATATTGGGAGATTGCTCGAAGATGCAATTCTGGAGGAGTCCATGAAGAATATCAGCTGCCATATTACGACTTAGTGCCCTCTGACCCTTCCATTGAGGAAATGCGAAAGGTTGTATGTGATCAGAAGCTGCGTCCCAACATCCCCAACTGGTGGCAGAGTTATGAGGCACTGCGGGTGATGGGGAAGATGATGCGAGAGTGTTGGTATGCCAACGGCGCAGCCCGCCTGACGGCCCTGCGCATCAAGAAGACCCTCTCCCAGCTCAGCGTGCAGGAAGACGTGAAGATC (서열 번호: 221)
TCCGGGCCCCGGGGGGTCCAGGCTCTGCTGTGTGCGTGCACCAGCTGCCTCCAGGCCAACTACACGTGTGAGACAGATGGGGCCTGCATGGTTTCCATTTTCAATCTGGATGGGATGGAGCACCATGTGCGCACCTGCATCCCCAAAGTGGAGCTGGTCCCTGCCGGGAAGCCCTTCTACTGCCTGAGCTCGGAGGACCTGCGCAACACCCACTGCTGCTACACTGACTACTGCAACAGGATCGACTTGAGGGTGCCCAGTGGTCACCTCAAGGAGCCTGAGCACCCGTCCATGTGGGGCCCGGTGGAG (서열 번호: 222)
ATGGCGGAGTCGGCCGGAGCCTCCTCCTTCTTCCCCCTTGTTGTCCTCCTGCTCGCCGGCAGCGGCGGG TCCGGGCCCCGGGGGGTCCAGGCTCTGCTGTGTGCGTGCACCAGCTGCCTCCAGGCCAACTACACGTGTGAGACAGATGGGGCCTGCATGGTTTCCATTTTCAATCTGGATGGGATGGAGCACCATGTGCGCACCTGCATCCCCAAAGTGGAGCTGGTCCCTGCCGGGAAGCCCTTCTACTGCCTGAGCTCGGAGGACCTGCGCAACACCCACTGCTGCTACACTGACTACTGCAACAGGATCGACTTGAGGGTGCCCAGTGGTCACCTCAAGGAGCCTGAGCACCCGTCCATGTGGGGCCCGGTGGAGCTGGTAGGCATCATCGCCGGCCCGGTGTTCCTCCTGTTCCTCATCATCATCATTGTTTTCCTTGTCATTAACTATCATCAGCGTGTCTATCACAACCGCCAGAGACTGGACATGGAAGATCCCTCATGTGAGATGTGTCTCTCCAAAGACAAGACGCTCCAGGATCTTGTCTACGATCTCTCCACCTCAGGGTCTGGCTCAGGGTTACCCCTCTTTGTCCAGCGCACAGTGGCCCGAACCATCGTTTTACAAGAGATTATTGGCAAGGGTCGGTTTGGGGAAGTATGGCGGGGCCGCTGGAGGGGTGGTGATGTGGCTGTGAAAATATTCTCTTCTCGTGAAGAACGGTCTTGGTTCAGGGAAGCAGAGATATACCAGACGGTCATGCTGCGCCATGAAAACATCCTTGGATTTATTGCTGCTGACAATAAAGCAGACTGCTCATTCCTCACATTGCCATGGGAAGTTGTAATGGTCTCTGCTGCCCCCAAGCTGAGGAGCCTTAGACTCCAATACAAGGGAGGAAGGGGAAGAGCAAGATTTTTATTCCCACTGAATAATGGCACCTGGACACAGCTGTGGCTTGTTTCTGACTATCATGAGCACGGGTCCCTGTTTGATTATCTGAACCGGTACACAGTGACAATTGAGGGGATGATTAAGCTGGCCTTGTCTGCTGCTAGTGGGCTGGCACACCTGCACATGGAGATCGTGGGCACCCAAGGGAAGCCTGGAATTGCTCATCGAGACTTAAAGTCAAAGAACATTCTGGTGAAGAAAAATGGCATGTGTGCCATAGCAGACCTGGGCCTGGCTGTCCGTCATGATGCAGTCACTGACACCATTGACATTGCCCCGAATCAGAGGGTGGGGACCAAACGATACATGGCCCCTGAAGTACTTGATGAAACCATTAATATGAAACACTTTGACTCCTTTAAATGTGCTGATATTTATGCCCTCGGGCTTGTATATTGGGAGATTGCTCGAAGATGCAATTCTGGAGGAGTCCATGAAGAATATCAGCTGCCATATTACGACTTAGTGCCCTCTGACCCTTCCATTGAGGAAATGCGAAAGGTTGTATGTGATCAGAAGCTGCGTCCCAACATCCCCAACTGGTGGCAGAGTTATGAGGCACTGCGGGTGATGGGGAAGATGATGCGAGAGTGTTGGTATGCCAACGGCGCAGCCCGCCTGACGGCCCTGCGCATCAAGAAGACCCTCTCCCAGCTCAGCGTGCAGGAAGACGTGAAGATC (서열 번호: 223)
TCCGGGCCCCGGGGGGTCCAGGCTCTGCTGTGTGCGTGCACCAGCTGCCTCCAGGCCAACTACACGTGTGAGACAGATGGGGCCTGCATGGTTTCCATTTTCAATCTGGATGGGATGGAGCACCATGTGCGCACCTGCATCCCCAAAGTGGAGCTGGTCCCTGCCGGGAAGCCCTTCTACTGCCTGAGCTCGGAGGACCTGCGCAACACCCACTGCTGCTACACTGACTACTGCAACAGGATCGACTTGAGGGTGCCCAGTGGTCACCTCAAGGAGCCTGAGCACCCGTCCATGTGGGGCCCGGTGGAG (서열 번호: 224)
ATGGAGGCGGCGGTCGCTGCTCCGCGTCCCCGGCTGCTCCTCCTCGTGCTGGCGGCGGCGGCGGCGGCGGCG GCGGCGCTGCTCCCGGGGGCGACGGCGTTACAGTGTTTCTGCCACCTCTGTACAAAAGACAATTTTACTTGTGTGACAGATGGGCTCTGCTTTGTCTCTGTCACAGAGACCACAGACAAAGTTATACACAACAGCATGTGTATAGCTGAAATTGACTTAATTCCTCGAGATAGGCCGTTTGTATGTGCACCCTCTTCAAAAACTGGGTCTGTGACTACAACATATTGCTGCAATCAGGACCATTGCAATAAAATAGAACTTCCAACTACTGTAAAGTCATCACCTGGCCTTGGTCCTGTGGAACTGGCAGCTGTCATTGCTGGACCAGTGTGCTTCGTCTGCATCTCACTCATGTTGATGGTCTATATCTGCCACAACCGCACTGTCATTCACCATCGAGTGCCAAATGAAGAGGACCCTTCATTAGATCGCCCTTTTATTTCAGAGGGTACTACGTTGAAAGACTTAATTTATGATATGACAACGTCAGGTTCTGGCTCAGGTTTACCATTGCTTGTTCAGAGAACAATTGCGAGAACTATTGTGTTACAAGAAAGCATTGGCAAAGGTCGATTTGGAGAAGTTTGGAGAGGAAAGTGGCGGGGAGAAGAAGTTGCTGTTAAGATATTCTCCTCTAGAGAAGAACGTTCGTGGTTCCGTGAGGCAGAGATTTATCAAACTGTAATGTTACGTCATGAAAACATCCTGGGATTTATAGCAGCAGACAATAAAGACAATGGTACTTGGACTCAGCTCTGGTTGGTGTCAGATTATCATGAGCATGGATCCCTTTTTGATTACTTAAACAGATACACAGTTACTGTGGAAGGAATGATAAAACTTGCTCTGTCCACGGCGAGCGGTCTTGCCCATCTTCACATGGAGATTGTTGGTACCCAAGGAAAGCCAGCCATTGCTCATAGAGATTTGAAATCAAAGAATATCTTGGTAAAGAAGAATGGAACTTGCTGTATTGCAGACTTAGGACTGGCAGTAAGACATGATTCAGCCACAGATACCATTGATATTGCTCCAAACCACAGAGTGGGAACAAAAAGGTACATGGCCCCTGAAGTTCTCGATGATTCCATAAATATGAAACATTTTGAATCCTTCAAACGTGCTGACATCTATGCAATGGGCTTAGTATTCTGGGAAATTGCTCGACGATGTTCCATTGGTGGAATTCATGAAGATTACCAACTGCCTTATTATGATCTTGTACCTTCTGACCCATCAGTTGAAGAAATGAGAAAAGTTGTTTGTGAACAGAAGTTAAGGCCAAATATCCCAAACAGATGGCAGAGCTGTGAAGCCTTGAGAGTAATGGCTAAAATTATGAGAGAATGTTGGTATGCCAATGGAGCAGCTAGGCTTACAGCATTGCGGATTAAGAAAACATTATCGCAACTCAGTCAACAGGAAGGCATCAAAATG (서열 번호: 225)
GCGGCGCTGCTCCCGGGGGCGACGGCGTTACAGTGTTTCTGCCACCTCTGTACAAAAGACAATTTTACTTGTGTGACAGATGGGCTCTGCTTTGTCTCTGTCACAGAGACCACAGACAAAGTTATACACAACAGCATGTGTATAGCTGAAATTGACTTAATTCCTCGAGATAGGCCGTTTGTATGTGCACCCTCTTCAAAAACTGGGTCTGTGACTACAACATATTGCTGCAATCAGGACCATTGCAATAAAATAGAACTTCCAACTACTGTAAAGTCATCACCTGGCCTTGGTCCTGTGGAACTG (서열 번호: 226)
ATGGAGGCGGCGGTCGCTGCTCCGCGTCCCCGGCTGCTCCTCCTCGTGCTGGCGGCGGCGGCGGCGGCGGCG GCGGCGCTGCTCCCGGGGGCGACGGCGTTACAGTGTTTCTGCCACCTCTGTACAAAAGACAATTTTACTTGTGTGACAGATGGGCTCTGCTTTGTCTCTGTCACAGAGACCACAGACAAAGTTATACACAACAGCATGTGTATAGCTGAAATTGACTTAATTCCTCGAGATAGGCCGTTTGTATGTGCACCCTCTTCAAAAACTGGGTCTGTGACTACAACATATTGCTGCAATCAGGACCATTGCAATAAAATAGAACTTCCAACTACTGGCCCTTTTTCAGTAAAGTCATCACCTGGCCTTGGTCCTGTGGAACTGGCAGCTGTCATTGCTGGACCAGTGTGCTTCGTCTGCATCTCACTCATGTTGATGGTCTATATCTGCCACAACCGCACTGTCATTCACCATCGAGTGCCAAATGAAGAGGACCCTTCATTAGATCGCCCTTTTATTTCAGAGGGTACTACGTTGAAAGACTTAATTTATGATATGACAACGTCAGGTTCTGGCTCAGGTTTACCATTGCTTGTTCAGAGAACAATTGCGAGAACTATTGTGTTACAAGAAAGCATTGGCAAAGGTCGATTTGGAGAAGTTTGGAGAGGAAAGTGGCGGGGAGAAGAAGTTGCTGTTAAGATATTCTCCTCTAGAGAAGAACGTTCGTGGTTCCGTGAGGCAGAGATTTATCAAACTGTAATGTTACGTCATGAAAACATCCTGGGATTTATAGCAGCAGACAATAAAGACAATGGTACTTGGACTCAGCTCTGGTTGGTGTCAGATTATCATGAGCATGGATCCCTTTTTGATTACTTAAACAGATACACAGTTACTGTGGAAGGAATGATAAAACTTGCTCTGTCCACGGCGAGCGGTCTTGCCCATCTTCACATGGAGATTGTTGGTACCCAAGGAAAGCCAGCCATTGCTCATAGAGATTTGAAATCAAAGAATATCTTGGTAAAGAAGAATGGAACTTGCTGTATTGCAGACTTAGGACTGGCAGTAAGACATGATTCAGCCACAGATACCATTGATATTGCTCCAAACCACAGAGTGGGAACAAAAAGGTACATGGCCCCTGAAGTTCTCGATGATTCCATAAATATGAAACATTTTGAATCCTTCAAACGTGCTGACATCTATGCAATGGGCTTAGTATTCTGGGAAATTGCTCGACGATGTTCCATTGGTGGAATTCATGAAGATTACCAACTGCCTTATTATGATCTTGTACCTTCTGACCCATCAGTTGAAGAAATGAGAAAAGTTGTTTGTGAACAGAAGTTAAGGCCAAATATCCCAAACAGATGGCAGAGCTGTGAAGCCTTGAGAGTAATGGCTAAAATTATGAGAGAATGTTGGTATGCCAATGGAGCAGCTAGGCTTACAGCATTGCGGATTAAGAAAACATTATCGCAACTCAGTCAACAGGAAGGCATCAAAATG (서열 번호: 227)
GCGGCGCTGCTCCCGGGGGCGACGGCGTTACAGTGTTTCTGCCACCTCTGTACAAAAGACAATTTTACTTGTGTGACAGATGGGCTCTGCTTTGTCTCTGTCACAGAGACCACAGACAAAGTTATACACAACAGCATGTGTATAGCTGAAATTGACTTAATTCCTCGAGATAGGCCGTTTGTATGTGCACCCTCTTCAAAAACTGGGTCTGTGACTACAACATATTGCTGCAATCAGGACCATTGCAATAAAATAGAACTTCCAACTACTGGCCCTTTTTCAGTAAAGTCATCACCTGGCCTTGGTCCTGTGGAACTG (서열 번호: 228)
ATGCTTTTGCGAAGTGCAGGAAAATTAAATGTGGGCACC AAGAAAGAGGATGGTGAGAGTACAGCCCCCACCCCCCGTCCAAAGGTCTTGCGTTGTAAATGCCACCACCATTGTCCAGAAGACTCAGTCAACAATATTTGCAGCACAGACGGATATTGTTTCACGATGATAGAAGAGGATGACTCTGGGTTGCCTGTGGTCACTTCTGGTTGCCTAGGACTAGAAGGCTCAGATTTTCAGTGTCGGGACACTCCCATTCCTCATCAAAGAAGATCAATTGAATGCTGCACAGAAAGGAACGAATGTAATAAAGACCTACACCCTACACTGCCTCCATTGAAAAACAGAGATTTTGTTGATGGACCTATACACCACAGGGCTTTACTTATATCTGTGACTGTCTGTAGTTTGCTCTTGGTCCTTATCATATTATTTTGTTACTTCCGGTATAAAAGACAAGAAACCAGACCTCGATACAGCATTGGGTTAGAACAGGATGAAACTTACATTCCTCCTGGAGAATCCCTGAGAGACTTAATTGAGCAGTCTCAGAGCTCAGGAAGTGGATCAGGCCTCCCTCTGCTGGTCCAAAGGACTATAGCTAAGCAGATTCAGATGGTGAAACAGATTGGAAAAGGTCGCTATGGGGAAGTTTGGATGGGAAAGTGGCGTGGCGAAAAGGTAGCTGTGAAAGTGTTCTTCACCACAGAGGAAGCCAGCTGGTTCAGAGAGACAGAAATATATCAGACAGTGTTGATGAGGCATGAAAACATTTTGGGTTTCATTGCTGCAGATATCAAAGGGACAGGGTCCTGGACCCAGTTGTACCTAATCACAGACTATCATGAAAATGGTTCCCTTTATGATTATCTGAAGTCCACCACCCTAGACGCTAAATCAATGCTGAAGTTAGCCTACTCTTCTGTCAGTGGCTTATGTCATTTACACACAGAAATCTTTAGTACTCAAGGCAAACCAGCAATTGCCCATCGAGATCTGAAAAGTAAAAACATTCTGGTGAAGAAAAATGGAACTTGCTGTATTGCTGACCTGGGCCTGGCTGTTAAATTTATTAGTGATACAAATGAAGTTGACATACCACCTAACACTCGAGTTGGCACCAAACGCTATATGCCTCCAGAAGTGTTGGACGAGAGCTTGAACAGAAATCACTTCCAGTCTTACATCATGGCTGACATGTATAGTTTTGGCCTCATCCTTTGGGAGGTTGCTAGGAGATGTGTATCAGGAGGTATAGTGGAAGAATACCAGCTTCCTTATCATGACCTAGTGCCCAGTGACCCCTCTTATGAGGACATGAGGGAGATTGTGTGCATCAAGAAGTTACGCCCCTCATTCCCAAACCGGTGGAGCAGTGATGAGTGTCTAAGGCAGATGGGAAAACTCATGACAGAATGCTGGGCTCACAATCCTGCATCAAGGCTGACAGCCCTGCGGGTTAAGAAAACACTTGCCAAAATGTCAGAGTCCCAGGACATTAAACTC (서열 번호: 229)
AAGAAAGAGGATGGTGAGAGTACAGCCCCCACCCCCCGTCCAAAGGTCTTGCGTTGTAAATGCCACCACCATTGTCCAGAAGACTCAGTCAACAATATTTGCAGCACAGACGGATATTGTTTCACGATGATAGAAGAGGATGACTCTGGGTTGCCTGTGGTCACTTCTGGTTGCCTAGGACTAGAAGGCTCAGATTTTCAGTGTCGGGACACTCCCATTCCTCATCAAAGAAGATCAATTGAATGCTGCACAGAAAGGAACGAATGTAATAAAGACCTACACCCTACACTGCCTCCATTGAAAAACAGAGATTTTGTTGATGGACCTATACACCACAGG (서열 번호: 230)
ATGGGTTGGCTGGAAGAACTAAACTGGCAGCTTCACATTTTCTTGCTCATTCTTCTCTCTATGCACACAAGGGCA AACTTCCTTGATAACATGCTTTTGCGAAGTGCAGGAAAATTAAATGTGGGCACCAAGAAAGAGGATGGTGAGAGTACAGCCCCCACCCCCCGTCCAAAGGTCTTGCGTTGTAAATGCCACCACCATTGTCCAGAAGACTCAGTCAACAATATTTGCAGCACAGACGGATATTGTTTCACGATGATAGAAGAGGATGACTCTGGGTTGCCTGTGGTCACTTCTGGTTGCCTAGGACTAGAAGGCTCAGATTTTCAGTGTCGGGACACTCCCATTCCTCATCAAAGAAGATCAATTGAATGCTGCACAGAAAGGAACGAATGTAATAAAGACCTACACCCTACACTGCCTCCATTGAAAAACAGAGATTTTGTTGATGGACCTATACACCACAGGGCTTTACTTATATCTGTGACTGTCTGTAGTTTGCTCTTGGTCCTTATCATATTATTTTGTTACTTCCGGTATAAAAGACAAGAAACCAGACCTCGATACAGCATTGGGTTAGAACAGGATGAAACTTACATTCCTCCTGGAGAATCCCTGAGAGACTTAATTGAGCAGTCTCAGAGCTCAGGAAGTGGATCAGGCCTCCCTCTGCTGGTCCAAAGGACTATAGCTAAGCAGATTCAGATGGTGAAACAGATTGGAAAAGGTCGCTATGGGGAAGTTTGGATGGGAAAGTGGCGTGGCGAAAAGGTAGCTGTGAAAGTGTTCTTCACCACAGAGGAAGCCAGCTGGTTCAGAGAGACAGAAATATATCAGACAGTGTTGATGAGGCATGAAAACATTTTGGGTTTCATTGCTGCAGATATCAAAGGGACAGGGTCCTGGACCCAGTTGTACCTAATCACAGACTATCATGAAAATGGTTCCCTTTATGATTATCTGAAGTCCACCACCCTAGACGCTAAATCAATGCTGAAGTTAGCCTACTCTTCTGTCAGTGGCTTATGTCATTTACACACAGAAATCTTTAGTACTCAAGGCAAACCAGCAATTGCCCATCGAGATCTGAAAAGTAAAAACATTCTGGTGAAGAAAAATGGAACTTGCTGTATTGCTGACCTGGGCCTGGCTGTTAAATTTATTAGTGATACAAATGAAGTTGACATACCACCTAACACTCGAGTTGGCACCAAACGCTATATGCCTCCAGAAGTGTTGGACGAGAGCTTGAACAGAAATCACTTCCAGTCTTACATCATGGCTGACATGTATAGTTTTGGCCTCATCCTTTGGGAGGTTGCTAGGAGATGTGTATCAGGAGGTATAGTGGAAGAATACCAGCTTCCTTATCATGACCTAGTGCCCAGTGACCCCTCTTATGAGGACATGAGGGAGATTGTGTGCATCAAGAAGTTACGCCCCTCATTCCCAAACCGGTGGAGCAGTGATGAGTGTCTAAGGCAGATGGGAAAACTCATGACAGAATGCTGGGCTCACAATCCTGCATCAAGGCTGACAGCCCTGCGGGTTAAGAAAACACTTGCCAAAATGTCAGAGTCCCAGGACATTAAACTC (서열 번호: 231)
AACTTCCTTGATAACATGCTTTTGCGAAGTGCAGGAAAATTAAATGTGGGCACCAAGAAAGAGGATGGTGAGAGTACAGCCCCCACCCCCCGTCCAAAGGTCTTGCGTTGTAAATGCCACCACCATTGTCCAGAAGACTCAGTCAACAATATTTGCAGCACAGACGGATATTGTTTCACGATGATAGAAGAGGATGACTCTGGGTTGCCTGTGGTCACTTCTGGTTGCCTAGGACTAGAAGGCTCAGATTTTCAGTGTCGGGACACTCCCATTCCTCATCAAAGAAGATCAATTGAATGCTGCACAGAAAGGAACGAATGTAATAAAGACCTACACCCTACACTGCCTCCATTGAAAAACAGAGATTTTGTTGATGGACCTATACACCACAGG (서열 번호: 232)
ATGACCCGGGCGCTCTGCTCAGCGCTCCGCCAGGCTCTCCTGCTGCTCGCAGCGGCCGCC GAGCTCTCGCCAGGACTGAAGTGTGTATGTCTTTTGTGTGATTCTTCAAACTTTACCTGCCAAACAGAAGGAGCATGTTGGGCATCAGTCATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGCATCACCAAATGCCCCAAAACTTGGACCCATGGAGCTGGCCATCATTATTACTGTGCCTGTTTGCCTCCTGTCCATAGCTGCGATGCTGACAGTATGGGCATGCCAGGGTCGACAGTGCTCCTACAGGAAGAAAAAGAGACCAAATGTGGAGGAACCACTCTCTGAGTGCAATCTGGTAAATGCTGGAAAAACTCTGAAAGATCTGATTTATGATGTGACCGCCTCTGGATCTGGCTCTGGTCTACCTCTGTTGGTTCAAAGGACAATTGCAAGGACGATTGTGCTTCAGGAAATAGTAGGAAAAGGTAGATTTGGTGAGGTGTGGCATGGAAGATGGTGTGGGGAAGATGTGGCTGTGAAAATATTCTCCTCCAGAGATGAAAGATCTTGGTTTCGTGAGGCAGAAATTTACCAGACGGTCATGCTGCGACATGAAAACATCCTTGGTTTCATTGCTGCTGACAACAAAGATAATGGAACTTGGACTCAACTTTGGCTGGTATCTGAATATCATGAACAGGGCTCCTTATATGACTATTTGAATAGAAATATAGTGACCGTGGCTGGAATGATCAAGCTGGCGCTCTCAATTGCTAGTGGTCTGGCACACCTTCATATGGAGATTGTTGGTACACAAGGTAAACCTGCTATTGCTCATCGAGACATAAAATCAAAGAATATCTTAGTGAAAAAGTGTGAAACTTGTGCCATAGCGGACTTAGGGTTGGCTGTGAAGCATGATTCAATACTGAACACTATCGACATACCTCAGAATCCTAAAGTGGGAACCAAGAGGTATATGGCTCCTGAAATGCTTGATGATACAATGAATGTGAATATCTTTGAGTCCTTCAAACGAGCTGACATCTATTCTGTTGGTCTGGTTTACTGGGAAATAGCCCGGAGGTGTTCAGTCGGAGGAATTGTTGAGGAGTACCAATTGCCTTATTATGACATGGTGCCTTCAGATCCCTCGATAGAGGAAATGAGAAAGGTTGTTTGTGACCAGAAGTTTCGACCAAGTATCCCAAACCAGTGGCAAAGTTGTGAAGCACTCCGAGTCATGGGGAGAATAATGCGTGAGTGTTGGTATGCCAACGGAGCGGCCCGCCTAACTGCTCTTCGTATTAAGAAGACTATATCTCAACTTTGTGTCAAAGAAGACTGCAAAGCC (서열 번호: 233)
GAGCTCTCGCCAGGACTGAAGTGTGTATGTCTTTTGTGTGATTCTTCAAACTTTACCTGCCAAACAGAAGGAGCATGTTGGGCATCAGTCATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGCATCACCAAATGCCCCAAAACTTGGACCCATGGAG (서열 번호: 234)
ATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGCATCACCAAATGCCCCAAAACTTGGACCCATGGAGCTGGCCATCATTATTACTGTGCCTGTTTGCCTCCTGTCCATAGCTGCGATGCTGACAGTATGGGCATGCCAGGGTCGACAGTGCTCCTACAGGAAGAAAAAGAGACCAAATGTGGAGGAACCACTCTCTGAGTGCAATCTGGTAAATGCTGGAAAAACTCTGAAAGATCTGATTTATGATGTGACCGCCTCTGGATCTGGCTCTGGTCTACCTCTGTTGGTTCAAAGGACAATTGCAAGGACGATTGTGCTTCAGGAAATAGTAGGAAAAGGTAGATTTGGTGAGGTGTGGCATGGAAGATGGTGTGGGGAAGATGTGGCTGTGAAAATATTCTCCTCCAGAGATGAAAGATCTTGGTTTCGTGAGGCAGAAATTTACCAGACGGTCATGCTGCGACATGAAAACATCCTTGGTTTCATTGCTGCTGACAACAAAGATAATGGAACTTGGACTCAACTTTGGCTGGTATCTGAATATCATGAACAGGGCTCCTTATATGACTATTTGAATAGAAATATAGTGACCGTGGCTGGAATGATCAAGCTGGCGCTCTCAATTGCTAGTGGTCTGGCACACCTTCATATGGAGATTGTTGGTACACAAGGTAAACCTGCTATTGCTCATCGAGACATAAAATCAAAGAATATCTTAGTGAAAAAGTGTGAAACTTGTGCCATAGCGGACTTAGGGTTGGCTGTGAAGCATGATTCAATACTGAACACTATCGACATACCTCAGAATCCTAAAGTGGGAACCAAGAGGTATATGGCTCCTGAAATGCTTGATGATACAATGAATGTGAATATCTTTGAGTCCTTCAAACGAGCTGACATCTATTCTGTTGGTCTGGTTTACTGGGAAATAGCCCGGAGGTGTTCAGTCGGAGGAATTGTTGAGGAGTACCAATTGCCTTATTATGACATGGTGCCTTCAGATCCCTCGATAGAGGAAATGAGAAAGGTTGTTTGTGACCAGAAGTTTCGACCAAGTATCCCAAACCAGTGGCAAAGTTGTGAAGCACTCCGAGTCATGGGGAGAATAATGCGTGAGTGTTGGTATGCCAACGGAGCGGCCCGCCTAACTGCTCTTCGTATTAAGAAGACTATATCTCAACTTTGTGTCAAAGAAGACTGCAAAGCC (서열 번호: 235)
ATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGCATCACCAAATGCCCCAAAACTTGGACCCATGGAG (서열 번호: 236)
ATGACCCGGGCGCTCTGCTCAGCGCTCCGCCAGGCTCTCCTGCTGCTCGCAGCGGCCGCCGAGCTCTCGCCAGGACTGAAGTGTGTATGTCTTTTGTGTGATTCTTCAAACTTTACCTGCCAAACAGAAGGAGCATGTTGGGCATCAGTCATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGGTCTACCTCTGTTGGTTCAAAGGACAATTGCAAGGACGATTGTGCTTCAGGAAATAGTAGGAAAAGGTAGATTTGGTGAGGTGTGGCATGGAAGATGGTGTGGGGAAGATGTGGCTGTGAAAATATTCTCCTCCAGAGATGAAAGATCTTGGTTTCGTGAGGCAGAAATTTACCAGACGGTCATGCTGCGACATGAAAACATCCTTGGTTTCATTGCTGCTGACAACAAAGATAATGGAACTTGGACTCAACTTTGGCTGGTATCTGAATATCATGAACAGGGCTCCTTATATGACTATTTGAATAGAAATATAGTGACCGTGGCTGGAATGATCAAGCTGGCGCTCTCAATTGCTAGTGGTCTGGCACACCTTCATATGGAGATTGTTGGTACACAAGGTAAACCTGCTATTGCTCATCGAGACATAAAATCAAAGAATATCTTAGTGAAAAAGTGTGAAACTTGTGCCATAGCGGACTTAGGGTTGGCTGTGAAGCATGATTCAATACTGAACACTATCGACATACCTCAGAATCCTAAAGTGGGAACCAAGAGGTATATGGCTCCTGAAATGCTTGATGATACAATGAATGTGAATATCTTTGAGTCCTTCAAACGAGCTGACATCTATTCTGTTGGTCTGGTTTACTGGGAAATAGCCCGGAGGTGTTCAGTCGGAGGAATTGTTGAGGAGTACCAATTGCCTTATTATGACATGGTGCCTTCAGATCCCTCGATAGAGGAAATGAGAAAGGTTGTTTGTGACCAGAAGTTTCGACCAAGTATCCCAAACCAGTGGCAAAGTTGTGAAGCACTCCGAGTCATGGGGAGAATAATGCGTGAGTGTTGGTATGCCAACGGAGCGGCCCGCCTAACTGCTCTTCGTATTAAGAAGACTATATCTCAACTTTGTGTCAAAGAAGACTGCAAAGCC (서열 번호: 237)
GAGCTCTCGCCAGGACTGAAGTGTGTATGTCTTTTGTGTGATTCTTCAAACTTTACCTGCCAAACAGAAGGAGCATGTTGGGCATCAGTCATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGGTCTACCTCTGTTGGTTCAAAGGACAATTGCAAGGACGATTGTGCTTCAGGAAATAGTAGGAAAAGGTAGATTTGGTGAGGTGTGGCATGGAAGATGGTGTGGGGAAGATGTGGCTGTGAAAATATTCTCCTCCAGAGATGAAAGATCTTGGTTTCGTGAGGCAGAAATTTACCAGACGGTCATGCTGCGACATGAAAACATCCTTGGTTTCATTGCTGCTGACAACAAAGATAATGGAACTTGGACTCAACTTTGGCTGGTATCTGAATATCATGAACAGGGCTCCTTATATGACTATTTGAATAGAAATATAGTGACCGTGGCTGGAATGATCAAGCTGGCGCTCTCAATTGCTAGTGGTCTGGCACACCTTCATATGGAGATTGTTGGTACACAAGGTAAACCTGCTATTGCTCATCGAGACATAAAATCAAAGAATATCTTAGTGAAAAAGTGTGAAACTTGTGCCATAGCGGACTTAGGGTTGGCTGTGAAGCATGATTCAATACTGAACACTATCGACATACCTCAGAATCCTAAAGTGGGAACCAAGAGGTATATGGCTCCTGAAATGCTTGATGATACAATGAATGTGAATATCTTTGAGTCCTTCAAACGAGCTGACATCTATTCTGTTGGTCTGGTTTACTGGGAAATAGCCCGGAGGTGTTCAGTCGGAGGAATTGTTGAGGAGTACCAATTGCCTTATTATGACATGGTGCCTTCAGATCCCTCGATAGAGGAAATGAGAAAGGTTGTTTGTGACCAGAAGTTTCGACCAAGTATCCCAAACCAGTGGCAAAGTTGTGAAGCACTCCGAGTCATGGGGAGAATAATGCGTGAGTGTTGGTATGCCAACGGAGCGGCCCGCCTAACTGCTCTTCGTATTAAGAAGACTATATCTCAACTTTGTGTCAAAGAAGACTGCAAAGCC (서열 번호: 238)
ATGACCCGGGCGCTCTGCTCAGCGCTCCGCCAGGCTCTCCTGCTGCTCGCAGCGGCCGCCGAGCTCTCGCCAGGACTGAAGTGTGTATGTCTTTTGTGTGATTCTTCAAACTTTACCTGCCAAACAGAAGGAGCATGTTGGGCATCAGTCATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGATAATGGAACTTGGACTCAACTTTGGCTGGTATCTGAATATCATGAACAGGGCTCCTTATATGACTATTTGAATAGAAATATAGTGACCGTGGCTGGAATGATCAAGCTGGCGCTCTCAATTGCTAGTGGTCTGGCACACCTTCATATGGAGATTGTTGGTACACAAGGTAAACCTGCTATTGCTCATCGAGACATAAAATCAAAGAATATCTTAGTGAAAAAGTGTGAAACTTGTGCCATAGCGGACTTAGGGTTGGCTGTGAAGCATGATTCAATACTGAACACTATCGACATACCTCAGAATCCTAAAGTGGGAACCAAGAGGTATATGGCTCCTGAAATGCTTGATGATACAATGAATGTGAATATCTTTGAGTCCTTCAAACGAGCTGACATCTATTCTGTTGGTCTGGTTTACTGGGAAATAGCCCGGAGGTGTTCAGTCGGAGGAATTGTTGAGGAGTACCAATTGCCTTATTATGACATGGTGCCTTCAGATCCCTCGATAGAGGAAATGAGAAAGGTTGTTTGTGACCAGAAGTTTCGACCAAGTATCCCAAACCAGTGGCAAAGTTGTGAAGCACTCCGAGTCATGGGGAGAATAATGCGTGAGTGTTGGTATGCCAACGGAGCGGCCCGCCTAACTGCTCTTCGTATTAAGAAGACTATATCTCAACTTTGTGTCAAAGAAGACTGCAAAGCCTAA (서열 번호: 239)
GAGCTCTCGCCAGGACTGAAGTGTGTATGTCTTTTGTGTGATTCTTCAAACTTTACCTGCCAAACAGAAGGAGCATGTTGGGCATCAGTCATGCTAACCAATGGAAAAGAGCAGGTGATCAAATCCTGTGTCTCCCTTCCAGAACTGAATGCTCAAGTCTTCTGTCATAGTTCCAACAATGTTACCAAAACCGAATGCTGCTTCACAGATTTTTGCAACAACATAACACTGCACCTTCCAACAGATAATGGAACTTGGACTCAACTTTGGCTGGTATCTGAATATCATGAACAGGGCTCCTTATATGACTATTTGAATAGAAATATAGTGACCGTGGCTGGAATGATCAAGCTGGCGCTCTCAATTGCTAGTGGTCTGGCACACCTTCATATGGAGATTGTTGGTACACAAGGTAAACCTGCTATTGCTCATCGAGACATAAAATCAAAGAATATCTTAGTGAAAAAGTGTGAAACTTGTGCCATAGCGGACTTAGGGTTGGCTGTGAAGCATGATTCAATACTGAACACTATCGACATACCTCAGAATCCTAAAGTGGGAACCAAGAGGTATATGGCTCCTGAAATGCTTGATGATACAATGAATGTGAATATCTTTGAGTCCTTCAAACGAGCTGACATCTATTCTGTTGGTCTGGTTTACTGGGAAATAGCCCGGAGGTGTTCAGTCGGAGGAATTGTTGAGGAGTACCAATTGCCTTATTATGACATGGTGCCTTCAGATCCCTCGATAGAGGAAATGAGAAAGGTTGTTTGTGACCAGAAGTTTCGACCAAGTATCCCAAACCAGTGGCAAAGTTGTGAAGCACTCCGAGTCATGGGGAGAATAATGCGTGAGTGTTGGTATGCCAACGGAGCGGCCCGCCTAACTGCTCTTCGTATTAAGAAGACTATATCTCAACTTTGTGTCAAAGAAGACTGCAAAGCCTAA (서열 번호: 240)
1 ATGGGAGCTG CTGCAAAGTT GGCGTTTGCC GTCTTTCTTA TCTCCTGTTC
51
TTCAGGTGCT ATACTTGGTA GATCAGAAAC TCAGGAGTGT CTTTTCTTTA
101
ATGCTAATTG GGAAAAAGAC AGAACCAATC AAACTGGTGT TGAACCGTGT
151
TATGGTGACA AAGATAAACG GCGGCATTGT TTTGCTACCT GGAAGAATAT
201
TTCTGGTTCC ATTGAAATAG TGAAACAAGG TTGTTGGCTG GATGATATCA
251
ACTGCTATGA CAGGACTGAT TGTGTAGAAA AAAAAGACAG CCCTGAAGTA
301
TATTTTTGTT GCTGTGAGGG CAATATGTGT AATGAAAAGT TTTCTTATTT
351
TCCGGAGATG GAAGTCACAC AGCCCACTTC AAATCCAGTT ACACCTAAGC
401
CACCCTATTA CAACATCCTG CTCTATTCCT TGGTGCCACT TATGTTAATT
451
GCGGGGATTG TCATTTGTGC ATTTTGGGTG TACAGGCATC ACAAGATGGC
501
CTACCCTCCT GTACTTGTTC CAACTCAAGA CCCAGGACCA CCCCCACCTT
551
CTCCATTACT AGGTTTGAAA CCACTGCAGT TATTAGAAGT GAAAGCAAGG
601
GGAAGATTTG GTTGTGTCTG GAAAGCCCAG TTGCTTAACG AATATGTGGC
651
TGTCAAAATA TTTCCAATAC AGGACAAACA GTCATGGCAA AATGAATACG
701
AAGTCTACAG TTTGCCTGGA ATGAAGCATG AGAACATATT ACAGTTCATT
751
GGTGCAGAAA AACGAGGCAC CAGTGTTGAT GTGGATCTTT GGCTGATCAC
801
AGCATTTCAT GAAAAGGGTT CACTATCAGA CTTTCTTAAG GCTAATGTGG
851
TCTCTTGGAA TGAACTGTGT CATATTGCAG AAACCATGGC TAGAGGATTG
901
GCATATTTAC ATGAGGATAT ACCTGGCCTA AAAGATGGCC ACAAACCTGC
951
CATATCTCAC AGGGACATCA AAAGTAAAAA TGTGCTGTTG AAAAACAACC
1001
TGACAGCTTG CATTGCTGAC TTTGGGTTGG CCTTAAAATT TGAGGCTGGC
1051
AAGTCTGCAG GCGATACCCA TGGACAGGTT GGTACCCGGA GGTACATGGC
1101
TCCAGAGGTA TTAGAGGGTG CTATAAACTT CCAAAGGGAT GCATTTTTGA
1151
GGATAGATAT GTATGCCATG GGATTAGTCC TATGGGAACT GGCTTCTCGC
1201
TGTACTGCTG CAGATGGACC TGTAGATGAA TACATGTTGC CATTTGAGGA
1251
GGAAATTGGC CAGCATCCAT CTCTTGAAGA CATGCAGGAA GTTGTTGTGC
1301
ATAAAAAAAA GAGGCCTGTT TTAAGAGATT ATTGGCAGAA ACATGCTGGA
1351
ATGGCAATGC TCTGTGAAAC CATTGAAGAA TGTTGGGATC ACGACGCAGA
1401
AGCCAGGTTA TCAGCTGGAT GTGTAGGTGA AAGAATTACC CAGATGCAGA
1451
GACTAACAAA TATTATTACC ACAGAGGACA TTGTAACAGT GGTCACAATG
1501
GTGACAAATG TTGACTTTCC TCCCAAAGAA TCTAGTCTA
(서열 번호: 241)
1 ATACTTGGTA GATCAGAAAC TCAGGAGTGT CTTTTCTTTA ATGCTAATTG
51
GGAAAAAGAC AGAACCAATC AAACTGGTGT TGAACCGTGT TATGGTGACA
101
AAGATAAACG GCGGCATTGT TTTGCTACCT GGAAGAATAT TTCTGGTTCC
151
ATTGAAATAG TGAAACAAGG TTGTTGGCTG GATGATATCA ACTGCTATGA
201
CAGGACTGAT TGTGTAGAAA AAAAAGACAG CCCTGAAGTA TATTTTTGTT
251
GCTGTGAGGG CAATATGTGT AATGAAAAGT TTTCTTATTT TCCGGAGATG
301
GAAGTCACAC AGCCCACTTC AAATCCAGTT ACACCTAAGC CACCC
(서열 번호: 242)
SEQUENCE LISTING
<110> ACCELERON PHARMA INC.
<120> VARIANT ACTRIIB PROTEINS AND USES THEREOF
<130> 1848179-0002-119-WO1
<140> PCT/US2017/055421
<141> 2017-10-05
<150> 62/404,718
<151> 2016-10-05
<160> 280
<170> PatentIn version 3.5
<210> 1
<211> 115
<212> PRT
<213> Homo sapiens
<400> 1
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr
115
<210> 2
<211> 512
<212> PRT
<213> Homo sapiens
<400> 2
Met Thr Ala Pro Trp Val Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Ala Gly Ser Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr
20 25 30
Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg
35 40 45
Cys Glu Gly Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg
50 55 60
Asn Ser Ser Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp
65 70 75 80
Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn
85 90 95
Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg
100 105 110
Phe Thr His Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro
115 120 125
Pro Pro Thr Ala Pro Thr Leu Leu Thr Val Leu Ala Tyr Ser Leu Leu
130 135 140
Pro Ile Gly Gly Leu Ser Leu Ile Val Leu Leu Ala Phe Trp Met Tyr
145 150 155 160
Arg His Arg Lys Pro Pro Tyr Gly His Val Asp Ile His Glu Asp Pro
165 170 175
Gly Pro Pro Pro Pro Ser Pro Leu Val Gly Leu Lys Pro Leu Gln Leu
180 185 190
Leu Glu Ile Lys Ala Arg Gly Arg Phe Gly Cys Val Trp Lys Ala Gln
195 200 205
Leu Met Asn Asp Phe Val Ala Val Lys Ile Phe Pro Leu Gln Asp Lys
210 215 220
Gln Ser Trp Gln Ser Glu Arg Glu Ile Phe Ser Thr Pro Gly Met Lys
225 230 235 240
His Glu Asn Leu Leu Gln Phe Ile Ala Ala Glu Lys Arg Gly Ser Asn
245 250 255
Leu Glu Val Glu Leu Trp Leu Ile Thr Ala Phe His Asp Lys Gly Ser
260 265 270
Leu Thr Asp Tyr Leu Lys Gly Asn Ile Ile Thr Trp Asn Glu Leu Cys
275 280 285
His Val Ala Glu Thr Met Ser Arg Gly Leu Ser Tyr Leu His Glu Asp
290 295 300
Val Pro Trp Cys Arg Gly Glu Gly His Lys Pro Ser Ile Ala His Arg
305 310 315 320
Asp Phe Lys Ser Lys Asn Val Leu Leu Lys Ser Asp Leu Thr Ala Val
325 330 335
Leu Ala Asp Phe Gly Leu Ala Val Arg Phe Glu Pro Gly Lys Pro Pro
340 345 350
Gly Asp Thr His Gly Gln Val Gly Thr Arg Arg Tyr Met Ala Pro Glu
355 360 365
Val Leu Glu Gly Ala Ile Asn Phe Gln Arg Asp Ala Phe Leu Arg Ile
370 375 380
Asp Met Tyr Ala Met Gly Leu Val Leu Trp Glu Leu Val Ser Arg Cys
385 390 395 400
Lys Ala Ala Asp Gly Pro Val Asp Glu Tyr Met Leu Pro Phe Glu Glu
405 410 415
Glu Ile Gly Gln His Pro Ser Leu Glu Glu Leu Gln Glu Val Val Val
420 425 430
His Lys Lys Met Arg Pro Thr Ile Lys Asp His Trp Leu Lys His Pro
435 440 445
Gly Leu Ala Gln Leu Cys Val Thr Ile Glu Glu Cys Trp Asp His Asp
450 455 460
Ala Glu Ala Arg Leu Ser Ala Gly Cys Val Glu Glu Arg Val Ser Leu
465 470 475 480
Ile Arg Arg Ser Val Asn Gly Thr Thr Ser Asp Cys Leu Val Ser Leu
485 490 495
Val Thr Ser Val Thr Asn Val Asp Leu Pro Pro Lys Glu Ser Ser Ile
500 505 510
<210> 3
<211> 345
<212> DNA
<213> Homo sapiens
<400> 3
gggcgtgggg aggctgagac acgggagtgc atctactaca acgccaactg ggagctggag 60
cgcaccaacc agagcggcct ggagcgctgc gaaggcgagc aggacaagcg gctgcactgc 120
tacgcctcct ggcgcaacag ctctggcacc atcgagctcg tgaagaaggg ctgctggcta 180
gatgacttca actgctacga taggcaggag tgtgtggcca ctgaggagaa cccccaggtg 240
tacttctgct gctgtgaagg caacttctgc aacgagcgct tcactcattt gccagaggct 300
gggggcccgg aagtcacgta cgagccaccc ccgacagccc ccacc 345
<210> 4
<211> 1539
<212> DNA
<213> Homo sapiens
<400> 4
atgacggcgc cctgggtggc cctcgccctc ctctggggat cgctgtggcc cggctctggg 60
cgtggggagg ctgagacacg ggagtgcatc tactacaacg ccaactggga gctggagcgc 120
accaaccaga gcggcctgga gcgctgcgaa ggcgagcagg acaagcggct gcactgctac 180
gcctcctggc gcaacagctc tggcaccatc gagctcgtga agaagggctg ctggctagat 240
gacttcaact gctacgatag gcaggagtgt gtggccactg aggagaaccc ccaggtgtac 300
ttctgctgct gtgaaggcaa cttctgcaac gagcgcttca ctcatttgcc agaggctggg 360
ggcccggaag tcacgtacga gccacccccg acagccccca ccctgctcac ggtgctggcc 420
tactcactgc tgcccatcgg gggcctttcc ctcatcgtcc tgctggcctt ttggatgtac 480
cggcatcgca agccccccta cggtcatgtg gacatccatg aggaccctgg gcctccacca 540
ccatcccctc tggtgggcct gaagccactg cagctgctgg agatcaaggc tcgggggcgc 600
tttggctgtg tctggaaggc ccagctcatg aatgactttg tagctgtcaa gatcttccca 660
ctccaggaca agcagtcgtg gcagagtgaa cgggagatct tcagcacacc tggcatgaag 720
cacgagaacc tgctacagtt cattgctgcc gagaagcgag gctccaacct cgaagtagag 780
ctgtggctca tcacggcctt ccatgacaag ggctccctca cggattacct caaggggaac 840
atcatcacat ggaacgaact gtgtcatgta gcagagacga tgtcacgagg cctctcatac 900
ctgcatgagg atgtgccctg gtgccgtggc gagggccaca agccgtctat tgcccacagg 960
gactttaaaa gtaagaatgt attgctgaag agcgacctca cagccgtgct ggctgacttt 1020
ggcttggctg ttcgatttga gccagggaaa cctccagggg acacccacgg acaggtaggc 1080
acgagacggt acatggctcc tgaggtgctc gagggagcca tcaacttcca gagagatgcc 1140
ttcctgcgca ttgacatgta tgccatgggg ttggtgctgt gggagcttgt gtctcgctgc 1200
aaggctgcag acggacccgt ggatgagtac atgctgccct ttgaggaaga gattggccag 1260
cacccttcgt tggaggagct gcaggaggtg gtggtgcaca agaagatgag gcccaccatt 1320
aaagatcact ggttgaaaca cccgggcctg gcccagcttt gtgtgaccat cgaggagtgc 1380
tgggaccatg atgcagaggc tcgcttgtcc gcgggctgtg tggaggagcg ggtgtccctg 1440
attcggaggt cggtcaacgg cactacctcg gactgtctcg tttccctggt gacctctgtc 1500
accaatgtgg acctgccccc taaagagtca agcatctaa 1539
<210> 5
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 6
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 7
<211> 21
<212> PRT
<213> Apis mellifera
<400> 7
Met Lys Phe Leu Val Asn Val Ala Leu Val Phe Met Val Val Tyr Ile
1 5 10 15
Ser Tyr Ile Tyr Ala
20
<210> 8
<211> 22
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Tissue plasminogen activator
<400> 8
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro
20
<210> 9
<211> 18
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Native sequence
<400> 9
Met Thr Ala Pro Trp Val Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Ala Gly
<210> 10
<211> 1107
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 10
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
aagcggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct ggctagatga cttcaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 960
tccgacggct ccttcttcct ctatagcaag ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtctccggg taaatga 1107
<210> 11
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 11
Gly Arg Gly Glu Ala Glu
1 5
<210> 12
<211> 335
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 12
Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg
1 5 10 15
Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg
20 25 30
Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu
35 40 45
Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln
50 55 60
Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys
65 70 75 80
Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly
85 90 95
Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr Gly Gly Gly Thr His
100 105 110
Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
115 120 125
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
130 135 140
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
145 150 155 160
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
165 170 175
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
180 185 190
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
195 200 205
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
210 215 220
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
225 230 235 240
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
245 250 255
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
260 265 270
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
275 280 285
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
290 295 300
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
305 310 315 320
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330 335
<210> 13
<211> 225
<212> PRT
<213> Homo sapiens
<400> 13
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 14
<211> 223
<212> PRT
<213> Homo sapiens
<400> 14
Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val
1 5 10 15
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
20 25 30
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
35 40 45
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
50 55 60
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser
65 70 75 80
Val Leu Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
85 90 95
Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile
100 105 110
Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
115 120 125
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
130 135 140
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
145 150 155 160
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser
165 170 175
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
180 185 190
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
195 200 205
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
210 215 220
<210> 15
<211> 232
<212> PRT
<213> Homo sapiens
<400> 15
Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Ala
1 5 10 15
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
20 25 30
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
35 40 45
Val Asp Val Ser His Glu Asp Pro Glu Val Gln Phe Lys Trp Tyr Val
50 55 60
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
65 70 75 80
Tyr Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Leu His Gln
85 90 95
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
100 105 110
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro
115 120 125
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
130 135 140
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
145 150 155 160
Asp Ile Ala Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr
165 170 175
Asn Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
180 185 190
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe
195 200 205
Ser Cys Ser Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys
210 215 220
Ser Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 16
<211> 279
<212> PRT
<213> Homo sapiens
<400> 16
Glu Leu Lys Thr Pro Leu Gly Asp Thr Thr His Thr Cys Pro Arg Cys
1 5 10 15
Pro Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro
20 25 30
Glu Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Glu
35 40 45
Pro Lys Ser Cys Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Ala Pro
50 55 60
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
65 70 75 80
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
85 90 95
Asp Val Ser His Glu Asp Pro Glu Val Gln Phe Lys Trp Tyr Val Asp
100 105 110
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
115 120 125
Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
130 135 140
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
145 150 155 160
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg
165 170 175
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
180 185 190
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
195 200 205
Ile Ala Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Asn
210 215 220
Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
225 230 235 240
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser
245 250 255
Cys Ser Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser
260 265 270
Leu Ser Leu Ser Pro Gly Lys
275
<210> 17
<211> 229
<212> PRT
<213> Homo sapiens
<400> 17
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Ser Cys Pro Ala Pro Glu Phe
1 5 10 15
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
20 25 30
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
35 40 45
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
50 55 60
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
65 70 75 80
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
85 90 95
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
100 105 110
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
115 120 125
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
130 135 140
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
145 150 155 160
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
165 170 175
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
180 185 190
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
195 200 205
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
210 215 220
Leu Ser Leu Gly Lys
225
<210> 18
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 18
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Lys Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Lys Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 19
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 19
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 20
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 20
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Tyr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 21
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 21
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Thr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 22
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 22
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 23
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 23
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser
130 135 140
Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 24
<211> 228
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Phe Arg Pro Glu Val His Leu
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Ala Arg Gly Phe Tyr Pro Lys Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Ser Arg Gln
165 170 175
Glu Pro Ser Gln Gly Thr Thr Thr Phe Ala Val Thr Ser Lys Leu Thr
180 185 190
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
195 200 205
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Thr Ile Ser Leu
210 215 220
Ser Pro Gly Lys
225
<210> 25
<211> 228
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Pro Ser Glu Glu Leu Ala Leu Asn Glu Leu Val Thr Leu
130 135 140
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
145 150 155 160
Glu Ser Asn Gly Gln Glu Leu Pro Arg Glu Lys Tyr Leu Thr Trp Ala
165 170 175
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Ile Leu Arg
180 185 190
Val Ala Ala Glu Asp Trp Lys Lys Gly Asp Thr Phe Ser Cys Ser Val
195 200 205
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Asp Arg
210 215 220
Ser Pro Gly Lys
225
<210> 26
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 26
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys Gly Gly Ser Ala Gln Leu Glu Lys Glu Leu Gln Ala Leu Glu Lys
225 230 235 240
Glu Asn Ala Gln Leu Glu Trp Glu Leu Gln Ala Leu Glu Lys Glu Leu
245 250 255
Ala Gln Gly Ala Thr
260
<210> 27
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 27
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys Gly Gly Ser Ala Gln Leu Lys Lys Lys Leu Gln Ala Leu Lys Lys
225 230 235 240
Lys Asn Ala Gln Leu Lys Trp Lys Leu Gln Ala Leu Lys Lys Lys Leu
245 250 255
Ala Gln Gly Ala Thr
260
<210> 28
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 28
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Cys Arg Glu Glu Met Thr Glu Asn Gln Val Ser Leu Trp
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Asp Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 29
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 29
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr
115 120 125
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser
130 135 140
Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Arg Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Arg Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 30
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 30
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1 5 10 15
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
20 25 30
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
35 40 45
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
50 55 60
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
65 70 75 80
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
85 90 95
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
100 105 110
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
115 120 125
Leu Pro Pro Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp
130 135 140
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
145 150 155 160
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
165 170 175
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
180 185 190
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
195 200 205
Ala Leu His Asn Arg Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
210 215 220
Lys
225
<210> 31
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 31
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Ala Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 32
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
gcccggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct ggctagatga cttcaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 960
tccgacggct ccttcttcct ctatagcaag ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtccccggg taaa 1104
<210> 33
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Ala Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 34
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 34
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Glu Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 35
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 35
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
gagcggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct ggctagatga cttcaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 960
tccgacggct ccttcttcct ctatagcaag ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtccccggg taaa 1104
<210> 36
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 36
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Glu Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 37
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Ile Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 38
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
aagcggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct ggctagatga catcaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 960
tccgacggct ccttcttcct ctatagcaag ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtctccggg taaa 1104
<210> 39
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 39
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Ile Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 40
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 40
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Lys Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 41
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 41
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
aagcggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct ggctagatga caagaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 960
tccgacggct ccttcttcct ctatagcaag ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtctccggg taaa 1104
<210> 42
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 42
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Lys Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 43
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 43
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Glu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
355 360 365
<210> 44
<211> 1101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 44
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
aagcggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct gggaagatga cttcaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacgaca ccacgcctcc cgtgctggac 960
tccgacggct ccttcttcct ctatagcgac ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtctccggg t 1101
<210> 45
<211> 342
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 45
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Glu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Asp Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly
340
<210> 46
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Ser Arg Lys Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Lys
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 47
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctctgggcg tggggaggct gagacacggg agtgcatcta ctacaacgcc 120
aactgggagc tggagcgcac caaccagagc ggcctggagc gctgcgaagg cgagcaggac 180
aagcggctgc actgctacgc ctcctggcgc aacagctctg gcaccatcga gctcgtgaag 240
aagggctgct ggctagatga cttcaactgc tacgataggc aggagtgtgt ggccactgag 300
gagaaccccc aggtgtactt ctgctgctgt gaaggcaact tctgcaacga gcgcttcact 360
catttgccag aggctggggg cccggaagtc acgtacgagc cacccccgac agcccccacc 420
ggtggtggaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 480
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 540
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 600
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 660
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 720
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 780
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggaa ggagatgacc 840
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 900
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctgaag 960
tccgacggct ccttcttcct ctatagcaag ctcaccgtgg acaagagcag gtggcagcag 1020
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 1080
agcctctccc tgtctccggg taaa 1104
<210> 48
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Lys Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Lys Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 49
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 49
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Glu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
260 265 270
Pro Pro Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp Cys
275 280 285
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
355 360 365
<210> 50
<211> 342
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 50
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Glu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Tyr Thr Leu Pro Pro Cys Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Trp Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly
340
<210> 51
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 51
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Arg Gly Glu Ala Glu Thr
20 25 30
Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn
35 40 45
Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg Leu His
50 55 60
Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu Val Lys
65 70 75 80
Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys
85 90 95
Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly Gly Pro
115 120 125
Glu Val Thr Tyr Glu Pro Pro Pro Thr Ala Pro Thr Gly Gly Gly Thr
130 135 140
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
145 150 155 160
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
165 170 175
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
180 185 190
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
195 200 205
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
210 215 220
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
225 230 235 240
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
245 250 255
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu
260 265 270
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys
275 280 285
Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
290 295 300
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
305 310 315 320
Ser Asp Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser
325 330 335
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
340 345 350
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 52
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 52
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
115 120 125
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
130 135 140
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
145 150 155 160
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
165 170 175
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
180 185 190
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
195 200 205
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
210 215 220
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
225 230 235 240
Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
245 250 255
Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp
260 265 270
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
275 280 285
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val Ser
290 295 300
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
305 310 315 320
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
325 330 335
Leu Ser Leu Ser Pro Gly Lys
340
<210> 53
<211> 107
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 53
Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn Trp Glu Leu Glu Arg
1 5 10 15
Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly Glu Gln Asp Lys Arg
20 25 30
Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser Gly Thr Ile Glu Leu
35 40 45
Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln
50 55 60
Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val Tyr Phe Cys Cys Cys
65 70 75 80
Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His Leu Pro Glu Ala Gly
85 90 95
Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105
<210> 54
<400> 54
000
<210> 55
<400> 55
000
<210> 56
<211> 351
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 56
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Asp Pro Val Lys Pro Ser Arg Gly
20 25 30
Pro Leu Val Thr Cys Thr Cys Glu Ser Pro His Cys Lys Gly Pro Thr
35 40 45
Cys Arg Gly Ala Trp Cys Thr Val Val Leu Val Arg Glu Glu Gly Arg
50 55 60
His Pro Gln Glu His Arg Gly Cys Gly Asn Leu His Arg Glu Leu Cys
65 70 75 80
Arg Gly Arg Pro Thr Glu Phe Val Asn His Tyr Cys Cys Asp Ser His
85 90 95
Leu Cys Asn His Asn Val Ser Leu Val Leu Glu Ala Thr Gln Pro Pro
100 105 110
Ser Glu Gln Pro Gly Thr Asp Gly Gln Leu Ala Thr Gly Gly Gly Thr
115 120 125
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
130 135 140
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
145 150 155 160
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
165 170 175
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
180 185 190
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
195 200 205
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
210 215 220
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
225 230 235 240
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
245 250 255
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
260 265 270
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
275 280 285
Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp
290 295 300
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser
305 310 315 320
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
325 330 335
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
340 345 350
<210> 57
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 57
Asp Pro Val Lys Pro Ser Arg Gly Pro Leu Val Thr Cys Thr Cys Glu
1 5 10 15
Ser Pro His Cys Lys Gly Pro Thr Cys Arg Gly Ala Trp Cys Thr Val
20 25 30
Val Leu Val Arg Glu Glu Gly Arg His Pro Gln Glu His Arg Gly Cys
35 40 45
Gly Asn Leu His Arg Glu Leu Cys Arg Gly Arg Pro Thr Glu Phe Val
50 55 60
Asn His Tyr Cys Cys Asp Ser His Leu Cys Asn His Asn Val Ser Leu
65 70 75 80
Val Leu Glu Ala Thr Gln Pro Pro Ser Glu Gln Pro Gly Thr Asp Gly
85 90 95
Gln Leu Ala Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
100 105 110
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
115 120 125
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
130 135 140
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
145 150 155 160
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
165 170 175
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
180 185 190
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
195 200 205
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
210 215 220
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
225 230 235 240
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
245 250 255
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
260 265 270
Asp Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
275 280 285
Ser Asp Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
290 295 300
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
305 310 315 320
Ser Leu Ser Leu Ser Pro Gly
325
<210> 58
<400> 58
000
<210> 59
<400> 59
000
<210> 60
<211> 352
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 60
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Asp Pro Val Lys Pro Ser Arg Gly
20 25 30
Pro Leu Val Thr Cys Thr Cys Glu Ser Pro His Cys Lys Gly Pro Thr
35 40 45
Cys Arg Gly Ala Trp Cys Thr Val Val Leu Val Arg Glu Glu Gly Arg
50 55 60
His Pro Gln Glu His Arg Gly Cys Gly Asn Leu His Arg Glu Leu Cys
65 70 75 80
Arg Gly Arg Pro Thr Glu Phe Val Asn His Tyr Cys Cys Asp Ser His
85 90 95
Leu Cys Asn His Asn Val Ser Leu Val Leu Glu Ala Thr Gln Pro Pro
100 105 110
Ser Glu Gln Pro Gly Thr Asp Gly Gln Leu Ala Thr Gly Gly Gly Thr
115 120 125
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
130 135 140
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
145 150 155 160
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
165 170 175
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
180 185 190
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
195 200 205
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
210 215 220
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
225 230 235 240
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu
245 250 255
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys
260 265 270
Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
275 280 285
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
290 295 300
Ser Asp Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser
305 310 315 320
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
325 330 335
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
340 345 350
<210> 61
<211> 328
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 61
Asp Pro Val Lys Pro Ser Arg Gly Pro Leu Val Thr Cys Thr Cys Glu
1 5 10 15
Ser Pro His Cys Lys Gly Pro Thr Cys Arg Gly Ala Trp Cys Thr Val
20 25 30
Val Leu Val Arg Glu Glu Gly Arg His Pro Gln Glu His Arg Gly Cys
35 40 45
Gly Asn Leu His Arg Glu Leu Cys Arg Gly Arg Pro Thr Glu Phe Val
50 55 60
Asn His Tyr Cys Cys Asp Ser His Leu Cys Asn His Asn Val Ser Leu
65 70 75 80
Val Leu Glu Ala Thr Gln Pro Pro Ser Glu Gln Pro Gly Thr Asp Gly
85 90 95
Gln Leu Ala Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
100 105 110
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
115 120 125
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
130 135 140
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
145 150 155 160
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
165 170 175
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
180 185 190
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
195 200 205
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
210 215 220
Arg Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
225 230 235 240
Lys Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser
245 250 255
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
260 265 270
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val
275 280 285
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
290 295 300
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
305 310 315 320
Ser Leu Ser Leu Ser Pro Gly Lys
325
<210> 62
<400> 62
000
<210> 63
<400> 63
000
<210> 64
<211> 509
<212> PRT
<213> Homo sapiens
<400> 64
Met Val Asp Gly Val Met Ile Leu Pro Val Leu Ile Met Ile Ala Leu
1 5 10 15
Pro Ser Pro Ser Met Glu Asp Glu Lys Pro Lys Val Asn Pro Lys Leu
20 25 30
Tyr Met Cys Val Cys Glu Gly Leu Ser Cys Gly Asn Glu Asp His Cys
35 40 45
Glu Gly Gln Gln Cys Phe Ser Ser Leu Ser Ile Asn Asp Gly Phe His
50 55 60
Val Tyr Gln Lys Gly Cys Phe Gln Val Tyr Glu Gln Gly Lys Met Thr
65 70 75 80
Cys Lys Thr Pro Pro Ser Pro Gly Gln Ala Val Glu Cys Cys Gln Gly
85 90 95
Asp Trp Cys Asn Arg Asn Ile Thr Ala Gln Leu Pro Thr Lys Gly Lys
100 105 110
Ser Phe Pro Gly Thr Gln Asn Phe His Leu Glu Val Gly Leu Ile Ile
115 120 125
Leu Ser Val Val Phe Ala Val Cys Leu Leu Ala Cys Leu Leu Gly Val
130 135 140
Ala Leu Arg Lys Phe Lys Arg Arg Asn Gln Glu Arg Leu Asn Pro Arg
145 150 155 160
Asp Val Glu Tyr Gly Thr Ile Glu Gly Leu Ile Thr Thr Asn Val Gly
165 170 175
Asp Ser Thr Leu Ala Asp Leu Leu Asp His Ser Cys Thr Ser Gly Ser
180 185 190
Gly Ser Gly Leu Pro Phe Leu Val Gln Arg Thr Val Ala Arg Gln Ile
195 200 205
Thr Leu Leu Glu Cys Val Gly Lys Gly Arg Tyr Gly Glu Val Trp Arg
210 215 220
Gly Ser Trp Gln Gly Glu Asn Val Ala Val Lys Ile Phe Ser Ser Arg
225 230 235 240
Asp Glu Lys Ser Trp Phe Arg Glu Thr Glu Leu Tyr Asn Thr Val Met
245 250 255
Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ser Asp Met Thr Ser
260 265 270
Arg His Ser Ser Thr Gln Leu Trp Leu Ile Thr His Tyr His Glu Met
275 280 285
Gly Ser Leu Tyr Asp Tyr Leu Gln Leu Thr Thr Leu Asp Thr Val Ser
290 295 300
Cys Leu Arg Ile Val Leu Ser Ile Ala Ser Gly Leu Ala His Leu His
305 310 315 320
Ile Glu Ile Phe Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp
325 330 335
Leu Lys Ser Lys Asn Ile Leu Val Lys Lys Asn Gly Gln Cys Cys Ile
340 345 350
Ala Asp Leu Gly Leu Ala Val Met His Ser Gln Ser Thr Asn Gln Leu
355 360 365
Asp Val Gly Asn Asn Pro Arg Val Gly Thr Lys Arg Tyr Met Ala Pro
370 375 380
Glu Val Leu Asp Glu Thr Ile Gln Val Asp Cys Phe Asp Ser Tyr Lys
385 390 395 400
Arg Val Asp Ile Trp Ala Phe Gly Leu Val Leu Trp Glu Val Ala Arg
405 410 415
Arg Met Val Ser Asn Gly Ile Val Glu Asp Tyr Lys Pro Pro Phe Tyr
420 425 430
Asp Val Val Pro Asn Asp Pro Ser Phe Glu Asp Met Arg Lys Val Val
435 440 445
Cys Val Asp Gln Gln Arg Pro Asn Ile Pro Asn Arg Trp Phe Ser Asp
450 455 460
Pro Thr Leu Thr Ser Leu Ala Lys Leu Met Lys Glu Cys Trp Tyr Gln
465 470 475 480
Asn Pro Ser Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Leu Thr
485 490 495
Lys Ile Asp Asn Ser Leu Asp Lys Leu Lys Thr Asp Cys
500 505
<210> 65
<211> 103
<212> PRT
<213> Homo sapiens
<400> 65
Met Glu Asp Glu Lys Pro Lys Val Asn Pro Lys Leu Tyr Met Cys Val
1 5 10 15
Cys Glu Gly Leu Ser Cys Gly Asn Glu Asp His Cys Glu Gly Gln Gln
20 25 30
Cys Phe Ser Ser Leu Ser Ile Asn Asp Gly Phe His Val Tyr Gln Lys
35 40 45
Gly Cys Phe Gln Val Tyr Glu Gln Gly Lys Met Thr Cys Lys Thr Pro
50 55 60
Pro Ser Pro Gly Gln Ala Val Glu Cys Cys Gln Gly Asp Trp Cys Asn
65 70 75 80
Arg Asn Ile Thr Ala Gln Leu Pro Thr Lys Gly Lys Ser Phe Pro Gly
85 90 95
Thr Gln Asn Phe His Leu Glu
100
<210> 66
<211> 355
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 66
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Met Glu Asp Glu Lys Pro Lys Val
20 25 30
Asn Pro Lys Leu Tyr Met Cys Val Cys Glu Gly Leu Ser Cys Gly Asn
35 40 45
Glu Asp His Cys Glu Gly Gln Gln Cys Phe Ser Ser Leu Ser Ile Asn
50 55 60
Asp Gly Phe His Val Tyr Gln Lys Gly Cys Phe Gln Val Tyr Glu Gln
65 70 75 80
Gly Lys Met Thr Cys Lys Thr Pro Pro Ser Pro Gly Gln Ala Val Glu
85 90 95
Cys Cys Gln Gly Asp Trp Cys Asn Arg Asn Ile Thr Ala Gln Leu Pro
100 105 110
Thr Lys Gly Lys Ser Phe Pro Gly Thr Gln Asn Phe His Leu Glu Thr
115 120 125
Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
130 135 140
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
145 150 155 160
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
165 170 175
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
180 185 190
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
195 200 205
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
210 215 220
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
225 230 235 240
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
245 250 255
Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val
260 265 270
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
275 280 285
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro
290 295 300
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr
305 310 315 320
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
325 330 335
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
340 345 350
Ser Pro Gly
355
<210> 67
<211> 331
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 67
Met Glu Asp Glu Lys Pro Lys Val Asn Pro Lys Leu Tyr Met Cys Val
1 5 10 15
Cys Glu Gly Leu Ser Cys Gly Asn Glu Asp His Cys Glu Gly Gln Gln
20 25 30
Cys Phe Ser Ser Leu Ser Ile Asn Asp Gly Phe His Val Tyr Gln Lys
35 40 45
Gly Cys Phe Gln Val Tyr Glu Gln Gly Lys Met Thr Cys Lys Thr Pro
50 55 60
Pro Ser Pro Gly Gln Ala Val Glu Cys Cys Gln Gly Asp Trp Cys Asn
65 70 75 80
Arg Asn Ile Thr Ala Gln Leu Pro Thr Lys Gly Lys Ser Phe Pro Gly
85 90 95
Thr Gln Asn Phe His Leu Glu Thr Gly Gly Gly Thr His Thr Cys Pro
100 105 110
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
115 120 125
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
130 135 140
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
145 150 155 160
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
165 170 175
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
180 185 190
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
195 200 205
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
210 215 220
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
225 230 235 240
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
245 250 255
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
260 265 270
Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
275 280 285
Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
290 295 300
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
305 310 315 320
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
325 330
<210> 68
<400> 68
000
<210> 69
<400> 69
000
<210> 70
<211> 356
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 70
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Met Glu Asp Glu Lys Pro Lys Val
20 25 30
Asn Pro Lys Leu Tyr Met Cys Val Cys Glu Gly Leu Ser Cys Gly Asn
35 40 45
Glu Asp His Cys Glu Gly Gln Gln Cys Phe Ser Ser Leu Ser Ile Asn
50 55 60
Asp Gly Phe His Val Tyr Gln Lys Gly Cys Phe Gln Val Tyr Glu Gln
65 70 75 80
Gly Lys Met Thr Cys Lys Thr Pro Pro Ser Pro Gly Gln Ala Val Glu
85 90 95
Cys Cys Gln Gly Asp Trp Cys Asn Arg Asn Ile Thr Ala Gln Leu Pro
100 105 110
Thr Lys Gly Lys Ser Phe Pro Gly Thr Gln Asn Phe His Leu Glu Thr
115 120 125
Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
130 135 140
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
145 150 155 160
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
165 170 175
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
180 185 190
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
195 200 205
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
210 215 220
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
225 230 235 240
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
245 250 255
Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val
260 265 270
Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
275 280 285
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
290 295 300
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val Ser Lys Leu Thr
305 310 315 320
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
325 330 335
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
340 345 350
Ser Pro Gly Lys
355
<210> 71
<211> 332
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 71
Met Glu Asp Glu Lys Pro Lys Val Asn Pro Lys Leu Tyr Met Cys Val
1 5 10 15
Cys Glu Gly Leu Ser Cys Gly Asn Glu Asp His Cys Glu Gly Gln Gln
20 25 30
Cys Phe Ser Ser Leu Ser Ile Asn Asp Gly Phe His Val Tyr Gln Lys
35 40 45
Gly Cys Phe Gln Val Tyr Glu Gln Gly Lys Met Thr Cys Lys Thr Pro
50 55 60
Pro Ser Pro Gly Gln Ala Val Glu Cys Cys Gln Gly Asp Trp Cys Asn
65 70 75 80
Arg Asn Ile Thr Ala Gln Leu Pro Thr Lys Gly Lys Ser Phe Pro Gly
85 90 95
Thr Gln Asn Phe His Leu Glu Thr Gly Gly Gly Thr His Thr Cys Pro
100 105 110
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
115 120 125
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
130 135 140
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
145 150 155 160
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
165 170 175
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
180 185 190
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
195 200 205
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
210 215 220
Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg
225 230 235 240
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly
245 250 255
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
260 265 270
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
275 280 285
Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
290 295 300
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
305 310 315 320
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<211> 532
<212> PRT
<213> Homo sapiens
<400> 74
Met Pro Gln Leu Tyr Ile Tyr Ile Arg Leu Leu Gly Ala Tyr Leu Phe
1 5 10 15
Ile Ile Ser Arg Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly
20 25 30
Thr Gly Met Lys Ser Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly Val
35 40 45
Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser
50 55 60
Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly
65 70 75 80
His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu
85 90 95
Ala Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp
100 105 110
Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn
115 120 125
Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly
130 135 140
Pro Phe Phe Asp Gly Ser Ile Arg Trp Leu Val Leu Leu Ile Ser Met
145 150 155 160
Ala Val Cys Ile Ile Ala Met Ile Ile Phe Ser Ser Cys Phe Cys Tyr
165 170 175
Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Arg Arg Tyr Asn Arg Asp
180 185 190
Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp
195 200 205
Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu
210 215 220
Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val
225 230 235 240
Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu
245 250 255
Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe
260 265 270
Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile
275 280 285
Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln
290 295 300
Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe
305 310 315 320
Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr
325 330 335
Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr
340 345 350
Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile
355 360 365
Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala
370 375 380
Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Val Pro Leu Asn Thr
385 390 395 400
Arg Val Gly Thr Lys Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser
405 410 415
Leu Asn Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser
420 425 430
Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly
435 440 445
Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp
450 455 460
Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg
465 470 475 480
Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val
485 490 495
Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu
500 505 510
Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln
515 520 525
Asp Val Lys Ile
530
<210> 75
<211> 129
<212> PRT
<213> Homo sapiens
<400> 75
Gln Asn Leu Asp Ser Met Leu His Gly Thr Gly Met Lys Ser Asp Ser
1 5 10 15
Asp Gln Lys Lys Ser Glu Asn Gly Val Thr Leu Ala Pro Glu Asp Thr
20 25 30
Leu Pro Phe Leu Lys Cys Tyr Cys Ser Gly His Cys Pro Asp Asp Ala
35 40 45
Ile Asn Asn Thr Cys Ile Thr Asn Gly His Cys Phe Ala Ile Ile Glu
50 55 60
Glu Asp Asp Gln Gly Glu Thr Thr Leu Ala Ser Gly Cys Met Lys Tyr
65 70 75 80
Glu Gly Ser Asp Phe Gln Cys Lys Asp Ser Pro Lys Ala Gln Leu Arg
85 90 95
Arg Thr Ile Glu Cys Cys Arg Thr Asn Leu Cys Asn Gln Tyr Leu Gln
100 105 110
Pro Thr Leu Pro Pro Val Val Ile Gly Pro Phe Phe Asp Gly Ser Ile
115 120 125
Arg
<210> 76
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 76
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Gln Asn Leu Asp Ser Met Leu His
20 25 30
Gly Thr Gly Met Lys Ser Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly
35 40 45
Val Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys
50 55 60
Ser Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn
65 70 75 80
Gly His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr
85 90 95
Leu Ala Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys
100 105 110
Asp Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr
115 120 125
Asn Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile
130 135 140
Gly Pro Phe Phe Asp Gly Ser Ile Arg Thr Gly Gly Gly Thr His Thr
145 150 155 160
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
165 170 175
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
180 185 190
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
195 200 205
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
210 215 220
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
225 230 235 240
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
245 250 255
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
260 265 270
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
275 280 285
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
290 295 300
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
305 310 315 320
Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp Ser Asp
325 330 335
Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser Arg Trp
340 345 350
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
355 360 365
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
370 375 380
<210> 77
<211> 359
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 77
Gly Ala Gln Asn Leu Asp Ser Met Leu His Gly Thr Gly Met Lys Ser
1 5 10 15
Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly Val Thr Leu Ala Pro Glu
20 25 30
Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser Gly His Cys Pro Asp
35 40 45
Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly His Cys Phe Ala Ile
50 55 60
Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu Ala Ser Gly Cys Met
65 70 75 80
Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp Ser Pro Lys Ala Gln
85 90 95
Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn Leu Cys Asn Gln Tyr
100 105 110
Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly Pro Phe Phe Asp Gly
115 120 125
Ser Ile Arg Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
130 135 140
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
145 150 155 160
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
165 170 175
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
180 185 190
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
195 200 205
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
210 215 220
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
225 230 235 240
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
245 250 255
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
260 265 270
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
275 280 285
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
290 295 300
Asp Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
305 310 315 320
Ser Asp Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
325 330 335
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
340 345 350
Ser Leu Ser Leu Ser Pro Gly
355
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<211> 382
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 80
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Gln Asn Leu Asp Ser Met Leu His
20 25 30
Gly Thr Gly Met Lys Ser Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly
35 40 45
Val Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys
50 55 60
Ser Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn
65 70 75 80
Gly His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr
85 90 95
Leu Ala Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys
100 105 110
Asp Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr
115 120 125
Asn Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile
130 135 140
Gly Pro Phe Phe Asp Gly Ser Ile Arg Thr Gly Gly Gly Thr His Thr
145 150 155 160
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
165 170 175
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
180 185 190
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
195 200 205
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
210 215 220
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
225 230 235 240
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
245 250 255
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
260 265 270
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro
275 280 285
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val
290 295 300
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
305 310 315 320
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
325 330 335
Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
340 345 350
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
355 360 365
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
370 375 380
<210> 81
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 81
Gly Ala Gln Asn Leu Asp Ser Met Leu His Gly Thr Gly Met Lys Ser
1 5 10 15
Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly Val Thr Leu Ala Pro Glu
20 25 30
Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser Gly His Cys Pro Asp
35 40 45
Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly His Cys Phe Ala Ile
50 55 60
Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu Ala Ser Gly Cys Met
65 70 75 80
Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp Ser Pro Lys Ala Gln
85 90 95
Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn Leu Cys Asn Gln Tyr
100 105 110
Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly Pro Phe Phe Asp Gly
115 120 125
Ser Ile Arg Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
130 135 140
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
145 150 155 160
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
165 170 175
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
180 185 190
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
195 200 205
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
210 215 220
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
225 230 235 240
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
245 250 255
Arg Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
260 265 270
Lys Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser
275 280 285
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
290 295 300
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val
305 310 315 320
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
325 330 335
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
340 345 350
Ser Leu Ser Leu Ser Pro Gly Lys
355 360
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<211> 505
<212> PRT
<213> Homo sapiens
<400> 84
Met Ala Glu Ser Ala Gly Ala Ser Ser Phe Phe Pro Leu Val Val Leu
1 5 10 15
Leu Leu Ala Gly Ser Gly Gly Ser Gly Pro Arg Gly Val Gln Ala Leu
20 25 30
Leu Cys Ala Cys Thr Ser Cys Leu Gln Ala Asn Tyr Thr Cys Glu Thr
35 40 45
Asp Gly Ala Cys Met Val Ser Ile Phe Asn Leu Asp Gly Met Glu His
50 55 60
His Val Arg Thr Cys Ile Pro Lys Val Glu Leu Val Pro Ala Gly Lys
65 70 75 80
Pro Phe Tyr Cys Leu Ser Ser Glu Asp Leu Arg Asn Thr His Cys Cys
85 90 95
Tyr Thr Asp Tyr Cys Asn Arg Ile Asp Leu Arg Val Pro Ser Gly His
100 105 110
Leu Lys Glu Pro Glu His Pro Ser Met Trp Gly Pro Val Glu Leu Val
115 120 125
Gly Ile Ile Ala Gly Pro Val Phe Leu Leu Phe Leu Ile Ile Ile Ile
130 135 140
Val Phe Leu Val Ile Asn Tyr His Gln Arg Val Tyr His Asn Arg Gln
145 150 155 160
Arg Leu Asp Met Glu Asp Pro Ser Cys Glu Met Cys Leu Ser Lys Asp
165 170 175
Lys Thr Leu Gln Asp Leu Val Tyr Asp Leu Ser Thr Ser Gly Ser Gly
180 185 190
Ser Gly Leu Pro Leu Phe Val Gln Arg Thr Val Ala Arg Thr Ile Val
195 200 205
Leu Gln Glu Ile Ile Gly Lys Gly Arg Phe Gly Glu Val Trp Arg Gly
210 215 220
Arg Trp Arg Gly Gly Asp Val Ala Val Lys Ile Phe Ser Ser Arg Glu
225 230 235 240
Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln Thr Val Met Leu
245 250 255
Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp Asn Lys Asp Asn
260 265 270
Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Asp Tyr His Glu His Gly
275 280 285
Ser Leu Phe Asp Tyr Leu Asn Arg Tyr Thr Val Thr Ile Glu Gly Met
290 295 300
Ile Lys Leu Ala Leu Ser Ala Ala Ser Gly Leu Ala His Leu His Met
305 310 315 320
Glu Ile Val Gly Thr Gln Gly Lys Pro Gly Ile Ala His Arg Asp Leu
325 330 335
Lys Ser Lys Asn Ile Leu Val Lys Lys Asn Gly Met Cys Ala Ile Ala
340 345 350
Asp Leu Gly Leu Ala Val Arg His Asp Ala Val Thr Asp Thr Ile Asp
355 360 365
Ile Ala Pro Asn Gln Arg Val Gly Thr Lys Arg Tyr Met Ala Pro Glu
370 375 380
Val Leu Asp Glu Thr Ile Asn Met Lys His Phe Asp Ser Phe Lys Cys
385 390 395 400
Ala Asp Ile Tyr Ala Leu Gly Leu Val Tyr Trp Glu Ile Ala Arg Arg
405 410 415
Cys Asn Ser Gly Gly Val His Glu Glu Tyr Gln Leu Pro Tyr Tyr Asp
420 425 430
Leu Val Pro Ser Asp Pro Ser Ile Glu Glu Met Arg Lys Val Val Cys
435 440 445
Asp Gln Lys Leu Arg Pro Asn Ile Pro Asn Trp Trp Gln Ser Tyr Glu
450 455 460
Ala Leu Arg Val Met Gly Lys Met Met Arg Glu Cys Trp Tyr Ala Asn
465 470 475 480
Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Leu Ser Gln
485 490 495
Leu Ser Val Gln Glu Asp Val Lys Ile
500 505
<210> 85
<211> 546
<212> PRT
<213> Homo sapiens
<400> 85
Met Ala Glu Ser Ala Gly Ala Ser Ser Phe Phe Pro Leu Val Val Leu
1 5 10 15
Leu Leu Ala Gly Ser Gly Gly Ser Gly Pro Arg Gly Val Gln Ala Leu
20 25 30
Leu Cys Ala Cys Thr Ser Cys Leu Gln Ala Asn Tyr Thr Cys Glu Thr
35 40 45
Asp Gly Ala Cys Met Val Ser Ile Phe Asn Leu Asp Gly Met Glu His
50 55 60
His Val Arg Thr Cys Ile Pro Lys Val Glu Leu Val Pro Ala Gly Lys
65 70 75 80
Pro Phe Tyr Cys Leu Ser Ser Glu Asp Leu Arg Asn Thr His Cys Cys
85 90 95
Tyr Thr Asp Tyr Cys Asn Arg Ile Asp Leu Arg Val Pro Ser Gly His
100 105 110
Leu Lys Glu Pro Glu His Pro Ser Met Trp Gly Pro Val Glu Leu Val
115 120 125
Gly Ile Ile Ala Gly Pro Val Phe Leu Leu Phe Leu Ile Ile Ile Ile
130 135 140
Val Phe Leu Val Ile Asn Tyr His Gln Arg Val Tyr His Asn Arg Gln
145 150 155 160
Arg Leu Asp Met Glu Asp Pro Ser Cys Glu Met Cys Leu Ser Lys Asp
165 170 175
Lys Thr Leu Gln Asp Leu Val Tyr Asp Leu Ser Thr Ser Gly Ser Gly
180 185 190
Ser Gly Leu Pro Leu Phe Val Gln Arg Thr Val Ala Arg Thr Ile Val
195 200 205
Leu Gln Glu Ile Ile Gly Lys Gly Arg Phe Gly Glu Val Trp Arg Gly
210 215 220
Arg Trp Arg Gly Gly Asp Val Ala Val Lys Ile Phe Ser Ser Arg Glu
225 230 235 240
Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln Thr Val Met Leu
245 250 255
Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp Asn Lys Ala Asp
260 265 270
Cys Ser Phe Leu Thr Leu Pro Trp Glu Val Val Met Val Ser Ala Ala
275 280 285
Pro Lys Leu Arg Ser Leu Arg Leu Gln Tyr Lys Gly Gly Arg Gly Arg
290 295 300
Ala Arg Phe Leu Phe Pro Leu Asn Asn Gly Thr Trp Thr Gln Leu Trp
305 310 315 320
Leu Val Ser Asp Tyr His Glu His Gly Ser Leu Phe Asp Tyr Leu Asn
325 330 335
Arg Tyr Thr Val Thr Ile Glu Gly Met Ile Lys Leu Ala Leu Ser Ala
340 345 350
Ala Ser Gly Leu Ala His Leu His Met Glu Ile Val Gly Thr Gln Gly
355 360 365
Lys Pro Gly Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile Leu Val
370 375 380
Lys Lys Asn Gly Met Cys Ala Ile Ala Asp Leu Gly Leu Ala Val Arg
385 390 395 400
His Asp Ala Val Thr Asp Thr Ile Asp Ile Ala Pro Asn Gln Arg Val
405 410 415
Gly Thr Lys Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Thr Ile Asn
420 425 430
Met Lys His Phe Asp Ser Phe Lys Cys Ala Asp Ile Tyr Ala Leu Gly
435 440 445
Leu Val Tyr Trp Glu Ile Ala Arg Arg Cys Asn Ser Gly Gly Val His
450 455 460
Glu Glu Tyr Gln Leu Pro Tyr Tyr Asp Leu Val Pro Ser Asp Pro Ser
465 470 475 480
Ile Glu Glu Met Arg Lys Val Val Cys Asp Gln Lys Leu Arg Pro Asn
485 490 495
Ile Pro Asn Trp Trp Gln Ser Tyr Glu Ala Leu Arg Val Met Gly Lys
500 505 510
Met Met Arg Glu Cys Trp Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala
515 520 525
Leu Arg Ile Lys Lys Thr Leu Ser Gln Leu Ser Val Gln Glu Asp Val
530 535 540
Lys Ile
545
<210> 86
<211> 103
<212> PRT
<213> Homo sapiens
<400> 86
Ser Gly Pro Arg Gly Val Gln Ala Leu Leu Cys Ala Cys Thr Ser Cys
1 5 10 15
Leu Gln Ala Asn Tyr Thr Cys Glu Thr Asp Gly Ala Cys Met Val Ser
20 25 30
Ile Phe Asn Leu Asp Gly Met Glu His His Val Arg Thr Cys Ile Pro
35 40 45
Lys Val Glu Leu Val Pro Ala Gly Lys Pro Phe Tyr Cys Leu Ser Ser
50 55 60
Glu Asp Leu Arg Asn Thr His Cys Cys Tyr Thr Asp Tyr Cys Asn Arg
65 70 75 80
Ile Asp Leu Arg Val Pro Ser Gly His Leu Lys Glu Pro Glu His Pro
85 90 95
Ser Met Trp Gly Pro Val Glu
100
<210> 87
<211> 103
<212> PRT
<213> Homo sapiens
<400> 87
Ser Gly Pro Arg Gly Val Gln Ala Leu Leu Cys Ala Cys Thr Ser Cys
1 5 10 15
Leu Gln Ala Asn Tyr Thr Cys Glu Thr Asp Gly Ala Cys Met Val Ser
20 25 30
Ile Phe Asn Leu Asp Gly Met Glu His His Val Arg Thr Cys Ile Pro
35 40 45
Lys Val Glu Leu Val Pro Ala Gly Lys Pro Phe Tyr Cys Leu Ser Ser
50 55 60
Glu Asp Leu Arg Asn Thr His Cys Cys Tyr Thr Asp Tyr Cys Asn Arg
65 70 75 80
Ile Asp Leu Arg Val Pro Ser Gly His Leu Lys Glu Pro Glu His Pro
85 90 95
Ser Met Trp Gly Pro Val Glu
100
<210> 88
<211> 355
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 88
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Pro Arg Gly Val Gln Ala
20 25 30
Leu Leu Cys Ala Cys Thr Ser Cys Leu Gln Ala Asn Tyr Thr Cys Glu
35 40 45
Thr Asp Gly Ala Cys Met Val Ser Ile Phe Asn Leu Asp Gly Met Glu
50 55 60
His His Val Arg Thr Cys Ile Pro Lys Val Glu Leu Val Pro Ala Gly
65 70 75 80
Lys Pro Phe Tyr Cys Leu Ser Ser Glu Asp Leu Arg Asn Thr His Cys
85 90 95
Cys Tyr Thr Asp Tyr Cys Asn Arg Ile Asp Leu Arg Val Pro Ser Gly
100 105 110
His Leu Lys Glu Pro Glu His Pro Ser Met Trp Gly Pro Val Glu Thr
115 120 125
Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
130 135 140
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
145 150 155 160
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
165 170 175
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
180 185 190
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
195 200 205
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
210 215 220
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
225 230 235 240
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
245 250 255
Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val
260 265 270
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
275 280 285
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro
290 295 300
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr
305 310 315 320
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
325 330 335
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
340 345 350
Ser Pro Gly
355
<210> 89
<211> 331
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 89
Ser Gly Pro Arg Gly Val Gln Ala Leu Leu Cys Ala Cys Thr Ser Cys
1 5 10 15
Leu Gln Ala Asn Tyr Thr Cys Glu Thr Asp Gly Ala Cys Met Val Ser
20 25 30
Ile Phe Asn Leu Asp Gly Met Glu His His Val Arg Thr Cys Ile Pro
35 40 45
Lys Val Glu Leu Val Pro Ala Gly Lys Pro Phe Tyr Cys Leu Ser Ser
50 55 60
Glu Asp Leu Arg Asn Thr His Cys Cys Tyr Thr Asp Tyr Cys Asn Arg
65 70 75 80
Ile Asp Leu Arg Val Pro Ser Gly His Leu Lys Glu Pro Glu His Pro
85 90 95
Ser Met Trp Gly Pro Val Glu Thr Gly Gly Gly Thr His Thr Cys Pro
100 105 110
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
115 120 125
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
130 135 140
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
145 150 155 160
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
165 170 175
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
180 185 190
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
195 200 205
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
210 215 220
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
225 230 235 240
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
245 250 255
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
260 265 270
Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
275 280 285
Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
290 295 300
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
305 310 315 320
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
325 330
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<211> 356
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 92
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Pro Arg Gly Val Gln Ala
20 25 30
Leu Leu Cys Ala Cys Thr Ser Cys Leu Gln Ala Asn Tyr Thr Cys Glu
35 40 45
Thr Asp Gly Ala Cys Met Val Ser Ile Phe Asn Leu Asp Gly Met Glu
50 55 60
His His Val Arg Thr Cys Ile Pro Lys Val Glu Leu Val Pro Ala Gly
65 70 75 80
Lys Pro Phe Tyr Cys Leu Ser Ser Glu Asp Leu Arg Asn Thr His Cys
85 90 95
Cys Tyr Thr Asp Tyr Cys Asn Arg Ile Asp Leu Arg Val Pro Ser Gly
100 105 110
His Leu Lys Glu Pro Glu His Pro Ser Met Trp Gly Pro Val Glu Thr
115 120 125
Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
130 135 140
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
145 150 155 160
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
165 170 175
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
180 185 190
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
195 200 205
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
210 215 220
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
225 230 235 240
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
245 250 255
Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val
260 265 270
Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
275 280 285
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
290 295 300
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val Ser Lys Leu Thr
305 310 315 320
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
325 330 335
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
340 345 350
Ser Pro Gly Lys
355
<210> 93
<211> 332
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 93
Ser Gly Pro Arg Gly Val Gln Ala Leu Leu Cys Ala Cys Thr Ser Cys
1 5 10 15
Leu Gln Ala Asn Tyr Thr Cys Glu Thr Asp Gly Ala Cys Met Val Ser
20 25 30
Ile Phe Asn Leu Asp Gly Met Glu His His Val Arg Thr Cys Ile Pro
35 40 45
Lys Val Glu Leu Val Pro Ala Gly Lys Pro Phe Tyr Cys Leu Ser Ser
50 55 60
Glu Asp Leu Arg Asn Thr His Cys Cys Tyr Thr Asp Tyr Cys Asn Arg
65 70 75 80
Ile Asp Leu Arg Val Pro Ser Gly His Leu Lys Glu Pro Glu His Pro
85 90 95
Ser Met Trp Gly Pro Val Glu Thr Gly Gly Gly Thr His Thr Cys Pro
100 105 110
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
115 120 125
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
130 135 140
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
145 150 155 160
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
165 170 175
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
180 185 190
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
195 200 205
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
210 215 220
Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg
225 230 235 240
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly
245 250 255
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
260 265 270
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
275 280 285
Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
290 295 300
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
305 310 315 320
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<211> 503
<212> PRT
<213> Homo sapiens
<400> 96
Met Glu Ala Ala Val Ala Ala Pro Arg Pro Arg Leu Leu Leu Leu Val
1 5 10 15
Leu Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu Leu Pro Gly Ala Thr
20 25 30
Ala Leu Gln Cys Phe Cys His Leu Cys Thr Lys Asp Asn Phe Thr Cys
35 40 45
Val Thr Asp Gly Leu Cys Phe Val Ser Val Thr Glu Thr Thr Asp Lys
50 55 60
Val Ile His Asn Ser Met Cys Ile Ala Glu Ile Asp Leu Ile Pro Arg
65 70 75 80
Asp Arg Pro Phe Val Cys Ala Pro Ser Ser Lys Thr Gly Ser Val Thr
85 90 95
Thr Thr Tyr Cys Cys Asn Gln Asp His Cys Asn Lys Ile Glu Leu Pro
100 105 110
Thr Thr Val Lys Ser Ser Pro Gly Leu Gly Pro Val Glu Leu Ala Ala
115 120 125
Val Ile Ala Gly Pro Val Cys Phe Val Cys Ile Ser Leu Met Leu Met
130 135 140
Val Tyr Ile Cys His Asn Arg Thr Val Ile His His Arg Val Pro Asn
145 150 155 160
Glu Glu Asp Pro Ser Leu Asp Arg Pro Phe Ile Ser Glu Gly Thr Thr
165 170 175
Leu Lys Asp Leu Ile Tyr Asp Met Thr Thr Ser Gly Ser Gly Ser Gly
180 185 190
Leu Pro Leu Leu Val Gln Arg Thr Ile Ala Arg Thr Ile Val Leu Gln
195 200 205
Glu Ser Ile Gly Lys Gly Arg Phe Gly Glu Val Trp Arg Gly Lys Trp
210 215 220
Arg Gly Glu Glu Val Ala Val Lys Ile Phe Ser Ser Arg Glu Glu Arg
225 230 235 240
Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln Thr Val Met Leu Arg His
245 250 255
Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp Asn Lys Asp Asn Gly Thr
260 265 270
Trp Thr Gln Leu Trp Leu Val Ser Asp Tyr His Glu His Gly Ser Leu
275 280 285
Phe Asp Tyr Leu Asn Arg Tyr Thr Val Thr Val Glu Gly Met Ile Lys
290 295 300
Leu Ala Leu Ser Thr Ala Ser Gly Leu Ala His Leu His Met Glu Ile
305 310 315 320
Val Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser
325 330 335
Lys Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu
340 345 350
Gly Leu Ala Val Arg His Asp Ser Ala Thr Asp Thr Ile Asp Ile Ala
355 360 365
Pro Asn His Arg Val Gly Thr Lys Arg Tyr Met Ala Pro Glu Val Leu
370 375 380
Asp Asp Ser Ile Asn Met Lys His Phe Glu Ser Phe Lys Arg Ala Asp
385 390 395 400
Ile Tyr Ala Met Gly Leu Val Phe Trp Glu Ile Ala Arg Arg Cys Ser
405 410 415
Ile Gly Gly Ile His Glu Asp Tyr Gln Leu Pro Tyr Tyr Asp Leu Val
420 425 430
Pro Ser Asp Pro Ser Val Glu Glu Met Arg Lys Val Val Cys Glu Gln
435 440 445
Lys Leu Arg Pro Asn Ile Pro Asn Arg Trp Gln Ser Cys Glu Ala Leu
450 455 460
Arg Val Met Ala Lys Ile Met Arg Glu Cys Trp Tyr Ala Asn Gly Ala
465 470 475 480
Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Leu Ser Gln Leu Ser
485 490 495
Gln Gln Glu Gly Ile Lys Met
500
<210> 97
<211> 507
<212> PRT
<213> Homo sapiens
<400> 97
Met Glu Ala Ala Val Ala Ala Pro Arg Pro Arg Leu Leu Leu Leu Val
1 5 10 15
Leu Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu Leu Pro Gly Ala Thr
20 25 30
Ala Leu Gln Cys Phe Cys His Leu Cys Thr Lys Asp Asn Phe Thr Cys
35 40 45
Val Thr Asp Gly Leu Cys Phe Val Ser Val Thr Glu Thr Thr Asp Lys
50 55 60
Val Ile His Asn Ser Met Cys Ile Ala Glu Ile Asp Leu Ile Pro Arg
65 70 75 80
Asp Arg Pro Phe Val Cys Ala Pro Ser Ser Lys Thr Gly Ser Val Thr
85 90 95
Thr Thr Tyr Cys Cys Asn Gln Asp His Cys Asn Lys Ile Glu Leu Pro
100 105 110
Thr Thr Gly Pro Phe Ser Val Lys Ser Ser Pro Gly Leu Gly Pro Val
115 120 125
Glu Leu Ala Ala Val Ile Ala Gly Pro Val Cys Phe Val Cys Ile Ser
130 135 140
Leu Met Leu Met Val Tyr Ile Cys His Asn Arg Thr Val Ile His His
145 150 155 160
Arg Val Pro Asn Glu Glu Asp Pro Ser Leu Asp Arg Pro Phe Ile Ser
165 170 175
Glu Gly Thr Thr Leu Lys Asp Leu Ile Tyr Asp Met Thr Thr Ser Gly
180 185 190
Ser Gly Ser Gly Leu Pro Leu Leu Val Gln Arg Thr Ile Ala Arg Thr
195 200 205
Ile Val Leu Gln Glu Ser Ile Gly Lys Gly Arg Phe Gly Glu Val Trp
210 215 220
Arg Gly Lys Trp Arg Gly Glu Glu Val Ala Val Lys Ile Phe Ser Ser
225 230 235 240
Arg Glu Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln Thr Val
245 250 255
Met Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp Asn Lys
260 265 270
Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Asp Tyr His Glu
275 280 285
His Gly Ser Leu Phe Asp Tyr Leu Asn Arg Tyr Thr Val Thr Val Glu
290 295 300
Gly Met Ile Lys Leu Ala Leu Ser Thr Ala Ser Gly Leu Ala His Leu
305 310 315 320
His Met Glu Ile Val Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg
325 330 335
Asp Leu Lys Ser Lys Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys
340 345 350
Ile Ala Asp Leu Gly Leu Ala Val Arg His Asp Ser Ala Thr Asp Thr
355 360 365
Ile Asp Ile Ala Pro Asn His Arg Val Gly Thr Lys Arg Tyr Met Ala
370 375 380
Pro Glu Val Leu Asp Asp Ser Ile Asn Met Lys His Phe Glu Ser Phe
385 390 395 400
Lys Arg Ala Asp Ile Tyr Ala Met Gly Leu Val Phe Trp Glu Ile Ala
405 410 415
Arg Arg Cys Ser Ile Gly Gly Ile His Glu Asp Tyr Gln Leu Pro Tyr
420 425 430
Tyr Asp Leu Val Pro Ser Asp Pro Ser Val Glu Glu Met Arg Lys Val
435 440 445
Val Cys Glu Gln Lys Leu Arg Pro Asn Ile Pro Asn Arg Trp Gln Ser
450 455 460
Cys Glu Ala Leu Arg Val Met Ala Lys Ile Met Arg Glu Cys Trp Tyr
465 470 475 480
Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Leu
485 490 495
Ser Gln Leu Ser Gln Gln Glu Gly Ile Lys Met
500 505
<210> 98
<211> 102
<212> PRT
<213> Homo sapiens
<400> 98
Ala Ala Leu Leu Pro Gly Ala Thr Ala Leu Gln Cys Phe Cys His Leu
1 5 10 15
Cys Thr Lys Asp Asn Phe Thr Cys Val Thr Asp Gly Leu Cys Phe Val
20 25 30
Ser Val Thr Glu Thr Thr Asp Lys Val Ile His Asn Ser Met Cys Ile
35 40 45
Ala Glu Ile Asp Leu Ile Pro Arg Asp Arg Pro Phe Val Cys Ala Pro
50 55 60
Ser Ser Lys Thr Gly Ser Val Thr Thr Thr Tyr Cys Cys Asn Gln Asp
65 70 75 80
His Cys Asn Lys Ile Glu Leu Pro Thr Thr Val Lys Ser Ser Pro Gly
85 90 95
Leu Gly Pro Val Glu Leu
100
<210> 99
<211> 106
<212> PRT
<213> Homo sapiens
<400> 99
Ala Ala Leu Leu Pro Gly Ala Thr Ala Leu Gln Cys Phe Cys His Leu
1 5 10 15
Cys Thr Lys Asp Asn Phe Thr Cys Val Thr Asp Gly Leu Cys Phe Val
20 25 30
Ser Val Thr Glu Thr Thr Asp Lys Val Ile His Asn Ser Met Cys Ile
35 40 45
Ala Glu Ile Asp Leu Ile Pro Arg Asp Arg Pro Phe Val Cys Ala Pro
50 55 60
Ser Ser Lys Thr Gly Ser Val Thr Thr Thr Tyr Cys Cys Asn Gln Asp
65 70 75 80
His Cys Asn Lys Ile Glu Leu Pro Thr Thr Gly Pro Phe Ser Val Lys
85 90 95
Ser Ser Pro Gly Leu Gly Pro Val Glu Leu
100 105
<210> 100
<211> 352
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 100
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ala Leu Leu Pro Gly Ala Thr Ala
20 25 30
Leu Gln Cys Phe Cys His Leu Cys Thr Lys Asp Asn Phe Thr Cys Val
35 40 45
Thr Asp Gly Leu Cys Phe Val Ser Val Thr Glu Thr Thr Asp Lys Val
50 55 60
Ile His Asn Ser Met Cys Ile Ala Glu Ile Asp Leu Ile Pro Arg Asp
65 70 75 80
Arg Pro Phe Val Cys Ala Pro Ser Ser Lys Thr Gly Ser Val Thr Thr
85 90 95
Thr Tyr Cys Cys Asn Gln Asp His Cys Asn Lys Ile Glu Leu Pro Thr
100 105 110
Thr Val Lys Ser Ser Pro Gly Leu Gly Pro Val Glu Thr Gly Gly Gly
115 120 125
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
130 135 140
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
145 150 155 160
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
165 170 175
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
180 185 190
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
195 200 205
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
210 215 220
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
225 230 235 240
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
245 250 255
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
260 265 270
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
275 280 285
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu
290 295 300
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys
305 310 315 320
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
325 330 335
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
340 345 350
<210> 101
<211> 328
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 101
Ala Leu Leu Pro Gly Ala Thr Ala Leu Gln Cys Phe Cys His Leu Cys
1 5 10 15
Thr Lys Asp Asn Phe Thr Cys Val Thr Asp Gly Leu Cys Phe Val Ser
20 25 30
Val Thr Glu Thr Thr Asp Lys Val Ile His Asn Ser Met Cys Ile Ala
35 40 45
Glu Ile Asp Leu Ile Pro Arg Asp Arg Pro Phe Val Cys Ala Pro Ser
50 55 60
Ser Lys Thr Gly Ser Val Thr Thr Thr Tyr Cys Cys Asn Gln Asp His
65 70 75 80
Cys Asn Lys Ile Glu Leu Pro Thr Thr Val Lys Ser Ser Pro Gly Leu
85 90 95
Gly Pro Val Glu Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro
100 105 110
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
115 120 125
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
130 135 140
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
145 150 155 160
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
165 170 175
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
180 185 190
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
195 200 205
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
210 215 220
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met
225 230 235 240
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
245 250 255
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
260 265 270
Tyr Asp Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
275 280 285
Tyr Ser Asp Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
290 295 300
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
305 310 315 320
Lys Ser Leu Ser Leu Ser Pro Gly
325
<210> 102
<400> 102
000
<210> 103
<400> 103
000
<210> 104
<211> 353
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 104
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ala Leu Leu Pro Gly Ala Thr Ala
20 25 30
Leu Gln Cys Phe Cys His Leu Cys Thr Lys Asp Asn Phe Thr Cys Val
35 40 45
Thr Asp Gly Leu Cys Phe Val Ser Val Thr Glu Thr Thr Asp Lys Val
50 55 60
Ile His Asn Ser Met Cys Ile Ala Glu Ile Asp Leu Ile Pro Arg Asp
65 70 75 80
Arg Pro Phe Val Cys Ala Pro Ser Ser Lys Thr Gly Ser Val Thr Thr
85 90 95
Thr Tyr Cys Cys Asn Gln Asp His Cys Asn Lys Ile Glu Leu Pro Thr
100 105 110
Thr Val Lys Ser Ser Pro Gly Leu Gly Pro Val Glu Thr Gly Gly Gly
115 120 125
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
130 135 140
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
145 150 155 160
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
165 170 175
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
180 185 190
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
195 200 205
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
210 215 220
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
225 230 235 240
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr
245 250 255
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser
260 265 270
Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
275 280 285
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
290 295 300
Asp Ser Asp Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys
305 310 315 320
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
325 330 335
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
340 345 350
Lys
<210> 105
<211> 329
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 105
Ala Leu Leu Pro Gly Ala Thr Ala Leu Gln Cys Phe Cys His Leu Cys
1 5 10 15
Thr Lys Asp Asn Phe Thr Cys Val Thr Asp Gly Leu Cys Phe Val Ser
20 25 30
Val Thr Glu Thr Thr Asp Lys Val Ile His Asn Ser Met Cys Ile Ala
35 40 45
Glu Ile Asp Leu Ile Pro Arg Asp Arg Pro Phe Val Cys Ala Pro Ser
50 55 60
Ser Lys Thr Gly Ser Val Thr Thr Thr Tyr Cys Cys Asn Gln Asp His
65 70 75 80
Cys Asn Lys Ile Glu Leu Pro Thr Thr Val Lys Ser Ser Pro Gly Leu
85 90 95
Gly Pro Val Glu Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro
100 105 110
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
115 120 125
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
130 135 140
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
145 150 155 160
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
165 170 175
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
180 185 190
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
195 200 205
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
210 215 220
Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met
225 230 235 240
Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro
245 250 255
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
260 265 270
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
275 280 285
Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
290 295 300
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
305 310 315 320
Lys Ser Leu Ser Leu Ser Pro Gly Lys
325
<210> 106
<400> 106
000
<210> 107
<400> 107
000
<210> 108
<211> 502
<212> PRT
<213> Homo sapiens
<400> 108
Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu
1 5 10 15
Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys
20 25 30
Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser
35 40 45
Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu
50 55 60
Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln
65 70 75 80
Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys
85 90 95
Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro
100 105 110
Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu
115 120 125
Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu
130 135 140
Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser
145 150 155 160
Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu
165 170 175
Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu
180 185 190
Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys
195 200 205
Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg
210 215 220
Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser
225 230 235 240
Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu
245 250 255
Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp
260 265 270
Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr
275 280 285
Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu
290 295 300
Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe
305 310 315 320
Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys
325 330 335
Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly
340 345 350
Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro
355 360 365
Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp
370 375 380
Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met
385 390 395 400
Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser
405 410 415
Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro
420 425 430
Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys
435 440 445
Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg
450 455 460
Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser
465 470 475 480
Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu
485 490 495
Ser Gln Asp Ile Lys Leu
500
<210> 109
<211> 113
<212> PRT
<213> Homo sapiens
<400> 109
Lys Lys Glu Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val
1 5 10 15
Leu Arg Cys Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn
20 25 30
Ile Cys Ser Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp
35 40 45
Ser Gly Leu Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser
50 55 60
Asp Phe Gln Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile
65 70 75 80
Glu Cys Cys Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr
85 90 95
Leu Pro Pro Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His
100 105 110
Arg
<210> 110
<211> 532
<212> PRT
<213> Homo sapiens
<400> 110
Met Gly Trp Leu Glu Glu Leu Asn Trp Gln Leu His Ile Phe Leu Leu
1 5 10 15
Ile Leu Leu Ser Met His Thr Arg Ala Asn Phe Leu Asp Asn Met Leu
20 25 30
Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu Asp Gly
35 40 45
Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys Lys Cys
50 55 60
His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser Thr Asp
65 70 75 80
Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu Pro Val
85 90 95
Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln Cys Arg
100 105 110
Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys Thr Glu
115 120 125
Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro Leu Lys
130 135 140
Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu Leu Ile
145 150 155 160
Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu Phe Cys
165 170 175
Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser Ile Gly
180 185 190
Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu Arg Asp
195 200 205
Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu
210 215 220
Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys Gln Ile
225 230 235 240
Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu
245 250 255
Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe
260 265 270
Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile
275 280 285
Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln
290 295 300
Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Tyr
305 310 315 320
Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu Ala Tyr
325 330 335
Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe Ser Thr
340 345 350
Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile
355 360 365
Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly Leu Ala
370 375 380
Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro Asn Thr
385 390 395 400
Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp Glu Ser
405 410 415
Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met Tyr Ser
420 425 430
Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser Gly Gly
435 440 445
Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro Ser Asp
450 455 460
Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys Leu Arg
465 470 475 480
Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg Gln Met
485 490 495
Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu
500 505 510
Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu Ser Gln
515 520 525
Asp Ile Lys Leu
530
<210> 111
<211> 131
<212> PRT
<213> Homo sapiens
<400> 111
Asn Phe Leu Asp Asn Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val
1 5 10 15
Gly Thr Lys Lys Glu Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro
20 25 30
Lys Val Leu Arg Cys Lys Cys His His His Cys Pro Glu Asp Ser Val
35 40 45
Asn Asn Ile Cys Ser Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu
50 55 60
Asp Asp Ser Gly Leu Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu
65 70 75 80
Gly Ser Asp Phe Gln Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg
85 90 95
Ser Ile Glu Cys Cys Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His
100 105 110
Pro Thr Leu Pro Pro Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile
115 120 125
His His Arg
130
<210> 112
<211> 365
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 112
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Lys Lys Glu Asp Gly Glu Ser Thr
20 25 30
Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys Lys Cys His His His
35 40 45
Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser Thr Asp Gly Tyr Cys
50 55 60
Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu Pro Val Val Thr Ser
65 70 75 80
Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln Cys Arg Asp Thr Pro
85 90 95
Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys Thr Glu Arg Asn Glu
100 105 110
Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro Leu Lys Asn Arg Asp
115 120 125
Phe Val Asp Gly Pro Ile His His Arg Thr Gly Gly Gly Thr His Thr
130 135 140
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
145 150 155 160
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
165 170 175
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
180 185 190
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
195 200 205
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
210 215 220
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
225 230 235 240
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
245 250 255
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
260 265 270
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
275 280 285
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
290 295 300
Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp Ser Asp
305 310 315 320
Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser Arg Trp
325 330 335
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
340 345 350
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
355 360 365
<210> 113
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 113
Lys Lys Glu Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val
1 5 10 15
Leu Arg Cys Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn
20 25 30
Ile Cys Ser Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp
35 40 45
Ser Gly Leu Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser
50 55 60
Asp Phe Gln Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile
65 70 75 80
Glu Cys Cys Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr
85 90 95
Leu Pro Pro Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His
100 105 110
Arg Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
115 120 125
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
130 135 140
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
145 150 155 160
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
165 170 175
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
180 185 190
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
195 200 205
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
210 215 220
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
225 230 235 240
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
245 250 255
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
260 265 270
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr
275 280 285
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp
290 295 300
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
305 310 315 320
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
325 330 335
Ser Leu Ser Pro Gly
340
<210> 114
<400> 114
000
<210> 115
<400> 115
000
<210> 116
<211> 366
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 116
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Lys Lys Glu Asp Gly Glu Ser Thr
20 25 30
Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys Lys Cys His His His
35 40 45
Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser Thr Asp Gly Tyr Cys
50 55 60
Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu Pro Val Val Thr Ser
65 70 75 80
Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln Cys Arg Asp Thr Pro
85 90 95
Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys Thr Glu Arg Asn Glu
100 105 110
Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro Leu Lys Asn Arg Asp
115 120 125
Phe Val Asp Gly Pro Ile His His Arg Thr Gly Gly Gly Thr His Thr
130 135 140
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
145 150 155 160
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
165 170 175
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
180 185 190
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
195 200 205
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
210 215 220
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
225 230 235 240
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
245 250 255
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro
260 265 270
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val
275 280 285
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
290 295 300
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
305 310 315 320
Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
325 330 335
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
340 345 350
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 117
<211> 342
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 117
Lys Lys Glu Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val
1 5 10 15
Leu Arg Cys Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn
20 25 30
Ile Cys Ser Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp
35 40 45
Ser Gly Leu Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser
50 55 60
Asp Phe Gln Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile
65 70 75 80
Glu Cys Cys Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr
85 90 95
Leu Pro Pro Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His
100 105 110
Arg Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
115 120 125
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
130 135 140
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
145 150 155 160
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
165 170 175
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
180 185 190
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
195 200 205
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
210 215 220
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
225 230 235 240
Pro Gln Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
245 250 255
Gln Val Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile
260 265 270
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
275 280 285
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val Ser Lys
290 295 300
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
305 310 315 320
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
325 330 335
Ser Leu Ser Pro Gly Lys
340
<210> 118
<400> 118
000
<210> 119
<400> 119
000
<210> 120
<211> 493
<212> PRT
<213> Homo sapiens
<400> 120
Met Thr Arg Ala Leu Cys Ser Ala Leu Arg Gln Ala Leu Leu Leu Leu
1 5 10 15
Ala Ala Ala Ala Glu Leu Ser Pro Gly Leu Lys Cys Val Cys Leu Leu
20 25 30
Cys Asp Ser Ser Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala
35 40 45
Ser Val Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val
50 55 60
Ser Leu Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn
65 70 75 80
Val Thr Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr
85 90 95
Leu His Leu Pro Thr Ala Ser Pro Asn Ala Pro Lys Leu Gly Pro Met
100 105 110
Glu Leu Ala Ile Ile Ile Thr Val Pro Val Cys Leu Leu Ser Ile Ala
115 120 125
Ala Met Leu Thr Val Trp Ala Cys Gln Gly Arg Gln Cys Ser Tyr Arg
130 135 140
Lys Lys Lys Arg Pro Asn Val Glu Glu Pro Leu Ser Glu Cys Asn Leu
145 150 155 160
Val Asn Ala Gly Lys Thr Leu Lys Asp Leu Ile Tyr Asp Val Thr Ala
165 170 175
Ser Gly Ser Gly Ser Gly Leu Pro Leu Leu Val Gln Arg Thr Ile Ala
180 185 190
Arg Thr Ile Val Leu Gln Glu Ile Val Gly Lys Gly Arg Phe Gly Glu
195 200 205
Val Trp His Gly Arg Trp Cys Gly Glu Asp Val Ala Val Lys Ile Phe
210 215 220
Ser Ser Arg Asp Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln
225 230 235 240
Thr Val Met Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp
245 250 255
Asn Lys Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Glu Tyr
260 265 270
His Glu Gln Gly Ser Leu Tyr Asp Tyr Leu Asn Arg Asn Ile Val Thr
275 280 285
Val Ala Gly Met Ile Lys Leu Ala Leu Ser Ile Ala Ser Gly Leu Ala
290 295 300
His Leu His Met Glu Ile Val Gly Thr Gln Gly Lys Pro Ala Ile Ala
305 310 315 320
His Arg Asp Ile Lys Ser Lys Asn Ile Leu Val Lys Lys Cys Glu Thr
325 330 335
Cys Ala Ile Ala Asp Leu Gly Leu Ala Val Lys His Asp Ser Ile Leu
340 345 350
Asn Thr Ile Asp Ile Pro Gln Asn Pro Lys Val Gly Thr Lys Arg Tyr
355 360 365
Met Ala Pro Glu Met Leu Asp Asp Thr Met Asn Val Asn Ile Phe Glu
370 375 380
Ser Phe Lys Arg Ala Asp Ile Tyr Ser Val Gly Leu Val Tyr Trp Glu
385 390 395 400
Ile Ala Arg Arg Cys Ser Val Gly Gly Ile Val Glu Glu Tyr Gln Leu
405 410 415
Pro Tyr Tyr Asp Met Val Pro Ser Asp Pro Ser Ile Glu Glu Met Arg
420 425 430
Lys Val Val Cys Asp Gln Lys Phe Arg Pro Ser Ile Pro Asn Gln Trp
435 440 445
Gln Ser Cys Glu Ala Leu Arg Val Met Gly Arg Ile Met Arg Glu Cys
450 455 460
Trp Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys
465 470 475 480
Thr Ile Ser Gln Leu Cys Val Lys Glu Asp Cys Lys Ala
485 490
<210> 121
<211> 413
<212> PRT
<213> Homo sapiens
<400> 121
Met Thr Arg Ala Leu Cys Ser Ala Leu Arg Gln Ala Leu Leu Leu Leu
1 5 10 15
Ala Ala Ala Ala Glu Leu Ser Pro Gly Leu Lys Cys Val Cys Leu Leu
20 25 30
Cys Asp Ser Ser Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala
35 40 45
Ser Val Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val
50 55 60
Ser Leu Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn
65 70 75 80
Val Thr Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr
85 90 95
Leu His Leu Pro Thr Gly Leu Pro Leu Leu Val Gln Arg Thr Ile Ala
100 105 110
Arg Thr Ile Val Leu Gln Glu Ile Val Gly Lys Gly Arg Phe Gly Glu
115 120 125
Val Trp His Gly Arg Trp Cys Gly Glu Asp Val Ala Val Lys Ile Phe
130 135 140
Ser Ser Arg Asp Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln
145 150 155 160
Thr Val Met Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp
165 170 175
Asn Lys Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Glu Tyr
180 185 190
His Glu Gln Gly Ser Leu Tyr Asp Tyr Leu Asn Arg Asn Ile Val Thr
195 200 205
Val Ala Gly Met Ile Lys Leu Ala Leu Ser Ile Ala Ser Gly Leu Ala
210 215 220
His Leu His Met Glu Ile Val Gly Thr Gln Gly Lys Pro Ala Ile Ala
225 230 235 240
His Arg Asp Ile Lys Ser Lys Asn Ile Leu Val Lys Lys Cys Glu Thr
245 250 255
Cys Ala Ile Ala Asp Leu Gly Leu Ala Val Lys His Asp Ser Ile Leu
260 265 270
Asn Thr Ile Asp Ile Pro Gln Asn Pro Lys Val Gly Thr Lys Arg Tyr
275 280 285
Met Ala Pro Glu Met Leu Asp Asp Thr Met Asn Val Asn Ile Phe Glu
290 295 300
Ser Phe Lys Arg Ala Asp Ile Tyr Ser Val Gly Leu Val Tyr Trp Glu
305 310 315 320
Ile Ala Arg Arg Cys Ser Val Gly Gly Ile Val Glu Glu Tyr Gln Leu
325 330 335
Pro Tyr Tyr Asp Met Val Pro Ser Asp Pro Ser Ile Glu Glu Met Arg
340 345 350
Lys Val Val Cys Asp Gln Lys Phe Arg Pro Ser Ile Pro Asn Gln Trp
355 360 365
Gln Ser Cys Glu Ala Leu Arg Val Met Gly Arg Ile Met Arg Glu Cys
370 375 380
Trp Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys
385 390 395 400
Thr Ile Ser Gln Leu Cys Val Lys Glu Asp Cys Lys Ala
405 410
<210> 122
<211> 336
<212> PRT
<213> Homo sapiens
<400> 122
Met Thr Arg Ala Leu Cys Ser Ala Leu Arg Gln Ala Leu Leu Leu Leu
1 5 10 15
Ala Ala Ala Ala Glu Leu Ser Pro Gly Leu Lys Cys Val Cys Leu Leu
20 25 30
Cys Asp Ser Ser Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala
35 40 45
Ser Val Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val
50 55 60
Ser Leu Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn
65 70 75 80
Val Thr Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr
85 90 95
Leu His Leu Pro Thr Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val
100 105 110
Ser Glu Tyr His Glu Gln Gly Ser Leu Tyr Asp Tyr Leu Asn Arg Asn
115 120 125
Ile Val Thr Val Ala Gly Met Ile Lys Leu Ala Leu Ser Ile Ala Ser
130 135 140
Gly Leu Ala His Leu His Met Glu Ile Val Gly Thr Gln Gly Lys Pro
145 150 155 160
Ala Ile Ala His Arg Asp Ile Lys Ser Lys Asn Ile Leu Val Lys Lys
165 170 175
Cys Glu Thr Cys Ala Ile Ala Asp Leu Gly Leu Ala Val Lys His Asp
180 185 190
Ser Ile Leu Asn Thr Ile Asp Ile Pro Gln Asn Pro Lys Val Gly Thr
195 200 205
Lys Arg Tyr Met Ala Pro Glu Met Leu Asp Asp Thr Met Asn Val Asn
210 215 220
Ile Phe Glu Ser Phe Lys Arg Ala Asp Ile Tyr Ser Val Gly Leu Val
225 230 235 240
Tyr Trp Glu Ile Ala Arg Arg Cys Ser Val Gly Gly Ile Val Glu Glu
245 250 255
Tyr Gln Leu Pro Tyr Tyr Asp Met Val Pro Ser Asp Pro Ser Ile Glu
260 265 270
Glu Met Arg Lys Val Val Cys Asp Gln Lys Phe Arg Pro Ser Ile Pro
275 280 285
Asn Gln Trp Gln Ser Cys Glu Ala Leu Arg Val Met Gly Arg Ile Met
290 295 300
Arg Glu Cys Trp Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg
305 310 315 320
Ile Lys Lys Thr Ile Ser Gln Leu Cys Val Lys Glu Asp Cys Lys Ala
325 330 335
<210> 123
<211> 93
<212> PRT
<213> Homo sapiens
<400> 123
Glu Leu Ser Pro Gly Leu Lys Cys Val Cys Leu Leu Cys Asp Ser Ser
1 5 10 15
Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala Ser Val Met Leu
20 25 30
Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val Ser Leu Pro Glu
35 40 45
Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn Val Thr Lys Thr
50 55 60
Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr Leu His Leu Pro
65 70 75 80
Thr Ala Ser Pro Asn Ala Pro Lys Leu Gly Pro Met Glu
85 90
<210> 124
<211> 443
<212> PRT
<213> Homo sapiens
<400> 124
Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val Ser Leu
1 5 10 15
Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn Val Thr
20 25 30
Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr Leu His
35 40 45
Leu Pro Thr Ala Ser Pro Asn Ala Pro Lys Leu Gly Pro Met Glu Leu
50 55 60
Ala Ile Ile Ile Thr Val Pro Val Cys Leu Leu Ser Ile Ala Ala Met
65 70 75 80
Leu Thr Val Trp Ala Cys Gln Gly Arg Gln Cys Ser Tyr Arg Lys Lys
85 90 95
Lys Arg Pro Asn Val Glu Glu Pro Leu Ser Glu Cys Asn Leu Val Asn
100 105 110
Ala Gly Lys Thr Leu Lys Asp Leu Ile Tyr Asp Val Thr Ala Ser Gly
115 120 125
Ser Gly Ser Gly Leu Pro Leu Leu Val Gln Arg Thr Ile Ala Arg Thr
130 135 140
Ile Val Leu Gln Glu Ile Val Gly Lys Gly Arg Phe Gly Glu Val Trp
145 150 155 160
His Gly Arg Trp Cys Gly Glu Asp Val Ala Val Lys Ile Phe Ser Ser
165 170 175
Arg Asp Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln Thr Val
180 185 190
Met Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp Asn Lys
195 200 205
Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Glu Tyr His Glu
210 215 220
Gln Gly Ser Leu Tyr Asp Tyr Leu Asn Arg Asn Ile Val Thr Val Ala
225 230 235 240
Gly Met Ile Lys Leu Ala Leu Ser Ile Ala Ser Gly Leu Ala His Leu
245 250 255
His Met Glu Ile Val Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg
260 265 270
Asp Ile Lys Ser Lys Asn Ile Leu Val Lys Lys Cys Glu Thr Cys Ala
275 280 285
Ile Ala Asp Leu Gly Leu Ala Val Lys His Asp Ser Ile Leu Asn Thr
290 295 300
Ile Asp Ile Pro Gln Asn Pro Lys Val Gly Thr Lys Arg Tyr Met Ala
305 310 315 320
Pro Glu Met Leu Asp Asp Thr Met Asn Val Asn Ile Phe Glu Ser Phe
325 330 335
Lys Arg Ala Asp Ile Tyr Ser Val Gly Leu Val Tyr Trp Glu Ile Ala
340 345 350
Arg Arg Cys Ser Val Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr
355 360 365
Tyr Asp Met Val Pro Ser Asp Pro Ser Ile Glu Glu Met Arg Lys Val
370 375 380
Val Cys Asp Gln Lys Phe Arg Pro Ser Ile Pro Asn Gln Trp Gln Ser
385 390 395 400
Cys Glu Ala Leu Arg Val Met Gly Arg Ile Met Arg Glu Cys Trp Tyr
405 410 415
Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Ile
420 425 430
Ser Gln Leu Cys Val Lys Glu Asp Cys Lys Ala
435 440
<210> 125
<211> 63
<212> PRT
<213> Homo sapiens
<400> 125
Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val Ser Leu
1 5 10 15
Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn Val Thr
20 25 30
Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr Leu His
35 40 45
Leu Pro Thr Ala Ser Pro Asn Ala Pro Lys Leu Gly Pro Met Glu
50 55 60
<210> 126
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 126
Glu Leu Ser Pro Gly Leu Lys Cys Val Cys Leu Leu Cys Asp Ser Ser
1 5 10 15
Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala Ser Val Met Leu
20 25 30
Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val Ser Leu Pro Glu
35 40 45
Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn Val Thr Lys Thr
50 55 60
Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr Leu His Leu Pro
65 70 75 80
Thr Gly Leu Pro Leu Leu Val Gln Arg Thr Ile Ala Arg Thr Ile Val
85 90 95
Leu Gln Glu Ile Val Gly Lys Gly Arg Phe Gly Glu Val Trp His Gly
100 105 110
Arg Trp Cys Gly Glu Asp Val Ala Val Lys Ile Phe Ser Ser Arg Asp
115 120 125
Glu Arg Ser Trp Phe Arg Glu Ala Glu Ile Tyr Gln Thr Val Met Leu
130 135 140
Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ala Asp Asn Lys Asp Asn
145 150 155 160
Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Glu Tyr His Glu Gln Gly
165 170 175
Ser Leu Tyr Asp Tyr Leu Asn Arg Asn Ile Val Thr Val Ala Gly Met
180 185 190
Ile Lys Leu Ala Leu Ser Ile Ala Ser Gly Leu Ala His Leu His Met
195 200 205
Glu Ile Val Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Ile
210 215 220
Lys Ser Lys Asn Ile Leu Val Lys Lys Cys Glu Thr Cys Ala Ile Ala
225 230 235 240
Asp Leu Gly Leu Ala Val Lys His Asp Ser Ile Leu Asn Thr Ile Asp
245 250 255
Ile Pro Gln Asn Pro Lys Val Gly Thr Lys Arg Tyr Met Ala Pro Glu
260 265 270
Met Leu Asp Asp Thr Met Asn Val Asn Ile Phe Glu Ser Phe Lys Arg
275 280 285
Ala Asp Ile Tyr Ser Val Gly Leu Val Tyr Trp Glu Ile Ala Arg Arg
290 295 300
Cys Ser Val Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asp
305 310 315 320
Met Val Pro Ser Asp Pro Ser Ile Glu Glu Met Arg Lys Val Val Cys
325 330 335
Asp Gln Lys Phe Arg Pro Ser Ile Pro Asn Gln Trp Gln Ser Cys Glu
340 345 350
Ala Leu Arg Val Met Gly Arg Ile Met Arg Glu Cys Trp Tyr Ala Asn
355 360 365
Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Ile Ser Gln
370 375 380
Leu Cys Val Lys Glu Asp Cys Lys Ala
385 390
<210> 127
<211> 316
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 127
Glu Leu Ser Pro Gly Leu Lys Cys Val Cys Leu Leu Cys Asp Ser Ser
1 5 10 15
Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala Ser Val Met Leu
20 25 30
Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val Ser Leu Pro Glu
35 40 45
Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn Val Thr Lys Thr
50 55 60
Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr Leu His Leu Pro
65 70 75 80
Thr Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val Ser Glu Tyr His
85 90 95
Glu Gln Gly Ser Leu Tyr Asp Tyr Leu Asn Arg Asn Ile Val Thr Val
100 105 110
Ala Gly Met Ile Lys Leu Ala Leu Ser Ile Ala Ser Gly Leu Ala His
115 120 125
Leu His Met Glu Ile Val Gly Thr Gln Gly Lys Pro Ala Ile Ala His
130 135 140
Arg Asp Ile Lys Ser Lys Asn Ile Leu Val Lys Lys Cys Glu Thr Cys
145 150 155 160
Ala Ile Ala Asp Leu Gly Leu Ala Val Lys His Asp Ser Ile Leu Asn
165 170 175
Thr Ile Asp Ile Pro Gln Asn Pro Lys Val Gly Thr Lys Arg Tyr Met
180 185 190
Ala Pro Glu Met Leu Asp Asp Thr Met Asn Val Asn Ile Phe Glu Ser
195 200 205
Phe Lys Arg Ala Asp Ile Tyr Ser Val Gly Leu Val Tyr Trp Glu Ile
210 215 220
Ala Arg Arg Cys Ser Val Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro
225 230 235 240
Tyr Tyr Asp Met Val Pro Ser Asp Pro Ser Ile Glu Glu Met Arg Lys
245 250 255
Val Val Cys Asp Gln Lys Phe Arg Pro Ser Ile Pro Asn Gln Trp Gln
260 265 270
Ser Cys Glu Ala Leu Arg Val Met Gly Arg Ile Met Arg Glu Cys Trp
275 280 285
Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr
290 295 300
Ile Ser Gln Leu Cys Val Lys Glu Asp Cys Lys Ala
305 310 315
<210> 128
<211> 88
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 128
Leu Lys Cys Val Cys Leu Leu Cys Asp Ser Ser Asn Phe Thr Cys Gln
1 5 10 15
Thr Glu Gly Ala Cys Trp Ala Ser Val Met Leu Thr Asn Gly Lys Glu
20 25 30
Gln Val Ile Lys Ser Cys Val Ser Leu Pro Glu Leu Asn Ala Gln Val
35 40 45
Phe Cys His Ser Ser Asn Asn Val Thr Lys Thr Glu Cys Cys Phe Thr
50 55 60
Asp Phe Cys Asn Asn Ile Thr Leu His Leu Pro Thr Ala Ser Pro Asn
65 70 75 80
Ala Pro Lys Leu Gly Pro Met Glu
85
<210> 129
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 129
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Gly Leu Lys Cys Val Cys Leu Leu
20 25 30
Cys Asp Ser Ser Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala
35 40 45
Ser Val Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val
50 55 60
Ser Leu Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn
65 70 75 80
Val Thr Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr
85 90 95
Leu His Leu Pro Thr Ala Ser Pro Asn Ala Pro Lys Leu Gly Pro Met
100 105 110
Glu Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
115 120 125
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
130 135 140
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
145 150 155 160
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
165 170 175
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
180 185 190
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
195 200 205
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
210 215 220
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
225 230 235 240
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
245 250 255
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
260 265 270
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Asp Thr
275 280 285
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Asp
290 295 300
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
305 310 315 320
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
325 330 335
Ser Leu Ser Pro Gly
340
<210> 130
<211> 317
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 130
Gly Leu Lys Cys Val Cys Leu Leu Cys Asp Ser Ser Asn Phe Thr Cys
1 5 10 15
Gln Thr Glu Gly Ala Cys Trp Ala Ser Val Met Leu Thr Asn Gly Lys
20 25 30
Glu Gln Val Ile Lys Ser Cys Val Ser Leu Pro Glu Leu Asn Ala Gln
35 40 45
Val Phe Cys His Ser Ser Asn Asn Val Thr Lys Thr Glu Cys Cys Phe
50 55 60
Thr Asp Phe Cys Asn Asn Ile Thr Leu His Leu Pro Thr Ala Ser Pro
65 70 75 80
Asn Ala Pro Lys Leu Gly Pro Met Glu Thr Gly Gly Gly Thr His Thr
85 90 95
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
100 105 110
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
115 120 125
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
130 135 140
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
145 150 155 160
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
165 170 175
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
180 185 190
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
195 200 205
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
210 215 220
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
225 230 235 240
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
245 250 255
Gln Pro Glu Asn Asn Tyr Asp Thr Thr Pro Pro Val Leu Asp Ser Asp
260 265 270
Gly Ser Phe Phe Leu Tyr Ser Asp Leu Thr Val Asp Lys Ser Arg Trp
275 280 285
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
290 295 300
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
305 310 315
<210> 131
<400> 131
000
<210> 132
<400> 132
000
<210> 133
<211> 342
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 133
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Gly Leu Lys Cys Val Cys Leu Leu
20 25 30
Cys Asp Ser Ser Asn Phe Thr Cys Gln Thr Glu Gly Ala Cys Trp Ala
35 40 45
Ser Val Met Leu Thr Asn Gly Lys Glu Gln Val Ile Lys Ser Cys Val
50 55 60
Ser Leu Pro Glu Leu Asn Ala Gln Val Phe Cys His Ser Ser Asn Asn
65 70 75 80
Val Thr Lys Thr Glu Cys Cys Phe Thr Asp Phe Cys Asn Asn Ile Thr
85 90 95
Leu His Leu Pro Thr Ala Ser Pro Asn Ala Pro Lys Leu Gly Pro Met
100 105 110
Glu Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
115 120 125
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
130 135 140
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
145 150 155 160
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
165 170 175
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
180 185 190
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
195 200 205
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
210 215 220
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
225 230 235 240
Pro Gln Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
245 250 255
Gln Val Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile
260 265 270
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
275 280 285
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Val Ser Lys
290 295 300
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
305 310 315 320
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
325 330 335
Ser Leu Ser Pro Gly Lys
340
<210> 134
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 134
Gly Leu Lys Cys Val Cys Leu Leu Cys Asp Ser Ser Asn Phe Thr Cys
1 5 10 15
Gln Thr Glu Gly Ala Cys Trp Ala Ser Val Met Leu Thr Asn Gly Lys
20 25 30
Glu Gln Val Ile Lys Ser Cys Val Ser Leu Pro Glu Leu Asn Ala Gln
35 40 45
Val Phe Cys His Ser Ser Asn Asn Val Thr Lys Thr Glu Cys Cys Phe
50 55 60
Thr Asp Phe Cys Asn Asn Ile Thr Leu His Leu Pro Thr Ala Ser Pro
65 70 75 80
Asn Ala Pro Lys Leu Gly Pro Met Glu Thr Gly Gly Gly Thr His Thr
85 90 95
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
100 105 110
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
115 120 125
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
130 135 140
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
145 150 155 160
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
165 170 175
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
180 185 190
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
195 200 205
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro
210 215 220
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val
225 230 235 240
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
245 250 255
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
260 265 270
Gly Ser Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
275 280 285
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
290 295 300
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
305 310 315
<210> 135
<400> 135
000
<210> 136
<400> 136
000
<210> 137
<211> 513
<212> PRT
<213> Homo sapiens
<400> 137
Met Gly Ala Ala Ala Lys Leu Ala Phe Ala Val Phe Leu Ile Ser Cys
1 5 10 15
Ser Ser Gly Ala Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe
20 25 30
Phe Asn Ala Asn Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu
35 40 45
Pro Cys Tyr Gly Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp
50 55 60
Lys Asn Ile Ser Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu
65 70 75 80
Asp Asp Ile Asn Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp
85 90 95
Ser Pro Glu Val Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu
100 105 110
Lys Phe Ser Tyr Phe Pro Glu Met Glu Val Thr Gln Pro Thr Ser Asn
115 120 125
Pro Val Thr Pro Lys Pro Pro Tyr Tyr Asn Ile Leu Leu Tyr Ser Leu
130 135 140
Val Pro Leu Met Leu Ile Ala Gly Ile Val Ile Cys Ala Phe Trp Val
145 150 155 160
Tyr Arg His His Lys Met Ala Tyr Pro Pro Val Leu Val Pro Thr Gln
165 170 175
Asp Pro Gly Pro Pro Pro Pro Ser Pro Leu Leu Gly Leu Lys Pro Leu
180 185 190
Gln Leu Leu Glu Val Lys Ala Arg Gly Arg Phe Gly Cys Val Trp Lys
195 200 205
Ala Gln Leu Leu Asn Glu Tyr Val Ala Val Lys Ile Phe Pro Ile Gln
210 215 220
Asp Lys Gln Ser Trp Gln Asn Glu Tyr Glu Val Tyr Ser Leu Pro Gly
225 230 235 240
Met Lys His Glu Asn Ile Leu Gln Phe Ile Gly Ala Glu Lys Arg Gly
245 250 255
Thr Ser Val Asp Val Asp Leu Trp Leu Ile Thr Ala Phe His Glu Lys
260 265 270
Gly Ser Leu Ser Asp Phe Leu Lys Ala Asn Val Val Ser Trp Asn Glu
275 280 285
Leu Cys His Ile Ala Glu Thr Met Ala Arg Gly Leu Ala Tyr Leu His
290 295 300
Glu Asp Ile Pro Gly Leu Lys Asp Gly His Lys Pro Ala Ile Ser His
305 310 315 320
Arg Asp Ile Lys Ser Lys Asn Val Leu Leu Lys Asn Asn Leu Thr Ala
325 330 335
Cys Ile Ala Asp Phe Gly Leu Ala Leu Lys Phe Glu Ala Gly Lys Ser
340 345 350
Ala Gly Asp Thr His Gly Gln Val Gly Thr Arg Arg Tyr Met Ala Pro
355 360 365
Glu Val Leu Glu Gly Ala Ile Asn Phe Gln Arg Asp Ala Phe Leu Arg
370 375 380
Ile Asp Met Tyr Ala Met Gly Leu Val Leu Trp Glu Leu Ala Ser Arg
385 390 395 400
Cys Thr Ala Ala Asp Gly Pro Val Asp Glu Tyr Met Leu Pro Phe Glu
405 410 415
Glu Glu Ile Gly Gln His Pro Ser Leu Glu Asp Met Gln Glu Val Val
420 425 430
Val His Lys Lys Lys Arg Pro Val Leu Arg Asp Tyr Trp Gln Lys His
435 440 445
Ala Gly Met Ala Met Leu Cys Glu Thr Ile Glu Glu Cys Trp Asp His
450 455 460
Asp Ala Glu Ala Arg Leu Ser Ala Gly Cys Val Gly Glu Arg Ile Thr
465 470 475 480
Gln Met Gln Arg Leu Thr Asn Ile Ile Thr Thr Glu Asp Ile Val Thr
485 490 495
Val Val Thr Met Val Thr Asn Val Asp Phe Pro Pro Lys Glu Ser Ser
500 505 510
Leu
<210> 138
<211> 115
<212> PRT
<213> Homo sapiens
<400> 138
Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe Phe Asn Ala Asn
1 5 10 15
Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu Pro Cys Tyr Gly
20 25 30
Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp Lys Asn Ile Ser
35 40 45
Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu Asp Asp Ile Asn
50 55 60
Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp Ser Pro Glu Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu Lys Phe Ser Tyr
85 90 95
Phe Pro Glu Met Glu Val Thr Gln Pro Thr Ser Asn Pro Val Thr Pro
100 105 110
Lys Pro Pro
115
<210> 139
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 139
Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe Phe Asn Ala Asn
1 5 10 15
Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu Pro Cys Tyr Gly
20 25 30
Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp Lys Asn Ile Ser
35 40 45
Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu Asp Asp Ile Asn
50 55 60
Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp Ser Pro Glu Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu Lys Phe Ser Tyr
85 90 95
Phe Pro Glu Met
100
<210> 140
<211> 369
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 140
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ala Ile Leu Gly Arg Ser Glu Thr
20 25 30
Gln Glu Cys Leu Phe Phe Asn Ala Asn Trp Glu Lys Asp Arg Thr Asn
35 40 45
Gln Thr Gly Val Glu Pro Cys Tyr Gly Asp Lys Asp Lys Arg Arg His
50 55 60
Cys Phe Ala Thr Trp Lys Asn Ile Ser Gly Ser Ile Glu Ile Val Lys
65 70 75 80
Gln Gly Cys Trp Leu Asp Asp Ile Asn Cys Tyr Asp Arg Thr Asp Cys
85 90 95
Val Glu Lys Lys Asp Ser Pro Glu Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Met Cys Asn Glu Lys Phe Ser Tyr Phe Pro Glu Met Glu Val Thr
115 120 125
Gln Pro Thr Ser Asn Pro Val Thr Pro Lys Pro Pro Thr Gly Gly Gly
130 135 140
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
145 150 155 160
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
165 170 175
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
180 185 190
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
195 200 205
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
210 215 220
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
225 230 235 240
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
245 250 255
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
260 265 270
Leu Pro Pro Ser Arg Lys Glu Met Thr Lys Asn Gln Val Ser Leu Thr
275 280 285
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
290 295 300
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
305 310 315 320
Lys Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
325 330 335
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
340 345 350
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
355 360 365
Lys
<210> 141
<211> 344
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 141
Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe Phe Asn Ala Asn
1 5 10 15
Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu Pro Cys Tyr Gly
20 25 30
Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp Lys Asn Ile Ser
35 40 45
Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu Asp Asp Ile Asn
50 55 60
Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp Ser Pro Glu Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu Lys Phe Ser Tyr
85 90 95
Phe Pro Glu Met Glu Val Thr Gln Pro Thr Ser Asn Pro Val Thr Pro
100 105 110
Lys Pro Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
115 120 125
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
130 135 140
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
145 150 155 160
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
165 170 175
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
180 185 190
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
195 200 205
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
210 215 220
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
225 230 235 240
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Lys Glu Met Thr
245 250 255
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
260 265 270
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
275 280 285
Lys Thr Thr Pro Pro Val Leu Lys Ser Asp Gly Ser Phe Phe Leu Tyr
290 295 300
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
305 310 315 320
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
325 330 335
Ser Leu Ser Leu Ser Pro Gly Lys
340
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<211> 369
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 144
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ala Ile Leu Gly Arg Ser Glu Thr
20 25 30
Gln Glu Cys Leu Phe Phe Asn Ala Asn Trp Glu Lys Asp Arg Thr Asn
35 40 45
Gln Thr Gly Val Glu Pro Cys Tyr Gly Asp Lys Asp Lys Arg Arg His
50 55 60
Cys Phe Ala Thr Trp Lys Asn Ile Ser Gly Ser Ile Glu Ile Val Lys
65 70 75 80
Gln Gly Cys Trp Leu Asp Asp Ile Asn Cys Tyr Asp Arg Thr Asp Cys
85 90 95
Val Glu Lys Lys Asp Ser Pro Glu Val Tyr Phe Cys Cys Cys Glu Gly
100 105 110
Asn Met Cys Asn Glu Lys Phe Ser Tyr Phe Pro Glu Met Glu Val Thr
115 120 125
Gln Pro Thr Ser Asn Pro Val Thr Pro Lys Pro Pro Thr Gly Gly Gly
130 135 140
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
145 150 155 160
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
165 170 175
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
180 185 190
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
195 200 205
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
210 215 220
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
225 230 235 240
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
245 250 255
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
260 265 270
Leu Pro Pro Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp
275 280 285
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
290 295 300
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
305 310 315 320
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
325 330 335
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
340 345 350
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
355 360 365
Lys
<210> 145
<211> 344
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 145
Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe Phe Asn Ala Asn
1 5 10 15
Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu Pro Cys Tyr Gly
20 25 30
Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp Lys Asn Ile Ser
35 40 45
Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu Asp Asp Ile Asn
50 55 60
Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp Ser Pro Glu Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu Lys Phe Ser Tyr
85 90 95
Phe Pro Glu Met Glu Val Thr Gln Pro Thr Ser Asn Pro Val Thr Pro
100 105 110
Lys Pro Pro Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
115 120 125
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
130 135 140
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
145 150 155 160
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
165 170 175
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
180 185 190
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
195 200 205
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
210 215 220
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
225 230 235 240
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Cys Arg Glu Glu Met Thr
245 250 255
Lys Asn Gln Val Ser Leu Trp Cys Leu Val Lys Gly Phe Tyr Pro Ser
260 265 270
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
275 280 285
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
290 295 300
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
305 310 315 320
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
325 330 335
Ser Leu Ser Leu Ser Pro Gly Lys
340
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<211> 1038
<212> PRT
<213> Homo sapiens
<400> 148
Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp
1 5 10 15
Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg
20 25 30
Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu
35 40 45
Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser
50 55 60
Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val
65 70 75 80
Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr
85 90 95
Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr
100 105 110
Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr
115 120 125
Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser
130 135 140
Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val
145 150 155 160
Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr
165 170 175
Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala
180 185 190
Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu
195 200 205
Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu
210 215 220
Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe
225 230 235 240
Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn
245 250 255
Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg
260 265 270
Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys
275 280 285
Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu
290 295 300
Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro
305 310 315 320
Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser
325 330 335
Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe
340 345 350
Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu
355 360 365
Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala
370 375 380
Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala
385 390 395 400
Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile
405 410 415
Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr
420 425 430
Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp
435 440 445
Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu
450 455 460
Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile
465 470 475 480
Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys
485 490 495
Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys
500 505 510
Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu
515 520 525
Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro
530 535 540
Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp
545 550 555 560
Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro
565 570 575
Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln
580 585 590
Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu
595 600 605
Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr
610 615 620
Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu
625 630 635 640
His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu
645 650 655
Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu
660 665 670
Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His
675 680 685
Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser
690 695 700
Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln
705 710 715 720
Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp
725 730 735
Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro
740 745 750
Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu
755 760 765
Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val
770 775 780
Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His
785 790 795 800
Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val
805 810 815
Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Gly Thr Val Leu Ser
820 825 830
Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln
835 840 845
Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro
850 855 860
Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp
865 870 875 880
Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu
885 890 895
Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu
900 905 910
Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly
915 920 925
Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser
930 935 940
Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr
945 950 955 960
Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys
965 970 975
Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser
980 985 990
Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala
995 1000 1005
Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly
1010 1015 1020
Thr Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu
1025 1030 1035
<210> 149
<211> 530
<212> PRT
<213> Homo sapiens
<400> 149
Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp
1 5 10 15
Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg
20 25 30
Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu
35 40 45
Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser
50 55 60
Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val
65 70 75 80
Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr
85 90 95
Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr
100 105 110
Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr
115 120 125
Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser
130 135 140
Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val
145 150 155 160
Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr
165 170 175
Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala
180 185 190
Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu
195 200 205
Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu
210 215 220
Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe
225 230 235 240
Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn
245 250 255
Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg
260 265 270
Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys
275 280 285
Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu
290 295 300
Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro
305 310 315 320
Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser
325 330 335
Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe
340 345 350
Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu
355 360 365
Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala
370 375 380
Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala
385 390 395 400
Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile
405 410 415
Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr
420 425 430
Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp
435 440 445
Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu
450 455 460
Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile
465 470 475 480
Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys
485 490 495
Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys
500 505 510
Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu
515 520 525
Arg Arg
530
<210> 150
<211> 124
<212> PRT
<213> Homo sapiens
<400> 150
Ser Gln Asn Gln Glu Arg Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln
1 5 10 15
Asp Leu Gly Ile Gly Glu Ser Arg Ile Ser His Glu Asn Gly Thr Ile
20 25 30
Leu Cys Ser Lys Gly Ser Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys
35 40 45
Gly Asp Ile Asn Leu Val Lys Gln Gly Cys Trp Ser His Ile Gly Asp
50 55 60
Pro Gln Glu Cys His Tyr Glu Glu Cys Val Val Thr Thr Thr Pro Pro
65 70 75 80
Ser Ile Gln Asn Gly Thr Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu
85 90 95
Cys Asn Val Asn Phe Thr Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro
100 105 110
Leu Ser Pro Pro His Ser Phe Asn Arg Asp Glu Thr
115 120
<210> 151
<211> 124
<212> PRT
<213> Homo sapiens
<400> 151
Ser Gln Asn Gln Glu Arg Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln
1 5 10 15
Asp Leu Gly Ile Gly Glu Ser Arg Ile Ser His Glu Asn Gly Thr Ile
20 25 30
Leu Cys Ser Lys Gly Ser Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys
35 40 45
Gly Asp Ile Asn Leu Val Lys Gln Gly Cys Trp Ser His Ile Gly Asp
50 55 60
Pro Gln Glu Cys His Tyr Glu Glu Cys Val Val Thr Thr Thr Pro Pro
65 70 75 80
Ser Ile Gln Asn Gly Thr Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu
85 90 95
Cys Asn Val Asn Phe Thr Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro
100 105 110
Leu Ser Pro Pro His Ser Phe Asn Arg Asp Glu Thr
115 120
<210> 152
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 152
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gln Asn Gln Glu Arg Leu Cys
20 25 30
Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu Ser Arg
35 40 45
Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser Thr Cys
50 55 60
Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val Lys Gln
65 70 75 80
Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr Glu Glu
85 90 95
Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr Tyr Arg
100 105 110
Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr Glu Asn
115 120 125
Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser Phe Asn
130 135 140
Arg Asp Glu Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
145 150 155 160
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
165 170 175
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
180 185 190
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
195 200 205
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
210 215 220
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
225 230 235 240
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
245 250 255
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
260 265 270
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Lys Glu Met Thr
275 280 285
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
290 295 300
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
305 310 315 320
Lys Thr Thr Pro Pro Val Leu Lys Ser Asp Gly Ser Phe Phe Leu Tyr
325 330 335
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
340 345 350
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
355 360 365
Ser Leu Ser Leu Ser Pro Gly Lys
370 375
<210> 153
<211> 352
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 153
Ser Gln Asn Gln Glu Arg Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln
1 5 10 15
Asp Leu Gly Ile Gly Glu Ser Arg Ile Ser His Glu Asn Gly Thr Ile
20 25 30
Leu Cys Ser Lys Gly Ser Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys
35 40 45
Gly Asp Ile Asn Leu Val Lys Gln Gly Cys Trp Ser His Ile Gly Asp
50 55 60
Pro Gln Glu Cys His Tyr Glu Glu Cys Val Val Thr Thr Thr Pro Pro
65 70 75 80
Ser Ile Gln Asn Gly Thr Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu
85 90 95
Cys Asn Val Asn Phe Thr Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro
100 105 110
Leu Ser Pro Pro His Ser Phe Asn Arg Asp Glu Thr Gly Gly Gly Thr
115 120 125
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
130 135 140
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
145 150 155 160
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
165 170 175
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
180 185 190
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
195 200 205
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
210 215 220
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
225 230 235 240
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
245 250 255
Pro Pro Ser Arg Lys Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
260 265 270
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
275 280 285
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Lys
290 295 300
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
305 310 315 320
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
325 330 335
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
340 345 350
<210> 154
<400> 154
000
<210> 155
<400> 155
000
<210> 156
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 156
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gln Asn Gln Glu Arg Leu Cys
20 25 30
Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu Ser Arg
35 40 45
Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser Thr Cys
50 55 60
Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val Lys Gln
65 70 75 80
Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr Glu Glu
85 90 95
Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr Tyr Arg
100 105 110
Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr Glu Asn
115 120 125
Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser Phe Asn
130 135 140
Arg Asp Glu Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala
145 150 155 160
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
165 170 175
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
180 185 190
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
195 200 205
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
210 215 220
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
225 230 235 240
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
245 250 255
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
260 265 270
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Cys Arg Glu Glu Met Thr
275 280 285
Lys Asn Gln Val Ser Leu Trp Cys Leu Val Lys Gly Phe Tyr Pro Ser
290 295 300
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
305 310 315 320
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
325 330 335
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
340 345 350
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
355 360 365
Ser Leu Ser Leu Ser Pro Gly Lys
370 375
<210> 157
<211> 352
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 157
Ser Gln Asn Gln Glu Arg Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln
1 5 10 15
Asp Leu Gly Ile Gly Glu Ser Arg Ile Ser His Glu Asn Gly Thr Ile
20 25 30
Leu Cys Ser Lys Gly Ser Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys
35 40 45
Gly Asp Ile Asn Leu Val Lys Gln Gly Cys Trp Ser His Ile Gly Asp
50 55 60
Pro Gln Glu Cys His Tyr Glu Glu Cys Val Val Thr Thr Thr Pro Pro
65 70 75 80
Ser Ile Gln Asn Gly Thr Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu
85 90 95
Cys Asn Val Asn Phe Thr Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro
100 105 110
Leu Ser Pro Pro His Ser Phe Asn Arg Asp Glu Thr Gly Gly Gly Thr
115 120 125
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
130 135 140
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
145 150 155 160
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
165 170 175
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
180 185 190
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
195 200 205
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
210 215 220
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
225 230 235 240
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
245 250 255
Pro Pro Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp Cys
260 265 270
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
275 280 285
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
290 295 300
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
305 310 315 320
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
325 330 335
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
340 345 350
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<211> 592
<212> PRT
<213> Homo sapiens
<400> 160
Met Gly Arg Gly Leu Leu Arg Gly Leu Trp Pro Leu His Ile Val Leu
1 5 10 15
Trp Thr Arg Ile Ala Ser Thr Ile Pro Pro His Val Gln Lys Ser Asp
20 25 30
Val Glu Met Glu Ala Gln Lys Asp Glu Ile Ile Cys Pro Ser Cys Asn
35 40 45
Arg Thr Ala His Pro Leu Arg His Ile Asn Asn Asp Met Ile Val Thr
50 55 60
Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe Cys Asp
65 70 75 80
Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser Asn Cys
85 90 95
Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val Ala Val
100 105 110
Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys His Asp
115 120 125
Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala Ser Pro
130 135 140
Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe Phe Met
145 150 155 160
Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe Ser Glu
165 170 175
Glu Tyr Asn Thr Ser Asn Pro Asp Leu Leu Leu Val Ile Phe Gln Val
180 185 190
Thr Gly Ile Ser Leu Leu Pro Pro Leu Gly Val Ala Ile Ser Val Ile
195 200 205
Ile Ile Phe Tyr Cys Tyr Arg Val Asn Arg Gln Gln Lys Leu Ser Ser
210 215 220
Thr Trp Glu Thr Gly Lys Thr Arg Lys Leu Met Glu Phe Ser Glu His
225 230 235 240
Cys Ala Ile Ile Leu Glu Asp Asp Arg Ser Asp Ile Ser Ser Thr Cys
245 250 255
Ala Asn Asn Ile Asn His Asn Thr Glu Leu Leu Pro Ile Glu Leu Asp
260 265 270
Thr Leu Val Gly Lys Gly Arg Phe Ala Glu Val Tyr Lys Ala Lys Leu
275 280 285
Lys Gln Asn Thr Ser Glu Gln Phe Glu Thr Val Ala Val Lys Ile Phe
290 295 300
Pro Tyr Glu Glu Tyr Ala Ser Trp Lys Thr Glu Lys Asp Ile Phe Ser
305 310 315 320
Asp Ile Asn Leu Lys His Glu Asn Ile Leu Gln Phe Leu Thr Ala Glu
325 330 335
Glu Arg Lys Thr Glu Leu Gly Lys Gln Tyr Trp Leu Ile Thr Ala Phe
340 345 350
His Ala Lys Gly Asn Leu Gln Glu Tyr Leu Thr Arg His Val Ile Ser
355 360 365
Trp Glu Asp Leu Arg Lys Leu Gly Ser Ser Leu Ala Arg Gly Ile Ala
370 375 380
His Leu His Ser Asp His Thr Pro Cys Gly Arg Pro Lys Met Pro Ile
385 390 395 400
Val His Arg Asp Leu Lys Ser Ser Asn Ile Leu Val Lys Asn Asp Leu
405 410 415
Thr Cys Cys Leu Cys Asp Phe Gly Leu Ser Leu Arg Leu Asp Pro Thr
420 425 430
Leu Ser Val Asp Asp Leu Ala Asn Ser Gly Gln Val Gly Thr Ala Arg
435 440 445
Tyr Met Ala Pro Glu Val Leu Glu Ser Arg Met Asn Leu Glu Asn Val
450 455 460
Glu Ser Phe Lys Gln Thr Asp Val Tyr Ser Met Ala Leu Val Leu Trp
465 470 475 480
Glu Met Thr Ser Arg Cys Asn Ala Val Gly Glu Val Lys Asp Tyr Glu
485 490 495
Pro Pro Phe Gly Ser Lys Val Arg Glu His Pro Cys Val Glu Ser Met
500 505 510
Lys Asp Asn Val Leu Arg Asp Arg Gly Arg Pro Glu Ile Pro Ser Phe
515 520 525
Trp Leu Asn His Gln Gly Ile Gln Met Val Cys Glu Thr Leu Thr Glu
530 535 540
Cys Trp Asp His Asp Pro Glu Ala Arg Leu Thr Ala Gln Cys Val Ala
545 550 555 560
Glu Arg Phe Ser Glu Leu Glu His Leu Asp Arg Leu Ser Gly Arg Ser
565 570 575
Cys Ser Glu Glu Lys Ile Pro Glu Asp Gly Ser Leu Asn Thr Thr Lys
580 585 590
<210> 161
<211> 567
<212> PRT
<213> Homo sapiens
<400> 161
Met Gly Arg Gly Leu Leu Arg Gly Leu Trp Pro Leu His Ile Val Leu
1 5 10 15
Trp Thr Arg Ile Ala Ser Thr Ile Pro Pro His Val Gln Lys Ser Val
20 25 30
Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val Lys Phe Pro
35 40 45
Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys Asp Asn Gln
50 55 60
Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro
65 70 75 80
Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu Asn Ile Thr
85 90 95
Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His Asp Phe Ile
100 105 110
Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu Lys Lys Lys
115 120 125
Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp Glu Cys Asn
130 135 140
Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn Pro Asp Leu
145 150 155 160
Leu Leu Val Ile Phe Gln Val Thr Gly Ile Ser Leu Leu Pro Pro Leu
165 170 175
Gly Val Ala Ile Ser Val Ile Ile Ile Phe Tyr Cys Tyr Arg Val Asn
180 185 190
Arg Gln Gln Lys Leu Ser Ser Thr Trp Glu Thr Gly Lys Thr Arg Lys
195 200 205
Leu Met Glu Phe Ser Glu His Cys Ala Ile Ile Leu Glu Asp Asp Arg
210 215 220
Ser Asp Ile Ser Ser Thr Cys Ala Asn Asn Ile Asn His Asn Thr Glu
225 230 235 240
Leu Leu Pro Ile Glu Leu Asp Thr Leu Val Gly Lys Gly Arg Phe Ala
245 250 255
Glu Val Tyr Lys Ala Lys Leu Lys Gln Asn Thr Ser Glu Gln Phe Glu
260 265 270
Thr Val Ala Val Lys Ile Phe Pro Tyr Glu Glu Tyr Ala Ser Trp Lys
275 280 285
Thr Glu Lys Asp Ile Phe Ser Asp Ile Asn Leu Lys His Glu Asn Ile
290 295 300
Leu Gln Phe Leu Thr Ala Glu Glu Arg Lys Thr Glu Leu Gly Lys Gln
305 310 315 320
Tyr Trp Leu Ile Thr Ala Phe His Ala Lys Gly Asn Leu Gln Glu Tyr
325 330 335
Leu Thr Arg His Val Ile Ser Trp Glu Asp Leu Arg Lys Leu Gly Ser
340 345 350
Ser Leu Ala Arg Gly Ile Ala His Leu His Ser Asp His Thr Pro Cys
355 360 365
Gly Arg Pro Lys Met Pro Ile Val His Arg Asp Leu Lys Ser Ser Asn
370 375 380
Ile Leu Val Lys Asn Asp Leu Thr Cys Cys Leu Cys Asp Phe Gly Leu
385 390 395 400
Ser Leu Arg Leu Asp Pro Thr Leu Ser Val Asp Asp Leu Ala Asn Ser
405 410 415
Gly Gln Val Gly Thr Ala Arg Tyr Met Ala Pro Glu Val Leu Glu Ser
420 425 430
Arg Met Asn Leu Glu Asn Val Glu Ser Phe Lys Gln Thr Asp Val Tyr
435 440 445
Ser Met Ala Leu Val Leu Trp Glu Met Thr Ser Arg Cys Asn Ala Val
450 455 460
Gly Glu Val Lys Asp Tyr Glu Pro Pro Phe Gly Ser Lys Val Arg Glu
465 470 475 480
His Pro Cys Val Glu Ser Met Lys Asp Asn Val Leu Arg Asp Arg Gly
485 490 495
Arg Pro Glu Ile Pro Ser Phe Trp Leu Asn His Gln Gly Ile Gln Met
500 505 510
Val Cys Glu Thr Leu Thr Glu Cys Trp Asp His Asp Pro Glu Ala Arg
515 520 525
Leu Thr Ala Gln Cys Val Ala Glu Arg Phe Ser Glu Leu Glu His Leu
530 535 540
Asp Arg Leu Ser Gly Arg Ser Cys Ser Glu Glu Lys Ile Pro Glu Asp
545 550 555 560
Gly Ser Leu Asn Thr Thr Lys
565
<210> 162
<211> 144
<212> PRT
<213> Homo sapiens
<400> 162
Thr Ile Pro Pro His Val Gln Lys Ser Val Asn Asn Asp Met Ile Val
1 5 10 15
Thr Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe Cys
20 25 30
Asp Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser Asn
35 40 45
Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val Ala
50 55 60
Val Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys His
65 70 75 80
Asp Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala Ser
85 90 95
Pro Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe Phe
100 105 110
Met Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe Ser
115 120 125
Glu Glu Tyr Asn Thr Ser Asn Pro Asp Leu Leu Leu Val Ile Phe Gln
130 135 140
<210> 163
<211> 169
<212> PRT
<213> Homo sapiens
<400> 163
Thr Ile Pro Pro His Val Gln Lys Ser Asp Val Glu Met Glu Ala Gln
1 5 10 15
Lys Asp Glu Ile Ile Cys Pro Ser Cys Asn Arg Thr Ala His Pro Leu
20 25 30
Arg His Ile Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val
35 40 45
Lys Phe Pro Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys
50 55 60
Asp Asn Gln Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys
65 70 75 80
Glu Lys Pro Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu
85 90 95
Asn Ile Thr Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His
100 105 110
Asp Phe Ile Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu
115 120 125
Lys Lys Lys Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp
130 135 140
Glu Cys Asn Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn
145 150 155 160
Pro Asp Leu Leu Leu Val Ile Phe Gln
165
<210> 164
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 164
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Thr Ile Pro Pro His Val Gln Lys
20 25 30
Ser Val Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val Lys
35 40 45
Phe Pro Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys Asp
50 55 60
Asn Gln Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys Glu
65 70 75 80
Lys Pro Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu Asn
85 90 95
Ile Thr Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His Asp
100 105 110
Phe Ile Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu Lys
115 120 125
Lys Lys Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp Glu
130 135 140
Cys Asn Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn Pro
145 150 155 160
Asp Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
165 170 175
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
180 185 190
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
195 200 205
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
210 215 220
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
225 230 235 240
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
245 250 255
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
260 265 270
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
275 280 285
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Lys Glu Met Thr Lys Asn
290 295 300
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
305 310 315 320
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
325 330 335
Thr Pro Pro Val Leu Lys Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
340 345 350
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
355 360 365
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
370 375 380
Ser Leu Ser Pro Gly Lys
385 390
<210> 165
<211> 366
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 165
Thr Ile Pro Pro His Val Gln Lys Ser Val Asn Asn Asp Met Ile Val
1 5 10 15
Thr Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe Cys
20 25 30
Asp Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser Asn
35 40 45
Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val Ala
50 55 60
Val Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys His
65 70 75 80
Asp Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala Ser
85 90 95
Pro Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe Phe
100 105 110
Met Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe Ser
115 120 125
Glu Glu Tyr Asn Thr Ser Asn Pro Asp Thr Gly Gly Gly Thr His Thr
130 135 140
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
145 150 155 160
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
165 170 175
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
180 185 190
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
195 200 205
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
210 215 220
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
225 230 235 240
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
245 250 255
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
260 265 270
Ser Arg Lys Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
275 280 285
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
290 295 300
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Lys Ser Asp
305 310 315 320
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
325 330 335
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
340 345 350
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 166
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 166
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Thr Ile Pro Pro His Val Gln Lys
20 25 30
Ser Asp Val Glu Met Glu Ala Gln Lys Asp Glu Ile Ile Cys Pro Ser
35 40 45
Cys Asn Arg Thr Ala His Pro Leu Arg His Ile Asn Asn Asp Met Ile
50 55 60
Val Thr Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe
65 70 75 80
Cys Asp Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser
85 90 95
Asn Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val
100 105 110
Ala Val Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys
115 120 125
His Asp Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala
130 135 140
Ser Pro Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe
145 150 155 160
Phe Met Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe
165 170 175
Ser Glu Glu Tyr Asn Thr Ser Asn Pro Asp Thr Gly Gly Gly Thr His
180 185 190
Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
195 200 205
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
210 215 220
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
225 230 235 240
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
245 250 255
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
260 265 270
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
275 280 285
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
290 295 300
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
305 310 315 320
Pro Ser Arg Lys Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
325 330 335
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
340 345 350
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Lys Ser
355 360 365
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
370 375 380
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
385 390 395 400
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
405 410 415
<210> 167
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 167
Thr Ile Pro Pro His Val Gln Lys Ser Asp Val Glu Met Glu Ala Gln
1 5 10 15
Lys Asp Glu Ile Ile Cys Pro Ser Cys Asn Arg Thr Ala His Pro Leu
20 25 30
Arg His Ile Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val
35 40 45
Lys Phe Pro Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys
50 55 60
Asp Asn Gln Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys
65 70 75 80
Glu Lys Pro Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu
85 90 95
Asn Ile Thr Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His
100 105 110
Asp Phe Ile Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu
115 120 125
Lys Lys Lys Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp
130 135 140
Glu Cys Asn Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn
145 150 155 160
Pro Asp Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
165 170 175
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
180 185 190
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
195 200 205
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
210 215 220
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
225 230 235 240
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
245 250 255
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
260 265 270
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
275 280 285
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Lys Glu Met Thr Lys
290 295 300
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
305 310 315 320
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
325 330 335
Thr Thr Pro Pro Val Leu Lys Ser Asp Gly Ser Phe Phe Leu Tyr Ser
340 345 350
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
355 360 365
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
370 375 380
Leu Ser Leu Ser Pro Gly Lys
385 390
<210> 168
<400> 168
000
<210> 169
<400> 169
000
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 172
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Thr Ile Pro Pro His Val Gln Lys
20 25 30
Ser Val Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val Lys
35 40 45
Phe Pro Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys Asp
50 55 60
Asn Gln Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys Glu
65 70 75 80
Lys Pro Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu Asn
85 90 95
Ile Thr Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His Asp
100 105 110
Phe Ile Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu Lys
115 120 125
Lys Lys Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp Glu
130 135 140
Cys Asn Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn Pro
145 150 155 160
Asp Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
165 170 175
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
180 185 190
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
195 200 205
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
210 215 220
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
225 230 235 240
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
245 250 255
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
260 265 270
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
275 280 285
Pro Gln Val Tyr Thr Leu Pro Pro Cys Arg Glu Glu Met Thr Lys Asn
290 295 300
Gln Val Ser Leu Trp Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
305 310 315 320
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
325 330 335
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
340 345 350
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
355 360 365
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
370 375 380
Ser Leu Ser Pro Gly Lys
385 390
<210> 173
<211> 366
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 173
Thr Ile Pro Pro His Val Gln Lys Ser Val Asn Asn Asp Met Ile Val
1 5 10 15
Thr Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe Cys
20 25 30
Asp Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser Asn
35 40 45
Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val Ala
50 55 60
Val Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys His
65 70 75 80
Asp Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala Ser
85 90 95
Pro Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe Phe
100 105 110
Met Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe Ser
115 120 125
Glu Glu Tyr Asn Thr Ser Asn Pro Asp Thr Gly Gly Gly Thr His Thr
130 135 140
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
145 150 155 160
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
165 170 175
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
180 185 190
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
195 200 205
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
210 215 220
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
225 230 235 240
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
245 250 255
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
260 265 270
Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp Cys Leu Val
275 280 285
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
290 295 300
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
305 310 315 320
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
325 330 335
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
340 345 350
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
355 360 365
<210> 174
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 174
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Thr Ile Pro Pro His Val Gln Lys
20 25 30
Ser Asp Val Glu Met Glu Ala Gln Lys Asp Glu Ile Ile Cys Pro Ser
35 40 45
Cys Asn Arg Thr Ala His Pro Leu Arg His Ile Asn Asn Asp Met Ile
50 55 60
Val Thr Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe
65 70 75 80
Cys Asp Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser
85 90 95
Asn Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val
100 105 110
Ala Val Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys
115 120 125
His Asp Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala
130 135 140
Ser Pro Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe
145 150 155 160
Phe Met Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe
165 170 175
Ser Glu Glu Tyr Asn Thr Ser Asn Pro Asp Thr Gly Gly Gly Thr His
180 185 190
Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
195 200 205
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
210 215 220
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
225 230 235 240
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
245 250 255
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
260 265 270
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
275 280 285
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
290 295 300
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
305 310 315 320
Pro Cys Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Trp Cys Leu
325 330 335
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
340 345 350
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
355 360 365
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
370 375 380
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
385 390 395 400
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
405 410 415
<210> 175
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 175
Thr Ile Pro Pro His Val Gln Lys Ser Asp Val Glu Met Glu Ala Gln
1 5 10 15
Lys Asp Glu Ile Ile Cys Pro Ser Cys Asn Arg Thr Ala His Pro Leu
20 25 30
Arg His Ile Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val
35 40 45
Lys Phe Pro Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys
50 55 60
Asp Asn Gln Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys
65 70 75 80
Glu Lys Pro Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu
85 90 95
Asn Ile Thr Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His
100 105 110
Asp Phe Ile Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu
115 120 125
Lys Lys Lys Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp
130 135 140
Glu Cys Asn Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn
145 150 155 160
Pro Asp Thr Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro
165 170 175
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
180 185 190
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
195 200 205
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
210 215 220
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
225 230 235 240
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
245 250 255
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
260 265 270
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
275 280 285
Glu Pro Gln Val Tyr Thr Leu Pro Pro Cys Arg Glu Glu Met Thr Lys
290 295 300
Asn Gln Val Ser Leu Trp Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
305 310 315 320
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
325 330 335
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
340 345 350
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
355 360 365
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
370 375 380
Leu Ser Leu Ser Pro Gly Lys
385 390
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<211> 573
<212> PRT
<213> Homo sapiens
<400> 180
Met Leu Gly Ser Leu Gly Leu Trp Ala Leu Leu Pro Thr Ala Val Glu
1 5 10 15
Ala Pro Pro Asn Arg Arg Thr Cys Val Phe Phe Glu Ala Pro Gly Val
20 25 30
Arg Gly Ser Thr Lys Thr Leu Gly Glu Leu Leu Asp Thr Gly Thr Glu
35 40 45
Leu Pro Arg Ala Ile Arg Cys Leu Tyr Ser Arg Cys Cys Phe Gly Ile
50 55 60
Trp Asn Leu Thr Gln Asp Arg Ala Gln Val Glu Met Gln Gly Cys Arg
65 70 75 80
Asp Ser Asp Glu Pro Gly Cys Glu Ser Leu His Cys Asp Pro Ser Pro
85 90 95
Arg Ala His Pro Ser Pro Gly Ser Thr Leu Phe Thr Cys Ser Cys Gly
100 105 110
Thr Asp Phe Cys Asn Ala Asn Tyr Ser His Leu Pro Pro Pro Gly Ser
115 120 125
Pro Gly Thr Pro Gly Ser Gln Gly Pro Gln Ala Ala Pro Gly Glu Ser
130 135 140
Ile Trp Met Ala Leu Val Leu Leu Gly Leu Phe Leu Leu Leu Leu Leu
145 150 155 160
Leu Leu Gly Ser Ile Ile Leu Ala Leu Leu Gln Arg Lys Asn Tyr Arg
165 170 175
Val Arg Gly Glu Pro Val Pro Glu Pro Arg Pro Asp Ser Gly Arg Asp
180 185 190
Trp Ser Val Glu Leu Gln Glu Leu Pro Glu Leu Cys Phe Ser Gln Val
195 200 205
Ile Arg Glu Gly Gly His Ala Val Val Trp Ala Gly Gln Leu Gln Gly
210 215 220
Lys Leu Val Ala Ile Lys Ala Phe Pro Pro Arg Ser Val Ala Gln Phe
225 230 235 240
Gln Ala Glu Arg Ala Leu Tyr Glu Leu Pro Gly Leu Gln His Asp His
245 250 255
Ile Val Arg Phe Ile Thr Ala Ser Arg Gly Gly Pro Gly Arg Leu Leu
260 265 270
Ser Gly Pro Leu Leu Val Leu Glu Leu His Pro Lys Gly Ser Leu Cys
275 280 285
His Tyr Leu Thr Gln Tyr Thr Ser Asp Trp Gly Ser Ser Leu Arg Met
290 295 300
Ala Leu Ser Leu Ala Gln Gly Leu Ala Phe Leu His Glu Glu Arg Trp
305 310 315 320
Gln Asn Gly Gln Tyr Lys Pro Gly Ile Ala His Arg Asp Leu Ser Ser
325 330 335
Gln Asn Val Leu Ile Arg Glu Asp Gly Ser Cys Ala Ile Gly Asp Leu
340 345 350
Gly Leu Ala Leu Val Leu Pro Gly Leu Thr Gln Pro Pro Ala Trp Thr
355 360 365
Pro Thr Gln Pro Gln Gly Pro Ala Ala Ile Met Glu Ala Gly Thr Gln
370 375 380
Arg Tyr Met Ala Pro Glu Leu Leu Asp Lys Thr Leu Asp Leu Gln Asp
385 390 395 400
Trp Gly Met Ala Leu Arg Arg Ala Asp Ile Tyr Ser Leu Ala Leu Leu
405 410 415
Leu Trp Glu Ile Leu Ser Arg Cys Pro Asp Leu Arg Pro Asp Ser Ser
420 425 430
Pro Pro Pro Phe Gln Leu Ala Tyr Glu Ala Glu Leu Gly Asn Thr Pro
435 440 445
Thr Ser Asp Glu Leu Trp Ala Leu Ala Val Gln Glu Arg Arg Arg Pro
450 455 460
Tyr Ile Pro Ser Thr Trp Arg Cys Phe Ala Thr Asp Pro Asp Gly Leu
465 470 475 480
Arg Glu Leu Leu Glu Asp Cys Trp Asp Ala Asp Pro Glu Ala Arg Leu
485 490 495
Thr Ala Glu Cys Val Gln Gln Arg Leu Ala Ala Leu Ala His Pro Gln
500 505 510
Glu Ser His Pro Phe Pro Glu Ser Cys Pro Arg Gly Cys Pro Pro Leu
515 520 525
Cys Pro Glu Asp Cys Thr Ser Ile Pro Ala Pro Thr Ile Leu Pro Cys
530 535 540
Arg Pro Gln Arg Ser Ala Cys His Phe Ser Val Gln Gln Gly Pro Cys
545 550 555 560
Ser Arg Asn Pro Gln Pro Ala Cys Thr Leu Ser Pro Val
565 570
<210> 181
<211> 478
<212> PRT
<213> Homo sapiens
<400> 181
Met Leu Gly Ser Leu Gly Leu Trp Ala Leu Leu Pro Thr Ala Val Glu
1 5 10 15
Ala Pro Pro Asn Arg Arg Thr Cys Val Phe Phe Glu Ala Pro Gly Val
20 25 30
Arg Gly Ser Thr Lys Thr Leu Gly Glu Leu Leu Asp Thr Gly Thr Glu
35 40 45
Leu Pro Arg Ala Ile Arg Cys Leu Tyr Ser Arg Cys Cys Phe Gly Ile
50 55 60
Trp Asn Leu Thr Gln Asp Arg Ala Gln Val Glu Met Gln Gly Cys Arg
65 70 75 80
Asp Ser Asp Glu Pro Gly Cys Glu Ser Leu His Cys Asp Pro Ser Pro
85 90 95
Arg Ala His Pro Ser Pro Gly Ser Thr Leu Phe Thr Cys Ser Cys Gly
100 105 110
Thr Asp Phe Cys Asn Ala Asn Tyr Ser His Leu Pro Pro Pro Gly Ser
115 120 125
Pro Gly Thr Pro Gly Ser Gln Gly Pro Gln Ala Ala Pro Gly Glu Ser
130 135 140
Ile Trp Met Ala Leu Val Leu Leu Gly Leu Phe Leu Leu Leu Leu Leu
145 150 155 160
Leu Leu Gly Ser Ile Ile Leu Ala Leu Leu Gln Arg Lys Asn Tyr Arg
165 170 175
Val Arg Gly Glu Pro Val Pro Glu Pro Arg Pro Asp Ser Gly Arg Asp
180 185 190
Trp Ser Val Glu Leu Gln Glu Leu Pro Glu Leu Cys Phe Ser Gln Val
195 200 205
Ile Arg Glu Gly Gly His Ala Val Val Trp Ala Gly Gln Leu Gln Gly
210 215 220
Lys Leu Val Ala Ile Lys Ala Phe Pro Pro Arg Ser Val Ala Gln Phe
225 230 235 240
Gln Ala Glu Arg Ala Leu Tyr Glu Leu Pro Gly Leu Gln His Asp His
245 250 255
Ile Val Arg Phe Ile Thr Ala Ser Arg Gly Gly Pro Gly Arg Leu Leu
260 265 270
Ser Gly Pro Leu Leu Val Leu Glu Leu His Pro Lys Gly Ser Leu Cys
275 280 285
His Tyr Leu Thr Gln Tyr Thr Ser Asp Trp Gly Ser Ser Leu Arg Met
290 295 300
Ala Leu Ser Leu Ala Gln Gly Leu Ala Phe Leu His Glu Glu Arg Trp
305 310 315 320
Gln Asn Gly Gln Tyr Lys Pro Gly Ile Ala His Arg Asp Leu Ser Ser
325 330 335
Gln Asn Val Leu Ile Arg Glu Asp Gly Ser Cys Ala Ile Gly Asp Leu
340 345 350
Gly Leu Ala Leu Val Leu Pro Gly Leu Thr Gln Pro Pro Ala Trp Thr
355 360 365
Pro Thr Gln Pro Gln Gly Pro Ala Ala Ile Met Glu Ala Gly Thr Gln
370 375 380
Arg Tyr Met Ala Pro Glu Leu Leu Asp Lys Thr Leu Asp Leu Gln Asp
385 390 395 400
Trp Gly Met Ala Leu Arg Arg Ala Asp Ile Tyr Ser Leu Ala Leu Leu
405 410 415
Leu Trp Glu Ile Leu Ser Arg Cys Pro Asp Leu Arg Pro Ala Val His
420 425 430
His Pro Ser Asn Trp Pro Met Arg Gln Asn Trp Ala Ile Pro Leu Pro
435 440 445
Leu Met Ser Tyr Gly Pro Trp Gln Cys Arg Arg Gly Gly Val Pro Thr
450 455 460
Ser His Pro Pro Gly Ala Ala Leu Pro Gln Thr Leu Met Gly
465 470 475
<210> 182
<211> 478
<212> PRT
<213> Homo sapiens
<400> 182
Met Leu Gly Ser Leu Gly Leu Trp Ala Leu Leu Pro Thr Ala Val Glu
1 5 10 15
Ala Pro Pro Asn Arg Arg Thr Cys Val Phe Phe Glu Ala Pro Gly Val
20 25 30
Arg Gly Ser Thr Lys Thr Leu Gly Glu Leu Leu Asp Thr Gly Thr Glu
35 40 45
Leu Pro Arg Ala Ile Arg Cys Leu Tyr Ser Arg Cys Cys Phe Gly Ile
50 55 60
Trp Asn Leu Thr Gln Asp Arg Ala Gln Val Glu Met Gln Gly Cys Arg
65 70 75 80
Asp Ser Asp Glu Pro Gly Cys Glu Ser Leu His Cys Asp Pro Ser Pro
85 90 95
Arg Ala His Pro Ser Pro Gly Ser Thr Leu Phe Thr Cys Ser Cys Gly
100 105 110
Thr Asp Phe Cys Asn Ala Asn Tyr Ser His Leu Pro Pro Pro Gly Ser
115 120 125
Pro Gly Thr Pro Gly Ser Gln Gly Pro Gln Ala Ala Pro Gly Glu Ser
130 135 140
Ile Trp Met Ala Leu Val Leu Leu Gly Leu Phe Leu Leu Leu Leu Leu
145 150 155 160
Leu Leu Gly Ser Ile Ile Leu Ala Leu Leu Gln Arg Lys Asn Tyr Arg
165 170 175
Val Arg Gly Glu Pro Val Pro Glu Pro Arg Pro Asp Ser Gly Arg Asp
180 185 190
Trp Ser Val Glu Leu Gln Glu Leu Pro Glu Leu Cys Phe Ser Gln Val
195 200 205
Ile Arg Glu Gly Gly His Ala Val Val Trp Ala Gly Gln Leu Gln Gly
210 215 220
Lys Leu Val Ala Ile Lys Ala Phe Pro Pro Arg Ser Val Ala Gln Phe
225 230 235 240
Gln Ala Glu Arg Ala Leu Tyr Glu Leu Pro Gly Leu Gln His Asp His
245 250 255
Ile Val Arg Phe Ile Thr Ala Ser Arg Gly Gly Pro Gly Arg Leu Leu
260 265 270
Ser Gly Pro Leu Leu Val Leu Glu Leu His Pro Lys Gly Ser Leu Cys
275 280 285
His Tyr Leu Thr Gln Tyr Thr Ser Asp Trp Gly Ser Ser Leu Arg Met
290 295 300
Ala Leu Ser Leu Ala Gln Gly Leu Ala Phe Leu His Glu Glu Arg Trp
305 310 315 320
Gln Asn Gly Gln Tyr Lys Pro Gly Ile Ala His Arg Asp Leu Ser Ser
325 330 335
Gln Asn Val Leu Ile Arg Glu Asp Gly Ser Cys Ala Ile Gly Asp Leu
340 345 350
Gly Leu Ala Leu Val Leu Pro Gly Leu Thr Gln Pro Pro Ala Trp Thr
355 360 365
Pro Thr Gln Pro Gln Gly Pro Ala Ala Ile Met Glu Asp Pro Asp Gly
370 375 380
Leu Arg Glu Leu Leu Glu Asp Cys Trp Asp Ala Asp Pro Glu Ala Arg
385 390 395 400
Leu Thr Ala Glu Cys Val Gln Gln Arg Leu Ala Ala Leu Ala His Pro
405 410 415
Gln Glu Ser His Pro Phe Pro Glu Ser Cys Pro Arg Gly Cys Pro Pro
420 425 430
Leu Cys Pro Glu Asp Cys Thr Ser Ile Pro Ala Pro Thr Ile Leu Pro
435 440 445
Cys Arg Pro Gln Arg Ser Ala Cys His Phe Ser Val Gln Gln Gly Pro
450 455 460
Cys Ser Arg Asn Pro Gln Pro Ala Cys Thr Leu Ser Pro Val
465 470 475
<210> 183
<211> 132
<212> PRT
<213> Homo sapiens
<400> 183
Pro Pro Asn Arg Arg Thr Cys Val Phe Phe Glu Ala Pro Gly Val Arg
1 5 10 15
Gly Ser Thr Lys Thr Leu Gly Glu Leu Leu Asp Thr Gly Thr Glu Leu
20 25 30
Pro Arg Ala Ile Arg Cys Leu Tyr Ser Arg Cys Cys Phe Gly Ile Trp
35 40 45
Asn Leu Thr Gln Asp Arg Ala Gln Val Glu Met Gln Gly Cys Arg Asp
50 55 60
Ser Asp Glu Pro Gly Cys Glu Ser Leu His Cys Asp Pro Ser Pro Arg
65 70 75 80
Ala His Pro Ser Pro Gly Ser Thr Leu Phe Thr Cys Ser Cys Gly Thr
85 90 95
Asp Phe Cys Asn Ala Asn Tyr Ser His Leu Pro Pro Pro Gly Ser Pro
100 105 110
Gly Thr Pro Gly Ser Gln Gly Pro Gln Ala Ala Pro Gly Glu Ser Ile
115 120 125
Trp Met Ala Leu
130
<210> 184
<211> 132
<212> PRT
<213> Homo sapiens
<400> 184
Pro Pro Asn Arg Arg Thr Cys Val Phe Phe Glu Ala Pro Gly Val Arg
1 5 10 15
Gly Ser Thr Lys Thr Leu Gly Glu Leu Leu Asp Thr Gly Thr Glu Leu
20 25 30
Pro Arg Ala Ile Arg Cys Leu Tyr Ser Arg Cys Cys Phe Gly Ile Trp
35 40 45
Asn Leu Thr Gln Asp Arg Ala Gln Val Glu Met Gln Gly Cys Arg Asp
50 55 60
Ser Asp Glu Pro Gly Cys Glu Ser Leu His Cys Asp Pro Ser Pro Arg
65 70 75 80
Ala His Pro Ser Pro Gly Ser Thr Leu Phe Thr Cys Ser Cys Gly Thr
85 90 95
Asp Phe Cys Asn Ala Asn Tyr Ser His Leu Pro Pro Pro Gly Ser Pro
100 105 110
Gly Thr Pro Gly Ser Gln Gly Pro Gln Ala Ala Pro Gly Glu Ser Ile
115 120 125
Trp Met Ala Leu
130
<210> 185
<211> 132
<212> PRT
<213> Homo sapiens
<400> 185
Pro Pro Asn Arg Arg Thr Cys Val Phe Phe Glu Ala Pro Gly Val Arg
1 5 10 15
Gly Ser Thr Lys Thr Leu Gly Glu Leu Leu Asp Thr Gly Thr Glu Leu
20 25 30
Pro Arg Ala Ile Arg Cys Leu Tyr Ser Arg Cys Cys Phe Gly Ile Trp
35 40 45
Asn Leu Thr Gln Asp Arg Ala Gln Val Glu Met Gln Gly Cys Arg Asp
50 55 60
Ser Asp Glu Pro Gly Cys Glu Ser Leu His Cys Asp Pro Ser Pro Arg
65 70 75 80
Ala His Pro Ser Pro Gly Ser Thr Leu Phe Thr Cys Ser Cys Gly Thr
85 90 95
Asp Phe Cys Asn Ala Asn Tyr Ser His Leu Pro Pro Pro Gly Ser Pro
100 105 110
Gly Thr Pro Gly Ser Gln Gly Pro Gln Ala Ala Pro Gly Glu Ser Ile
115 120 125
Trp Met Ala Leu
130
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<211> 567
<212> PRT
<213> Homo sapiens
<400> 194
Met Gly Arg Gly Leu Leu Arg Gly Leu Trp Pro Leu His Ile Val Leu
1 5 10 15
Trp Thr Arg Ile Ala Ser Thr Ile Pro Pro His Val Gln Lys Ser Val
20 25 30
Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val Lys Phe Pro
35 40 45
Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys Asp Asn Gln
50 55 60
Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro
65 70 75 80
Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu Asn Ile Thr
85 90 95
Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His Asp Phe Ile
100 105 110
Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu Lys Lys Lys
115 120 125
Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp Glu Cys Asn
130 135 140
Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn Pro Asp Leu
145 150 155 160
Leu Leu Val Ile Phe Gln Val Thr Gly Ile Ser Leu Leu Pro Pro Leu
165 170 175
Gly Val Ala Ile Ser Val Ile Ile Ile Phe Tyr Cys Tyr Arg Val Asn
180 185 190
Arg Gln Gln Lys Leu Ser Ser Thr Trp Glu Thr Gly Lys Thr Arg Lys
195 200 205
Leu Met Glu Phe Ser Glu His Cys Ala Ile Ile Leu Glu Asp Asp Arg
210 215 220
Ser Asp Ile Ser Ser Thr Cys Ala Asn Asn Ile Asn His Asn Thr Glu
225 230 235 240
Leu Leu Pro Ile Glu Leu Asp Thr Leu Val Gly Lys Gly Arg Phe Ala
245 250 255
Glu Val Tyr Lys Ala Lys Leu Lys Gln Asn Thr Ser Glu Gln Phe Glu
260 265 270
Thr Val Ala Val Lys Ile Phe Pro Tyr Glu Glu Tyr Ala Ser Trp Lys
275 280 285
Thr Glu Lys Asp Ile Phe Ser Asp Ile Asn Leu Lys His Glu Asn Ile
290 295 300
Leu Gln Phe Leu Thr Ala Glu Glu Arg Lys Thr Glu Leu Gly Lys Gln
305 310 315 320
Tyr Trp Leu Ile Thr Ala Phe His Ala Lys Gly Asn Leu Gln Glu Tyr
325 330 335
Leu Thr Arg His Val Ile Ser Trp Glu Asp Leu Arg Lys Leu Gly Ser
340 345 350
Ser Leu Ala Arg Gly Ile Ala His Leu His Ser Asp His Thr Pro Cys
355 360 365
Gly Arg Pro Lys Met Pro Ile Val His Arg Asp Leu Lys Ser Ser Asn
370 375 380
Ile Leu Val Lys Asn Asp Leu Thr Cys Cys Leu Cys Asp Phe Gly Leu
385 390 395 400
Ser Leu Arg Leu Asp Pro Thr Leu Ser Val Asp Asp Leu Ala Asn Ser
405 410 415
Gly Gln Val Gly Thr Ala Arg Tyr Met Ala Pro Glu Val Leu Glu Ser
420 425 430
Arg Met Asn Leu Glu Asn Val Glu Ser Phe Lys Gln Thr Asp Val Tyr
435 440 445
Ser Met Ala Leu Val Leu Trp Glu Met Thr Ser Arg Cys Asn Ala Val
450 455 460
Gly Glu Val Lys Asp Tyr Glu Pro Pro Phe Gly Ser Lys Val Arg Glu
465 470 475 480
His Pro Cys Val Glu Ser Met Lys Asp Asn Val Leu Arg Asp Arg Gly
485 490 495
Arg Pro Glu Ile Pro Ser Phe Trp Leu Asn His Gln Gly Ile Gln Met
500 505 510
Val Cys Glu Thr Leu Thr Glu Cys Trp Asp His Asp Pro Glu Ala Arg
515 520 525
Leu Thr Ala Gln Cys Val Ala Glu Arg Phe Ser Glu Leu Glu His Leu
530 535 540
Asp Arg Leu Ser Gly Arg Ser Cys Ser Glu Glu Lys Ile Pro Glu Asp
545 550 555 560
Gly Ser Leu Asn Thr Thr Lys
565
<210> 195
<211> 144
<212> PRT
<213> Homo sapiens
<400> 195
Thr Ile Pro Pro His Val Gln Lys Ser Val Asn Asn Asp Met Ile Val
1 5 10 15
Thr Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe Cys
20 25 30
Asp Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser Asn
35 40 45
Cys Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val Ala
50 55 60
Val Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys His
65 70 75 80
Asp Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala Ser
85 90 95
Pro Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe Phe
100 105 110
Met Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe Ser
115 120 125
Glu Glu Tyr Asn Thr Ser Asn Pro Asp Leu Leu Leu Val Ile Phe Gln
130 135 140
<210> 196
<211> 1701
<212> DNA
<213> Homo sapiens
<400> 196
atgggtcggg ggctgctcag gggcctgtgg ccgctgcaca tcgtcctgtg gacgcgtatc 60
gccagcacga tcccaccgca cgttcagaag tcggttaata acgacatgat agtcactgac 120
aacaacggtg cagtcaagtt tccacaactg tgtaaatttt gtgatgtgag attttccacc 180
tgtgacaacc agaaatcctg catgagcaac tgcagcatca cctccatctg tgagaagcca 240
caggaagtct gtgtggctgt atggagaaag aatgacgaga acataacact agagacagtt 300
tgccatgacc ccaagctccc ctaccatgac tttattctgg aagatgctgc ttctccaaag 360
tgcattatga aggaaaaaaa aaagcctggt gagactttct tcatgtgttc ctgtagctct 420
gatgagtgca atgacaacat catcttctca gaagaatata acaccagcaa tcctgacttg 480
ttgctagtca tatttcaagt gacaggcatc agcctcctgc caccactggg agttgccata 540
tctgtcatca tcatcttcta ctgctaccgc gttaaccggc agcagaagct gagttcaacc 600
tgggaaaccg gcaagacgcg gaagctcatg gagttcagcg agcactgtgc catcatcctg 660
gaagatgacc gctctgacat cagctccacg tgtgccaaca acatcaacca caacacagag 720
ctgctgccca ttgagctgga caccctggtg gggaaaggtc gctttgctga ggtctataag 780
gccaagctga agcagaacac ttcagagcag tttgagacag tggcagtcaa gatctttccc 840
tatgaggagt atgcctcttg gaagacagag aaggacatct tctcagacat caatctgaag 900
catgagaaca tactccagtt cctgacggct gaggagcgga agacggagtt ggggaaacaa 960
tactggctga tcaccgcctt ccacgccaag ggcaacctac aggagtacct gacgcggcat 1020
gtcatcagct gggaggacct gcgcaagctg ggcagctccc tcgcccgggg gattgctcac 1080
ctccacagtg atcacactcc atgtgggagg cccaagatgc ccatcgtgca cagggacctc 1140
aagagctcca atatcctcgt gaagaacgac ctaacctgct gcctgtgtga ctttgggctt 1200
tccctgcgtc tggaccctac tctgtctgtg gatgacctgg ctaacagtgg gcaggtggga 1260
actgcaagat acatggctcc agaagtccta gaatccagga tgaatttgga gaatgttgag 1320
tccttcaagc agaccgatgt ctactccatg gctctggtgc tctgggaaat gacatctcgc 1380
tgtaatgcag tgggagaagt aaaagattat gagcctccat ttggttccaa ggtgcgggag 1440
cacccctgtg tcgaaagcat gaaggacaac gtgttgagag atcgagggcg accagaaatt 1500
cccagcttct ggctcaacca ccagggcatc cagatggtgt gtgagacgtt gactgagtgc 1560
tgggaccacg acccagaggc ccgtctcaca gcccagtgtg tggcagaacg cttcagtgag 1620
ctggagcatc tggacaggct ctcggggagg agctgctcgg aggagaagat tcctgaagac 1680
ggctccctaa acactaccaa a 1701
<210> 197
<211> 432
<212> DNA
<213> Homo sapiens
<400> 197
acgatcccac cgcacgttca gaagtcggtt aataacgaca tgatagtcac tgacaacaac 60
ggtgcagtca agtttccaca actgtgtaaa ttttgtgatg tgagattttc cacctgtgac 120
aaccagaaat cctgcatgag caactgcagc atcacctcca tctgtgagaa gccacaggaa 180
gtctgtgtgg ctgtatggag aaagaatgac gagaacataa cactagagac agtttgccat 240
gaccccaagc tcccctacca tgactttatt ctggaagatg ctgcttctcc aaagtgcatt 300
atgaaggaaa aaaaaaagcc tggtgagact ttcttcatgt gttcctgtag ctctgatgag 360
tgcaatgaca acatcatctt ctcagaagaa tataacacca gcaatcctga cttgttgcta 420
gtcatatttc aa 432
<210> 198
<211> 592
<212> PRT
<213> Homo sapiens
<400> 198
Met Gly Arg Gly Leu Leu Arg Gly Leu Trp Pro Leu His Ile Val Leu
1 5 10 15
Trp Thr Arg Ile Ala Ser Thr Ile Pro Pro His Val Gln Lys Ser Asp
20 25 30
Val Glu Met Glu Ala Gln Lys Asp Glu Ile Ile Cys Pro Ser Cys Asn
35 40 45
Arg Thr Ala His Pro Leu Arg His Ile Asn Asn Asp Met Ile Val Thr
50 55 60
Asp Asn Asn Gly Ala Val Lys Phe Pro Gln Leu Cys Lys Phe Cys Asp
65 70 75 80
Val Arg Phe Ser Thr Cys Asp Asn Gln Lys Ser Cys Met Ser Asn Cys
85 90 95
Ser Ile Thr Ser Ile Cys Glu Lys Pro Gln Glu Val Cys Val Ala Val
100 105 110
Trp Arg Lys Asn Asp Glu Asn Ile Thr Leu Glu Thr Val Cys His Asp
115 120 125
Pro Lys Leu Pro Tyr His Asp Phe Ile Leu Glu Asp Ala Ala Ser Pro
130 135 140
Lys Cys Ile Met Lys Glu Lys Lys Lys Pro Gly Glu Thr Phe Phe Met
145 150 155 160
Cys Ser Cys Ser Ser Asp Glu Cys Asn Asp Asn Ile Ile Phe Ser Glu
165 170 175
Glu Tyr Asn Thr Ser Asn Pro Asp Leu Leu Leu Val Ile Phe Gln Val
180 185 190
Thr Gly Ile Ser Leu Leu Pro Pro Leu Gly Val Ala Ile Ser Val Ile
195 200 205
Ile Ile Phe Tyr Cys Tyr Arg Val Asn Arg Gln Gln Lys Leu Ser Ser
210 215 220
Thr Trp Glu Thr Gly Lys Thr Arg Lys Leu Met Glu Phe Ser Glu His
225 230 235 240
Cys Ala Ile Ile Leu Glu Asp Asp Arg Ser Asp Ile Ser Ser Thr Cys
245 250 255
Ala Asn Asn Ile Asn His Asn Thr Glu Leu Leu Pro Ile Glu Leu Asp
260 265 270
Thr Leu Val Gly Lys Gly Arg Phe Ala Glu Val Tyr Lys Ala Lys Leu
275 280 285
Lys Gln Asn Thr Ser Glu Gln Phe Glu Thr Val Ala Val Lys Ile Phe
290 295 300
Pro Tyr Glu Glu Tyr Ala Ser Trp Lys Thr Glu Lys Asp Ile Phe Ser
305 310 315 320
Asp Ile Asn Leu Lys His Glu Asn Ile Leu Gln Phe Leu Thr Ala Glu
325 330 335
Glu Arg Lys Thr Glu Leu Gly Lys Gln Tyr Trp Leu Ile Thr Ala Phe
340 345 350
His Ala Lys Gly Asn Leu Gln Glu Tyr Leu Thr Arg His Val Ile Ser
355 360 365
Trp Glu Asp Leu Arg Lys Leu Gly Ser Ser Leu Ala Arg Gly Ile Ala
370 375 380
His Leu His Ser Asp His Thr Pro Cys Gly Arg Pro Lys Met Pro Ile
385 390 395 400
Val His Arg Asp Leu Lys Ser Ser Asn Ile Leu Val Lys Asn Asp Leu
405 410 415
Thr Cys Cys Leu Cys Asp Phe Gly Leu Ser Leu Arg Leu Asp Pro Thr
420 425 430
Leu Ser Val Asp Asp Leu Ala Asn Ser Gly Gln Val Gly Thr Ala Arg
435 440 445
Tyr Met Ala Pro Glu Val Leu Glu Ser Arg Met Asn Leu Glu Asn Val
450 455 460
Glu Ser Phe Lys Gln Thr Asp Val Tyr Ser Met Ala Leu Val Leu Trp
465 470 475 480
Glu Met Thr Ser Arg Cys Asn Ala Val Gly Glu Val Lys Asp Tyr Glu
485 490 495
Pro Pro Phe Gly Ser Lys Val Arg Glu His Pro Cys Val Glu Ser Met
500 505 510
Lys Asp Asn Val Leu Arg Asp Arg Gly Arg Pro Glu Ile Pro Ser Phe
515 520 525
Trp Leu Asn His Gln Gly Ile Gln Met Val Cys Glu Thr Leu Thr Glu
530 535 540
Cys Trp Asp His Asp Pro Glu Ala Arg Leu Thr Ala Gln Cys Val Ala
545 550 555 560
Glu Arg Phe Ser Glu Leu Glu His Leu Asp Arg Leu Ser Gly Arg Ser
565 570 575
Cys Ser Glu Glu Lys Ile Pro Glu Asp Gly Ser Leu Asn Thr Thr Lys
580 585 590
<210> 199
<211> 169
<212> PRT
<213> Homo sapiens
<400> 199
Thr Ile Pro Pro His Val Gln Lys Ser Asp Val Glu Met Glu Ala Gln
1 5 10 15
Lys Asp Glu Ile Ile Cys Pro Ser Cys Asn Arg Thr Ala His Pro Leu
20 25 30
Arg His Ile Asn Asn Asp Met Ile Val Thr Asp Asn Asn Gly Ala Val
35 40 45
Lys Phe Pro Gln Leu Cys Lys Phe Cys Asp Val Arg Phe Ser Thr Cys
50 55 60
Asp Asn Gln Lys Ser Cys Met Ser Asn Cys Ser Ile Thr Ser Ile Cys
65 70 75 80
Glu Lys Pro Gln Glu Val Cys Val Ala Val Trp Arg Lys Asn Asp Glu
85 90 95
Asn Ile Thr Leu Glu Thr Val Cys His Asp Pro Lys Leu Pro Tyr His
100 105 110
Asp Phe Ile Leu Glu Asp Ala Ala Ser Pro Lys Cys Ile Met Lys Glu
115 120 125
Lys Lys Lys Pro Gly Glu Thr Phe Phe Met Cys Ser Cys Ser Ser Asp
130 135 140
Glu Cys Asn Asp Asn Ile Ile Phe Ser Glu Glu Tyr Asn Thr Ser Asn
145 150 155 160
Pro Asp Leu Leu Leu Val Ile Phe Gln
165
<210> 200
<400> 200
000
<210> 201
<400> 201
000
<210> 202
<211> 1776
<212> DNA
<213> Homo sapiens
<400> 202
atgggtcggg ggctgctcag gggcctgtgg ccgctgcaca tcgtcctgtg gacgcgtatc 60
gccagcacga tcccaccgca cgttcagaag tcggatgtgg aaatggaggc ccagaaagat 120
gaaatcatct gccccagctg taataggact gcccatccac tgagacatat taataacgac 180
atgatagtca ctgacaacaa cggtgcagtc aagtttccac aactgtgtaa attttgtgat 240
gtgagatttt ccacctgtga caaccagaaa tcctgcatga gcaactgcag catcacctcc 300
atctgtgaga agccacagga agtctgtgtg gctgtatgga gaaagaatga cgagaacata 360
acactagaga cagtttgcca tgaccccaag ctcccctacc atgactttat tctggaagat 420
gctgcttctc caaagtgcat tatgaaggaa aaaaaaaagc ctggtgagac tttcttcatg 480
tgttcctgta gctctgatga gtgcaatgac aacatcatct tctcagaaga atataacacc 540
agcaatcctg acttgttgct agtcatattt caagtgacag gcatcagcct cctgccacca 600
ctgggagttg ccatatctgt catcatcatc ttctactgct accgcgttaa ccggcagcag 660
aagctgagtt caacctggga aaccggcaag acgcggaagc tcatggagtt cagcgagcac 720
tgtgccatca tcctggaaga tgaccgctct gacatcagct ccacgtgtgc caacaacatc 780
aaccacaaca cagagctgct gcccattgag ctggacaccc tggtggggaa aggtcgcttt 840
gctgaggtct ataaggccaa gctgaagcag aacacttcag agcagtttga gacagtggca 900
gtcaagatct ttccctatga ggagtatgcc tcttggaaga cagagaagga catcttctca 960
gacatcaatc tgaagcatga gaacatactc cagttcctga cggctgagga gcggaagacg 1020
gagttgggga aacaatactg gctgatcacc gccttccacg ccaagggcaa cctacaggag 1080
tacctgacgc ggcatgtcat cagctgggag gacctgcgca agctgggcag ctccctcgcc 1140
cgggggattg ctcacctcca cagtgatcac actccatgtg ggaggcccaa gatgcccatc 1200
gtgcacaggg acctcaagag ctccaatatc ctcgtgaaga acgacctaac ctgctgcctg 1260
tgtgactttg ggctttccct gcgtctggac cctactctgt ctgtggatga cctggctaac 1320
agtgggcagg tgggaactgc aagatacatg gctccagaag tcctagaatc caggatgaat 1380
ttggagaatg ttgagtcctt caagcagacc gatgtctact ccatggctct ggtgctctgg 1440
gaaatgacat ctcgctgtaa tgcagtggga gaagtaaaag attatgagcc tccatttggt 1500
tccaaggtgc gggagcaccc ctgtgtcgaa agcatgaagg acaacgtgtt gagagatcga 1560
gggcgaccag aaattcccag cttctggctc aaccaccagg gcatccagat ggtgtgtgag 1620
acgttgactg agtgctggga ccacgaccca gaggcccgtc tcacagccca gtgtgtggca 1680
gaacgcttca gtgagctgga gcatctggac aggctctcgg ggaggagctg ctcggaggag 1740
aagattcctg aagacggctc cctaaacact accaaa 1776
<210> 203
<211> 507
<212> DNA
<213> Homo sapiens
<400> 203
acgatcccac cgcacgttca gaagtcggat gtggaaatgg aggcccagaa agatgaaatc 60
atctgcccca gctgtaatag gactgcccat ccactgagac atattaataa cgacatgata 120
gtcactgaca acaacggtgc agtcaagttt ccacaactgt gtaaattttg tgatgtgaga 180
ttttccacct gtgacaacca gaaatcctgc atgagcaact gcagcatcac ctccatctgt 240
gagaagccac aggaagtctg tgtggctgta tggagaaaga atgacgagaa cataacacta 300
gagacagttt gccatgaccc caagctcccc taccatgact ttattctgga agatgctgct 360
tctccaaagt gcattatgaa ggaaaaaaaa aagcctggtg agactttctt catgtgttcc 420
tgtagctctg atgagtgcaa tgacaacatc atcttctcag aagaatataa caccagcaat 480
cctgacttgt tgctagtcat atttcaa 507
<210> 204
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 204
Gly Arg Cys Lys Ile Arg His Ile Gly Ser Asn Asn Arg Leu Gln Arg
1 5 10 15
Ser Thr Cys Gln Asn Thr Gly Trp Glu Ser Ala His Val Met Lys Thr
20 25 30
Pro Gly Phe Arg
35
<210> 205
<211> 3114
<212> DNA
<213> Homo sapiens
<400> 205
atgacttcct cgctgcagcg gccctggcgg gtgccctggc taccatggac catcctgctg 60
gtcagcactg cggctgcttc gcagaatcaa gaacggctat gtgcgtttaa agatccgtat 120
cagcaagacc ttgggatagg tgagagtaga atctctcatg aaaatgggac aatattatgc 180
tcgaaaggta gcacctgcta tggcctttgg gagaaatcaa aaggggacat aaatcttgta 240
aaacaaggat gttggtctca cattggagat ccccaagagt gtcactatga agaatgtgta 300
gtaactacca ctcctccctc aattcagaat ggaacatacc gtttctgctg ttgtagcaca 360
gatttatgta atgtcaactt tactgagaat tttccacctc ctgacacaac accactcagt 420
ccacctcatt catttaaccg agatgagaca ataatcattg ctttggcatc agtctctgta 480
ttagctgttt tgatagttgc cttatgcttt ggatacagaa tgttgacagg agaccgtaaa 540
caaggtcttc acagtatgaa catgatggag gcagcagcat ccgaaccctc tcttgatcta 600
gataatctga aactgttgga gctgattggc cgaggtcgat atggagcagt atataaaggc 660
tccttggatg agcgtccagt tgctgtaaaa gtgttttcct ttgcaaaccg tcagaatttt 720
atcaacgaaa agaacattta cagagtgcct ttgatggaac atgacaacat tgcccgcttt 780
atagttggag atgagagagt cactgcagat ggacgcatgg aatatttgct tgtgatggag 840
tactatccca atggatcttt atgcaagtat ttaagtctcc acacaagtga ctgggtaagc 900
tcttgccgtc ttgctcattc tgttactaga ggactggctt atcttcacac agaattacca 960
cgaggagatc attataaacc tgcaatttcc catcgagatt taaacagcag aaatgtccta 1020
gtgaaaaatg atggaacctg tgttattagt gactttggac tgtccatgag gctgactgga 1080
aatagactgg tgcgcccagg ggaggaagat aatgcagcca taagcgaggt tggcactatc 1140
agatatatgg caccagaagt gctagaagga gctgtgaact tgagggactg tgaatcagct 1200
ttgaaacaag tagacatgta tgctcttgga ctaatctatt gggagatatt tatgagatgt 1260
acagacctct tcccagggga atccgtacca gagtaccaga tggcttttca gacagaggtt 1320
ggaaaccatc ccacttttga ggatatgcag gttctcgtgt ctagggaaaa acagagaccc 1380
aagttcccag aagcctggaa agaaaatagc ctggcagtga ggtcactcaa ggagacaatc 1440
gaagactgtt gggaccagga tgcagaggct cggcttactg cacagtgtgc tgaggaaagg 1500
atggctgaac ttatgatgat ttgggaaaga aacaaatctg tgagcccaac agtcaatcca 1560
atgtctactg ctatgcagaa tgaacgcaac ctgtcacata ataggcgtgt gccaaaaatt 1620
ggtccttatc cagattattc ttcctcctca tacattgaag actctatcca tcatactgac 1680
agcatcgtga agaatatttc ctctgagcat tctatgtcca gcacaccttt gactataggg 1740
gaaaaaaacc gaaattcaat taactatgaa cgacagcaag cacaagctcg aatccccagc 1800
cctgaaacaa gtgtcaccag cctctccacc aacacaacaa ccacaaacac cacaggactc 1860
acgccaagta ctggcatgac tactatatct gagatgccat acccagatga aacaaatctg 1920
cataccacaa atgttgcaca gtcaattggg ccaacccctg tctgcttaca gctgacagaa 1980
gaagacttgg aaaccaacaa gctagaccca aaagaagttg ataagaacct caaggaaagc 2040
tctgatgaga atctcatgga gcactctctt aaacagttca gtggcccaga cccactgagc 2100
agtactagtt ctagcttgct ttacccactc ataaaacttg cagtagaagc aactggacag 2160
caggacttca cacagactgc aaatggccaa gcatgtttga ttcctgatgt tctgcctact 2220
cagatctatc ctctccccaa gcagcagaac cttcccaaga gacctactag tttgcctttg 2280
aacaccaaaa attcaacaaa agagccccgg ctaaaatttg gcagcaagca caaatcaaac 2340
ttgaaacaag tcgaaactgg agttgccaag atgaatacaa tcaatgcagc agaacctcat 2400
gtggtgacag tcaccatgaa tggtgtggca ggtagaaacc acagtgttaa ctcccatgct 2460
gccacaaccc aatatgccaa tgggacagta ctatctggcc aaacaaccaa catagtgaca 2520
catagggccc aagaaatgtt gcagaatcag tttattggtg aggacacccg gctgaatatt 2580
aattccagtc ctgatgagca tgagccttta ctgagacgag agcaacaagc tggccatgat 2640
gaaggtgttc tggatcgtct tgtggacagg agggaacggc cactagaagg tggccgaact 2700
aattccaata acaacaacag caatccatgt tcagaacaag atgttcttgc acagggtgtt 2760
ccaagcacag cagcagatcc tgggccatca aagcccagaa gagcacagag gcctaattct 2820
ctggatcttt cagccacaaa tgtcctggat ggcagcagta tacagatagg tgagtcaaca 2880
caagatggca aatcaggatc aggtgaaaag atcaagaaac gtgtgaaaac tccctattct 2940
cttaagcggt ggcgcccctc cacctgggtc atctccactg aatcgctgga ctgtgaagtc 3000
aacaataatg gcagtaacag ggcagttcat tccaaatcca gcactgctgt ttaccttgca 3060
gaaggaggca ctgctacaac catggtgtct aaagatatag gaatgaactg tctg 3114
<210> 206
<211> 372
<212> DNA
<213> Homo sapiens
<400> 206
tcgcagaatc aagaacggct atgtgcgttt aaagatccgt atcagcaaga ccttgggata 60
ggtgagagta gaatctctca tgaaaatggg acaatattat gctcgaaagg tagcacctgc 120
tatggccttt gggagaaatc aaaaggggac ataaatcttg taaaacaagg atgttggtct 180
cacattggag atccccaaga gtgtcactat gaagaatgtg tagtaactac cactcctccc 240
tcaattcaga atggaacata ccgtttctgc tgttgtagca cagatttatg taatgtcaac 300
tttactgaga attttccacc tcctgacaca acaccactca gtccacctca ttcatttaac 360
cgagatgaga ca 372
<210> 207
<211> 1590
<212> DNA
<213> Homo sapiens
<400> 207
atgacttcct cgctgcagcg gccctggcgg gtgccctggc taccatggac catcctgctg 60
gtcagcactg cggctgcttc gcagaatcaa gaacggctat gtgcgtttaa agatccgtat 120
cagcaagacc ttgggatagg tgagagtaga atctctcatg aaaatgggac aatattatgc 180
tcgaaaggta gcacctgcta tggcctttgg gagaaatcaa aaggggacat aaatcttgta 240
aaacaaggat gttggtctca cattggagat ccccaagagt gtcactatga agaatgtgta 300
gtaactacca ctcctccctc aattcagaat ggaacatacc gtttctgctg ttgtagcaca 360
gatttatgta atgtcaactt tactgagaat tttccacctc ctgacacaac accactcagt 420
ccacctcatt catttaaccg agatgagaca ataatcattg ctttggcatc agtctctgta 480
ttagctgttt tgatagttgc cttatgcttt ggatacagaa tgttgacagg agaccgtaaa 540
caaggtcttc acagtatgaa catgatggag gcagcagcat ccgaaccctc tcttgatcta 600
gataatctga aactgttgga gctgattggc cgaggtcgat atggagcagt atataaaggc 660
tccttggatg agcgtccagt tgctgtaaaa gtgttttcct ttgcaaaccg tcagaatttt 720
atcaacgaaa agaacattta cagagtgcct ttgatggaac atgacaacat tgcccgcttt 780
atagttggag atgagagagt cactgcagat ggacgcatgg aatatttgct tgtgatggag 840
tactatccca atggatcttt atgcaagtat ttaagtctcc acacaagtga ctgggtaagc 900
tcttgccgtc ttgctcattc tgttactaga ggactggctt atcttcacac agaattacca 960
cgaggagatc attataaacc tgcaatttcc catcgagatt taaacagcag aaatgtccta 1020
gtgaaaaatg atggaacctg tgttattagt gactttggac tgtccatgag gctgactgga 1080
aatagactgg tgcgcccagg ggaggaagat aatgcagcca taagcgaggt tggcactatc 1140
agatatatgg caccagaagt gctagaagga gctgtgaact tgagggactg tgaatcagct 1200
ttgaaacaag tagacatgta tgctcttgga ctaatctatt gggagatatt tatgagatgt 1260
acagacctct tcccagggga atccgtacca gagtaccaga tggcttttca gacagaggtt 1320
ggaaaccatc ccacttttga ggatatgcag gttctcgtgt ctagggaaaa acagagaccc 1380
aagttcccag aagcctggaa agaaaatagc ctggcagtga ggtcactcaa ggagacaatc 1440
gaagactgtt gggaccagga tgcagaggct cggcttactg cacagtgtgc tgaggaaagg 1500
atggctgaac ttatgatgat ttgggaaaga aacaaatctg tgagcccaac agtcaatcca 1560
atgtctactg ctatgcagaa tgaacgtagg 1590
<210> 208
<211> 372
<212> DNA
<213> Homo sapiens
<400> 208
tcgcagaatc aagaacggct atgtgcgttt aaagatccgt atcagcaaga ccttgggata 60
ggtgagagta gaatctctca tgaaaatggg acaatattat gctcgaaagg tagcacctgc 120
tatggccttt gggagaaatc aaaaggggac ataaatcttg taaaacaagg atgttggtct 180
cacattggag atccccaaga gtgtcactat gaagaatgtg tagtaactac cactcctccc 240
tcaattcaga atggaacata ccgtttctgc tgttgtagca cagatttatg taatgtcaac 300
tttactgaga attttccacc tcctgacaca acaccactca gtccacctca ttcatttaac 360
cgagatgaga ca 372
<210> 209
<211> 1719
<212> DNA
<213> Homo sapiens
<400> 209
atgctagggt ctttggggct ttgggcatta cttcccacag ctgtggaagc acccccaaac 60
aggcgaacct gtgtgttctt tgaggcccct ggagtgcggg gaagcacaaa gacactggga 120
gagctgctag atacaggcac agagctcccc agagctatcc gctgcctcta cagccgctgc 180
tgctttggga tctggaacct gacccaagac cgggcacagg tggaaatgca aggatgccga 240
gacagtgatg agccaggctg tgagtccctc cactgtgacc caagtccccg agcccacccc 300
agccctggct ccactctctt cacctgctcc tgtggcactg acttctgcaa tgccaattac 360
agccatctgc ctcctccagg gagccctggg actcctggct cccagggtcc ccaggctgcc 420
ccaggtgagt ccatctggat ggcactggtg ctgctggggc tgttcctcct cctcctgctg 480
ctgctgggca gcatcatctt ggccctgcta cagcgaaaga actacagagt gcgaggtgag 540
ccagtgccag agccaaggcc agactcaggc agggactgga gtgtggagct gcaggagctg 600
cctgagctgt gtttctccca ggtaatccgg gaaggaggtc atgcagtggt ttgggccggg 660
cagctgcaag gaaaactggt tgccatcaag gccttcccac cgaggtctgt ggctcagttc 720
caagctgaga gagcattgta cgaacttcca ggcctacagc acgaccacat tgtccgattt 780
atcactgcca gccggggggg tcctggccgc ctgctctctg ggcccctgct ggtactggaa 840
ctgcatccca agggctccct gtgccactac ttgacccagt acaccagtga ctggggaagt 900
tccctgcgga tggcactgtc cctggcccag ggcctggcat ttctccatga ggagcgctgg 960
cagaatggcc aatataaacc aggtattgcc caccgagatc tgagcagcca gaatgtgctc 1020
attcgggaag atggatcgtg tgccattgga gacctgggcc ttgccttggt gctccctggc 1080
ctcactcagc cccctgcctg gacccctact caaccacaag gcccagctgc catcatggaa 1140
gctggcaccc agaggtacat ggcaccagag ctcttggaca agactctgga cctacaggat 1200
tggggcatgg ccctccgacg agctgatatt tactctttgg ctctgctcct gtgggagata 1260
ctgagccgct gcccagattt gaggcctgac agcagtccac cacccttcca actggcctat 1320
gaggcagaac tgggcaatac ccctacctct gatgagctat gggccttggc agtgcaggag 1380
aggaggcgtc cctacatccc atccacctgg cgctgctttg ccacagaccc tgatgggctg 1440
agggagctcc tagaagactg ttgggatgca gacccagaag cacggctgac agctgagtgt 1500
gtacagcagc gcctggctgc cttggcccat cctcaagaga gccacccctt tccagagagc 1560
tgtccacgtg gctgcccacc tctctgccca gaagactgta cttcaattcc tgcccctacc 1620
atcctcccct gtaggcctca gcggagtgcc tgccacttca gcgttcagca aggcccttgt 1680
tccaggaatc ctcagcctgc ctgtaccctt tctcctgtg 1719
<210> 210
<211> 396
<212> DNA
<213> Homo sapiens
<400> 210
cccccaaaca ggcgaacctg tgtgttcttt gaggcccctg gagtgcgggg aagcacaaag 60
acactgggag agctgctaga tacaggcaca gagctcccca gagctatccg ctgcctctac 120
agccgctgct gctttgggat ctggaacctg acccaagacc gggcacaggt ggaaatgcaa 180
ggatgccgag acagtgatga gccaggctgt gagtccctcc actgtgaccc aagtccccga 240
gcccacccca gccctggctc cactctcttc acctgctcct gtggcactga cttctgcaat 300
gccaattaca gccatctgcc tcctccaggg agccctggga ctcctggctc ccagggtccc 360
caggctgccc caggtgagtc catctggatg gcactg 396
<210> 211
<211> 1434
<212> DNA
<213> Homo sapiens
<400> 211
atgctagggt ctttggggct ttgggcatta cttcccacag ctgtggaagc acccccaaac 60
aggcgaacct gtgtgttctt tgaggcccct ggagtgcggg gaagcacaaa gacactggga 120
gagctgctag atacaggcac agagctcccc agagctatcc gctgcctcta cagccgctgc 180
tgctttggga tctggaacct gacccaagac cgggcacagg tggaaatgca aggatgccga 240
gacagtgatg agccaggctg tgagtccctc cactgtgacc caagtccccg agcccacccc 300
agccctggct ccactctctt cacctgctcc tgtggcactg acttctgcaa tgccaattac 360
agccatctgc ctcctccagg gagccctggg actcctggct cccagggtcc ccaggctgcc 420
ccaggtgagt ccatctggat ggcactggtg ctgctggggc tgttcctcct cctcctgctg 480
ctgctgggca gcatcatctt ggccctgcta cagcgaaaga actacagagt gcgaggtgag 540
ccagtgccag agccaaggcc agactcaggc agggactgga gtgtggagct gcaggagctg 600
cctgagctgt gtttctccca ggtaatccgg gaaggaggtc atgcagtggt ttgggccggg 660
cagctgcaag gaaaactggt tgccatcaag gccttcccac cgaggtctgt ggctcagttc 720
caagctgaga gagcattgta cgaacttcca ggcctacagc acgaccacat tgtccgattt 780
atcactgcca gccggggggg tcctggccgc ctgctctctg ggcccctgct ggtactggaa 840
ctgcatccca agggctccct gtgccactac ttgacccagt acaccagtga ctggggaagt 900
tccctgcgga tggcactgtc cctggcccag ggcctggcat ttctccatga ggagcgctgg 960
cagaatggcc aatataaacc aggtattgcc caccgagatc tgagcagcca gaatgtgctc 1020
attcgggaag atggatcgtg tgccattgga gacctgggcc ttgccttggt gctccctggc 1080
ctcactcagc cccctgcctg gacccctact caaccacaag gcccagctgc catcatggaa 1140
gctggcaccc agaggtacat ggcaccagag ctcttggaca agactctgga cctacaggat 1200
tggggcatgg ccctccgacg agctgatatt tactctttgg ctctgctcct gtgggagata 1260
ctgagccgct gcccagattt gaggcctgca gtccaccacc cttccaactg gcctatgagg 1320
cagaactggg caatacccct acctctgatg agctatgggc cttggcagtg caggagagga 1380
ggcgtcccta catcccatcc acctggcgct gctttgccac agaccctgat gggc 1434
<210> 212
<211> 396
<212> DNA
<213> Homo sapiens
<400> 212
cccccaaaca ggcgaacctg tgtgttcttt gaggcccctg gagtgcgggg aagcacaaag 60
acactgggag agctgctaga tacaggcaca gagctcccca gagctatccg ctgcctctac 120
agccgctgct gctttgggat ctggaacctg acccaagacc gggcacaggt ggaaatgcaa 180
ggatgccgag acagtgatga gccaggctgt gagtccctcc actgtgaccc aagtccccga 240
gcccacccca gccctggctc cactctcttc acctgctcct gtggcactga cttctgcaat 300
gccaattaca gccatctgcc tcctccaggg agccctggga ctcctggctc ccagggtccc 360
caggctgccc caggtgagtc catctggatg gcactg 396
<210> 213
<211> 1434
<212> DNA
<213> Homo sapiens
<400> 213
atgctagggt ctttggggct ttgggcatta cttcccacag ctgtggaagc acccccaaac 60
aggcgaacct gtgtgttctt tgaggcccct ggagtgcggg gaagcacaaa gacactggga 120
gagctgctag atacaggcac agagctcccc agagctatcc gctgcctcta cagccgctgc 180
tgctttggga tctggaacct gacccaagac cgggcacagg tggaaatgca aggatgccga 240
gacagtgatg agccaggctg tgagtccctc cactgtgacc caagtccccg agcccacccc 300
agccctggct ccactctctt cacctgctcc tgtggcactg acttctgcaa tgccaattac 360
agccatctgc ctcctccagg gagccctggg actcctggct cccagggtcc ccaggctgcc 420
ccaggtgagt ccatctggat ggcactggtg ctgctggggc tgttcctcct cctcctgctg 480
ctgctgggca gcatcatctt ggccctgcta cagcgaaaga actacagagt gcgaggtgag 540
ccagtgccag agccaaggcc agactcaggc agggactgga gtgtggagct gcaggagctg 600
cctgagctgt gtttctccca ggtaatccgg gaaggaggtc atgcagtggt ttgggccggg 660
cagctgcaag gaaaactggt tgccatcaag gccttcccac cgaggtctgt ggctcagttc 720
caagctgaga gagcattgta cgaacttcca ggcctacagc acgaccacat tgtccgattt 780
atcactgcca gccggggggg tcctggccgc ctgctctctg ggcccctgct ggtactggaa 840
ctgcatccca agggctccct gtgccactac ttgacccagt acaccagtga ctggggaagt 900
tccctgcgga tggcactgtc cctggcccag ggcctggcat ttctccatga ggagcgctgg 960
cagaatggcc aatataaacc aggtattgcc caccgagatc tgagcagcca gaatgtgctc 1020
attcgggaag atggatcgtg tgccattgga gacctgggcc ttgccttggt gctccctggc 1080
ctcactcagc cccctgcctg gacccctact caaccacaag gcccagctgc catcatggaa 1140
gaccctgatg ggctgaggga gctcctagaa gactgttggg atgcagaccc agaagcacgg 1200
ctgacagctg agtgtgtaca gcagcgcctg gctgccttgg cccatcctca agagagccac 1260
ccctttccag agagctgtcc acgtggctgc ccacctctct gcccagaaga ctgtacttca 1320
attcctgccc ctaccatcct cccctgtagg cctcagcgga gtgcctgcca cttcagcgtt 1380
cagcaaggcc cttgttccag gaatcctcag cctgcctgta ccctttctcc tgtg 1434
<210> 214
<211> 396
<212> DNA
<213> Homo sapiens
<400> 214
cccccaaaca ggcgaacctg tgtgttcttt gaggcccctg gagtgcgggg aagcacaaag 60
acactgggag agctgctaga tacaggcaca gagctcccca gagctatccg ctgcctctac 120
agccgctgct gctttgggat ctggaacctg acccaagacc gggcacaggt ggaaatgcaa 180
ggatgccgag acagtgatga gccaggctgt gagtccctcc actgtgaccc aagtccccga 240
gcccacccca gccctggctc cactctcttc acctgctcct gtggcactga cttctgcaat 300
gccaattaca gccatctgcc tcctccaggg agccctggga ctcctggctc ccagggtccc 360
caggctgccc caggtgagtc catctggatg gcactg 396
<210> 215
<211> 1509
<212> DNA
<213> Homo sapiens
<400> 215
atgaccttgg gctcccccag gaaaggcctt ctgatgctgc tgatggcctt ggtgacccag 60
ggagaccctg tgaagccgtc tcggggcccg ctggtgacct gcacgtgtga gagcccacat 120
tgcaaggggc ctacctgccg gggggcctgg tgcacagtag tgctggtgcg ggaggagggg 180
aggcaccccc aggaacatcg gggctgcggg aacttgcaca gggagctctg cagggggcgc 240
cccaccgagt tcgtcaacca ctactgctgc gacagccacc tctgcaacca caacgtgtcc 300
ctggtgctgg aggccaccca acctccttcg gagcagccgg gaacagatgg ccagctggcc 360
ctgatcctgg gccccgtgct ggccttgctg gccctggtgg ccctgggtgt cctgggcctg 420
tggcatgtcc gacggaggca ggagaagcag cgtggcctgc acagcgagct gggagagtcc 480
agtctcatcc tgaaagcatc tgagcagggc gacagcatgt tgggggacct cctggacagt 540
gactgcacca cagggagtgg ctcagggctc cccttcctgg tgcagaggac agtggcacgg 600
caggttgcct tggtggagtg tgtgggaaaa ggccgctatg gcgaagtgtg gcggggcttg 660
tggcacggtg agagtgtggc cgtcaagatc ttctcctcga gggatgaaca gtcctggttc 720
cgggagactg agatctataa cacagtgttg ctcagacacg acaacatcct aggcttcatc 780
gcctcagaca tgacctcccg caactcgagc acgcagctgt ggctcatcac gcactaccac 840
gagcacggct ccctctacga ctttctgcag agacagacgc tggagcccca tctggctctg 900
aggctagctg tgtccgcggc atgcggcctg gcgcacctgc acgtggagat cttcggtaca 960
cagggcaaac cagccattgc ccaccgcgac ttcaagagcc gcaatgtgct ggtcaagagc 1020
aacctgcagt gttgcatcgc cgacctgggc ctggctgtga tgcactcaca gggcagcgat 1080
tacctggaca tcggcaacaa cccgagagtg ggcaccaagc ggtacatggc acccgaggtg 1140
ctggacgagc agatccgcac ggactgcttt gagtcctaca agtggactga catctgggcc 1200
tttggcctgg tgctgtggga gattgcccgc cggaccatcg tgaatggcat cgtggaggac 1260
tatagaccac ccttctatga tgtggtgccc aatgacccca gctttgagga catgaagaag 1320
gtggtgtgtg tggatcagca gacccccacc atccctaacc ggctggctgc agacccggtc 1380
ctctcaggcc tagctcagat gatgcgggag tgctggtacc caaacccctc tgcccgactc 1440
accgcgctgc ggatcaagaa gacactacaa aaaattagca acagtccaga gaagcctaaa 1500
gtgattcaa 1509
<210> 216
<211> 291
<212> DNA
<213> Homo sapiens
<400> 216
gaccctgtga agccgtctcg gggcccgctg gtgacctgca cgtgtgagag cccacattgc 60
aaggggccta cctgccgggg ggcctggtgc acagtagtgc tggtgcggga ggaggggagg 120
cacccccagg aacatcgggg ctgcgggaac ttgcacaggg agctctgcag ggggcgcccc 180
accgagttcg tcaaccacta ctgctgcgac agccacctct gcaaccacaa cgtgtccctg 240
gtgctggagg ccacccaacc tccttcggag cagccgggaa cagatggcca g 291
<210> 217
<211> 1527
<212> DNA
<213> Homo sapiens
<400> 217
atggtagatg gagtgatgat tcttcctgtg cttatcatga ttgctctccc ctcccctagt 60
atggaagatg agaagcccaa ggtcaacccc aaactctaca tgtgtgtgtg tgaaggtctc 120
tcctgcggta atgaggacca ctgtgaaggc cagcagtgct tttcctcact gagcatcaac 180
gatggcttcc acgtctacca gaaaggctgc ttccaggttt atgagcaggg aaagatgacc 240
tgtaagaccc cgccgtcccc tggccaagcc gtggagtgct gccaagggga ctggtgtaac 300
aggaacatca cggcccagct gcccactaaa ggaaaatcct tccctggaac acagaatttc 360
cacttggagg ttggcctcat tattctctct gtagtgttcg cagtatgtct tttagcctgc 420
ctgctgggag ttgctctccg aaaatttaaa aggcgcaacc aagaacgcct caatccccga 480
gacgtggagt atggcactat cgaagggctc atcaccacca atgttggaga cagcacttta 540
gcagatttat tggatcattc gtgtacatca ggaagtggct ctggtcttcc ttttctggta 600
caaagaacag tggctcgcca gattacactg ttggagtgtg tcgggaaagg caggtatggt 660
gaggtgtgga ggggcagctg gcaaggggag aatgttgccg tgaagatctt ctcctcccgt 720
gatgagaagt catggttcag ggaaacggaa ttgtacaaca ctgtgatgct gaggcatgaa 780
aatatcttag gtttcattgc ttcagacatg acatcaagac actccagtac ccagctgtgg 840
ttaattacac attatcatga aatgggatcg ttgtacgact atcttcagct tactactctg 900
gatacagtta gctgccttcg aatagtgctg tccatagcta gtggtcttgc acatttgcac 960
atagagatat ttgggaccca agggaaacca gccattgccc atcgagattt aaagagcaaa 1020
aatattctgg ttaagaagaa tggacagtgt tgcatagcag atttgggcct ggcagtcatg 1080
cattcccaga gcaccaatca gcttgatgtg gggaacaatc cccgtgtggg caccaagcgc 1140
tacatggccc ccgaagttct agatgaaacc atccaggtgg attgtttcga ttcttataaa 1200
agggtcgata tttgggcctt tggacttgtt ttgtgggaag tggccaggcg gatggtgagc 1260
aatggtatag tggaggatta caagccaccg ttctacgatg tggttcccaa tgacccaagt 1320
tttgaagata tgaggaaggt agtctgtgtg gatcaacaaa ggccaaacat acccaacaga 1380
tggttctcag acccgacatt aacctctctg gccaagctaa tgaaagaatg ctggtatcaa 1440
aatccatccg caagactcac agcactgcgt atcaaaaaga ctttgaccaa aattgataat 1500
tccctcgaca aattgaaaac tgactgt 1527
<210> 218
<211> 309
<212> DNA
<213> Homo sapiens
<400> 218
atggaagatg agaagcccaa ggtcaacccc aaactctaca tgtgtgtgtg tgaaggtctc 60
tcctgcggta atgaggacca ctgtgaaggc cagcagtgct tttcctcact gagcatcaac 120
gatggcttcc acgtctacca gaaaggctgc ttccaggttt atgagcaggg aaagatgacc 180
tgtaagaccc cgccgtcccc tggccaagcc gtggagtgct gccaagggga ctggtgtaac 240
aggaacatca cggcccagct gcccactaaa ggaaaatcct tccctggaac acagaatttc 300
cacttggag 309
<210> 219
<211> 1596
<212> DNA
<213> Homo sapiens
<400> 219
atgcctcagc tatacattta catcagatta ttgggagcct atttgttcat catttctcgt 60
gttcaaggac agaatctgga tagtatgctt catggcactg ggatgaaatc agactccgac 120
cagaaaaagt cagaaaatgg agtaacctta gcaccagagg ataccttgcc ttttttaaag 180
tgctattgct cagggcactg tccagatgat gctattaata acacatgcat aactaatgga 240
cattgctttg ccatcataga agaagatgac cagggagaaa ccacattagc ttcagggtgt 300
atgaaatatg aaggatctga ttttcagtgc aaagattctc caaaagccca gctacgccgg 360
acaatagaat gttgtcggac caatttatgt aaccagtatt tgcaacccac actgccccct 420
gttgtcatag gtccgttttt tgatggcagc attcgatggc tggttttgct catttctatg 480
gctgtctgca taattgctat gatcatcttc tccagctgct tttgttacaa acattattgc 540
aagagcatct caagcagacg tcgttacaat cgtgatttgg aacaggatga agcatttatt 600
ccagttggag aatcactaaa agaccttatt gaccagtcac aaagttctgg tagtgggtct 660
ggactacctt tattggttca gcgaactatt gccaaacaga ttcagatggt ccggcaagtt 720
ggtaaaggcc gatatggaga agtatggatg ggcaaatggc gtggcgaaaa agtggcggtg 780
aaagtattct ttaccactga agaagccagc tggtttcgag aaacagaaat ctaccaaact 840
gtgctaatgc gccatgaaaa catacttggt ttcatagcgg cagacattaa aggtacaggt 900
tcctggactc agctctattt gattactgat taccatgaaa atggatctct ctatgacttc 960
ctgaaatgtg ctacactgga caccagagcc ctgcttaaat tggcttattc agctgcctgt 1020
ggtctgtgcc acctgcacac agaaatttat ggcacccaag gaaagcccgc aattgctcat 1080
cgagacctaa agagcaaaaa catcctcatc aagaaaaatg ggagttgctg cattgctgac 1140
ctgggccttg ctgttaaatt caacagtgac acaaatgaag ttgatgtgcc cttgaatacc 1200
agggtgggca ccaaacgcta catggctccc gaagtgctgg acgaaagcct gaacaaaaac 1260
cacttccagc cctacatcat ggctgacatc tacagcttcg gcctaatcat ttgggagatg 1320
gctcgtcgtt gtatcacagg agggatcgtg gaagaatacc aattgccata ttacaacatg 1380
gtaccgagtg atccgtcata cgaagatatg cgtgaggttg tgtgtgtcaa acgtttgcgg 1440
ccaattgtgt ctaatcggtg gaacagtgat gaatgtctac gagcagtttt gaagctaatg 1500
tcagaatgct gggcccacaa tccagcctcc agactcacag cattgagaat taagaagacg 1560
cttgccaaga tggttgaatc ccaagatgta aaaatc 1596
<210> 220
<211> 387
<212> DNA
<213> Homo sapiens
<400> 220
cagaatctgg atagtatgct tcatggcact gggatgaaat cagactccga ccagaaaaag 60
tcagaaaatg gagtaacctt agcaccagag gataccttgc cttttttaaa gtgctattgc 120
tcagggcact gtccagatga tgctattaat aacacatgca taactaatgg acattgcttt 180
gccatcatag aagaagatga ccagggagaa accacattag cttcagggtg tatgaaatat 240
gaaggatctg attttcagtg caaagattct ccaaaagccc agctacgccg gacaatagaa 300
tgttgtcgga ccaatttatg taaccagtat ttgcaaccca cactgccccc tgttgtcata 360
ggtccgtttt ttgatggcag cattcga 387
<210> 221
<211> 1515
<212> DNA
<213> Homo sapiens
<400> 221
atggcggagt cggccggagc ctcctccttc ttcccccttg ttgtcctcct gctcgccggc 60
agcggcgggt ccgggccccg gggggtccag gctctgctgt gtgcgtgcac cagctgcctc 120
caggccaact acacgtgtga gacagatggg gcctgcatgg tttccatttt caatctggat 180
gggatggagc accatgtgcg cacctgcatc cccaaagtgg agctggtccc tgccgggaag 240
cccttctact gcctgagctc ggaggacctg cgcaacaccc actgctgcta cactgactac 300
tgcaacagga tcgacttgag ggtgcccagt ggtcacctca aggagcctga gcacccgtcc 360
atgtggggcc cggtggagct ggtaggcatc atcgccggcc cggtgttcct cctgttcctc 420
atcatcatca ttgttttcct tgtcattaac tatcatcagc gtgtctatca caaccgccag 480
agactggaca tggaagatcc ctcatgtgag atgtgtctct ccaaagacaa gacgctccag 540
gatcttgtct acgatctctc cacctcaggg tctggctcag ggttacccct ctttgtccag 600
cgcacagtgg cccgaaccat cgttttacaa gagattattg gcaagggtcg gtttggggaa 660
gtatggcggg gccgctggag gggtggtgat gtggctgtga aaatattctc ttctcgtgaa 720
gaacggtctt ggttcaggga agcagagata taccagacgg tcatgctgcg ccatgaaaac 780
atccttggat ttattgctgc tgacaataaa gataatggca cctggacaca gctgtggctt 840
gtttctgact atcatgagca cgggtccctg tttgattatc tgaaccggta cacagtgaca 900
attgagggga tgattaagct ggccttgtct gctgctagtg ggctggcaca cctgcacatg 960
gagatcgtgg gcacccaagg gaagcctgga attgctcatc gagacttaaa gtcaaagaac 1020
attctggtga agaaaaatgg catgtgtgcc atagcagacc tgggcctggc tgtccgtcat 1080
gatgcagtca ctgacaccat tgacattgcc ccgaatcaga gggtggggac caaacgatac 1140
atggcccctg aagtacttga tgaaaccatt aatatgaaac actttgactc ctttaaatgt 1200
gctgatattt atgccctcgg gcttgtatat tgggagattg ctcgaagatg caattctgga 1260
ggagtccatg aagaatatca gctgccatat tacgacttag tgccctctga cccttccatt 1320
gaggaaatgc gaaaggttgt atgtgatcag aagctgcgtc ccaacatccc caactggtgg 1380
cagagttatg aggcactgcg ggtgatgggg aagatgatgc gagagtgttg gtatgccaac 1440
ggcgcagccc gcctgacggc cctgcgcatc aagaagaccc tctcccagct cagcgtgcag 1500
gaagacgtga agatc 1515
<210> 222
<211> 309
<212> DNA
<213> Homo sapiens
<400> 222
tccgggcccc ggggggtcca ggctctgctg tgtgcgtgca ccagctgcct ccaggccaac 60
tacacgtgtg agacagatgg ggcctgcatg gtttccattt tcaatctgga tgggatggag 120
caccatgtgc gcacctgcat ccccaaagtg gagctggtcc ctgccgggaa gcccttctac 180
tgcctgagct cggaggacct gcgcaacacc cactgctgct acactgacta ctgcaacagg 240
atcgacttga gggtgcccag tggtcacctc aaggagcctg agcacccgtc catgtggggc 300
ccggtggag 309
<210> 223
<211> 1638
<212> DNA
<213> Homo sapiens
<400> 223
atggcggagt cggccggagc ctcctccttc ttcccccttg ttgtcctcct gctcgccggc 60
agcggcgggt ccgggccccg gggggtccag gctctgctgt gtgcgtgcac cagctgcctc 120
caggccaact acacgtgtga gacagatggg gcctgcatgg tttccatttt caatctggat 180
gggatggagc accatgtgcg cacctgcatc cccaaagtgg agctggtccc tgccgggaag 240
cccttctact gcctgagctc ggaggacctg cgcaacaccc actgctgcta cactgactac 300
tgcaacagga tcgacttgag ggtgcccagt ggtcacctca aggagcctga gcacccgtcc 360
atgtggggcc cggtggagct ggtaggcatc atcgccggcc cggtgttcct cctgttcctc 420
atcatcatca ttgttttcct tgtcattaac tatcatcagc gtgtctatca caaccgccag 480
agactggaca tggaagatcc ctcatgtgag atgtgtctct ccaaagacaa gacgctccag 540
gatcttgtct acgatctctc cacctcaggg tctggctcag ggttacccct ctttgtccag 600
cgcacagtgg cccgaaccat cgttttacaa gagattattg gcaagggtcg gtttggggaa 660
gtatggcggg gccgctggag gggtggtgat gtggctgtga aaatattctc ttctcgtgaa 720
gaacggtctt ggttcaggga agcagagata taccagacgg tcatgctgcg ccatgaaaac 780
atccttggat ttattgctgc tgacaataaa gcagactgct cattcctcac attgccatgg 840
gaagttgtaa tggtctctgc tgcccccaag ctgaggagcc ttagactcca atacaaggga 900
ggaaggggaa gagcaagatt tttattccca ctgaataatg gcacctggac acagctgtgg 960
cttgtttctg actatcatga gcacgggtcc ctgtttgatt atctgaaccg gtacacagtg 1020
acaattgagg ggatgattaa gctggccttg tctgctgcta gtgggctggc acacctgcac 1080
atggagatcg tgggcaccca agggaagcct ggaattgctc atcgagactt aaagtcaaag 1140
aacattctgg tgaagaaaaa tggcatgtgt gccatagcag acctgggcct ggctgtccgt 1200
catgatgcag tcactgacac cattgacatt gccccgaatc agagggtggg gaccaaacga 1260
tacatggccc ctgaagtact tgatgaaacc attaatatga aacactttga ctcctttaaa 1320
tgtgctgata tttatgccct cgggcttgta tattgggaga ttgctcgaag atgcaattct 1380
ggaggagtcc atgaagaata tcagctgcca tattacgact tagtgccctc tgacccttcc 1440
attgaggaaa tgcgaaaggt tgtatgtgat cagaagctgc gtcccaacat ccccaactgg 1500
tggcagagtt atgaggcact gcgggtgatg gggaagatga tgcgagagtg ttggtatgcc 1560
aacggcgcag cccgcctgac ggccctgcgc atcaagaaga ccctctccca gctcagcgtg 1620
caggaagacg tgaagatc 1638
<210> 224
<211> 309
<212> DNA
<213> Homo sapiens
<400> 224
tccgggcccc ggggggtcca ggctctgctg tgtgcgtgca ccagctgcct ccaggccaac 60
tacacgtgtg agacagatgg ggcctgcatg gtttccattt tcaatctgga tgggatggag 120
caccatgtgc gcacctgcat ccccaaagtg gagctggtcc ctgccgggaa gcccttctac 180
tgcctgagct cggaggacct gcgcaacacc cactgctgct acactgacta ctgcaacagg 240
atcgacttga gggtgcccag tggtcacctc aaggagcctg agcacccgtc catgtggggc 300
ccggtggag 309
<210> 225
<211> 1509
<212> DNA
<213> Homo sapiens
<400> 225
atggaggcgg cggtcgctgc tccgcgtccc cggctgctcc tcctcgtgct ggcggcggcg 60
gcggcggcgg cggcggcgct gctcccgggg gcgacggcgt tacagtgttt ctgccacctc 120
tgtacaaaag acaattttac ttgtgtgaca gatgggctct gctttgtctc tgtcacagag 180
accacagaca aagttataca caacagcatg tgtatagctg aaattgactt aattcctcga 240
gataggccgt ttgtatgtgc accctcttca aaaactgggt ctgtgactac aacatattgc 300
tgcaatcagg accattgcaa taaaatagaa cttccaacta ctgtaaagtc atcacctggc 360
cttggtcctg tggaactggc agctgtcatt gctggaccag tgtgcttcgt ctgcatctca 420
ctcatgttga tggtctatat ctgccacaac cgcactgtca ttcaccatcg agtgccaaat 480
gaagaggacc cttcattaga tcgccctttt atttcagagg gtactacgtt gaaagactta 540
atttatgata tgacaacgtc aggttctggc tcaggtttac cattgcttgt tcagagaaca 600
attgcgagaa ctattgtgtt acaagaaagc attggcaaag gtcgatttgg agaagtttgg 660
agaggaaagt ggcggggaga agaagttgct gttaagatat tctcctctag agaagaacgt 720
tcgtggttcc gtgaggcaga gatttatcaa actgtaatgt tacgtcatga aaacatcctg 780
ggatttatag cagcagacaa taaagacaat ggtacttgga ctcagctctg gttggtgtca 840
gattatcatg agcatggatc cctttttgat tacttaaaca gatacacagt tactgtggaa 900
ggaatgataa aacttgctct gtccacggcg agcggtcttg cccatcttca catggagatt 960
gttggtaccc aaggaaagcc agccattgct catagagatt tgaaatcaaa gaatatcttg 1020
gtaaagaaga atggaacttg ctgtattgca gacttaggac tggcagtaag acatgattca 1080
gccacagata ccattgatat tgctccaaac cacagagtgg gaacaaaaag gtacatggcc 1140
cctgaagttc tcgatgattc cataaatatg aaacattttg aatccttcaa acgtgctgac 1200
atctatgcaa tgggcttagt attctgggaa attgctcgac gatgttccat tggtggaatt 1260
catgaagatt accaactgcc ttattatgat cttgtacctt ctgacccatc agttgaagaa 1320
atgagaaaag ttgtttgtga acagaagtta aggccaaata tcccaaacag atggcagagc 1380
tgtgaagcct tgagagtaat ggctaaaatt atgagagaat gttggtatgc caatggagca 1440
gctaggctta cagcattgcg gattaagaaa acattatcgc aactcagtca acaggaaggc 1500
atcaaaatg 1509
<210> 226
<211> 306
<212> DNA
<213> Homo sapiens
<400> 226
gcggcgctgc tcccgggggc gacggcgtta cagtgtttct gccacctctg tacaaaagac 60
aattttactt gtgtgacaga tgggctctgc tttgtctctg tcacagagac cacagacaaa 120
gttatacaca acagcatgtg tatagctgaa attgacttaa ttcctcgaga taggccgttt 180
gtatgtgcac cctcttcaaa aactgggtct gtgactacaa catattgctg caatcaggac 240
cattgcaata aaatagaact tccaactact gtaaagtcat cacctggcct tggtcctgtg 300
gaactg 306
<210> 227
<211> 1521
<212> DNA
<213> Homo sapiens
<400> 227
atggaggcgg cggtcgctgc tccgcgtccc cggctgctcc tcctcgtgct ggcggcggcg 60
gcggcggcgg cggcggcgct gctcccgggg gcgacggcgt tacagtgttt ctgccacctc 120
tgtacaaaag acaattttac ttgtgtgaca gatgggctct gctttgtctc tgtcacagag 180
accacagaca aagttataca caacagcatg tgtatagctg aaattgactt aattcctcga 240
gataggccgt ttgtatgtgc accctcttca aaaactgggt ctgtgactac aacatattgc 300
tgcaatcagg accattgcaa taaaatagaa cttccaacta ctggcccttt ttcagtaaag 360
tcatcacctg gccttggtcc tgtggaactg gcagctgtca ttgctggacc agtgtgcttc 420
gtctgcatct cactcatgtt gatggtctat atctgccaca accgcactgt cattcaccat 480
cgagtgccaa atgaagagga cccttcatta gatcgccctt ttatttcaga gggtactacg 540
ttgaaagact taatttatga tatgacaacg tcaggttctg gctcaggttt accattgctt 600
gttcagagaa caattgcgag aactattgtg ttacaagaaa gcattggcaa aggtcgattt 660
ggagaagttt ggagaggaaa gtggcgggga gaagaagttg ctgttaagat attctcctct 720
agagaagaac gttcgtggtt ccgtgaggca gagatttatc aaactgtaat gttacgtcat 780
gaaaacatcc tgggatttat agcagcagac aataaagaca atggtacttg gactcagctc 840
tggttggtgt cagattatca tgagcatgga tccctttttg attacttaaa cagatacaca 900
gttactgtgg aaggaatgat aaaacttgct ctgtccacgg cgagcggtct tgcccatctt 960
cacatggaga ttgttggtac ccaaggaaag ccagccattg ctcatagaga tttgaaatca 1020
aagaatatct tggtaaagaa gaatggaact tgctgtattg cagacttagg actggcagta 1080
agacatgatt cagccacaga taccattgat attgctccaa accacagagt gggaacaaaa 1140
aggtacatgg cccctgaagt tctcgatgat tccataaata tgaaacattt tgaatccttc 1200
aaacgtgctg acatctatgc aatgggctta gtattctggg aaattgctcg acgatgttcc 1260
attggtggaa ttcatgaaga ttaccaactg ccttattatg atcttgtacc ttctgaccca 1320
tcagttgaag aaatgagaaa agttgtttgt gaacagaagt taaggccaaa tatcccaaac 1380
agatggcaga gctgtgaagc cttgagagta atggctaaaa ttatgagaga atgttggtat 1440
gccaatggag cagctaggct tacagcattg cggattaaga aaacattatc gcaactcagt 1500
caacaggaag gcatcaaaat g 1521
<210> 228
<211> 318
<212> DNA
<213> Homo sapiens
<400> 228
gcggcgctgc tcccgggggc gacggcgtta cagtgtttct gccacctctg tacaaaagac 60
aattttactt gtgtgacaga tgggctctgc tttgtctctg tcacagagac cacagacaaa 120
gttatacaca acagcatgtg tatagctgaa attgacttaa ttcctcgaga taggccgttt 180
gtatgtgcac cctcttcaaa aactgggtct gtgactacaa catattgctg caatcaggac 240
cattgcaata aaatagaact tccaactact ggcccttttt cagtaaagtc atcacctggc 300
cttggtcctg tggaactg 318
<210> 229
<211> 1506
<212> DNA
<213> Homo sapiens
<400> 229
atgcttttgc gaagtgcagg aaaattaaat gtgggcacca agaaagagga tggtgagagt 60
acagccccca ccccccgtcc aaaggtcttg cgttgtaaat gccaccacca ttgtccagaa 120
gactcagtca acaatatttg cagcacagac ggatattgtt tcacgatgat agaagaggat 180
gactctgggt tgcctgtggt cacttctggt tgcctaggac tagaaggctc agattttcag 240
tgtcgggaca ctcccattcc tcatcaaaga agatcaattg aatgctgcac agaaaggaac 300
gaatgtaata aagacctaca ccctacactg cctccattga aaaacagaga ttttgttgat 360
ggacctatac accacagggc tttacttata tctgtgactg tctgtagttt gctcttggtc 420
cttatcatat tattttgtta cttccggtat aaaagacaag aaaccagacc tcgatacagc 480
attgggttag aacaggatga aacttacatt cctcctggag aatccctgag agacttaatt 540
gagcagtctc agagctcagg aagtggatca ggcctccctc tgctggtcca aaggactata 600
gctaagcaga ttcagatggt gaaacagatt ggaaaaggtc gctatgggga agtttggatg 660
ggaaagtggc gtggcgaaaa ggtagctgtg aaagtgttct tcaccacaga ggaagccagc 720
tggttcagag agacagaaat atatcagaca gtgttgatga ggcatgaaaa cattttgggt 780
ttcattgctg cagatatcaa agggacaggg tcctggaccc agttgtacct aatcacagac 840
tatcatgaaa atggttccct ttatgattat ctgaagtcca ccaccctaga cgctaaatca 900
atgctgaagt tagcctactc ttctgtcagt ggcttatgtc atttacacac agaaatcttt 960
agtactcaag gcaaaccagc aattgcccat cgagatctga aaagtaaaaa cattctggtg 1020
aagaaaaatg gaacttgctg tattgctgac ctgggcctgg ctgttaaatt tattagtgat 1080
acaaatgaag ttgacatacc acctaacact cgagttggca ccaaacgcta tatgcctcca 1140
gaagtgttgg acgagagctt gaacagaaat cacttccagt cttacatcat ggctgacatg 1200
tatagttttg gcctcatcct ttgggaggtt gctaggagat gtgtatcagg aggtatagtg 1260
gaagaatacc agcttcctta tcatgaccta gtgcccagtg acccctctta tgaggacatg 1320
agggagattg tgtgcatcaa gaagttacgc ccctcattcc caaaccggtg gagcagtgat 1380
gagtgtctaa ggcagatggg aaaactcatg acagaatgct gggctcacaa tcctgcatca 1440
aggctgacag ccctgcgggt taagaaaaca cttgccaaaa tgtcagagtc ccaggacatt 1500
aaactc 1506
<210> 230
<211> 339
<212> DNA
<213> Homo sapiens
<400> 230
aagaaagagg atggtgagag tacagccccc accccccgtc caaaggtctt gcgttgtaaa 60
tgccaccacc attgtccaga agactcagtc aacaatattt gcagcacaga cggatattgt 120
ttcacgatga tagaagagga tgactctggg ttgcctgtgg tcacttctgg ttgcctagga 180
ctagaaggct cagattttca gtgtcgggac actcccattc ctcatcaaag aagatcaatt 240
gaatgctgca cagaaaggaa cgaatgtaat aaagacctac accctacact gcctccattg 300
aaaaacagag attttgttga tggacctata caccacagg 339
<210> 231
<211> 1596
<212> DNA
<213> Homo sapiens
<400> 231
atgggttggc tggaagaact aaactggcag cttcacattt tcttgctcat tcttctctct 60
atgcacacaa gggcaaactt ccttgataac atgcttttgc gaagtgcagg aaaattaaat 120
gtgggcacca agaaagagga tggtgagagt acagccccca ccccccgtcc aaaggtcttg 180
cgttgtaaat gccaccacca ttgtccagaa gactcagtca acaatatttg cagcacagac 240
ggatattgtt tcacgatgat agaagaggat gactctgggt tgcctgtggt cacttctggt 300
tgcctaggac tagaaggctc agattttcag tgtcgggaca ctcccattcc tcatcaaaga 360
agatcaattg aatgctgcac agaaaggaac gaatgtaata aagacctaca ccctacactg 420
cctccattga aaaacagaga ttttgttgat ggacctatac accacagggc tttacttata 480
tctgtgactg tctgtagttt gctcttggtc cttatcatat tattttgtta cttccggtat 540
aaaagacaag aaaccagacc tcgatacagc attgggttag aacaggatga aacttacatt 600
cctcctggag aatccctgag agacttaatt gagcagtctc agagctcagg aagtggatca 660
ggcctccctc tgctggtcca aaggactata gctaagcaga ttcagatggt gaaacagatt 720
ggaaaaggtc gctatgggga agtttggatg ggaaagtggc gtggcgaaaa ggtagctgtg 780
aaagtgttct tcaccacaga ggaagccagc tggttcagag agacagaaat atatcagaca 840
gtgttgatga ggcatgaaaa cattttgggt ttcattgctg cagatatcaa agggacaggg 900
tcctggaccc agttgtacct aatcacagac tatcatgaaa atggttccct ttatgattat 960
ctgaagtcca ccaccctaga cgctaaatca atgctgaagt tagcctactc ttctgtcagt 1020
ggcttatgtc atttacacac agaaatcttt agtactcaag gcaaaccagc aattgcccat 1080
cgagatctga aaagtaaaaa cattctggtg aagaaaaatg gaacttgctg tattgctgac 1140
ctgggcctgg ctgttaaatt tattagtgat acaaatgaag ttgacatacc acctaacact 1200
cgagttggca ccaaacgcta tatgcctcca gaagtgttgg acgagagctt gaacagaaat 1260
cacttccagt cttacatcat ggctgacatg tatagttttg gcctcatcct ttgggaggtt 1320
gctaggagat gtgtatcagg aggtatagtg gaagaatacc agcttcctta tcatgaccta 1380
gtgcccagtg acccctctta tgaggacatg agggagattg tgtgcatcaa gaagttacgc 1440
ccctcattcc caaaccggtg gagcagtgat gagtgtctaa ggcagatggg aaaactcatg 1500
acagaatgct gggctcacaa tcctgcatca aggctgacag ccctgcgggt taagaaaaca 1560
cttgccaaaa tgtcagagtc ccaggacatt aaactc 1596
<210> 232
<211> 393
<212> DNA
<213> Homo sapiens
<400> 232
aacttccttg ataacatgct tttgcgaagt gcaggaaaat taaatgtggg caccaagaaa 60
gaggatggtg agagtacagc ccccaccccc cgtccaaagg tcttgcgttg taaatgccac 120
caccattgtc cagaagactc agtcaacaat atttgcagca cagacggata ttgtttcacg 180
atgatagaag aggatgactc tgggttgcct gtggtcactt ctggttgcct aggactagaa 240
ggctcagatt ttcagtgtcg ggacactccc attcctcatc aaagaagatc aattgaatgc 300
tgcacagaaa ggaacgaatg taataaagac ctacacccta cactgcctcc attgaaaaac 360
agagattttg ttgatggacc tatacaccac agg 393
<210> 233
<211> 1479
<212> DNA
<213> Homo sapiens
<400> 233
atgacccggg cgctctgctc agcgctccgc caggctctcc tgctgctcgc agcggccgcc 60
gagctctcgc caggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 120
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 180
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 240
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 300
acagcatcac caaatgcccc aaaacttgga cccatggagc tggccatcat tattactgtg 360
cctgtttgcc tcctgtccat agctgcgatg ctgacagtat gggcatgcca gggtcgacag 420
tgctcctaca ggaagaaaaa gagaccaaat gtggaggaac cactctctga gtgcaatctg 480
gtaaatgctg gaaaaactct gaaagatctg atttatgatg tgaccgcctc tggatctggc 540
tctggtctac ctctgttggt tcaaaggaca attgcaagga cgattgtgct tcaggaaata 600
gtaggaaaag gtagatttgg tgaggtgtgg catggaagat ggtgtgggga agatgtggct 660
gtgaaaatat tctcctccag agatgaaaga tcttggtttc gtgaggcaga aatttaccag 720
acggtcatgc tgcgacatga aaacatcctt ggtttcattg ctgctgacaa caaagataat 780
ggaacttgga ctcaactttg gctggtatct gaatatcatg aacagggctc cttatatgac 840
tatttgaata gaaatatagt gaccgtggct ggaatgatca agctggcgct ctcaattgct 900
agtggtctgg cacaccttca tatggagatt gttggtacac aaggtaaacc tgctattgct 960
catcgagaca taaaatcaaa gaatatctta gtgaaaaagt gtgaaacttg tgccatagcg 1020
gacttagggt tggctgtgaa gcatgattca atactgaaca ctatcgacat acctcagaat 1080
cctaaagtgg gaaccaagag gtatatggct cctgaaatgc ttgatgatac aatgaatgtg 1140
aatatctttg agtccttcaa acgagctgac atctattctg ttggtctggt ttactgggaa 1200
atagcccgga ggtgttcagt cggaggaatt gttgaggagt accaattgcc ttattatgac 1260
atggtgcctt cagatccctc gatagaggaa atgagaaagg ttgtttgtga ccagaagttt 1320
cgaccaagta tcccaaacca gtggcaaagt tgtgaagcac tccgagtcat ggggagaata 1380
atgcgtgagt gttggtatgc caacggagcg gcccgcctaa ctgctcttcg tattaagaag 1440
actatatctc aactttgtgt caaagaagac tgcaaagcc 1479
<210> 234
<211> 279
<212> DNA
<213> Homo sapiens
<400> 234
gagctctcgc caggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 60
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 120
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 180
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 240
acagcatcac caaatgcccc aaaacttgga cccatggag 279
<210> 235
<211> 1329
<212> DNA
<213> Homo sapiens
<400> 235
atgctaacca atggaaaaga gcaggtgatc aaatcctgtg tctcccttcc agaactgaat 60
gctcaagtct tctgtcatag ttccaacaat gttaccaaaa ccgaatgctg cttcacagat 120
ttttgcaaca acataacact gcaccttcca acagcatcac caaatgcccc aaaacttgga 180
cccatggagc tggccatcat tattactgtg cctgtttgcc tcctgtccat agctgcgatg 240
ctgacagtat gggcatgcca gggtcgacag tgctcctaca ggaagaaaaa gagaccaaat 300
gtggaggaac cactctctga gtgcaatctg gtaaatgctg gaaaaactct gaaagatctg 360
atttatgatg tgaccgcctc tggatctggc tctggtctac ctctgttggt tcaaaggaca 420
attgcaagga cgattgtgct tcaggaaata gtaggaaaag gtagatttgg tgaggtgtgg 480
catggaagat ggtgtgggga agatgtggct gtgaaaatat tctcctccag agatgaaaga 540
tcttggtttc gtgaggcaga aatttaccag acggtcatgc tgcgacatga aaacatcctt 600
ggtttcattg ctgctgacaa caaagataat ggaacttgga ctcaactttg gctggtatct 660
gaatatcatg aacagggctc cttatatgac tatttgaata gaaatatagt gaccgtggct 720
ggaatgatca agctggcgct ctcaattgct agtggtctgg cacaccttca tatggagatt 780
gttggtacac aaggtaaacc tgctattgct catcgagaca taaaatcaaa gaatatctta 840
gtgaaaaagt gtgaaacttg tgccatagcg gacttagggt tggctgtgaa gcatgattca 900
atactgaaca ctatcgacat acctcagaat cctaaagtgg gaaccaagag gtatatggct 960
cctgaaatgc ttgatgatac aatgaatgtg aatatctttg agtccttcaa acgagctgac 1020
atctattctg ttggtctggt ttactgggaa atagcccgga ggtgttcagt cggaggaatt 1080
gttgaggagt accaattgcc ttattatgac atggtgcctt cagatccctc gatagaggaa 1140
atgagaaagg ttgtttgtga ccagaagttt cgaccaagta tcccaaacca gtggcaaagt 1200
tgtgaagcac tccgagtcat ggggagaata atgcgtgagt gttggtatgc caacggagcg 1260
gcccgcctaa ctgctcttcg tattaagaag actatatctc aactttgtgt caaagaagac 1320
tgcaaagcc 1329
<210> 236
<211> 189
<212> DNA
<213> Homo sapiens
<400> 236
atgctaacca atggaaaaga gcaggtgatc aaatcctgtg tctcccttcc agaactgaat 60
gctcaagtct tctgtcatag ttccaacaat gttaccaaaa ccgaatgctg cttcacagat 120
ttttgcaaca acataacact gcaccttcca acagcatcac caaatgcccc aaaacttgga 180
cccatggag 189
<210> 237
<211> 1239
<212> DNA
<213> Homo sapiens
<400> 237
atgacccggg cgctctgctc agcgctccgc caggctctcc tgctgctcgc agcggccgcc 60
gagctctcgc caggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 120
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 180
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 240
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 300
acaggtctac ctctgttggt tcaaaggaca attgcaagga cgattgtgct tcaggaaata 360
gtaggaaaag gtagatttgg tgaggtgtgg catggaagat ggtgtgggga agatgtggct 420
gtgaaaatat tctcctccag agatgaaaga tcttggtttc gtgaggcaga aatttaccag 480
acggtcatgc tgcgacatga aaacatcctt ggtttcattg ctgctgacaa caaagataat 540
ggaacttgga ctcaactttg gctggtatct gaatatcatg aacagggctc cttatatgac 600
tatttgaata gaaatatagt gaccgtggct ggaatgatca agctggcgct ctcaattgct 660
agtggtctgg cacaccttca tatggagatt gttggtacac aaggtaaacc tgctattgct 720
catcgagaca taaaatcaaa gaatatctta gtgaaaaagt gtgaaacttg tgccatagcg 780
gacttagggt tggctgtgaa gcatgattca atactgaaca ctatcgacat acctcagaat 840
cctaaagtgg gaaccaagag gtatatggct cctgaaatgc ttgatgatac aatgaatgtg 900
aatatctttg agtccttcaa acgagctgac atctattctg ttggtctggt ttactgggaa 960
atagcccgga ggtgttcagt cggaggaatt gttgaggagt accaattgcc ttattatgac 1020
atggtgcctt cagatccctc gatagaggaa atgagaaagg ttgtttgtga ccagaagttt 1080
cgaccaagta tcccaaacca gtggcaaagt tgtgaagcac tccgagtcat ggggagaata 1140
atgcgtgagt gttggtatgc caacggagcg gcccgcctaa ctgctcttcg tattaagaag 1200
actatatctc aactttgtgt caaagaagac tgcaaagcc 1239
<210> 238
<211> 1179
<212> DNA
<213> Homo sapiens
<400> 238
gagctctcgc caggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 60
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 120
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 180
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 240
acaggtctac ctctgttggt tcaaaggaca attgcaagga cgattgtgct tcaggaaata 300
gtaggaaaag gtagatttgg tgaggtgtgg catggaagat ggtgtgggga agatgtggct 360
gtgaaaatat tctcctccag agatgaaaga tcttggtttc gtgaggcaga aatttaccag 420
acggtcatgc tgcgacatga aaacatcctt ggtttcattg ctgctgacaa caaagataat 480
ggaacttgga ctcaactttg gctggtatct gaatatcatg aacagggctc cttatatgac 540
tatttgaata gaaatatagt gaccgtggct ggaatgatca agctggcgct ctcaattgct 600
agtggtctgg cacaccttca tatggagatt gttggtacac aaggtaaacc tgctattgct 660
catcgagaca taaaatcaaa gaatatctta gtgaaaaagt gtgaaacttg tgccatagcg 720
gacttagggt tggctgtgaa gcatgattca atactgaaca ctatcgacat acctcagaat 780
cctaaagtgg gaaccaagag gtatatggct cctgaaatgc ttgatgatac aatgaatgtg 840
aatatctttg agtccttcaa acgagctgac atctattctg ttggtctggt ttactgggaa 900
atagcccgga ggtgttcagt cggaggaatt gttgaggagt accaattgcc ttattatgac 960
atggtgcctt cagatccctc gatagaggaa atgagaaagg ttgtttgtga ccagaagttt 1020
cgaccaagta tcccaaacca gtggcaaagt tgtgaagcac tccgagtcat ggggagaata 1080
atgcgtgagt gttggtatgc caacggagcg gcccgcctaa ctgctcttcg tattaagaag 1140
actatatctc aactttgtgt caaagaagac tgcaaagcc 1179
<210> 239
<211> 1011
<212> DNA
<213> Homo sapiens
<400> 239
atgacccggg cgctctgctc agcgctccgc caggctctcc tgctgctcgc agcggccgcc 60
gagctctcgc caggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 120
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 180
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 240
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 300
acagataatg gaacttggac tcaactttgg ctggtatctg aatatcatga acagggctcc 360
ttatatgact atttgaatag aaatatagtg accgtggctg gaatgatcaa gctggcgctc 420
tcaattgcta gtggtctggc acaccttcat atggagattg ttggtacaca aggtaaacct 480
gctattgctc atcgagacat aaaatcaaag aatatcttag tgaaaaagtg tgaaacttgt 540
gccatagcgg acttagggtt ggctgtgaag catgattcaa tactgaacac tatcgacata 600
cctcagaatc ctaaagtggg aaccaagagg tatatggctc ctgaaatgct tgatgataca 660
atgaatgtga atatctttga gtccttcaaa cgagctgaca tctattctgt tggtctggtt 720
tactgggaaa tagcccggag gtgttcagtc ggaggaattg ttgaggagta ccaattgcct 780
tattatgaca tggtgccttc agatccctcg atagaggaaa tgagaaaggt tgtttgtgac 840
cagaagtttc gaccaagtat cccaaaccag tggcaaagtt gtgaagcact ccgagtcatg 900
gggagaataa tgcgtgagtg ttggtatgcc aacggagcgg cccgcctaac tgctcttcgt 960
attaagaaga ctatatctca actttgtgtc aaagaagact gcaaagccta a 1011
<210> 240
<211> 951
<212> DNA
<213> Homo sapiens
<400> 240
gagctctcgc caggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 60
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 120
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 180
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 240
acagataatg gaacttggac tcaactttgg ctggtatctg aatatcatga acagggctcc 300
ttatatgact atttgaatag aaatatagtg accgtggctg gaatgatcaa gctggcgctc 360
tcaattgcta gtggtctggc acaccttcat atggagattg ttggtacaca aggtaaacct 420
gctattgctc atcgagacat aaaatcaaag aatatcttag tgaaaaagtg tgaaacttgt 480
gccatagcgg acttagggtt ggctgtgaag catgattcaa tactgaacac tatcgacata 540
cctcagaatc ctaaagtggg aaccaagagg tatatggctc ctgaaatgct tgatgataca 600
atgaatgtga atatctttga gtccttcaaa cgagctgaca tctattctgt tggtctggtt 660
tactgggaaa tagcccggag gtgttcagtc ggaggaattg ttgaggagta ccaattgcct 720
tattatgaca tggtgccttc agatccctcg atagaggaaa tgagaaaggt tgtttgtgac 780
cagaagtttc gaccaagtat cccaaaccag tggcaaagtt gtgaagcact ccgagtcatg 840
gggagaataa tgcgtgagtg ttggtatgcc aacggagcgg cccgcctaac tgctcttcgt 900
attaagaaga ctatatctca actttgtgtc aaagaagact gcaaagccta a 951
<210> 241
<211> 1539
<212> DNA
<213> Homo sapiens
<400> 241
atgggagctg ctgcaaagtt ggcgtttgcc gtctttctta tctcctgttc ttcaggtgct 60
atacttggta gatcagaaac tcaggagtgt cttttcttta atgctaattg ggaaaaagac 120
agaaccaatc aaactggtgt tgaaccgtgt tatggtgaca aagataaacg gcggcattgt 180
tttgctacct ggaagaatat ttctggttcc attgaaatag tgaaacaagg ttgttggctg 240
gatgatatca actgctatga caggactgat tgtgtagaaa aaaaagacag ccctgaagta 300
tatttttgtt gctgtgaggg caatatgtgt aatgaaaagt tttcttattt tccggagatg 360
gaagtcacac agcccacttc aaatccagtt acacctaagc caccctatta caacatcctg 420
ctctattcct tggtgccact tatgttaatt gcggggattg tcatttgtgc attttgggtg 480
tacaggcatc acaagatggc ctaccctcct gtacttgttc caactcaaga cccaggacca 540
cccccacctt ctccattact aggtttgaaa ccactgcagt tattagaagt gaaagcaagg 600
ggaagatttg gttgtgtctg gaaagcccag ttgcttaacg aatatgtggc tgtcaaaata 660
tttccaatac aggacaaaca gtcatggcaa aatgaatacg aagtctacag tttgcctgga 720
atgaagcatg agaacatatt acagttcatt ggtgcagaaa aacgaggcac cagtgttgat 780
gtggatcttt ggctgatcac agcatttcat gaaaagggtt cactatcaga ctttcttaag 840
gctaatgtgg tctcttggaa tgaactgtgt catattgcag aaaccatggc tagaggattg 900
gcatatttac atgaggatat acctggccta aaagatggcc acaaacctgc catatctcac 960
agggacatca aaagtaaaaa tgtgctgttg aaaaacaacc tgacagcttg cattgctgac 1020
tttgggttgg ccttaaaatt tgaggctggc aagtctgcag gcgataccca tggacaggtt 1080
ggtacccgga ggtacatggc tccagaggta ttagagggtg ctataaactt ccaaagggat 1140
gcatttttga ggatagatat gtatgccatg ggattagtcc tatgggaact ggcttctcgc 1200
tgtactgctg cagatggacc tgtagatgaa tacatgttgc catttgagga ggaaattggc 1260
cagcatccat ctcttgaaga catgcaggaa gttgttgtgc ataaaaaaaa gaggcctgtt 1320
ttaagagatt attggcagaa acatgctgga atggcaatgc tctgtgaaac cattgaagaa 1380
tgttgggatc acgacgcaga agccaggtta tcagctggat gtgtaggtga aagaattacc 1440
cagatgcaga gactaacaaa tattattacc acagaggaca ttgtaacagt ggtcacaatg 1500
gtgacaaatg ttgactttcc tcccaaagaa tctagtcta 1539
<210> 242
<211> 345
<212> DNA
<213> Homo sapiens
<400> 242
atacttggta gatcagaaac tcaggagtgt cttttcttta atgctaattg ggaaaaagac 60
agaaccaatc aaactggtgt tgaaccgtgt tatggtgaca aagataaacg gcggcattgt 120
tttgctacct ggaagaatat ttctggttcc attgaaatag tgaaacaagg ttgttggctg 180
gatgatatca actgctatga caggactgat tgtgtagaaa aaaaagacag ccctgaagta 240
tatttttgtt gctgtgaggg caatatgtgt aatgaaaagt tttcttattt tccggagatg 300
gaagtcacac agcccacttc aaatccagtt acacctaagc caccc 345
<210> 243
<211> 1065
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 243
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctccgggcc ccggggggtc caggctctgc tgtgtgcgtg caccagctgc 120
ctccaggcca actacacgtg tgagacagat ggggcctgca tggtttccat tttcaatctg 180
gatgggatgg agcaccatgt gcgcacctgc atccccaaag tggagctggt ccctgccggg 240
aagcccttct actgcctgag ctcggaggac ctgcgcaaca cccactgctg ctacactgac 300
tactgcaaca ggatcgactt gagggtgccc agtggtcacc tcaaggagcc tgagcacccg 360
tccatgtggg gcccggtgga gaccggtggt ggaactcaca catgcccacc gtgcccagca 420
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 480
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 540
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 600
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 660
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 720
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 780
cccccatccc gggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 840
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 900
gacaccacgc ctcccgtgct ggactccgac ggctccttct tcctctatag cgacctcacc 960
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 1020
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggt 1065
<210> 244
<211> 1065
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 244
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccatggaaga tgagaagccc aaggtcaacc ccaaactcta catgtgtgtg 120
tgtgaaggtc tctcctgcgg taatgaggac cactgtgaag gccagcagtg cttttcctca 180
ctgagcatca acgatggctt ccacgtctac cagaaaggct gcttccaggt ttatgagcag 240
ggaaagatga cctgtaagac cccgccgtcc cctggccaag ctgtggagtg ctgccaaggg 300
gactggtgta acaggaacat cacggcccag ctgcccacta aaggaaaatc cttccctgga 360
acacagaatt tccacttgga gaccggtggt ggaactcaca catgcccacc gtgcccagca 420
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 480
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 540
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 600
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 660
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 720
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 780
cccccatccc gggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 840
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 900
gacaccacgc ctcccgtgct ggactccgac ggctccttct tcctctatag cgacctcacc 960
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 1020
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggt 1065
<210> 245
<211> 1143
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 245
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cccagaatct ggatagtatg cttcatggca ctgggatgaa atcagactcc 120
gaccagaaaa agtcagaaaa tggagtaacc ttagcaccag aggatacctt gcctttttta 180
aagtgctatt gctcagggca ctgtccagat gatgctatta ataacacatg cataactaat 240
ggacattgct ttgccatcat agaagaagat gaccagggag aaaccacatt agcttcaggg 300
tgtatgaaat atgaaggatc tgattttcag tgcaaagatt ctccaaaagc ccagctacgc 360
cggacaatag aatgttgtcg gaccaattta tgtaaccagt atttgcaacc cacactgccc 420
cctgttgtca taggtccgtt ttttgatggc agcattcgaa ccggtggtgg aactcacaca 480
tgcccaccgt gcccagcacc tgaactcctg gggggaccgt cagtcttcct cttcccccca 540
aaacccaagg acaccctcat gatctcccgg acccctgagg tcacatgcgt ggtggtggac 600
gtgagccacg aagaccctga ggtcaagttc aactggtacg tggacggcgt ggaggtgcat 660
aatgccaaga caaagccgcg ggaggagcag tacaacagca cgtaccgtgt ggtcagcgtc 720
ctcaccgtcc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtctccaac 780
aaagccctcc cagcccccat cgagaaaacc atctccaaag ccaaagggca gccccgagaa 840
ccacaggtgt acaccctgcc cccatcccgg gaggagatga ccaagaacca ggtcagcctg 900
acctgcctgg tcaaaggctt ctatcccagc gacatcgccg tggagtggga gagcaatggg 960
cagccggaga acaactacga caccacgcct cccgtgctgg actccgacgg ctccttcttc 1020
ctctatagcg acctcaccgt ggacaagagc aggtggcagc aggggaacgt cttctcatgc 1080
tccgtgatgc atgaggctct gcacaaccac tacacgcaga agagcctctc cctgtctccg 1140
ggt 1143
<210> 246
<211> 22
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Tissue plasminogen activator
<400> 246
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro
20
<210> 247
<211> 356
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 247
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Gly Ala Ser Gly Pro Arg Gly Val Gln Ala
20 25 30
Leu Leu Cys Ala Cys Thr Ser Cys Leu Gln Ala Asn Tyr Thr Cys Glu
35 40 45
Thr Asp Gly Ala Cys Met Val Ser Ile Phe Asn Leu Asp Gly Met Glu
50 55 60
His His Val Arg Thr Cys Ile Pro Lys Val Glu Leu Val Pro Ala Gly
65 70 75 80
Lys Pro Phe Tyr Cys Leu Ser Ser Glu Asp Leu Arg Asn Thr His Cys
85 90 95
Cys Tyr Thr Asp Tyr Cys Asn Arg Ile Asp Leu Arg Val Pro Ser Gly
100 105 110
His Leu Lys Glu Pro Glu His Pro Ser Met Trp Gly Pro Val Glu Thr
115 120 125
Gly Gly Gly Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
130 135 140
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
145 150 155 160
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
165 170 175
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
180 185 190
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
195 200 205
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
210 215 220
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
225 230 235 240
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
245 250 255
Val Cys Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val
260 265 270
Ser Leu Ser Cys Ala Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
275 280 285
Glu Trp Glu Ser Arg Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
290 295 300
Pro Val Leu Asp Ser Arg Gly Ser Phe Phe Leu Val Ser Lys Leu Thr
305 310 315 320
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
325 330 335
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
340 345 350
Ser Pro Gly Lys
355
<210> 248
<211> 1068
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 248
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctccgggcc ccggggggtc caggctctgc tgtgtgcgtg caccagctgc 120
ctccaggcca actacacgtg tgagacagat ggggcctgca tggtttccat tttcaatctg 180
gatgggatgg agcaccatgt gcgcacctgc atccccaaag tggagctggt ccctgccggg 240
aagcccttct actgcctgag ctcggaggac ctgcgcaaca cccactgctg ctacactgac 300
tactgcaaca ggatcgactt gagggtgccc agtggtcacc tcaaggagcc tgagcacccg 360
tccatgtggg gcccggtgga gaccggtggt ggaactcaca catgcccacc gtgcccagca 420
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 480
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 540
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 600
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 660
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 720
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtgcaccctg 780
cccccatccc gggaggagat gaccaagaac caggtcagcc tgtcctgcgc cgtcaaaggc 840
ttctatccca gcgacatcgc cgtggagtgg gagagccgcg ggcagccgga gaacaactac 900
aagaccacgc ctcccgtgct ggactcccgc ggctccttct tcctcgtgag caagctcacc 960
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 1020
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggtaaa 1068
<210> 249
<211> 332
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 249
Ser Gly Pro Arg Gly Val Gln Ala Leu Leu Cys Ala Cys Thr Ser Cys
1 5 10 15
Leu Gln Ala Asn Tyr Thr Cys Glu Thr Asp Gly Ala Cys Met Val Ser
20 25 30
Ile Phe Asn Leu Asp Gly Met Glu His His Val Arg Thr Cys Ile Pro
35 40 45
Lys Val Glu Leu Val Pro Ala Gly Lys Pro Phe Tyr Cys Leu Ser Ser
50 55 60
Glu Asp Leu Arg Asn Thr His Cys Cys Tyr Thr Asp Tyr Cys Asn Arg
65 70 75 80
Ile Asp Leu Arg Val Pro Ser Gly His Leu Lys Glu Pro Glu His Pro
85 90 95
Ser Met Trp Gly Pro Val Glu Thr Gly Gly Gly Thr His Thr Cys Pro
100 105 110
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
115 120 125
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
130 135 140
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
145 150 155 160
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
165 170 175
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
180 185 190
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
195 200 205
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
210 215 220
Lys Gly Gln Pro Arg Glu Pro Gln Val Cys Thr Leu Pro Pro Ser Arg
225 230 235 240
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Ser Cys Ala Val Lys Gly
245 250 255
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Arg Gly Gln Pro
260 265 270
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Arg Gly Ser
275 280 285
Phe Phe Leu Val Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
290 295 300
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
305 310 315 320
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 250
<211> 996
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 250
tccgggcccc ggggggtcca ggctctgctg tgtgcgtgca ccagctgcct ccaggccaac 60
tacacgtgtg agacagatgg ggcctgcatg gtttccattt tcaatctgga tgggatggag 120
caccatgtgc gcacctgcat ccccaaagtg gagctggtcc ctgccgggaa gcccttctac 180
tgcctgagct cggaggacct gcgcaacacc cactgctgct acactgacta ctgcaacagg 240
atcgacttga gggtgcccag tggtcacctc aaggagcctg agcacccgtc catgtggggc 300
ccggtggaga ccggtggtgg aactcacaca tgcccaccgt gcccagcacc tgaactcctg 360
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 420
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 480
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 540
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 600
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 660
atctccaaag ccaaagggca gccccgagaa ccacaggtgt gcaccctgcc cccatcccgg 720
gaggagatga ccaagaacca ggtcagcctg tcctgcgccg tcaaaggctt ctatcccagc 780
gacatcgccg tggagtggga gagccgcggg cagccggaga acaactacaa gaccacgcct 840
cccgtgctgg actcccgcgg ctccttcttc ctcgtgagca agctcaccgt ggacaagagc 900
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 960
tacacgcaga agagcctctc cctgtctccg ggtaaa 996
<210> 251
<211> 1068
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 251
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctccgggcc ccggggggtc caggctctgc tgtgtgcgtg caccagctgc 120
ctccaggcca actacacgtg tgagacagat ggggcctgca tggtttccat tttcaatctg 180
gatgggatgg agcaccatgt gcgcacctgc atccccaaag tggagctggt ccctgccggg 240
aagcccttct actgcctgag ctcggaggac ctgcgcaaca cccactgctg ctacactgac 300
tactgcaaca ggatcgactt gagggtgccc agtggtcacc tcaaggagcc tgagcacccg 360
tccatgtggg gcccggtgga gaccggtggt ggaactcaca catgcccacc gtgcccagca 420
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 480
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 540
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 600
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 660
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 720
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtgcaccctg 780
cccccatccc gggaggagat gaccaagaac caggtcagcc tgtcctgcgc cgtcaaaggc 840
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 900
aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctcgtgag caagctcacc 960
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 1020
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggtaaa 1068
<210> 252
<211> 996
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 252
tccgggcccc ggggggtcca ggctctgctg tgtgcgtgca ccagctgcct ccaggccaac 60
tacacgtgtg agacagatgg ggcctgcatg gtttccattt tcaatctgga tgggatggag 120
caccatgtgc gcacctgcat ccccaaagtg gagctggtcc ctgccgggaa gcccttctac 180
tgcctgagct cggaggacct gcgcaacacc cactgctgct acactgacta ctgcaacagg 240
atcgacttga gggtgcccag tggtcacctc aaggagcctg agcacccgtc catgtggggc 300
ccggtggaga ccggtggtgg aactcacaca tgcccaccgt gcccagcacc tgaactcctg 360
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 420
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 480
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 540
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 600
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 660
atctccaaag ccaaagggca gccccgagaa ccacaggtgt gcaccctgcc cccatcccgg 720
gaggagatga ccaagaacca ggtcagcctg tcctgcgccg tcaaaggctt ctatcccagc 780
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 840
cccgtgctgg actccgacgg ctccttcttc ctcgtgagca agctcaccgt ggacaagagc 900
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 960
tacacgcaga agagcctctc cctgtctccg ggtaaa 996
<210> 253
<211> 1056
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 253
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccgcgctgct cccgggggcg acggcgttac agtgtttctg ccacctctgt 120
acaaaagaca attttacttg tgtgacagat gggctctgct ttgtctctgt cacagagacc 180
acagacaaag ttatacacaa cagcatgtgt atagctgaaa ttgacttaat tcctcgagat 240
aggccgtttg tatgtgcacc ctcttcaaaa actgggtctg tgactacaac atattgctgc 300
aatcaggacc attgcaataa aatagaactt ccaactactg taaagtcatc acctggcctt 360
ggtcctgtgg aaaccggtgg tggaactcac acatgcccac cgtgcccagc acctgaactc 420
ctggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc 480
cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag 540
ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag 600
cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg 660
aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa 720
accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcccccatcc 780
cgggaggaga tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc 840
agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta cgacaccacg 900
cctcccgtgc tggactccga cggctccttc ttcctctata gcgacctcac cgtggacaag 960
agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac 1020
cactacacgc agaagagcct ctccctgtct ccgggt 1056
<210> 254
<211> 1095
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 254
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccaagaaaga ggatggtgag agtacagccc ccaccccccg tccaaaggtc 120
ttgcgttgta aatgccacca ccattgtcca gaagactcag tcaacaatat ttgcagcaca 180
gacggatatt gtttcacgat gatagaagag gatgactctg ggttgcctgt ggtcacttct 240
ggttgcctag gactagaagg ctcagatttt cagtgtcggg acactcccat tcctcatcaa 300
agaagatcaa ttgaatgctg cacagaaagg aacgaatgta ataaagacct acaccctaca 360
ctgcctccat tgaaaaacag agattttgtt gatggaccta tacaccacag gaccggtggt 420
ggaactcaca catgcccacc gtgcccagca cctgaactcc tggggggacc gtcagtcttc 480
ctcttccccc caaaacccaa ggacaccctc atgatctccc ggacccctga ggtcacatgc 540
gtggtggtgg acgtgagcca cgaagaccct gaggtcaagt tcaactggta cgtggacggc 600
gtggaggtgc ataatgccaa gacaaagccg cgggaggagc agtacaacag cacgtaccgt 660
gtggtcagcg tcctcaccgt cctgcaccag gactggctga atggcaagga gtacaagtgc 720
aaggtctcca acaaagccct cccagccccc atcgagaaaa ccatctccaa agccaaaggg 780
cagccccgag aaccacaggt gtacaccctg cccccatccc gggaggagat gaccaagaac 840
caggtcagcc tgacctgcct ggtcaaaggc ttctatccca gcgacatcgc cgtggagtgg 900
gagagcaatg ggcagccgga gaacaactac gacaccacgc ctcccgtgct ggactccgac 960
ggctccttct tcctctatag cgacctcacc gtggacaaga gcaggtggca gcaggggaac 1020
gtcttctcat gctccgtgat gcatgaggct ctgcacaacc actacacgca gaagagcctc 1080
tccctgtctc cgggt 1095
<210> 255
<211> 1023
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 255
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccggactgaa gtgtgtatgt cttttgtgtg attcttcaaa ctttacctgc 120
caaacagaag gagcatgttg ggcatcagtc atgctaacca atggaaaaga gcaggtgatc 180
aaatcctgtg tctcccttcc agaactgaat gctcaagtct tctgtcatag ttccaacaat 240
gttaccaaaa ccgaatgctg cttcacagat ttttgcaaca acataacact gcaccttcca 300
acagcatcac caaatgcccc aaaacttgga cccatggaga ccggtggtgg aactcacaca 360
tgcccaccgt gcccagcacc tgaactcctg gggggaccgt cagtcttcct cttcccccca 420
aaacccaagg acaccctcat gatctcccgg acccctgagg tcacatgcgt ggtggtggac 480
gtgagccacg aagaccctga ggtcaagttc aactggtacg tggacggcgt ggaggtgcat 540
aatgccaaga caaagccgcg ggaggagcag tacaacagca cgtaccgtgt ggtcagcgtc 600
ctcaccgtcc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtctccaac 660
aaagccctcc cagcccccat cgagaaaacc atctccaaag ccaaagggca gccccgagaa 720
ccacaggtgt acaccctgcc cccatcccgg gaggagatga ccaagaacca ggtcagcctg 780
acctgcctgg tcaaaggctt ctatcccagc gacatcgccg tggagtggga gagcaatggg 840
cagccggaga acaactacga caccacgcct cccgtgctgg actccgacgg ctccttcttc 900
ctctatagcg acctcaccgt ggacaagagc aggtggcagc aggggaacgt cttctcatgc 960
tccgtgatgc atgaggctct gcacaaccac tacacgcaga agagcctctc cctgtctccg 1020
ggt 1023
<210> 256
<211> 1107
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 256
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccgctatact tggtagatca gaaactcagg agtgtctttt ctttaatgct 120
aattgggaaa aagacagaac caatcaaact ggtgttgaac cgtgttatgg tgacaaagat 180
aaacggcggc attgttttgc tacctggaag aatatttctg gttccattga aatagtgaaa 240
caaggttgtt ggctggatga tatcaactgc tatgacagga ctgattgtgt agaaaaaaaa 300
gacagccctg aagtatattt ctgttgctgt gagggcaata tgtgtaatga aaagttttct 360
tattttccgg agatggaagt cacacagccc acttcaaatc cagttacacc taagccaccc 420
accggtggtg gaactcacac atgcccaccg tgcccagcac ctgaactcct ggggggaccg 480
tcagtcttcc tcttcccccc aaaacccaag gacaccctca tgatctcccg gacccctgag 540
gtcacatgcg tggtggtgga cgtgagccac gaagaccctg aggtcaagtt caactggtac 600
gtggacggcg tggaggtgca taatgccaag acaaagccgc gggaggagca gtacaacagc 660
acgtaccgtg tggtcagcgt cctcaccgtc ctgcaccagg actggctgaa tggcaaggag 720
tacaagtgca aggtctccaa caaagccctc ccagccccca tcgagaaaac catctccaaa 780
gccaaagggc agccccgaga accacaggtg tacaccctgc ccccatcccg gaaggagatg 840
accaagaacc aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc 900
gtggagtggg agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg 960
aagtccgacg gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag 1020
caggggaacg tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag 1080
aagagcctct ccctgtctcc gggtaaa 1107
<210> 257
<211> 1128
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 257
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg cctcgcagaa tcaagaacgc ctatgtgcgt ttaaagatcc gtatcagcaa 120
gaccttggga taggtgagag tagaatctct catgaaaatg ggacaatatt atgctcgaaa 180
ggtagcacct gctatggcct ttgggagaaa tcaaaagggg acataaatct tgtaaaacaa 240
ggatgttggt ctcacattgg agatccccaa gagtgtcact atgaagaatg tgtagtaact 300
accactcctc cctcaattca gaatggaaca taccgtttct gctgttgtag cacagattta 360
tgtaatgtca actttactga gaattttcca cctcctgaca caacaccact cagtccacct 420
cattcattta accgagatga gaccggtggt ggaactcaca catgcccacc gtgcccagca 480
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 540
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 600
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 660
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 720
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 780
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 840
cccccatccc ggaaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 900
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 960
aagaccacgc ctcccgtgct gaagtccgac ggctccttct tcctctatag caagctcacc 1020
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 1080
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggtaaa 1128
<210> 258
<211> 1053
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 258
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccgaccctgt gaagccgtct cggggcccgc tggtgacctg cacgtgtgag 120
agcccacatt gcaaggggcc tacctgccgg ggggcctggt gcacagtagt gctggtgcgg 180
gaggagggga ggcaccccca ggaacatcgg ggctgcggga acttgcacag ggagctctgc 240
aggggccgcc ccaccgagtt cgtcaaccac tactgctgcg acagccacct ctgcaaccac 300
aacgtgtccc tggtgctgga ggccacccaa cctccttcgg agcagccggg aacagatggc 360
cagctggcca ccggtggtgg aactcacaca tgcccaccgt gcccagcacc tgaactcctg 420
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 480
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 540
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 600
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 660
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 720
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 780
gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 840
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacga caccacgcct 900
cccgtgctgg actccgacgg ctccttcttc ctctatagcg acctcaccgt ggacaagagc 960
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 1020
tacacgcaga agagcctctc cctgtctccg ggt 1053
<210> 259
<211> 1170
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 259
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccacgatccc accgcacgtt cagaagtcgg ttaataacga catgatagtc 120
actgacaaca acggtgcagt caagtttcca caactgtgta aattttgtga tgtgagattt 180
tccacctgtg acaaccagaa atcctgcatg agcaactgca gcatcacctc catctgtgag 240
aagccacagg aagtctgtgt ggctgtatgg agaaagaatg acgagaacat aacactagag 300
acagtttgcc atgaccccaa gctcccctac catgacttta ttctggaaga tgctgcttct 360
ccaaagtgca ttatgaagga aaaaaaaaag cctggtgaga ctttcttcat gtgttcctgt 420
agctctgatg agtgcaatga caacatcatc ttctcagaag aatataacac cagcaatcct 480
gacaccggtg gtggaactca cacatgccca ccgtgcccag cacctgaact cctgggggga 540
ccgtcagtct tcctcttccc cccaaaaccc aaggacaccc tcatgatctc ccggacccct 600
gaggtcacat gcgtggtggt ggacgtgagc cacgaagacc ctgaggtcaa gttcaactgg 660
tacgtggacg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagtacaac 720
agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaatggcaag 780
gagtacaagt gcaaggtctc caacaaagcc ctcccagccc ccatcgagaa aaccatctcc 840
aaagccaaag ggcagccccg agaaccacag gtgtacaccc tgcccccatc ccggaaggag 900
atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctatcc cagcgacatc 960
gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg 1020
ctgaagtccg acggctcctt cttcctctat agcaagctca ccgtggacaa gagcaggtgg 1080
cagcagggga acgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacacg 1140
cagaagagcc tctccctgtc tccgggtaaa 1170
<210> 260
<211> 1245
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 260
atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60
tcgcccggcg ccacgatccc accgcacgtt cagaagtcgg atgtggaaat ggaggcccag 120
aaagatgaaa tcatctgccc cagctgtaat aggactgccc atccactgag acatattaat 180
aacgacatga tagtcactga caacaacggt gcagtcaagt ttccacaact gtgtaaattt 240
tgtgatgtga gattttccac ctgtgacaac cagaaatcct gcatgagcaa ctgcagcatc 300
acctccatct gtgagaagcc acaggaagtc tgtgtggctg tatggagaaa gaatgacgag 360
aacataacac tagagacagt ttgccatgac cccaagctcc cctaccatga ctttattctg 420
gaagatgctg cttctccaaa gtgcattatg aaggaaaaaa aaaagcctgg tgagactttc 480
ttcatgtgtt cctgtagctc tgatgagtgc aatgacaaca tcatcttctc agaagaatat 540
aacaccagca atcctgacac cggtggtgga actcacacat gcccaccgtg cccagcacct 600
gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 660
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 720
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 780
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 840
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 900
gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 960
ccatcccgga aggagatgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 1020
tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 1080
accacgcctc ccgtgctgaa gtccgacggc tccttcttcc tctatagcaa gctcaccgtg 1140
gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 1200
cacaaccact acacgcagaa gagcctctcc ctgtctccgg gtaaa 1245
<210> 261
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 261
Gly Gly Gly
1
<210> 262
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 262
Gly Gly Gly Gly
1
<210> 263
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 263
Thr Gly Gly Gly Gly
1 5
<210> 264
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 264
Ser Gly Gly Gly Gly
1 5
<210> 265
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 265
Thr Gly Gly Gly
1
<210> 266
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 266
Ser Gly Gly Gly
1
<210> 267
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 267
Gly Gly Gly Gly Ser
1 5
<210> 268
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
6xHis tag
<400> 268
His His His His His His
1 5
<210> 269
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(10)
<223> This sequence may encompass 2-10 residues
<400> 269
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
1 5 10
<210> 270
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> This sequence may encompass 2-5 residues
<400> 270
Gly Gly Gly Gly Gly
1 5
<210> 271
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(4)
<223> This sequence may encompass 2-4 residues
<400> 271
Gly Gly Gly Gly
1
<210> 272
<211> 116
<212> PRT
<213> Homo sapiens
<400> 272
Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe Phe Asn Ala Asn
1 5 10 15
Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu Pro Cys Tyr Gly
20 25 30
Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp Lys Asn Ile Ser
35 40 45
Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu Asp Asp Ile Asn
50 55 60
Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp Ser Pro Glu Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu Lys Phe Ser Tyr
85 90 95
Phe Pro Glu Met Glu Val Thr Gln Pro Thr Ser Asn Pro Val Thr Pro
100 105 110
Lys Pro Pro Thr
115
<210> 273
<211> 115
<212> PRT
<213> Homo sapiens
<400> 273
Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr Asn Ala Asn
1 5 10 15
Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg Cys Glu Gly
20 25 30
Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg Asn Ser Ser
35 40 45
Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp Asp Phe Asn
50 55 60
Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn Pro Gln Val
65 70 75 80
Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg Phe Thr His
85 90 95
Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro Pro Pro Thr
100 105 110
Ala Pro Thr
115
<210> 274
<211> 150
<212> PRT
<213> Rattus sp.
<400> 274
Met Thr Ala Pro Trp Ala Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Ala Gly Ser Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr
20 25 30
Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg
35 40 45
Cys Glu Gly Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Pro
50 55 60
Asn Ser Ser Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp
65 70 75 80
Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn
85 90 95
Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg
100 105 110
Phe Thr His Leu Pro Glu Pro Gly Gly Pro Glu Val Thr Tyr Glu Pro
115 120 125
Pro Pro Thr Ala Pro Thr Leu Leu Thr Val Leu Ala Tyr Ser Leu Leu
130 135 140
Pro Ile Gly Gly Leu Ser
145 150
<210> 275
<211> 150
<212> PRT
<213> Sus sp.
<400> 275
Met Thr Ala Pro Trp Ala Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Val Gly Ser Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr
20 25 30
Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg
35 40 45
Cys Glu Gly Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg
50 55 60
Asn Ser Ser Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp
65 70 75 80
Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn
85 90 95
Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg
100 105 110
Phe Thr His Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro
115 120 125
Pro Pro Thr Ala Pro Thr Leu Leu Thr Val Leu Ala Tyr Ser Leu Leu
130 135 140
Pro Ile Gly Gly Leu Ser
145 150
<210> 276
<211> 150
<212> PRT
<213> Mus sp.
<400> 276
Met Thr Ala Pro Trp Ala Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Ala Gly Ser Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr
20 25 30
Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg
35 40 45
Cys Glu Gly Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg
50 55 60
Asn Ser Ser Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp
65 70 75 80
Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn
85 90 95
Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg
100 105 110
Phe Thr His Leu Pro Glu Pro Gly Gly Pro Glu Val Thr Tyr Glu Pro
115 120 125
Pro Pro Thr Ala Pro Thr Leu Leu Thr Val Leu Ala Tyr Ser Leu Leu
130 135 140
Pro Ile Gly Gly Leu Ser
145 150
<210> 277
<211> 150
<212> PRT
<213> Homo sapiens
<400> 277
Met Thr Ala Pro Trp Val Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Ala Gly Ser Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr
20 25 30
Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg
35 40 45
Cys Glu Gly Glu Gln Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg
50 55 60
Asn Ser Ser Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp
65 70 75 80
Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn
85 90 95
Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg
100 105 110
Phe Thr His Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro
115 120 125
Pro Pro Thr Ala Pro Thr Leu Leu Thr Val Leu Ala Tyr Ser Leu Leu
130 135 140
Pro Ile Gly Gly Leu Ser
145 150
<210> 278
<211> 150
<212> PRT
<213> Bos sp.
<400> 278
Met Thr Ala Pro Trp Ala Ala Leu Ala Leu Leu Trp Gly Ser Leu Cys
1 5 10 15
Ala Gly Ser Gly Arg Gly Glu Ala Glu Thr Arg Glu Cys Ile Tyr Tyr
20 25 30
Asn Ala Asn Trp Glu Leu Glu Arg Thr Asn Gln Ser Gly Leu Glu Arg
35 40 45
Cys Glu Gly Glu Arg Asp Lys Arg Leu His Cys Tyr Ala Ser Trp Arg
50 55 60
Asn Ser Ser Gly Thr Ile Glu Leu Val Lys Lys Gly Cys Trp Leu Asp
65 70 75 80
Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Val Ala Thr Glu Glu Asn
85 90 95
Pro Gln Val Tyr Phe Cys Cys Cys Glu Gly Asn Phe Cys Asn Glu Arg
100 105 110
Phe Thr His Leu Pro Glu Ala Gly Gly Pro Glu Val Thr Tyr Glu Pro
115 120 125
Pro Pro Thr Ala Pro Thr Leu Leu Thr Val Leu Ala Tyr Ser Leu Leu
130 135 140
Pro Val Gly Gly Leu Ser
145 150
<210> 279
<211> 150
<212> PRT
<213> Xenopus sp.
<400> 279
Met Gly Ala Ser Val Ala Leu Thr Phe Leu Leu Leu Leu Ala Thr Phe
1 5 10 15
Arg Ala Gly Ser Gly His Asp Glu Val Glu Thr Arg Glu Cys Ile Tyr
20 25 30
Tyr Asn Ala Asn Trp Glu Leu Glu Lys Thr Asn Gln Ser Gly Val Glu
35 40 45
Arg Leu Val Glu Gly Lys Lys Asp Lys Arg Leu His Cys Tyr Ala Ser
50 55 60
Trp Arg Asn Asn Ser Gly Phe Ile Glu Leu Val Lys Lys Gly Cys Trp
65 70 75 80
Leu Asp Asp Phe Asn Cys Tyr Asp Arg Gln Glu Cys Ile Ala Lys Glu
85 90 95
Glu Asn Pro Gln Val Phe Phe Cys Cys Cys Glu Gly Asn Tyr Cys Asn
100 105 110
Lys Lys Phe Thr His Leu Pro Glu Val Glu Thr Phe Asp Pro Lys Pro
115 120 125
Gln Pro Ser Ala Ser Val Leu Asn Ile Leu Ile Tyr Ser Leu Leu Pro
130 135 140
Ile Val Gly Leu Ser Met
145 150
<210> 280
<211> 150
<212> PRT
<213> Homo sapiens
<400> 280
Met Gly Ala Ala Ala Lys Leu Ala Phe Ala Val Phe Leu Ile Ser Cys
1 5 10 15
Ser Ser Gly Ala Ile Leu Gly Arg Ser Glu Thr Gln Glu Cys Leu Phe
20 25 30
Phe Asn Ala Asn Trp Glu Lys Asp Arg Thr Asn Gln Thr Gly Val Glu
35 40 45
Pro Cys Tyr Gly Asp Lys Asp Lys Arg Arg His Cys Phe Ala Thr Trp
50 55 60
Lys Asn Ile Ser Gly Ser Ile Glu Ile Val Lys Gln Gly Cys Trp Leu
65 70 75 80
Asp Asp Ile Asn Cys Tyr Asp Arg Thr Asp Cys Val Glu Lys Lys Asp
85 90 95
Ser Pro Glu Val Tyr Phe Cys Cys Cys Glu Gly Asn Met Cys Asn Glu
100 105 110
Lys Phe Ser Tyr Phe Pro Glu Met Glu Val Thr Gln Pro Thr Ser Asn
115 120 125
Pro Val Thr Pro Lys Pro Pro Tyr Tyr Asn Ile Leu Leu Tyr Ser Leu
130 135 140
Val Pro Leu Met Leu Ile
145 150
Claims (1)
- 다음을 포함하는 변이체 ActRIIB 폴리펩티드: 서열 번호: 2의 아미노산 20-29중 임의의 하나 (가령, 20, 21, 22, 23, 24, 25, 26, 27, 28, 또는 29)에서 시작하고, 그리고 서열 번호: 2의 아미노산 109-134중 임의의 하나 (가령, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 또는 134)에서 종료되는 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 변이체 ActRIIB 폴리펩티드로서, 이때 상기 폴리펩티드는 K55, F82, L79, A24, K74, R64, P129, P130, E37, R40, D54, R56, W78, D80, 및 F82로 구성된 군에서 선택된 서열 번호: 2의 위치에서 하나 또는 그 이상의 아미노산 치환을 포함하는, 변이체 ActRIIB 폴리펩티드.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662404718P | 2016-10-05 | 2016-10-05 | |
US62/404,718 | 2016-10-05 | ||
PCT/US2017/055421 WO2018067874A1 (en) | 2016-10-05 | 2017-10-05 | Variant actriib proteins and uses thereof |
KR1020197012902A KR102595559B1 (ko) | 2016-10-05 | 2017-10-05 | 변이체 actriib 단백질 및 이의 용도 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197012902A Division KR102595559B1 (ko) | 2016-10-05 | 2017-10-05 | 변이체 actriib 단백질 및 이의 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230152811A true KR20230152811A (ko) | 2023-11-03 |
Family
ID=61831930
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197012902A KR102595559B1 (ko) | 2016-10-05 | 2017-10-05 | 변이체 actriib 단백질 및 이의 용도 |
KR1020237036672A KR20230152811A (ko) | 2016-10-05 | 2017-10-05 | 변이체 actriib 단백질 및 이의 용도 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197012902A KR102595559B1 (ko) | 2016-10-05 | 2017-10-05 | 변이체 actriib 단백질 및 이의 용도 |
Country Status (10)
Country | Link |
---|---|
US (2) | US11267865B2 (ko) |
EP (1) | EP3523328A4 (ko) |
JP (2) | JP7280182B2 (ko) |
KR (2) | KR102595559B1 (ko) |
CN (1) | CN110036025B (ko) |
AU (3) | AU2017338916B2 (ko) |
BR (1) | BR112019006918A2 (ko) |
CA (1) | CA3039525A1 (ko) |
MA (1) | MA46471A (ko) |
WO (1) | WO2018067874A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MA41052A (fr) | 2014-10-09 | 2017-08-15 | Celgene Corp | Traitement d'une maladie cardiovasculaire à l'aide de pièges de ligands d'actrii |
TWI773117B (zh) | 2014-12-03 | 2022-08-01 | 美商西建公司 | 活化素-actrii拮抗劑及治療貧血之用途 |
KR20180006386A (ko) | 2015-04-22 | 2018-01-17 | 얼라이브젠 유에스에이 인코포레이티드 | 신규한 근육 소모 질환 치료용 하이브리드 actriib 리간드 트랩 단백질 |
US20170306027A1 (en) | 2016-04-06 | 2017-10-26 | Acceleron Pharma Inc. | Alk7 antagonists and uses thereof |
JOP20190085A1 (ar) * | 2016-10-20 | 2019-04-17 | Biogen Ma Inc | طرق علاج الضمور العضلي ومرض العظام باستخدام بروتينات احتجاز مركب ترابطي actriib هجين حديثة |
EP3538123A4 (en) | 2016-11-10 | 2020-10-14 | Keros Therapeutics, Inc. | ACTIVIN RECEPTOR TYPE IIA VARIANTS AND METHOD OF USING THEREOF |
EP4428147A3 (en) | 2017-11-09 | 2024-10-30 | Keros Therapeutics, Inc. | Activin receptor type iia variants and methods of use thereof |
JP7510875B2 (ja) | 2018-01-12 | 2024-07-04 | ケロス セラピューティクス インコーポレイテッド | アクチビンiib型受容体変異体および同変異体を含む医薬組成物 |
JP2021522793A (ja) | 2018-05-03 | 2021-09-02 | アクセルロン ファーマ インコーポレイテッド | TGFβスーパーファミリーリガンドの多特異性バインダーおよびその使用 |
EP3788067A4 (en) * | 2018-05-03 | 2022-01-19 | Acceleron Pharma Inc. | NOVEL BINDERS OF TGFBETA SUPERFAMILY LIGANDS AND THEIR USES |
CA3098679A1 (en) * | 2018-05-09 | 2019-11-14 | Keros Therapeutics, Inc. | Activin receptor type iia variants and methods of use thereof |
EP3807308A4 (en) * | 2018-06-15 | 2022-03-16 | Acceleron Pharma Inc. | BI- AND TRI-FUNCTIONAL FUSION PROTEINS AND USES THEREOF |
CN109293763B (zh) * | 2018-10-26 | 2021-10-26 | 中国农业科学院特产研究所 | 水貂激活素b蛋白及其制备与应用 |
CA3166820A1 (en) * | 2020-02-03 | 2021-08-12 | Ravindra Kumar | Variant actriib proteins and uses thereof |
EP4121088A4 (en) * | 2020-03-20 | 2024-07-03 | Keros Therapeutics Inc | METHODS OF USING ACTIVIN TYPE IIB RECEPTOR VARIANTS |
WO2021189006A1 (en) * | 2020-03-20 | 2021-09-23 | Keros Therapeutics, Inc. | Methods of using activin receptor type iia variants |
US20230242672A1 (en) * | 2020-06-25 | 2023-08-03 | Gliknik Inc. | Ace2-fc fusion proteins and methods of use |
WO2022150590A1 (en) * | 2021-01-08 | 2022-07-14 | Acceleron Pharma Inc. | Compositions and methods for treating pulmonary hypertension |
IL314280A (en) | 2022-01-28 | 2024-09-01 | 35Pharma Inc | Type IIB activin receptor variants and their uses |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0105014B1 (en) | 1982-09-24 | 1992-05-20 | THE UNITED STATES OF AMERICA as represented by the Secretary United States Department of Commerce | Repair of tissue in animals |
NZ210699A (en) | 1984-01-04 | 1989-06-28 | Int Genetic Eng | Isolation of an osteogenic protein of the p3 immunologically related family |
EP0169016B2 (en) | 1984-07-16 | 2004-04-28 | Celtrix Pharmaceuticals, Inc. | Polypeptide cartilage-inducing factors found in bone |
EP0272253A4 (en) | 1986-03-07 | 1990-02-05 | Massachusetts Inst Technology | METHOD FOR IMPROVING GLYCOPROTE INSTABILITY. |
US5080891A (en) | 1987-08-03 | 1992-01-14 | Ddi Pharmaceuticals, Inc. | Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols |
US20050186593A1 (en) * | 1991-05-10 | 2005-08-25 | The Salk Institute For Biological Studies | Cloning and recombinant production of CRF receptor(s) |
US5932448A (en) | 1991-11-29 | 1999-08-03 | Protein Design Labs., Inc. | Bispecific antibody heterodimers |
US5677196A (en) | 1993-05-18 | 1997-10-14 | University Of Utah Research Foundation | Apparatus and methods for multi-analyte homogeneous fluoro-immunoassays |
US5525490A (en) | 1994-03-29 | 1996-06-11 | Onyx Pharmaceuticals, Inc. | Reverse two-hybrid method |
US5814565A (en) | 1995-02-23 | 1998-09-29 | University Of Utah Research Foundation | Integrated optic waveguide immunosensor |
US5731168A (en) | 1995-03-01 | 1998-03-24 | Genentech, Inc. | Method for making heteromultimeric polypeptides |
DE69636866D1 (en) | 1995-04-11 | 2007-03-15 | Gen Hospital Corp | Reverse "two-hybrid"-systeme |
US20020062010A1 (en) | 1997-05-02 | 2002-05-23 | Genentech, Inc. | Method for making multispecific antibodies having heteromultimeric and common components |
ES2320603T3 (es) | 1997-07-30 | 2009-05-25 | Emory University | Sistemas de expresion, vectores, adn, proteinas de mineralizacion osea novedosos. |
ATE322681T1 (de) | 1999-01-21 | 2006-04-15 | Metamorphix Inc | Inhibitoren für wachstumdifferenzierungsfaktor und ihre anwendungen |
US7456149B2 (en) | 2004-03-02 | 2008-11-25 | Acceleron Pharma, Inc. | ALK7 and myostatin inhibitors and uses thereof |
ES2426005T3 (es) | 2004-07-23 | 2013-10-18 | Acceleron Pharma Inc. | Polipéptidos del receptor ACTRII, procedimientos y composiciones |
JP2009541275A (ja) | 2006-06-22 | 2009-11-26 | ノボ・ノルデイスク・エー/エス | 二重特異性抗体の生産 |
PT2124999E (pt) | 2006-12-18 | 2013-01-22 | Acceleron Pharma Inc | Antagonistas de activina-actrii e usos para tratar anemia |
US20100028332A1 (en) | 2006-12-18 | 2010-02-04 | Acceleron Pharma Inc. | Antagonists of actriib and uses for increasing red blood cell levels |
TW202104248A (zh) * | 2007-02-02 | 2021-02-01 | 美商艾瑟勒朗法瑪公司 | 衍生自ActRIIB的變體與其用途 |
MX350962B (es) | 2008-01-07 | 2017-09-27 | Amgen Inc | Metodo para fabricar moleculas heterodimericas de fragmentos cristalizables de anticuerpo, utilizando efectos electrostaticos de direccion. |
JP5719766B2 (ja) | 2008-05-02 | 2015-05-20 | アクセルロン ファーマ, インコーポレイテッド | 血管新生および周皮細胞組成物を調節するための方法および組成物 |
NZ602471A (en) * | 2008-06-26 | 2014-10-31 | Acceleron Pharma Inc | Antagonists of activin-actriia and uses for increasing red blood cell levels |
US8216997B2 (en) | 2008-08-14 | 2012-07-10 | Acceleron Pharma, Inc. | Methods for increasing red blood cell levels and treating anemia using a combination of GDF traps and erythropoietin receptor activators |
LT3750552T (lt) | 2008-08-14 | 2023-06-26 | Acceleron Pharma Inc. | Gdf gaudyklės |
EP2387412A4 (en) | 2009-01-13 | 2013-04-03 | Acceleron Pharma Inc | METHODS FOR INCREASING ADIPONECTIN |
BRPI1014858A2 (pt) | 2009-03-30 | 2017-03-28 | Acceleron Pharma Inc | "antagonistas de bmp-alk3 e usos para promover o crescimento ósseo" |
KR20190090049A (ko) * | 2009-06-12 | 2019-07-31 | 악셀레론 파마 인코포레이티드 | 절두된 ActRIIB-FC 융합 단백질 |
WO2011020045A1 (en) * | 2009-08-13 | 2011-02-17 | Acceleron Pharma Inc. | Combined use of gdf traps and erythropoietin receptor activators to increase red blood cell levels |
EP3202459B1 (en) | 2009-09-09 | 2021-04-14 | Acceleron Pharma Inc. | Actriib antagonists and dosing and uses thereof for treating obesity or type 2 diabetes by regulating body fat content |
SG179196A1 (en) | 2009-09-16 | 2012-04-27 | Genentech Inc | Coiled coil and/or tether containing protein complexes and uses thereof |
WO2012027065A2 (en) | 2010-08-27 | 2012-03-01 | Celgene Corporation | Combination therapy for treatment of disease |
CN102850458B (zh) | 2011-06-28 | 2014-10-01 | 华博生物医药技术(上海)有限公司 | 新型重组双功能融合蛋白及其制法和用途 |
KR20140084211A (ko) | 2011-10-17 | 2014-07-04 | 악셀레론 파마 인코포레이티드 | 효과가 없는 적혈구생성 치료를 위한 방법 및 조성물 |
WO2013063536A1 (en) | 2011-10-27 | 2013-05-02 | Acceleron Pharma, Inc. | Actriib binding agents and uses thereof |
CN116655801A (zh) | 2013-08-22 | 2023-08-29 | 阿塞勒隆制药公司 | TGF-β受体II型变体及其用途 |
KR20160127148A (ko) | 2014-03-21 | 2016-11-02 | 악셀레론 파마 인코포레이티드 | 액티빈 b 및/또는 gdf11을 억제함으로써 적혈 혈액 세포 수준을 증가시키고 비효율적인 적혈구 생성을 치료하는 방법 |
CA2962197C (en) | 2014-04-18 | 2023-10-03 | Ravindra Kumar | Methods for increasing red blood cell levels and treating sickle-cell disease |
MX2016016531A (es) * | 2014-06-13 | 2017-04-25 | Acceleron Pharma Inc | Metodos y composiciones para el tratamiento de las ulceras. |
MA41919A (fr) | 2015-04-06 | 2018-02-13 | Acceleron Pharma Inc | Hétéromultimères alk4:actriib et leurs utilisations |
EP3828199A1 (en) | 2015-04-06 | 2021-06-02 | Acceleron Pharma Inc. | Alk7: actriib heteromultimers and uses thereof |
JP6810702B2 (ja) | 2015-04-06 | 2021-01-06 | アクセルロン ファーマ インコーポレイテッド | シングルアームi型およびii型受容体融合タンパク質およびその使用 |
KR20180006386A (ko) | 2015-04-22 | 2018-01-17 | 얼라이브젠 유에스에이 인코포레이티드 | 신규한 근육 소모 질환 치료용 하이브리드 actriib 리간드 트랩 단백질 |
WO2016205370A1 (en) | 2015-06-15 | 2016-12-22 | Santa Maria Biotherapeutics, Inc. | Methods of using activin receptor iib-based proteins |
WO2017037634A1 (en) | 2015-08-31 | 2017-03-09 | National Research Council Of Canada | Tgf-β-receptor ectodomain fusion molecules and uses thereof |
US20170306027A1 (en) | 2016-04-06 | 2017-10-26 | Acceleron Pharma Inc. | Alk7 antagonists and uses thereof |
US20200071382A1 (en) | 2016-07-07 | 2020-03-05 | Acceleron Pharma Inc. | Tgf-beta superfamily heteromultimers and uses thereof |
US11440949B2 (en) | 2016-10-05 | 2022-09-13 | Acceleron Pharma Inc. | TGF-beta superfamily type I and type II receptor heteromultimers and uses thereof |
KR20190075078A (ko) | 2016-10-05 | 2019-06-28 | 악셀레론 파마 인코포레이티드 | ALK4:ActRIIB 이형다량체 및 이의 용도 |
JOP20190085A1 (ar) | 2016-10-20 | 2019-04-17 | Biogen Ma Inc | طرق علاج الضمور العضلي ومرض العظام باستخدام بروتينات احتجاز مركب ترابطي actriib هجين حديثة |
EP3538123A4 (en) | 2016-11-10 | 2020-10-14 | Keros Therapeutics, Inc. | ACTIVIN RECEPTOR TYPE IIA VARIANTS AND METHOD OF USING THEREOF |
-
2017
- 2017-10-05 WO PCT/US2017/055421 patent/WO2018067874A1/en unknown
- 2017-10-05 EP EP17859219.2A patent/EP3523328A4/en active Pending
- 2017-10-05 MA MA046471A patent/MA46471A/fr unknown
- 2017-10-05 US US16/340,048 patent/US11267865B2/en active Active
- 2017-10-05 JP JP2019518302A patent/JP7280182B2/ja active Active
- 2017-10-05 AU AU2017338916A patent/AU2017338916B2/en active Active
- 2017-10-05 BR BR112019006918A patent/BR112019006918A2/pt unknown
- 2017-10-05 KR KR1020197012902A patent/KR102595559B1/ko active IP Right Grant
- 2017-10-05 KR KR1020237036672A patent/KR20230152811A/ko not_active Application Discontinuation
- 2017-10-05 CA CA3039525A patent/CA3039525A1/en active Pending
- 2017-10-05 CN CN201780074935.6A patent/CN110036025B/zh active Active
-
2022
- 2022-03-07 US US17/687,934 patent/US20220306724A1/en active Pending
- 2022-03-11 AU AU2022201698A patent/AU2022201698A1/en not_active Abandoned
-
2023
- 2023-01-19 JP JP2023006458A patent/JP2023033573A/ja active Pending
-
2024
- 2024-02-05 AU AU2024200684A patent/AU2024200684A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112019006918A2 (pt) | 2019-06-25 |
EP3523328A1 (en) | 2019-08-14 |
JP7280182B2 (ja) | 2023-05-23 |
JP2019536440A (ja) | 2019-12-19 |
AU2022201698A1 (en) | 2022-04-07 |
US11267865B2 (en) | 2022-03-08 |
US20220306724A1 (en) | 2022-09-29 |
KR20190073414A (ko) | 2019-06-26 |
AU2017338916B2 (en) | 2022-03-24 |
AU2024200684A1 (en) | 2024-02-22 |
KR102595559B1 (ko) | 2023-10-30 |
JP2023033573A (ja) | 2023-03-10 |
MA46471A (fr) | 2021-05-19 |
WO2018067874A1 (en) | 2018-04-12 |
US20200055919A1 (en) | 2020-02-20 |
AU2017338916A1 (en) | 2019-04-18 |
CN110036025A (zh) | 2019-07-19 |
EP3523328A4 (en) | 2020-04-01 |
CN110036025B (zh) | 2024-03-22 |
CA3039525A1 (en) | 2018-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220306724A1 (en) | Variant actriib proteins and uses thereof | |
US20240158468A1 (en) | Tgf-beta superfamily type i and type ii receptor heteromultimers and uses thereof | |
AU2021200906B2 (en) | Single-ARM type I and type II receptor fusion proteins and uses thereof | |
US20230265161A1 (en) | Tgf-beta superfamily type i and type ii receptor heteromultimers and uses thereof | |
US20230129812A1 (en) | Compositions and methods for treating pulmonary hypertension | |
BR122024002253A2 (pt) | Polipeptídeo compreendendo sequência de aminoácidos de actriib, ácido nucleico compreendendo uma sequência que codifica o dito polipeptídeo, vetor compreendendo o dito ácido nucléico, célula compreendendo polipeptídeo, ácido nucleico ou vetor, usos terapêuticos do dito polipeptídeo e do dito ácido nucléico e métodos para produzir um polupeptídeo, uma proteína ou uma heteromultímera, piroteína e heteromultímera compreendendo um polipeptídeo actriib variante |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal |