CN116744966A - Dna编码的用于抵抗sars-cov-2的抗体 - Google Patents
Dna编码的用于抵抗sars-cov-2的抗体 Download PDFInfo
- Publication number
- CN116744966A CN116744966A CN202180056190.7A CN202180056190A CN116744966A CN 116744966 A CN116744966 A CN 116744966A CN 202180056190 A CN202180056190 A CN 202180056190A CN 116744966 A CN116744966 A CN 116744966A
- Authority
- CN
- China
- Prior art keywords
- seq
- cov
- sars
- antibody
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 301
- 102000036639 antigens Human genes 0.000 claims abstract description 218
- 239000000427 antigen Substances 0.000 claims abstract description 217
- 108091007433 antigens Proteins 0.000 claims abstract description 217
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 195
- 239000000203 mixture Substances 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 115
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 55
- 201000010099 disease Diseases 0.000 claims abstract description 52
- 208000035475 disorder Diseases 0.000 claims abstract description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 179
- 239000012634 fragment Substances 0.000 claims description 164
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 144
- 102000039446 nucleic acids Human genes 0.000 claims description 134
- 108020004707 nucleic acids Proteins 0.000 claims description 134
- 125000003729 nucleotide group Chemical group 0.000 claims description 126
- 239000002773 nucleotide Substances 0.000 claims description 124
- 238000004520 electroporation Methods 0.000 claims description 67
- 239000003814 drug Substances 0.000 claims description 30
- 101100112922 Candida albicans CDR3 gene Proteins 0.000 claims description 28
- 102100035361 Cerebellar degeneration-related protein 2 Human genes 0.000 claims description 28
- 101000737796 Homo sapiens Cerebellar degeneration-related protein 2 Proteins 0.000 claims description 28
- 102100035360 Cerebellar degeneration-related antigen 1 Human genes 0.000 claims description 26
- 101000737793 Homo sapiens Cerebellar degeneration-related antigen 1 Proteins 0.000 claims description 26
- 230000028993 immune response Effects 0.000 claims description 22
- 229940124597 therapeutic agent Drugs 0.000 claims description 22
- 238000011282 treatment Methods 0.000 claims description 20
- 229940127121 immunoconjugate Drugs 0.000 claims description 19
- 238000003776 cleavage reaction Methods 0.000 claims description 16
- 230000007017 scission Effects 0.000 claims description 16
- 239000013604 expression vector Substances 0.000 claims description 15
- 238000002347 injection Methods 0.000 claims description 14
- 239000007924 injection Substances 0.000 claims description 14
- 208000015181 infectious disease Diseases 0.000 claims description 13
- 230000001939 inductive effect Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 229940022962 COVID-19 vaccine Drugs 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 5
- 125000003275 alpha amino acid group Chemical group 0.000 claims 12
- 208000025721 COVID-19 Diseases 0.000 abstract description 81
- 208000037847 SARS-CoV-2-infection Diseases 0.000 abstract description 24
- 230000027455 binding Effects 0.000 description 167
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 163
- 150000001413 amino acids Chemical group 0.000 description 140
- 210000004027 cell Anatomy 0.000 description 133
- 102000004196 processed proteins & peptides Human genes 0.000 description 122
- 229920001184 polypeptide Polymers 0.000 description 115
- 108090000623 proteins and genes Proteins 0.000 description 104
- 229960005486 vaccine Drugs 0.000 description 81
- 102000004169 proteins and genes Human genes 0.000 description 80
- 235000018102 proteins Nutrition 0.000 description 79
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 67
- 230000014509 gene expression Effects 0.000 description 67
- 239000013612 plasmid Substances 0.000 description 61
- 239000013598 vector Substances 0.000 description 61
- 102000005962 receptors Human genes 0.000 description 60
- 108020003175 receptors Proteins 0.000 description 60
- 229940125583 Inovio COVID-19 vaccine Drugs 0.000 description 59
- 108020004414 DNA Proteins 0.000 description 58
- 101710198474 Spike protein Proteins 0.000 description 53
- 229940096437 Protein S Drugs 0.000 description 51
- 102000053723 Angiotensin-converting enzyme 2 Human genes 0.000 description 50
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 description 50
- 230000002163 immunogen Effects 0.000 description 50
- 210000002966 serum Anatomy 0.000 description 49
- 241000699670 Mus sp. Species 0.000 description 48
- 210000001744 T-lymphocyte Anatomy 0.000 description 46
- 108091005634 SARS-CoV-2 receptor-binding domains Proteins 0.000 description 41
- 238000003556 assay Methods 0.000 description 41
- 235000001014 amino acid Nutrition 0.000 description 39
- 108010076504 Protein Sorting Signals Proteins 0.000 description 38
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 34
- 238000002965 ELISA Methods 0.000 description 33
- 210000001519 tissue Anatomy 0.000 description 29
- 238000000338 in vitro Methods 0.000 description 28
- 241000700605 Viruses Species 0.000 description 27
- 238000001727 in vivo Methods 0.000 description 27
- 108060003951 Immunoglobulin Proteins 0.000 description 26
- 102000018358 immunoglobulin Human genes 0.000 description 26
- 229940024606 amino acid Drugs 0.000 description 25
- 239000000523 sample Substances 0.000 description 25
- 241001465754 Metazoa Species 0.000 description 24
- 238000004519 manufacturing process Methods 0.000 description 24
- 238000001890 transfection Methods 0.000 description 24
- 241000315672 SARS coronavirus Species 0.000 description 23
- 230000003053 immunization Effects 0.000 description 23
- 108091026890 Coding region Proteins 0.000 description 22
- 230000005867 T cell response Effects 0.000 description 22
- 238000002649 immunization Methods 0.000 description 22
- 238000006386 neutralization reaction Methods 0.000 description 22
- 230000003612 virological effect Effects 0.000 description 22
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 21
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 21
- 241000699666 Mus <mouse, genus> Species 0.000 description 21
- 230000024932 T cell mediated immunity Effects 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 21
- 238000006467 substitution reaction Methods 0.000 description 21
- 241000711573 Coronaviridae Species 0.000 description 20
- 108010074328 Interferon-gamma Proteins 0.000 description 20
- 150000002632 lipids Chemical class 0.000 description 20
- 230000008488 polyadenylation Effects 0.000 description 20
- 229940021995 DNA vaccine Drugs 0.000 description 19
- 102100037850 Interferon gamma Human genes 0.000 description 19
- 230000004048 modification Effects 0.000 description 19
- 238000012986 modification Methods 0.000 description 19
- 238000011725 BALB/c mouse Methods 0.000 description 18
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 17
- 108010041986 DNA Vaccines Proteins 0.000 description 17
- 102000035195 Peptidases Human genes 0.000 description 17
- 108091005804 Peptidases Proteins 0.000 description 17
- 230000000295 complement effect Effects 0.000 description 17
- 238000011161 development Methods 0.000 description 17
- 241000700198 Cavia Species 0.000 description 16
- 230000005847 immunogenicity Effects 0.000 description 16
- 230000003472 neutralizing effect Effects 0.000 description 16
- 239000004365 Protease Substances 0.000 description 15
- 238000010790 dilution Methods 0.000 description 15
- 239000012895 dilution Substances 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 239000002502 liposome Substances 0.000 description 15
- 235000019419 proteases Nutrition 0.000 description 15
- 230000004044 response Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 230000028996 humoral immune response Effects 0.000 description 14
- 230000003993 interaction Effects 0.000 description 14
- 210000004988 splenocyte Anatomy 0.000 description 14
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 13
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 13
- 210000004408 hybridoma Anatomy 0.000 description 13
- 230000005764 inhibitory process Effects 0.000 description 13
- 230000001404 mediated effect Effects 0.000 description 13
- 230000014616 translation Effects 0.000 description 13
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 12
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 description 12
- 241001112090 Pseudovirus Species 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 230000009385 viral infection Effects 0.000 description 12
- 238000001262 western blot Methods 0.000 description 12
- 108020003589 5' Untranslated Regions Proteins 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 11
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 11
- 230000000903 blocking effect Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 210000004072 lung Anatomy 0.000 description 11
- 238000005457 optimization Methods 0.000 description 11
- 239000002953 phosphate buffered saline Substances 0.000 description 11
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 11
- 230000004083 survival effect Effects 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 230000001225 therapeutic effect Effects 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 241000124008 Mammalia Species 0.000 description 10
- 208000036142 Viral infection Diseases 0.000 description 10
- 230000010056 antibody-dependent cellular cytotoxicity Effects 0.000 description 10
- 238000012512 characterization method Methods 0.000 description 10
- 230000008713 feedback mechanism Effects 0.000 description 10
- 239000012091 fetal bovine serum Substances 0.000 description 10
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 10
- 238000003032 molecular docking Methods 0.000 description 10
- 108091081024 Start codon Proteins 0.000 description 9
- 230000001594 aberrant effect Effects 0.000 description 9
- 238000000684 flow cytometry Methods 0.000 description 9
- 230000008685 targeting Effects 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 108091035707 Consensus sequence Proteins 0.000 description 8
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 150000004676 glycans Chemical class 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 229930182817 methionine Natural products 0.000 description 8
- 239000013603 viral vector Substances 0.000 description 8
- 108020005345 3' Untranslated Regions Proteins 0.000 description 7
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 7
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 7
- 108010002350 Interleukin-2 Proteins 0.000 description 7
- 102000000588 Interleukin-2 Human genes 0.000 description 7
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 7
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 7
- 229920001213 Polysorbate 20 Polymers 0.000 description 7
- 108091008874 T cell receptors Proteins 0.000 description 7
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 7
- 229940098773 bovine serum albumin Drugs 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 239000012636 effector Substances 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 239000012530 fluid Substances 0.000 description 7
- 238000011597 hartley guinea pig Methods 0.000 description 7
- 230000008348 humoral response Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000003018 immunoassay Methods 0.000 description 7
- 238000004246 ligand exchange chromatography Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 210000003205 muscle Anatomy 0.000 description 7
- 239000013642 negative control Substances 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 7
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 7
- 230000005030 transcription termination Effects 0.000 description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 6
- 108010085238 Actins Proteins 0.000 description 6
- 102000007469 Actins Human genes 0.000 description 6
- 238000011740 C57BL/6 mouse Methods 0.000 description 6
- 241000283707 Capra Species 0.000 description 6
- 208000001528 Coronaviridae Infections Diseases 0.000 description 6
- 241000701022 Cytomegalovirus Species 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 6
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 6
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 6
- 108091005609 SARS-CoV-2 Spike Subunit S1 Proteins 0.000 description 6
- 108010067390 Viral Proteins Proteins 0.000 description 6
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 6
- 239000012472 biological sample Substances 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 238000010839 reverse transcription Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 230000028327 secretion Effects 0.000 description 6
- 238000013207 serial dilution Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 241000700199 Cavia porcellus Species 0.000 description 5
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 5
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 5
- 108060003393 Granulin Proteins 0.000 description 5
- 101000929928 Homo sapiens Angiotensin-converting enzyme 2 Proteins 0.000 description 5
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 5
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 5
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 5
- 229930182555 Penicillin Natural products 0.000 description 5
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 5
- 230000010530 Virus Neutralization Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 230000005875 antibody response Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 230000001588 bifunctional effect Effects 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 210000000170 cell membrane Anatomy 0.000 description 5
- 230000036755 cellular response Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 102000048657 human ACE2 Human genes 0.000 description 5
- 239000003446 ligand Substances 0.000 description 5
- 239000000693 micelle Substances 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 229920000447 polyanionic polymer Polymers 0.000 description 5
- 230000001681 protective effect Effects 0.000 description 5
- 210000004989 spleen cell Anatomy 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 238000002560 therapeutic procedure Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 4
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 4
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 4
- 101000611023 Homo sapiens Tumor necrosis factor receptor superfamily member 6 Proteins 0.000 description 4
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 4
- 102100034349 Integrase Human genes 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 4
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 4
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 4
- 102100029193 Low affinity immunoglobulin gamma Fc region receptor III-A Human genes 0.000 description 4
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 4
- 241000714474 Rous sarcoma virus Species 0.000 description 4
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 4
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 4
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 4
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 4
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 4
- 102100040403 Tumor necrosis factor receptor superfamily member 6 Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 239000002671 adjuvant Substances 0.000 description 4
- 150000001412 amines Chemical class 0.000 description 4
- 229960000074 biopharmaceutical Drugs 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- CVSVTCORWBXHQV-UHFFFAOYSA-N creatine Chemical compound NC(=[NH2+])N(C)CC([O-])=O CVSVTCORWBXHQV-UHFFFAOYSA-N 0.000 description 4
- 238000002716 delivery method Methods 0.000 description 4
- 238000010494 dissociation reaction Methods 0.000 description 4
- 230000005593 dissociations Effects 0.000 description 4
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000036039 immunity Effects 0.000 description 4
- 238000009169 immunotherapy Methods 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 208000030500 lower respiratory tract disease Diseases 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 210000000822 natural killer cell Anatomy 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 229940023041 peptide vaccine Drugs 0.000 description 4
- 229920002643 polyglutamic acid Polymers 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000012146 running buffer Substances 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 229940031439 squalene Drugs 0.000 description 4
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 230000000638 stimulation Effects 0.000 description 4
- 229960005322 streptomycin Drugs 0.000 description 4
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- 230000007502 viral entry Effects 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 102100031673 Corneodesmosin Human genes 0.000 description 3
- 101710139375 Corneodesmosin Proteins 0.000 description 3
- 241000702421 Dependoparvovirus Species 0.000 description 3
- 229920002307 Dextran Polymers 0.000 description 3
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 3
- 208000032163 Emerging Communicable disease Diseases 0.000 description 3
- 101710091045 Envelope protein Proteins 0.000 description 3
- 241000283074 Equus asinus Species 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 3
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 3
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 3
- 101000851370 Homo sapiens Tumor necrosis factor receptor superfamily member 9 Proteins 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 102000018697 Membrane Proteins Human genes 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 3
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 3
- 108010067902 Peptide Library Proteins 0.000 description 3
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 3
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 3
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 3
- 101710188315 Protein X Proteins 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108020005091 Replication Origin Proteins 0.000 description 3
- 102000044437 S1 domains Human genes 0.000 description 3
- 108700036684 S1 domains Proteins 0.000 description 3
- 108091006197 SARS-CoV-2 Nucleocapsid Protein Proteins 0.000 description 3
- 108091007520 SARS-CoV-2 RNA polymerases Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 3
- 101150056647 TNFRSF4 gene Proteins 0.000 description 3
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 3
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 3
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 210000000612 antigen-presenting cell Anatomy 0.000 description 3
- 210000003719 b-lymphocyte Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 3
- 108010006025 bovine growth hormone Proteins 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- -1 cell membranes Chemical class 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 231100000517 death Toxicity 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 230000033581 fucosylation Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 206010022000 influenza Diseases 0.000 description 3
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000034217 membrane fusion Effects 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 239000002105 nanoparticle Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 229940049954 penicillin Drugs 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 229920000136 polysorbate Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 238000003127 radioimmunoassay Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 239000012089 stop solution Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 239000012096 transfection reagent Substances 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241001515965 unidentified phage Species 0.000 description 3
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 2
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 2
- FZWIIGKQNLYDQI-UHFFFAOYSA-N 8-aminopyrene-1,3,6-trisulfonic acid Chemical compound C1=C2C(N)=CC(S(O)(=O)=O)=C(C=C3)C2=C2C3=C(S(O)(=O)=O)C=C(S(O)(=O)=O)C2=C1 FZWIIGKQNLYDQI-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- XKXAZPSREVUCRT-BPNCWPANSA-N Ala-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=C(O)C=C1 XKXAZPSREVUCRT-BPNCWPANSA-N 0.000 description 2
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 2
- 235000002198 Annona diversifolia Nutrition 0.000 description 2
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 2
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 2
- UZNSWMFLKVKJLI-VHWLVUOQSA-N Asp-Ile-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UZNSWMFLKVKJLI-VHWLVUOQSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- 241000283726 Bison Species 0.000 description 2
- 241000282817 Bovidae Species 0.000 description 2
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 2
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 2
- 102000016550 Complement Factor H Human genes 0.000 description 2
- 108010053085 Complement Factor H Proteins 0.000 description 2
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 2
- 241000494545 Cordyline virus 2 Species 0.000 description 2
- VIRYODQIWJNWNU-NRPADANISA-N Cys-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N VIRYODQIWJNWNU-NRPADANISA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 102000004961 Furin Human genes 0.000 description 2
- 108090001126 Furin Proteins 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 102000025850 HLA-A2 Antigen Human genes 0.000 description 2
- 108010074032 HLA-A2 Antigen Proteins 0.000 description 2
- 102000001554 Hemoglobins Human genes 0.000 description 2
- 108010054147 Hemoglobins Proteins 0.000 description 2
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 2
- 101000934341 Homo sapiens T-cell surface glycoprotein CD5 Proteins 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 2
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- YLMIDMSLKLRNHX-HSCHXYMDSA-N Leu-Trp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YLMIDMSLKLRNHX-HSCHXYMDSA-N 0.000 description 2
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 2
- MNNKPHGAPRUKMW-BPUTZDHNSA-N Met-Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MNNKPHGAPRUKMW-BPUTZDHNSA-N 0.000 description 2
- 102000003505 Myosin Human genes 0.000 description 2
- 108060008487 Myosin Proteins 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 102000057297 Pepsin A Human genes 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 2
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 2
- 206010035664 Pneumonia Diseases 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- 239000012980 RPMI-1640 medium Substances 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- 101000667982 Severe acute respiratory syndrome coronavirus 2 Envelope small membrane protein Proteins 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 2
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 2
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 101000980463 Treponema pallidum (strain Nichols) Chaperonin GroEL Proteins 0.000 description 2
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 2
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 2
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 2
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 2
- ANHVRCNNGJMJNG-BZSNNMDCSA-N Tyr-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CS)C(=O)O)N)O ANHVRCNNGJMJNG-BZSNNMDCSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 2
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000840 anti-viral effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000003443 antiviral agent Substances 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 229910001424 calcium ion Inorganic materials 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- MYSWGUAQZAJSOK-UHFFFAOYSA-N ciprofloxacin Chemical compound C12=CC(N3CCNCC3)=C(F)C=C2C(=O)C(C(=O)O)=CN1C1CC1 MYSWGUAQZAJSOK-UHFFFAOYSA-N 0.000 description 2
- 238000012761 co-transfection Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 229960003624 creatine Drugs 0.000 description 2
- 239000006046 creatine Substances 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 230000005182 global health Effects 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229920002674 hyaluronan Polymers 0.000 description 2
- 229960003160 hyaluronic acid Drugs 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 238000003119 immunoblot Methods 0.000 description 2
- 230000000951 immunodiffusion Effects 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 230000003308 immunostimulating effect Effects 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 238000005462 in vivo assay Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 2
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 2
- 229920002113 octoxynol Polymers 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 230000005180 public health Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000004053 quinones Chemical class 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 125000005629 sialic acid group Chemical group 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 229960001322 trypsin Drugs 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 238000002255 vaccination Methods 0.000 description 2
- 229940125575 vaccine candidate Drugs 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- IESDGNYHXIOKRW-YXMSTPNBSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IESDGNYHXIOKRW-YXMSTPNBSA-N 0.000 description 1
- DIBLBAURNYJYBF-XLXZRNDBSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2-amino-3-methylbutanoyl]amino]hexanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 DIBLBAURNYJYBF-XLXZRNDBSA-N 0.000 description 1
- MMRINLZOZVAPDZ-LSGRDSQZSA-N (6r,7r)-7-[[(2z)-2-(2-amino-1,3-thiazol-4-yl)-2-methoxyiminoacetyl]amino]-3-[(1-methylpyrrolidin-1-ium-1-yl)methyl]-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid;chloride Chemical compound Cl.S([C@@H]1[C@@H](C(N1C=1C([O-])=O)=O)NC(=O)\C(=N/OC)C=2N=C(N)SC=2)CC=1C[N+]1(C)CCCC1 MMRINLZOZVAPDZ-LSGRDSQZSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- YRNWIFYIFSBPAU-UHFFFAOYSA-N 4-[4-(dimethylamino)phenyl]-n,n-dimethylaniline Chemical compound C1=CC(N(C)C)=CC=C1C1=CC=C(N(C)C)C=C1 YRNWIFYIFSBPAU-UHFFFAOYSA-N 0.000 description 1
- 108020005176 AU Rich Elements Proteins 0.000 description 1
- 108091005508 Acid proteases Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 244000303258 Annona diversifolia Species 0.000 description 1
- WZPBZJONDBGPKJ-UHFFFAOYSA-N Antibiotic SQ 26917 Natural products O=C1N(S(O)(=O)=O)C(C)C1NC(=O)C(=NOC(C)(C)C(O)=O)C1=CSC(N)=N1 WZPBZJONDBGPKJ-UHFFFAOYSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- YQNBILXAUIAUCF-CIUDSAMLSA-N Asn-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N YQNBILXAUIAUCF-CIUDSAMLSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- 102000035101 Aspartic proteases Human genes 0.000 description 1
- 108091005502 Aspartic proteases Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 102000006734 Beta-Globulins Human genes 0.000 description 1
- 108010087504 Beta-Globulins Proteins 0.000 description 1
- 102400000107 C-terminal peptide Human genes 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- 102000053028 CD36 Antigens Human genes 0.000 description 1
- 108010045374 CD36 Antigens Proteins 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 229940125579 COVID-19 vaccine candidate Drugs 0.000 description 1
- 108010032088 Calpain Proteins 0.000 description 1
- 102000007590 Calpain Human genes 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 108010078777 Colistin Proteins 0.000 description 1
- 108010061994 Coronavirus Spike Glycoprotein Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 206010011409 Cross infection Diseases 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 1
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- 108010005843 Cysteine Proteases Proteins 0.000 description 1
- 102000005927 Cysteine Proteases Human genes 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000011238 DNA vaccination Methods 0.000 description 1
- 108010031111 EBV-encoded nuclear antigen 1 Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000011510 Elispot assay Methods 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 206010014950 Eosinophilia Diseases 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010087819 Fc receptors Proteins 0.000 description 1
- 102000009109 Fc receptors Human genes 0.000 description 1
- 108010008177 Fd immunoglobulins Proteins 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 1
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- ZSIDREAPEPAPKL-XIRDDKMYSA-N Glu-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N ZSIDREAPEPAPKL-XIRDDKMYSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 101710114810 Glycoprotein Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 101710088172 HTH-type transcriptional regulator RipA Proteins 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 1
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 101001023379 Homo sapiens Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101001041393 Homo sapiens Serine protease HTRA1 Proteins 0.000 description 1
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 1
- 244000309467 Human Coronavirus Species 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- QQFSKBMCAKWHLG-UHFFFAOYSA-N Ile-Phe-Pro-Pro Chemical compound C1CCC(C(=O)N2C(CCC2)C(O)=O)N1C(=O)C(NC(=O)C(N)C(C)CC)CC1=CC=CC=C1 QQFSKBMCAKWHLG-UHFFFAOYSA-N 0.000 description 1
- FBGXMKUWQFPHFB-JBDRJPRFSA-N Ile-Ser-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N FBGXMKUWQFPHFB-JBDRJPRFSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- WKSHBPRUIRGWRZ-KCTSRDHCSA-N Ile-Trp-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N WKSHBPRUIRGWRZ-KCTSRDHCSA-N 0.000 description 1
- JERJIYYCOGBAIJ-OBAATPRFSA-N Ile-Tyr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JERJIYYCOGBAIJ-OBAATPRFSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 1
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- GSDSWSVVBLHKDQ-JTQLQIEISA-N Levofloxacin Chemical compound C([C@@H](N1C2=C(C(C(C(O)=O)=C1)=O)C=C1F)C)OC2=C1N1CCN(C)CC1 GSDSWSVVBLHKDQ-JTQLQIEISA-N 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 108010027796 Membrane Fusion Proteins Proteins 0.000 description 1
- 102000018897 Membrane Fusion Proteins Human genes 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101001044384 Mus musculus Interferon gamma Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 101001028244 Onchocerca volvulus Fatty-acid and retinol-binding protein 1 Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- APECKGGXAXNFLL-RNXOBYDBSA-N Phe-Trp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 APECKGGXAXNFLL-RNXOBYDBSA-N 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 108010093965 Polymyxin B Proteins 0.000 description 1
- 108010040201 Polymyxins Proteins 0.000 description 1
- 102000015623 Polynucleotide Adenylyltransferase Human genes 0.000 description 1
- 108010024055 Polynucleotide adenylyltransferase Proteins 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 101710138747 Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000035415 Reinfection Diseases 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 1
- 108091005774 SARS-CoV-2 proteins Proteins 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102100021119 Serine protease HTRA1 Human genes 0.000 description 1
- 101000629313 Severe acute respiratory syndrome coronavirus Spike glycoprotein Proteins 0.000 description 1
- 241000219289 Silene Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- 101710167605 Spike glycoprotein Proteins 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000006044 T cell activation Effects 0.000 description 1
- 230000006052 T cell proliferation Effects 0.000 description 1
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- WKDDRNSBRWANNC-UHFFFAOYSA-N Thienamycin Natural products C1C(SCCN)=C(C(O)=O)N2C(=O)C(C(O)C)C21 WKDDRNSBRWANNC-UHFFFAOYSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 102000035100 Threonine proteases Human genes 0.000 description 1
- 108091005501 Threonine proteases Proteins 0.000 description 1
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 1
- MICFJCRQBFSKPA-UMPQAUOISA-N Trp-Met-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 MICFJCRQBFSKPA-UMPQAUOISA-N 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- QOIKZODVIPOPDD-AVGNSLFASA-N Tyr-Cys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOIKZODVIPOPDD-AVGNSLFASA-N 0.000 description 1
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 1
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229960004821 amikacin Drugs 0.000 description 1
- LKCWBDHBTVXHDL-RMDFUYIESA-N amikacin Chemical compound O([C@@H]1[C@@H](N)C[C@H]([C@@H]([C@H]1O)O[C@@H]1[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O1)O)NC(=O)[C@@H](O)CCN)[C@H]1O[C@H](CN)[C@@H](O)[C@H](O)[C@H]1O LKCWBDHBTVXHDL-RMDFUYIESA-N 0.000 description 1
- 150000001414 amino alcohols Chemical class 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000244 anti-pseudomonal effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000000823 artificial membrane Substances 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 229960003623 azlocillin Drugs 0.000 description 1
- JTWOMNBEOCYFNV-NFFDBFGFSA-N azlocillin Chemical compound N([C@@H](C(=O)N[C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C=1C=CC=CC=1)C(=O)N1CCNC1=O JTWOMNBEOCYFNV-NFFDBFGFSA-N 0.000 description 1
- WZPBZJONDBGPKJ-VEHQQRBSSA-N aztreonam Chemical compound O=C1N(S([O-])(=O)=O)[C@@H](C)[C@@H]1NC(=O)C(=N/OC(C)(C)C(O)=O)\C1=CSC([NH3+])=N1 WZPBZJONDBGPKJ-VEHQQRBSSA-N 0.000 description 1
- 229960003644 aztreonam Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 238000013357 binding ELISA Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 229910021538 borax Inorganic materials 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 229940041011 carbapenems Drugs 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical group 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 229960002100 cefepime Drugs 0.000 description 1
- GCFBRXLSHGKWDP-XCGNWRKASA-N cefoperazone Chemical compound O=C1C(=O)N(CC)CCN1C(=O)N[C@H](C=1C=CC(O)=CC=1)C(=O)N[C@@H]1C(=O)N2C(C(O)=O)=C(CSC=3N(N=NN=3)C)CS[C@@H]21 GCFBRXLSHGKWDP-XCGNWRKASA-N 0.000 description 1
- 229960004682 cefoperazone Drugs 0.000 description 1
- DKOQGJHPHLTOJR-WHRDSVKCSA-N cefpirome Chemical compound N([C@@H]1C(N2C(=C(C[N+]=3C=4CCCC=4C=CC=3)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 DKOQGJHPHLTOJR-WHRDSVKCSA-N 0.000 description 1
- 229960000466 cefpirome Drugs 0.000 description 1
- 229960000484 ceftazidime Drugs 0.000 description 1
- NMVPEQXCMGEDNH-TZVUEUGBSA-N ceftazidime pentahydrate Chemical compound O.O.O.O.O.S([C@@H]1[C@@H](C(N1C=1C([O-])=O)=O)NC(=O)\C(=N/OC(C)(C)C(O)=O)C=2N=C(N)SC=2)CC=1C[N+]1=CC=CC=C1 NMVPEQXCMGEDNH-TZVUEUGBSA-N 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000008004 cell lysis buffer Substances 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 229960003405 ciprofloxacin Drugs 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 229960003346 colistin Drugs 0.000 description 1
- 238000001246 colloidal dispersion Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006957 competitive inhibition Effects 0.000 description 1
- 230000024203 complement activation Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229960000895 doripenem Drugs 0.000 description 1
- AVAACINZEOAHHE-VFZPANTDSA-N doripenem Chemical compound C=1([C@H](C)[C@@H]2[C@H](C(N2C=1C(O)=O)=O)[C@H](O)C)S[C@@H]1CN[C@H](CNS(N)(=O)=O)C1 AVAACINZEOAHHE-VFZPANTDSA-N 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000001827 electrotherapy Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 230000010502 episomal replication Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 235000020187 evaporated milk Nutrition 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 108010052621 fas Receptor Proteins 0.000 description 1
- 102000018823 fas Receptor Human genes 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 150000002337 glycosamines Chemical group 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 238000011554 guinea pig model Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 230000007236 host immunity Effects 0.000 description 1
- 229960002182 imipenem Drugs 0.000 description 1
- ZSKVGTPCRGIANV-ZXFLCMHBSA-N imipenem Chemical compound C1C(SCC\N=C\N)=C(C(O)=O)N2C(=O)[C@H]([C@H](O)C)[C@H]21 ZSKVGTPCRGIANV-ZXFLCMHBSA-N 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 210000004201 immune sera Anatomy 0.000 description 1
- 229940042743 immune sera Drugs 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 238000000760 immunoelectrophoresis Methods 0.000 description 1
- 238000003125 immunofluorescent labeling Methods 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000002055 immunohistochemical effect Effects 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000001759 immunoprophylactic effect Effects 0.000 description 1
- 230000001024 immunotherapeutic effect Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000006882 induction of apoptosis Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 239000000644 isotonic solution Substances 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000012933 kinetic analysis Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 201000002364 leukopenia Diseases 0.000 description 1
- 231100001022 leukopenia Toxicity 0.000 description 1
- 229960003376 levofloxacin Drugs 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 229960002260 meropenem Drugs 0.000 description 1
- DMJNNHOOLUXYBV-PQTSNVLCSA-N meropenem Chemical compound C=1([C@H](C)[C@@H]2[C@H](C(N2C=1C(O)=O)=O)[C@H](O)C)S[C@@H]1CN[C@H](C(=O)N(C)C)C1 DMJNNHOOLUXYBV-PQTSNVLCSA-N 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229960000198 mezlocillin Drugs 0.000 description 1
- YPBATNHYBCGSSN-VWPFQQQWSA-N mezlocillin Chemical compound N([C@@H](C(=O)N[C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C=1C=CC=CC=1)C(=O)N1CCN(S(C)(=O)=O)C1=O YPBATNHYBCGSSN-VWPFQQQWSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229940041009 monobactams Drugs 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- JORAUNFTUVJTNG-BSTBCYLQSA-N n-[(2s)-4-amino-1-[[(2s,3r)-1-[[(2s)-4-amino-1-oxo-1-[[(3s,6s,9s,12s,15r,18s,21s)-6,9,18-tris(2-aminoethyl)-3-[(1r)-1-hydroxyethyl]-12,15-bis(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-h Chemical compound CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@H]([C@@H](C)O)CN[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@H](CCN)NC1=O.CCC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@H]([C@@H](C)O)CN[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@H](CCN)NC1=O JORAUNFTUVJTNG-BSTBCYLQSA-N 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 201000009240 nasopharyngitis Diseases 0.000 description 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 150000002960 penicillins Chemical class 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 229940021222 peritoneal dialysis isotonic solution Drugs 0.000 description 1
- 102000013415 peroxidase activity proteins Human genes 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 230000009894 physiological stress Effects 0.000 description 1
- 229960002292 piperacillin Drugs 0.000 description 1
- WCMIIGXFCMNQDS-IDYPWDAWSA-M piperacillin sodium Chemical compound [Na+].O=C1C(=O)N(CC)CCN1C(=O)N[C@H](C=1C=CC=CC=1)C(=O)N[C@@H]1C(=O)N2[C@@H](C([O-])=O)C(C)(C)S[C@@H]21 WCMIIGXFCMNQDS-IDYPWDAWSA-M 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000024 polymyxin B Polymers 0.000 description 1
- XDJYMJULXQKGMM-UHFFFAOYSA-N polymyxin E1 Natural products CCC(C)CCCCC(=O)NC(CCN)C(=O)NC(C(C)O)C(=O)NC(CCN)C(=O)NC1CCNC(=O)C(C(C)O)NC(=O)C(CCN)NC(=O)C(CCN)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C(CCN)NC1=O XDJYMJULXQKGMM-UHFFFAOYSA-N 0.000 description 1
- KNIWPHSUTGNZST-UHFFFAOYSA-N polymyxin E2 Natural products CC(C)CCCCC(=O)NC(CCN)C(=O)NC(C(C)O)C(=O)NC(CCN)C(=O)NC1CCNC(=O)C(C(C)O)NC(=O)C(CCN)NC(=O)C(CCN)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C(CCN)NC1=O KNIWPHSUTGNZST-UHFFFAOYSA-N 0.000 description 1
- 229960005266 polymyxin b Drugs 0.000 description 1
- 229940041153 polymyxins Drugs 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012910 preclinical development Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000011809 primate model Methods 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000021127 protein binding proteins Human genes 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 150000007660 quinolones Chemical class 0.000 description 1
- 238000010814 radioimmunoprecipitation assay Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012898 sample dilution Substances 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 235000010339 sodium tetraborate Nutrition 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 229940126577 synthetic vaccine Drugs 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 230000008646 thermal stress Effects 0.000 description 1
- 229960004659 ticarcillin Drugs 0.000 description 1
- OHKOGUYZJXTSFX-KZFFXBSXSA-N ticarcillin Chemical compound C=1([C@@H](C(O)=O)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)C=CSC=1 OHKOGUYZJXTSFX-KZFFXBSXSA-N 0.000 description 1
- 229960000707 tobramycin Drugs 0.000 description 1
- NLVFBUXFDBBNBW-PBSUHMDJSA-N tobramycin Chemical compound N[C@@H]1C[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N NLVFBUXFDBBNBW-PBSUHMDJSA-N 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 239000005526 vasoconstrictor agent Substances 0.000 description 1
- 230000008478 viral entry into host cell Effects 0.000 description 1
- 230000017613 viral reproduction Effects 0.000 description 1
- 229940023147 viral vector vaccine Drugs 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Landscapes
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
本文公开了SARS‑CoV‑2抗原的抗体和编码SARS‑CoV‑2抗体的重组核酸序列。本发明还提供使用所述组合物和方法预防和/或治疗受试者中SARS‑CoV‑2感染或与SARS‑CoV‑2感染相关的疾病或病症(例如,COVID‑19)的方法。
Description
相关申请
本申请要求2020年6月9日提交的临时申请号U.S.63/036,809;2020年6月9日提交的美国临时申请号63/036,795;2020年8月21日提交的美国临时申请号63/068,868;2020年9月25日提交的美国临时申请号63/083,173;以及2020年11月16日提交的美国临时申请号63/114,271的优先权,这些申请各自特此通过引用以其全文结合在此。
技术领域
本发明涉及一种组合物,包含用于在体内产生一种或多种合成抗体及其功能性片段的重组核酸序列,以及通过给予所述组合物来在受试者中预防和/或治疗病毒感染的方法。
背景技术
冠状病毒(CoV)是世界范围内常见的病毒家族,并且在人类中引起从普通感冒到严重急性呼吸综合征(SARS)的一系列疾病。冠状病毒还可以在动物中引起多种疾病。人冠状病毒229E、OC43、NL63和HKU1在人群中是地方性的。
COVID-19,先前已知为2019-nCoV肺炎或疾病,迅速出现为全球公共健康危机,将严重急性呼吸综合征(SARS)和中东呼吸综合征(MERS)加入数量日益增长的冠状病毒相关性疾病,这些疾病从动物跳至人。至少有7种鉴定的感染人的冠状病毒。从来自感染患者的人呼吸道上皮细胞中分离并测序SARS-CoV-2(Zhu et al.,2020N Engl J Med,382:727-733;Wu et al.,2020,Nature,579:265–269)。疾病症状的范围可以从轻度流感样至患有威胁生命的肺炎的严重病例(Huang et al.,2020,Lancet,395:497-506)。全球形势正在动态演变,并且在2020年1月30日,世界卫生组织宣布COVID-19为国际关注的公共健康紧急情况(PHEIC),并且在2020年3月11日宣布其为全球大流行。截至2020年4月1日,存在932,605人感染和46,809人死亡(gistide.org/epiflu-applications/global-cases-covid-19)。感染已扩散到多大洲。已经在多个国家中观察到人对人的传播,并且处置的个人防护设备的短缺和冠状病毒在无生命表面上的延长的存活时间(Hulkower et al.,2011,Am J InfectControl 39,401-407)已经复合了这种已经脆弱的情况并且增加了医院感染的风险。为了努力保护全世界数十亿易受攻击的受试者,必须并行进行先进研究活动以推进保护模式。
因此,本领域需要预防和/或治疗COVID-19的治疗剂,从而提供保护抵御并促进COVID-19感染的存活。本发明满足这种需要。
发明内容
在一个实施方式中,本发明涉及抗SARS-CoV-2抗体或其片段,其中抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。
在一个实施方式中,免疫偶联物包含治疗剂或检测部分。
在一个实施方式中,抗体选自由以下各项组成的组:人源化抗体、嵌合抗体、完全人抗体、抗体模拟物。
在一个实施方式中,抗体包含选自由以下组成的组中的至少一种:a)选自SEQ IDNO:26、SEQ ID NO:80和SEQ ID NO:108的重链CDR1序列;b)选自SEQ ID NO:27、SEQ ID NO:81和SEQ ID NO:109的重链CDR2序列;c)选自SEQ ID NO:28、SEQ ID NO:82和SEQ ID NO:110的重链CDR3序列;d)选自SEQ ID NO:34、SEQ ID NO:88和SEQ ID NO:116的轻链CDR1序列;e)选自SEQ ID NO:35、SEQ ID NO:89和SEQ ID NO:117的轻链CDR2序列;以及f)选自SEQID NO:36、SEQ ID NO:90和SEQ ID NO:118的轻链CDR3序列。
在一个实施方式中,抗体包含选自由以下组成的组的至少一种:a)抗SARS-CoV-2抗体重链,其包含与选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ IDNO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQID NO:122和SEQ ID NO:128的氨基酸序列具有至少80%同一性的序列;b)抗SARS-CoV-2抗体轻链,其包含与选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ IDNO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQID NO:124和SEQ ID NO:130的氨基酸序列具有至少80%同一性的序列;c)抗SARS-CoV-2抗体重链的片段,其包含选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的全长序列的至少80%;和d)抗SARS-CoV-2抗体轻链的片段,其包含选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的全长序列的至少80%。
在一个实施方式中,抗体包含选自由以下组成的组的至少一种:a)与选自SEQ IDNO:10、SEQ ID NO:16、SEQ ID NO:22、SEQ ID NO:40、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:98、SEQ ID NO:104、SEQ ID NO:126和SEQ ID NO:132的氨基酸序列具有至少80%同一性的氨基酸序列;和b)包含选自SEQ ID NO:10、SEQ ID NO:16、SEQ ID NO:22、SEQ ID NO:40、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:98、SEQ ID NO:104、SEQ ID NO:126和SEQ ID NO:132的全长序列的至少80%的抗SARS-CoV-2抗体重链的片段。
在一个实施方式中,本发明涉及编码抗SARS-CoV-2抗体或其片段的核酸分子,其中抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。在一个实施方式中,免疫偶联物包含治疗剂或检测部分。
在一个实施方式中,该核酸分子编码选自由以下各项组成的组的抗体:人源化抗体、嵌合抗体、完全人抗体、抗体模拟物。
在一个实施方式中,核酸分子编码包含选自由以下组成的组的至少一种的抗体:a)选自SEQ ID NO:26、SEQ ID NO:80和SEQ ID NO:108的重链CDR1序列;b)选自SEQ ID NO:27、SEQ ID NO:81和SEQ ID NO:109的重链CDR2序列;c)选自SEQ ID NO:28、SEQ ID NO:82和SEQ ID NO:110的重链CDR3序列;d)选自SEQ ID NO:34、SEQ ID NO:88和SEQ ID NO:116的轻链CDR1序列;e)选自SEQ ID NO:35、SEQ ID NO:89和SEQ ID NO:117的轻链CDR2序列;以及f)选自SEQ ID NO:36、SEQ ID NO:90和SEQ ID NO:118的轻链CDR3序列。
在一个实施方式中,核酸分子编码包含选自由以下各项组成的组中的至少一种的抗体:a)抗SARS-CoV-2抗体重链,其包含与选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的氨基酸序列具有至少80%同一性的序列;b)抗SARS-CoV-2抗体轻链,其包含与选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ IDNO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的氨基酸序列具有至少80%同一性的序列;c)抗SARS-CoV-2抗体重链的片段,其包含选自SEQ ID NO:2、SEQ ID NO:6、SEQID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的全长序列的至少80%;和d)抗SARS-CoV-2抗体轻链的片段,其包含选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的全长序列的至少80%。
在一个实施方式中,核酸分子编码包含选自由以下组成的组的至少一种的抗体:a)与选自SEQ ID NO:10、SEQ ID NO:16、SEQ ID NO:22、SEQ ID NO:40、SEQ ID NO:46、SEQID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:98、SEQ ID NO:104、SEQ ID NO:126和SEQ ID NO:132的氨基酸序列具有至少80%同一性的氨基酸序列;和b)包含选自SEQ IDNO:10、SEQ ID NO:16、SEQ ID NO:22、SEQ ID NO:40、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:98、SEQ ID NO:104、SEQ ID NO:126和SEQ ID NO:132的全长序列的至少80%的抗SARS-CoV-2抗体重链的片段。
在一个实施方式中,核酸分子还包含编码切割结构域的核苷酸序列。
在一个实施方式中,核酸分子包含选自由以下组成的组中的至少一种:a)编码重链CDR1序列的选自SEQ ID NO:23、SEQ ID NO:77和SEQ ID NO:105的核苷酸序列;b)编码重链CDR2序列的选自SEQ ID NO:24、SEQ ID NO:78和SEQ ID NO:106的核苷酸序列;c)编码重链CDR3序列的选自SEQ ID NO:25、SEQ ID NO:79和SEQ ID NO:107的核苷酸序列;d)编码轻链CDR1序列的选自SEQ ID NO:31、SEQ ID NO:85和SEQ ID NO:113的核苷酸序列;e)编码轻链CDR2序列的选自SEQ ID NO:32、SEQ ID NO:86和SEQ ID NO:114的核苷酸序列;以及f)编码轻链CDR3序列的选自SEQ ID NO:33、SEQ ID NO:87和SEQ ID NO:115的核苷酸序列。
在一个实施方式中,核酸分子包含选自由以下各项组成的组的至少一个核苷酸序列:a)与选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQ ID NO:127的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体重链;b)与选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体轻链;c)包含选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ IDNO:121和SEQ ID NO:127的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体重链;和d)包含选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体轻链。
在一个实施方式中,核酸分子包含选自由以下组成的组的核苷酸序列:a)与选自SEQ ID NO:9、SEQ ID NO:15、SEQ ID NO:21、SEQ ID NO:39、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ IDNO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:97、SEQ ID NO:103、SEQ ID NO:125和SEQID NO:131的核苷酸具有至少80%同一性的核苷酸序列;和b)包含选自SEQ ID NO:9、SEQID NO:15、SEQ ID NO:21、SEQ ID NO:39、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQID NO:75、SEQ ID NO:97、SEQ ID NO:103、SEQ ID NO:125和SEQ ID NO:131的至少80%的全长序列的核苷酸序列的片段。
在一个实施方式中,核苷酸序列编码前导序列。
在一个实施方式中,该核酸分子包括表达载体。
在一个实施方式中,本发明涉及包含抗SARS-CoV-2抗体或其片段的组合物,其中抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。
在一个实施方式中,本发明涉及包含至少一种编码抗SARS-CoV-2抗体或其片段的核酸分子的组合物,其中抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。在一个实施方式中,免疫偶联物包含治疗剂或检测部分。
在一个实施方式中,组合物包含第一核酸分子和第二核酸分子,第一核酸分子包含编码抗SARS-CoV-2刺突抗原合成抗体重链的核苷酸序列;第二核酸分子包含编码抗SARS-CoV-2刺突抗原合成抗体轻链的核苷酸序列。
在一个实施方式中,第一核酸分子包含编码选自由以下各项组成的组中的至少一种的核苷酸序列:a)抗SARS-CoV-2抗体重链,其包含与选自SEQ ID NO:2、SEQ ID NO:6、SEQID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的氨基酸序列具有至少80%同一性的序列;和b)抗SARS-CoV-2抗体重链的片段,其包含选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的全长序列的至少80%;并且第二核酸分子包含编码选自由以下组成的组的至少一种的核苷酸序列:c)抗SARS-CoV-2抗体轻链,其包含与选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ IDNO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQID NO:120、SEQ ID NO:124和SEQ ID NO:130的氨基酸序列具有至少80%同一性的序列;和d)抗SARS-CoV-2抗体轻链的片段,其包含选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的全长序列的至少80%。
在一个实施方式中,第一核酸分子包含选自由以下各项组成的组的核苷酸序列:a)与选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ IDNO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQID NO:127的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体重链;和b)包含选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQ ID NO:127的全长序列的至少80%的核苷酸序列片段,其编码抗SARS-CoV-2抗体重链;并且第二核酸分子包含选自由以下各项组成的组的核苷酸序列:c)与选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体轻链;和d)包含选自SEQ IDNO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ IDNO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体轻链。
在一个实施方式中,该组合物还包括药学上可接受的赋形剂。
在一个实施方式中,该组合物还包括佐剂。
在一个实施方式中,本发明涉及预防或治疗受试者疾病的方法,该方法包括向受试者给予抗SARS-CoV-2抗体或其片段,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,b)编码抗SARS-CoV-2抗体或其片段的核酸分子,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,c)包含至少一种抗SARS-CoV-2抗体或其片段的组合物,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,或d)包含至少一种编码抗SARS-CoV-2抗体或其片段的核酸分子的组合物,其中抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。
在一个实施方式中,疾病是COVID-19。
在一个实施方式中,该方法还包括向受试者给予用于治疗COVID-19的至少一种另外的SARS-CoV-2疫苗或治疗剂。
在一个实施方式中,本发明涉及在受试者中诱导针对SARS-CoV-2的免疫应答的方法,该方法包括向该受试者给予a)抗SARS-CoV-2抗体或其片段,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,b)编码抗SARS-CoV-2抗体或其片段的核酸分子,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,c)包含至少一种抗SARS-CoV-2抗体或其片段的组合物,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,或d)包含至少一种编码抗SARS-CoV-2抗体或其片段的核酸分子的组合物,其中抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。
在一个实施方式中,本发明涉及在有此需要的受试者中诱导抗SARS-CoV-2免疫应答的方法,该方法包括给予包含编码合成抗SARS-CoV-2抗体或其片段的核酸分子的第一组合物的组合,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,以及包含编码SARS-CoV-2抗原的核酸分子的第二组合物。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含编码肽的核苷酸序列,肽包含在选自SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138和SEQ ID NO:140的氨基酸序列的全长上具有至少约90%同一性的氨基酸序列。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含编码选自SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138和SEQ ID NO:140的氨基酸序列的核苷酸序列。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含在选自SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137和SEQ ID NO:139的核酸序列的全长上具有至少约90%同一性的核苷酸序列。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含选自SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137和SEQ ID NO:139的核苷酸序列。
在一个实施方式中,给予包括电穿孔和注射中的至少一种。
在一个实施方式中,本发明涉及治疗或预防有需要的受试者免于SARS-CoV-2或与其相关的疾病或病症感染的方法,该方法包括给予第一组合物和第二组合物组合,第一组合物包含编码合成抗SARS-CoV-2抗体或其片段的核酸分子,其中抗体选自单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖基化抗体和双特异性抗体,第二组合物包含编码SARS-CoV-2抗原的核酸分子。
在一个实施方式中,疾病是COVID-19。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含编码肽的核苷酸序列,肽包含在选自SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138和SEQ ID NO:140的氨基酸序列的全长上具有至少约90%同一性的氨基酸序列。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含编码选自SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138和SEQ ID NO:140的氨基酸序列的核苷酸序列。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含在选自SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137和SEQ ID NO:139的核酸序列的全长上具有至少约90%同一性的核苷酸序列。
在一个实施方式中,编码SARS-CoV-2抗原的核酸分子包含选自SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137和SEQ ID NO:139的核苷酸序列。
在一个实施方式中,给予包括电穿孔和注射中的至少一种。
附图说明
图1描绘了使用双质粒系统表达CR3022 dMAB的图。
图2描绘了展示CR3022 dMAB的体外表达和表征的示例性实验结果。
图3描绘了示例性实验结果,证明CR3022 dMAB在体外结合SARS-CoV-2受体结合结构域(RBD)。
图4描绘了展示CR3022 dMAB的体内表达动力学的示例性实验结果。
图5描绘了示例性实验结果,证明体内产生的CR3022 dMAB与重组SARSCoV-2RBD和S1结构域结合。
图6描绘使用单质粒或双质粒系统开发SARS-CoV-2克隆以表达dMAB的图。
图7描绘了展示S309 dMAB(中和)的表达和表征的示例性实验结果。
图8描绘了展示2130、2381和2196dMAB变体的体外评估的示例性实验结果。
图9描绘了展示2130、2381和2196dMAB变体的体内表达动力学的示例性实验结果。
图10描绘了展示体内产生的2130、2381和2196dMAB的定量和结合的示例性实验结果。
图11描绘了示例性实验结果,证明来自给予dMAB的小鼠2130、2381和2196的血清库证明了SARS-CoV-2假病毒的有效中和。
图12描绘了展示2196_MOD dMAB展示体内表达和比亲本2196WT dMAB更有效的中和的示例性实验结果。
图13A至图13B描绘了mAb开发的流程图。图13A和图13B显示用SARS-CoV-2-全长刺突DNA的合成共有序列作为初免来免疫Balb/c小鼠。在两周间隔内以25μg/小鼠的剂量注射DNA,并在第二次免疫后通过SARS-CoV-2-RBD蛋白(50μg/小鼠)进行加强。收集免疫小鼠的血清,然后通过ELISA评价,检测抗SARS-CoV-2抗体的存在。在确认后,收获小鼠脾细胞,分离B淋巴细胞并用于制备杂交瘤。最后,通过间接ELISA对阳性杂交瘤克隆进行表征,并且将选择的那些进一步亚克隆和扩增用于未来的表征和分析。
图14A至图14E描绘了SARS-CoV-2-刺突全长蛋白的构建和表达。图14A显示了克隆到pCDNA3.1载体中的SARS-CoV-2全长刺突的示意图。图14B描绘了SARS-CoV-2全长刺突蛋白在C端具有Fc标签和Avi标签的哺乳动物系统中表达,并且在Bis-TrisPAGE凝胶中确认其大小。图14C描绘了它呈现出如通过HPLC示出的>95%的纯度。图14D描述使用来自SARS-CoV-2-刺突DNA疫苗接种的小鼠的免疫血清,通过ELISA验证SARS-CoV-2全长蛋白的特异性(n=4)。在所有小鼠血清样品的情况下,获得剂量依赖性结合曲线。m1至m4表示获得结合曲线的4只不同小鼠。图14E描绘了通过SDS-PAGE(12%)分析针对IgG mAb克隆(WCoVA1、WCoVA2、WCoVA3、WCoVA4、WCoVA5、WCoVA6、WCoVA7、WCoVA8、WCoVA9和WCoVA10)的重链和轻链表达的蛋白质印迹分析。
图15A至图15D描绘了SARS-CoV-2-刺突IgG mAb的表征。图15A描绘了IgG克隆与SARS-CoV-2-全长刺突和RBD的结合潜力的评估。ELISA板用重组SARS-CoV-2-全长刺突蛋白(1μg/ml)以及RBD(1μg/ml)包被,并用所示连续稀释的mAb克隆进行测试。图15B描绘了mAb克隆对SARS-CoV-2-全长刺突蛋白的血清IgG终点滴度,并且使用终点滴度ELISA测定RBD。将重组Avi-Tag蛋白用作结合对照,其中没有观察到IgG mAb克隆的结合。图15C描绘了mAb克隆通过蛋白质印迹针对SARS-CoV-2-RBD蛋白的结合特异性分析。用山羊抗小鼠IgG-IRDye CW-800二抗探测抗体。图15D描绘了SARS-CoV-2-刺突mAb及其靶标的结合动力学;SARS-CoV-2-RBD通过表面等离子体共振分析。代表相对于时间表现出与SARS-CoV-2-RBD强健结合的IgG mAb克隆的应答的传感图,显示了其相互作用的进展。
图16示出通过SPR分析IgG mAb与SARS-CoV-2-RBD蛋白的结合。结合水平条形图显示使用BiacoreT200SPR系统通过SPR分析IgG mAb与SARS-CoV-2-RBD蛋白的结合。Y轴表示在关联阶段(300s)结束时记录的参考减去的RU信号。
图17A至图17C描绘了SARS-CoV-2-刺突mAb与ACE2受体竞争SARS-CoV-2刺突蛋白结合。图17A描绘了在添加ACE2蛋白之前将SARS-CoV-2-刺突IgG mAb的连续稀释物添加至SARS-CoV-2包被的孔中。测量了ACE2与SARS-CoV-2-刺突mAb的结合,SARS-CoV-2-刺突IgGmAb针对ACE2受体与SARS-CoV-2-刺突蛋白的结合显示了竞争。图17B描绘了基于流式细胞术的受体结合抑制;显示了用SARS-CoV-2刺突染色CHO-ACE2细胞和流式细胞术分析。分析细胞的斯皮克结合(x轴)。图17C描绘了在每个象限中示出评分为阴性或阳性的细胞的百分比。
图18A至图18D描绘了SARS-CoV-2-刺突mAb针对SARS-CoV-2假病毒测定的中和功效。使用假病毒中和测定评估SARS-CoV-2-刺突IgG mAb的功能。SARS-CoV-2野生型和(图18B)D614G突变的假病毒通过以%中和表示的SARS-CoV-2IgG mAb克隆的中和功效。图18C显示柱状图中表示的SARS-CoV-2-刺突IgG mAb克隆的IC50值。图18D描绘了ELISA滴度与病毒中和滴度之间的相关性。在GraphPad Prism中进行统计分析。实验进行一次。IC50,半最大抑制浓度。
图19A至图19E描绘了SARS-CoV-2抗体的糖原学分析,揭示了与较高Fc介导的效应子功能相容的谱。图19A描绘了抗体糖基化作用的示意性结构,突出了若干单糖以及它们对Fc介导的效应子功能的已知影响。图19B至图19E描绘了在五种SARS-CoV2抗体、来自三只对照C57BL/6小鼠的大量IgG和来自人类对照样品的大量IgG(一式三份运行)的总糖组中总核心岩藻糖(图19B)、末端唾液酸(图19C)、等分的GlcNac(图19D)以及末端半乳糖(图19E)的百分比。显示了中值和四分位数间距。
图20A至图20F描述了与SARS-CoV-2-刺突蛋白对接的抗体的计算模型。图20A和图20D描绘了通过AbYmod预测的WCoVA7和WCoVA9可变区的结构。图20B和图20C描述了全长SARS-CoV-2刺突结构(PDB:6VYB)和WCoVA7抗体的对接模型。左:纸箱对接模型(绿色:全长刺突蛋白;红色:抗体可变区)。右:表面对接模型(灰色:全长刺突蛋白;红色:抗体可变区)。图20E和图20F描述了全长SARS-CoV-2刺突结构(PDB:6VYB)和WCoVA9抗体的对接模型。动画对接模型(绿色:全长刺突蛋白;红色:抗体可变区)。右:表面对接模型(灰色:全长刺突蛋白;红色:抗体可变区)。
图21A和图21B描绘了SARS-CoV-2、SARS-CoV和MERS-CoV刺突糖蛋白的比较。图21A:冠状病毒刺突蛋白(包括具有突变的11种SARS-CoV-2序列(GISAID))的氨基酸比对。灰色条表示相同的氨基酸并且彩色条表示相对于Wuhan-Hu-1的突变。RBD、切割位点、融合肽以及跨膜结构域以红色指示。图21B:SARS-CoV-2、SARS和MERS糖蛋白的结构模型,其中一条链表示为动画,两条链表示为表面。SARS-CoV-2的RBD是黄色的。
图22A至图22D描绘了COVID-19合成DNA疫苗构建体的设计和表达。图22A:COVID-19合成DNA疫苗构建体的示意图,pGX9501(匹配的)和pGX9503(离群值(OL)),含有IgE前导序列和SARS-CoV-2刺突蛋白插入片段。图22B:来自用pGX9501和pGX9503转染的COS-7细胞的RNA提取物的RT-PCR测定。使用RT-PCR,使用针对每种靶标和针对作为内部表达标准化基因使用的COS-7β-肌动蛋白mRNA设计的PCR测定来分析提取的RNA。对于每个转染浓度,ΔCT(ΔCT)被计算为靶标的CT减去β-肌动蛋白的CT,并且针对pDNA转染的质量的对数绘图。图22C:通过蛋白质印迹法用pGX9501、pGX9503或MOCK质粒转染293T细胞之后刺突蛋白的体外表达的分析。将293T细胞裂解物在凝胶上分辨并用多克隆抗SARS刺突蛋白探测。剥离印迹,然后用抗β-肌动蛋白上样对照探测。图22D:用3μg/孔的pGX9501、pGX9503或pVax(空对照载体)转染的293T细胞的体外免疫荧光染色。用多克隆抗SARS刺突蛋白IgG和抗IgG二级(绿色)测量刺突蛋白的表达。将细胞核用DAPI(蓝色)复染色。使用ImageXpress Pico自动细胞成像系统捕获图像。
图23显示了使用来自INO-4800处理小鼠的血清的一组SARS-CoV-2和SARS-CoV抗原的IgG结合筛选。在第0天用25μg INO-4800或pVAX-空载体(对照)免疫BALB/c小鼠,如方法中所述。在第14天,来自小鼠的1:50和1:250血清稀释度的IgG的蛋白质抗原结合。显示的数据表示每组4只小鼠的平均OD450nm值(平均值+SD)。
图24A至图24D描绘了BALB/c小鼠中在单剂量的INO-4800后对SARS-CoV-2S1+2和SRBD蛋白抗原的体液应答,在第0天用指定剂量的INO-4800或pVAX-空载体免疫BALB/c小鼠,如方法中所述。(图4A)第14天来自小鼠的连续血清稀释物中的IgG的SARS-CoV-2S1+2或(图4C)SARS-CoV-2RBD蛋白抗原结合。所示的数据表示每组8只小鼠(图24A和图24B)和5只小鼠(图24C和图24D)的平均OD450nm值(平均值+SD)。对(图24B)SARS-CoV-2S1+2和(图24D)SARS-CoV-2RBD蛋白的血清IgG结合终点效价。代表2个独立实验的数据。
图25A至图25C描绘了来自INO-4800免疫小鼠的血清IgG与ACE2受体竞争SARS-CoV-2刺突蛋白结合。图25A:可溶性ACE2受体以0.025μg/ml的EC50结合CoV-2全长刺突。图25B:在用INO-4800进行第二次免疫之后来自BALB/c小鼠的纯化的血清IgG产生了针对ACE2受体的显著竞争。将来自动物的血清IgG样品一式三份运行。图25C:在用INO-4800第二次免疫后第14天从n=5只小鼠中纯化的IgG显示出针对ACE2受体结合SARS-CoV-2S1+2蛋白的显著竞争。用于竞争测定的可溶性ACE2浓度是约0.1μg/ml。
图26描绘了用INO-4800的第二次免疫后第14天从n=5只小鼠中纯化的IgG与汇集的天然小鼠IgG相比显示出针对ACE2受体结合SARS-CoV-2刺突蛋白的竞争。在单柱中运行初次接受实验的小鼠(mice)。一式两份运行接种疫苗的小鼠。如果错误条不可见,则错误小于数据点。
图27A和图27B描绘了在单次剂量的INO-4800之后在哈特利豚鼠中对SARS-CoV-2的体液应答。如第0天用100μg INO-4800或pVAX-空载体免疫Hart1ey豚鼠小鼠,如在这些方法中所述。图27A:在第0天和第14天,连续血清稀释物中IgG的SARS-CoV-2S蛋白抗原结合。显示的数据表示5只豚鼠的平均OD450nm值(平均值+SD)。图27B:第14天对SARS-CoV-2S蛋白的血清IgG结合效价(平均值±SD)。P=0.0079,Mann-Whitney检验。
图28A和图28B描绘了来自INO-4800免疫的豚鼠的血清介导ACE-2与SARS-CoV-2S蛋白的结合的抑制。如方法中所述,在第0和14天用100μg INO-4800或pVAX-空载体免疫Hart1ey豚鼠。图28A:第28天采集的血清(1:20稀释)加入SARS-CoV-2包被的孔,然后加入ACE-2蛋白的系列稀释液。测量ACE-2与SARS-CoV-2S蛋白结合的检测。在本实验中使用采集自5只INO-4800处理和3只pVAX处理的动物的血清。图28B:在第21天采集的豚鼠血清的连续稀释液在加入ACE-2蛋白之前加入到SARS-CoV-2包被的孔中。测量ACE-2与SARS-CoV-2S蛋白结合的检测。在本实验中使用从4只INO-4800处理和5只pVAX处理的豚鼠采集的血清。
图29A至图29D描述了在INO-4800免疫动物的BAL中检测SARS-CoV-2S蛋白反应性抗体。在第0天和第14天用INO-4800或在第21天采集的pVAX和BAL免疫BALB/c小鼠(图29A和图29B)。在第0、14和21天,用在第42天采集的INO-4800或pVAX和BAL免疫Hart1ey豚鼠(图29C和图29D)。通过ELISA测定支气管肺泡灌洗液中SARS-CoV-2刺突蛋白特异性抗体。数据呈现为终点滴度(图29A和图29C)和具有原始OD450nm值的BAL稀释曲线(图29B和图29D)。(图29A和图29C)条表示每个组的平均值,并且误差条表示标准偏差。**p<0.01,通过Mann-Whitney U检验。数据表示n=5/组的每个种类的一个实验
图30A至图30C描绘了在给予INO-4800之后在BALB/c小鼠中T细胞应答的快速诱导。BALB/c小鼠(n=5/组)用2.5或10μg INO-4800免疫。在图30A和图30B的第4天、第7天、第10天以及图30C的第14天分析动物中的T细胞应答。在用跨越SARS-CoV-2(图30A)、SARS-CoV(图30B)或MERS-CoV(图30C)刺突蛋白的重叠肽池刺激20小时的脾细胞中,通过IFN-γELISpot测量T细胞应答。条表示平均值+SD。
图31A至图31F描绘了在用SARS-CoV-2和SARS抗原刺激后IFN-γ+小鼠脾细胞的ELISpot图像。在第0天对小鼠进行免疫并且在指定的时间点收获脾细胞。通过ELISpot测定对免疫动物的脾中的IFNγ分泌细胞计数。代表性图像显示在免疫后第4、7和10天,脾细胞群体中SARS-CoV-2特异性(图31A至图31C)和SARS-CoV-特异性(图31D至图31F)IFNγ斑点形成单位。通过ImmunoSpot CTL读取器捕获图像。
图32A和图32B描绘了SARS-CoV-2S蛋白刺激时产生IFN-γ的T细胞群的流式细胞术分析。将pVAX或INO-4800处理14天后从BALB/c和C57BL/6小鼠收获的脾细胞制成单细胞悬浮液。用SARS-CoV-2重叠肽库刺激细胞6小时。图32A:CD4+和CD8+T细胞门控策略;在(i)上门控单峰,然后在淋巴细胞(ii)上门控单峰,随后是活CD45+细胞(iii)。接下来,对CD3+细胞进行门控(iv),并且对来自该群体的CD4+(v)和CD8+(vi)T细胞进行门控。从CD4+(vii)和CD8+(viii)T细胞群体中的每一个门控IFNγ+细胞。图32B:描绘了产生IFNγ的CD4+和CD8+T细胞的百分比。条表示平均值+SD。在这项研究中使用4只BALB/c和4只C57BL/6小鼠。*p<0.05,Mann Whitney检验。
图33A和图33B描绘了在向BALB/c小鼠给予INO-4800之后的T细胞表位作图。用SARS-CoV-2肽基质池刺激脾细胞20小时。图33A:用基质作图SARS-CoV-2肽库刺激后的T细胞应答。条表示平均值+SD。图33B:SARS-CoV-2刺突蛋白的图谱和BALB/c小鼠中免疫显性肽的鉴定。包括已知的免疫显性SARS-CoVHLA-A2表位用于比较。
具体实施方式
本发明涉及包含编码抗体、其片段、其变体或其组合的重组核酸序列的组合物。可以将该组合物给予对其有需要的受试者以促进合成抗体的体内表达和形成。
特别地,从重组核酸序列表达的重链和轻链多肽可以组装成合成抗体。重链多肽和轻链多肽可以彼此相互作用,使得组装导致合成抗体能够结合抗原,与未如本文所述组装的抗体相比更具免疫原性,并且能够引发或诱导针对抗原的免疫应答。
此外,这些合成抗体在受试者中比响应于抗原诱导的免疫应答而产生的抗体更快速地产生。合成抗体能够有效地结合和中和一系列抗原。合成抗体还能够有效地保护免于和/或促进疾病的存活。
1.定义
除非另有定义,否则本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同的含义。在冲突的情况下,将以包括定义的本发明为准。下文描述了优选的方法和材料,尽管与本文描述的那些类似或等同的方法和材料可以用于本发明的实践或测试。在此提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全部内容结合在此。本文公开的材料、方法和实施例仅是说明性的并且不旨在是限制性的。
如本文所使用的,术语“包含”、“包括”、“具有”、“具有”、“可以”、“含有”及其变体旨在是开放式过渡短语、术语或单词,其并不排除另外的行为或结构的可能性。除非上下文另有明确规定,否则单数形式“一个”、“一种”和“该”包括复数指代。本披露还考虑了其他实施例“包含”、“由……组成”和“基本上由……组成”,无论是否明确地陈述,在此呈现的这些实施例或元件。
“抗体”可以指IgG、IgM、IgA、IgD或IgE类的抗体,或其片段、片段或衍生物,包括Fab、F(ab’)2、Fd,和单链抗体及其衍生物。抗体可以是分离自哺乳动物血清样品的抗体、多克隆抗体、亲和纯化的抗体或它们的混合物,其表现出对期望的表位或源自其的序列的足够的结合特异性。
如在此可互换使用的“抗体片段”或“抗体的片段”是指包含抗原结合位点或可变区的完整抗体的一部分。该部分不包括恒定的重链结构域(即CH2、CH3或CH4,取决于抗体同种型)的完整抗体的Fc区。抗体片段的实施例包括但不限于Fab片段、Fab’片段、Fab’-SH片段、F(ab’)2片段、Fd片段、Fv片段、双抗体、单链Fv(scFv)分子、仅包含一个轻链可变域的单链多肽、包含轻链可变域的三个CDR的单链多肽、仅包含一个重链可变区的单链多肽以及包含重链可变区的三个CDR的单链多肽。
“抗原”是指具有在宿主中产生免疫应答的能力的蛋白质。抗原可被抗体识别和结合。抗原可以起源于体内或起源于外部环境。
如在此使用,“编码序列”或“编码核酸”可以指包含编码如在此所阐明的抗体的核苷酸序列的核酸(RNA或DNA分子)。编码序列还可以包含编码RNA序列的DNA序列。该编码序列可以还包括可操作地连接至调节元件的起始和终止信号,这些调节元件包括能够指导在给予该核酸的受试者或哺乳动物的细胞中表达的启动子和聚腺苷酸化信号。编码序列可以还包括编码信号肽的序列。
如在此使用,“补体”或“互补的”可以指核酸可以指核酸分子的核苷酸或核苷酸类似物之间的沃森-克里克(Watson-Crick)(例如,A-T/U和C-G)或Hoogsteen碱基配对。
如在本文中使用的,“恒定电流”限定在递送至相同组织的电脉冲的持续时间内由组织或限定所述组织的细胞接收或经历的电流。电脉冲从本文所述的电穿孔装置递送。该电流在电脉冲的寿命期间在所述组织中保持在恒定的安培数处,因为在此提供的电穿孔装置具有反馈元件,优选地具有瞬时反馈。反馈元件可在脉冲的整个持续时间内测量组织(或细胞)的电阻,并且导致电穿孔装置改变其电能输出(例如,增加电压),使得在同一组织中的电流在整个电脉冲(微秒级)内并且在脉冲与脉冲之间保持恒定。在一些实施方式中,该反馈元件包括控制器。
如在本文中使用的,“电流反馈”或“反馈”可以互换地使用并且可以意指所提供的电穿孔装置的主动响应,该主动响应包括测量电极之间的组织中的电流并且相应地改变由EP装置递送的能量输出以便将电流维持在恒定水平。该恒定电平由使用者在启动脉冲序列或电治疗之前预设。该反馈可以通过电穿孔装置的电穿孔部件(例如,控制器)来完成,因为其中的电路能够连续地监测电极之间的组织中的电流并且将该监测的电流(或组织中的电流)与预设电流进行比较并且连续地进行能量输出调整以将该监测的电流维持在预设水平。反馈回路可以是瞬时的,因为它是模拟闭环反馈。
如在本文中使用的,“分散电流”可以指从在此描述的电穿孔装置的不同针状电极阵列递送的电流的模式,其中这些图案最小化或优选地消除电穿孔相关的热胁迫在正在电穿孔的组织的任何区域上的发生。
如在此可互换使用的“电穿孔”、“电透化”或“电动增强”(“EP”)可以指使用跨膜电场脉冲来诱导生物膜中的显微途径(孔);它们的存在允许生物分子如质粒、寡核苷酸、siRNA、药物、离子和水从细胞膜的一侧传递到另一侧。
如在此使用,“内源抗体”可以指在受试者中产生的抗体,该受试者被给予有效剂量的用于诱导体液免疫应答的抗原。
如在本文中使用的,“反馈机制”可以指代由软件或硬件(或固件)执行的过程,该过程接收所希望的组织的阻抗并且将其(在传递能量脉冲之前、过程中、和/或之后)与当前值(优选地是电流)进行比较,并且调整所传递的能量脉冲以实现预设值。反馈机制可由模拟闭环电路执行。
“片段”可以意指抗体的多肽片段,该多肽片段起作用,即,可以结合至所希望的靶标并且具有与全长抗体相同的预期效果。抗体的片段可以与全长100%一致,除了从N端和/或C端缺失至少氨基酸,在每种情况中在位置1处有或没有信号肽和/或甲硫氨酸。片段可以包含特定全长抗体的长度的20%或更多、25%或更多、30%或更多、35%或更多、40%或更多、45%或更多、50%或更多、55%或更多、60%或更多、65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、99%或更多%(不包括添加的任何异源信号肽)。片段可以包含与抗体具有95%或更多、96%或更多、97%或更多、98%或更多或99%或更多同一性的多肽的片段,并且另外地包含当计算百分比同一性时不包括的N末端甲硫氨酸或异源信号肽。片段可以还包含N端甲硫氨酸和/或信号肽,如免疫球蛋白信号肽,例如IgE或IgG信号肽。N端甲硫氨酸和/或信号肽可以连接至抗体的片段。
编码抗体的核酸序列的片段可以与全长100%相同,除了从5’和/或3’端缺失至少一个核苷酸,在每种情况下具有或不具有在位置1处编码信号肽和/或甲硫氨酸的序列。片段可以包含特定全长编码序列的长度的20%或更多、25%或更多、30%或更多、35%或更多、40%或更多、45%或更多、50%或更多、55%或更多、60%或更多、65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、99%或更多%(不包括添加的任何异源信号肽)。片段可以包含编码与抗体具有95%或更多、96%或更多、97%或更多、98%或更多或99%或更多同一性的多肽的片段,并且另外任选地包含编码当计算百分比同一性时不包括的N末端甲硫氨酸或异源信号肽的序列。片段可以还包含N端甲硫氨酸和/或信号肽(如免疫球蛋白信号肽,例如IgE或IgG信号肽)的编码序列。编码N端甲硫氨酸和/或信号肽的编码序列可以连接至编码序列的片段。
如在本文中使用的,“遗传构建体”是指包含编码蛋白质(如抗体)的核苷酸序列的DNA或RNA分子。遗传构建体还可以指转录RNA的DNA分子。该编码序列包括可操作地连接至调节元件的起始和终止信号,这些调节元件包括能够指导在给予该核酸分子的受试者的细胞中表达的启动子和多腺苷酸化信号。如在此所使用,术语“可表达形式”是指基因构建体,这些基因构建体含有可操作地连接至编码蛋白质的编码序列上的必要调节元件,这样使得当存在于受试者的细胞中时,该编码序列将被表达。
如在本文中使用的,在两个或更多个核酸或多肽序列的背景下,“一致的”或“同一性”可以意指这些序列具有在指定区域上相同的指定百分比的残基。所述百分比可通过如下计算:最佳地比对两个序列,比较指定区域上的两个序列,确定两个序列中出现相同残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以指定区域中的位置的总数,并将结果乘以100以产生序列同一性的百分比。在两个序列具有不同长度或比对产生一个或多个交错末端且指定的比较区仅包含单个序列的情况下,单个序列的残基包含在计算的分母中而不包含分子。当比较DNA和RNA时,胸腺嘧啶(T)和尿嘧啶(U)可以被认为是等效的。同一性可以手动地或通过使用计算机序列算法(如BLAST或BLAST2.0)来进行。
当讨论反馈机制时,可以使用如本文中使用的“阻抗”,并且可以根据欧姆定律(Ohm’slaw)将其转换为电流值,从而能够与预设电流进行比较。
如在本文中使用的,“免疫应答”可以意指响应于一种或多种核酸和/或肽的引入而激活宿主的免疫系统,例如哺乳动物的免疫系统。免疫应答可以处于一种细胞或体液应答或两者的形式。
如在本文中使用的,“核酸”或“寡核苷酸”或“多核苷酸”可以指共价连接在一起的至少两个核苷酸。单链的描绘还限定了互补链的序列。因此,核酸还包括描绘的单链的互补链。核酸的许多变体可以用于与给定核酸相同的目的。因此,核酸还包括基本上相同的核酸及其互补物。单链提供可以在严格杂交条件下与靶序列杂交的探针。因此,核酸也包括在严格杂交条件下杂交的探针。
核酸可以是单链或双链的,或可以含有双链和单链序列两者的部分。核酸可以是基因组和cDNA的DNA、RNA或杂合体,其中核酸可以包含脱氧核糖和核糖核苷酸的组合,以及碱基的组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤次黄嘌呤、异胞嘧啶和异鸟嘌呤。核酸可以通过化学合成方法或通过重组方法获得。
如在本文中使用的,“可操作地连接”可以指基因的表达处于与其空间连接的启动子的控制下。启动子可以位于受其控制的基因的5’(上游)或3’(下游)。启动子与基因之间的距离可以与该启动子与其在衍生该启动子的基因中所控制的基因之间的距离大致相同。如本领域中已知的,可以在不损失启动子功能的情况下适应这个距离的变化。
如在此使用,“肽”、“蛋白质”或“多肽”可以意指连接的氨基酸序列并且可以是天然的、合成的或天然的和合成的修饰或组合。
如在此使用,“启动子”可以指合成的或天然衍生的分子,该分子能够赋予、激活或增强核酸在细胞中的表达。启动子可以包含一个或多个特异性转录调节序列,以进一步增强其表达和/或改变其表达的空间和/或时间。启动子还可包含远端增强子或阻遏子元件,其可位于距转录起始位点多达数千个碱基对处。启动子可以来源于包括病毒、细菌、真菌、植物、昆虫和动物的来源。启动子可以相对于细胞、其中发生表达的组织或器官,或相对于发生表达的发育阶段,或响应于外部刺激如生理应激、病原体、金属离子或诱导剂,组成性地或差异性地调节基因组分的表达。启动子的代表性实施例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵基因启动子、RSV-LTR启动子、tac启动子、SV40早期启动子或SV40晚期启动子以及CMVIE启动子。
如在本文中使用的,“样品”或“生物样品”是指从受试者分离的生物材料。该生物样品可以包含适合于检测所希望的生物标志物的任何生物材料,并且可以包括从该受试者获得的细胞和/或非细胞材料。
“信号肽”和“前导序列”在本文中可互换使用,并且是指可以连接在本文中阐述的蛋白质的氨基末端的氨基酸序列。信号肽/前导序列通常指导蛋白质的定位。在此使用的信号肽/前导序列优选地促进蛋白质从产生该信号肽/前导序列的细胞中的分泌。信号肽/前导序列通常在从细胞分泌时从蛋白质的剩余部分(通常被称为成熟蛋白质)切割。信号肽/前导序列在蛋白质的N末端连接。
如在本文中使用的,“严格杂交条件”可以指第一核酸序列(例如,探针)将与第二核酸序列(例如,靶标)杂交的条件,如在核酸的复杂混合物中。严格条件是序列依赖性的,并且将在不同环境下不同。严格条件可以被选择为比特定序列在限定的离子强度pH下的热熔点(Tm)低约5℃-10℃。Tm可以是50%的与靶互补的探针在平衡时与靶序列杂交的温度(在限定的离子强度、pH和核酸浓度下)(因为靶序列过量存在,在Tm时,50%的探针在平衡时被占据)。严格条件可以是其中盐浓度小于约1.0M钠离子,例如在pH7.0至8.3下约0.01-1.0M钠离子浓度(或其他盐)并且对于短探针(例如,约10-50个核苷酸)温度是至少约30℃并且对于长探针(例如,大于约50个核苷酸)温度是至少约60℃的那些。严格条件也可以通过添加去稳定剂如甲酰胺来实现。对于选择性或特异性杂交,阳性信号可以是背景杂交的至少2至10倍。示例性严格杂交条件包括以下各项:50%甲酰胺、5×SSC和1%SDS,在42℃下孵育,或5×SSC、1%SDS,在65℃下孵育,在0.2×SSC和0.1%SDS中在65℃下洗涤。
如在本文中互换使用的,“受试者”和“患者”是指任何脊椎动物,包括但不限于哺乳动物(例如,牛、猪、骆驼、美洲驼、马、山羊、兔、绵羊、仓鼠、豚鼠、猫、狗、大鼠和小鼠、非人灵长类动物(例如,猴,如食蟹猴或恒河猴、黑猩猩等)和人)。在一些实施方式中,该受试者可以是人或非人。受试者或患者可经历其他形式的治疗。
如在本文中使用的,“基本上互补的”可以指第一序列是在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个核苷酸或氨基酸的区域上与第二序列的互补序列至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致,或者两个序列在严格杂交条件下杂交。
如在本文中使用的,“基本相同”可以指第一和第二序列是在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600,700、800、900、1000、1100或更多个核苷酸或氨基酸的区域上的,或相对于核酸,至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,如果第一序列与第二序列的互补序列基本上互补。
如在本文中使用的,“合成抗体”是指由在此描述的重组核酸序列编码并且在受试者中产生的抗体。
如在本文中使用的,“治疗(treatment)”或“处置(treating)”可以意指通过预防、压制、阻遏或完全消除受试者的疾病来保护该疾病免于该疾病。预防疾病涉及在疾病发作之前向受试者给予本发明的疫苗。抑制所述疾病涉及在诱导所述疾病之后但在其临床出现之前向受试者给予本发明的疫苗。抑制该疾病涉及在疾病的临床出现之后向受试者给予本发明的疫苗。
相对于核酸,在此使用的“变体”可以指(i)参考核苷酸序列的一部分或片段;(ii)参考核苷酸序列的互补序列或其部分;(iii)与参照核酸或其互补物基本上相同的核酸;或(iv)在严格条件下与参照核酸、其互补体或与其基本上相同的序列杂交的核酸。
就氨基酸序列因氨基酸的插入、缺失或保守取代而不同但保留至少一种生物活性的肽或多肽而言,“变体”。变体还可以意指具有与参考蛋白质基本上相同的氨基酸序列的蛋白质,所述参考蛋白质具有保留至少一种生物活性的氨基酸序列。氨基酸的保守取代,即,用具有类似特性(例如,亲水性、带电区域的程度和分布)的不同氨基酸替换氨基酸,在本领域中被认为是典型地涉及微小变化。这些微小的改变可以部分地通过考虑氨基酸的亲水指数来鉴定,如本领域所理解的。Kyte et al.,J.Mol.Biol.157:105-132(1982)。氨基酸的亲水指数是基于其疏水性和电荷的考虑。本领域已知类似亲水指数的氨基酸可以取代并仍保留蛋白质功能。在一个方面,具有±2亲水指数的氨基酸被取代。氨基酸的亲水性还可以用于揭示将导致蛋白质保留生物功能的取代。在肽的背景下考虑氨基酸的亲水性允许计算该肽的最大局部平均亲水性,这是已经报道与抗原性和免疫原性良好相关的有用量度。美国专利号4,554,101,其通过引用完全并入本文。如本领域所理解的,具有相似亲水性值的氨基酸的取代可以导致肽保留生物活性,例如免疫原性。取代可以用亲水性值在彼此±2内的氨基酸进行。氨基酸的疏水性指数和亲水性值都受该氨基酸的特定侧链的影响。与该观察一致,与生物功能相容的氨基酸取代应理解为取决于氨基酸的相对相似性,并且特别是那些氨基酸的侧链,如通过疏水性、亲水性、电荷、大小和其他特性所揭示。
变体可以是在全基因序列或其片段的全长上基本上相同的核酸序列。核酸序列在基因序列或其片段的全长上可以是80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的。变体可以是在氨基酸序列或其片段的全长上基本上相同的氨基酸序列。氨基酸序列在氨基酸序列或其片段的全长上可以是80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的。
本文中使用的“载体”可以指含有复制起点的核酸序列。载体可以是质粒、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自复制的染色体外载体或整合到宿主基因组中的载体。
对于本文中的数值范围的叙述,明确地考虑了其间具有相同精确度的每个中间数字。例如,对于6-9的范围,除了6和9之外,还考虑了数字7和8,并且对于6.0-7.0的范围,明确考虑了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、和7.0。
2.组合物
在一些实施方式中,本发明提供结合SARS-CoV-2抗原的组合物,包括但不限于SARS-CoV-2刺突蛋白。在一些实施方式中,结合SARS-CoV-2刺突蛋白的组合物是抗体。
本发明涉及编码人抗SARS-CoV-2单克隆抗体序列的合成DNA质粒的设计和开发,作为SARS-CoV-2感染或COVID-19的免疫疗法的新方法。用该抗SARS-CoV-2-dMAB单次接种在接种动物的血清中数周产生功能性抗SARS-CoV-2活性。抗SARS-CoV-2dMAB可作为SARS-CoV-2感染或COVID-19的免疫预防策略。
本发明涉及包含编码抗体、其片段、其变体或其组合的重组核酸序列的组合物。当给予有需要的受试者时,该组合物可以导致在该受试者中产生合成抗体。合成抗体可以结合受试者中存在的靶分子(即,抗原)。这种结合可以中和抗原,通过另一种分子例如蛋白质或核酸阻断抗原的识别,并且引发或诱导对抗原的免疫应答。
在一个实施方式中,该组合物包含编码合成抗体的核苷酸序列。在一个实施方式中,该组合物包含核酸分子,该核酸分子包含编码第一合成抗体的第一核苷酸序列和编码第二合成抗体的第二核苷酸序列。在一个实施方式中,核酸分子包含编码切割结构域的核苷酸序列。
在一个实施方式中,核酸分子包含编码SARS-CoV-2病毒(抗SARS-CoV-2)受体结合结构域(RBD)或刺突蛋白的抗体的核苷酸序列。
在一个实施方式中,核酸分子包含编码抗SARS-CoV-2抗体的可变重链区的核苷酸序列和编码抗SARS-CoV-2抗体的可变轻链区的核苷酸序列。
在一个实施方式中,本发明提供了组合物,其包含含有编码抗SARS-CoV-2抗体可变重链区的核苷酸序列的第一核酸分子和含有编码抗SARS-CoV-2抗体可变轻链区的核苷酸序列的第二核酸分子。
在某些实施方式中,本发明的抗体(包括SARS-CoV-2刺突蛋白片段)包括在此披露的由任何适合的多核苷酸编码的抗体氨基酸序列,或任何分离或配制的抗体。此外,本发明的抗体包含具有本文所述的抗SARS-CoV-2刺突蛋白抗体的结构和/或功能特征的抗体。在一个实施方式中,抗SARS-CoV-2刺突蛋白抗体结合SARS-CoV-2刺突蛋白,从而部分或完全改变SARS-CoV-2刺突蛋白的至少一种生物活性(例如受体结合活性)。
在一个实施方式中,本发明的抗SARS-CoV-2刺突蛋白抗体免疫特异性结合SARS-CoV-2刺突蛋白特异性的至少一个特定表位,而不特异性结合其他多肽。该至少一个表位可包含至少一个抗体结合区,其包含SARS-CoV-2刺突蛋白的至少一部分。如在本文中使用的,术语“表位”是指能够结合到抗体上的蛋白质决定子。表位通常由分子如氨基酸或糖侧链的化学活性表面基团组成,并且通常具有特定的三维结构特征以及特定的电荷特征。构象表位和非构象表位的区别在于在变性溶剂存在下失去与前者而不是后者的结合。
在一些实施方式中,本发明包括含有与SARS-CoV-2刺突蛋白(例如抗体的结合部分)特异性结合的抗体。在一个实施方式中,抗SARS-CoV-2刺突蛋白抗体是多克隆抗体。在另外的实施方式中,抗SARS-CoV-2刺突蛋白抗体是单克隆抗体。在一些实施方式中,抗SARS-CoV-2刺突蛋白抗体是嵌合抗体。在另外的实施方式中,抗SARS-CoV-2刺突蛋白抗体是人源化抗体。
抗体的结合部分包含保留特异性结合至结合伴侣分子(例如SARS-CoV-2刺突蛋白)的能力的抗体的一个或多个片段。已经显示,抗体的结合功能可以由全长抗体的片段进行。涵盖在术语抗体的“结合部分”内的结合片段的实施例包括(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包含在铰链区通过二硫键连接的两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的Fd片段;(iv)由抗体单臂的VL和VH结构域组成的Fv片段,(v)由VH结构域组成的dAb片段(Ward et al.,(1989)Nature 341:544-546);和(vi)分离的互补决定区(CDR)。此外,尽管Fv片段的两个结构域VL和VH由单独的基因编码,但是可以使用重组方法通过合成接头将它们连接,该合成接头使得它们能够被制成单蛋白链,其中VL和VH区配对形成单价分子(称为单链Fv(scFv);参见例如Bird et al.(1988)Science 242:423-426;和Huston etal.(1988)Proc.Natl.Acad.Sci.USA 85:5879-5883)。此类单链抗体还旨在被涵盖在术语抗体的“结合部分”内。使用本领域技术人员已知的常规技术获得这些抗体片段,并且以与完整抗体相同的方式筛选所述片段的效用。可以通过重组DNA技术,或通过完整免疫球蛋白的酶促或化学切割来产生结合部分。
与本发明的SARS-CoV-2刺突蛋白结合的抗体是在体外、原位和/或体内抑制、阻断或干扰至少一种SARS-CoV-2刺突蛋白活性(例如受体结合活性)的抗体。
在一个实施方式中,SARS-CoV-2抗体包含含有如SEQ ID NO:2、SEQ ID NO:6、SEQID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQID NO:100、SEQ ID NO:112、SEQ ID NO:122或SEQ ID NO:128所示氨基酸序列的重链。在一个实施方式中,SARS-CoV-2抗体包含含有如SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124或SEQ ID NO:130所示的氨基酸序列的轻链。
鉴于某些单克隆抗体可以结合SARS-CoV-2刺突蛋白,可以将VH和VL序列“混合并匹配”以产生本披露的其他抗SARS-CoV-2刺突蛋白结合分子。可以使用本领域已知的标准结合测定(例如,免疫印迹等)测试此类“混合和匹配”抗体的结合。在一些实施方式中,当VH链和VL链混合并匹配时,来自特定VH/VL配对的VH序列被结构类似的VH序列替换。同样地,优选地,将来自特定VH/VL配对的VL序列替换为结构上相似的VL序列。
因此,在一个方面,本公开提供了一种分离的单克隆抗体或其结合部分,其包括:(a)重链可变区,其包含选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122或SEQ ID NO:128的氨基酸序列;以及(b)轻链可变区,其包含选自SEQ IDNO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ IDNO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124或SEQ ID NO:130的氨基酸序列,其中抗体特异性结合SARS-CoV-2刺突蛋白。
在一些实施方式中,重链和轻链组合包括:(a)重链可变区,包含氨基酸序列SEQID NO:2,以及轻链可变区,包含氨基酸序列SEQ ID NO:4;(b)重链可变区,包含氨基酸序列SEQ ID NO:6,以及轻链可变区,包含氨基酸序列SEQ ID NO:8;(c)重链可变区,包含氨基酸序列SEQ ID NO:12和轻链可变区,包含氨基酸序列SEQ ID NO:14;(d)重链可变区,包含氨基酸序列SEQ ID NO:18,以及轻链可变区,包含氨基酸序列SEQ ID NO:20;(e)重链可变区,包含氨基酸序列SEQ ID NO:30;以及轻链可变区,包含氨基酸序列SEQ ID NO:38;(f)重链可变区,包含氨基酸序列SEQ ID NO:42,以及轻链可变区,包含氨基酸序列SEQ ID NO:44;(g)重链可变区,包含氨基酸序列SEQ ID NO:84;以及轻链可变区,包含氨基酸序列SEQ IDNO:92;(h)重链可变区,包含氨基酸序列SEQ ID NO:94;以及轻链可变区,包含氨基酸序列SEQ ID NO:96;(i)重链可变区,包含氨基酸序列SEQ ID NO:100以及轻链可变区,包含氨基酸序列SEQ ID NO:102;(j)重链可变区,包含氨基酸序列SEQ ID NO:112;以及轻链可变区,包含氨基酸序列SEQ ID NO:120;(k)重链可变区,包含氨基酸序列SEQ ID NO:122;以及轻链可变区,包含氨基酸序列SEQ ID NO:124;或(l)重链可变区,包含氨基酸序列SEQ ID NO:128,和轻链可变区,包含氨基酸序列SEQ ID NO:130。
鉴于这些抗体各自可结合SARS-CoV-2刺突蛋白并且结合特异性主要由CDR1、CDR2和CDR3区提供,VHCDR1、CDR2和CDR3序列以及VLCDR1、CDR2和CDR3序列可“混合并匹配”以产生本披露的其他抗SARS-CoV-2刺突蛋白结合分子。可以使用本领域已知的标准结合测定(例如,免疫印迹)测试此类“混合和匹配”抗体的SARS-CoV-2刺突蛋白结合。优选地,当混合和匹配VHCDR序列时,来自特定VH序列的CDR1、CDR2和/或CDR3序列被结构相似的CDR序列替换。同样地,当混合和匹配VLCDR序列时,来自特定VL序列的CDR1、CDR2和/或CDR3序列优选用结构上相似的CDR序列替换。普通技术人员将容易清楚的是,通过用来自在此披露的CDR序列的结构上相似的序列取代一个或多个VH和/或VLCDR区序列,可以产生新的VH和VL序列。
因此,在另一个方面,本发明提供了分离的单克隆抗体或其结合部分,其包含选自由以下各项组成的组的至少一个:(a)重链可变区CDRl,包含氨基酸序列SEQ ID NO:26、SEQID NO:80或SEQ ID NO:108;(b)重链可变区CDR2,包含氨基酸序列SEQ ID NO:27、SEQ IDNO:81或SEQ ID NO:109;(c)重链可变区CDR3,包含氨基酸序列SEQ ID NO:28、SEQ ID NO:82或SEQ ID NO:110;(d)轻链可变区CDRl,包含氨基酸序列SEQ ID NO:34、SEQ ID NO:88或SEQ ID NO:116;(e)轻链可变区CDR2,包含氨基酸序列SEQ ID NO:35、SEQ ID NO:89或SEQID NO:117;以及(f)轻链可变区CDR3,包含氨基酸序列SEQ ID NO:36、SEQ ID NO:90或SEQID NO:118;其中,抗体特异性结合SARS-CoV-2刺突蛋白。
在另外的实施方式中,抗体包含(a)重链可变区CDRl,包含SEQ ID NO:26;(b)重链可变区CDR2,包含SEQ ID NO:27;(c)重链可变区CDR3,包含SEQ ID NO:28;(d)轻链可变区CDRl,包含SEQ ID NO:34;(e)轻链可变区CDR2,包含SEQ ID NO:35以及(f)轻链可变区CDR3,包含SEQ ID NO:36。
在另外的实施方式中,抗体包含(a)重链可变区CDRl,包含SEQ ID NO:80;(b)重链可变区CDR2,包含SEQ ID NO:81;(c)重链可变区CDR3,包含SEQ ID NO:82;(d)轻链可变区CDRl,包含SEQ ID NO:88;(e)轻链可变区CDR2,包含SEQ ID NO:89以及(f)轻链可变区CDR3,包含SEQ ID NO:90。
在另外的实施方式中,抗体包含(a)重链可变区CDRl,包含SEQ ID NO:109;(b)重链可变区CDR2,包含SEQ ID NO:110;(c)重链可变区CDR3,包含SEQ ID NO:111;(d)轻链可变区CDRl,包含SEQ ID NO:116;(e)包含SEQ ID NO:117的轻链可变区CDR2以及(f)包含SEQID NO:118的轻链可变区CDR3。
前述分离的抗SARS-CoV-2刺突蛋白抗体CDR序列建立了新的SARS-CoV-2刺突蛋白结合蛋白家族,其根据本发明分离,并且包含包括列出的CDR序列的多肽。为了产生和选择具有SARS-CoV-2刺突蛋白结合和/或SARS-CoV-2刺突蛋白检测和/或SARS-CoV-2刺突蛋白中和活性的本发明的CDR,可以使用本领域已知的用于产生本发明的结合蛋白并评估这些结合蛋白的结合和/或检测和/或中和特征的标准方法,包括但不限于本文具体描述的那些。
在一个实施方式中,抗SARS-CoV-2抗体包含与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:84、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQID NO:102、SEQ ID NO:104、SEQ ID NO:112、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130或SEQ ID NO:132所示氨基酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:84、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:112、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130或SEQ IDNO:132的核酸序列,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含编码片段的密码子优化核酸序列,所述片段包含至少SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:84、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:112、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130或SEQ ID NO:132的全长的60%、70%、80%、90%、95%、96%、97%、98%或99%,或它们的组合。
在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含由DNA序列转录的RNA序列,DNA序列编码与如在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQID NO:22、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:84、SEQ ID NO:92、SEQID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:112、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ IDNO:128、SEQ ID NO:130或SEQ ID NO:132中列出的氨基酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%的同一性的氨基酸序列,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含由DNA序列转录的RNA序列,DNA序列编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:30、SEQID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQID NO:74、SEQ ID NO:76、SEQ ID NO:84、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:112、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130或SEQ ID NO:132所示的氨基酸序列。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含由DNA序列转录的RNA序列,DNA序列编码包含SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:84、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQID NO:102、SEQ ID NO:104、SEQ ID NO:112、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130或SEQ ID NO:132的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%的片段,或它们的组合。
在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:29、SEQ ID NO:37、SEQID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQID NO:75、SEQ ID NO:83、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:111、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131所示的核酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%同一性的序列,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:29、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ IDNO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ IDNO:73、SEQ ID NO:75、SEQ ID NO:83、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:111、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ IDNO:131所示的DNA序列,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含含有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:23、SEQID NO:29、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:83、SEQ ID NO:91、SEQ ID NO:93、SEQID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:111、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ IDNO:129或SEQ ID NO:131的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%的片段,或它们的组合。
在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含由密码子优化的核苷酸序列转录的RNA序列,所述核苷酸序列具有与如在SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:29、SEQ ID NO:37、SEQ ID NO:39、SEQ IDNO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:83、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103、SEQ ID NO:111、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131中列出的核酸序列至少60%、70%、80%、90%、95%、96%、97%、98%或99%的同一性,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含由SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:29、SEQ ID NO:37、SEQ ID NO:39、SEQ IDNO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:83、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103、SEQ ID NO:111、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131所示的DNA序列转录的RNA序列,或它们的组合。在一个实施方式中,编码抗SARS-CoV-2抗体的核苷酸序列包含由片段转录的RNA序列,所述片段包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:29、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ IDNO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ IDNO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:83、SEQ IDNO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQID NO:103、SEQ ID NO:111、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%,或它们的组合。
在一个实施方式中,本发明涉及编码抗SARS-CoV-2抗体重链的第一核酸分子和编码抗SARS-CoV-2抗体轻链的第二核酸分子的组合。在一个实施方式中,第一核酸分子是包含编码抗SARS-CoV-2抗体重链的核苷酸序列的第一质粒,第二核酸分子是编码抗SARS-CoV-2抗体轻链的第二质粒。
在一个实施方式中,编码抗SARS-CoV-2抗体重链的第一核酸分子编码SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12,SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122或SEQ ID NO:128,或与如在SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122或SEQID NO:128中列出的氨基酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列,或包含SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ IDNO:112、SEQ ID NO:122或SEQ ID NO:128的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%的片段。在一个实施方式中,编码抗SARS-CoV-2抗体重链的第一核酸分子包含SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121或SEQ IDNO:127的核苷酸序列,与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ IDNO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQID NO:121或SEQ ID NO:127具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列,或包含SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121或SEQ ID NO:127的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%的片段。
在一个实施方式中,编码抗SARS-CoV-2抗体轻链的第二核酸分子编码SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124或SEQ ID NO:130,与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124或SEQ IDNO:130中列出的氨基酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列,或包含SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124或SEQ ID NO:130的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%的片段。在一个实施方式中,编码抗SARS-CoV-2抗体轻链的第二核酸分子包含SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123或SEQID NO:129的核苷酸序列,与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123或SEQ ID NO:129具有至少60%、70%、80%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列,或包含SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ IDNO:119、SEQ ID NO:123或SEQ ID NO:129的全长的至少60%、70%、80%、90%、95%、96%、97%、98%或99%的片段。
本发明的组合物可以治疗、预防和/或保护免于SARS-CoV-2感染相关的任何疾病、失调或病症。在某些实施方式中,该组合物可以治疗、预防、和/或保护免受病毒感染。在某些实施方式中,该组合物可以治疗、预防和/或保护免于SARS-CoV-2感染相关疾病。在某些实施方式中,组合物可以治疗、预防、和/或保护免受COVID-19。
该组合物可以导致在将该组合物给予该受试者的至少约1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、20小时、25小时、30小时、35小时、40小时、45小时、50小时或60小时内在该受试者体内产生该合成抗体。该组合物可以导致在将该组合物给予该受试者的至少约1天、2天、3天、4天、5天、6天、7天、8天、9天或10天内在该受试者体内产生该合成抗体。该组合物可以导致该合成抗体在该受试者中在约1小时至约6天、约1小时至约5天、约1小时至约4天内产生,约1小时至约3天、约1小时至约2天、约1小时至约1天、约1小时至约72小时、约1小时至约60小时,向该受试者给予该组合物的约1小时至约48小时、约1小时至约36小时、约1小时至约24小时、约1小时至约12小时或约1小时至约6小时。
该组合物在给予至对其有需要的受试者时可以导致在该受试者中产生该合成抗体比在给予一种抗原以诱导体液免疫应答的受试者中产生一种内源性抗体更快。该组合物可以导致在受试者体内产生该内源性抗体之前至少约1天、2天、3天、4天、5天、6天、7天、8天、9天或10天产生该合成抗体,该受试者被给予一种抗原以诱导体液免疫应答。
本发明的组合物可以具有有效组合物所需的特征,如是安全的,使得该组合物不会引起疾病或死亡;对疾病有保护作用;以及提供易于给予、很少的副作用、生物稳定性和低成本/剂量。
在一些实施方式中,本发明的SARS-CoV-2刺突蛋白结合分子(例如抗体等)表现出在盐、化合物和其他多肽的复杂混合物中检测和结合SARS-CoV-2刺突蛋白的高能力,例如通过本领域已知的几种体外和体内测定法中的任一种评估。本领域技术人员将理解,本文所述的SARS-CoV-2刺突蛋白结合分子(例如抗体等)可用于疾病的诊断和治疗和预防的方法,在本发明的程序和方法中也是有用的,这些方法包括但不限于:免疫色谱测定、免疫缺陷测定、Luminex测定、ELISA测定、ELISPOT测定,蛋白质微阵列测定、蛋白质印迹测定、质谱测定、放射免疫测定(RIA)、放射免疫扩散测定、液相色谱-串联质谱测定、乌赫特罗尼免疫扩散测定、反相蛋白质微阵列,火箭免疫电泳测定、免疫组织染色测定、免疫沉淀测定、补体固定测定、FACS、蛋白质芯片测定、分离和纯化过程和亲和色谱法(参见,2007,Van Emon,Immunoassay and Other Bioanalytical Techniques,CRC Press;2005,Wild,Immunoassay Handbook,Gulf Professional Publishing;1996,Diamandis andChristopoulos,Immunoassay,Academic Press;2005,Joos,Microarrays in ClinicalDiagnosis,Humana Press;2005,Hamdan and Righetti,Proteomics Today,John Wileyand Sons;2007)。
在一些实施方式中,本发明的SARS-CoV-2刺突蛋白结合分子(例如抗体等)表现出降低或中和SARS-CoV-2刺突蛋白活性(例如受体结合活性等)的高能力,如通过本领域已知的几种体外和体内测定中的任一种所评估的。例如,这些SARS-CoV-2刺突蛋白结合分子(例如抗体等)中和SARS-CoV-2相关或SARS-CoV-2介导的疾病或病症。
如本文所用,“特异性结合SARS-CoV-2刺突蛋白”的SARS-CoV-2刺突蛋白结合分子(例如抗体等)以1x10-6M或更小、更优选地1x10-7M或更小、更优选地1x10-8M或更小、更优选地5x10-9M或更小、更优选地1x10-9M或更小或甚至更优选地3x10-10M或更小的KD结合SARS-CoV-2刺突蛋白。如在此所用,术语“基本上不结合”至蛋白质或细胞是指不以高亲和力结合或不以高亲和力结合至蛋白质或细胞,即,以大于1x106M或更大、更优选地1x105M或更大、更优选地1x104M或更大、更优选地1x103M或更大、甚至更优选地1x102M或更大的KD结合至蛋白质或细胞。如在此所用,术语“KD”旨在是指解离常数,该解离常数获得自Kd与Ka的比率(即,Kd/Ka)并且表示为摩尔浓度(M)。SARS-CoV-2刺突蛋白结合分子(例如抗体等)的KD值可用本领域熟知的方法测定。用于确定结合分子(例如,抗体等)的KD的优选方法是通过使用表面等离子体共振,优选使用生物传感器系统,如系统。
如在本文中使用的,术语针对IgG抗体的“高亲和力”是指针对靶结合伴侣分子具有1x10-7M或更小、更优选5x10-8M或更小、甚至更优选1x10-8M或更小、甚至更优选5x10-9M或更小并且甚至更优选1x10-9M或更小的KD的抗体。然而,“高亲和力”结合对于其他抗体同种型可以变化。例如,针对IgM同种型的“高亲和力”结合是指具有10-6M或更小、更优选10-7M或更小、甚至更优选10-8M或更小的KD的抗体。
在某些实施方式中,抗体包含重链恒定区,例如IgG1、IgG2、IgG3、IgG4、IgA、IgE、IgM或IgD恒定区。优选地,该重链恒定区是IgG1重链恒定区或IgG4重链恒定区。此外,抗体可以包括轻链恒定区,κ轻链恒定区或λ轻链恒定区。优选地,抗体包括κ轻链恒定区。可替代地,抗体部分可以是,例如,Fab片段或单链Fv片段。
重组核酸序列
如上所述,组合物可以包含重组核酸序列。重组核酸序列可以编码抗体、其片段、其变体或其组合。下文更详细地描述抗体。
重组核酸序列可以是异源核酸序列。该重组核酸序列可以包括一个或多个异源核酸序列。
重组核酸序列可以是优化的核酸序列。这种优化可以增加或改变抗体的免疫原性。优化也可以改进转录和/或翻译。优化可以包括以下各项中的一项或多项:增加转录的低GC含量前导序列;mRNA稳定性和密码子优化;添加kozak序列用于增加翻译;添加编码信号肽的免疫球蛋白(Ig)前导序列;加入内部IRES序列和消除可能的顺式作用序列基序(即内部TATA框)。
重组核酸序列构建体
该重组核酸序列可以包括一个或多个重组核酸序列构建体。所述重组核酸序列构建体可包含一种或多种组分,其在下文更详细地描述。
所述重组核酸序列构建体可包含编码重链多肽、其片段、其变体或其组合的异源核酸序列。所述重组核酸序列构建体可包含编码轻链多肽、其片段、其变体或其组合的异源核酸序列。重组核酸序列构建体也可以包括编码蛋白酶或肽酶裂解位点的异源核酸序列。重组核酸序列构建体也可以包括编码内部核糖体进入位点(IRES)的异源核酸序列。IRES可以是病毒IRES或真核IRES。重组核酸序列构建体可以包括一个或多个前导序列,其中每个前导序列编码信号肽。该重组核酸序列构建体可以包括一个或多个启动子、一个或多个内含子、一个或多个转录终止区、一个或多个起始密码子、一个或多个终止或终止密码子、和/或一个或多个聚腺苷酸化信号。该重组核酸序列构建体还可以包括一个或多个接头或标签序列。标签序列可编码血凝素(HA)标签。
(1)重链多肽
重组核酸序列构建体可以包括编码重链多肽的异源核酸、其片段、其变体或其组合。重链多肽可包含可变重链(VH)区和/或至少一个恒定重链(CH)区。该至少一个恒定重链区可以包括一个恒定重链区1(CH1)、一个恒定重链区2(CH2)和一个恒定重链区3(CH3)、和/或一个铰链区。
在一些实施方式中,重链多肽可以包括VH区和CH1区。在其他实施例中,该重链多肽可以包括VH区、CH1区、铰链区、CH2区和CH3区。
重链多肽可以包括互补决定区(“CDR”)组。CDR组可含有VH区的三个高变区。从重链多肽的N末端开始,这些CDR分别被表示为“CDR1”、“CDR2”和“CDR3”。重链多肽的CDR1、CDR2和CDR3可以有助于抗原的结合或识别。
(2)轻链多肽
所述重组核酸序列构建体可以包含编码所述轻链多肽、其片段、其变体或其组合的异源核酸序列。轻链多肽可以包括可变轻链(VL)区和/或恒定轻链(CL)区。
轻链多肽可以包括互补决定区(“CDR”)组。CDR组可以包含VL区的三个高变区。从轻链多肽的N末端开始,这些CDR分别被表示为“CDR1”、“CDR2”和“CDR3”。轻链多肽的CDR1、CDR2和CDR3可以有助于抗原的结合或识别。
(3)蛋白酶切割位点
该重组核酸序列构建体可以包括编码蛋白酶切割位点的异源核酸序列。蛋白酶裂解位点可被蛋白酶或肽酶识别。蛋白酶可以是内肽酶或内切蛋白酶,例如但不限于弗林蛋白酶、弹性蛋白酶、HtrA、钙蛋白酶、胰蛋白酶、胰凝乳蛋白酶、胰蛋白酶和胃蛋白酶。该蛋白酶可以是弗林蛋白酶。在其他实施例中,该蛋白酶可以是丝氨酸蛋白酶、苏氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶、金属蛋白酶、谷氨酸蛋白酶或切割内部肽键(即,不切割N-末端或C-末端肽键)的任何蛋白酶。
蛋白酶切割位点可以包括促进或增加切割效率的一个或多个氨基酸序列。该一个或多个氨基酸序列可以促进或增加形成或产生离散多肽的效率。该一个或多个氨基酸序列可以包括一个2A肽序列。
(4)接头序列
所述重组核酸序列构建体可包含一个或多个接头序列。接头序列可以在空间上分开或连接在此描述的一种或多种组分。在其他实施例中,接头序列可以编码在空间上分离或连接两个或更多个多肽的氨基酸序列。
(5)启动子
该重组核酸序列构建体可以包括一个或多个启动子。该一个或多个启动子可以是能够驱动基因表达和调节基因表达的任何启动子。这样的启动子是经由DNA依赖性RNA聚合酶转录所需的顺式作用序列元件。用于指导基因表达的启动子的选择取决于具体应用。启动子可以定位在重组核酸序列构建体中与其天然环境中的转录起始位点距离转录起始位点大约相同的距离。然而,可以在不损失启动子功能的情况下适应这个距离的变化。
启动子可以可操作地连接至编码重链多肽和/或轻链多肽的异源核酸序列。启动子可以是显示在真核细胞中有效表达的启动子。可操作地连接至编码序列的启动子可以是CMV启动子、来自猿病毒40(SV40)的启动子(如SV40早期启动子和SV40晚期启动子)、小鼠乳腺肿瘤病毒(MMTV)启动子、人免疫缺陷病毒(HIV)启动子(如牛免疫缺陷病毒(BIV)长末端重复(LTR)启动子)、莫洛尼病毒启动子、禽类白细胞减少症病毒(ALV)启动子、巨细胞病毒(CMV)启动子(如CMV立即早期启动子)、爱泼斯坦巴尔病毒(EBV)启动子或劳氏肉瘤病毒(RSV)启动子。启动子还可以是来自人基因的启动子,例如人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸、人多角体蛋白或人金属硫蛋白。
启动子可以是组成型启动子或诱导型启动子,其仅在宿主细胞暴露于某些特定的外部刺激时才启动转录。在多细胞生物的情况下,启动子也可以对特定组织或器官或发育阶段是特异性的。启动子还可以是组织特异性启动子,如天然或合成的肌肉或皮肤特异性启动子。此类启动子的实施例描述于美国专利申请公开号中。US20040175727,其全部内容结合于本文。
启动子可以与增强子结合。增强子可以位于编码序列的上游。增强子可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或病毒增强子,如来自CMV、FMDV、RSV或EBV的增强子。多核苷酸功能增强描述于U.S.专利号5,593,972、5,962,428和WO94/016737,各自的内容通过引用全部并入。
(6)内含子
重组核酸序列构建体可以包括一个或多个内含子。每个内含子可以包括功能性剪接供体和受体位点。该内含子可以包括剪接的增强子。内含子可以包括有效剪接所需的一个或多个信号。
(7)转录终止区
该重组核酸序列构建体可以包括一个或多个转录终止区。转录终止区可以在编码序列的下游以提供有效的终止。转录终止区可以从与上述启动子相同的基因获得,或可以从一个或多个不同的基因获得。
(8)起始密码子
该重组核酸序列构建体可以包括一个或多个起始密码子。起始密码子可以位于编码序列的上游。起始密码子可以与编码序列符合读框。起始密码子可以与有效翻译起始所需的一个或多个信号相关,例如但不限于核糖体结合位点。
(9)终止密码子
该重组核酸序列构建体可以包括一个或多个终止或终止密码子。终止密码子可以在编码序列的下游。终止密码子可以与编码序列符合读框。终止密码子可以与有效翻译终止所需的一个或多个信号相关联。
(10)多腺苷酸化信号
该重组核酸序列构建体可以包括一个或多个聚腺苷酸化信号。聚腺苷酸化信号可以包括转录物的有效聚腺苷酸化所需的一个或多个信号。聚腺苷酸化信号可以位于编码序列的下游。聚腺苷酸化信号可以是SV40聚腺苷酸化信号、LTR聚腺苷酸化信号、牛生长激素(bGH)聚腺苷酸化信号、人生长激素(hGH)聚腺苷酸化信号或人β-球蛋白聚腺苷酸化信号。SV40多腺苷酸化信号可以是来自pCEP4质粒(Invitrogen,SanDiego,CA)的多腺苷酸化信号。
(11)前导序列
所述重组核酸序列构建体可包含一个或多个前导序列。前导序列可以编码信号肽。信号肽可以是免疫球蛋白(Ig)信号肽,例如但不限于IgG信号肽和IgE信号肽。
重组核酸序列构建体的排列
如上所述,重组核酸序列可以包括一个或多个重组核酸序列构建体,其中每个重组核酸序列构建体可以包括一个或多个组分。上面详细描述了一个或多个部件。当包含在重组核酸序列构建体中时,一种或多种组分可以相对于彼此以任何顺序排列。在一些实施方式中,该一个或多个组分可以被安排在如下所述的重组核酸序列构建体中。
(12)安排1
在一种安排中,第一重组核酸序列构建体可以包含编码重链多肽的异源核酸序列,并且第二重组核酸序列构建体可以包含编码轻链多肽的异源核酸序列。第一重组核酸序列构建体可以置于载体中。第二重组核酸序列构建体可以置于第二或单独的载体中。下面更详细地描述将重组核酸序列构建体置于载体中。
第一重组核酸序列构建体也可以包括启动子、内含子、转录终止区、起始密码子、终止密码子和/或多聚腺苷酸化信号。第一重组核酸序列构建体可还包含前导序列,其中前导序列位于编码重链多肽的异源核酸序列的上游(或5’)。因此,由前导序列编码的信号肽可以通过肽键连接至重链多肽。
第二重组核酸序列构建体也可以包括启动子、起始密码子、终止密码子和多腺苷酸化信号。第二重组核酸序列构建体可以还包括前导序列,其中前导序列位于编码轻链多肽的异源核酸序列的上游(或5’)。因此,由前导序列编码的信号肽可以通过肽键连接至轻链多肽。
因此,安排1的一个实施例可以包括编码包括VH和CH1的重链多肽的第一载体(并且因此第一重组核酸序列构建体)和编码包括VL和CL的轻链多肽的第二载体(并且因此第二重组核酸序列构建体)。安排1的第二实施例可以包括编码包括VH、CH1、铰链区、CH2和CH3的重链多肽的第一载体(并且因此第一重组核酸序列构建体),和编码包括VL和CL的轻链多肽的第二载体(并且因此第二重组核酸序列构建体)。
(13)安排2
在第二安排中,该重组核酸序列构建体可以包括编码该重链多肽的异源核酸序列和编码该轻链多肽的异源核酸序列。编码重链多肽的异源核酸序列可以位于编码轻链多肽的异源核酸序列的上游(或5’)。可替代地,编码轻链多肽的异源核酸序列可以位于编码重链多肽的异源核酸序列的上游(或5’)。
重组核酸序列构建体可以如下文更详细描述的那样置于载体中。
重组核酸序列构建体可以包括编码蛋白酶切割位点和/或接头序列的异源核酸序列。如果包括在重组核酸序列构建体中,编码蛋白酶切割位点的异源核酸序列可以定位在编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。因此,蛋白酶切割位点允许在表达时将重链多肽和轻链多肽分离成不同的多肽。在其他实施例中,如果接头序列包含在重组核酸序列构建体中,那么接头序列可以位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
重组核酸序列构建体也可以包括启动子、内含子、转录终止区、起始密码子、终止密码子和/或多聚腺苷酸化信号。该重组核酸序列构建体可以包括一个或多个启动子。重组核酸序列构建体可以包含两个启动子,使得一个启动子可以与编码重链多肽的异源核酸序列结合,并且第二个启动子可以与编码轻链多肽的异源核酸序列结合。在还其他实施例中,该重组核酸序列构建体可以包括一个启动子,该启动子与编码该重链多肽的异源核酸序列和编码该轻链多肽的异源核酸序列相关联。
所述重组核酸序列构建体还可包含两个前导序列,其中第一前导序列位于编码重链多肽的异源核酸序列的上游(或5’),第二前导序列位于编码轻链多肽的异源核酸序列的上游(或5’)。因此,由第一前导序列编码的第一信号肽可以通过肽键与重链多肽连接,并且由第二前导序列编码的第二信号肽可以通过肽键与轻链多肽连接。
因此,安排2的一个实施例可以包括编码包括VH和CH1的重链多肽以及包括VL和CL的轻链多肽的载体(并且因此重组核酸序列构建体),其中接头序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
安排2的第二实施例可包括编码包括VH和CH1的重链多肽和包括VL和CL的轻链多肽的载体(并且因此重组核酸序列构建体),其中编码蛋白酶切割位点的异源核酸序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
安排2的第三实施例可包括编码包括VH、CH1、铰链区、CH2和CH3的重链多肽和包括VL和CL的轻链多肽的载体(以及因此重组核酸序列构建体),其中接头序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
排列2的第四实施例可包括编码包括VH、CH1、铰链区、CH2和CH3的重链多肽和包括VL和CL的轻链多肽的载体(以及因此重组核酸序列构建体),其中编码蛋白酶切割位点的异源核酸序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
从重组核酸序列构建体的表达
如上所述,重组核酸序列构建体可以在一种或多种组分中包括编码重链多肽的异源核酸序列和/或编码轻链多肽的异源核酸序列。因此,重组核酸序列构建体可以促进重链多肽和/或轻链多肽的表达。
当使用如上所述的安排1时,第一重组核酸序列构建体可以促进重链多肽的表达,并且第二重组核酸序列构建体可以促进轻链多肽的表达。当使用如上所述的安排2时,该重组核酸序列构建体可以促进该重链多肽和该轻链多肽的表达。
当表达时,例如但不限于,在一种细胞、生物体或哺乳动物中,该重链多肽和该轻链多肽可以组装成该合成抗体。特别地,重链多肽和轻链多肽可以彼此相互作用,使得组装产生能够结合抗原的合成抗体。在其他实施例中,重链多肽和轻链多肽可以彼此相互作用,使得组装导致合成抗体与未如在此所描述组装的抗体相比更具免疫原性。在其他实施例中,重链多肽和轻链多肽可以彼此相互作用,使得组装产生能够引发或诱导针对抗原的免疫应答的合成抗体。
载体
上述重组核酸序列构建体可以置于一个或多个载体中。该一个或多个载体可以包含复制起点。该一种或多种载体可以是质粒、噬菌体、细菌人工染色体或酵母人工染色体。该一个或多个载体可以是自我复制的染色体外载体,或是整合到宿主基因组中的载体。
载体包括但不限于质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体等。“载体”包括可以感染、转染、瞬时或永久地转导细胞的核酸。应认识到,载体可以是裸核酸,或与蛋白质或脂质复合的核酸。该载体任选地包括病毒或细菌核酸和/或蛋白质、和/或膜(例如,细胞膜、病毒脂质包膜等)。载体包括但不限于复制子(例如,RNA复制子、噬菌体),DNA片段可以附接至该复制子并且变得复制。因此,载体包括但不限于RNA、自主自复制的环状或线性DNA或RNA(例如质粒、病毒等,参见例如U.S.专利号5,217,879。并且包括表达质粒和非表达质粒两者。在一些实施方式中,该载体包括线性DNA、酶DNA或合成DNA。当重组微生物或细胞培养物被描述为寄主“表达载体”时,这包括染色体外的环状和线性DNA以及已经掺入宿主染色体中的DNA。在载体由宿主细胞维持的情况下,载体可以在有丝分裂期间作为自主结构由细胞稳定复制,或并入宿主的基因组中。
一个或多个载体可以是异源表达构建体,其通常是用于将特定基因引入靶细胞的质粒。一旦表达载体在细胞内,由重组核酸序列构建体编码的重链多肽和/或轻链多肽由细胞转录和翻译机制核糖体复合物产生。该一种或多种载体可以表达大量的稳定的信使RNA,并且因此表达蛋白质。
(14)表达载体
该一个或多个载体可以是环状质粒或线性核酸。环状质粒和线性核酸能够指导特定核苷酸序列在合适的受试者细胞中的表达。包含重组核酸序列构建体的一种或多种载体可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。
(15)质粒
该一个或多个载体可以是质粒。质粒可用于用重组核酸序列构建体转染细胞。质粒可用于将重组核酸序列构建体引入受试者中。该质粒还可以包含一种调节序列,该调节序列可以很好地适合于在给予该质粒的细胞中的基因表达。
该质粒还可以包含哺乳动物复制起点以便在染色体外维持该质粒并且在细胞中产生该质粒的多个拷贝。该质粒可以是来自Invitrogen(Invitrogen)(圣地亚哥,加利福尼亚州)的pVAX1、pCEP4或pREP4,其可以包括爱泼斯坦巴尔病毒复制起点和核抗原EBNA-1编码区,其可以产生高拷贝附加型复制而不整合。质粒的主链可以是pAV0242。该质粒可以是复制缺陷型5型腺病毒(Ad5)质粒。
质粒可以是pSE420(Invitrogen,SanDiego,Calif.),其可以用于在大肠杆菌(E.coli)中生产蛋白质。该质粒还可以是pYES2(Invitrogen,San Diego,Calif.),该质粒可以用于酵母的酿酒酵母株中的蛋白质生产。该质粒还可以是MAXBACTM完全杆状病毒表达系统(Invitrogen,San Diego,Calif.)的质粒,该系统可以用于昆虫细胞中的蛋白质生产。该质粒还可以是pcDNAI或pcDNA3(Invitrogen,San Diego,Calif.),该质粒可以用于在哺乳动物细胞如中国仓鼠卵巢(CHO)细胞中产生蛋白质。
(16)RNA
在一个实施方式中,该核酸是RNA分子。在一个实施方式中,该RNA分子是从在此描述的DNA序列转录的。因此,在一个实施方式中,本发明提供了编码一种或多种dMAB的RNA分子。RNA可以是正链的。因此,在一些实施方式中,该RNA分子可以由细胞翻译而无需任何介入的复制步骤,例如逆转录。可用于本发明的RNA分子可具有5’帽(例如7-甲基鸟苷)。这个帽可以增强RNA的体内翻译。可用于本发明的RNA分子的5’核苷酸可以具有5’三磷酸基团。在封端的RNA中,这可以经由5’-至-5’桥连接至7-甲基鸟苷。RNA分子可以具有3’poly-A尾。它还可以包括poly-A聚合酶识别序列(例如AAUAAA)在其3’端附近。可用于本发明的RNA分子可以是单链的。可用于本发明的RNA分子可包含合成RNA。在一些实施方式中,RNA分子是裸RNA分子。在一个实施方式中,该RNA分子被包含在载体内。
在一个实施方式中,RNA具有5'和3'UTR。在一个实施方式中,5'UTR的长度在0至3000个核苷酸之间。可以通过不同方法改变待添加至编码区的5’和3’UTR序列的长度,包括但不限于设计用于PCR的引物,其退火至UTR的不同区域。使用该方法,本领域普通技术人员可以修饰在转录的RNA的转染之后实现最佳翻译效率所需的5'和3'UTR长度。
5'和3'UTR可以是感兴趣的基因的天然存在的、内源性5'和3'UTR。可替代地,可以通过将UTR序列掺入正向和反向引物或通过模板的任何其他修饰来添加对于感兴趣的基因不是内源的UTR序列。使用相对于目的基因不是内源的UTR序列可用于修饰RNA的稳定性和/或翻译效率。例如,已知3'UTR序列中的富含AU的元件可以降低RNA的稳定性。因此,基于本领域熟知的UTR的特性,可以选择或设计3'UTR以增加转录的RNA的稳定性。
在一个实施方式中,5'UTR可以包含内源基因的Kozak序列。可替代地,当如上所述通过PCR添加对于感兴趣的基因不是内源的5'UTR时,可以通过添加5'UTR序列重新设计共有Kozak序列。Kozak序列可以增加一些RNA转录物的翻译效率,但是似乎并非所有RNA都必需实现有效翻译。许多RNA对Kozak序列的要求在本领域中是已知的。在其他实施方式中,5'UTR可以源自RNA病毒,其RNA基因组在细胞中是稳定的。在其他实施方式中,在3'或5'UTR中可以使用各种核苷酸类似物以阻止RNA的外切核酸酶降解。
在一个实施方式中,RNA具有在5'端上的帽和3'聚(A)尾两者,其确定核糖体结合、翻译的起始和RNA在细胞中的稳定性。
在一个实施方式中,RNA是核苷修饰的RNA。核苷修饰的RNA具有超过非修饰的RNA的特定优势,包括例如增加的稳定性、低的或不存在的先天免疫原性和增强的翻译。
(17)环状和线性载体
该一种或多种载体可以是环状质粒,它可以通过整合到细胞基因组中来转化靶细胞或存在于染色体外(例如,具有复制起点的自主复制质粒)。载体可以是pVAX、pcDNA3.0或provax,或能够表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽的任何其他表达载体。
在此还提供了线性核酸或线性表达盒(“LEC”),该线性核酸或线性表达盒能够经由电穿孔有效地递送至受试者并且表达由该重组核酸序列构建体编码的重链多肽和/或轻链多肽。LEC可以是不含任何磷酸酯主链的任何线性DNA。LEC可以不包含任何抗生素抗性基因和/或磷酸主链。LEC可以不包含与所希望的基因表达无关的其他核酸序列。
LEC可以来源于能够被线性化的任何质粒。质粒可以能够表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽。该质粒可以是pNP(Puerto Rico/34)或pM2(NewCaledonia/99)。质粒可以是WLV009、pVAX、pcDNA3.0或provax或能够表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽的任何其他表达载体。
LEC可以是PcrM2。LEC可以是pcrNP.pcrNP,并且pcrMR可以分别来源于pNP(PuertoRico/34)和pM2(New Caledonia/99)。
(18)病毒载体
在一个实施方式中,在此提供了能够将本发明的核酸递送至细胞的病毒载体。表达载体可以以病毒载体的形式提供至细胞。病毒载体技术是本领域熟知的并且描述于,例如,Sambrook et al.(2001),和Ausubel et al.(1997),以及其他病毒学和分子生物学手册。可用作载体的病毒包括但不限于逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。通常,合适的载体含有在至少一种生物体中有功能的复制起点、启动子序列、方便的限制性内切核酸酶位点和一种或多种选择标志物。(参见,例如,WO01/96584;WO01/29058;和U.S.Pat.No.6,326,193。病毒载体,尤其是逆转录病毒载体,已成为将基因插入哺乳动物(例如人)细胞的最广泛使用的方法。其他病毒载体可以来源于慢病毒、痘病毒、单纯疱疹病毒I、腺病毒和腺相关病毒等。参见例如U.S.专利号5,350,674和5,585,362。
(19)制备载体的方法
本文提供了用于制备其中已放置重组核酸序列构建体的一个或多个载体的方法。在最后的亚克隆步骤之后,可以使用本领域已知的方法将该载体用于接种大规模发酵罐中的细胞培养物。
在其他实施例中,在最后的亚克隆步骤之后,该载体可以与一个或多个电穿孔(EP)装置一起使用。下面更详细地描述EP装置。
该一种或多种载体可以使用已知装置和技术的组合来配制或制造,但优选地是使用在授权的、共同未决的美国中描述的质粒制造技术来制造它们。临时申请U.S.序列号60/939,792,提交于2007年5月23日。在一些实施方式中,在此描述的DNA质粒可以按大于或等于10mg/mL的浓度配制。制造技术还包括或并入本领域普通技术人员通常已知的各种设备和方案,除了美国专利中描述的那些。序列号60/939,792,包括在2007年7月3日授权的授权专利美国专利号7,238,522中描述的那些。上述申请和专利,美国序列号60/939,792和美国专利号7,238,522,分别通过引用以其全部内容结合在此。
3.抗体
如上所述,重组核酸序列可以编码抗体、其片段、其变体或其组合。抗体可以与抗原结合或反应,这将在下文更详细地描述。
抗体可以包含重链和轻链互补决定区(“CDR”)组,其分别插入在重链和轻链框架(“FR”)组之间,其为CDR提供支持并定义CDR相对于彼此的空间关系。CDR组可含有重链或轻链V区的三个高变区。从重链或轻链的N-末端开始,这些区域分别表示为“CDR1”、“CDR2”和“CDR3”。因此,抗原结合位点可以包括六个CDR,包括来自重链和轻链V区中的每的CDR组。
蛋白水解酶木瓜蛋白酶优先切割IgG分子以产生几个片段,其中的两个(F(ab)片段)各自包含共价异二聚体,该共价异二聚体包含完整的抗原结合位点。胃蛋白酶能够切割IgG分子以提供若干片段,包括F(ab’)2片段,其包含两个抗原结合位点。因此,抗体可以是Fab或F(ab’)2。Fab可以包括重链多肽和轻链多肽。Fab的重链多肽可以包括VH区和CH1区。Fab的轻链可以包括VL区和CL区。
抗体可以是免疫球蛋白(Ig)。Ig可以是例如IgA、IgM、IgD、IgE和IgG。免疫球蛋白可以包括重链多肽和轻链多肽。免疫球蛋白的重链多肽可以包括VH区、CH1区、铰链区、CH2区和CH3区。免疫球蛋白的轻链多肽可以包括VL区和CL区。
抗体可以是多克隆或单克隆抗体。抗体可以是嵌合抗体、单链抗体、亲和力成熟的抗体、人抗体、人源化抗体或完全人抗体。人源化抗体可以是来自结合所希望的抗原的非人物种的抗体,抗体具有来自非人物种的一个或多个互补决定区(CDR)和来自人免疫球蛋白分子的框架区。
抗体可以是如下文更详细描述的双特异性抗体。抗体可以是双功能抗体,也如以下更详细描述的。
如上所述,在将组合物给予受试者时,可以在受试者中产生抗体。抗体在受试者内可以具有半衰期。在一些实施方式中,抗体可以被修饰以延长或缩短其在受试者体内的半衰期。下文更详细地描述此类修改。
抗体可如下文更详细描述的去岩藻糖化。
在一个实施方式中,抗体结合SARS-CoV-2抗原。在一个实施方式中,抗体结合SARS-CoV-2刺突蛋白的至少一个表位。在一个实施方式中,抗体结合SARS-CoV-2RBD。
可以修饰抗体以减少或预防与抗原相关的疾病的抗体依赖性增强(ADE),如下文更详细描述的。
双特异性抗体
重组核酸序列可以编码双特异性抗体、其片段、其变体或其组合。双特异性抗体可结合两种抗原或与两种抗原反应,例如,下文更详细描述的两种抗原。双特异性抗体可以由在此描述的抗体中的两种的片段组成,由此允许该双特异性抗体与两种所希望的靶分子结合或反应,这些靶分子可以包括以下更详细描述的抗原、配体(包括受体的配体)、受体(包括受体上的配体结合位点)、配体-受体复合物和标志物。
本发明提供了新的双特异性抗体,这些双特异性抗体包含特异性地结合到第一靶标上的第一抗原结合位点以及特异性地结合到第二靶标上的第二抗原结合位点,具有特别有利的特性,如可生产性、稳定性、结合亲和力、生物活性、某些T细胞的特异性靶向、靶向效率和降低的毒性。在一些情况下,存在双特异性抗体,其中该双特异性抗体以高亲和力与该第一靶标结合并且以低亲和力与该第二靶标结合。在其他情况下,存在双特异性抗体,其中该双特异性抗体以低亲和力结合到该第一靶标上并且以高亲和力结合到该第二靶标上。在其他情况下,存在双特异性抗体,其中该双特异性抗体以希望的亲和力结合到该第一靶标上并且以希望的亲和力结合到该第二靶标上。
在一个实施方式中,双特异性抗体是二价抗体,其包含a)特异性地结合于第一抗原的抗体的第一轻链和第一重链,和b)特异性地结合于第二抗原的抗体的第二轻链和第二重链。
根据本发明的双特异性抗体分子可以具有两个具有任何所希望的特异性的结合位点。在一些实施方式中,这些结合位点之一能够结合肿瘤相关抗原。在一些实施方式中,Fab片段中包含的结合位点是特异性针对SARS-CoV-2抗原的结合位点。在一些实施方式中,单链Fv片段中包含的结合位点是特异性针对SARS-CoV-2抗原(例如SARS-CoV-2刺突抗原)的结合位点。
在一些实施方式中,根据本发明的双特异性抗体的结合位点之一能够结合T细胞特异性受体分子和/或天然杀伤细胞(NK细胞)特异性受体分子。T细胞特异性受体是所谓的“T细胞受体”(TCR),其允许T细胞结合,并且如果存在另外的信号,则通过另一种细胞(称为抗原呈递细胞或APC)呈递的表位/抗原激活和应答该表位/抗原。已知T细胞受体类似于天然存在的免疫球蛋白的Fab片段。它通常是单价的,包括α-和β-链,在一些实施方式中,它包括γ-链和δ-链。因此,在一些实施方式中,TCR是TCR(α/β),并且在一些实施方式中,它是TCR(γ/δ)。T细胞受体与CD3T-细胞共受体形成复合物。CD3是蛋白质复合物并且由四个不同的链组成。在哺乳动物中,复合物包含CD3γ链、CD36链和两个CD3E链。这些链与被称为T细胞受体(TCR)的分子和ζ链结合以在T淋巴细胞中产生激活信号。因此,在一些实施方式中,T细胞特异性受体是CD3T细胞共受体。在一些实施方式中,T细胞特异性受体是CD28,一种也在T细胞上表达的蛋白质。CD28可以提供T细胞活化所需的共刺激信号。CD28在T细胞增殖和存活、细胞因子产生和T-辅助细胞-2型发育中起重要作用。T细胞特异性受体的又另外的实施方式是CD134,也称为Ox40。CD134/OX40在活化后24至72小时后表达,并且可以被用于限定次级共刺激分子。T细胞受体的另一个实施例是4-1BB,其能够结合于抗原呈递细胞(APCs)上的4-1BB-配体,从而产生T细胞的共刺激信号。主要发现于T细胞上的受体的另外的实施方式是CD5,CD5也以低水平发现于B细胞上。修饰T细胞功能的受体的另外的实施方式是CD95,也称为Fas受体,其通过在其他细胞表面上表达的Fas-配体介导凋亡信号传导。已报道CD95调节静息T淋巴细胞中的TCR/CD3驱动的信号传导途径。
NK细胞特异性受体分子的实施例是CD16,一种低亲和力Fc受体和NKG2D。存在于T细胞和天然杀伤(NK)细胞表面的受体分子的实施例是CD2和CD2-超家族的其他成员。CD2能够充当T和NK细胞上的共刺激分子。
在一些实施方式中,双特异性抗体分子的第一结合位点结合SARS-CoV-2抗原,第二结合位点结合T细胞特异性受体分子和/或天然杀伤(NK)细胞特异性受体分子。
在一些实施方式中,抗体分子的第一结合位点结合SARS-CoV-2刺突抗原,第二结合位点结合T细胞特异性受体分子和/或天然杀伤(NK)细胞特异性受体分子。在一些实施方式中,抗体分子的第一结合位点结合SARS-CoV-2刺突抗原,第二结合位点结合CD3、T细胞受体(TCR)、CD28、CD16、NKG2D、Ox40、4-1BB、CD2、CD5和CD95中的一种。
在一些实施方式中,抗体分子的第一结合位点结合T细胞特异性受体分子和/或天然杀伤(NK)细胞特异性受体分子,第二结合位点结合SARS-CoV-2抗原。在一些实施方式中,抗体的第一结合位点结合T细胞特异性受体分子和/或天然杀伤(NK)细胞特异性受体分子,第二结合位点结合SARS-CoV-2刺突抗原。在一些实施方式中,抗体的第一结合位点结合CD3、T细胞受体(TCR)、CD28、CD16、NKG2D、Ox40、4-1BB、CD2、CD5和CD95之一,并且第二结合位点结合SARS-CoV-2刺突抗原。
双功能抗体
重组核酸序列可以编码双功能抗体、其片段、其变体或其组合。双功能抗体可以与下述抗原结合或反应。双功能抗体还可以被修饰以赋予抗体除了识别抗原结合之外的附加功能。这样的修饰可以包括但不限于偶联至因子H或其片段。因子H是补体激活的可溶性调节剂,因此可以经由补体介导的溶解(CML)促进免疫应答。
抗体半衰期的延长
如上所述,可以修饰抗体以延长或缩短抗体在受试者中的半衰期。该修饰可以延长或缩短抗体在该受试者的血清中的半衰期。
修饰可以存在于抗体的恒定区中。修饰可以是在抗体的恒定区中的一个或多个氨基酸取代,与不包含一个或多个氨基酸取代的抗体的半衰期相比,这些氨基酸取代延长了抗体的半衰期。该修饰可以是在抗体的CH2结构域中的一个或多个氨基酸取代,这些取代与不包含该一个或多个氨基酸取代的抗体的半衰期相比延长了抗体的半衰期。
在一些实施方式中,恒定区中的一个或多个氨基酸取代可以包括用酪氨酸残基替换恒定区中的甲硫氨酸残基、用苏氨酸残基替换恒定区中的丝氨酸残基、用谷氨酸残基替换恒定区中的苏氨酸残基或其任何组合,由此延长抗体的半衰期。
在其他实施例中,恒定区中的一个或多个氨基酸取代可以包括用酪氨酸残基替换CH2结构域中的甲硫氨酸残基、用苏氨酸残基替换CH2结构域中的丝氨酸残基、用谷氨酸残基替换CH2结构域中的苏氨酸残基或其任何组合,由此延长抗体的半衰期。
去岩藻糖化
该重组核酸序列可以编码非岩藻糖基化的抗体(即去岩藻糖基化抗体或非岩藻糖基化抗体)、其片段、其变体或其组合。岩藻糖基化包括将糖岩藻糖添加至分子,例如将岩藻糖连接至N-聚糖、O-聚糖和糖脂。因此,在去岩藻糖化的抗体中,岩藻糖不附接至恒定区的碳水化合物链。进而,与岩藻糖基化抗体相比,岩藻糖基化的这种缺乏可以通过抗体改善FcγR11Ia结合和抗体定向细胞毒性(ADCC)活性。因此,在一些实施方式中,与岩藻糖基化抗体相比,非岩藻糖基化抗体可以显示增加的ADCC活性。
可以修饰抗体以防止或抑制抗体的岩藻糖基化。在一些实施方式中,与未修饰的抗体相比,此类修饰的抗体可以展现出增加的ADCC活性。修饰可以在重链、轻链或其组合中。修饰可以是重链中的一个或多个氨基酸取代、轻链中的一个或多个氨基酸取代或其组合。
减小的ADE响应
可以修饰抗体以减少或预防与抗原相关的疾病的抗体依赖性增强(ADE),但仍中和抗原。
在一些实施方式中,抗体可以被修饰为包括一个或多个氨基酸取代,这些取代减少或阻止抗体与FcγR1a的结合。该一个或多个氨基酸取代可以在抗体的恒定区中。一个或多个氨基酸取代可以包括在抗体的恒定区中用丙氨酸残基取代亮氨酸残基,即,在此也称为LA、LA突变或LA取代。一个或多个氨基酸取代可以包括在抗体的恒定区中用丙氨酸残基取代两个亮氨酸残基,每个亮氨酸残基在本文中也称为LALA、LALA突变或LALA取代。LALA取代的存在可以防止或阻断抗体结合至FcγR1a,并且因此,修饰的抗体不增强或引起与抗原相关的疾病的ADE,但仍中和抗原。
4.抗原
合成抗体针对抗原或其片段或变体。抗原可以是核酸序列、氨基酸序列、多糖或其组合。核酸序列可以是DNA、RNA、cDNA、其变体、其片段或其组合。氨基酸序列可以是蛋白质、肽、其变体、其片段或其组合。多糖可以是核酸编码的多糖。
抗原可以来自病毒。抗原可以与病毒感染相关。在一个实施方式中,抗原可与SARS-CoV-2感染或COVID-19相关。在一个实施方式中,抗原可以是SARS-CoV-2刺突抗原。
在一个实施方式中,抗原可以是SARS-CoV-2抗原的片段。例如,在一个实施方式中,抗原是SARS-CoV-2刺突蛋白的片段。在一个实施方式中,抗原是SARS-CoV-2刺突蛋白的受体结合结构域(RBD)。
在一个实施方式中,本发明的合成抗体靶向两种或更多种抗原。在一个实施方式中,双特异性抗体的至少一种抗原选自本文所述的抗原。在一个实施方式中,所述两种或更多种抗原选自本文所述的抗原。
病毒抗原
病毒抗原可以是病毒抗原或其片段或变体。病毒可以是致病病毒。所述病毒可以是冠状病毒。该病毒可以是SARS或SARS-CoV-2病毒。
抗原可以是SARS-CoV-2病毒抗原或其片段或变体。SARS-CoV-2抗原可来自允许病毒复制、感染或存活的因子。允许SARS-CoV-2病毒复制或存活的因素包括但不限于结构蛋白和非结构蛋白。这样的蛋白质可以是刺突蛋白。
5.赋形剂和组合物的其他组分
该组合物可以还包括药学上可接受的赋形剂。药学上可接受的赋形剂可以是功能性分子,如运载体、载体或稀释剂。药学上可接受的赋形剂可以是一种转染促进剂,其可以包括表面活性剂,如免疫刺激复合物(ISCOMS)、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁酰肽、醌类似物、囊泡(如角鲨烯和角鲨烯)、透明质酸、脂质、脂质体、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米颗粒或其他已知的转染促进剂。
转染促进剂是聚阴离子、聚阳离子,包括聚-L-谷氨酸盐(LGS)或脂质。转染促进剂是聚-L-谷氨酸,并且聚-L-谷氨酸可以以小于6mg/ml的浓度存在于组合物中。该转染促进剂还可以包括表面活性剂,例如免疫刺激复合物(ISCOMS)、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁酰肽、醌类似物以及囊泡(例如角鲨烯和角鲨烯),并且透明质酸也可以与该组合物联合使用。该组合物还可以包括一种转染促进剂如脂质、脂质体(包括卵磷脂脂质体或本领域已知的其他脂质体)作为一种DNA-脂质体混合物(参见例如WO9324640)、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米颗粒或其他已知的转染促进剂。转染促进剂是聚阴离子、聚阳离子,包括聚-L-谷氨酸盐(LGS)或脂质。该疫苗中转染剂的浓度是小于4mg/ml、小于2mg/ml、小于1mg/ml、小于0.750mg/ml、小于0.500mg/ml、小于0.250mg/ml、小于0.100mg/ml、小于0.050mg/ml或小于0.010mg/ml。
该组合物可以还包含如描述于1994年4月1日提交的序列号U.S.021,579,其通过引用完全并入。
该组合物可以包含从约1纳克至100毫克的量的DNA;约1微克至约10毫克;或优选约0.1微克至约10毫克;或更优选地约1毫克至约2毫克。在一些优选的实施例中,根据本发明的组合物包含约5纳克至约1000微克的DNA。在一些优选的实施例中,组合物可含有约10纳克至约800微克的DNA。在一些优选的实施例中,该组合物可以包含约0.1至约500微克的DNA。在一些优选的实施例中,该组合物可以包含约1至约350微克的DNA。在一些优选的实施例中,该组合物可以包含约25至约250微克、从约100至约200微克、从约1纳克至100毫克;约1微克至约10毫克;约0.1微克至约10毫克;约1毫克至约2毫克,约5纳克至约1000微克,约10纳克至约800微克,约0.1至约500微克,约1至约350微克,约25至约250微克,约100至约200微克的DNA。
该组合物可以根据有待使用的给药模式来配制。可注射药物组合物可以是无菌的、无热原的和无颗粒的。可以使用等渗制剂或溶液。用于等渗性的添加剂可以包括氯化钠、右旋糖、甘露醇、山梨醇和乳糖。该组合物可以包括一种血管收缩剂。等渗溶液可包括磷酸盐缓冲盐水。该组合物可以还包含稳定剂,包括明胶和白蛋白。稳定剂可以允许制剂在室温或环境温度下长时间稳定,包括LGS或聚阳离子或聚阴离子。
6.产生合成抗体的方法
本发明还涉及产生合成抗体的方法。该方法可以包括通过使用以下更详细描述的递送方法将该组合物给予对其有需要的受试者。因此,在将组合物给予受试者时,在受试者体内或体内产生合成抗体。
该方法还可以包括将该组合物引入一个或多个细胞中,并且因此,可以在该一个或多个细胞中产生或产生该合成抗体。该方法可以还包括将该组合物引入一个或多个组织中,例如但不限于皮肤和肌肉,并且因此,可以在该一个或多个组织中产生或产生该合成抗体。
7.鉴定或筛选抗体的方法
本发明进一步涉及鉴定或筛选上述抗体的方法,抗体与上述抗原反应或结合上述抗原。鉴定或筛选抗体的方法可以使用本领域技术人员已知的方法中的抗原来鉴定或筛选抗体。此类方法可以包括但不限于,从文库中选择抗体(例如,噬菌体展示)并且免疫动物,随后分离和/或纯化抗体。
8.诊断疾病或病症的方法
本发明进一步涉及使用如在此所述的抗体、其片段或编码它们的核酸分子将受试者诊断为患有疾病或病症的方法。在一些实施方式中,本发明的特征在于鉴定有传播SARS-CoV-2感染或COVID-19风险的受试者的方法,包括无症状或仅显示SARS-CoV-2感染或COVID-19的非特异性指标的那些受试者。在一些实施方式中,本发明也可用于监测接受SARS-CoV-2感染或COVID-19的治疗和疗法的受试者,并用于选择或改变在患有SARS-CoV-2感染或COVID-19的受试者中有效的治疗和疗法,其中此类治疗和疗法的选择和使用促进对SARS-CoV-2的免疫性,或预防SARS-CoV-2的感染。
在一个实施方式中,抗体、其片段或编码它们的核酸分子可用于免疫测定以诊断受试者患有活性SARS-CoV-2感染、COVID-19或对SARS-CoV-2感染具有免疫性,或监测接受SARS-CoV-2感染或COVID-19治疗和疗法的受试者。非限制性示例性免疫测定包括例如免疫组织化学测定、免疫细胞化学测定、ELISA、捕获ELISA、夹心测定、酶免疫测定、放射免疫测定、荧光免疫测定等,所有这些都是本领域技术人员已知的。参见例如Harlow et al.,1988,Antibodies:A Laboratory Manual,Cold Spring Harbor,New York;Harlow etal.,1999,Using Antibodies:A Laboratory Manual,Cold Spring Harbor LaboratoryPress,NY。
在一些实施方式中,这些方法包括从受试者获得样品并且将该样品与本发明的抗体或表达本发明的抗体的细胞接触,并且检测抗体与样品中存在的抗原的结合。
在一些实施方式中,样品可从接受治疗方案或治疗干预(例如药物治疗、疫苗接种等)的受试者提供,用于SARS-CoV-2感染或COVID-19。可以在治疗之前、期间或之后的不同时间点从受试者获得样品。
因此,本发明的SARS-CoV-2抗体或编码抗体的核酸分子可用于产生受试者的风险概况或特征:(i)预期对SARS-CoV-2感染或COVID-19具有免疫性和/或(ii)具有发展SARS-CoV-2感染或COVID-19的风险的受试者。可将受试者的抗体谱与预定或参考抗体谱比较,以诊断或鉴定具有发展SARS-CoV-2感染或COVID-19风险的受试者,监测疾病的进展,以及疾病的进展速率,和监测SARS-CoV-2感染或COVID-19治疗的有效性。关于本发明抗体的数据也可以与SARS-CoV-2感染或COVID-19的其他数据或测试结果组合或相关,包括但不限于年龄、体重、BMI、成像数据、病史、吸烟状况和任何相关家族史。
本发明也提供鉴定治疗SARS-CoV-2感染或COVID-19的药物的方法,这些药物适合特定受试者或以其他方式为特定受试者定制。对此,可获取暴露于治疗剂、药物或其他治疗方案的受试者的测试样品,并可测定一种或多种SARS-CoV-2抗体的水平。可将一种或多种SARS-CoV-2抗体的水平与治疗前和治疗后衍生自受试者的样品进行比较,或者可将一种或多种SARS-CoV-2抗体的水平与衍生自由于这种治疗或暴露而显示风险因素改善的一个或多个受试者的样品进行比较。
在一个实施方式中,本发明是诊断SARS-CoV-2感染或COVID-19的方法。在一个实施方式中,该方法包括确定SARS-CoV-2对感染或再感染的免疫性。在一些实施方式中,这些方法可利用至少一种生物样品(如尿、唾液、血液、血清、血浆、羊水或泪液)来检测样品中的一种或多种本发明的SARS-CoV-2抗体。通常,样品是“临床样品”,其是源自患者的样品。在一个实施方式中,该生物样品是一种血液样品。
在一个实施方式中,该方法包括检测受试者的至少一种生物样品中的一种或多种SARS-CoV-2抗原。在多个实施例中,将受试者生物样品中一种或多种本发明SARS-CoV-2抗原的水平与比较物比较。比较器的非限制性实施例包括但不限于阴性对照、阳性对照、受试者的预期正常背景值、受试者的历史正常背景值、受试者是其成员的群体的预期正常背景值或受试者是其成员的群体的历史正常背景值。
9.组合物的递送方法
本发明还涉及将该组合物递送至对其有需要的受试者的一种方法。该递送方法可以包括将该组合物给予该受试者。给予可以包括但不限于,具有和不具有体内电穿孔的DNA注射、脂质体介导的递送和纳米颗粒协助的递送。
接受组合物递送的哺乳动物可以是人、灵长类动物、非人灵长类动物、牛、牛、绵羊、山羊、羚羊、野牛、水牛、野牛、牛科(bovids)、鹿、天鹅、大象、美洲驼、羊驼、小鼠、大鼠和鸡。
该组合物可以通过不同的途径给予,包括口服、肠胃外、舌下、经皮、直肠、经粘膜、局部、经由吸入、经由口腔给予、胸腔内、静脉内、动脉内、腹膜内、皮下、肌内、鼻内、鞘内和关节内或其组合。对于兽医学用途,该组合物可以根据正常兽医学实践作为适合可接受的配制品给予。兽医可以容易地确定对于特定动物最适合的给药方案和给予途径。该组合物可以通过传统的注射器、无针注射装置、“微粒轰击消失枪”或其他物理方法如电穿孔(“EP”)、“流体动力学方法”或超声来给予。
电穿孔
经由电穿孔的组合物的给予可以使用电穿孔装置来完成,这些电穿孔装置可以被配置成递送能量脉冲至哺乳动物的所希望的组织,该能量脉冲有效引起在细胞膜中形成可逆的孔,并且优选地,该能量脉冲是类似于由用户输入的预设电流的恒定电流。电穿孔装置可包括电穿孔组件和电极组件或手柄组件。电穿孔组件可以包括和结合电穿孔装置的各种元件中的一个或多个,包括:控制器、电流波形发生器、阻抗测试仪、波形记录器、输入元件、状态报告元件、通信端口、存储器组件、电源和电源开关。电穿孔可以使用体内电穿孔装置来完成,例如CELLECTRA EP系统(Inovio Pharmaceuticals,Plymouth Meeting,PA)或Elgen电穿孔仪(Inovio Pharmaceuticals,Plymouth Meeting,PA),以促进质粒对细胞的转染。
电穿孔组件可充当电穿孔装置的一个元件,且其他元件是与电穿孔组件连通的单独元件(或组件)。电穿孔组件可充当电穿孔装置的多于一个元件,所述元件可与电穿孔装置的与电穿孔组件分离的其他元件通信。电穿孔装置的作为一个机电或机械装置的部件而存在的元件可不受限制,因为所述元件可充当一个装置或充当彼此连通的单独元件。电穿孔组件可能能够递送在所需组织中产生恒定电流的能量脉冲,并且包括反馈机制。该电极组件可以包括电极阵列,该电极阵列具有呈空间安排的多个电极,其中该电极组件从该电穿孔部件接收能量脉冲并且通过这些电极将其递送至所希望的组织。所述多个电极中的至少一个电极在能量脉冲的递送期间是中性的,并且测量所需组织中的阻抗并且将所述阻抗传送至电穿孔部件。反馈机制可以接收所测量的阻抗并且可以调节由电穿孔部件递送的能量的脉冲以维持恒定电流。
多个电极可以以分散模式输送能量脉冲。多个电极可在编程的序列下通过电极的控制以分散模式递送能量脉冲,并且编程的序列由用户输入到电穿孔组件。该编程序列可以包括依次递送的多个脉冲,其中该多个脉冲中的每个脉冲是由具有测量阻抗的一个中性电极的至少两个有源电极递送的,并且其中该多个脉冲中的一个随后的脉冲由至少两个有源电极中的一个不同的有源电极递送,该至少两个有源电极具有测量阻抗的一个中性电极。
反馈机制可由硬件或软件执行。反馈机制可由模拟闭环电路执行。反馈每50μs、20μs、10μs或1μs发生,但优选地是实时反馈或瞬时的(即,如通过用于确定响应时间的可用技术所确定的基本上瞬时的)。该中性电极可以测量所希望的组织中的阻抗并且将该阻抗传送到该反馈机制,并且该反馈机制响应于该阻抗并且调整能量脉冲以将该恒定电流维持在类似于该预设电流的值。反馈机制可在能量脉冲的传递期间连续地且瞬时地维持恒定电流。
可促进本发明组合物递送的电穿孔装置和电穿孔方法的实例包括描述于U.S.Draghia-Akii等人的美国专利号7,245,963,Smith等人提交的美国专利公开2005/0052630,其内容通过引用整体并入本文。可以用于促进组合物递送的其他电穿孔装置和电穿孔方法包括在共同待审和共同拥有的美国提供的那些。2007年10月17日提交的序列号为11/874072的专利申请,其在35USC 119(e)下要求2006年10月17日提交的U.S.临时申请序列No.60/852,149和2007年10月10日提交的No.60/978,982,它们全部以其整体结合在此。
Draghia-Akii等人的美国专利号7,245,963描述了模块化电极系统及其用于促进生物分子引入身体或植物中的所选组织的细胞中的用途。模块化电极系统可以包括多个针状电极;皮下注射针;电连接器,该电连接器提供从可编程的恒定电流脉冲控制器到该多个针状电极的导电链接;以及电源。操作者可以抓住安装在支撑结构上的多个针状电极并将它们牢固地插入身体或植物中的所选择的组织中。然后将生物分子经由皮下注射针递送到所选择的组织中。该可编程恒定电流脉冲控制器被激活并且恒定电流电脉冲被施加到该多个针状电极上。所施加的恒定电流电脉冲有助于将生物分子引入多个电极之间的细胞中。美国全部内容.专利号7,245,963通过引用结合在此。
Smith等人提交的美国专利公开2005/0052630描述了一种电穿孔装置,其可用于有效地促进生物分子引入身体或植物中选定组织的细胞中。电穿孔装置包括电动装置(“EKD装置”),其操作由软件或固件指定。该EKD装置基于用户控制和脉冲参数的输入在阵列中的电极之间产生一系列可编程恒定电流脉冲图案,并且允许存储和获取电流波形数据。电穿孔设备还包括具有针电极阵列的可替换电极盘、用于注射针的中心注射通道和可移除的引导盘。美国专利公开2005/0052630的全部内容通过引用结合在此。
在美国专利号7,245,963和美国专利公开2005/0052630中描述的电极阵列和方法可以适用于不仅深入渗透到组织(如肌肉)中,而且深入渗透到其他组织或器官中。由于电极阵列的构型,注射针(递送所选择的生物分子)也被完全插入靶器官中,并且注射垂直于靶问题被给予在由电极预先界定的区域中。电极描述于U.S.专利号7,245,963和美国专利公开2005/005263优选为20mm长和21号规格。
另外,考虑到在并入电穿孔装置及其用途的一些实施方式中,存在电穿孔装置,这些电穿孔装置是在以下专利中描述的那些:1993年12月28日授权的美国专利5,273,525、2000年8月29日授权的美国专利6,110,161、2001年7月17日授权的6,261,281以及2005年10月25日授权的6,958,060和2005年9月6日授权的美国专利6,939,862。此外,在此考虑了覆盖于2004年2月24日发布的美国专利6,697,669(涉及使用多种装置中的任一种递送DNA)以及于2008年2月5日发布的美国专利7,328,064(涉及注射DNA的方法)中提供的主题的专利。上述专利的全部内容以引用方式并入。
10.治疗方法
在此还提供了通过在对其有需要的受试者中产生合成抗体来治疗、保护免于和/或预防疾病的方法。该方法可以包括将该组合物给予该受试者。可以使用上述递送方法来向受试者给予该组合物。
在某些实施方式中,本发明提供了治疗SARS-CoV-2病毒感染的保护性和/或预防SARS-CoV-2病毒感染的方法。在一个实施方式中,该方法治疗、保护和/或预防与SARS-CoV-2病毒感染相关的疾病或病症。在一个实施方式中,该方法治疗、防止和/或防止COVID-19。
在一个实施方式中,该受试者患有SARS-CoV-2病毒感染或处于SARS-CoV-2病毒感染的风险中。
在受试者中产生合成抗体时,合成抗体可以结合抗原或与抗原反应。这种结合可以中和抗原,阻断另一分子(例如蛋白质或核酸)对抗原的识别,并引发或诱导对抗原的免疫应答,从而在受试者中治疗、保护对抗原和/或预防与抗原相关的疾病。
该合成抗体可以治疗、预防、和/或保护免受给予该组合物的受试者中的疾病。通过结合抗原的合成抗体可以治疗、预防和/或保护免于在给予组合物的受试者中的疾病。该合成抗体可以促进该疾病在给予该组合物的受试者中的存活。在一个实施方式中,该合成抗体可以在该受试者中提供该疾病的存活率增加,超过未给予该合成抗体的患有该疾病的受试者的预期存活率。在不同的实施例中,该合成抗体可以在给予该组合物的受试者中提供该疾病的存活率相对于在不存在该组合物的情况下的预期存活率的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的增加。在一个实施方式中,该合成抗体可以在受试者中提供针对疾病的超过未给予该合成抗体的受试者的预期保护的增加的保护。在不同的实施例中,该合成抗体可以在至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的受试者体内保护免受疾病,超过在不存在组合物的情况下的预期保护。
组合物剂量可以在1μg至10mg活性组分/kg体重/时间之间,并且可以是20μg至10mg组分/kg体重/时间。可以每1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31天给予该组合物。用于有效治疗的组合物剂量的数目可以是1、2、3、4、5、6、7、8、9或10。
在一个实施方式中,用本发明的抗SARS-CoV-2dMAB的免疫疗法将具有直接治疗效果。在一个实施方式中,使用本发明的抗SARS-CoV-2dMAB的免疫疗法可以用作免疫的“佐剂”治疗来降低病毒蛋白负荷,以便提供宿主免疫性并优化抗病毒药物的作用。
11.SARS-CoV-2抗原的组合
在一个实施方式中,本发明涉及SARS-CoV-2抗体或编码SARS-CoV-2抗体的核酸与编码SARS-CoV-2抗原的核酸分子联合给药。因此,在一些实施方式中,本发明涉及包含SARS-CoV-2抗体或编码SARS-CoV-2抗体的核酸与SARS-CoV-2抗原、其片段、变体的免疫原性组合物,例如疫苗。疫苗可用于保护抵御任何数量的SARS-CoV-2株,从而治疗、预防和/或保护抵御SARS-CoV-2感染或相关病理,包括COVID-19。该疫苗可以显著诱导给予该疫苗的受试者的免疫应答,从而保护免于和治疗SARS-CoV-2感染或相关病状,包括COVID-19。
疫苗可以是DNA疫苗、肽疫苗或DNA和肽疫苗的组合。DNA疫苗可包含编码SARS-CoV-2抗原的核酸序列。核酸序列可以是DNA、RNA、cDNA、其变体、其片段或其组合。核酸序列还可包括编码接头、前导序列或标签序列的其他序列,它们通过肽键与SARS-CoV-2抗原连接。肽疫苗可包括SARS-CoV-2抗原肽、SARS-CoV-2抗原蛋白、其变体、其片段或其组合。DNA和肽联合疫苗可包括上述编码SARS-CoV-2抗原和SARS-CoV-2抗原肽或蛋白质的核酸序列,其中SARS-CoV-2抗原肽或蛋白质和编码的SARS-CoV-2抗原具有相同的氨基酸序列。
在一些实施方式中,该疫苗可以在给予该疫苗的受试者中诱导体液免疫应答。诱导的体液免疫应答可以对SARS-CoV-2抗原具有特异性。诱导的体液免疫应答可与SARS-CoV-2抗原反应。体液免疫应答可以在给予该疫苗的受试者中诱导约1.5倍至约16倍、约2倍至约12倍或约3倍至约10倍。该体液免疫应答可以在给予该疫苗的该受试者中诱导至少约1.5倍、至少约2.0倍、至少约2.5倍,至少约3.0倍、至少约3.5倍、至少约4.0倍、至少约4.5倍、至少约5.0倍,至少约5.5倍、至少约6.0倍、至少约6.5倍、至少约7.0倍、至少约7.5倍,至少约8.0倍、至少约8.5倍、至少约9.0倍、至少约9.5倍、至少约10.0倍,至少约10.5倍、至少约11.0倍、至少约11.5倍、至少约12.0倍、至少约12.5倍,至少约13.0倍、至少约13.5倍、至少约14.0倍、至少约14.5倍、至少约15.0倍,至少约15.5倍或至少约16.0倍。
与未给予该疫苗的受试者相比,由该疫苗诱导的体液免疫应答可以包括与给予该疫苗的受试者相关联的增加水平的中和抗体。中和抗体可以特异性针对SARS-CoV-2抗原。中和抗体可以与SARS-CoV-2抗原反应。中和抗体可以在给予疫苗的受试者中提供针对COVID-19感染及其相关病状的保护和/或治疗COVID-19感染及其相关病状。
该疫苗诱导的体液免疫应答可以包括与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的IgG抗体的水平增加。这些IgG抗体可对SARS-CoV-2抗原具有特异性。这些IgG抗体可以与SARS-CoV-2抗原反应。优选地,体液应答对COVID-19的两种或多种株具有交叉反应性。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的IgG抗体的水平可以增加约1.5倍至约16倍、约2倍至约12倍或约3倍至约10倍。与给予疫苗的受试者相关的IgG抗体的水平可增加至少约1.5倍、至少约2.0倍、至少约2.5倍,至少约3.0倍、至少约3.5倍、至少约4.0倍、至少约4.5倍、至少约5.0倍,至少约5.5倍、至少约6.0倍、至少约6.5倍、至少约7.0倍、至少约7.5倍,至少约8.0倍、至少约8.5倍、至少约9.0倍、至少约9.5倍、至少约10.0倍,至少约10.5倍、至少约11.0倍、至少约11.5倍、至少约12.0倍、至少约12.5倍,至少约13.0倍、至少约13.5倍、至少约14.0倍、至少约14.5倍、至少约15.0倍,与未给予该疫苗的该受试者相比,至少约15.5倍或至少约16.0倍。
该疫苗可以在给予该疫苗的受试者中诱导细胞免疫应答。诱导的细胞免疫应答可以对SARS-CoV-2抗原具有特异性。诱导的细胞免疫应答可与SARS-CoV-2抗原反应。优选地,细胞应答对COVID-19的两个或更多个株具有交叉反应性。诱导的细胞免疫应答可以包括引发CD8+T细胞应答。引发的CD8+T细胞应答可以与SARS-CoV-2抗原反应。引出的CD8+T细胞应答可以是多官能的。诱导的细胞免疫应答可以包括引发CD8+T细胞应答,其中CD8+T细胞产生干扰素-γ(IFN-γ)、肿瘤坏死因子α(TNF-α)、白细胞介素-2(IL-2)或IFN-γ和TNF-α的组合。
与未给予该疫苗的受试者相比,诱导的细胞免疫应答可以包括与给予该疫苗的受试者相关的增加的CD8+T细胞应答。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD8+T细胞应答可以增加约2倍至约30倍、约3倍至约25倍或约4倍至约20倍。与给予该疫苗的受试者相关的CD8+T细胞应答可以增加至少约1.5倍、至少约2.0倍、至少约3.0倍,至少约4.0倍、至少约5.0倍、至少约6.0倍、至少约6.5倍、至少约7.0倍,至少约7.5倍、至少约8.0倍、至少约8.5倍、至少约9.0倍、至少约9.5倍,至少约10.0倍、至少约10.5倍、至少约11.0倍、至少约11.5倍、至少约12.0倍,至少约12.5倍、至少约13.0倍、至少约13.5倍、至少约14.0倍、至少约14.5倍,至少约15.0倍、至少约16.0倍、至少约17.0倍、至少约18.0倍、至少约19.0倍,至少约20.0倍、至少约21.0倍、至少约22.0倍、至少约23.0倍、至少约24.0倍,至少约25.0倍、至少约26.0倍、至少约27.0倍、至少约28.0倍、至少约29.0倍,或与未给予所述疫苗的受试者相比至少约30.0倍。
诱导的细胞免疫应答可以包括产生IFN-γ的CD3+CD8+T细胞的增加频率。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD3+CD8+IFN-γ+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍或20倍。
诱导的细胞免疫应答可以包括产生TNF-α的CD3+CD8+T细胞的增加频率。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD3+CD8+TNF-α+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍或14倍。
诱导的细胞免疫应答可以包括产生IL-2的CD3+CD8+T细胞的增加频率。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD3+CD8+IL-2+T细胞的频率可以增加至少约0.5倍、1.0倍、1.5倍、2.0倍、2.5倍、3.0倍、3.5倍、4.0倍、4.5倍或5.0倍。
诱导的细胞免疫应答可以包括产生IFN-γ和TNF-α两者的CD3+CD8+T细胞的增加频率。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD3+CD8+IFN-γ+TNF-α+T细胞的频率可以增加至少约25倍、30倍、35倍、40倍、45倍、50倍、55倍、60倍、65倍、70倍、75倍、80倍、85倍、90倍、95倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍或180倍。
由疫苗诱导的细胞免疫应答可以包括引发CD4+T细胞应答。引发的CD4+T细胞应答可与SARS-CoV-2抗原反应。引发的CD4+T细胞应答可以是多官能的。诱导的细胞免疫应答可以包括引发CD4+T细胞应答,其中CD4+T细胞产生IFN-γ、TNF-α、IL-2或IFN-γ和TNF-α的组合。
诱导的细胞免疫应答可以包括产生IFN-γ的CD3+CD4+T细胞的增加频率。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD3+CD4+IFN-γ+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍或20倍。
诱导的细胞免疫应答可以包括产生TNF-α的CD3+CD4+T细胞的增加频率。与未给予该疫苗的受试者相比,与给予该疫苗的受试者相关的CD3+CD4+TNF-α+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、21倍或22倍。
诱导的细胞免疫应答可以包括产生IL-2的CD3+CD4+T细胞的增加频率。与给予该疫苗的受试者相关的CD3+CD4+IL-2+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍,6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍,21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、32倍、33倍、34倍、35倍,与未给予该疫苗的受试者相比,36倍、37倍、38倍、39倍、40倍、45倍、50倍、55倍或60倍。
诱导的细胞免疫应答可以包括产生IFN-γ和TNF-α的CD3+CD4+T细胞的增加频率。与给予该疫苗的受试者相关的CD3+CD4+IFN-γ+TNF-α+的频率可增加至少约2倍、2.5倍、3.0倍、3.5倍,4.0倍、4.5倍、5.0倍、5.5倍、6.0倍、6.5倍、7.0倍、7.5倍、8.0倍、8.5倍,9.0倍、9.5倍、10.0倍、10.5倍、11.0倍、11.5倍、12.0倍、12.5倍、13.0倍、13.5倍,14.0倍、14.5倍、15.0倍、15.5倍、16.0倍、16.5倍、17.0倍、17.5倍、18.0倍、18.5倍,19.0倍、19.5倍、20.0倍、21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍,与未给予该疫苗的该受试者相比,32倍、33倍、34倍或35倍。
本发明的疫苗可以具有有效疫苗所需的特征,如是安全的,因此该疫苗本身不引起疾病或死亡;对由暴露于活病原体如病毒或细菌引起的疾病具有保护性;诱导中和抗体以预防细胞的发明;诱导针对细胞内病原体的保护性T细胞;并且提供了易于给予、很少的副作用、生物稳定性和低成本/剂量。
当给予不同组织如肌肉或皮肤时,该疫苗可以进一步诱导免疫应答。当通过电穿孔或注射或皮下或肌内给予时,该疫苗可以进一步诱导免疫应答。
SARS-CoV-2抗原
如上所述,疫苗包含SARS-CoV-2抗原、其片段、其变体、编码其的核酸分子或其组合。冠状病毒,包括SARS-CoV-2,被膜包封,并具有称为刺突(S)蛋白的1型膜糖蛋白,其在冠状病毒的表面上形成突出的刺突。刺突蛋白促进冠状病毒与位于细胞表面的蛋白质(例如,金属蛋白酶氨肽酶N)的结合,并且介导细胞-病毒膜融合。具体地,该刺突蛋白包含促进冠状病毒与细胞表面蛋白结合的S1亚基。因此,刺突蛋白的S1亚基控制哪些细胞被冠状病毒感染。该刺突蛋白还含有S2亚基,该S2亚基是促进病毒和细胞膜融合的跨膜亚基。因此,SARS-CoV-2抗原可包括SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白的S1亚基或SARS-CoV-2刺突蛋白的S2亚基。
在结合细胞表面蛋白和膜融合时,冠状病毒进入细胞并且其单链RNA基因组被释放到受感染细胞的细胞质中。该单链RNA基因组是正链,并且因此可以被翻译成RNA聚合酶,该RNA聚合酶产生另外的病毒RNA,这些病毒RNA是负链。因此,SARS-CoV-2抗原也可以是SARS-CoV-2RNA聚合酶。
病毒负RNA链被转录为更小的亚基因组正RNA链,其用于翻译其他病毒蛋白,例如核衣壳(N)蛋白、包膜(E)蛋白和基质(M)蛋白。因此,SARS-CoV-2抗原可包括SARS-CoV-2核衣壳蛋白、SARS-CoV-2包膜蛋白或SARS-CoV-2基质蛋白。
病毒负RNA链还可用于复制由核壳蛋白结合的病毒基因组。将基质蛋白连同穗蛋白整合进受感染细胞的内质网中。结合到病毒基因组上的核衣壳蛋白以及膜包埋的基质和刺突蛋白一起出芽到内质网的内腔中,由此将病毒基因组包裹在膜中。然后通过高尔基体囊泡将病毒子代运输至受感染细胞的细胞膜并且通过内吞作用释放到细胞外空间中。
在一些实施方式中,SARS-CoV-2抗原可以是SARS-CoV-2刺突蛋白、SARS-CoV-2RNA聚合酶、SARS-CoV-2核衣壳蛋白、SARS-CoV-2包膜蛋白、SARS-CoV-2基质蛋白、其片段、其变体或其组合。SARS-CoV-2抗原可以是衍生自两种或多种SARS-CoV-2刺突抗原、两种或多种SARS-CoV-2RNA聚合酶、两种或多种SARS-CoV-2核衣壳蛋白、两种或多种包膜蛋白、两种或多种基质蛋白或其组合的共有抗原。SARS-CoV-2共有抗原可经修饰以改善表达。修饰可包括密码子优化、RNA优化、加入kozak序列以增加翻译起始和/或加入免疫球蛋白前导序列以增加SARS-CoV-2抗原的免疫原性。在一些实施方式中,SARS-CoV-2抗原包括IgE前导序列,其可以是SEQ ID NO:141所示的氨基酸序列。
SARS-CoV-2刺突抗原
SARS-CoV-2抗原可以是SARS-CoV-2刺突抗原、其片段、其变体或其组合。SARS-CoV-2刺突抗原能在哺乳动物中引发针对一种或多种SARS-CoV-2株的免疫应答。SARS-CoV-2刺突抗原可包含使其作为免疫原特别有效的表位,可针对免疫原诱导抗SARS-CoV-2免疫应答。
SARS-CoV-2刺突抗原可以是衍生自两种或多种SARS-CoV-2株的共有序列。SARS-CoV-2刺突抗原可包含用于改善表达的共有序列和/或修饰。修饰可包括密码子优化、RNA优化、加入kozak序列以增加翻译起始和/或加入免疫球蛋白前导序列以增加SARS-CoV-2刺突抗原的免疫原性。SARS-CoV-2刺突抗原可包括信号肽,例如免疫球蛋白信号肽,例如但不限于免疫球蛋白E(IgE)或免疫球蛋白(IgG)信号肽。在一些实施方式中,SARS-CoV-2刺突抗原可包括血凝素(HA)标签。SARS-CoV-2刺突抗原可设计为引起比相应的密码子优化刺突抗原更强和更宽的细胞和/或体液免疫应答。
SARS-CoV-2共有刺突抗原可以是氨基酸序列SEQ ID NO:134。在一些实施方式中,SARS-CoV-2共有刺突抗原可以是在SEQ ID NO:134所示氨基酸序列的全长上具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
SARS-CoV-2共有刺突抗原可以是编码SEQ ID NO:134的核酸序列SEQ ID NO:133。在一些实施方式中,SARS-CoV-2共有刺突抗原可以是在SEQ ID NO:133所示核酸序列的全长上具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列。在其他实施例中,SARS-CoV-2共有刺突抗原可以是编码与SEQ ID NO:134所示氨基酸序列的全长具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列的核酸序列。
SARS-CoV-2共有刺突抗原可与IgE前导序列有效连接。与IgE前导序列可操作连接的SARS-CoV-2共有刺突抗原可以是氨基酸序列SEQ ID NO:136。在一些实施方式中,SARS-CoV-2共有刺突抗原可以是在SEQ ID NO:136中所示氨基酸序列的全长上具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
SARS-CoV-2共有刺突抗原可以是编码SEQ ID NO:136的核酸序列SEQ ID NO:135。在一些实施方式中,SARS-CoV-2共有刺突抗原可以是在SEQ ID NO:135所示核酸序列的全长上具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列。在其他实施例中,SARS-CoV-2共有刺突抗原可以是编码与SEQ ID NO:136所示氨基酸序列的全长具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列的核酸序列。
可以提供SEQ ID NO:134或SEQ ID NO:136的免疫原性片段。免疫原性片段可以包含SEQ ID NO:134或SEQ ID NO:136的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%。在一些实施方式中,免疫原性片段包括前导序列,例如免疫球蛋白前导序列,例如IgE前导序列。在一些实施方式中,免疫原性片段不含前导序列。
可以提供具有与SEQ ID NO:134或SEQ ID NO:136的免疫原性片段同源的氨基酸序列的蛋白质的免疫原性片段。此类免疫原性片段可以包含与SEQ ID NO:134或SEQ IDNO:13695%同源的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的蛋白质。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有96%同源性的免疫原性片段。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有97%同源性的免疫原性片段。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有98%同源性的免疫原性片段。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有99%同源性的免疫原性片段。在一些实施方式中,免疫原性片段包括前导序列,例如免疫球蛋白前导序列,例如IgE前导序列。在一些实施方式中,免疫原性片段不含前导序列。
一些实施例涉及SEQ ID NO:133或SEQ ID NO:135的免疫原性片段。免疫原性片段可以是SEQ ID NO:133或SEQ ID NO:135的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%。免疫原性片段可以与SEQ ID NO:133或SEQ ID NO:135的片段至少95%、至少96%、至少97%、至少98%或至少99%同源。在一些实施方式中,免疫原性片段包括编码前导序列的序列,例如免疫球蛋白前导序列,例如IgE前导序列。在一些实施方式中,片段不含编码前导序列的编码序列。
异常SARS-CoV-2刺突抗原
SARS-CoV-2抗原可以是异常SARS-CoV-2刺突抗原、其片段、其变体或其组合。异常SARS-CoV-2刺突抗原能在哺乳动物中引发针对一种或多种SARS-CoV-2株的免疫应答。异常SARS-CoV-2刺突抗原可包含使其作为免疫原特别有效的表位,可针对免疫原诱导抗SARS-CoV-2免疫应答。
异常SARS-CoV-2刺突抗原可以是衍生自两种或多种SARS-CoV-2株的共有序列。异常SARS-CoV-2刺突抗原可包含共有序列和/或修饰以改进表达。修饰可包括密码子优化、RNA优化、加入kozak序列以增加翻译起始和/或加入免疫球蛋白前导序列以增加异常SARS-CoV-2刺突抗原的免疫原性。异常SARS-CoV-2刺突抗原可包括信号肽,例如免疫球蛋白信号肽,例如但不限于免疫球蛋白E(IgE)或免疫球蛋白(IgG)信号肽。异常SARS-CoV-2刺突抗原可设计为引起比相应刺突抗原更强和更宽的细胞和/或体液免疫应答。
异常SARS-CoV-2刺突抗原可以是氨基酸序列SEQ ID NO:138。在一些实施方式中,异常SARS-CoV-2刺突抗原可以是在SEQ ID NO:138所示氨基酸序列的全长上具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
异常SARS-CoV-2刺突抗原可以是编码SEQ ID NO:138的核酸序列SEQ ID NO:137。在一些实施方式中,异常SARS-CoV-2刺突抗原可以是在SEQ ID NO:137所示核酸序列的全长上具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列。在其他实施例中,异常SARS-CoV-2刺突抗原可以是编码与SEQ ID NO:138所示氨基酸序列的全长具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列的核酸序列。
异常SARS-CoV-2刺突抗原可与IgE前导序列有效连接。与IgE前导序列有效连接的异常SARS-CoV-2刺突抗原可以是氨基酸序列SEQ ID NO:140。在一些实施方式中,异常SARS-CoV-2刺突抗原可以是在SEQ ID NO:140所示氨基酸序列的全长上具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
异常SARS-CoV-2刺突抗原可以是编码SEQ ID NO:140的核酸序列SEQ ID NO:139。在一些实施方式中,异常SARS-CoV-2刺突抗原可以是在SEQ ID NO:139中所示核酸序列的全长上具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列。在其他实施例中,异常SARS-CoV-2刺突抗原可以是编码与SEQ ID NO:140所示氨基酸序列的全长具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列的核酸序列。
可以提供SEQ ID NO:138或SEQ ID NO:140的免疫原性片段。免疫原性片段可以包含SEQ ID NO:138或SEQ ID NO:140的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%。在一些实施方式中,免疫原性片段包括前导序列,例如免疫球蛋白前导序列,例如IgE前导序列。在一些实施方式中,免疫原性片段不含前导序列。
可以提供具有与SEQ ID NO:138或SEQ ID NO:140的免疫原性片段同源的氨基酸序列的蛋白质的免疫原性片段。此类免疫原性片段可以包含与SEQ ID NO:138或SEQ IDNO:140 95%同源的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的蛋白质。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有96%同源性的免疫原性片段。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有97%同源性的免疫原性片段。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有98%同源性的免疫原性片段。一些实施例涉及与本文的蛋白质序列的免疫原性片段具有99%同源性的免疫原性片段。在一些实施方式中,免疫原性片段包括前导序列,例如免疫球蛋白前导序列,例如IgE前导序列。在一些实施方式中,免疫原性片段不含前导序列。
一些实施例涉及SEQ ID NO:137或SEQ ID NO:139的免疫原性片段。免疫原性片段可以是SEQ ID NO:137或SEQ ID NO:139的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%。免疫原性片段可以与SEQ ID NO:137或SEQ ID NO:139的片段至少95%、至少96%、至少97%、至少98%或至少99%同源。在一些实施方式中,免疫原性片段包括编码前导序列的序列,例如免疫球蛋白前导序列,例如IgE前导序列。在一些实施方式中,片段不含编码前导序列的编码序列。
12.在组合中的用途
本发明还提供了一种通过给予合成抗体和治疗剂的组合来治疗、保护免受、和/或预防对其有需要的受试者的疾病的方法。在一个实施方式中,该治疗剂是一种抗病毒剂。在一个实施方式中,治疗剂是抗生素剂。在一个实施方式中,该治疗剂是一种SARS-CoV-2疫苗。在一个实施方式中,治疗剂是小分子药物或生物制剂。
该合成抗体和治疗剂可以使用任何适合的方法来给予,这样使得该合成抗体和治疗剂的组合都存在于该受试者中。在一个实施方式中,该方法可以包括通过上文详细描述的任何方法给予包含本发明的合成抗体的第一组合物,并且在给予该合成抗体之后少于1天、少于2天、少于3天、少于4天、少于5天、少于6天、少于7天、少于8天、少于9天或少于10天给予包含治疗剂的第二组合物。在一个实施方式中,该方法可以包括通过上文详细描述的任何方法给予包含本发明的合成抗体的一种第一组合物并且在给予该合成抗体之后超过1天、超过2天、超过3天、超过4天、超过5天、超过6天、超过7天、超过8天、超过9天或超过10天给予包含治疗剂的一种第二组合物。在一个实施方式中,该方法可以包括在给予治疗剂之后少于1天、少于2天、少于3天、少于4天、少于5天、少于6天、少于7天、少于8天、少于9天或少于10天,给予包含治疗剂的第一组合物和给予包含本发明的合成抗体的第二组合物。在一个实施方式中,该方法可以包括在给予该治疗剂之后多于1天、多于2天、多于3天、多于4天、多于5天、多于6天、多于7天、多于8天、多于9天或多于10天,给予包含治疗剂的第一组合物和给予包含本发明的合成抗体的第二组合物。在一个实施方式中,该方法可以包括通过上文详细描述的任何方法同时给予包含本发明的合成抗体的第一组合物和包含治疗剂的第二组合物。在一个实施方式中,该方法可以包括通过上文详细描述的任何方法同时给予包含本发明的合成抗体的第一组合物和包含治疗剂的第二组合物。在一个实施方式中,该方法可以包括给予包含本发明的合成抗体和治疗剂的单一组合物。
可以与本发明的合成抗体组合使用的抗生素的非限制性实施例包括氨基糖苷类(例如,庆大霉素、阿米卡星、妥布霉素)、喹诺酮类(例如,环丙沙星、左氧氟沙星)、头孢菌素类(例如,头孢他啶、头孢吡肟、头孢哌酮、头孢匹罗、头孢比罗)、抗假单胞菌青霉素类:羧苄青霉素类(例如,羧苄青霉素和替卡西林)和脲青霉烯类(例如,美洛西林、阿洛西林和哌拉西林)、碳青霉烯类(例如,美罗培南、亚胺培南、多尼培南)、多粘菌素类(例如,多粘菌素B和粘菌素)以及单环内酰胺类(例如,氨曲南)。
13.体外和离体产生合成抗体
在一个实施方式中,合成抗体在体外或离体产生。例如,在一个实施方式中,可以在体外或离体细胞中引入并且表达编码合成抗体的核酸。将基因引入和表达至细胞中的方法是本领域已知的。在表达载体的背景下,该载体可以通过本领域中的任何方法容易地引入宿主细胞(例如,哺乳动物、细菌、酵母或昆虫细胞)中。例如,表达载体可以通过物理、化学或生物方法转移到宿主细胞中。
用于将多核苷酸引入宿主细胞的物理方法包括磷酸钙沉淀、脂转染、粒子轰击、显微注射、电穿孔等。用于产生包含载体和/或外源核酸的细胞的方法是本领域熟知的。参见,例如,Sambrook et al.(2012,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory,New York)。将多核苷酸引入宿主细胞的优选方法是磷酸钙转染。
用于将目的多核苷酸引入宿主细胞的生物方法包括使用DNA和RNA载体。病毒载体,尤其是逆转录病毒载体,已成为将基因插入哺乳动物(例如人)细胞的最广泛使用的方法。其他病毒载体可以来源于慢病毒、痘病毒、单纯疱疹病毒I、腺病毒和腺相关病毒等。参见例如美国专利号5,350,674和5,585,362。
用于将多核苷酸引入宿主细胞的化学手段包括胶体分散体系统,如大分子复合物、纳米胶囊、微球、珠粒和基于脂质的系统,包括水包油乳液、胶束、混合胶束和脂质体。在体外和体内用作递送载体的示例性胶体系统是脂质体(例如,人工膜囊泡)。
在使用非病毒递送系统的情况下,示例性递送运载体是脂质体。考虑使用脂质配制品用于将核酸引入宿主细胞(体外、离体或体内)。在另方面,核酸可以与脂质结合。与脂质相关联的核酸可以包封在脂质体的水性内部中,散布在脂质体的脂质双层内,经由与脂质体和寡核苷酸两者相关联的连接分子附接至脂质体,包埋在脂质体中,与脂质体复合,分散在含有脂质的溶液中,与脂质混合,与脂质组合,作为悬浮液包含在脂质中,包含胶束或与胶束复合,或以其他方式与脂质相关联。与脂质、脂质/DNA或脂质/表达载体相关的组合物不限于溶液中的任何特定结构。例如,它们可以作为胶束存在于双层结构中,或具有“塌陷的”结构。它们也可以简单地散布在溶液中,可能形成尺寸或形状不均匀的聚集体。脂质是可以是天然存在的或合成的脂质的脂肪物质。例如,脂质包括天然存在于细胞质中的脂肪滴以及含有长链脂肪烃和它们的衍生物(如脂肪酸、醇、胺、氨基醇和醛)的化合物的类别。
本发明具有多个方面,通过以下非限制性实施例说明。
14.实施例
在以下实施例中进一步说明本发明。应当理解,这些实施例虽然指示本发明的优选实施例,但仅通过说明的方式给出。从以上讨论和这些实施例中,本领域技术人员可以确定本发明的本质特征,并且在不背离其精神和范围的情况下,可以对本发明进行各种改变和修改以使其适应各种用途和条件。因此,除了本文所示和所述的那些之外,根据前面的描述,本发明的各种修改对于本领域技术人员将是显而易见的。此类修改还旨在落入所附权利要求书的范围内。
实施例1:使用合成DNA体内生产针对SARS-CoV-2/COVID-19的单克隆抗体
CR3022是结合SARS-CoV-2的交叉反应性单克隆Ab(mAb)。CR3022结合受体结合结构域(RBD)内的SARS-CoV刺突(S)蛋白上的表位。
开发了针对SARS-CoV-2病毒的优化的DNA编码单克隆抗体(dMAB),用于预防、治疗和/或诊断用途,包括治疗或预防SARS-CoV-2介导的疾病(例如COVID-19)。使用新的工程化方法来开发用于体内递送具有增强的产生(表达、加工、组装、分泌)的抗SARS-CoV-2/COVID-19mAb的dMAB:1)Ig基因(重链/HC和轻链/LC)序列在核酸水平(DNA和RNA)优化,2)优化的IgG前导序列置于基因之前以确保分泌到循环中,和3)使用包含各种组分以确保转录物加工的修饰的pVax表达载体(图1)。
在体外共转染CR3022LC和HC质粒导致CR3022 IgG1抗体的产生和分泌,抗体在培养上清液蛋白质印迹中检测到并且通过ELISA定量(图2)。
体外表达的CR3022 dMAB显示出与SARS-CoV-2刺突(S)蛋白的适当结构域结合(图3)。与先前报道一致,它结合受体结合结构域(RBD)的重组版本。RBD位于S蛋白的较大亚单元1(S1)结构域内,因此,CR3022 dMAB也结合重组S1(图3)。
体内表达动力学的分析示出了在双质粒给予/电穿孔之后,人CR3022IgG1 dMAB在小鼠中的一致且持久的表达(图4)。
来自经由电穿孔给予CR3022 dMAB的小鼠的血清通过ELISA展示出与重组SARS-CoV-2RBD和S1结构域的结合(图5)。
实施例2:使用合成DNA体内生产针对SARS-CoV-2/COVID-19的单克隆抗体
开发了针对SARS-CoV-2病毒的优化的DNA编码的单克隆抗体(dMAB)用于预防、治疗和/或诊断用途(例如,用于治疗COVID-19疾病)。开发了DMAB用于使用单一质粒或双重质粒系统体内递送具有增强的产生(表达、加工、组装、分泌)的抗SARS-CoV-2/COVID-19mAb(图6)。
S309LC和HC质粒在体外的共转染导致结合SARS-CoV-2刺突蛋白受体结合结构域(RBD)的中和抗体的产生和分泌(图7)。
体外转染2130、2381和2196dMAB质粒导致dMAB的表达并结合SARS-CoV-2刺突(S)蛋白的合适结构域(图8和图9)。体内表达动力学的分析显示在给予/电穿孔之后2130、2381和2196dMAB的一致且持久的表达(图10)。经由电穿孔给予2130、2381和2196个dMAB的小鼠的血清通过ELISA证明了与重组SARS-CoV-2RBD和S1结构域的结合(图11)。最后,修饰的dMAB(2196_MOD dMAB)展示体内表达并且具有比亲本2196WT dMAB更有效的中和(图12)。
实施例3:抗SARS-CoV-2刺突糖蛋白的新型单克隆抗体:作为治疗COVID-19患者的潜在用途
据报道,SARS-CoV-2病毒的刺突蛋白结合其受体ACE2。靶向病毒表面蛋白上的易损位点的mAb作为针对感染性疾病的有希望的药物类别日益已知并且已经显示出针对许多病毒的治疗效力(Wang et al.,2020a)。与此一致,鉴定和克隆能特异性靶向表面病毒蛋白以阻断病毒进入宿主细胞的mAb似乎是用于预防和治疗SARS-CoV-2的非常有吸引力的方法(Chen et al.,2020)。SARS-CoV-2的刺突蛋白经历主要的构象改变,并暴露RBD和受体结合的重要残基,以接合宿主细胞受体ACE2。因此,RBD与ACE2受体蛋白的结合导致S1从S2脱离,最终导致由S2介导的病毒-宿主膜融合以及病毒的进入。因此,刺突蛋白在SARS-CoV-2进入宿主细胞的感染过程中的作用是高度关键的,因此是开发有效mAbs的高效靶标(Chen等,2020)。针对SARS-CoV-2以及其他包膜病毒的抗体应答通常包括针对病毒包膜糖蛋白和针对核蛋白的IgM、IgG和IgA抗体。针对包膜蛋白的IgG抗体表现出不同的功能特征,这使得它们能够提供针对病毒的最有效的全身性抗体应答(French and Moodley,2020)。
不受理论束缚,假设包括疫苗和抗体的免疫治疗方法可以为患者提供益处。在此方面,来自从疾病恢复的患者的血浆已经用于治疗严重病情的COVID-19患者(Ni et al.,2020;Zhang et al.,2020)。这促进了用于治疗用途的针对刺突蛋白的抗体的发展。在本研究中,开发并成功克隆了10个SARS-CoV-2-刺突蛋白特异性的IgG mAb。为了有效,抗体应该满足若干特征,包括特异性、与抗原的高亲和力结合以及与结合受体ACE2的刺突蛋白竞争的能力,由此阻断病毒对细胞的感染。发现所有10种mAb与SARS-CoV-2-RBD具有特异性和强结合。此外,它们还引起SARS-CoV-2-RBD和ACE2受体之间的相互作用的阻断。此外,抗体(尤其是WCoVA7)的糖组谱表明它们具有高Fc介导的效应子功能。因此,需要进一步检查这些抗体的Fc介导的效应子功能。此外,它们还引起SARS-CoV-2-RBD和ACE2受体之间的相互作用的阻断。此外,所有10个IgG克隆均表现出SARS-CoV-2蛋白假型病毒感染的有效中和,其最低IC50值在2.6ng/ml获得,大部分小于10ng/ml。此外,在本研究中,显示这些IgG克隆有效地中和SARS-CoV-2-D614G突变病毒,其中4个表现出小于10ng/ml的IC50值。就中和效力而言,显著降低的IC50值强烈地表明这些刺突抗体对SARS-CoV-2的高潜力。值得注意的是,已经报道了SARS-CoV-2-刺突蛋白中的许多不同天然存在的变体。最初的发现暗示由于COVID-19引起的增加的致死率可以与D614G(最显性的变体)相联系。据推测,这种突变可以导致刺突蛋白的构象改变,最终导致增强的感染性(Li et al.,2020)。不受理论束缚,假设这种不同程度的感染性和传递性可能归因于在本研究中在野生型和D614G突变的SARS-CoV-2病毒之间对SARS-CoV-2-刺突中和抗体观察到的不同反应性。总之,这些抗SARS-CoV-2-刺突-ACE2阻断性mAb具有显著的潜力,因此可以进一步探索这些抗SARS-CoV-2-刺突-ACE2阻断性mAb作为对抗这种严重世界大流行的特异性治疗选择。
在此呈现的结果强调被动免疫疗法对于COVID-19的治疗的潜在效用。抗SARS-CoV-2刺突蛋白的单克隆抗体的鉴定和表征增加了一套有价值的药剂,具有治疗潜力。在所描述的10种mAb中,它们全部表现出针对刺突的RBD的特异性和高亲和力。因此,单克隆抗体具有优于使用来自从COVID-19恢复的患者的康复期多克隆血清的优点。虽然这些mAb是彼此独立的,但是这些抗体所识别的表位是不清楚的。抗体的功能特征显示它们中和SARS-CoV-2刺突蛋白假型病毒的能力,这是它们对病毒的作用的替代量度。抗体应在SARS-CoV-2病毒感染研究中进行评估。开发针对刺突抗原和表位的独特和特异性mAb是必需的,因为它们将能够使用“鸡尾酒”(特异性生物活性mAb的混合物)来同时接合病毒颗粒上的多个中和表位用于增强的治疗效力。此外,生物活性抗SARS CoV-2中和性mAb的开发还可提供关于抗原中的表位的信息,所述表位作为开发用于预防目的的活性疫苗的可能靶标。此外,高度有效的SARS-CoV-2-刺突mAb具有充当来自预防和治疗两方面的候选生物制剂以及用于开发高临床意义的SARS-CoV-2特异性诊断测定的工具的潜力。
现在描述所使用的材料和方法
细胞培养
HEK293T细胞从ATCC获得,并且CHO-ACE2细胞系(在细胞表面上稳定表达ACE2)从美国Creative Biolabs获得。将两种细胞类型维持在D10培养基中,该培养基由具有热灭活的胎牛血清(10%)、谷氨酰胺(3mM)、青霉素(100U/ml)和链霉素(100U/ml)的杜尔贝科改良的伊格尔培养基(Invitrogen Life Science Technologies,USA)组成。包含RPMI1640(Invitrogen Life Science Technologies,USA)、热灭活的胎牛血清(10%)、谷氨酰胺(3mM)、青霉素(100U/ml)和链霉素(100U/ml)的R10培养基用于小鼠脾细胞。将所有细胞维持在37℃和5%CO2。
SARS-CoV-2-刺突合成DNA和蛋白质的构建
SARS-CoV-2-刺突质粒DNA编码构建体通过比对PubMed数据库中可用的RBD蛋白序列来确定。将对应于免疫原插入物的序列遗传优化用于增强在人中的表达,并且添加IgE前导序列以促进表达(Muthumani et al.,2016)。设计合成疫苗构建体并提供给商业供应商(Genscript,NJ,USA)进行合成。然后将插入片段亚克隆到修饰的pMV101表达载体中,在巨细胞病毒立即早期启动子的控制下,如先前所描述(Muthumani et al.,2015;Muthumaniet al.,2016)。
抗SARS-CoV-2杂交瘤的产生和评价
在第0天和第14天,通过肌内免疫途径,接着皮下递送重组刺突-RBD蛋白(100μg/小鼠),以50μg/小鼠,用SARS-CoV-2-刺突抗原的合成共有序列免疫Balb/c小鼠。收集来自免疫小鼠的血清,通过ELISA评价,检测靶向SARS-CoV-2刺突的抗体的存在。在确认之后,将小鼠脾细胞用于产生如前所述的杂交瘤(Choi et al.,2020)。随后,通过间接ELISA表征阳性杂交瘤克隆,并且将选择的那些进一步亚克隆和扩增。从杂交瘤上清液中纯化抗体并用于进一步的研究。
酶联免疫吸附测定(ELISA)
用mAb克隆进行ELISA测定,以便测量靶抗原结合。为了测量杂交瘤上清液中的总IgG,将MaxiSorp高结合96孔ELISA板(ThermoFisher,USA)用1μg/mL重组SARS-CoV-2-RBD(Sino Biological,USA)以及全长斯皮克在4℃包被过夜。在用PBS中的10%FBS封闭1小时后,将这些板与连续稀释的mAb克隆一起孵育,使用具有1%FBS的PBS孵育2小时。然后用偶联至辣根过氧化物酶(HRP)的抗小鼠IgG抗体(Sigma Aldrich,USA)以1:20,000稀释度探测样品1小时。此后,将四甲基联苯胺(TMB)底物(Sigma Aldrich,USA)添加至所有孔中并且孵育10分钟。然后使用2N H2SO4来停止该反应。最后,在ELISA酶标仪(Biotek,USA)的帮助下在450nm下测量光密度。此外,还测定了所有mAb克隆的SARS-CoV-2-RBD和全长刺突特异性抗体平均终点效价。在S/N(信号/阴性)比率≥2.1的最高稀释度下测定滴度。与无关的无关mAb与抗原结合的阴性对照相比,该信号被命名为与SARS-CoV-2-RBD或全长刺突阳性结合。阴性对照中的OD450是两个技术重复的平均值并且被指定为IgG mAb克隆的抗体终点滴度。
蛋白质印迹分析
进行结合Western印迹分析以评估抗CoV-2mAb结合特异性。简言之,在12%NuPAGE Novex聚丙烯酰胺凝胶(Invitrogen Life Science Technologies,USA)中运行5μg内部产生的重组人SASR-CoV-2-全长斯派克(刺突)和2.5μg的SARS-CoV-2-RBD(SinoBiological Inc,USA)蛋白并且将其转移至PVDF膜(Invitrogen Life ScienceTechnologies,USA)上。使用Odyssey封闭缓冲液(LiCor BioSciences,USA)封闭这些膜,并且然后与来自mAb克隆的上清液在4℃下孵育过夜。孵育后,用包含0.05%Tween20的PBS或PBST洗涤膜。随后,膜用IRDye800山羊抗小鼠二抗(LiCor BioSciences,USA)在RT染色,然后再用PBST洗涤。最后,使用LI-COR Odyssey CLx成像仪扫描这些膜。此外,为了测定mAb克隆的重链和轻链表达,进行这种测定,其中将6ng的每种mAb克隆在12%NuPAGENovex聚丙烯酰胺凝胶(Invitrogen Life Science Technologies,USA)中运行并且随后用山羊抗小鼠IgG二抗(LiCor BioSciences,USA)探测。
SARS-CoV-2-刺突单克隆抗体克隆与RBD蛋白结合的SPR(表面等离振子共振)分析
使用Biacore T200 SPR系统测量mAb克隆与SARS-CoV-2-刺突蛋白的结合。使用对羧甲基葡聚糖传感器芯片(CMD200L,Xantec Bioanalytics)的标准胺偶联程序,用10m MHEPES(pH7.4)、150mMNaCl、0.05%Tween20的运行缓冲液固定SARS-CoV-2-RBD(SinoBiological Inc,USA)蛋白。简言之,首先用0.1M硼酸钠(pH9.0)、1MNaCl洗涤芯片,随后使用MilliQ蒸馏水的流动缓冲液用EDC/NHS活化8min。在活化之后,10μg/mL的每种蛋白质在10mM乙酸钠(pH5)中直到达到所希望的固定水平。将大约2500RUSAR-CoV-RBD蛋白固定在流动池上。还将5000RU的牛血清白蛋白(BSA)固定至充当阴性对照的另流动池。固定后,用pH8.5的1M乙醇胺封闭剩余的活化位点。然后将运行缓冲液切换到10mM HEPES(pH7.4)、150mMNaCl、0.05% Tween20。在三种不同浓度下一式两份地(0.13nM、0.41nM和1.2nM)测试每个IgG mAb克隆。在运行缓冲液中制备稀释液。结合时间是300s并且解离时间是600s,具有30μL/min的流速和20℃的测量温度。每次注射后,通过注射20mM甘氨酸(pH2.0)60秒来再生表面。收集数据并且使用Biacore评估软件进行分析。此外,在Biacore T200SPR系统中使用蛋白A/G包被的羧甲基葡聚糖传感器芯片(Xantec Bioanalytics,Germany)测定SARS-CoV-2-RBD与IgG mAb克隆结合的动力学参数。对于每一浓度的抗原,在芯片表面上捕获大约400RU的每个mAb克隆。在从0-100nM的浓度范围内测试SARS-CoV-2-RBD并且流速为30μL/min。用400RU的小鼠IgG同种型对照涂覆参考表面。缔合时间是210秒并且解离时间是900秒。在每次浓缩抗原后,使用20mM甘氨酸pH2.0从芯片上除去抗体-抗原复合物。数据是两次测定的平均值,并且使用BiacoreT200评估软件中的1:1结合模型测定动力学参数。
聚糖分析
使用AmiconUltra-0·5离心过滤器单元(Millipore Sigma)浓缩500μl的杂交瘤上清液。将来自三只C57BL/6小鼠和人血浆样品(Innovative Research)的大量IgG用作对照。使用PierceTMProteinG旋转板纯化总IgG用于IgG筛选(Thermo Fisher),并且使用Amicon Ultra-0·5离心过滤单元(Millipore Sigma)进一步浓缩IgG。按照制造商的方案,使用肽-N-糖苷酶F(PNGaseF)释放N-聚糖并且使用Glycan AssureAPTS试剂盒(ThermoFisher)用8-氨基芘-1,3,6-三磺酸(APTS)标记。使用3500遗传分析仪毛细管电泳系统对标记的N-聚糖进行分析。通过计算每种聚糖结构的曲线下面积除以总聚糖来量化IgG聚糖结构的相对丰度。
SARS-CoV-2-替代病毒中和测定
SARS-CoV-2-替代病毒中和试验试剂盒(Genscript,USA)用于检测mAb中和SARS-CoV-2-RBD和ACE2相互作用的潜力。它是确定抗SARS-CoV-2的循环中和抗体的不依赖于物种和同种型的阻断ELISA检测工具,抗体可以阻断RBD和人ACE2受体之间的蛋白质-蛋白质相互作用。简言之,将500ng/ml的每种mAb克隆和对照用HRP缀合的RBD(HRP-RBD)在37℃预孵育30分钟,以促进mAb克隆与HRP-RBD之间的结合。随后,将该混合物添加至预涂覆有人ACE2受体蛋白的捕获板中并且在37℃下孵育15分钟。在使用洗涤溶液(Genscript,USA)洗涤板后,将TMB底物添加至所有孔并且孵育15分钟。然后,向每个孔中加入终止溶液(Genscript,USA)以终止反应。最后,使用ELISA酶标仪(Biotek,USA)在450nm下测量吸光度,并且确定抑制值。基于通过Genscript,USA验证的一组确认的COVID-19患者血清和健康对照血清,考虑20的截断值。
基于流式细胞术的受体结合抑制测定
还使用可商购的CHO-ACE2细胞系通过基于流式细胞术的测定来评估SARS-CoV-2-刺突蛋白与ACE2受体结合的抑制。对于此测定,将2.5ug/ml S1+S2 ECD-his标记的(SinoBiological,USA)与10个IgG mAb克隆(500ng/ml)中的每一个在冰上孵育60分钟。然后将混合物转移到已经铺板的CHO-ACE2细胞(150,000个细胞/孔)中,并且然后在冰上再次孵育90min。随后,将细胞用PBS洗涤两次,随后用APC偶联的抗his抗体(Abcam,USA)染色。将用重组人ACE2(Invitrogen Life Science Technologies,USA)预孵育的刺突蛋白用作阳性对照。从LSR11流式细胞仪(BDBiosciences)获得所有数据,并在FlowJo软件(版本10;TreeStar,USA)。
SARS-CoV-2假病毒产生和中和测定
通过使用Gene Jammer(Agilent,USA)在D10培养基中以1:1比率的编码SARS-CoV-2刺突蛋白(GenScript,USA)的DNA质粒和主链质粒pNL4-3.Luc.R-E-(NIHAIDS试剂)共转染HEK293T细胞来产生SARS-CoV-2假病毒。转染后48小时收获含有假病毒的上清液并且用FBS富集至12%的总体积,steri过滤并且储存在-80℃下。使用稳定的可商购的CHO-ACE2细胞系滴定假病毒。对于中和测定,将100μLD10培养基中的10,000个CHO-ACE2细胞铺板在96孔板中并且在中和测定之前在37℃和5%CO2下静置过夜。第二天,将连续稀释的样品与SARS-CoV-2假病毒在室温下孵育90分钟,之后将该混合物添加至已经接种的CHO-ACE2细胞中。将细胞在37℃和5%CO2下孵育72小时,并且随后收获并用BriteLite试剂(PerkinElmer,USA)裂解。用BioTek读板仪记录来自板的发光并用于计算每次稀释时样品的中和百分比。
统计分析
使用GraphPadPrism软件,通过学生t检验或非参数斯皮尔曼(Spearman)相关性检验进行统计分析,用于计算统计显著性。数据表示为平均值±平均值的标准误差(SEM)。对于所有测试,认为p值<0.05是显著的。
现在描述实验结果
靶向SARS-CoV-2-刺突的抗体的产生和表征
越来越多的证据表明,冠状病毒中和抗体(NAb)由于其高度特异性抗病毒活性和安全性而在治疗多种范围的感染性疾病中表现出高功效。值得注意的是,SARS-CoV和MERS-CoVRBD-疫苗研究揭示了在体内环境中的强多克隆抗体反应,其引起病毒进入的抑制,暗示了抗刺突抗体抑制SARS-CoV-2冠状病毒进入的高潜力(Ju et al.,2020;Shi et al.,2020)。
在本研究中,Balb/c小鼠用编码全长SARS-CoV-2-刺突抗原的共有序列(Smith etal.,2020)作为初免和SARS-CoV-2-刺突-RBD重组蛋白的共有序列的合成DNA质粒构建体免疫,如前所述(Choi et al.,2020)。用于免疫和后续程序的策略和步骤概述于图13A-B中。最后,从免疫的小鼠的脾中分离B淋巴细胞,并用于产生杂交瘤。为了分析来自免疫动物的血清,如图14A所示产生全长穗蛋白表达构建体。使用在C-末端具有Fc标签和Avi标签的哺乳动物细胞系统表达SARS-CoV-2刺突全长蛋白,并且通过SDS-PAGE和HPLC技术验证其大小和纯度(图14B-C)。全长刺突蛋白(160KDa)在SDS-PAGE凝胶上的正确位置显示清晰条带。还发现该蛋白质具有高纯度,如从HPLC获得的尖锐单峰所表明的。此外,使用来自接种SARS-CoV-2刺突DNA的小鼠的免疫血清,通过ELISA证实蛋白特异性(图14D)。产生800个以上的杂交瘤,然后筛选杂交瘤以确定能够产生针对SARS-CoV-2刺突蛋白具有最高亲和力的抗体的克隆。这种筛选导致鉴定最好的10种IgG mAb(WCoVA1、WCoVA2、WCoVA3、WCoVA4、WCoVA5、WCoVA6、WCoVA7、WCoVA8、WCoVA9和WCoVA10)。mAb的同种型分析显示具有IgG1的WCoVA1、WCoVA2、WCoVA3、WCoVA4、WCoVA7和WCoVA8克隆,而具有IgG2a的WCoVA5、WCoVA6、WCoVA9和WCoVA10克隆。进一步评价单个杂交瘤克隆的结合和特异性。
SARS-CoV-2刺突单克隆抗体的结合和特异性分析
针对重链和轻链表达,通过蛋白质印迹分析确认抗体特异性(图14E)。此外,通过间接ELISA研究这些mAb结合SARS-CoV-2全长刺突以及RBD的能力。结果显示所有mAb特异性且强烈地结合全长刺突和RBD蛋白,而未观察到与非特异性(NSP)对照的结合。图15A显示了IgG克隆的剂量依赖性结合曲线,其由相对于mAb克隆的不同稀释度绘制的平均ELISA信号表示。所有克隆显示出高终点滴度而没有任何背景(图15B)。此外,mAb克隆的结合特异性也通过蛋白质印迹分析证实。对于该分析,加载SARS-CoV-2-RBD蛋白,并随后用材料和方法部分中所述的等浓度mAb克隆探测。发现显示所有10个mAb克隆与SARS-CoV-2-RBD蛋白特异性结合(图15C)。
通过表面等离子体共振分析对SARS-CoV-2-刺突抗体及其靶标的动力学分析
表面等离子体共振结合分析提供了用于mAb抗原结合表征的重要工具。通过SPR分析SARS-CoV-2刺突的mAb克隆及其靶RBD区的结合动力学。最初,通过胺偶联将CoV-S-RBD固定在羧甲基葡聚糖传感器芯片上。使用重组ACE2测试SARS-CoV-2-RBD在固定化后是有功能的。所有mAb克隆以0.13nM、0.41nM和1.3nM浓度测试,10个克隆中的9个显示与SARS-CoV-2-RBD的剂量依赖性结合(图16)。然后进一步表征这9个mAb克隆以确定相互作用的动力学参数。对于该实验,将mAb克隆固定在蛋白A/G传感器芯片上,其允许估计固定在芯片表面上的活性抗体。考虑到抗体和SARS-CoV-2-RBD之间的MW比率,抗体的靶固定水平是400RU,这将产生80RU的理论Rmax。这些克隆的传感图显示在图15D中,并且所有9个IgG mAb克隆的结合动力学值总结在表1中。在所有9个IgG mAb克隆的情况下,获得非常低的KD值(<1nM),这强烈指示它们与SARS-CoV-2-RBD蛋白的高亲和力相互作用。WCoVA9具有最高的亲和力和最慢的解离速率。这些克隆中的三个(WCoVA5、WCoVA8和WCoVA9)具有大于预期Rmax的100%的Rmax值。这表明这些抗体可结合2个SARS-CoV-2-RBD分子/抗体分子。这些克隆中的三个(WCoVA1、WCoVA2和WCoVA4)具有约50%的预期Rmax的Rmax值。
表1:通过使用标准胺偶联固定SARS-CoV-2-RBD通过SPR分析IgG mAb克隆及其靶SARS-CoV-2-RBD的结合动力学。
SARS-CoV-2-刺突mAb抑制血管紧张素转化酶2(ACE2)
Shang和组在其研究中报道了SARS-CoV-2刺突蛋白RBD与ACE2复合的晶体结构并显示SARS-CoV-2RBD中的ACE2结合脊具有紧密构象(Shang et al.,2020)。具有靶向SARS-CoV-2RBD能力的NAb具有阻断ACE2被病毒结合的潜力,并且防止病毒进入并且可能保护细胞在治疗上免受感染(Walker et al.,2020)。因此,靶向SARS-CoV-2刺突蛋白和ACE2受体之间的相互作用的治疗活性mAb对于筛选杂交瘤是感兴趣的。因此,在阻断ELISA的帮助下评估这些mAb是否可以阻断SARS-CoV-2-RBD和ACE2之间的相互作用。结果显示mAb克隆能以可变效率有效地阻断SARS-CoV-2-RBD-ACE2相互作用(图17A)。在这个测定中,总共5个克隆(WCoVA4、WCoVA5、WCoVA6、WCoVA7以及WCoVA8)能够引起SARS-CoV-2-RBD和ACE2相互作用的超过70%的抑制。然后评估鉴定的SARS-CoV-2-刺突IgG mAb作为病毒进入的抑制剂的潜力。为此目的,使用基于流式细胞术的测定来测试这些mAb克隆对SARS-CoV-2刺突蛋白与CHO-ACE2细胞的结合的干扰。如通过流式细胞术所示,四个mAb克隆(WCoVA4、WCoVA5、WCoVA7和WCoVA8)阻断SARS-刺突与ACE2的结合(图17B和图17C)。
SARS-CoV-2-刺突抗体中和SARS-CoV-2假病毒
NAb具有通过阻断病毒的复制周期来抑制病毒感染的能力(Tong etal.,2020)。因此,使用开发的假病毒中和测定(Smith et al.,2020)评估SARS-CoV-2-刺突mAb的功能。如所预期的,通过阳性对照ACE2-Ig以0.9μg/mL的IC50值观察到假病毒中和,但在阴性对照鼠抗体TA99的情况下没有。由10个IgG mAb克隆中的10个分泌的抗体能够以最低样品稀释(10倍)中和超过50%的野生型(图18A)和D614G突变病毒(图18B)两者。此外,评估这些克隆的IC50值,这表明它们有效地阻断感染。mAb克隆;观察到WCoVA4、WCoVA7、WCoVA9和WCoVA10针对野生型病毒最有效,IC50值分别为6.9ng/ml、2.6ng/ml、4.9ng/ml和5.0ng/ml。此外,发现WCoVA1、WCoVA2、WCoVA3和WCoVA4对D614G突变病毒具有更高的功效,IC50值分别为8.85ng/ml、5.05ng/ml、7.93ng/ml和6.42ng/ml(图18C)。而且,观察到这些SARS-CoV-2-刺突mAb的ELISA滴度与中和滴度之间的显著相关性(图18D)。这些结果表明这些mAb的抗病毒活性增加与它们与RBD的结合亲和力增加相关,但是它们的详细相互作用需要进一步研究。
SARS-CoV-2抗体的糖组分析
抗体的非中和性Fc介导的效应子功能,包括抗体依赖性细胞毒性(ADCC),在控制病毒感染中发挥重要作用(Alpert et al.,2012;Baum etal.,1996;Bhiman and Lynch,2017;Bruel et al.,2016;Chung et al.,2011;Halper-Strobng and Nussenzweig,2016;Isitman et al.,2016;Lee and Kent,2018;Madhavi et al.,2015)。抗体糖基化强烈影响其效应子功能。核心岩藻糖的存在导致与Fcγ受体IIIA的较弱结合并降低ADCC(Masudaetal.,2007)。虽然核心岩藻糖对ADCC具有最显著的影响,但是其他糖原学特征也已经显示影响ADCC:末端唾液酸降低ADCC,(Naso et al.,2010;Raju,2008;Raju和Scallon,2007)等分GlcNAc诱导先天免疫功能和炎症(Davies et al.,2001;Takahashi etal.,2009;Umana et al.,1999)和末端半乳糖诱导ADCC(图19A)(Thomann et al.,2016)。检查WCoVA5、WCoVA7、WCoVA8、WCoVA9和WCoVA10的糖基化作用。与大量C57BL/6IgG相比,所有这些抗体(尤其是WCoVA7)具有更低水平的核心岩藻糖、更低水平的唾液酸以及更高水平的等分GlcNac(图19B-D)。此外,WCoVA5、WCoVA7、和WCoVA9具有高水平的末端半乳糖(图19B-图19E)。这种糖原谱(尤其对于WCoVA7)表明这些抗体将具有高Fc介导的效应子功能。
表2提供了向下选择的抗体的特征的概述。
表2:向下选择的抗体的特征
抗体-抗原对接的计算表征
基于总体特异性,选择克隆WCoVA7和WCoVA9用于测序,并且扩增重链和轻链两者。然后将这些序列用作抗体-抗原对接的工具。使用AbYmod预测WCoVA7和WCoVA9可变区的结构。SARS-CoV-2刺突结构从蛋白质数据库(PDB:6VYB)获得,并且在ZDOCK服务器用抗体复合物对SARS-CoV-2刺突蛋白建模。ZDOCK执行详尽的基于网格的搜索以用于两个分量蛋白质的对接模式(Pierce et al.,2011)。当抗体移动时,在输出预测中SARS-CoV-2刺突蛋白是静止的。抗体-抗原对接揭示,WCoVA7抗体结合至RBD结构域的界面(图20A-C),而WCoVA9抗体结合至N端结构域(NTD)与RBD结构域之间的界面(图20B)。
表3:WCoVA7的V(D)J结的IMGT分析
表4:WCoVA9的V(D)J结的IMGT分析
实施例4:抗体和dMAB序列
实施例5:快速开发用于COVID-19的合成DNA疫苗
SARS-CoV-2刺突序列与SARS-CoV刺突蛋白(Wrapp et al.,2020,Science,eabb2507)的序列和结构最相似,与MERS-CoV刺突蛋白共享总体蛋白质折叠结构(图21)。与HIV和流感糖蛋白不同,冠状病毒三聚体刺突的融合前形式是构象动态的,很少完全暴露受体结合位点(Kirchdoerfer et al.,2018,Sci Rep,8:15701)。受体结合位点是中和抗体的易损靶标。事实上,靶向受体结合结构域(RBD)的MERSnAb倾向于具有比其他表位更大的中和效力(Wang et al.,2018,J Virol,92:e02002-17)。最近的报道表明,中和性抗SARS抗体可与SARS-CoV-2的RBD交叉反应(Tian et al.,2020,Emerg Microbes Infect,9:382-385)。这些数据表明,SARS-CoV-2RBD是疫苗开发的重要靶标。最近的数据显示SARS-CoV-2S蛋白结合与SARS-CoVS蛋白相同的宿主受体血管紧张素转化酶2(ACE-2)(Wrapp et al.,2020,Science,eabb2507)。
此处,描述了SARS-CoV-2合成DNA疫苗候选物的设计和初始临床前测试。在用候选疫苗体外转染COS和293T细胞后,分别显示了SARS-CoV-2S抗原RNA和蛋白质的表达。在小鼠和豚鼠中跟踪由所选择的免疫原诱导免疫,测量血清和肺液中的SARS-CoV-2S蛋白特异性抗体水平,以及对ACE2结合的竞争性抑制。INO-4800疫苗诱导可在单次免疫后数天内观察到的细胞和体液宿主免疫应答,包括针对SARS-CoV的交叉反应性应答。总之,数据显示靶向SARS-CoV-2S蛋白的SARS-CoV-2合成DNA疫苗候选物的免疫原性支持进一步的翻译研究,以快速加速该候选物的发展以应对当前的全球健康危机。
新的冠状病毒,SARS-CoV-2,和相关的COVID-19疾病迅速传播,并已成为全球大流行。这里,描述了基于合成DNA的SARS-CoV-2疫苗,INO-4800的加速临床前发展以对抗这种新兴的传染性疾病。合成DNA疫苗设计和合成是在2020年1月11日公开释放SARS-CoV-2基因组序列后立即开始的。本文所述的大部分体外和体内研究是在SARS-CoV-2基因组序列变得可用的6周内进行的。数据支持INO-4800合成DNA疫苗候选物在多种动物模型中的表达和免疫原性。在单次剂量之后在小鼠中观察到体液和T细胞应答。在豚鼠中,采用临床递送参数并且在单次剂量后观察抗体滴度。
阻止迅速出现的传染病需要来自全球健康群体的协调反应,并且需要改进的策略来加速疫苗开发。响应于2019/2020冠状病毒爆发,快速开发高度可适应的合成DNA药物平台。用于新抗原的合成DNA疫苗的设计和制造是这样一种方法,其中将靶抗原序列插入高度表征和临床测试的质粒载体骨架(pGX0001)中。优化构建体设计和工程化参数以用于体内基因表达。
选择SARS-CoV-2S蛋白作为抗原靶。SARS-CoV-2S蛋白是I类膜融合蛋白,它是冠状病毒表面上的主要包膜蛋白。初步研究表明SARS-CoV-2与其宿主受体(ACE-2)的相互作用可以被抗体阻断(Zhou et al.,2020,Nature,579:270–273)。在小鼠和豚鼠模型中的体内免疫原性研究揭示了INO-4800免疫动物的血清中的S蛋白反应性IgG的水平。除了全长S1+S2和S1之外,INO-4800免疫诱导RBD结合抗体,即已知是来自SARS-CoV康复期患者的中和抗体的靶标的结构域(Zhu et al.,2007,Proc Natl Acad Sci U S A,104:12123-12128;Heet al.,2005,Virology,334:74-82)。在此呈现的实验进一步证明了这些抗体的功能性,这是通过在来自INO-4800免疫动物的血清存在下竞争性抑制SARS-CoV-2刺突蛋白与ACE2受体结合。重要的是,抗SARS-CoV-2结合抗体在免疫INO-4800的小鼠和豚鼠的肺洗液中检测到。肺中这些抗体的存在具有保护免受这些组织感染并防止LRD的潜力,LRD与COVID-19的严重病例相关。除了体液应答之外,已经显示细胞免疫应答与MERS-CoV感染中更有利的恢复相关(Zhao etal.,Sci Immunol,2:eaan5393),并且可能针对SARS-CoV感染是重要的(Ohet al.,2012,Emerg Microbes Infect,1:e23)。在此,实验显示早在疫苗递送后第7天诱导针对SARS-CoV-2的T细胞应答。快速细胞应答具有降低病毒载量的潜力,并可能潜在地减少SARS-CoV-2和相关的COVID-19疾病的传播。
除了INO-4800在单次免疫后快速引发体液和细胞应答的能力之外,合成的DNA药物平台具有几个协同特性,这些特性使其很好地响应疾病爆发,如COVID-19。如前所述,设计和合成候选疫苗构建体的能力意味着体外和体内测试可以潜在地在接受病毒序列的几天内开始,从而允许对疫苗发展的加速反应。用于DNA质粒生产的明确定义和确立的生产方法导致快速且可扩展的生产方法,该方法具有避免在卵或细胞培养物中传统疫苗生产的复杂性的潜力。与DNA生产相关的商品成本也显著低于目前针对基于mRNA的技术所见的成本。最近已经公开了关于通过使用优化的DNA制剂提供的稳定性概况的报告(Tebas et al.,2019,J Infect Dis,220:400-410)。稳定性特征意味着DNA药物产品是非冷冻的并且可以在2℃-8℃下储存4.5年,在37℃下室温储存1年和1周,同时在60℃以上的温度下维持效力。在大流行爆发的情况下,疫苗的稳定性概况直接发挥其以有效且可执行的方式部署和贮存的能力。
虽然疫苗诱导的免疫病理学已经作为SARS和MERS候选疫苗,以及可能SARS-CoV-2疫苗的潜在关注而提出,但这些关注可能是疫苗平台依赖性的,并且迄今为止,对于小鼠或非人灵长动物模型中的MERSDNA疫苗(Muthmani et al.,2015,Sci Transl Med,7:301ra13)或小鼠中的SARSDNA疫苗(Yang et al.,2004,Nature,428:561-564),尚未报道免疫发病的证据。已经报道了SARS-CoV攻击后全灭活病毒(IV)、重组蛋白、肽和/或重组病毒载体疫苗的以Th2相关嗜酸性粒细胞增多为特征的肺免疫病理学(Tseng et al.,2012,PLoS One,7:e35421;Iwata-Yoshikawa et al.,2014,J Virol,88:8597-8614;Bolles etal.,2011,J Virol,85:12201-12215;Yasui et al.,2008,J Immunol,181:6337-6348;Wang et al.,2016,ACS Infect Dis,2:361-376),并且最近在MERS-CoV激发模型中(Agrawal et al.,2016,Hum Vaccin Immunother,12:2351-2356)。然而,还报道了SARS-CoV和MERS-CoV疫苗的无肺免疫病理学的保护功效(Yang et al.,2004,Nature,428:561-564;Muthmani et al.,2015,Sci Transl Med,7:301ra132;Luoetal.,2018,Virol Sin33,201-204;Qin et al.,2006,Vaccine,24:1028-1034;Roberts et al.,2010,ViralImmunol 23,509-519;Deng et al.,2018,Emerg Microbes Infect,7:60;Zhang et al.,2016,Cell Mol Immunol,13:180-190;Luke et al.,2016,Sci Transl Med,8:326ra321;Darnell et al.,2007,J Infect Dis,196:1329-1338)。重要的是注意到证明CoV疫苗诱导的免疫病理学的大多数研究利用了BALB/c小鼠,一种已知优先发展Th2型应答的模型。DNA疫苗平台诱导Th1型免疫应答并且在呼吸道感染模型中已经证明不具有免疫病理学的功效,这些模型包括SARS-CoV(Yang et al.,2004,Nature,428:561-564)、MERS-CoV(Muthumani et al.,2015,Sci Transl Med,7:301ra132)和RSV(Smith et al.,2017,Vaccine,35:2840-2847)。未来的研究将评估INO-4800免疫动物中的疫苗增强的疾病。
正在进行另外的临床前研究以进一步表征小动物和大动物中的INO-4800。试剂的可用性是开发针对新出现的感染性疾病的疫苗的主要挑战,并且这限制了在这个早期研究中在动物模型中报告抗体的活病毒中和活性的能力。然而,在此报道,使用替代中和测定,INO-4800诱导的抗体阻断SARS-CoV-2刺突与宿主受体ACE2的结合。使用活病毒中和测定的其他研究为抗体功能性的研究提供信息,并且证明INO-4800免疫介导动物对抗病毒激发的保护的能力。
总之,描述SARS-CoV-2候选疫苗INO-4800的免疫原性的结果是有希望的,在单剂量疫苗后的早期时间点测量抗体和T细胞水平特别令人鼓舞,支持该疫苗的进一步评估。
现在描述用于实验的材料和方法
细胞系
从ATCC(Old Town Manassas,VA)获得人胚肾(HEK)-293T和COS-7细胞系。将所有细胞系维持在补充有10%胎牛血清(FBS)和青霉素-链霉素的DMEM中。
体外RNA表达(qRT-PCR)
通过用连续稀释的质粒转染COS-7,随后使用逆转录和PCR分析从细胞中提取的总RNA来证明质粒的体外mRNA表达。使用6转染试剂(Promega)进行四种浓度的质粒的转染,这导致最终质量范围在80ng与10ng/孔之间。一式两份进行转染。孵育18至26小时后,将细胞用RLT缓冲液(Qiagen)裂解。使用Qiagen RNeasy试剂盒按照试剂盒说明从每个孔中分离总RNA。通过OD260/280测定所得RNA浓度,并且将RNA的样品稀释至10ng/μL。然后使用高容量cDNA逆转录(RevT)试剂盒(Applied Biosystems)遵循试剂盒说明书将一百纳克RNA转化为cDNA。包含RNA但不包含逆转录酶(负RT)的RevT反应作为质粒DNA或细胞基因组DNA样品污染的对照。然后使用特异性针对靶序列的引物和探针对八μL的样品cDNA进行PCR。在单独的反应中,使用针对COS-7细胞系β-肌动蛋白序列设计的引物和探针对相同量的样品cDNA进行PCR。使用Quant Studio7Flex实时PCRStudio系统(Applied Biosystems),首先使样品在95℃下经受1分钟的保持,并且然后进行40个循环的PCR,其中每个循环由在95℃下的1秒和在60℃下的20秒组成。PCR后,如下分析扩增结果。针对其各自的适应症中的每一个检查阴性转染对照、负RevT对照和NTC。使用自动阈值设置由QuantStudio软件产生INO-4800COVID-19靶mRNA和β-肌动蛋白mRNA的每个转染浓度的阈值周期(CT)。如果与阴性转染对照相比,在任何质粒转染孔中的表达大于5CT,则认为质粒对于mRNA表达是活性的。
体外蛋白质表达(蛋白质印迹)
如前所述培养和转染人胚肾细胞,293T(Yan et al.,2007,MolTher,15:411-421)。遵循制造商的方案,使用TurboFectin8.0(OriGene)转染试剂,用pDNA转染293T细胞。48小时后,使用经修饰的RIPA细胞裂解缓冲液收获细胞裂解液。将蛋白质在4%-12%BIS-TRIS凝胶(Thermo Fisher Scientific)上分离,然后在转移之后,将印迹与抗SARS-CoV刺突蛋白多克隆抗体(Novus Biologicals)孵育,然后用辣根过氧化物酶(HRP)结合的抗小鼠IgG(GE Amersham)可视化。
转染的293T细胞的免疫荧光
对于刺突蛋白表达的体外染色,将293T细胞在4-孔载玻片(Lab-Tek)上培养并且使用Turbo Fectin8.0(OriGene)转染试剂遵循制造商的方案用3μg/孔的pDNA进行转染。在室温(RT)下用10%中性缓冲的福尔马林(BBC Biochemical,Washington State)转染10分钟之后将细胞固定48小时并且然后用PBS洗涤。在染色之前,将室载玻片在室温下用在PBS中的0.3%(v/v)Triton-X(Sigma)、2%(v/v)驴血清封闭1小时。将细胞用在PBS中的1%(w/v)BSA(Sigma)、2%(v/v)驴血清、0.3%(v/v)Triton-X(Sigma)和0.025%(v/v)1gml-1叠氮化钠(Sigma)中稀释的兔抗SARS-CoV刺突蛋白多克隆抗体(Novus Biologicals)在室温下染色2小时。将载玻片在PBS中洗涤3次,持续5分钟,并且然后在RT下用驴抗兔IgGAF488(生命技术)染色1小时。将载玻片再次洗涤并且安装并且用DAPI-Fluoroment覆盖(SouthernBiotech)。
动物
雌性、6周龄C57/BL6和BALB/c小鼠购自Charles River Laboratories(Malvern,PA)和The Jackson Laboratory(Bar Harbor,ME)。雌性8周龄Hart1ey豚鼠购自Elm HillLabs(Chelmsford,MA)。对于小鼠研究,在第0天,通过针注射随后体内电穿孔(EP)向胫骨前肌(TA)给予2.5、10或25μg pDNA的剂量。EP递送由具有0.2Amp恒定电流的两组脉冲组成。第二脉冲组延迟3秒。在每组内,存在两个52ms脉冲,在脉冲之间具有198ms延迟。在第0天和第14天收集血液。在免疫后第4天、第7天和第10天连续处死平行组的小鼠用于分析细胞免疫应答。对于豚鼠研究,在第0天,通过Mantoux注射随后体内EP向皮肤给予100μgpDNA。在第0天和第14天收集血液。对于ACE2竞争ELISA和肺支气管肺泡灌洗,在第0和14天对小鼠和豚鼠免疫两次。第二次免疫后14天收集小鼠的血清,第二次免疫后28天收集豚鼠。
抗原结合ELISA
进行ELISA以确定血清抗体结合滴度。在4℃下,用1μg ml-1重组蛋白抗原在Dulbecco磷酸盐缓冲盐水(DPBS)中包被NuncELISA板过夜。将板洗涤三次,然后在37℃下用在具有0.05% Tween20的DPBS中的3%牛血清白蛋白(BSA)封闭2小时。然后洗涤板,并用小鼠或豚鼠血清的连续稀释液孵育,并在37℃下孵育2小时。再次洗涤板,并且然后用1:10,000稀释的辣根过氧化物酶(HRP)轭合的抗豚鼠IgG二抗(Sigma-Aldrich,cat)孵育。A7289)或(HRP)偶联的抗小鼠IgG二抗(Sigma-Aldrich)并在RT温育1小时。最终洗涤后,使用SureBlueTM TMB1-Component Peroxidase Substrate(KPL,cat.52-00-03)对板进行显影。并且用TMB终止溶液(KPL,cat.50-85-06)终止反应。使用SynergyHTX(BioTekInstruments,Highland Park,VT)在30分钟内在450nm波长下读取板。如前所述在BagarazziM等人中计算结合抗体终点效价(EPT)。2012(Bagarazzi et al.,2012,SciTranslMed,4:155ra138)。测试的结合抗原包括SARS-CoV-2抗原:S1刺突蛋白(SinoBiological 40591-V08H)、S1+S2ECD刺突蛋白(Sino Biological 40589-V08B1)、RBD(University of Texas,at Austin(McLellan Lab.));SARS-COV抗原:刺突S1蛋白(SinoBiological40150-V08B1)、S(1-1190)(Immune Tech IT-002-001P)和刺突C端(MeridianLife Science R18572)。
ACE-2竞争ELISA
小鼠
进行ELISA以确定血清IgG抗体用具有人Fc标签的人ACE2的竞争。在室温下,用1μg/ml兔抗His6X在1XPBS中包被NuncELISA板4-6小时,并且用洗涤缓冲液(1XPBS和0.05%Tween20)洗涤4次。将板在4℃下用封闭缓冲液(1XPBS,0.05% Tween20,5%蒸发奶和1%FBS)封闭过夜。将板用洗涤缓冲液洗涤四次,然后与含有C-末端His标签的全长(S1+S2)刺突蛋白(Sino Biologics,cat 40589-V08B1)一起孵育。在室温下,以10ug/ml进行1小时。将板洗涤并且然后将纯化的小鼠IgG与0.1ug/ml具有人Fc标签的重组人ACE2(ACE2-IgHu)混合的连续稀释物在室温下孵育1-2小时。再次洗涤板,并且然后用1:10,000稀释的辣根过氧化物酶(HRP)轭合的抗人IgG二抗(Bethyl,cat A80-304P)孵育。并且在室温下温育1小时。最终洗涤后,使用1-StepUltraTMB-ELISA底物(Thermo,cat.34029)对板进行显影。并且用1M硫酸终止反应。使用Spectra Ma xPlus384酶标仪(Molecular Devices,Sunnyvale,CA)在30分钟内在450nm波长下读取板。将竞争曲线作图并且使用Prism8分析软件用多个t检验计算曲线下面积(AUC)以确定统计显著性。
豚鼠
将96孔半面积测定板(Costar)用25μl/孔的在1xDPBS(Thermofisher)中稀释的5μg/mL的SARS-CoV-2穿刺S1+S2蛋白(Sion Biological)在4℃包被过夜。用具有0.05%TWEEN(Sigma)的1xPBS缓冲液洗涤板。添加100μl/孔的在具有0.05% TWEEN的1xPBS中的3%(w/v)BSA(Sigma),并且在37℃下孵育1小时。在具有0.05% TWEEN的1xPBS中的1%(w/v)BSA中以1:20稀释血清样品。在洗涤测定板后,添加25μl/孔的稀释的血清并且在37℃下孵育1小时。将人类重组ACE-2-Fc标签(Sino biological)直接添加至稀释的血清,随后在37℃下孵育1小时。洗涤板,并将25μl/孔的1:10,000稀释的山羊抗huFc片段抗体HRP(bethyl)添加至测定板。将板在室温下孵育1小时。为了显影,使用SureBlue/TMB终止溶液(KPL,MD),并且在450nm下记录O.D.。
支气管肺泡灌洗收集
通过用700-1000ul冰冷的PBS(包含100μmEDTA、0.05%叠氮化钠、0.05% Tween-20、和1x蛋白酶抑制剂(Pierce))(具有平端针头的粘膜制备溶液(MPS))洗涤安乐死的和放血的小鼠的肺来收集支气管肺泡灌洗(BAL)流体。将豚鼠肺用20ml的MPS经由插入到气管中的16G导管进行洗涤。将采集的BAL液体储存在-20C下直到测定时。
IFN-γELISpot
将来自小鼠的脾单独地收集在补充有10%FBS(R10)和青霉素/链霉素的RPMI1640培养基中并且加工成单细胞悬浮液。将细胞沉淀重悬于5mLACK裂解缓冲液(LifeTechnologies,Carlsbad,CA)中,RT5分钟,然后加入PBS以终止反应。将样品在1,500g下再次离心10min,将细胞沉淀重悬于R10中,并且然后在用于ELISpot测定之前使其穿过45μm尼龙过滤器。使用小鼠IFN--γELISpotPLUS板(MABTECH)进行ELISpot测定。将用捕获抗体预包被的96孔ELISpot板在4℃下用R10培养基封闭过夜。将200,000个小鼠脾细胞铺板到每个孔中,并且用15-mer肽池(与来自SARS-CoV-2、SARS-CoV或MERS-CoV刺突蛋白的9个氨基酸重叠)刺激20小时(每个蛋白5个肽池)。此外,使用设计用于鉴定免疫显性应答的基质中的肽库进行基质作图。将细胞用在RPMI+10%FBS(R10)中每孔5μL的每种肽的终浓度进行刺激。这些斑点是基于制造商的说明而开发的。R10和细胞刺激混合物(Invitrogen)分别用于阴性和阳性对照。通过ImmunoSpot CTL读取器扫描并量化斑点。通过减去阴性对照孔计算每百万个细胞的斑点形成单位(SFU)。
流式细胞术
在37℃、5%CO2下,对收获自BALB/c和C57BL/6(用跨越SARS-CoV-2S蛋白的重叠肽进行小鼠评估)的脾细胞进行细胞内细胞因子染色6小时。用以下抗体将细胞染色:FITC抗小鼠CD107a、PerCP-Cy5.5抗小鼠CD4(BD Biosciences)、APC抗小鼠CD8a(BDBiosciences)、ViViD染料(Fixed Viole Dead Cell Stain kit;Invitrogen,L34955)、APC-Cy7抗小鼠CD3e(BD Biosciences)和BV605抗小鼠IFN-γ(eBiosciences)。将肉豆蔻酸佛波酯(PMA)用作阳性对照,并且仅将完全培养基用作阴性对照。洗涤、固定细胞,并且使用FACSCANTO(BD Biosciences),随后进行FlowJo软件(FlowJoLLC,Ashland,OR)分析获取细胞事件。
结构建模
SARS-CoV和MERS-CoV的结构模型由PDB ID 6acc和5x59构建,以便装配具有下构象的所有三个RBD的融合前模型。SARS-CoV-2结构模型使用SARS-CoV结构(PDB id:6acc)作为模板构建。采用罗塞塔重塑模拟制备合适的氨基酸突变,并构建SARS-CoV结构中未结构限定的SARS-CoV-2环的从头模型(Huang等,2011,PLoSOne,6:e24109)。允许邻近环的氨基酸位置改变主链构象以适应新的环。结构图使用PyMOL制备。
统计
使用GraphPadPrism7或8软件(LaJolla,CA)进行所有统计分析。如果p<0.05,则这些数据被认为是显著的。所有曲线图中的线表示平均值并且误差条表示标准偏差。没有样品或动物被排除在分析之外。对于动物研究没有进行随机化。在进行每个实验之前,样品和动物不致盲。
现在描述实验结果
COVID-19合成DNA疫苗构建体的设计和合成
从公布于GISAID(Global Initiative on Sharing All Influenza Data)的前四个可用的SARS-CoV-2全基因组序列中检索四个刺突蛋白序列。三个刺突序列是100%匹配的并且一个被认为是离群值(与其他序列具有98.6%序列同一性)。进行序列比对后,产生SARS-CoV-2刺突糖蛋白序列,加入N-末端IgE前导序列。使用Inovio专有的计算机基因优化算法来产生编码SARS-CoV-2IgE-刺突的高优化DNA序列,以增强表达和免疫原性。合成优化的DNA序列,用BamHI和XhoI消化,并在人巨细胞病毒立即早期启动子和牛生长激素聚腺苷酸化信号的控制下克隆到表达载体pGX0001中。所得质粒命名为pGX9501和pGX9503,分别设计用于编码来自3个匹配序列和异常值序列的SARS-CoV-2S蛋白(图22A)。
COVID-19合成DNA疫苗构建体的体外表征
在用pGX9501和pGX9503转染的COS-7细胞中,在RNA水平上测量编码的SARS-CoV-2刺突转基因的表达。使用从转染的COS-7细胞中提取的总RNA,通过RT-PCR证实了穗转基因的表达(图22B)。使用细胞裂解物上的抗SARS-CoVS蛋白的交叉反应性抗体,通过蛋白质印迹分析测量HEK-293T细胞中的体外刺突蛋白表达。用pGX9501或pGX9503构建体转染的HEK-293T细胞的裂解物的蛋白质印迹揭示了与预测的S蛋白分子量(140-142kDa)近似的条带(图22C)。在免疫荧光研究中,在用pGX9501或pGX9503转染的293T细胞中检测到S蛋白(图22D)。总之,体外研究揭示了用候选疫苗构建体转染细胞系后,刺突蛋白在RNA和蛋白水平上的表达。
在用INO-4800免疫的小鼠中测量的对SARS-CoV-2S蛋白抗原的体液免疫应答
选择pGX9501作为疫苗构建体以进行免疫原性研究,由于与异常值相比,其将可能提供的更宽的覆盖范围,pGX9503。pGX9501随后称为INO-4800。在给予TA肌肉之后跟随递送装置的BALB/c小鼠中评估INO-4800的免疫原性。针对一组SARS-CoV-2和SARS-CoV抗原,测量来自一组用INO-4800免疫的小鼠的血清的反应性(图23)。分析显示在INO-4800免疫小鼠的血清中IgG结合SARS-CoV-2S蛋白抗原,与SARS-CoVS蛋白抗原具有有限的交叉反应性。在用pDNA免疫的小鼠中测量针对重组SARS-CoV-2刺突蛋白S1+S2区域(图24A和图24B)和重组SARS-CoV-2刺突蛋白受体结合结构域(RBD)(图24C和图24D)的血清IgG结合终点滴度。在用单剂量的INO-4800免疫后第14天,在小鼠血清中观察到终点滴度(图24B-图24D)。
诱导能够抑制刺突蛋白宿主受体接合的抗体是SARS-CoV-2疫苗开发的关键目标。因此,设计实验以检查INO-4800诱导的抗体应答的受体抑制功能。最近,开发了基于ELISA的ACE2抑制测定作为中和的替代物。该测定原则上与已经针对冠状病毒验证的其他替代中和测定相似(罗森(Rosen)et al.,2019,病毒学方法杂志(JVirol Methods),265:77-83)。作为测定中的对照,显示ACE2能以0.025μg/ml的EC50结合SARS-CoV-2刺突蛋白(图25A)。BALB/c小鼠在第0天和第14天用10μg的INO-4800免疫,并且在免疫后第28天纯化血清IgG以确保抑制是抗体介导的。比较使用来自初次接受实验的小鼠和来自INO-4800接种疫苗的小鼠的血清IgG的刺突-ACE2相互作用的抑制(图25B)。用免疫的五只小鼠的组重复受体抑制测定,并且显示INO-4800诱导的抗体与ACE2竞争结合SARS-CoV-2刺突蛋白(图25C和图26)。ACE2被认为是SARS-CoV-2细胞进入的主要受体,阻断这种相互作用表明INO-4800诱导的抗体可以预防宿主感染。
在皮内递送INO-4800之后在豚鼠中检测对SARS-CoV-2S蛋白的体液免疫应答
在Hartley豚鼠模型中评估INO-4800的免疫原性,Hart1ey豚鼠模型是用于皮内疫苗递送的已建立的模型(Carteretal.,2018,SciAdv,4:eaas9930;Schultheis et al.,2017,疫苗,35:61-70.如方法部分所述,通过Mantoux注射将100μg的pDNA给予皮肤,随后在第0天给予递送装置。在第14天,通过ELISA测量血清抗体的抗刺突蛋白结合。用INO-4800免疫揭示血清中SARS-CoV-2S1+2蛋白结合IgG水平的免疫应答(图27A和图27B)。第14天的终点SARS-CoV-2S蛋白结合效价在用100μg INO-4800或pVAX(对照)处理的豚鼠中分别为10,530和21(图27B)。通过评估其抑制ACE-2与SARS-CoV-2刺突蛋白结合的能力来测量血清抗体的功能性。第二次免疫后从INO-4800免疫的豚鼠采集的血清(1:20稀释)在ACE-2浓度范围内(0.25μg/ml至4μg/ml)抑制了SARS-CoV-2刺突蛋白的结合(图28A)。此外,血清稀释曲线揭示从INO-4800免疫的豚鼠采集的血清以稀释依赖性方式阻断ACE-2与SARS-CoV-2的结合(图28B)。从pVAX处理的动物采集的血清在ACE-2与病毒蛋白的结合的抑制中显示可忽略的活性,在血清的最高浓度下OD信号的降低被认为是测定中的基质效应。
总之,在小鼠和豚鼠两者中的免疫原性测试揭示COVID-19候选疫苗INO-4800能够引发对SARS-CoV-2刺突蛋白的功能性抗体应答。
SARS-CoV-2特异性抗体在INO-4800免疫动物中对肺的生物分布
下呼吸道疾病(LRD)与COVID-19的严重病例相关。在肺粘膜处靶向SARS-CoV-2的抗体的存在可潜在地介导针对LRD的保护。因此,在免疫小鼠和豚鼠的肺中评估SARS-CoV-2特异性抗体的存在。BALB/c小鼠和Hartley豚鼠分别在第0和14天或0、14和28天用INO-4800或pVAX对照pDNA免疫。处死后收集支气管肺泡灌洗(BAL)液体,并进行SARS-CoV-2S蛋白ELISA。在接受INO-4800的BALB/c和Hart1ey豚鼠中,与接受pVAX对照的动物相比,在它们的BAL流体中测量到统计学上显著增加的SARS-CoV-2S蛋白结合IgG(图29A至图29D)。总之,这些数据表明用INO-4800免疫后肺中存在抗SARS-CoV-2特异性抗体。
在用INO-4800免疫的小鼠中早期检测针对SARS-CoV-2和SARS-CoV的交叉反应性细胞免疫应答
通过IFN-γELISpot测定针对SARS-CoV-2、SARS-CoV和MERS-CoVS抗原的T细胞应答。在给予INO-4800后第4天、第7天或第10天(2.5μg或10μg的pDNA)处死BALB/c小鼠组,收获脾细胞,并且用跨越SARS-CoV-2、SARS-CoV和MERS-CoV刺突蛋白的15-mer重叠肽池刺激单细胞悬浮液20小时。INO-4800给药后第7天,对2.5和10μg剂量分别测量205和552SFU/106脾细胞针对SARS-CoV-2的T细胞应答(图30A)。在INO-4800给药后第10天观察到852和2193个SFU/106脾细胞对SARS-CoV-2的更高量级反应。此外,评估由INO-4800引发的细胞应答针对SARS-CoV的交叉反应性,并且在第7天(74[2.5μg剂量]和140[10μg剂量]SFU/106脾细胞)和给药后第10天(242[2.5μg剂量]和588[10μg剂量]SFC/106脾细胞)观察到可检测的(尽管较低)T细胞应答(图30B)。有趣的是,没有观察到针对MERS-CoV肽的交叉反应性T细胞应答(图30C)。在图31中提供了IFN-γELISpot板的代表性图像。鉴定了产生IFN-γ的T细胞群。在单次INO-4800免疫后第14天对从BALB/c小鼠收获的脾细胞的流式细胞术分析揭示在用SARS-CoV-2抗原刺激后T细胞区室含有0.0365%CD4+和0.3248%CD8+IFN-γ+T细胞(图32)。
BALB/c小鼠SARS-CoV-2表位作图
对来自接受10μg INO-4800剂量的BALB/c小鼠的脾细胞进行表位作图。使用三十个基质作图池刺激脾细胞20小时,并且在多个肽池中检测到免疫显性反应(图33A)。将这些应答去卷积以鉴定受体结合结构域和S2结构域中的若干表位(H2-Kd)聚簇(图33B)。有趣的是,观察到一个SARS-CoV-2H2 Kd表位PHGVVFLHV(SEQ ID NO:142)与SARS-CoV人HLA-A2限制性表位VVFLHVTYV(SEQ ID NO:143)重叠并相邻(Ahmed et al.,2020,Viruses 12:254)。
总之,在用INO-4800免疫的小鼠中检测到针对SARS-CoV-2S蛋白表位的快速T细胞应答。
实施例6:dMAB和DNA疫苗共递送
设计了证明dMAB+DNA疫苗共递送的功效的研究。
疫苗序列:
应当理解的是,前述详细说明和所附实施例仅是说明性的并且不应被视为对本发明范围的限制,本发明的范围仅由所附权利要求及其等效物限定。
对所公开的实施例的各种改变和修改对于本领域技术人员而言将是显而易见的。在不偏离本发明的精神和范围的情况下,可以进行这样的改变和修饰,包括但不限于涉及本发明的化学结构、取代基、衍生物、中间体、合成、组合物、配制品或使用方法的那些。
序列表
<110> 威斯塔解剖学和生物学研究所(The Wistar Institute of Anatomy andBiology)
大卫·韦纳(Weiner, David)
卡尔·穆图马尼(Muthumani, Kar)
伊丽莎白·帕尔扎奇(Parzych, Elizabeth)
<120> DNA编码的用于抵抗SARS-COV-2的抗体
<130> 206194-0046-00WO
<150> US 63/036,795
<151> 2020-06-09
<150> US 63/036,809
<151> 2020-06-09
<150> US 63/068,868
<151> 2020-08-21
<150> US 63/083,173
<151> 2020-09-25
<150> US 63/114,271
<151> 2020-11-16
<160> 152
<170> 专利版本 3.5
<210> 1
<211> 714
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 1
atggtgctgc agactcaggt gttcatttca ctgctgctgt ggatttcagg agcctacggc 60
gacattcagc tgacccagag ccccgattcc ctggccgtgt ctctgggaga gagggcaacc 120
atcaactgca agagctccca gagcgtgctg tactctagca tcaacaagaa ttacctggcc 180
tggtatcagc agaagcccgg ccagccccct aagctgctga tctattgggc aagcaccagg 240
gagtccggag tgcctgacag attctctggc agcggctccg gcacagactt caccctgaca 300
atctcctctc tgcaggccga ggacgtggcc gtgtactatt gccagcagta ctattccacc 360
ccttacacat tcggccaggg caccaaggtg gagatcaaga cagtggccgc cccatccgtg 420
ttcatctttc caccctctga cgagcagctg aagtctggca cagccagcgt ggtgtgcctg 480
ctgaacaact tctacccccg cgaggccaag gtgcagtgga aggtggataa cgccctgcag 540
tctggcaata gccaggagtc cgtgaccgag caggacaagg attctacata tagcctgagc 600
tccaccctga cactgagcaa ggccgattac gagaagcaca aggtgtatgc ctgtgaggtc 660
acccatcagg ggctgtcaag tccagtcaca aaatccttca atagagggga atgc 714
<210> 2
<211> 238
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 2
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Asp Ile Gln Leu Thr Gln Ser Pro Asp Ser Leu Ala
20 25 30
Val Ser Leu Gly Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser
35 40 45
Val Leu Tyr Ser Ser Ile Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln
50 55 60
Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg
65 70 75 80
Glu Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
85 90 95
Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr
100 105 110
Tyr Cys Gln Gln Tyr Tyr Ser Thr Pro Tyr Thr Phe Gly Gln Gly Thr
115 120 125
Lys Val Glu Ile Lys Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
130 135 140
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
145 150 155 160
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
165 170 175
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
180 185 190
Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala
195 200 205
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly
210 215 220
Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230 235
<210> 3
<211> 1398
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 3
atggactgga cctggagaat tctgttcctg gtcgccgccg caactgggac tcacgctcag 60
atgcagctgg tgcagagtgg gaccgaggtg aagaagccag gcgagtctct gaagatcagc 120
tgcaagggct ccggctacgg cttcatcacc tattggatcg gctgggtgag gcagatgcct 180
ggcaagggcc tggagtggat gggcatcatc taccccggcg atagcgagac aagatattct 240
cctagctttc agggccaggt gaccatctct gccgacaaga gcatcaacac agcctacctg 300
cagtggagct ccctgaaggc ctccgatacc gccatctact attgcgccgg cggctctggc 360
atcagcacac ctatggacgt gtggggacag ggaaccacag tgaccgtggc ctccacaaag 420
ggaccaagcg tgttcccact ggcaccctct agcaagtcca cctctggcgg cacagccgcc 480
ctgggctgtc tggtgaagga ctacttccca gagcccgtga ccgtgtcctg gaactctggc 540
gccctgacct ctggcgtgca cacatttccc gccgtgctgc agtcctctgg cctgtactcc 600
ctgagctccg tggtgaccgt gccttctagc tccctgggca cccagacata tatctgcaac 660
gtgaatcaca agccttctaa tacaaaggtg gacaagaagg tggagccaaa gagctgtgat 720
aagacccaca catgccctcc ctgtcctgca ccagagctgc tgggcggccc aagcgtgttc 780
ctgtttccac ccaagcccaa ggataccctg atgatctccc ggaccccaga ggtgacatgc 840
gtggtggtgg acgtgtctca cgaggacccc gaggtgaagt ttaactggta cgtggacggc 900
gtggaggtgc acaatgccaa gacaaagccc agggaggagc agtacaacag cacctataga 960
gtggtgtccg tgctgacagt gctgcaccag gattggctga acggcaagga gtataagtgc 1020
aaggtgagca ataaggccct gcccgcccct atcgagaaga ccatctccaa ggcaaaggga 1080
cagcctcggg agccacaggt gtacacactg cctccaagcc gcgatgagct gaccaagaac 1140
caggtgtccc tgacatgtct ggtgaagggc ttctatccct ccgacatcgc cgtggagtgg 1200
gagtctaatg gccagcctga gaacaattac aagaccacac cccctgtgct ggacagcgat 1260
ggctccttct ttctgtattc taagctgacc gtggacaaga gccgctggca gcagggcaac 1320
gtgttcagct gttccgtgat gcacgaagca ctgcacaacc attacactca gaagtcactg 1380
tcactgtccc ctggcaag 1398
<210> 4
<211> 466
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 4
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Gly Phe
35 40 45
Ile Thr Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Gly Ile Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Asn
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Ile
100 105 110
Tyr Tyr Cys Ala Gly Gly Ser Gly Ile Ser Thr Pro Met Asp Val Trp
115 120 125
Gly Gln Gly Thr Thr Val Thr Val Ala Ser Thr Lys Gly Pro Ser Val
130 135 140
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
145 150 155 160
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
165 170 175
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
180 185 190
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
195 200 205
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
210 215 220
Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp
225 230 235 240
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly
245 250 255
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
260 265 270
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
275 280 285
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
290 295 300
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
305 310 315 320
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
325 330 335
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
340 345 350
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
355 360 365
Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu
370 375 380
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
385 390 395 400
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
405 410 415
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
420 425 430
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
435 440 445
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
450 455 460
Gly Lys
465
<210> 5
<211> 384
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 5
gaggtgcagc tggtgcagtc aggagccgag gtgaaggagc ccggcagctc cgtgaaggtg 60
tcttgcaagg ccagcggcgg caccttcggc tcttacgccg gcggcacatt tggcagctat 120
gccatcaact gggtgcggca ggcacctgga cagcgcctgg agtggatggg ctggatcgat 180
gccgccaacg gcaataccaa gtacagccag aagttccagg gccgggtgac catcacaggc 240
gacacctctg ccagcacagc ctatatggag ctgtctagcc tgaggtccga ggacaccgcc 300
gtgtactatt gcgcccggga tcgctggatg accacaagag ccttcgacat ctggggccag 360
ggcaccatgg tgacagtgtc ctct 384
<210> 6
<211> 128
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 6
Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Glu Pro Gly Ser
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe Gly Ser Tyr
20 25 30
Ala Gly Gly Thr Phe Gly Ser Tyr Ala Ile Asn Trp Val Arg Gln Ala
35 40 45
Pro Gly Gln Arg Leu Glu Trp Met Gly Trp Ile Asp Ala Ala Asn Gly
50 55 60
Asn Thr Lys Tyr Ser Gln Lys Phe Gln Gly Arg Val Thr Ile Thr Gly
65 70 75 80
Asp Thr Ser Ala Ser Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser
85 90 95
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Asp Arg Trp Met Thr Thr
100 105 110
Arg Ala Phe Asp Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser
115 120 125
<210> 7
<211> 333
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 7
cagcctgtgc tgacacagcc acccgcatcc gcctctggaa ccccaggcca gagagtgaca 60
atcagctgtt ccggcagctc ctctaacatc ggcagcaatt acgtgttctg gtatcagcag 120
ctgcccggca tggcccctaa gctgctgatc tcccggaaca atcagcgccc atctggcgtg 180
cccgatcggt tttctggcag caagtccggc acctctgcca gcctggcaat ctccggacca 240
cagtctgagg acgaggccga ttactattgc gcagcatggg acgattccct gaggggacca 300
gtgttcggcg gcggaaccag ggtgacagtg ctg 333
<210> 8
<211> 111
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 8
Gln Pro Val Leu Thr Gln Pro Pro Ala Ser Ala Ser Gly Thr Pro Gly
1 5 10 15
Gln Arg Val Thr Ile Ser Cys Ser Gly Ser Ser Ser Asn Ile Gly Ser
20 25 30
Asn Tyr Val Phe Trp Tyr Gln Gln Leu Pro Gly Met Ala Pro Lys Leu
35 40 45
Leu Ile Ser Arg Asn Asn Gln Arg Pro Ser Gly Val Pro Asp Arg Phe
50 55 60
Ser Gly Ser Lys Ser Gly Thr Ser Ala Ser Leu Ala Ile Ser Gly Pro
65 70 75 80
Gln Ser Glu Asp Glu Ala Asp Tyr Tyr Cys Ala Ala Trp Asp Asp Ser
85 90 95
Leu Arg Gly Pro Val Phe Gly Gly Gly Thr Arg Val Thr Val Leu
100 105 110
<210> 9
<211> 2238
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 9
atggattgga cttggaggat tctgtttctg gtcgccgccg ctaccggaac tcacgccgag 60
gtgcagctgg tgcagtcagg agccgaggtg aaggagcccg gcagctccgt gaaggtgtct 120
tgcaaggcca gcggcggcac cttcggctct tacgccggcg gcacatttgg cagctatgcc 180
atcaactggg tgcggcaggc acctggacag cgcctggagt ggatgggctg gatcgatgcc 240
gccaacggca ataccaagta cagccagaag ttccagggcc gggtgaccat cacaggcgac 300
acctctgcca gcacagccta tatggagctg tctagcctga ggtccgagga caccgccgtg 360
tactattgcg cccgggatcg ctggatgacc acaagagcct tcgacatctg gggccagggc 420
accatggtga cagtgtcctc tgcctctaca aagggaccaa gcgtgtttcc actggcaccc 480
agctccaagt ccacctctgg cggcacagcc gccctgggct gtctggtgaa ggattacttc 540
cccgagcctg tgaccgtgtc ctggaactct ggcgccctga ccagcggagt gcacacattt 600
cctgccgtgc tgcagtctag cggcctgtac tccctgtcct ctgtggtgac cgtgccaagc 660
tcctctctgg gcacccagac atatatctgc aacgtgaatc acaagccctc taatacaaag 720
gtggataaga aggtggagcc taagagctgt gacaagaccc acacatgccc tccctgtcca 780
gcaccagagc tgctgggcgg ccctagcgtg ttcctgtttc cacccaagcc aaaggatacc 840
ctgatgatct cccgcacccc agaggtgaca tgcgtggtgg tggacgtgtc tcacgaggac 900
cccgaggtga agttcaactg gtacgtggac ggcgtggagg tgcacaatgc caagacaaag 960
cctagggagg agcagtacaa ctccacctat agagtggtgt ctgtgctgac agtgctgcac 1020
caggactggc tgaacggcaa ggagtataag tgcaaggtga gcaataaggc cctgcctgcc 1080
ccaatcgaga agaccatctc caaggcaaag ggacagcctc gggagccaca ggtgtacaca 1140
ctgcctccaa gccgcgatga gctgaccaag aaccaggtgt ccctgacatg tctggtgaag 1200
ggcttctatc catccgacat cgccgtggag tgggagtcta atggccagcc cgagaacaat 1260
tacaagacca caccccctgt gctggacagc gatggctcct tctttctgta ttctaagctg 1320
accgtggata agagcaggtg gcagcagggc aacgtgttta gctgctccgt gatgcacgag 1380
gccctgcaca atcactacac ccagaagtct ctgagcctgt ccccaggcaa gaggggcaga 1440
aagaggagat ctggcagcgg cgccacaaac ttcagcctgc tgaagcaggc aggcgacgtg 1500
gaggagaatc caggacctat ggtgctgcag acccaggtgt ttatcagcct gctgctgtgg 1560
atctccggag catacggaca gcctgtgctg acacagccac ccgcatccgc ctctggaacc 1620
ccaggccaga gagtgacaat cagctgttcc ggcagctcct ctaacatcgg cagcaattac 1680
gtgttctggt atcagcagct gcccggcatg gcccctaagc tgctgatctc ccggaacaat 1740
cagcgcccat ctggcgtgcc cgatcggttt tctggcagca agtccggcac ctctgccagc 1800
ctggcaatct ccggaccaca gtctgaggac gaggccgatt actattgcgc agcatgggac 1860
gattccctga ggggaccagt gttcggcggc ggaaccaggg tgacagtgct gagaaccgtg 1920
gcagcaccaa gcgtgttcat ctttcctcca tccgatgagc agctgaagag cggcacagcc 1980
tccgtggtgt gcctgctgaa caacttctac cccagggagg ccaaggtgca gtggaaggtg 2040
gacaacgccc tgcagtctgg caatagccag gagtccgtga ccgagcagga ctctaaggat 2100
agcacatatt ccctgagctc caccctgaca ctgtccaagg ccgactacga gaagcacaag 2160
gtgtatgcct gcgaagtcac ccaccagggg ctgaggtctc cagtcactaa atctttcaat 2220
aggggcgaat gctgataa 2238
<210> 10
<211> 744
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 10
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Glu
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe
35 40 45
Gly Ser Tyr Ala Gly Gly Thr Phe Gly Ser Tyr Ala Ile Asn Trp Val
50 55 60
Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Met Gly Trp Ile Asp Ala
65 70 75 80
Ala Asn Gly Asn Thr Lys Tyr Ser Gln Lys Phe Gln Gly Arg Val Thr
85 90 95
Ile Thr Gly Asp Thr Ser Ala Ser Thr Ala Tyr Met Glu Leu Ser Ser
100 105 110
Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Asp Arg Trp
115 120 125
Met Thr Thr Arg Ala Phe Asp Ile Trp Gly Gln Gly Thr Met Val Thr
130 135 140
Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro
145 150 155 160
Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val
165 170 175
Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala
180 185 190
Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly
195 200 205
Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly
210 215 220
Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys
225 230 235 240
Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys
245 250 255
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
260 265 270
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
275 280 285
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys
290 295 300
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
305 310 315 320
Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu
325 330 335
Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
340 345 350
Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
355 360 365
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
370 375 380
Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
385 390 395 400
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
405 410 415
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
420 425 430
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
435 440 445
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
450 455 460
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg
465 470 475 480
Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln
485 490 495
Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln
500 505 510
Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Gln Pro
515 520 525
Val Leu Thr Gln Pro Pro Ala Ser Ala Ser Gly Thr Pro Gly Gln Arg
530 535 540
Val Thr Ile Ser Cys Ser Gly Ser Ser Ser Asn Ile Gly Ser Asn Tyr
545 550 555 560
Val Phe Trp Tyr Gln Gln Leu Pro Gly Met Ala Pro Lys Leu Leu Ile
565 570 575
Ser Arg Asn Asn Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly
580 585 590
Ser Lys Ser Gly Thr Ser Ala Ser Leu Ala Ile Ser Gly Pro Gln Ser
595 600 605
Glu Asp Glu Ala Asp Tyr Tyr Cys Ala Ala Trp Asp Asp Ser Leu Arg
610 615 620
Gly Pro Val Phe Gly Gly Gly Thr Arg Val Thr Val Leu Arg Thr Val
625 630 635 640
Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys
645 650 655
Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg
660 665 670
Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn
675 680 685
Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser
690 695 700
Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys
705 710 715 720
Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val Thr
725 730 735
Lys Ser Phe Asn Arg Gly Glu Cys
740
<210> 11
<211> 372
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 11
caggtgcagc tggtgcagtc tggggccgaa gtgaagaagc caggcagctc cgtgaaggtg 60
tcctgcaagg cctctggcgg cacattctct agctacgcca tctcctgggt gaggcaggca 120
ccaggacagg gcctggagtg ggtgggcaga atcatcccta tcttcggcac cgccaactac 180
gcccagtttc agggccgggt gaccatcaca gccgacaagt ccacctctac agcctatatg 240
gagctgtcct ctctgaggag cgaggatacc gccgtgtact attgcgccag agccagctac 300
tgctccacca catcttgtgc aagcggagcc ttcgacatct ggggacaggg caccctggtg 360
acagtgagct cc 372
<210> 12
<211> 124
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 12
Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe Ser Ser Tyr
20 25 30
Ala Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Val
35 40 45
Gly Arg Ile Ile Pro Ile Phe Gly Thr Ala Asn Tyr Ala Gln Phe Gln
50 55 60
Gly Arg Val Thr Ile Thr Ala Asp Lys Ser Thr Ser Thr Ala Tyr Met
65 70 75 80
Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Ala Ser Tyr Cys Ser Thr Thr Ser Cys Ala Ser Gly Ala Phe Asp
100 105 110
Ile Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser
115 120
<210> 13
<211> 339
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 13
gacatccaga tgacccagtc tcctgatagc ctggccgtgt ccctgggaga gagagcaaca 60
atcaactgta agtctagcca gagcgtgctg tactcctcta acaataagaa ttacctggcc 120
tggtatcagc agaagccagg ccagccaccc aagctgctga tctattgggc aagcgccagg 180
gagtccggag tgccagacag attcagcggc tccggctctg gaaccgactt caccctgaca 240
atcagctccc tgcagcccga ggacgtggcc atctactatt gccagcagta ctattccgtg 300
cccttcacct ttggccctgg cacaaaggtg gagatcaag 339
<210> 14
<211> 113
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 14
Asp Ile Gln Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly
1 5 10 15
Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Val Leu Tyr Ser
20 25 30
Ser Asn Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln
35 40 45
Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Ala Arg Glu Ser Gly Val
50 55 60
Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
65 70 75 80
Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Ile Tyr Tyr Cys Gln Gln
85 90 95
Tyr Tyr Ser Val Pro Phe Thr Phe Gly Pro Gly Thr Lys Val Glu Ile
100 105 110
Lys
<210> 15
<211> 2232
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 15
atggattgga catggaggat tctgtttctg gtcgccgccg ccacaggaac tcacgctcag 60
gtgcagctgg tgcagtctgg ggccgaagtg aagaagccag gcagctccgt gaaggtgtcc 120
tgcaaggcct ctggcggcac attctctagc tacgccatct cctgggtgag gcaggcacca 180
ggacagggcc tggagtgggt gggcagaatc atccctatct tcggcaccgc caactacgcc 240
cagtttcagg gccgggtgac catcacagcc gacaagtcca cctctacagc ctatatggag 300
ctgtcctctc tgaggagcga ggataccgcc gtgtactatt gcgccagagc cagctactgc 360
tccaccacat cttgtgcaag cggagccttc gacatctggg gacagggcac cctggtgaca 420
gtgagctccg cctccacaaa gggaccaagc gtgttcccac tggcaccctc tagcaagagc 480
acctccggcg gcacagccgc cctgggctgt ctggtgaagg attatttccc cgagcctgtg 540
accgtgtcct ggaactctgg cgccctgacc tccggagtgc acacatttcc cgccgtgctg 600
cagtcctctg gcctgtacag cctgagctcc gtggtgaccg tgccttctag ctccctgggc 660
acccagacat atatctgcaa cgtgaatcac aagcctagca atacaaaggt ggacaagaag 720
gtggagccaa agtcctgtga taagacccac acatgccctc cctgtccagc accagagctg 780
ctgggcggcc caagcgtgtt cctgtttcca cccaagccca aggacacact gatgatctct 840
cgcacccctg aggtgacatg cgtggtggtg gacgtgagcc acgaggaccc cgaggtgaag 900
tttaactggt acgtggatgg cgtggaggtg cacaatgcca agaccaagcc tcgggaggag 960
cagtacaaca gcacctatcg cgtggtgtcc gtgctgacag tgctgcacca ggactggctg 1020
aacggcaagg agtataagtg caaggtgtcc aataaggccc tgcctgcccc aatcgagaag 1080
accatctcta aggcaaaggg acagcctcgg gagccacagg tgtacacact gcctccatcc 1140
cgcgacgagc tgaccaagaa ccaggtgtct ctgacatgtc tggtgaaggg cttctatcca 1200
tctgatatcg ccgtggagtg ggagagcaat ggccagcccg agaacaatta caagaccaca 1260
ccccctgtgc tggacagcga tggctccttc tttctgtatt ccaagctgac cgtggacaag 1320
tctaggtggc agcagggcaa cgtgttttct tgcagcgtga tgcacgaggc cctgcacaat 1380
cactacaccc agaagtccct gtctctgagc ccaggcaaga ggggaaggaa gaggagatcc 1440
ggctctggcg ccacaaactt cagcctgctg aagcaggcag gcgatgtgga ggagaatcca 1500
ggacctatgg tgctgcagac ccaggtgttt atctctctgc tgctgtggat cagcggcgcc 1560
tacggcgaca tccagatgac ccagtctcct gatagcctgg ccgtgtccct gggagagaga 1620
gcaacaatca actgtaagtc tagccagagc gtgctgtact cctctaacaa taagaattac 1680
ctggcctggt atcagcagaa gccaggccag ccacccaagc tgctgatcta ttgggcaagc 1740
gccagggagt ccggagtgcc agacagattc agcggctccg gctctggaac cgacttcacc 1800
ctgacaatca gctccctgca gcccgaggac gtggccatct actattgcca gcagtactat 1860
tccgtgccct tcacctttgg ccctggcaca aaggtggaga tcaagaggac cgtggcagca 1920
cctagcgtgt tcatctttcc tccatccgac gagcagctga agtctggcac agccagcgtg 1980
gtgtgcctgc tgaacaattt ctacccacgc gaggccaagg tgcagtggaa ggtggataac 2040
gccctgcagt ccggcaattc tcaggagagc gtgaccgagc aggactccaa ggattctaca 2100
tatagcctgt ctagcaccct gacactgagc aaggccgatt acgagaagca caaggtgtat 2160
gcctgcgaag tcacccacca ggggctgagg tcaccagtca ccaagtcttt caacagaggg 2220
gaatgttgat aa 2232
<210> 16
<211> 742
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 16
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe
35 40 45
Ser Ser Tyr Ala Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu
50 55 60
Glu Trp Val Gly Arg Ile Ile Pro Ile Phe Gly Thr Ala Asn Tyr Ala
65 70 75 80
Gln Phe Gln Gly Arg Val Thr Ile Thr Ala Asp Lys Ser Thr Ser Thr
85 90 95
Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Ala Arg Ala Ser Tyr Cys Ser Thr Thr Ser Cys Ala Ser Gly
115 120 125
Ala Phe Asp Ile Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala
130 135 140
Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser
145 150 155 160
Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe
165 170 175
Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly
180 185 190
Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu
195 200 205
Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr
210 215 220
Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys
225 230 235 240
Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro
245 250 255
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
260 265 270
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
275 280 285
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
290 295 300
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
305 310 315 320
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
325 330 335
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
340 345 350
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
355 360 365
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu
370 375 380
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
385 390 395 400
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
405 410 415
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
420 425 430
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
435 440 445
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
450 455 460
Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser
465 470 475 480
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
485 490 495
Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser
500 505 510
Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Asp Ile Gln Met Thr Gln
515 520 525
Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn
530 535 540
Cys Lys Ser Ser Gln Ser Val Leu Tyr Ser Ser Asn Asn Lys Asn Tyr
545 550 555 560
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile
565 570 575
Tyr Trp Ala Ser Ala Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly
580 585 590
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
595 600 605
Glu Asp Val Ala Ile Tyr Tyr Cys Gln Gln Tyr Tyr Ser Val Pro Phe
610 615 620
Thr Phe Gly Pro Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
625 630 635 640
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
645 650 655
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
660 665 670
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
675 680 685
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
690 695 700
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
705 710 715 720
Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val Thr Lys Ser
725 730 735
Phe Asn Arg Gly Glu Cys
740
<210> 17
<211> 375
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 17
caggtgcagc tggtgcagtc tggggctgaa gtgaagaaac caggcagctc cgtcaaggtg 60
tcatgcaaag ccagcggcgg aacattctct agttacgcaa tcagctgggt gcgacaggct 120
ccaggacagg gactggagtg gatgggcggc atcattccta tcttcgggac cgctaactac 180
gcacagaagt ttcagggccg cgtgaccatt acagcagata aatccacttc taccgcctat 240
atggagctgt caagcctgag gagcgaagac actgcagtct actattgcgc cagagtggga 300
tactgctcct ctacctcctg tcacatcggg gccttcgata tttggggaca ggggaccaca 360
gtcaccgtga gttca 375
<210> 18
<211> 125
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 18
Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe Ser Ser Tyr
20 25 30
Ala Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met
35 40 45
Gly Gly Ile Ile Pro Ile Phe Gly Thr Ala Asn Tyr Ala Gln Lys Phe
50 55 60
Gln Gly Arg Val Thr Ile Thr Ala Asp Lys Ser Thr Ser Thr Ala Tyr
65 70 75 80
Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Val Gly Tyr Cys Ser Ser Thr Ser Cys His Ile Gly Ala Phe
100 105 110
Asp Ile Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser
115 120 125
<210> 19
<211> 321
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 19
gaaacaactc tgactcagag ccccggcacc ctgtctctga gtcctggaga gcgagctacc 60
ctgagctgta gggcatcaca gagcgtgtca agctccatcg cctggtatca gcagaagcct 120
ggacaggctc cacgcctgct gatgttcgac tctagtacaa gagctactgg catccccgat 180
cggttctccg ggtctggcag tggaaccgac tttacactga acatttcaag cctggagccc 240
gaagatttcg cagtgtacta ttgccagcag tactcctcta gtccttatac atttgggcag 300
ggcactaagc tggaaatcaa a 321
<210> 20
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 20
Glu Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
20 25 30
Ile Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Met
35 40 45
Phe Asp Ser Ser Thr Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile Ser Ser Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Ser Ser Ser Pro Tyr
85 90 95
Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys
100 105
<210> 21
<211> 2216
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 21
atggattgga catggagaat tctgtttctg gtcgccgccg ccactggaac tcacgctcag 60
gtgcagctgg tgcagtctgg ggctgaagtg aagaaaccag gcagctccgt caaggtgtca 120
tgcaaagcca gcggcggaac attctctagt tacgcaatca gctgggtgcg acaggctcca 180
ggacagggac tggagtggat gggcggcatc attcctatct tcgggaccgc taactacgca 240
cagaagtttc agggccgcgt gaccattaca gcagataaat ccacttctac cgcctatatg 300
gagctgtcaa gcctgaggag cgaagacact gcagtctact attgcgccag agtgggatac 360
tgctcctcta cctcctgtca catcggggcc ttcgatattt ggggacaggg gaccacagtc 420
accgtgagtt cagcaagtac aaaggggcct tcagtgtttc ccctggcccc tagctccaaa 480
agtacttcag gagggaccgc cgctctggga tgtctggtga aggactattt ccctgagcca 540
gtcaccgtgt catggaacag cggggccctg acctccggag tccatacatt tccagctgtg 600
ctgcagtcta gtgggctgta ctctctgtca agcgtggtca ctgtcccctc ctctagtctg 660
ggcacacaga cttatatctg caacgtgaat cacaagcctt ccaataccaa agtcgacaag 720
aaagtggaac caaagtcttg tgataaaacc catacatgcc ctccctgtcc agcacctgag 780
ctgctgggcg gaccaagcgt gttcctgttt ccacccaagc ccaaagatac actgatgatt 840
agccggacac ctgaagtcac ttgcgtggtc gtggacgtga gccacgagga ccccgaagtc 900
aagttcaact ggtacgtgga cggcgtcgag gtgcataatg ctaagaccaa accccgcgag 960
gaacagtaca atagcacata tcgagtcgtg tccgtcctga ctgtgctgca ccaggactgg 1020
ctgaacggaa aggagtataa gtgcaaagtg tccaataagg ccctgccagc tcccatcgag 1080
aaaacaattt ctaaggccaa aggccagcca cgggaacccc aggtgtacac tctgcctcca 1140
agccgcgatg agctgactaa gaaccaggtc agcctgacct gtctggtgaa aggcttctat 1200
ccaagtgaca tcgctgtgga gtgggaatct aatggacagc ccgaaaacaa ttacaagact 1260
acccctcccg tgctggactc cgatggctct ttctttctgt attcaaagct gacagtggat 1320
aaaagccggt ggcagcaggg aaacgtcttt agctgctccg tgatgcatga ggccctgcac 1380
aatcattaca cacagaagtc tctgagtctg tcacccggaa agcgaggacg aaaaaggaga 1440
agcggctccg gagctactaa cttctccctg ctgaagcagg caggagacgt ggaggaaaat 1500
cctgggccaa tggtcctgca gacccaggtg tttatctctc tgctgctgtg gattagtggc 1560
gcttacggag aaacaactct gactcagagc cccggcaccc tgtctctgag tcctggagag 1620
cgagctaccc tgagctgtag ggcatcacag agcgtgtcaa gctccatcgc ctggtatcag 1680
cagaagcctg gacaggctcc acgcctgctg atgttcgact ctagtacaag agctactggc 1740
atccccgatc ggttctccgg gtctggcagt ggaaccgact ttacactgaa catttcaagc 1800
ctggagcccg aagatttcgc agtgtactat tgccagcagt actcctctag tccttataca 1860
tttgggcagg gcactaagct ggaaatcaaa aggaccgtcg cagccccttc cgtgttcatt 1920
tttccaccct ctgatgagca gctgaagtcc ggcacagcct ctgtggtgtg cctgctgaac 1980
aacttctacc caagagaagc aaaggtccag tggaaagtgg acaacgccct gcagagtggc 2040
aattcacagg agagcgtgac cgaacaggac tccaaggatt ctacatatag tctgtcaagc 2100
actctgaccc tagcaaagct gactacgaga agcacaaagt gtatgcatgc gaagtgaccc 2160
accaggggct gagaagtcca gtgacaaaat cctttaacag aggggaatgc tgataa 2216
<210> 22
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 22
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe
35 40 45
Ser Ser Tyr Ala Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu
50 55 60
Glu Trp Met Gly Gly Ile Ile Pro Ile Phe Gly Thr Ala Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Gly Arg Val Thr Ile Thr Ala Asp Lys Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Val Gly Tyr Cys Ser Ser Thr Ser Cys His Ile
115 120 125
Gly Ala Phe Asp Ile Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser
130 135 140
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
145 150 155 160
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
165 170 175
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
180 185 190
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
195 200 205
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
210 215 220
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
225 230 235 240
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
245 250 255
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
260 265 270
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
275 280 285
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
290 295 300
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
305 310 315 320
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
325 330 335
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
340 345 350
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
355 360 365
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
370 375 380
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
385 390 395 400
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
405 410 415
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
420 425 430
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
435 440 445
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
450 455 460
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg
465 470 475 480
Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
485 490 495
Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile
500 505 510
Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Thr Thr Leu Thr
515 520 525
Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu
530 535 540
Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser Ile Ala Trp Tyr Gln
545 550 555 560
Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Met Phe Asp Ser Ser Thr
565 570 575
Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr
580 585 590
Asp Phe Thr Leu Asn Ile Ser Ser Leu Glu Pro Glu Asp Phe Ala Val
595 600 605
Tyr Tyr Cys Gln Gln Tyr Ser Ser Ser Pro Tyr Thr Phe Gly Gln Gly
610 615 620
Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Arg Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 23
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 23
tcctacggaa tgcac 15
<210> 24
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 24
atctcttatg acggcagcaa caagtactat gccgatagcg tgaagggc 48
<210> 25
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 25
gacggatatg gcagcggctc cgattactac tactactact acatggacgt gtggggcaag 60
<210> 26
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 26
Ser Tyr Gly Met His
1 5
<210> 27
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 27
Ile Ser Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val Lys Gly
1 5 10 15
<210> 28
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 28
Asp Gly Tyr Gly Ser Gly Ser Asp Tyr Tyr Tyr Tyr Tyr Tyr Met Asp
1 5 10 15
Val Trp Gly Lys
20
<210> 29
<211> 399
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 29
gaggtgcagc tggtcgagac tggagggggc gtggtgcagc caggccggag cctgagactg 60
agctgcgcag catccggctt cacctttagc tcctacggaa tgcactgggt gaggcaggca 120
ccaggcaagg gcctggagtg ggtggccgtg atctcttatg acggcagcaa caagtactat 180
gccgatagcg tgaagggcag gttcaccatc tcccgcgaca actctaagaa tacactgtac 240
ctgcagatga attccctgag ggccgaggat accgccgtgt actattgcgc ccgcgacgga 300
tatggcagcg gctccgatta ctactactac tactacatgg acgtgtgggg caagggcacc 360
atggtgacag tgtctagctc cgccagcgga gcagagctg 399
<210> 30
<211> 133
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 30
Glu Val Gln Leu Val Glu Thr Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Ser Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Asp Gly Tyr Gly Ser Gly Ser Asp Tyr Tyr Tyr Tyr Tyr Tyr
100 105 110
Met Asp Val Trp Gly Lys Gly Thr Met Val Thr Val Ser Ser Ser Ala
115 120 125
Ser Gly Ala Glu Leu
130
<210> 31
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 31
cagggcgata gcctgagatc ctactatgcc 30
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 32
ggcaagaaca atcggccctc c 21
<210> 33
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 33
aactccaggg attctagcgg caatcaccct 30
<210> 34
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 34
Gln Gly Asp Ser Leu Arg Ser Tyr Tyr Ala
1 5 10
<210> 35
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 35
Gly Lys Asn Asn Arg Pro Ser
1 5
<210> 36
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 36
Asn Ser Arg Asp Ser Ser Gly Asn His Pro
1 5 10
<210> 37
<211> 324
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 37
acctctagct ccgagctgac acaggaccct gccgtgagcg tggccctggg acagaccgtg 60
cggatcacat gtcagggcga tagcctgaga tcctactatg cctcctggta ccagcagaag 120
ccaggacagg caccagtgcc tgtgatctat ggcaagaaca atcggccctc cggcatccct 180
gacagattct ctggctctag ctccggcaac accgcaagcc tgaccatcac aggagcacag 240
gcagaggacg aggcagatta ctattgcaac tccagggatt ctagcggcaa tcaccctttt 300
ggcaccggca caaaggtgac cctg 324
<210> 38
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 38
Thr Ser Ser Ser Glu Leu Thr Gln Asp Pro Ala Val Ser Val Ala Leu
1 5 10 15
Gly Gln Thr Val Arg Ile Thr Cys Gln Gly Asp Ser Leu Arg Ser Tyr
20 25 30
Tyr Ala Ser Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Val Pro Val
35 40 45
Ile Tyr Gly Lys Asn Asn Arg Pro Ser Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Ser Ser Gly Asn Thr Ala Ser Leu Thr Ile Thr Gly Ala Gln
65 70 75 80
Ala Glu Asp Glu Ala Asp Tyr Tyr Cys Asn Ser Arg Asp Ser Ser Gly
85 90 95
Asn His Pro Phe Gly Thr Gly Thr Lys Val Thr Leu
100 105
<210> 39
<211> 2244
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 39
atggactgga cttggaggat tctgtttctg gtcgccgccg ctactgggac tcacgccgag 60
gtgcagctgg tcgagactgg agggggcgtg gtgcagccag gccggagcct gagactgagc 120
tgcgcagcat ccggcttcac ctttagctcc tacggaatgc actgggtgag gcaggcacca 180
ggcaagggcc tggagtgggt ggccgtgatc tcttatgacg gcagcaacaa gtactatgcc 240
gatagcgtga agggcaggtt caccatctcc cgcgacaact ctaagaatac actgtacctg 300
cagatgaatt ccctgagggc cgaggatacc gccgtgtact attgcgcccg cgacggatat 360
ggcagcggct ccgattacta ctactactac tacatggacg tgtggggcaa gggcaccatg 420
gtgacagtgt ctagctccgc cagcggagca gagctggcat ctacaaaggg accaagcgtg 480
tttccactgg caccctctag caagtctacc agcggcggca cagccgccct gggatgtctg 540
gtgaaggatt acttccctga gccagtgacc gtgtcttgga acagcggcgc cctgaccagc 600
ggagtgcaca catttcccgc cgtgctgcag tcctctggcc tgtactccct gagctccgtg 660
gtgaccgtgc cttctagctc cctgggcacc cagacatata tctgcaacgt gaatcacaag 720
cctagcaata caaaggtgga caagaaggtg gagccaaagt cctgtgataa gacccacaca 780
tgccctccct gtccagcacc tgagctgctg ggcggcccat ccgtgttcct gtttccaccc 840
aagcccaagg acacactgat gatctctcgg accccagagg tgacatgcgt ggtggtggac 900
gtgagccacg aggaccccga ggtgaagttc aactggtacg tggatggcgt ggaggtgcac 960
aatgccaaga ccaagcccag ggaggagcag tacaactcca cctatcgcgt ggtgtctgtg 1020
ctgacagtgc tgcaccagga ctggctgaac ggcaaggagt ataagtgcaa ggtgtccaat 1080
aaggccctgc cagcccccat cgagaagacc atctctaagg caaagggaca gcctcgggag 1140
ccacaggtgt acacactgcc tccatccaga gacgagctga ccaagaacca ggtgtctctg 1200
acatgtctgg tgaagggctt ctatccctct gatatcgccg tggagtggga gagcaatggc 1260
cagcctgaga acaattacaa gaccacaccc cctgtgctgg actccgatgg ctctttcttt 1320
ctgtattcta agctgaccgt ggacaagagc agatggcagc agggcaacgt gttttcctgc 1380
tctgtgatgc acgaggccct gcacaatcac tacacccaga agagcctgtc cctgtctcct 1440
ggcaagaggg gaaggaagcg gagaagcggc tccggagcca caaacttcag cctgctgaag 1500
caggccggcg atgtggagga gaatcctggc ccaatggtgc tgcagaccca ggtgtttatc 1560
agcctgctgc tgtggatctc cggagcatac ggcacctcta gctccgagct gacacaggac 1620
cctgccgtga gcgtggccct gggacagacc gtgcggatca catgtcaggg cgatagcctg 1680
agatcctact atgcctcctg gtaccagcag aagccaggac aggcaccagt gcctgtgatc 1740
tatggcaaga acaatcggcc ctccggcatc cctgacagat tctctggctc tagctccggc 1800
aacaccgcaa gcctgaccat cacaggagca caggcagagg acgaggcaga ttactattgc 1860
aactccaggg attctagcgg caatcaccct tttggcaccg gcacaaaggt gaccctgagg 1920
acagtggcag caccaagcgt gttcatcttt ccaccctccg acgagcagct gaagagcgga 1980
accgcatccg tggtgtgcct gctgaacaac ttctaccccc gggaggccaa ggtgcagtgg 2040
aaggtggata acgccctgca gtctggcaat agccaggagt ccgtgaccga gcaggactct 2100
aaggatagca catattccct gtcctctacc ctgacactga gcaaggccga ctacgagaag 2160
cacaaggtgt atgcctgcga agtcacccac caggggctgc ggtcaccagt cacaaaatcc 2220
tttaatagag gcgaatgttg ataa 2244
<210> 40
<211> 746
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 40
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Thr Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Asp Gly Tyr Gly Ser Gly Ser Asp Tyr Tyr Tyr
115 120 125
Tyr Tyr Tyr Met Asp Val Trp Gly Lys Gly Thr Met Val Thr Val Ser
130 135 140
Ser Ser Ala Ser Gly Ala Glu Leu Ala Ser Thr Lys Gly Pro Ser Val
145 150 155 160
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
165 170 175
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
180 185 190
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
195 200 205
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
210 215 220
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
225 230 235 240
Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp
245 250 255
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly
260 265 270
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
275 280 285
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
290 295 300
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
305 310 315 320
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
325 330 335
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
340 345 350
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
355 360 365
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
370 375 380
Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu
385 390 395 400
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
405 410 415
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
420 425 430
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
435 440 445
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
450 455 460
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
465 470 475 480
Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe
485 490 495
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met
500 505 510
Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly
515 520 525
Ala Tyr Gly Thr Ser Ser Ser Glu Leu Thr Gln Asp Pro Ala Val Ser
530 535 540
Val Ala Leu Gly Gln Thr Val Arg Ile Thr Cys Gln Gly Asp Ser Leu
545 550 555 560
Arg Ser Tyr Tyr Ala Ser Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro
565 570 575
Val Pro Val Ile Tyr Gly Lys Asn Asn Arg Pro Ser Gly Ile Pro Asp
580 585 590
Arg Phe Ser Gly Ser Ser Ser Gly Asn Thr Ala Ser Leu Thr Ile Thr
595 600 605
Gly Ala Gln Ala Glu Asp Glu Ala Asp Tyr Tyr Cys Asn Ser Arg Asp
610 615 620
Ser Ser Gly Asn His Pro Phe Gly Thr Gly Thr Lys Val Thr Leu Arg
625 630 635 640
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
645 650 655
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
660 665 670
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
675 680 685
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
690 695 700
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
705 710 715 720
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro
725 730 735
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
740 745
<210> 41
<211> 1425
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 41
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tgcagtccgg agcagaggtg aagaagcctg gagcctctgt gaaggtgagc 120
tgcaaggcct ccggctacac ctttacatct tatggaatca gctgggtgag gcaggcacca 180
ggacagggac tggagtggat gggctggatc agcgcctaca acggcaatac aaactatgcc 240
cagaagctgc agggcagagt gaccatgacc acagacacca gcacatccac cgcctacatg 300
gagctgaggt ctctgagaag cgacgataca gccgtgtact attgcgcccg ggactatacc 360
cgcggcgcct ggttcggaga gtctctgatc ggcggatttg ataattgggg ccagggcaca 420
ctggtgaccg tgtctgccag cacaaaggga ccaagcgtgt tcccactggc acccagctcc 480
aagtccacat ctggcggcac cgccgccctg ggatgtctgg tgaaggatta cttcccagag 540
cccgtgaccg tgtcctggaa ttctggcgcc ctgacaagcg gcgtgcacac ctttccagcc 600
gtgctgcagt ctagcggcct gtactccctg tcctctgtgg tgacagtgcc cagctcctct 660
ctgggcacac agacctatat ctgcaatgtg aaccacaagc caagcaacac caaggtggac 720
aagaaggtgg agcccaagtc ctgtgataag acacacacct gccctccctg tcctgcacca 780
gagctgctgg gcggcccatc cgtgttcctg tttccaccca agcctaagga caccctgatg 840
atctctcgga cacccgaggt gacctgcgtg gtggtggacg tgagccacga ggaccccgag 900
gtgaagttta attggtacgt ggatggcgtg gaggtgcaca acgccaagac caagcccagg 960
gaggagcagt acaactccac atatagagtg gtgtctgtgc tgaccgtgct gcaccaggac 1020
tggctgaatg gcaaggagta taagtgcaag gtgtccaaca aggccctgcc cgcccctatc 1080
gagaagacaa tctctaaggc aaagggacag cctcgggagc cacaggtgta caccctgcct 1140
ccatcccgcg acgagctgac aaagaatcag gtgtctctga cctgtctggt gaagggcttc 1200
tatccttctg atatcgcagt ggagtgggag agcaacggac agccagagaa caattacaag 1260
accacacccc ctgtgctgga cagcgatggc tccttctttc tgtatagcaa gctgacagtg 1320
gataagtccc gctggcagca gggcaacgtg ttcagctgtt ccgtgatgca cgaggccctg 1380
cacaaccact acacccagaa gtctctgagc ctgtcccctg gcaag 1425
<210> 42
<211> 475
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 42
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ala Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe
35 40 45
Thr Ser Tyr Gly Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu
50 55 60
Glu Trp Met Gly Trp Ile Ser Ala Tyr Asn Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Leu Gln Gly Arg Val Thr Met Thr Thr Asp Thr Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Arg Ser Leu Arg Ser Asp Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Asp Tyr Thr Arg Gly Ala Trp Phe Gly Glu Ser
115 120 125
Leu Ile Gly Gly Phe Asp Asn Trp Gly Gln Gly Thr Leu Val Thr Val
130 135 140
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
145 150 155 160
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
165 170 175
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
180 185 190
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
195 200 205
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
210 215 220
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
225 230 235 240
Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
245 250 255
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
260 265 270
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
275 280 285
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
290 295 300
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
305 310 315 320
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
325 330 335
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
340 345 350
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
355 360 365
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp
370 375 380
Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
385 390 395 400
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
405 410 415
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
420 425 430
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
435 440 445
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
450 455 460
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470 475
<210> 43
<211> 699
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 43
atggtgctgc agacccaggt gttcatctct ctgctgctgt ggatcagcgg agcatacgga 60
gagatcgtgc tgacccagag ccctggcaca ctgagcctgt ccccaggaga gagggccaca 120
ctgtcctgca gagcctctca gagcgtgagc tcctcttacc tggcctggta tcagcagaag 180
ccaggacagg cccccaggct gctgatctat ggagccagct cccgggccac cggcatcccc 240
gaccgcttct ccggctctgg cagcggcaca gacttcaccc tgacaatctc taggctggag 300
cctgaggact tcgccgtgta ctattgccag cagcacgata ccagcctgac atttggccag 360
ggcaccaagg tggagatcaa gagaacagtg gccgccccat ccgtgttcat ctttccccct 420
tctgacgagc agctgaagag cggaaccgca tccgtggtgt gcctgctgaa caatttctac 480
ccccgggagg ccaaggtgca gtggaaggtg gataacgccc tgcagtccgg caattctcag 540
gagagcgtga ccgagcagga caaggattcc acatattctc tgtctagcac cctgacactg 600
tccaaggccg actacgagaa gcacaaggtg tatgcatgcg aggtgaccca ccagggactg 660
tcctctcccg tgacaaagag ctttaaccgc ggcgagtgt 699
<210> 44
<211> 233
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 44
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser
20 25 30
Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser
35 40 45
Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala
50 55 60
Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro
65 70 75 80
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
85 90 95
Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln His
100 105 110
Asp Thr Ser Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
115 120 125
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
130 135 140
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
145 150 155 160
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
165 170 175
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Lys Asp Ser Thr Tyr
180 185 190
Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His
195 200 205
Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val
210 215 220
Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210> 45
<211> 1425
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 45
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tgcagtccgg agcagaggtg aagaagcctg gagcctctgt gaaggtgagc 120
tgcaaggcct ccggctacac ctttacatct tatggaatca gctgggtgag gcaggcacca 180
ggacagggac tggagtggat gggctggatc agcgcctaca acggcaatac aaactatgcc 240
cagaagctgc agggcagagt gaccatgacc acagacacca gcacatccac cgcctacatg 300
gagctgaggt ctctgagaag cgacgataca gccgtgtact attgcgcccg ggactatacc 360
cgcggcgcct ggttcggaga gtctctgatc ggcggatttg ataattgggg ccagggcaca 420
ctggtgaccg tgtctgccag cacaaaggga ccaagcgtgt tcccactggc acccagctcc 480
aagtccacat ctggcggcac cgccgccctg ggatgtctgg tgaaggatta cttcccagag 540
cccgtgaccg tgtcctggaa ttctggcgcc ctgacaagcg gcgtgcacac ctttccagcc 600
gtgctgcagt ctagcggcct gtactccctg tcctctgtgg tgacagtgcc cagctcctct 660
ctgggcacac agacctatat ctgcaatgtg aaccacaagc caagcaacac caaggtggac 720
aagaaggtgg agcccaagtc ctgtgataag acacacacct gccctccctg tcctgcacca 780
gagctgctgg gcggcccatc cgtgttcctg tttccaccca agcctaagga caccctgatg 840
atctctcgga cacccgaggt gacctgcgtg gtggtggacg tgagccacga ggaccccgag 900
gtgaagttta attggtacgt ggatggcgtg gaggtgcaca acgccaagac caagcccagg 960
gaggagcagt acaactccac atatagagtg gtgtctgtgc tgaccgtgct gcaccaggac 1020
tggctgaatg gcaaggagta taagtgcaag gtgtccaaca aggccctgcc cgcccctatc 1080
gagaagacaa tctctaaggc aaagggacag cctcgggagc cacaggtgta caccctgcct 1140
ccatcccgcg acgagctgac aaagaatcag gtgtctctga cctgtctggt gaagggcttc 1200
tatccttctg atatcgcagt ggagtgggag agcaacggac agccagagaa caattacaag 1260
accacacccc ctgtgctgga cagcgatggc tccttctttc tgtatagcaa gctgacagtg 1320
gataagtccc gctggcagca gggcaacgtg ttcagctgtt ccgtgatgca cgaggccctg 1380
cacaaccact acacccagaa gtctctgagc ctgtcccctg gcaag 1425
<210> 46
<211> 748
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 46
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Arg Asp Val Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Gly Arg Ile Lys Ser Lys Ile Asp Gly Gly Thr Thr Asp
65 70 75 80
Tyr Ala Ala Pro Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asp Ser
85 90 95
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Thr Glu Asp Thr
100 105 110
Ala Val Tyr Tyr Cys Thr Thr Ala Gly Ser Tyr Tyr Tyr Asp Thr Val
115 120 125
Gly Pro Gly Leu Pro Glu Gly Lys Phe Asp Tyr Trp Gly Gln Gly Thr
130 135 140
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
145 150 155 160
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
165 170 175
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
180 185 190
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
195 200 205
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
210 215 220
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
225 230 235 240
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
245 250 255
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
260 265 270
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
275 280 285
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
290 295 300
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
305 310 315 320
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
325 330 335
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
340 345 350
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
355 360 365
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
370 375 380
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
385 390 395 400
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
405 410 415
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
420 425 430
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
435 440 445
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
450 455 460
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470 475 480
Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu
485 490 495
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu
500 505 510
Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr
515 520 525
Gly Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu
530 535 540
Gly Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Val Leu Tyr
545 550 555 560
Ser Ser Asn Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly
565 570 575
Gln Pro Pro Lys Leu Leu Met Tyr Trp Ala Ser Thr Arg Glu Ser Gly
580 585 590
Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Ala Glu Phe Thr Leu
595 600 605
Thr Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Ile Tyr Tyr Cys Gln
610 615 620
Gln Tyr Tyr Ser Thr Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile
625 630 635 640
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
645 650 655
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
660 665 670
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
675 680 685
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
690 695 700
Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr
705 710 715 720
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
725 730 735
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
740 745
<210> 47
<211> 2244
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 47
atggactgga catggagaat cctgttcctg gtcgccgccg caactgggac tcacgccgaa 60
gtgcagctgg tcgaatctgg gggaggcctg gtgaagccag gcggcagcct gaggctgtcc 120
tgcgcagcat ctggcttcac ctttagggac gtgtggatgt cctgggtgag acaggcacca 180
ggcaagggcc tggagtgggt gggacgcatc aagagcaaga tcgacggcgg aaccacagat 240
tatgccgccc ccgtgaaggg caggttcacc atcagcagag acgattccaa gaacacactg 300
tacctgcaga tgaattccct gaagaccgag gatacagccg tgtactattg caccacagcc 360
ggctcttact attacgacac agtgggacca ggcctgccag agggcaagtt cgattattgg 420
ggccagggca ccctggtgac agtgagctcc gccagcacca agggcccttc cgtgtttcct 480
ctggccccat ctagcaagtc taccagcggc ggcacagccg ccctgggatg tctggtgaag 540
gactacttcc ccgagcctgt gaccgtgtcc tggaactctg gcgccctgac ctccggagtg 600
cacacatttc ctgccgtgct gcagtcctct ggcctgtata gcctgagctc cgtggtgacc 660
gtgccatcta gctccctggg cacccagaca tacatctgca acgtgaatca caagccttct 720
aatacaaagg tggacaagaa ggtggagcca aagagctgtg ataagaccca cacatgccct 780
ccctgtccag caccagagct gctgggcggc ccatccgtgt tcctgtttcc acccaagccc 840
aaggacacac tgatgatctc ccggacccca gaggtgacat gcgtggtggt ggacgtgtct 900
cacgaggacc ccgaggtgaa gttcaactgg tacgtggatg gcgtggaggt gcacaatgcc 960
aagaccaagc cccgggagga gcagtataac tctacctacc gcgtggtgag cgtgctgaca 1020
gtgctgcacc aggattggct gaacggcaag gagtacaagt gcaaggtgag caataaggcc 1080
ctgcctgccc caatcgagaa gaccatctcc aaggcaaagg gacagcccag ggagcctcag 1140
gtgtatacac tgcctccaag cagagacgag ctgaccaaga accaggtgtc cctgacatgt 1200
ctggtgaagg gcttctaccc ctccgatatc gccgtggagt gggagtctaa tggccagcct 1260
gagaacaatt ataagaccac accccctgtg ctggacagcg atggctcctt ctttctgtac 1320
agcaagctga ccgtggacaa gtcccggtgg cagcagggca acgtgttttc ctgctctgtg 1380
atgcacggcg ccctgcacaa tcactacacc cagaagagcc tgtccctgtc tccaggcaag 1440
aggggaagga agaggagaag cggctccggc gccacaaact tcagcctgct gaagcaggca 1500
ggcgatgtgg aggagaatcc aggacctatg gtgctgcaga cccaggtgtt tatctccctg 1560
ctgctgtgga tctctggcgc ctacggcgac atcgtgatga cccagtctcc tgatagcctg 1620
gccgtgtctc tgggagagag ggcaacaatc aactgtaagt ctagccagag cgtgctgtat 1680
tcctctaaca ataagaatta tctggcatgg taccagcaga agccaggaca gccacccaag 1740
ctgctgatgt actgggcatc tacccgggag agcggagtgc ctgaccgctt ctctggcagc 1800
ggctccggag cagagtttac cctgacaatc agctccctgc aggccgagga tgtggccatc 1860
tattactgcc agcagtatta cagcaccctg accttcggcg gcggcaccaa ggtggagatc 1920
aagaggacag tggccgcccc tagcgtgttc atctttcctc caagcgacga gcagctgaag 1980
tccggcaccg cctctgtggt gtgcctgctg aacaacttct acccaagaga ggccaaggtg 2040
cagtggaagg tggataacgc cctgcagtcc ggcaattctc aggagagcgt gaccgagcag 2100
gactccaagg attctacata ctctctgagc aacaccctga cactgagcaa ggccgactat 2160
gagaagcaca aggtgtacgc ctgcgaagtg acccaccagg ggctgagcag tccagtgacc 2220
aagtctttca atcggggaga atgc 2244
<210> 48
<211> 748
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 48
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Arg Asp Val Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Gly Arg Ile Lys Ser Lys Ile Asp Gly Gly Thr Thr Asp
65 70 75 80
Tyr Ala Ala Pro Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asp Ser
85 90 95
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Thr Glu Asp Thr
100 105 110
Ala Val Tyr Tyr Cys Thr Thr Ala Gly Ser Tyr Tyr Tyr Asp Thr Val
115 120 125
Gly Pro Gly Leu Pro Glu Gly Lys Phe Asp Tyr Trp Gly Gln Gly Thr
130 135 140
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
145 150 155 160
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
165 170 175
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
180 185 190
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
195 200 205
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
210 215 220
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
225 230 235 240
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
245 250 255
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
260 265 270
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
275 280 285
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
290 295 300
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
305 310 315 320
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
325 330 335
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
340 345 350
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
355 360 365
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
370 375 380
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
385 390 395 400
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
405 410 415
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
420 425 430
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
435 440 445
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Gly Ala
450 455 460
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470 475 480
Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu
485 490 495
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu
500 505 510
Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr
515 520 525
Gly Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu
530 535 540
Gly Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Val Leu Tyr
545 550 555 560
Ser Ser Asn Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly
565 570 575
Gln Pro Pro Lys Leu Leu Met Tyr Trp Ala Ser Thr Arg Glu Ser Gly
580 585 590
Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Ala Glu Phe Thr Leu
595 600 605
Thr Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Ile Tyr Tyr Cys Gln
610 615 620
Gln Tyr Tyr Ser Thr Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile
625 630 635 640
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
645 650 655
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
660 665 670
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
675 680 685
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
690 695 700
Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr
705 710 715 720
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
725 730 735
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
740 745
<210> 49
<211> 2244
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 49
atggactgga catggagaat cctgttcctg gtcgccgccg caactgggac tcacgccgaa 60
gtgcagctgg tcgaatctgg gggaggcctg gtgaagccag gcggcagcct gaggctgtcc 120
tgcgcagcat ctggcttcac ctttagggac gtgtggatgt cctgggtgag acaggcacca 180
ggcaagggcc tggagtgggt gggacgcatc aagagcaaga tcgacggcgg aaccacagat 240
tatgccgccc ccgtgaaggg caggttcacc atcagcagag acgattccaa gaacacactg 300
tacctgcaga tgaattccct gaagaccgag gatacagccg tgtactattg caccacagcc 360
ggctcttact attacgacac agtgggacca ggcctgccag agggcaagtt cgattattgg 420
ggccagggca ccctggtgac agtgagctcc gccagcacca agggcccttc cgtgtttcct 480
ctggccccat ctagcaagtc taccagcggc ggcacagccg ccctgggatg tctggtgaag 540
gactacttcc ccgagcctgt gaccgtgtcc tggaactctg gcgccctgac ctccggagtg 600
cacacatttc ctgccgtgct gcagtcctct ggcctgtata gcctgagctc cgtggtgacc 660
gtgccatcta gctccctggg cacccagaca tacatctgca acgtgaatca caagccttct 720
aatacaaagg tggacaagaa ggtggagcca aagagctgtg ataagaccca cacatgccct 780
ccctgtccag caccagagct gctgggcggc ccatccgtgt tcctgtttcc acccaagccc 840
aaggacacac tgatgatctc ccggacccca gaggtgacat gcgtggtggt ggacgtgtct 900
cacgaggacc ccgaggtgaa gttcaactgg tacgtggatg gcgtggaggt gcacaatgcc 960
aagaccaagc cccgggagga gcagtataac tctacctacc gcgtggtgag cgtgctgaca 1020
gtgctgcacc aggattggct gaacggcaag gagtacaagt gcaaggtgag caataaggcc 1080
ctgcctgccc caatcgagaa gaccatctcc aaggcaaagg gacagcccag gaagcctcag 1140
gtgtatacac tgcctccaag cagagacgag ctgaccaaga accaggtgtc cctgacatgt 1200
ctggtgaagg gcttctaccc ctccgatatc gccgtggagt gggagtctaa tggccagcct 1260
gagaacaatt ataagaccac accccctgtg ctggacagcg atggctcctt ctttctgtac 1320
agcaagctga ccgtggacaa gtcccggtgg cagcagggca acgtgttttc ctgctctgtg 1380
atgcacggcg ccctgcacaa tcactacacc cagaagagcc tgtccctgtc tccaggcaag 1440
aggggaagga agaggagaag cggctccggc gccacaaact tcagcctgct gaagcaggca 1500
ggcgatgtgg aggagaatcc aggacctatg gtgctgcaga cccaggtgtt tatctccctg 1560
ctgctgtgga tctctggcgc ctacggcgac atcgtgatga cccagtctcc tgatagcctg 1620
gccgtgtctc tgggagagag ggcaacaatc aactgtaagt ctagccagag cgtgctgtat 1680
tcctctaaca ataagaatta tctggcatgg taccagcaga agccaggaca gccacccaag 1740
ctgctgatgt actgggcatc tacccgggag agcggagtgc ctgaccgctt ctctggcagc 1800
ggctccggag cagagtttac cctgacaatc agctccctgc aggccgagga tgtggccatc 1860
tattactgcc agcagtatta cagcaccctg accttcggcg gcggcaccaa ggtggagatc 1920
aagaggacag tggccgcccc tagcgtgttc atctttcctc caagcgacga gcagctgaag 1980
tccggcaccg cctctgtggt gtgcctgctg aacaacttct acccaagaga ggccaaggtg 2040
cagtggaagg tggataacgc cctgcagtcc ggcaattctc aggagagcgt gaccgagcag 2100
gactccaagg attctacata ctctctgagc aacaccctga cactgagcaa ggccgactat 2160
gagaagcaca aggtgtacgc ctgcgaagtg acccaccagg ggctgagcag tccagtgacc 2220
aagtctttca atcggggaga atgc 2244
<210> 50
<211> 748
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 50
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Arg Asp Val Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Gly Arg Ile Lys Ser Lys Ile Asp Gly Gly Thr Thr Asp
65 70 75 80
Tyr Ala Ala Pro Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asp Ser
85 90 95
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Thr Glu Asp Thr
100 105 110
Ala Val Tyr Tyr Cys Thr Thr Ala Gly Ser Tyr Tyr Tyr Asp Thr Val
115 120 125
Gly Pro Gly Leu Pro Glu Gly Lys Phe Asp Tyr Trp Gly Gln Gly Thr
130 135 140
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
145 150 155 160
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
165 170 175
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
180 185 190
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
195 200 205
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
210 215 220
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
225 230 235 240
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
245 250 255
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
260 265 270
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
275 280 285
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
290 295 300
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
305 310 315 320
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
325 330 335
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
340 345 350
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
355 360 365
Ile Ser Lys Ala Lys Gly Gln Pro Arg Lys Pro Gln Val Tyr Thr Leu
370 375 380
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
385 390 395 400
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
405 410 415
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
420 425 430
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
435 440 445
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Gly Ala
450 455 460
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470 475 480
Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu
485 490 495
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu
500 505 510
Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr
515 520 525
Gly Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu
530 535 540
Gly Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Val Leu Tyr
545 550 555 560
Ser Ser Asn Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly
565 570 575
Gln Pro Pro Lys Leu Leu Met Tyr Trp Ala Ser Thr Arg Glu Ser Gly
580 585 590
Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Ala Glu Phe Thr Leu
595 600 605
Thr Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Ile Tyr Tyr Cys Gln
610 615 620
Gln Tyr Tyr Ser Thr Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile
625 630 635 640
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
645 650 655
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
660 665 670
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
675 680 685
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
690 695 700
Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr
705 710 715 720
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
725 730 735
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
740 745
<210> 51
<211> 2244
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 51
atggactgga catggagaat cctgttcctg gtcgccgccg caactgggac tcacgccgaa 60
gtgcagctgg tcgaatctgg gggaggcctg gtgaagccag gcggcagcct gaggctgtcc 120
tgcgcagcat ctggcttcac ctttagggac gtgtggatgt cctgggtgag acaggcacca 180
ggcaagggcc tggagtgggt gggacgcatc aagagcaaga tcgacggcgg aaccacagat 240
tatgccgccc ccgtgaaggg caggttcacc atcagcagag acgattccaa gaacacactg 300
tacctgcaga tgaattccct gaagaccgag gatacagccg tgtactattg caccacagcc 360
ggctcttact attacgacac agtgggacca ggcctgccag agggcaagtt cgattattgg 420
ggccagggca ccctggtgac agtgagctcc gccagcacca agggcccttc cgtgtttcct 480
ctggccccat ctagcaagtc taccagcggc ggcacagccg ccctgggatg tctggtgaag 540
gactacttcc ccgagcctgt gaccgtgtcc tggaactctg gcgccctgac ctccggagtg 600
cacacatttc ctgccgtgct gcagtcctct ggcctgtata gcctgagctc cgtggtgacc 660
gtgccatcta gctccctggg cacccagaca tacatctgca acgtgaatca caagccttct 720
aatacaaagg tggacaagaa ggtggagcca aagagctgtg ataagaccca cacatgccct 780
ccctgtccag caccagagtt cgagggcggc ccatccgtgt tcctgtttcc acccaagccc 840
aaggacacac tgatgatctc ccggacccca gaggtgacat gcgtggtggt ggacgtgtct 900
cacgaggacc ccgaggtgaa gttcaactgg tacgtggatg gcgtggaggt gcacaatgcc 960
aagaccaagc cccgggagga gcagtataac tctacctacc gcgtggtgag cgtgctgaca 1020
gtgctgcacc aggattggct gaacggcaag gagtacaagt gcaaggtgag caataaggcc 1080
ctgcctgcca gcatcgagaa gaccatctcc aaggcaaagg gacagcccag ggagcctcag 1140
gtgtatacac tgcctccaag cagagacgag ctgaccaaga accaggtgtc cctgacatgt 1200
ctggtgaagg gcttctaccc ctccgatatc gccgtggagt gggagtctaa tggccagcct 1260
gagaacaatt ataagaccac accccctgtg ctggacagcg atggctcctt ctttctgtac 1320
agcaagctga ccgtggacaa gtcccggtgg cagcagggca acgtgttttc ctgctctgtg 1380
atgcacgagg ccctgcacaa tcactacacc cagaagagcc tgtccctgtc tccaggcaag 1440
aggggaagga agaggagaag cggctccggc gccacaaact tcagcctgct gaagcaggca 1500
ggcgatgtgg aggagaatcc aggacctatg gtgctgcaga cccaggtgtt tatctccctg 1560
ctgctgtgga tctctggcgc ctacggcgac atcgtgatga cccagtctcc tgatagcctg 1620
gccgtgtctc tgggagagag ggcaacaatc aactgtaagt ctagccagag cgtgctgtat 1680
tcctctaaca ataagaatta tctggcatgg taccagcaga agccaggaca gccacccaag 1740
ctgctgatgt actgggcatc tacccgggag agcggagtgc ctgaccgctt ctctggcagc 1800
ggctccggag cagagtttac cctgacaatc agctccctgc aggccgagga tgtggccatc 1860
tattactgcc agcagtatta cagcaccctg accttcggcg gcggcaccaa ggtggagatc 1920
aagaggacag tggccgcccc tagcgtgttc atctttcctc caagcgacga gcagctgaag 1980
tccggcaccg cctctgtggt gtgcctgctg aacaacttct acccaagaga ggccaaggtg 2040
cagtggaagg tggataacgc cctgcagtcc ggcaattctc aggagagcgt gaccgagcag 2100
gactccaagg attctacata ctctctgagc aacaccctga cactgagcaa ggccgactat 2160
gagaagcaca aggtgtacgc ctgcgaagtg acccaccagg ggctgagcag tccagtgacc 2220
aagtctttca atcggggaga atgc 2244
<210> 52
<211> 748
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 52
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Arg Asp Val Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Gly Arg Ile Lys Ser Lys Ile Asp Gly Gly Thr Thr Asp
65 70 75 80
Tyr Ala Ala Pro Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asp Ser
85 90 95
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Thr Glu Asp Thr
100 105 110
Ala Val Tyr Tyr Cys Thr Thr Ala Gly Ser Tyr Tyr Tyr Asp Thr Val
115 120 125
Gly Pro Gly Leu Pro Glu Gly Lys Phe Asp Tyr Trp Gly Gln Gly Thr
130 135 140
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
145 150 155 160
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
165 170 175
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
180 185 190
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
195 200 205
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
210 215 220
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
225 230 235 240
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
245 250 255
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Phe Glu Gly Gly Pro Ser
260 265 270
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
275 280 285
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
290 295 300
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
305 310 315 320
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
325 330 335
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
340 345 350
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Ser Ile Glu Lys Thr
355 360 365
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
370 375 380
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
385 390 395 400
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
405 410 415
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
420 425 430
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
435 440 445
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
450 455 460
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470 475 480
Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu
485 490 495
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu
500 505 510
Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr
515 520 525
Gly Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu
530 535 540
Gly Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Val Leu Tyr
545 550 555 560
Ser Ser Asn Asn Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly
565 570 575
Gln Pro Pro Lys Leu Leu Met Tyr Trp Ala Ser Thr Arg Glu Ser Gly
580 585 590
Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Ala Glu Phe Thr Leu
595 600 605
Thr Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Ile Tyr Tyr Cys Gln
610 615 620
Gln Tyr Tyr Ser Thr Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile
625 630 635 640
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
645 650 655
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
660 665 670
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
675 680 685
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
690 695 700
Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr
705 710 715 720
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
725 730 735
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
740 745
<210> 53
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 53
atggactgga cttggagaat cctgtttctg gtcgccgccg ctactggaac ccacgctcag 60
atgcagctgg tgcagagtgg acccgaagtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagtttc aggagcgcgt gtctatcaca agggacatgt ctaccagcac agcctatatg 300
gagctgtcta gcctgagatc cgaggatacc gccgtgtact attgcgccgc cccttactgt 360
tcccggacat cttgccacga cgcctttgat atctggggcc agggcaccaa ggtgacagtg 420
tcctctgcct ctacaaaggg accaagcgtg ttcccactgg cacctagctc caagtccacc 480
tctggcggca cagccgccct gggctgtctg gtgaaggact actttcctga gccagtgacc 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca cattccctgc cgtgctgcag 600
tctagcggcc tgtacagcct gtcctctgtg gtgaccgtgc caagctcctc tctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagccgg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttc 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaactcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ttaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
cgctggcagc agggcaacgt gttcagctgt tccgtgatgc acgaggccct gcacaatcac 1380
tatacccaga agtctctgag cctgtcccct ggcaagaggg gaaggaagag gagatctggc 1440
agcggcgcca caaactttag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgttcatc agcctgctgc tgtggatctc cggagcatac 1560
ggagaggtgg tgctgaccca gtccccaggc acactgtccc tgtctcctgg agagagagcc 1620
accctgagct gcagggcaag ccagtccgtg agctcctctt acctggcctg gtatcagcag 1680
aagcctggac aggccccacg cctgctgatc tatggagcca gctcccgcgc caccggcatc 1740
cccgacaggt tttctggcag cggctccggc acagatttca ccctgacaat ctccaggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactttg gctctagctc ccagtggacc 1860
ttcggccagg gcacaaaggt ggagatcaag agaaccgtgg ccgccccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc ccagggaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc tctgagcaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtcact 2160
caccaggggc tgtccagtcc cgtcactaag tctttcaata gaggcgaatg t 2211
<210> 54
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 54
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Arg Thr Ser Cys His Asp Ala
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Phe Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 55
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 55
atggactgga cttggagaat cctgtttctg gtcgccgccg ctactggaac ccacgctcag 60
atgcagctgg tgcagagtgg acccgaagtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagtttc aggagcgcgt gtctatcaca agggacatgt ctaccagcac agcctatatg 300
gagctgtcta gcctgagatc cgaggatacc gccgtgtact attgcgccgc cccttactgt 360
tcccggacat cttgccacga cgcctttgat atctggggcc agggcaccaa ggtgacagtg 420
tcctctgcct ctacaaaggg accaagcgtg ttcccactgg cacctagctc caagtccacc 480
tctggcggca cagccgccct gggctgtctg gtgaaggact actttcctga gccagtgacc 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca cattccctgc cgtgctgcag 600
tctagcggcc tgtacagcct gtcctctgtg gtgaccgtgc caagctcctc tctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagccgg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttc 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaactcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ttaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
cgctggcagc agggcaacgt gttcagctgt tccgtgatgc acggcgccct gcacaatcac 1380
tatacccaga agtctctgag cctgtcccct ggcaagaggg gaaggaagag gagatctggc 1440
agcggcgcca caaactttag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgttcatc agcctgctgc tgtggatctc cggagcatac 1560
ggagaggtgg tgctgaccca gtccccaggc acactgtccc tgtctcctgg agagagagcc 1620
accctgagct gcagggcaag ccagtccgtg agctcctctt acctggcctg gtatcagcag 1680
aagcctggac aggccccacg cctgctgatc tatggagcca gctcccgcgc caccggcatc 1740
cccgacaggt tttctggcag cggctccggc acagatttca ccctgacaat ctccaggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactttg gctctagctc ccagtggacc 1860
ttcggccagg gcacaaaggt ggagatcaag agaaccgtgg ccgccccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc ccagggaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc tctgagcaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtcact 2160
caccaggggc tgtccagtcc cgtcactaag tctttcaata gaggcgaatg t 2211
<210> 56
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 56
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Arg Thr Ser Cys His Asp Ala
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Gly Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Phe Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 57
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 57
atggactgga cttggagaat cctgtttctg gtcgccgccg ctactggaac ccacgctcag 60
atgcagctgg tgcagagtgg acccgaagtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagtttc aggagcgcgt gtctatcaca agggacatgt ctaccagcac agcctatatg 300
gagctgtcta gcctgagatc cgaggatacc gccgtgtact attgcgccgc cccttactgt 360
tcccggacat cttgccacga cgcctttgat atctggggcc agggcaccaa ggtgacagtg 420
tcctctgcct ctacaaaggg accaagcgtg ttcccactgg cacctagctc caagtccacc 480
tctggcggca cagccgccct gggctgtctg gtgaaggact actttcctga gccagtgacc 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca cattccctgc cgtgctgcag 600
tctagcggcc tgtacagcct gtcctctgtg gtgaccgtgc caagctcctc tctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagccgg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttc 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaactcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcaag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ttaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
cgctggcagc agggcaacgt gttcagctgt tccgtgatgc acggcgccct gcacaatcac 1380
tatacccaga agtctctgag cctgtcccct ggcaagaggg gaaggaagag gagatctggc 1440
agcggcgcca caaactttag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgttcatc agcctgctgc tgtggatctc cggagcatac 1560
ggagaggtgg tgctgaccca gtccccaggc acactgtccc tgtctcctgg agagagagcc 1620
accctgagct gcagggcaag ccagtccgtg agctcctctt acctggcctg gtatcagcag 1680
aagcctggac aggccccacg cctgctgatc tatggagcca gctcccgcgc caccggcatc 1740
cccgacaggt tttctggcag cggctccggc acagatttca ccctgacaat ctccaggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactttg gctctagctc ccagtggacc 1860
ttcggccagg gcacaaaggt ggagatcaag agaaccgtgg ccgccccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc ccagggaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc tctgagcaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtcact 2160
caccaggggc tgtccagtcc cgtcactaag tctttcaata gaggcgaatg t 2211
<210> 58
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 58
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Arg Thr Ser Cys His Asp Ala
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Lys Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Gly Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Phe Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 59
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 59
atggactgga cttggagaat cctgtttctg gtcgccgccg ctactggaac ccacgctcag 60
atgcagctgg tgcagagtgg acccgaagtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagtttc aggagcgcgt gtctatcaca agggacatgt ctaccagcac agcctatatg 300
gagctgtcta gcctgagatc cgaggatacc gccgtgtact attgcgccgc cccttactgt 360
tcccggacat cttgccacga cgcctttgat atctggggcc agggcaccaa ggtgacagtg 420
tcctctgcct ctacaaaggg accaagcgtg ttcccactgg cacctagctc caagtccacc 480
tctggcggca cagccgccct gggctgtctg gtgaaggact actttcctga gccagtgacc 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca cattccctgc cgtgctgcag 600
tctagcggcc tgtacagcct gtcctctgtg gtgaccgtgc caagctcctc tctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagttcgag 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagccgg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttc 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaactcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagccagcat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ttaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
cgctggcagc agggcaacgt gttcagctgt tccgtgatgc acgaggccct gcacaatcac 1380
tatacccaga agtctctgag cctgtcccct ggcaagaggg gaaggaagag gagatctggc 1440
agcggcgcca caaactttag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgttcatc agcctgctgc tgtggatctc cggagcatac 1560
ggagaggtgg tgctgaccca gtccccaggc acactgtccc tgtctcctgg agagagagcc 1620
accctgagct gcagggcaag ccagtccgtg agctcctctt acctggcctg gtatcagcag 1680
aagcctggac aggccccacg cctgctgatc tatggagcca gctcccgcgc caccggcatc 1740
cccgacaggt tttctggcag cggctccggc acagatttca ccctgacaat ctccaggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactttg gctctagctc ccagtggacc 1860
ttcggccagg gcacaaaggt ggagatcaag agaaccgtgg ccgccccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc ccagggaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc tctgagcaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtcact 2160
caccaggggc tgtccagtcc cgtcactaag tctttcaata gaggcgaatg t 2211
<210> 60
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 60
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Arg Thr Ser Cys His Asp Ala
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Phe Glu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Phe Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 61
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 61
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gtctatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccaa ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acgaggccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagaggtgg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactatg gctcctctag ccagtggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg t 2211
<210> 62
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 62
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Tyr Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 63
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 63
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gtctatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccaa ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acggcgccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagaggtgg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactatg gctcctctag ccagtggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg t 2211
<210> 64
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 64
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Gly Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Tyr Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 65
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 65
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gtctatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccaa ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcaag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acggcgccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagaggtgg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactatg gctcctctag ccagtggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg t 2211
<210> 66
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 66
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Lys Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Gly Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Tyr Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 67
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 67
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttacaagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gcagtgggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gtctatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccaa ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagttcgag 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagccagcat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acgaggccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagaggtgg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtaccactgt cagcactatg gctcctctag ccagtggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg t 2211
<210> 68
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 68
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Phe Glu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Tyr Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 69
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 69
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttatgagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gtgatcggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gaccatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccat ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acgaggccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagagatcg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtactactgt cagcactatg gctcctctcg gggctggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg ttgataa 2217
<210> 70
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 70
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Met Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Val Ile Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Thr Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Ile Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
Tyr Cys Gln His Tyr Gly Ser Ser Arg Gly Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 71
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 71
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttatgagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gtgatcggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gaccatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccat ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acggcgccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagagatcg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtactactgt cagcactatg gctcctctcg gggctggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg ttgataa 2217
<210> 72
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 72
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Met Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Val Ile Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Thr Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Gly Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Ile Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
Tyr Cys Gln His Tyr Gly Ser Ser Arg Gly Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 73
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 73
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttatgagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gtgatcggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gaccatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccat ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagctgctg 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagcccccat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcaag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acggcgccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagagatcg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtactactgt cagcactatg gctcctctcg gggctggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg ttgataa 2217
<210> 74
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 74
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Met Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Val Ile Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Thr Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Lys Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Gly Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Ile Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
Tyr Cys Gln His Tyr Gly Ser Ser Arg Gly Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 75
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 75
atggactgga catggagaat cctgttcctg gtcgccgccg caactggcac tcacgctcag 60
atgcagctgg tgcagtctgg acccgaggtg aagaagcccg gcaccagcgt gaaggtgtcc 120
tgtaaggcct ctggcttcac ctttatgagc tccgccgtgc agtgggtgag gcaggccaga 180
ggccagcggc tggagtggat cggatggatc gtgatcggct ccggaaacac caattacgcc 240
cagaagttcc aggagcgcgt gaccatcaca agggacatgt ccacctctac agcctatatg 300
gagctgtcta gcctgcggtc cgaggataca gccgtgtact attgcgccgc cccttactgt 360
tcctctatca gctgcaacga cggcttcgat atctggggcc agggcaccat ggtgacagtg 420
agctccgcct ctaccaaggg cccaagcgtg tttcccctgg ccccttctag caagagcacc 480
tccggcggca cagccgccct gggctgtctg gtgaaggact acttccctga gccagtgaca 540
gtgagctgga actccggcgc cctgacctcc ggagtgcaca catttcctgc cgtgctgcag 600
tcctctggcc tgtacagcct gagctccgtg gtgaccgtgc catctagctc cctgggcacc 660
cagacatata tctgtaacgt gaatcacaag ccttccaata caaaggtgga caagaaggtg 720
gagccaaagt cttgcgataa gacccacaca tgccctccct gtccagcacc tgagttcgag 780
ggcggcccaa gcgtgttcct gtttccaccc aagcccaagg acaccctgat gatcagcagg 840
accccagagg tgacatgcgt ggtggtggac gtgtcccacg aggaccccga ggtgaagttt 900
aactggtacg tggatggcgt ggaggtgcac aatgccaaga ccaagcccag agaggagcag 960
tacaattcca cctatcgggt ggtgtctgtg ctgacagtgc tgcaccagga ctggctgaac 1020
ggcaaggagt acaagtgtaa ggtgtctaat aaggccctgc cagccagcat cgagaagacc 1080
atcagcaagg caaagggaca gccacgcgag ccacaggtgt atacactgcc tccatctagg 1140
gacgagctga ccaagaacca ggtgagcctg acatgcctgg tgaagggctt ctaccccagc 1200
gatatcgccg tggagtggga gtccaatggc cagcctgaga acaattacaa gaccacaccc 1260
cctgtgctgg actctgatgg cagcttcttt ctgtattcta agctgaccgt ggacaagagc 1320
agatggcagc agggcaacgt gttttcttgt agcgtgatgc acgaggccct gcacaatcac 1380
tacacccaga agtccctgtc tctgagccct ggcaagaggg gaaggaagag gagatccggc 1440
tctggcgcca caaacttcag cctgctgaag caggccggcg atgtggagga gaatcctggc 1500
ccaatggtgc tgcagaccca ggtgtttatc agcctgctgc tgtggatctc cggagcatat 1560
ggagagatcg tgctgaccca gtccccaggc acactgagcc tgtcccctgg agagagagcc 1620
accctgagct gcagggcatc tcagagcgtg tctagctcct acctggcctg gtatcagcag 1680
aagcctggcc aggccccaag actgctgatc tacggagcct ctagccgcgc caccggcatc 1740
cccgacaggt tctccggctc tggcagcggc acagacttca ccctgacaat ctcccggctg 1800
gagcctgagg acttcgccgt gtactactgt cagcactatg gctcctctcg gggctggacc 1860
tttggccagg gcacaaaggt ggagatcaag aggaccgtgg cagcaccatc cgtgttcatc 1920
tttccaccct ctgacgagca gctgaagagc ggcacagcct ccgtggtgtg cctgctgaac 1980
aatttctatc cccgcgaggc caaggtgcag tggaaggtgg ataacgccct gcagtccggc 2040
aattctcagg agagcgtgac cgagcaggac tccaaggatt ctacatactc cctgtctaac 2100
accctgacac tgagcaaggc cgattacgag aagcacaagg tgtatgcctg cgaggtgacc 2160
catcaggggc tgtcttctcc agtgaccaaa tccttcaatc gcggggaatg ttgataa 2217
<210> 76
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 76
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Met Gln Leu Val Gln Ser Gly Pro Glu Val Lys Lys
20 25 30
Pro Gly Thr Ser Val Lys Val Ser Cys Lys Ala Ser Gly Phe Thr Phe
35 40 45
Thr Ser Ser Ala Val Gln Trp Val Arg Gln Ala Arg Gly Gln Arg Leu
50 55 60
Glu Trp Ile Gly Trp Ile Ala Val Gly Ser Gly Asn Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Glu Arg Val Ser Ile Thr Arg Asp Met Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Pro Tyr Cys Ser Ser Ile Ser Cys Asn Asp Gly
115 120 125
Phe Asp Ile Trp Gly Gln Gly Thr Lys Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
245 250 255
Pro Glu Phe Glu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
260 265 270
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
275 280 285
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
290 295 300
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
305 310 315 320
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
325 330 335
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
340 345 350
Leu Pro Ala Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
355 360 365
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
370 375 380
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
385 390 395 400
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
405 410 415
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
420 425 430
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
435 440 445
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
450 455 460
Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly
465 470 475 480
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
485 490 495
Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu
500 505 510
Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Val Val Leu Thr Gln Ser
515 520 525
Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys
530 535 540
Arg Ala Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln
545 550 555 560
Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg
565 570 575
Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp
580 585 590
Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr
595 600 605
His Cys Gln His Tyr Gly Ser Ser Ser Gln Trp Thr Phe Gly Gln Gly
610 615 620
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile
625 630 635 640
Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val
645 650 655
Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys
660 665 670
Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu
675 680 685
Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu
690 695 700
Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr
705 710 715 720
His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu
725 730 735
Cys
<210> 77
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 77
agatactgga tgagt 15
<210> 78
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 78
gaaattaatc cagatagcag tacgataaac tatacgccat ctctaaagga t 51
<210> 79
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 79
atctactatg gttcccctgg tgctatggac tac 33
<210> 80
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 80
Arg Tyr Trp Met Ser
1 5
<210> 81
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 81
Glu Ile Asn Pro Asp Ser Ser Thr Ile Asn Tyr Thr Pro Ser Leu Lys
1 5 10 15
Asp
<210> 82
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 82
Ile Tyr Tyr Gly Ser Pro Gly Ala Met Asp Tyr
1 5 10
<210> 83
<211> 414
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 83
atggattttg ggctgatttt ttttattgtt gctcttttaa aaggggtcca gtgtgaggtg 60
aagcttctcg agtctggagg tggcctggtg cagcctggag gatccctgaa actctcctgt 120
gcagcctcag gattcgattt tagtagatac tggatgagtt gggtccggca ggctccaggg 180
aaagggctag aatggattgg agaaattaat ccagatagca gtacgataaa ctatacgcca 240
tctctaaagg ataaattcat catctccaga gacaacgcca aaaatacgct gtacctgcaa 300
atgagcaaag tgagatctga ggacacagcc ctttattact gtgcaaggat ctactatggt 360
tcccctggtg ctatggacta ctggggtcaa ggaacctcag tcaccgtctc ctca 414
<210> 84
<211> 138
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 84
Met Asp Phe Gly Leu Ile Phe Phe Ile Val Ala Leu Leu Lys Gly Val
1 5 10 15
Gln Cys Glu Val Lys Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro
20 25 30
Gly Gly Ser Leu Lys Leu Ser Cys Ala Ala Ser Gly Phe Asp Phe Ser
35 40 45
Arg Tyr Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu
50 55 60
Trp Ile Gly Glu Ile Asn Pro Asp Ser Ser Thr Ile Asn Tyr Thr Pro
65 70 75 80
Ser Leu Lys Asp Lys Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn Thr
85 90 95
Leu Tyr Leu Gln Met Ser Lys Val Arg Ser Glu Asp Thr Ala Leu Tyr
100 105 110
Tyr Cys Ala Arg Ile Tyr Tyr Gly Ser Pro Gly Ala Met Asp Tyr Trp
115 120 125
Gly Gln Gly Thr Ser Val Thr Val Ser Ser
130 135
<210> 85
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 85
aaggccagtc agagtgtgag taatgatgta gct 33
<210> 86
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 86
tatgcatcca atcgctacac t 21
<210> 87
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 87
cagcaggatt atttctctcc gtacacg 27
<210> 88
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 88
Lys Ala Ser Gln Ser Val Ser Asn Asp Val Ala
1 5 10
<210> 89
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 89
Tyr Ala Ser Asn Arg Tyr Thr
1 5
<210> 90
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 90
Gln Gln Asp Tyr Phe Ser Pro Tyr Thr
1 5
<210> 91
<211> 381
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 91
atgaagtcac agacccaggt cttcgtattt ctactgctct gtgtgtctgg tgctcatggg 60
agtattgtga tgacccagac tcccaaattc ctgcttgtat cagcaggaga cagggttacc 120
ataacctgca aggccagtca gagtgtgagt aatgatgtag cttggtacca acagaagcca 180
gggcagtctc ctaaactgct gatatactat gcatccaatc gctacactgg agtccctgat 240
cgcttcactg gcagtggata tgggacggat ttcactttca ccatcagcac tgtgcaggct 300
gaagacctgg cagtttattt ctgtcagcag gattatttct ctccgtacac gttcggaggg 360
gggaccaagc tggaaataaa a 381
<210> 92
<211> 127
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 92
Met Lys Ser Gln Thr Gln Val Phe Val Phe Leu Leu Leu Cys Val Ser
1 5 10 15
Gly Ala His Gly Ser Ile Val Met Thr Gln Thr Pro Lys Phe Leu Leu
20 25 30
Val Ser Ala Gly Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Ser
35 40 45
Val Ser Asn Asp Val Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ser Pro
50 55 60
Lys Leu Leu Ile Tyr Tyr Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp
65 70 75 80
Arg Phe Thr Gly Ser Gly Tyr Gly Thr Asp Phe Thr Phe Thr Ile Ser
85 90 95
Thr Val Gln Ala Glu Asp Leu Ala Val Tyr Phe Cys Gln Gln Asp Tyr
100 105 110
Phe Ser Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
115 120 125
<210> 93
<211> 360
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 93
gaggtgaagc tgctggagag cggaggagga ctggtgcagc ctggaggcag cctgaagctg 60
tcctgcgctg cctctggatt cgacttttcc aggtactgga tgtcttgggt gagacaggcc 120
ccaggcaagg gactggagtg gatcggcgag atcaacccag atagctccac aatcaactac 180
accccctccc tgaaggacaa gttcatcatc tctagagata acgctaagaa cacactgtac 240
ctgcagatga gcaaggtgag gtccgaggac accgctctgt actactgcgc cagaatctac 300
tacggcagcc ctggcgccat ggattactgg ggccagggaa catctgtgac cgtgagcagc 360
<210> 94
<211> 120
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 94
Glu Val Lys Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Lys Leu Ser Cys Ala Ala Ser Gly Phe Asp Phe Ser Arg Tyr
20 25 30
Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Ile
35 40 45
Gly Glu Ile Asn Pro Asp Ser Ser Thr Ile Asn Tyr Thr Pro Ser Leu
50 55 60
Lys Asp Lys Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Ser Lys Val Arg Ser Glu Asp Thr Ala Leu Tyr Tyr Cys
85 90 95
Ala Arg Ile Tyr Tyr Gly Ser Pro Gly Ala Met Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Ser Val Thr Val Ser Ser
115 120
<210> 95
<211> 321
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 95
tccatcgtga tgacacagac ccccaagttt ctgctggtgt ccgccggcga cagggtgaca 60
atcacctgta aggcttccca gtctgtgagc aacgatgtgg cctggtacca gcagaagcct 120
ggacagtccc caaagctgct gatctactac gcctctaacc ggtacacagg cgtgcctgac 180
cgcttcacag gctctggata cggcaccgac ttcaccttca ccatcagcac cgtgcaggct 240
gaggacctgg ccgtgtactt ttgccagcag gattacttca gcccatacac atttggaggc 300
ggaaccaagc tggagatcaa g 321
<210> 96
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 96
Ser Ile Val Met Thr Gln Thr Pro Lys Phe Leu Leu Val Ser Ala Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Ser Val Ser Asn Asp
20 25 30
Val Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ser Pro Lys Leu Leu Ile
35 40 45
Tyr Tyr Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe Thr Gly
50 55 60
Ser Gly Tyr Gly Thr Asp Phe Thr Phe Thr Ile Ser Thr Val Gln Ala
65 70 75 80
Glu Asp Leu Ala Val Tyr Phe Cys Gln Gln Asp Tyr Phe Ser Pro Tyr
85 90 95
Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
100 105
<210> 97
<211> 2178
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 97
atggactgga cctggagaat cctgttcctg gtggctgctg ctaccggaac acacgctgag 60
gtgaagctgc tggagagcgg aggaggactg gtgcagcctg gaggcagcct gaagctgtcc 120
tgcgctgcct ctggattcga cttttccagg tactggatgt cttgggtgag acaggcccca 180
ggcaagggac tggagtggat cggcgagatc aacccagata gctccacaat caactacacc 240
ccctccctga aggacaagtt catcatctct agagataacg ctaagaacac actgtacctg 300
cagatgagca aggtgaggtc cgaggacacc gctctgtact actgcgccag aatctactac 360
ggcagccctg gcgccatgga ttactggggc cagggaacat ctgtgaccgt gagcagcgcc 420
aagaccacac cacctagcgt gtacccactg gctcctggct ccgctgctca gacaaactct 480
atggtgaccc tgggatgtct ggtgaagggc tacttccctg agccagtgac cgtgacatgg 540
aactctggaa gcctgtcctc tggcgtgcac acctttcccg ccgtgctgca gtccgacctg 600
tacacactga gctcctctgt gaccgtgcct agctccccca ggcctagcga gaccgtgaca 660
tgcaacgtgg ctcaccccgc ctctagcaca aaggtggaca agaagatcgt gcctagagat 720
tgcggctgta agccctgcat ctgtaccgtg cctgaggtga gcagcgtgtt catctttcca 780
cccaagccta aggacgtgct gaccatcaca ctgaccccaa aggtgacctg cgtggtggtg 840
gatatctcta aggacgatcc agaggtgcag ttcagctggt ttgtggacga tgtggaggtg 900
cacacagctc agacccagcc tagggaggag cagttcaaca gcaccttcag gagcgtgagc 960
gagctgccaa tcatgcacca ggattggctg aacggaaagg agttcaagtg ccgggtgaac 1020
tccgctgcct ttccagcccc catcgagaag acaatctcta agaccaaggg acagccacgg 1080
gagccacagg tgtacaccct gcctccaagc cgcgacgagc tgacaaagaa ccaggtgtcc 1140
ctgacctgtc tggtgaaggg attctaccca agcgatatcg ctgtggagtg ggagtccaac 1200
ggccagcccg agaacaacta caagaccaca ccccctgtgc tggactccga tggatctttc 1260
tttctgtaca gcaagctgac cgtggacaag tcccgctggc agcagggcaa cgtgttcagc 1320
tgctccgtga tgcacgaggc cctgcacaac cactacacac agaagtctct gagcctgtcc 1380
ccaggaaaga ggggaaggaa gaggagatct ggcagcggag ctaccaactt ttccctgctg 1440
aagcaggccg gagatgtgga ggagaaccct ggcccaatgg tgctgcagac acaggtgttc 1500
atcagcctgc tgctgtggat cagcggagct tacggctcca tcgtgatgac acagaccccc 1560
aagtttctgc tggtgtccgc cggcgacagg gtgacaatca cctgtaaggc ttcccagtct 1620
gtgagcaacg atgtggcctg gtaccagcag aagcctggac agtccccaaa gctgctgatc 1680
tactacgcct ctaaccggta cacaggcgtg cctgaccgct tcacaggctc tggatacggc 1740
accgacttca ccttcaccat cagcaccgtg caggctgagg acctggccgt gtacttttgc 1800
cagcaggatt acttcagccc atacacattt ggaggcggaa ccaagctgga gatcaagcgg 1860
acagtggctg cccctagcgt gttcatcttc ccacccagcg acgagcagct gaagtctgga 1920
accgccagcg tggtgtgcct gctgaacaac ttctacccac gcgaggctaa ggtgcagtgg 1980
aaggtggata acgccctgca gagcggcaac tcccaggagt ctgtgacaga gcaggacagc 2040
aaggattcca cctactctct gagctccaca ctgaccctgt ccaaggctga ctacgagaag 2100
cacaaggtgt acgcctgcga ggtgacacac cagggactgc ggtctcccgt gaccaagagc 2160
tttaaccgcg gcgagtgt 2178
<210> 98
<211> 726
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 98
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Lys Leu Leu Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Gly Ser Leu Lys Leu Ser Cys Ala Ala Ser Gly Phe Asp Phe
35 40 45
Ser Arg Tyr Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Glu Ile Asn Pro Asp Ser Ser Thr Ile Asn Tyr Thr
65 70 75 80
Pro Ser Leu Lys Asp Lys Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Ser Lys Val Arg Ser Glu Asp Thr Ala Leu
100 105 110
Tyr Tyr Cys Ala Arg Ile Tyr Tyr Gly Ser Pro Gly Ala Met Asp Tyr
115 120 125
Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Lys Thr Thr Pro
130 135 140
Pro Ser Val Tyr Pro Leu Ala Pro Gly Ser Ala Ala Gln Thr Asn Ser
145 150 155 160
Met Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu Pro Val
165 170 175
Thr Val Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu Ser Ser Ser Val Thr
195 200 205
Val Pro Ser Ser Pro Arg Pro Ser Glu Thr Val Thr Cys Asn Val Ala
210 215 220
His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile Val Pro Arg Asp
225 230 235 240
Cys Gly Cys Lys Pro Cys Ile Cys Thr Val Pro Glu Val Ser Ser Val
245 250 255
Phe Ile Phe Pro Pro Lys Pro Lys Asp Val Leu Thr Ile Thr Leu Thr
260 265 270
Pro Lys Val Thr Cys Val Val Val Asp Ile Ser Lys Asp Asp Pro Glu
275 280 285
Val Gln Phe Ser Trp Phe Val Asp Asp Val Glu Val His Thr Ala Gln
290 295 300
Thr Gln Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Ser Val Ser
305 310 315 320
Glu Leu Pro Ile Met His Gln Asp Trp Leu Asn Gly Lys Glu Phe Lys
325 330 335
Cys Arg Val Asn Ser Ala Ala Phe Pro Ala Pro Ile Glu Lys Thr Ile
340 345 350
Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
355 360 365
Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
370 375 380
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
385 390 395 400
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
405 410 415
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
420 425 430
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
435 440 445
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
450 455 460
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
465 470 475 480
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
485 490 495
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
500 505 510
Ser Ile Val Met Thr Gln Thr Pro Lys Phe Leu Leu Val Ser Ala Gly
515 520 525
Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Ser Val Ser Asn Asp
530 535 540
Val Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ser Pro Lys Leu Leu Ile
545 550 555 560
Tyr Tyr Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe Thr Gly
565 570 575
Ser Gly Tyr Gly Thr Asp Phe Thr Phe Thr Ile Ser Thr Val Gln Ala
580 585 590
Glu Asp Leu Ala Val Tyr Phe Cys Gln Gln Asp Tyr Phe Ser Pro Tyr
595 600 605
Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala
610 615 620
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
625 630 635 640
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
645 650 655
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
660 665 670
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
675 680 685
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
690 695 700
Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val Thr Lys Ser
705 710 715 720
Phe Asn Arg Gly Glu Cys
725
<210> 99
<211> 360
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 99
gaggtcaaac tgctggagag tgggggaggg ctggtgcagc ctggcggctc cctgaagctg 60
tcttgcgcag caagcggctt cgacttttct cggtactgga tgagctgggt gagacaggca 120
ccaggcaagg gcctggagtg gatcggcgag atcaaccccg atagctccac catcaattac 180
acaccttctc tgaaggacaa gttcatcatc agcagggata acgccaagaa taccctgtat 240
ctgcagatgt ccaaggtgag gtctgaggac acagccctgt actattgcgc ccgcatctac 300
tatggcagcc caggcgccat ggattactgg ggccagggca cctccgtgac agtgtctagc 360
<210> 100
<211> 120
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 100
Glu Val Lys Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Lys Leu Ser Cys Ala Ala Ser Gly Phe Asp Phe Ser Arg Tyr
20 25 30
Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Ile
35 40 45
Gly Glu Ile Asn Pro Asp Ser Ser Thr Ile Asn Tyr Thr Pro Ser Leu
50 55 60
Lys Asp Lys Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Ser Lys Val Arg Ser Glu Asp Thr Ala Leu Tyr Tyr Cys
85 90 95
Ala Arg Ile Tyr Tyr Gly Ser Pro Gly Ala Met Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Ser Val Thr Val Ser Ser
115 120
<210> 101
<211> 324
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 101
tccatcgtga tgacccagac acccaagttt ctgctggtga gcgccggcga cagagtgacc 60
atcacctgta aggccagcca gtccgtgtct aacgatgtgg cctggtatca gcagaagcct 120
ggccagagcc caaagctgct gatctactat gcctccaata ggtacaccgg agtgcctgac 180
cgcttcaccg gctccggcta tggcacagat ttcaccttta caatctctac agtgcaggcc 240
gaggacctgg ccgtgtactt ttgccagcag gattacttct ccccctatac cttcggcggc 300
ggcacaaagc tggagatcaa gagg 324
<210> 102
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 102
Ser Ile Val Met Thr Gln Thr Pro Lys Phe Leu Leu Val Ser Ala Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Ser Val Ser Asn Asp
20 25 30
Val Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ser Pro Lys Leu Leu Ile
35 40 45
Tyr Tyr Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe Thr Gly
50 55 60
Ser Gly Tyr Gly Thr Asp Phe Thr Phe Thr Ile Ser Thr Val Gln Ala
65 70 75 80
Glu Asp Leu Ala Val Tyr Phe Cys Gln Gln Asp Tyr Phe Ser Pro Tyr
85 90 95
Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg
100 105
<210> 103
<211> 2202
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 103
atggactgga cttggagaat cctgttcctg gtcgctgctg ctaccggcac ccacgctgag 60
gtcaaactgc tggagagtgg gggagggctg gtgcagcctg gcggctccct gaagctgtct 120
tgcgcagcaa gcggcttcga cttttctcgg tactggatga gctgggtgag acaggcacca 180
ggcaagggcc tggagtggat cggcgagatc aaccccgata gctccaccat caattacaca 240
ccttctctga aggacaagtt catcatcagc agggataacg ccaagaatac cctgtatctg 300
cagatgtcca aggtgaggtc tgaggacaca gccctgtact attgcgcccg catctactat 360
ggcagcccag gcgccatgga ttactggggc cagggcacct ccgtgacagt gtctagcgcc 420
tccaccaagg gaccaagcgt gttcccactg gcaccttcct ctaagagcac ctccggcggc 480
acagccgccc tgggctgtct ggtgaaggac tatttccctg agccagtgac cgtgagctgg 540
aactccggcg ccctgaccag cggagtgcac acatttcctg ccgtgctgca gagctccggc 600
ctgtactccc tgtctagcgt ggtgaccgtg ccatcctcta gcctgggcac ccagacatat 660
atctgcaacg tgaatcacaa gccttctaat acaaaggtgg acaagaaggt ggagccaaag 720
agctgtgata agacccacac atgccctccc tgtccagcac ctgagctgct gggcggccca 780
agcgtgttcc tgtttccacc caagcccaag gacaccctga tgatctccag aaccccagag 840
gtgacatgcg tggtggtgga cgtgtctcac gaggaccccg aggtgaagtt caactggtac 900
gtggatggcg tggaggtgca caatgccaag accaagccac gggaggagca gtacaactct 960
acctatagag tggtgagcgt gctgacagtg ctgcaccagg attggctgaa cggcaaggag 1020
tataagtgca aggtgagcaa taaggccctg ccagccccca tcgagaagac catctccaag 1080
gcaaagggac agccacggga gccacaggtg tacacactgc ctccatctag agacgagctg 1140
accaagaacc aggtgagcct gacatgtctg gtgaagggct tttatccctc cgatatcgcc 1200
gtggagtggg agtctaatgg ccagcctgag aacaattaca agaccacacc ccctgtgctg 1260
gactctgatg gcagcttctt tctgtattcc aagctgaccg tggacaagtc tcggtggcag 1320
cagggcaacg tgttctcttg cagcgtgatg cacgaggccc tgcacaatca ctacacccag 1380
aagtccctgt ctctgagccc tggcaagagg ggaaggaagc ggagatccgg ctctggagcc 1440
acaaacttta gcctgctgaa gcaggccggc gatgtggagg agaatcctgg cccaatggtg 1500
ctgcagaccc aggtgttcat ctccctgctg ctgtggatca gcggcgccta cggctccatc 1560
gtgatgaccc agacacccaa gtttctgctg gtgagcgccg gcgacagagt gaccatcacc 1620
tgtaaggcca gccagtccgt gtctaacgat gtggcctggt atcagcagaa gcctggccag 1680
agcccaaagc tgctgatcta ctatgcctcc aataggtaca ccggagtgcc tgaccgcttc 1740
accggctccg gctatggcac agatttcacc tttacaatct ctacagtgca ggccgaggac 1800
ctggccgtgt acttttgcca gcaggattac ttctccccct ataccttcgg cggcggcaca 1860
aagctggaga tcaagaggac cgtggccgcc cctagcgtgt tcatctttcc accctccgac 1920
gagcagctga agagcggcac agcctccgtg gtgtgcctgc tgaacaattt ctacccccgc 1980
gaggccaagg tgcagtggaa ggtggataac gccctgcagt ccggcaattc tcaggagagc 2040
gtgaccgagc aggactccaa ggattctaca tatagcctgt cctctaccct gacactgagc 2100
aaggccgact acgagaagca caaggtgtat gcctgcgagg tcactcacca ggggctgcgc 2160
tcaccagtca caaaatcttt caatagaggg gaatgctgat aa 2202
<210> 104
<211> 732
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 104
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Lys Leu Leu Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Gly Ser Leu Lys Leu Ser Cys Ala Ala Ser Gly Phe Asp Phe
35 40 45
Ser Arg Tyr Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Glu Ile Asn Pro Asp Ser Ser Thr Ile Asn Tyr Thr
65 70 75 80
Pro Ser Leu Lys Asp Lys Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Ser Lys Val Arg Ser Glu Asp Thr Ala Leu
100 105 110
Tyr Tyr Cys Ala Arg Ile Tyr Tyr Gly Ser Pro Gly Ala Met Asp Tyr
115 120 125
Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ser Thr Lys Gly
130 135 140
Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly
145 150 155 160
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
165 170 175
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
195 200 205
Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val
210 215 220
Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys
225 230 235 240
Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
245 250 255
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
260 265 270
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
275 280 285
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
290 295 300
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
305 310 315 320
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
325 330 335
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
340 345 350
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
355 360 365
Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln
370 375 380
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
385 390 395 400
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
405 410 415
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu
420 425 430
Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser
435 440 445
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
450 455 460
Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala
465 470 475 480
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
485 490 495
Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp
500 505 510
Ile Ser Gly Ala Tyr Gly Ser Ile Val Met Thr Gln Thr Pro Lys Phe
515 520 525
Leu Leu Val Ser Ala Gly Asp Arg Val Thr Ile Thr Cys Lys Ala Ser
530 535 540
Gln Ser Val Ser Asn Asp Val Ala Trp Tyr Gln Gln Lys Pro Gly Gln
545 550 555 560
Ser Pro Lys Leu Leu Ile Tyr Tyr Ala Ser Asn Arg Tyr Thr Gly Val
565 570 575
Pro Asp Arg Phe Thr Gly Ser Gly Tyr Gly Thr Asp Phe Thr Phe Thr
580 585 590
Ile Ser Thr Val Gln Ala Glu Asp Leu Ala Val Tyr Phe Cys Gln Gln
595 600 605
Asp Tyr Phe Ser Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile
610 615 620
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
625 630 635 640
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
645 650 655
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
660 665 670
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
675 680 685
Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr
690 695 700
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg
705 710 715 720
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 105
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 105
gacacctata tgcac 15
<210> 106
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 106
aggattgatc ctgcgaatgg taatactaaa tatgacccga agttccaggc c 51
<210> 107
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 107
tactacgact acgtgggagc tatggactac 30
<210> 108
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 108
Asp Thr Tyr Met His
1 5
<210> 109
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 109
Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp Pro Lys Phe Gln
1 5 10 15
Ala
<210> 110
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 110
Tyr Tyr Asp Tyr Val Gly Ala Met Asp Tyr
1 5 10
<210> 111
<211> 414
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 111
atgaaatgca gctgggttat cttcttcctg atggcagtgg ttacaggggt caattcagag 60
gttcagctgc agcagtctgg ggcagagctt gtgaagccag gggcctcagt caagttgtcc 120
tgcacagctt ctggcttcaa cattaaagac acctatatgc actgggtgaa gcagaggcct 180
gaacagggcc tggagtggat tggaaggatt gatcctgcga atggtaatac taaatatgac 240
ccgaagttcc aggccaaggc cactataaca gcaaacacat cctccaacac agcctacctg 300
cacctcagca gcctgacatc tgaggacact gccgtctatt actgtgcccc atactacgac 360
tacgtgggag ctatggacta ctggggtcaa ggaacctcag tcaccgtctc ctca 414
<210> 112
<211> 138
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 112
Met Lys Cys Ser Trp Val Ile Phe Phe Leu Met Ala Val Val Thr Gly
1 5 10 15
Val Asn Ser Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys
20 25 30
Pro Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
35 40 45
Lys Asp Thr Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu
50 55 60
Glu Trp Ile Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp
65 70 75 80
Pro Lys Phe Gln Ala Lys Ala Thr Ile Thr Ala Asn Thr Ser Ser Asn
85 90 95
Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Pro Tyr Tyr Asp Tyr Val Gly Ala Met Asp Tyr Trp
115 120 125
Gly Gln Gly Thr Ser Val Thr Val Ser Ser
130 135
<210> 113
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 113
ctggcaagtc agaccattgg tacatggtta gca 33
<210> 114
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 114
gctgcaacca gcttggcaga t 21
<210> 115
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 115
caacaacttt acaatactcc tctgacg 27
<210> 116
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 116
Leu Ala Ser Gln Thr Ile Gly Thr Trp Leu Ala
1 5 10
<210> 117
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 117
Ala Ala Thr Ser Leu Ala Asp
1 5
<210> 118
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 118
Gln Gln Leu Tyr Asn Thr Pro Leu Thr
1 5
<210> 119
<211> 381
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 119
atgaacatgc tcactcagct cctgggatta ctgctgctct ggtttgcagg tggtaaatgt 60
gacattcaga tgacccagtc tcctgcctcc cagtctgcat ctctgggaga aagtgtcacc 120
atcacatgcc tggcaagtca gaccattggt acatggttag catggtatca gcagaaacca 180
gggaaatctc ctcagctcct gatttatgct gcaaccagct tggcagatgg ggtcccatca 240
aggttcagtg gtagtggatc tggcacaaaa ttttctttca agatcagcag cctacaggct 300
gaagattttg taagttatta ctgtcaacaa ctttacaata ctcctctgac gttcggtgga 360
ggcaccaagc tggaaatcaa a 381
<210> 120
<211> 127
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 120
Met Asn Met Leu Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Ala
1 5 10 15
Gly Gly Lys Cys Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Gln Ser
20 25 30
Ala Ser Leu Gly Glu Ser Val Thr Ile Thr Cys Leu Ala Ser Gln Thr
35 40 45
Ile Gly Thr Trp Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ser Pro
50 55 60
Gln Leu Leu Ile Tyr Ala Ala Thr Ser Leu Ala Asp Gly Val Pro Ser
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Lys Phe Ser Phe Lys Ile Ser
85 90 95
Ser Leu Gln Ala Glu Asp Phe Val Ser Tyr Tyr Cys Gln Gln Leu Tyr
100 105 110
Asn Thr Pro Leu Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
115 120 125
<210> 121
<211> 357
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 121
gaggtgcagc tgcagcagtc cggagctgag ctggtgaagc caggagccag cgtgaagctg 60
tcctgcacag cctctggctt caacatcaag gatacctaca tgcactgggt gaagcagagg 120
ccagagcagg gactggagtg gatcggaaga atcgaccccg ccaacggcaa caccaagtac 180
gatcctaagt tccaggctaa ggccaccatc acagctaaca caagctccaa caccgcctac 240
ctgcacctgt ctagcctgac aagcgaggac accgccgtgt actactgtgc cccttactac 300
gactacgtgg gcgctatgga ttactgggga cagggcacat ctgtgaccgt gtcctct 357
<210> 122
<211> 119
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 122
Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile Lys Asp Thr
20 25 30
Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu Glu Trp Ile
35 40 45
Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp Pro Lys Phe
50 55 60
Gln Ala Lys Ala Thr Ile Thr Ala Asn Thr Ser Ser Asn Thr Ala Tyr
65 70 75 80
Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Pro Tyr Tyr Asp Tyr Val Gly Ala Met Asp Tyr Trp Gly Gln Gly
100 105 110
Thr Ser Val Thr Val Ser Ser
115
<210> 123
<211> 330
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 123
aagtgcgata tccagatgac ccagtcccca gcttctcaga gcgcctccct gggagagtct 60
gtgaccatca catgtctggc tagccagaca atcggcacct ggctggcctg gtaccagcag 120
aagccaggaa agagccccca gctgctgatc tacgctgcca caagcctggc tgacggagtg 180
ccctcccggt tttctggaag cggctccgga accaagttct cctttaagat cagctccctg 240
caggccgagg atttcgtgtc ttactactgc cagcagctgt acaacacacc cctgaccttt 300
ggcggaggca ccaagctgga gatcaagcgc 330
<210> 124
<211> 110
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 124
Lys Cys Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Gln Ser Ala Ser
1 5 10 15
Leu Gly Glu Ser Val Thr Ile Thr Cys Leu Ala Ser Gln Thr Ile Gly
20 25 30
Thr Trp Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ser Pro Gln Leu
35 40 45
Leu Ile Tyr Ala Ala Thr Ser Leu Ala Asp Gly Val Pro Ser Arg Phe
50 55 60
Ser Gly Ser Gly Ser Gly Thr Lys Phe Ser Phe Lys Ile Ser Ser Leu
65 70 75 80
Gln Ala Glu Asp Phe Val Ser Tyr Tyr Cys Gln Gln Leu Tyr Asn Thr
85 90 95
Pro Leu Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg
100 105 110
<210> 125
<211> 2214
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 125
atggactgga cctggcgcat cctgttcctg gtggctgctg ctaccggaac acacgctgag 60
gtgcagctgc agcagtccgg agctgagctg gtgaagccag gagccagcgt gaagctgtcc 120
tgcacagcct ctggcttcaa catcaaggat acctacatgc actgggtgaa gcagaggcca 180
gagcagggac tggagtggat cggaagaatc gaccccgcca acggcaacac caagtacgat 240
cctaagttcc aggctaaggc caccatcaca gctaacacaa gctccaacac cgcctacctg 300
cacctgtcta gcctgacaag cgaggacacc gccgtgtact actgtgcccc ttactacgac 360
tacgtgggcg ctatggatta ctggggacag ggcacatctg tgaccgtgtc ctctgctaag 420
accacagctc caagcgtgta cccactggct cccgtgtgcg gaggaaccac aggcagctcc 480
gtgaccctgg gctgtctggt gaagggatac ttcccagagc ccgtgaccct gacatggaac 540
agcggctccc tgtctagcgg agtgcacaca tttcctgccc tgctgcagtc cggcctgtac 600
accctgtcct ctagcgtgac cgtgacatct aacacatggc caagccagac catcacatgc 660
aacgtggctc accccgcctc ctctacaaag gtggacaaga agatcgagcc tcgggtgcca 720
atcacccaga acccatgtcc ccctctgaag gagtgcccac cctgtgctgc ccctaacctg 780
ctgggcggac caagcgtgtt catctttcct ccaaagatca aggatgtgct gatgatctct 840
ctgagcccta tcgtgacctg cgtggtggtg gacgtgtccg aggacgatcc agatgtgcag 900
atctcttggt ttgtgaacaa cgtggaggtg cacacagctc agacccagac acacagggag 960
gactacaaca gcaccctgag agtggtgtcc gccctgccaa tccagcacca ggactggatg 1020
tccggcaagg agttcaagtg caaggtgaac aacaaggatc tgcctgcccc aatcgagcgg 1080
acaatctcta agccaaaggg acctgtgcgc gctccacagg tgtacgtgct gccacctcca 1140
gctgaggaga tgaccaagaa ggagttctct ctgacatgta tgatcaccgg ctttctgcct 1200
gctgagatcg ccgtggattg gacaagcaac ggaagaaccg agcagaacta caagaacacc 1260
gctacagtgc tggactccga tggctcttac ttcatgtact ccaagctgcg ggtgcagaag 1320
tctacctggg agcgcggcag cctgtttgcc tgttctgtgg tgcacgaggt gctgcacaac 1380
cacctgacca caaagacaat ctcccggtct ctgggcaaga ggggaaggaa gaggagaagc 1440
ggcagcggcg ctaccaactt ctccctgctg aagcaggctg gcgacgtgga ggagaaccca 1500
ggacctatgg tgctgcagac acaggtgttt atctctctgc tgctgtggat cagcggcgcc 1560
tacggaaagt gcgatatcca gatgacccag tccccagctt ctcagagcgc ctccctggga 1620
gagtctgtga ccatcacatg tctggctagc cagacaatcg gcacctggct ggcctggtac 1680
cagcagaagc caggaaagag cccccagctg ctgatctacg ctgccacaag cctggctgac 1740
ggagtgccct cccggttttc tggaagcggc tccggaacca agttctcctt taagatcagc 1800
tccctgcagg ccgaggattt cgtgtcttac tactgccagc agctgtacaa cacacccctg 1860
acctttggcg gaggcaccaa gctggagatc aagcgcgctg acgctgcccc tacagtgagc 1920
atcttccccc cttctagcga gcagctgacc agcggaggag cttccgtggt gtgcttcctg 1980
aacaactttt accccaagga catcaacgtg aagtggaaga tcgatggcag cgagaggcag 2040
aacggagtgc tgaactcctg gacagaccag gatagcaagg actccaccta ctctatgtcc 2100
tctaccctga cactgaccaa ggatgagtac gagaggcaca acagctacac atgcgaggcc 2160
acccacaaga catctaccag ccctatcgtg aagtccttca acagaaacga gtgt 2214
<210> 126
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 126
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys
20 25 30
Pro Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
35 40 45
Lys Asp Thr Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu
50 55 60
Glu Trp Ile Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp
65 70 75 80
Pro Lys Phe Gln Ala Lys Ala Thr Ile Thr Ala Asn Thr Ser Ser Asn
85 90 95
Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Pro Tyr Tyr Asp Tyr Val Gly Ala Met Asp Tyr Trp
115 120 125
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Lys Thr Thr Ala Pro
130 135 140
Ser Val Tyr Pro Leu Ala Pro Val Cys Gly Gly Thr Thr Gly Ser Ser
145 150 155 160
Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu Pro Val Thr
165 170 175
Leu Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly Val His Thr Phe Pro
180 185 190
Ala Leu Leu Gln Ser Gly Leu Tyr Thr Leu Ser Ser Ser Val Thr Val
195 200 205
Thr Ser Asn Thr Trp Pro Ser Gln Thr Ile Thr Cys Asn Val Ala His
210 215 220
Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile Glu Pro Arg Val Pro
225 230 235 240
Ile Thr Gln Asn Pro Cys Pro Pro Leu Lys Glu Cys Pro Pro Cys Ala
245 250 255
Ala Pro Asn Leu Leu Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys
260 265 270
Ile Lys Asp Val Leu Met Ile Ser Leu Ser Pro Ile Val Thr Cys Val
275 280 285
Val Val Asp Val Ser Glu Asp Asp Pro Asp Val Gln Ile Ser Trp Phe
290 295 300
Val Asn Asn Val Glu Val His Thr Ala Gln Thr Gln Thr His Arg Glu
305 310 315 320
Asp Tyr Asn Ser Thr Leu Arg Val Val Ser Ala Leu Pro Ile Gln His
325 330 335
Gln Asp Trp Met Ser Gly Lys Glu Phe Lys Cys Lys Val Asn Asn Lys
340 345 350
Asp Leu Pro Ala Pro Ile Glu Arg Thr Ile Ser Lys Pro Lys Gly Pro
355 360 365
Val Arg Ala Pro Gln Val Tyr Val Leu Pro Pro Pro Ala Glu Glu Met
370 375 380
Thr Lys Lys Glu Phe Ser Leu Thr Cys Met Ile Thr Gly Phe Leu Pro
385 390 395 400
Ala Glu Ile Ala Val Asp Trp Thr Ser Asn Gly Arg Thr Glu Gln Asn
405 410 415
Tyr Lys Asn Thr Ala Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Met
420 425 430
Tyr Ser Lys Leu Arg Val Gln Lys Ser Thr Trp Glu Arg Gly Ser Leu
435 440 445
Phe Ala Cys Ser Val Val His Glu Val Leu His Asn His Leu Thr Thr
450 455 460
Lys Thr Ile Ser Arg Ser Leu Gly Lys Arg Gly Arg Lys Arg Arg Ser
465 470 475 480
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
485 490 495
Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser
500 505 510
Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Lys Cys Asp Ile Gln Met
515 520 525
Thr Gln Ser Pro Ala Ser Gln Ser Ala Ser Leu Gly Glu Ser Val Thr
530 535 540
Ile Thr Cys Leu Ala Ser Gln Thr Ile Gly Thr Trp Leu Ala Trp Tyr
545 550 555 560
Gln Gln Lys Pro Gly Lys Ser Pro Gln Leu Leu Ile Tyr Ala Ala Thr
565 570 575
Ser Leu Ala Asp Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly
580 585 590
Thr Lys Phe Ser Phe Lys Ile Ser Ser Leu Gln Ala Glu Asp Phe Val
595 600 605
Ser Tyr Tyr Cys Gln Gln Leu Tyr Asn Thr Pro Leu Thr Phe Gly Gly
610 615 620
Gly Thr Lys Leu Glu Ile Lys Arg Ala Asp Ala Ala Pro Thr Val Ser
625 630 635 640
Ile Phe Pro Pro Ser Ser Glu Gln Leu Thr Ser Gly Gly Ala Ser Val
645 650 655
Val Cys Phe Leu Asn Asn Phe Tyr Pro Lys Asp Ile Asn Val Lys Trp
660 665 670
Lys Ile Asp Gly Ser Glu Arg Gln Asn Gly Val Leu Asn Ser Trp Thr
675 680 685
Asp Gln Asp Ser Lys Asp Ser Thr Tyr Ser Met Ser Ser Thr Leu Thr
690 695 700
Leu Thr Lys Asp Glu Tyr Glu Arg His Asn Ser Tyr Thr Cys Glu Ala
705 710 715 720
Thr His Lys Thr Ser Thr Ser Pro Ile Val Lys Ser Phe Asn Arg Asn
725 730 735
Glu Cys
<210> 127
<211> 357
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 127
gaagtgcagc tgcagcagtc tggagccgaa ctggtgaagc caggcgcctc cgtgaagctg 60
tcttgcacag ccagcggctt caacatcaag gacacctaca tgcactgggt gaagcagagg 120
cccgagcagg gcctggagtg gatcggaagg atcgacccag ccaacggcaa taccaagtac 180
gatcccaagt ttcaggccaa ggccaccatc acagccaaca caagctccaa taccgcctat 240
ctgcacctgt ctagcctgac aagcgaggat accgccgtgt actattgtgc cccttactat 300
gactacgtgg gcgccatgga ttattggggc cagggcacat ccgtgaccgt gtcctct 357
<210> 128
<211> 119
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 128
Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile Lys Asp Thr
20 25 30
Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu Glu Trp Ile
35 40 45
Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp Pro Lys Phe
50 55 60
Gln Ala Lys Ala Thr Ile Thr Ala Asn Thr Ser Ser Asn Thr Ala Tyr
65 70 75 80
Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Pro Tyr Tyr Asp Tyr Val Gly Ala Met Asp Tyr Trp Gly Gln Gly
100 105 110
Thr Ser Val Thr Val Ser Ser
115
<210> 129
<211> 330
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 129
aagtgcgata tccagatgac ccagagccca gcaagccagt ccgcctctct gggagagtct 60
gtgacaatca cctgtctggc cagccagaca atcggcacct ggctggcctg gtaccagcag 120
aagcctggca agtccccaca gctgctgatc tatgcagcca catctctggc agacggagtg 180
cctagccgct tcagcggctc cggctctgga accaagttct cctttaagat cagctccctg 240
caggccgagg atttcgtgtc ttactattgc cagcagctgt acaacacccc tctgaccttc 300
ggcggcggca caaagctgga gatcaagagg 330
<210> 130
<211> 110
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 130
Lys Cys Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Gln Ser Ala Ser
1 5 10 15
Leu Gly Glu Ser Val Thr Ile Thr Cys Leu Ala Ser Gln Thr Ile Gly
20 25 30
Thr Trp Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ser Pro Gln Leu
35 40 45
Leu Ile Tyr Ala Ala Thr Ser Leu Ala Asp Gly Val Pro Ser Arg Phe
50 55 60
Ser Gly Ser Gly Ser Gly Thr Lys Phe Ser Phe Lys Ile Ser Ser Leu
65 70 75 80
Gln Ala Glu Asp Phe Val Ser Tyr Tyr Cys Gln Gln Leu Tyr Asn Thr
85 90 95
Pro Leu Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg
100 105 110
<210> 131
<211> 2193
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 131
atggattgga cctggaggat tctgtttctg gtcgccgccg ctactggaac tcacgccgaa 60
gtgcagctgc agcagtctgg agccgaactg gtgaagccag gcgcctccgt gaagctgtct 120
tgcacagcca gcggcttcaa catcaaggac acctacatgc actgggtgaa gcagaggccc 180
gagcagggcc tggagtggat cggaaggatc gacccagcca acggcaatac caagtacgat 240
cccaagtttc aggccaaggc caccatcaca gccaacacaa gctccaatac cgcctatctg 300
cacctgtcta gcctgacaag cgaggatacc gccgtgtact attgtgcccc ttactatgac 360
tacgtgggcg ccatggatta ttggggccag ggcacatccg tgaccgtgtc ctctgccagc 420
accaagggac catccgtgtt cccactggca ccttgctccc ggtctacaag cgagtccacc 480
gccgccctgg gatgtctggt gaaggactac ttccccgagc ctgtgacagt gagctggaac 540
tccggcgccc tgacaagcgg agtgcacacc tttccagccg tgctgcagag ctccggcctg 600
tactccctgt ctagcgtggt gaccgtgcca tcctctaatt ttggcaccca gacatatacc 660
tgcaacgtgg accacaagcc cagcaataca aaggtggata agaccgtgga gaggaagtgc 720
tgcgtggagt gccctccctg tccagcccca cccgtggcag gcccttccgt gttcctgttt 780
cctccaaagc ctaaggacac actgatgatc agccgcacac cagaggtgac ctgcgtggtg 840
gtggacgtgt cccacgagga ccccgaggtg cagttcaact ggtacgtgga tggcgtggag 900
gtgcacaatg ccaagaccaa gcctcgggag gagcagttca atagcacctt ccgggtggtg 960
agcgtgctga ccgtggtgca ccaggattgg ctgaacggca aggagtataa gtgcaaggtg 1020
tctaataagg gcctgccagc ccccatcgag aagacaatca gcaagaccaa gggacagcca 1080
cgggagccac aggtgtacac cctgccccct tccagagagg agatgacaaa gaaccaggtg 1140
tctctgacct gtctggtgaa gggcttctat cccagcgaca tcgccgtgga gtgggagtcc 1200
aatggccagc ctgagaacaa ttacaagacc acaccaccca tgctggactc tgatggcagc 1260
ttctttctgt atagcaagct gaccgtggat aagtccaggt ggcagcaggg caacgtgttt 1320
tcttgcagcg tgatgcacga ggccctgcac aatcactaca cacagaagtc cctgtctctg 1380
agcccaggca agaggggaag gaagcggaga tccggctctg gagccaccaa cttcagcctg 1440
ctgaagcagg caggcgacgt ggaggagaat cctggaccaa tggtgctgca gacacaggtg 1500
tttatctccc tgctgctgtg gatctctggc gcctatggca agtgcgatat ccagatgacc 1560
cagagcccag caagccagtc cgcctctctg ggagagtctg tgacaatcac ctgtctggcc 1620
agccagacaa tcggcacctg gctggcctgg taccagcaga agcctggcaa gtccccacag 1680
ctgctgatct atgcagccac atctctggca gacggagtgc ctagccgctt cagcggctcc 1740
ggctctggaa ccaagttctc ctttaagatc agctccctgc aggccgagga tttcgtgtct 1800
tactattgcc agcagctgta caacacccct ctgaccttcg gcggcggcac aaagctggag 1860
atcaagagga ccgtggcagc accatccgtg ttcatctttc ctccatctga cgagcagctg 1920
aagtccggca ccgcctctgt ggtgtgcctg ctgaacaact tctaccctag agaggccaag 1980
gtgcagtgga aggtggataa cgccctgcag tccggcaatt ctcaggagag cgtgacagag 2040
caggactcca aggattctac ctatagcctg tctagcacac tgaccctgag caaggccgac 2100
tacgagaagc acaaggtgta tgcctgtgag gtcacccacc aggggctgag gtcaccagtc 2160
accaagtctt tcaacagggg agaatgttga taa 2193
<210> 132
<211> 729
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 132
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys
20 25 30
Pro Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
35 40 45
Lys Asp Thr Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu
50 55 60
Glu Trp Ile Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp
65 70 75 80
Pro Lys Phe Gln Ala Lys Ala Thr Ile Thr Ala Asn Thr Ser Ser Asn
85 90 95
Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Pro Tyr Tyr Asp Tyr Val Gly Ala Met Asp Tyr Trp
115 120 125
Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
130 135 140
Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr
145 150 155 160
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
165 170 175
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
180 185 190
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
195 200 205
Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp
210 215 220
His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys
225 230 235 240
Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser
245 250 255
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
260 265 270
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
275 280 285
Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
290 295 300
Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val
305 310 315 320
Ser Val Leu Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
325 330 335
Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr
340 345 350
Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
355 360 365
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
370 375 380
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
385 390 395 400
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp
405 410 415
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
420 425 430
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
435 440 445
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
450 455 460
Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu
465 470 475 480
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu
485 490 495
Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr
500 505 510
Gly Lys Cys Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Gln Ser Ala
515 520 525
Ser Leu Gly Glu Ser Val Thr Ile Thr Cys Leu Ala Ser Gln Thr Ile
530 535 540
Gly Thr Trp Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ser Pro Gln
545 550 555 560
Leu Leu Ile Tyr Ala Ala Thr Ser Leu Ala Asp Gly Val Pro Ser Arg
565 570 575
Phe Ser Gly Ser Gly Ser Gly Thr Lys Phe Ser Phe Lys Ile Ser Ser
580 585 590
Leu Gln Ala Glu Asp Phe Val Ser Tyr Tyr Cys Gln Gln Leu Tyr Asn
595 600 605
Thr Pro Leu Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Thr
610 615 620
Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu
625 630 635 640
Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro
645 650 655
Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly
660 665 670
Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr
675 680 685
Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His
690 695 700
Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val
705 710 715 720
Thr Lys Ser Phe Asn Arg Gly Glu Cys
725
<210> 133
<211> 3783
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 133
agccagtgtg tgaacctgac caccagaaca cagctgcctc ctgcctacac caacagcttc 60
accagaggag tctactaccc agacaaagtc ttcagaagct ctgtgctgca cagcacccag 120
gacctgttcc tgcctttctt cagcaacgtg acctggttcc acgccatcca cgtgtctggc 180
accaacggca ccaagagatt tgacaaccct gttcttcctt tcaatgatgg cgtgtacttt 240
gccagcacag agaagagcaa catcatccga ggctggatct ttggcaccac cctggacagc 300
aaaacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa ggtgtgtgag 360
ttccagttct gcaatgaccc tttcctgggc gtgtactacc acaagaacaa caagtcctgg 420
atggagtctg agttcagagt ctacagctct gccaacaact gcacatttga atatgtgtcc 480
cagcctttcc tgatggacct ggagggcaag cagggcaact ttaagaacct gagagaattt 540
gtgttcaaga acatcgatgg ctacttcaag atctacagca agcacacacc catcaacctg 600
gtgagagacc tgcctcaggg cttctctgcc ctggagcctc tggtggacct gcccatcggc 660
atcaacatca ccagattcca gaccctgctg gccctgcaca gaagctacct gaccccagga 720
gacagcagca gcggctggac agctggagct gctgcctact acgtgggcta cctgcagccc 780
aggaccttcc tgctgaagta caacgaaaat ggcaccatca cagatgctgt tgactgtgcc 840
ctggaccctc ttagcgagac caagtgcacc ctgaagtcct tcacagtgga gaaaggcatc 900
taccagacca gcaacttccg agtgcagcca acagagagca tcgtgagatt tccaaacatc 960
accaacctgt gcccttttgg agaagtcttc aatgccacca gatttgcttc tgtgtacgcc 1020
tggaacagaa aaagaatcag caactgtgtg gctgactact ctgtgctgta caactctgcc 1080
tccttctcca ccttcaagtg ctatggagtc tctccaacca agctgaatga cctgtgcttc 1140
accaacgtgt atgctgacag ctttgtgatc agaggagatg aagtgcggca gattgctcct 1200
ggccagacag gcaagattgc tgactacaac tacaagctgc ctgatgactt cacaggctgt 1260
gtcatcgcct ggaacagcaa caacctggac agcaaggtgg gcggcaacta caactacctg 1320
tacagacttt tcaggaagag caacctgaag ccttttgaaa gagacatctc cacagagatc 1380
taccaggctg gcagcacacc ctgcaatggt gtggaaggct tcaactgcta cttccctctg 1440
cagagctacg gcttccagcc aacaaatggc gtgggctacc agccttacag agtggtggtg 1500
ctgtcctttg agctgctgca cgcccctgcc acagtgtgtg gccccaagaa gagcaccaac 1560
ctggtgaaga acaaatgtgt gaacttcaat ttcaatggcc tgacaggcac aggagtgctg 1620
acagagagca acaagaagtt tcttcctttc cagcagtttg gaagagacat tgctgacacc 1680
acagatgctg tgagagatcc tcagaccctg gagatcctgg atatcacacc ctgctccttt 1740
ggaggagttt ctgtcatcac acctggcacc aataccagca accaagtggc tgtgctgtac 1800
caagatgtga attgcacaga agtgcctgtg gccatccacg ctgaccagct gacacccacc 1860
tggagagtgt acagcacagg cagcaatgtt ttccagacaa gagctggctg cctgattgga 1920
gcagagcacg tgaacaacag ctatgaatgt gacatcccta ttggagctgg catctgtgcc 1980
agctaccaga cccaaaccaa cagcccaaga agagccagat ctgtggccag ccagagcatc 2040
atcgcctaca ccatgagcct gggagctgag aactctgtgg cctacagcaa caacagcatc 2100
gccatcccca ccaacttcac catctctgtg accacagaga tcctgcctgt gtccatgacc 2160
aagacatctg tggactgcac catgtacatc tgtggagaca gcacagaatg cagcaacctg 2220
ctgctgcagt acggctcctt ctgcacccag ctgaacagag ccctgacagg catcgctgtg 2280
gagcaggaca agaacacaca ggaagtgttt gcccaggtga agcagatcta caaaacacca 2340
cccatcaagg actttggagg cttcaatttc tcccaaatcc tgcctgaccc cagcaagcct 2400
tccaagagaa gcttcattga agacctgctg ttcaacaaag tgaccctggc tgatgctggc 2460
ttcatcaagc agtatggaga ctgcctggga gacattgctg ccagagacct gatctgtgcc 2520
cagaagttta atggcctgac tgtgctgcct cctctgctga cagatgaaat gatcgcccag 2580
tacacatctg ccctgctggc tggcaccatc accagtggct ggacatttgg agctggagct 2640
gccctgcaga tcccttttgc catgcagatg gcctacagat ttaatggcat cggcgtgacc 2700
cagaacgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaactc tgccatcggc 2760
aagatccagg acagcctgag cagcacagcc tctgccctgg gcaagctgca ggatgtggtg 2820
aaccaaaacg cccaggccct gaacaccctg gtgaagcagc tgagcagcaa ctttggagcc 2880
atctcctctg tgctgaatga catcctgagc cggctggaca aggtggaagc agaagtgcag 2940
atcgacagac tcatcacagg ccgcctgcag agcctgcaga cctacgtgac ccagcagctg 3000
atcagagctg ctgagatccg ggcctctgcc aacctggctg ccaccaagat gtcagaatgt 3060
gtgctgggcc agagcaaaag agtggacttc tgtggcaaag gctaccacct gatgtccttc 3120
cctcagtctg ctcctcacgg cgtggtgttc ctgcacgtga cctacgtgcc tgcccaggag 3180
aagaacttca ccacagctcc tgccatctgc cacgatggca aggcccactt cccaagagaa 3240
ggtgtctttg tgtccaatgg cacccactgg ttcgtgaccc agagaaactt ctacgagcct 3300
cagatcatca ccacagacaa cacatttgtg tctggcaact gtgatgtggt catcggcatc 3360
gtgaacaaca cagtttatga ccctctgcag cctgagctgg acagcttcaa agaagagctg 3420
gacaagtact tcaagaacca cacatctcca gatgtggacc tgggagacat ctctggcatc 3480
aatgcctctg tggtgaacat ccagaaggaa attgacaggc tgaacgaagt ggccaagaac 3540
ctgaacgaaa gcctcatcga cctgcaggag ctgggcaagt acgagcagta catcaagtgg 3600
ccttggtaca tctggctggg cttcatcgct ggcctcatcg ccatcgtgat ggtgaccatc 3660
atgctgtgct gcatgaccag ctgctgctct tgcctgaagg gctgctgcag ctgtggcagc 3720
tgctgcaagt ttgatgaaga tgactctgag cctgtgctga agggcgtgaa gctgcactac 3780
aca 3783
<210> 134
<211> 1261
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 134
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
1 5 10 15
Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg
20 25 30
Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser
35 40 45
Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr
50 55 60
Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe
65 70 75 80
Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr
85 90 95
Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr
100 105 110
Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe
115 120 125
Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu
130 135 140
Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser
145 150 155 160
Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn
165 170 175
Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr
180 185 190
Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe
195 200 205
Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr
210 215 220
Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly
225 230 235 240
Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly
245 250 255
Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr
260 265 270
Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys
275 280 285
Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser
290 295 300
Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile
305 310 315 320
Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala
325 330 335
Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp
340 345 350
Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr
355 360 365
Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr
370 375 380
Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro
385 390 395 400
Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp
405 410 415
Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys
420 425 430
Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn
435 440 445
Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly
450 455 460
Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu
465 470 475 480
Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr
485 490 495
Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val
500 505 510
Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn
515 520 525
Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn
530 535 540
Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr
545 550 555 560
Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr
565 570 575
Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr
580 585 590
Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val
595 600 605
Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr
610 615 620
Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly
625 630 635 640
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala
645 650 655
Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala
660 665 670
Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
675 680 685
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
690 695 700
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
705 710 715 720
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
725 730 735
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
740 745 750
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
755 760 765
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
770 775 780
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
785 790 795 800
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
805 810 815
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
820 825 830
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
835 840 845
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
850 855 860
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
865 870 875 880
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
885 890 895
Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
900 905 910
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser
915 920 925
Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
930 935 940
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala
945 950 955 960
Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu
965 970 975
Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu
980 985 990
Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala
995 1000 1005
Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly
1010 1015 1020
Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met
1025 1030 1035
Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val
1040 1045 1050
Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala
1055 1060 1065
Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1070 1075 1080
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr
1085 1090 1095
Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn
1100 1105 1110
Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro
1115 1120 1125
Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1130 1135 1140
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser
1145 1150 1155
Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg
1160 1165 1170
Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1175 1180 1185
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
1190 1195 1200
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val
1205 1210 1215
Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
1220 1225 1230
Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
1235 1240 1245
Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1250 1255 1260
<210> 135
<211> 3843
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 135
atggattgga cttggattct ctttctcgtt gctgcagcca cacgcgttca tagcagccag 60
tgtgtgaacc tgaccaccag aacacagctg cctcctgcct acaccaacag cttcaccaga 120
ggagtctact acccagacaa agtcttcaga agctctgtgc tgcacagcac ccaggacctg 180
ttcctgcctt tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc tggcaccaac 240
ggcaccaaga gatttgacaa ccctgttctt cctttcaatg atggcgtgta ctttgccagc 300
acagagaaga gcaacatcat ccgaggctgg atctttggca ccaccctgga cagcaaaacc 360
cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaggtgtg tgagttccag 420
ttctgcaatg accctttcct gggcgtgtac taccacaaga acaacaagtc ctggatggag 480
tctgagttca gagtctacag ctctgccaac aactgcacat ttgaatatgt gtcccagcct 540
ttcctgatgg acctggaggg caagcagggc aactttaaga acctgagaga atttgtgttc 600
aagaacatcg atggctactt caagatctac agcaagcaca cacccatcaa cctggtgaga 660
gacctgcctc agggcttctc tgccctggag cctctggtgg acctgcccat cggcatcaac 720
atcaccagat tccagaccct gctggccctg cacagaagct acctgacccc aggagacagc 780
agcagcggct ggacagctgg agctgctgcc tactacgtgg gctacctgca gcccaggacc 840
ttcctgctga agtacaacga aaatggcacc atcacagatg ctgttgactg tgccctggac 900
cctcttagcg agaccaagtg caccctgaag tccttcacag tggagaaagg catctaccag 960
accagcaact tccgagtgca gccaacagag agcatcgtga gatttccaaa catcaccaac 1020
ctgtgccctt ttggagaagt cttcaatgcc accagatttg cttctgtgta cgcctggaac 1080
agaaaaagaa tcagcaactg tgtggctgac tactctgtgc tgtacaactc tgcctccttc 1140
tccaccttca agtgctatgg agtctctcca accaagctga atgacctgtg cttcaccaac 1200
gtgtatgctg acagctttgt gatcagagga gatgaagtgc ggcagattgc tcctggccag 1260
acaggcaaga ttgctgacta caactacaag ctgcctgatg acttcacagg ctgtgtcatc 1320
gcctggaaca gcaacaacct ggacagcaag gtgggcggca actacaacta cctgtacaga 1380
cttttcagga agagcaacct gaagcctttt gaaagagaca tctccacaga gatctaccag 1440
gctggcagca caccctgcaa tggtgtggaa ggcttcaact gctacttccc tctgcagagc 1500
tacggcttcc agccaacaaa tggcgtgggc taccagcctt acagagtggt ggtgctgtcc 1560
tttgagctgc tgcacgcccc tgccacagtg tgtggcccca agaagagcac caacctggtg 1620
aagaacaaat gtgtgaactt caatttcaat ggcctgacag gcacaggagt gctgacagag 1680
agcaacaaga agtttcttcc tttccagcag tttggaagag acattgctga caccacagat 1740
gctgtgagag atcctcagac cctggagatc ctggatatca caccctgctc ctttggagga 1800
gtttctgtca tcacacctgg caccaatacc agcaaccaag tggctgtgct gtaccaagat 1860
gtgaattgca cagaagtgcc tgtggccatc cacgctgacc agctgacacc cacctggaga 1920
gtgtacagca caggcagcaa tgttttccag acaagagctg gctgcctgat tggagcagag 1980
cacgtgaaca acagctatga atgtgacatc cctattggag ctggcatctg tgccagctac 2040
cagacccaaa ccaacagccc aagaagagcc agatctgtgg ccagccagag catcatcgcc 2100
tacaccatga gcctgggagc tgagaactct gtggcctaca gcaacaacag catcgccatc 2160
cccaccaact tcaccatctc tgtgaccaca gagatcctgc ctgtgtccat gaccaagaca 2220
tctgtggact gcaccatgta catctgtgga gacagcacag aatgcagcaa cctgctgctg 2280
cagtacggct ccttctgcac ccagctgaac agagccctga caggcatcgc tgtggagcag 2340
gacaagaaca cacaggaagt gtttgcccag gtgaagcaga tctacaaaac accacccatc 2400
aaggactttg gaggcttcaa tttctcccaa atcctgcctg accccagcaa gccttccaag 2460
agaagcttca ttgaagacct gctgttcaac aaagtgaccc tggctgatgc tggcttcatc 2520
aagcagtatg gagactgcct gggagacatt gctgccagag acctgatctg tgcccagaag 2580
tttaatggcc tgactgtgct gcctcctctg ctgacagatg aaatgatcgc ccagtacaca 2640
tctgccctgc tggctggcac catcaccagt ggctggacat ttggagctgg agctgccctg 2700
cagatccctt ttgccatgca gatggcctac agatttaatg gcatcggcgt gacccagaac 2760
gtgctgtacg agaaccagaa gctgatcgcc aaccagttca actctgccat cggcaagatc 2820
caggacagcc tgagcagcac agcctctgcc ctgggcaagc tgcaggatgt ggtgaaccaa 2880
aacgcccagg ccctgaacac cctggtgaag cagctgagca gcaactttgg agccatctcc 2940
tctgtgctga atgacatcct gagccggctg gacaaggtgg aagcagaagt gcagatcgac 3000
agactcatca caggccgcct gcagagcctg cagacctacg tgacccagca gctgatcaga 3060
gctgctgaga tccgggcctc tgccaacctg gctgccacca agatgtcaga atgtgtgctg 3120
ggccagagca aaagagtgga cttctgtggc aaaggctacc acctgatgtc cttccctcag 3180
tctgctcctc acggcgtggt gttcctgcac gtgacctacg tgcctgccca ggagaagaac 3240
ttcaccacag ctcctgccat ctgccacgat ggcaaggccc acttcccaag agaaggtgtc 3300
tttgtgtcca atggcaccca ctggttcgtg acccagagaa acttctacga gcctcagatc 3360
atcaccacag acaacacatt tgtgtctggc aactgtgatg tggtcatcgg catcgtgaac 3420
aacacagttt atgaccctct gcagcctgag ctggacagct tcaaagaaga gctggacaag 3480
tacttcaaga accacacatc tccagatgtg gacctgggag acatctctgg catcaatgcc 3540
tctgtggtga acatccagaa ggaaattgac aggctgaacg aagtggccaa gaacctgaac 3600
gaaagcctca tcgacctgca ggagctgggc aagtacgagc agtacatcaa gtggccttgg 3660
tacatctggc tgggcttcat cgctggcctc atcgccatcg tgatggtgac catcatgctg 3720
tgctgcatga ccagctgctg ctcttgcctg aagggctgct gcagctgtgg cagctgctgc 3780
aagtttgatg aagatgactc tgagcctgtg ctgaagggcg tgaagctgca ctacacataa 3840
tga 3843
<210> 136
<211> 1279
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 136
Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val
1 5 10 15
His Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro
20 25 30
Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val
35 40 45
Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe
50 55 60
Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn
65 70 75 80
Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val
85 90 95
Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe
100 105 110
Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn
115 120 125
Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp
130 135 140
Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu
145 150 155 160
Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr
165 170 175
Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe
180 185 190
Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys
195 200 205
Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln
210 215 220
Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn
225 230 235 240
Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr
245 250 255
Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr
260 265 270
Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn
275 280 285
Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu
290 295 300
Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln
305 310 315 320
Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro
325 330 335
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
340 345 350
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
355 360 365
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
370 375 380
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
385 390 395 400
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
405 410 415
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
420 425 430
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
435 440 445
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
450 455 460
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
465 470 475 480
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
485 490 495
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
500 505 510
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala
515 520 525
Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys
530 535 540
Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu
545 550 555 560
Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala
565 570 575
Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp
580 585 590
Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr
595 600 605
Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr
610 615 620
Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg
625 630 635 640
Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu
645 650 655
Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile
660 665 670
Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg
675 680 685
Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser
690 695 700
Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile
705 710 715 720
Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser
725 730 735
Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser
740 745 750
Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln
755 760 765
Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr
770 775 780
Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile
785 790 795 800
Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser
805 810 815
Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val
820 825 830
Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly
835 840 845
Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
850 855 860
Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr
865 870 875 880
Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala
885 890 895
Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
900 905 910
Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu
915 920 925
Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu
930 935 940
Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
945 950 955 960
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe
965 970 975
Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys
980 985 990
Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln
995 1000 1005
Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu
1010 1015 1020
Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys
1025 1030 1035
Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr
1040 1045 1050
His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe
1055 1060 1065
Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr
1070 1075 1080
Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu
1085 1090 1095
Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1100 1105 1110
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val
1115 1120 1125
Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val
1130 1135 1140
Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1145 1150 1155
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
1160 1165 1170
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
1175 1180 1185
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu
1190 1195 1200
Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp
1205 1210 1215
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile
1220 1225 1230
Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser
1235 1240 1245
Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp
1250 1255 1260
Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr
1265 1270 1275
Thr
<210> 137
<211> 3783
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 137
agccagtgtg tgaacctgac caccagaaca cagctgcctc ctgcctacac caacagcttc 60
accagaggag tctactaccc agacaaggtg ttcagaagct ctgtgctgca cagcacccag 120
gacctcttcc tgcctttctt cagcaacgtg acctggttcc acgccatcca cgtgtctggc 180
accaacggca ccaagagatt tgacaaccct gtgctgcctt tcaatgatgg tgtgtacttt 240
gccagcacag agaagagcaa catcatccga ggctggatct ttggcaccac cctggacagc 300
aaaacacaga gcctgctgat cgtgaataat gccaccaacg tggtcatcaa ggtgtgtgag 360
ttccagttct gcaatgaccc tttcctgggc gtgtactacc acaagaacaa caagtcctgg 420
atggagtctg agttccgagt gtacagctct gccaacaact gcacatttga atatgtgtcc 480
cagcctttcc tgatggacct ggagggcaag cagggcaatt tcaagaacct gagagaattt 540
gtgttcaaga acatcgatgg ctacttcaag atctacagca agcacacacc catcaacctg 600
gtgagagatc ttcctcaggg cttctctgcc ctggagcctc tggtggacct gcccatcggc 660
atcaacatca cccgctttca gaccctgctg gccctgcaca gaagctacct gaccccagga 720
gacagcagca gcggctggac agctggagct gctgcctact acgtgggcta cctgcagcca 780
agaaccttcc tgctgaagta caacgaaaat ggcaccatca ctgtggctgt ggcctgtgcc 840
ctggaccctc tttctgagac caagtgcacc ctgaagtcct tcacagtgga gaaaggcatc 900
taccagacca gcaacttcag agttcagcca acagagagca tcgtgagatt tccaaacatc 960
accaacctgt gtccttttgg agaagtcttc aatgccacca gatttgcttc tgtgtacgcc 1020
tggaacagaa aaagaatcag caactgtgtg gctgactact ctgtgctgta caactctgcc 1080
tccttctcca ccttcaagtg ctacggtgtg tctcctacca agctgaatga cctgtgcttc 1140
accaacgtgt atgctgacag ctttgtcatc agaggagatg aagtgcggca gatcgcccct 1200
ggccagacag gcaagattgc tgactacaac tacaagctgc ctgatgactt cacaggctgt 1260
gtcatcgcct ggaacagcaa caacctggac agcaaggtgg gcggcaacta caactacctg 1320
tacagacttt tcaggaagag caacctgaag ccttttgaaa gagacatctc cacagagatc 1380
taccaggctg gcagcacacc ctgcaatgga gtggaaggct tcaactgcta cttccctctg 1440
cagagctacg gcttccagcc caccaatggc gtgggctacc agccttacag agtggtggtg 1500
ctgtcctttg agctgctgca cgcccctgcc acagtgtgtg gccccaagaa gagcaccaac 1560
ctggtgaaga acaaatgtgt gaacttcaat ttcaatggcc tgacaggcac aggagtgctg 1620
acagagagca acaagaagtt cctgcctttc cagcagtttg gaagagacat tgctgacacc 1680
acagatgctg tgagagatcc tcagaccctg gagatcctgg acatcacacc ctgctccttt 1740
ggaggagttt ctgtcatcac acctggagcc aacaccagca accaagtgac agtgctgtac 1800
caagatgtga actgcacaga agttcctgtg gccatccacg ctgaccagct gaccccaacc 1860
tggagagtct acagcacagg cagcaacgtg tttaaaacaa gagctggctg cctgattgga 1920
gcagagcacg tgaacaacag ctatgaatgt gacatcccta ttggagctgg catctgtgcc 1980
agctaccaga cccaaaccaa cagcccaaga agagccagga gcacagccag ccagagcatc 2040
atcgcctaca ccatgagcct gggagcagag aactctgtgg cctacagcaa caacagcatc 2100
gtcatcccca ccaacttcac catctctgtg accacagaga tcctgcctgt gtccatgacc 2160
aagacatctg tggactgcac catgtacatc tgcagtgaca gcacagaatg cagcaaccct 2220
ctgctgcagt acggctcctt ctgcacccag ctgaacagag ccctgacagg catcgctgtg 2280
gagcaggaca agaacacaca ggaagtgttt gcccaggtga agcagatcta caaaacacca 2340
cccatcaagg actttggagg cttcaacttc tcccagatcc tgcctgaccc cagcaagccc 2400
agcaagagaa gcttcattga agacctgctg ttcaacaaag tgaccctggc tgatgctggc 2460
ttcatcaaac aatatggaga ctgcctggga gacattgctg ccagagacct gatctgtgcc 2520
cagaagttta atggcctgac tgtgctgcct cctctgctga cagatgaaat gatcgcccag 2580
tacacatctg ccctgctggc tggcaccatc acatctggct ggacatttgg agctggagct 2640
gccctgcaga tcccttttgc catgcagatg gcctacagat ttaatggcat cagagtgacc 2700
cagaacgtgc tgtatgaaaa ccagaagctg atcgccaacc agttcaactc tgccatcggc 2760
aagatccagg acagcctgag cagcacagcc tctgccctgg gcaagctgca ggatgtggtg 2820
aaccaaaatg cccaggccct gaacaccctg gtgaagcagc tgagcagcac cttctccacc 2880
atctccagcg tgctgaatga catcctgagc cggctggaca aggtggaagc tgaggtgcag 2940
atcgacagac tcatcacagg ccggctgcag agcctgcaga cctacgtgac ccagcagctg 3000
atcagagctg ctgagatcag agcttctgcc aacctgaagg ccaccaagat gtcagaatgt 3060
gtgctgggcc agagcaagag agtggacttc tgtggcaaag gctaccacct gatgtccttc 3120
cctcagtctg ctcctcacgg cgtggtgttc ctgcacgtga cctacgtgcc tgcccaggag 3180
aagaacttca ccacagctcc tgccacctgc cacgatggca aagcccactt cccaagagaa 3240
ggcgtctttg tgtccaatgg cacccactgg ttcgtgaccc agagaaactt tgatgagcct 3300
cagatcatca ccacagacaa cacatttgtt tctggcaact gtgatgtggt catcggcatc 3360
gtgaacaaca cagtttatga ccctctgcag cctgagctgg acagcttcaa agaagagctg 3420
gacaagtact tcaagaacca cacatctcca gatgtggacc tgggagacat ctctggcatc 3480
aatgcctctg tggtgaacat ccagaaggaa attgacaggc tgaacgaagt ggccaagaac 3540
ctgaacgaaa gcctcatcga cctgcaggag ctgggcaagt acgagcagta catcaagtgg 3600
ccttggtaca tctggctggg cttcattgct ggcctcatcg ccatcgtgat ggtgaccatc 3660
atgctgtgct gcatgaccag ctgctgctct tgcctgaagg gctgctgcag ctgtggcagc 3720
tgctgcaagt ttgatgaaga tgactctgag cctgtgctga agggcgtgaa gctgcactac 3780
aca 3783
<210> 138
<211> 1261
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 138
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
1 5 10 15
Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg
20 25 30
Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser
35 40 45
Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr
50 55 60
Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe
65 70 75 80
Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr
85 90 95
Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr
100 105 110
Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe
115 120 125
Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu
130 135 140
Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser
145 150 155 160
Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn
165 170 175
Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr
180 185 190
Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe
195 200 205
Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr
210 215 220
Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly
225 230 235 240
Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly
245 250 255
Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr
260 265 270
Ile Thr Val Ala Val Ala Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys
275 280 285
Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser
290 295 300
Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile
305 310 315 320
Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala
325 330 335
Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp
340 345 350
Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr
355 360 365
Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr
370 375 380
Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro
385 390 395 400
Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp
405 410 415
Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys
420 425 430
Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn
435 440 445
Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly
450 455 460
Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu
465 470 475 480
Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr
485 490 495
Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val
500 505 510
Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn
515 520 525
Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn
530 535 540
Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr
545 550 555 560
Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr
565 570 575
Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Ala Asn Thr
580 585 590
Ser Asn Gln Val Thr Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val
595 600 605
Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr
610 615 620
Ser Thr Gly Ser Asn Val Phe Lys Thr Arg Ala Gly Cys Leu Ile Gly
625 630 635 640
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala
645 650 655
Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala
660 665 670
Arg Ser Thr Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
675 680 685
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Val Ile Pro Thr
690 695 700
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
705 710 715 720
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Ser Asp Ser Thr Glu
725 730 735
Cys Ser Asn Pro Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
740 745 750
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
755 760 765
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
770 775 780
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
785 790 795 800
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
805 810 815
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
820 825 830
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
835 840 845
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
850 855 860
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
865 870 875 880
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
885 890 895
Ile Arg Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
900 905 910
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser
915 920 925
Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
930 935 940
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Thr Phe Ser Thr
945 950 955 960
Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu
965 970 975
Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu
980 985 990
Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala
995 1000 1005
Ser Ala Asn Leu Lys Ala Thr Lys Met Ser Glu Cys Val Leu Gly
1010 1015 1020
Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met
1025 1030 1035
Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val
1040 1045 1050
Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala
1055 1060 1065
Thr Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1070 1075 1080
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Asp
1085 1090 1095
Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn
1100 1105 1110
Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro
1115 1120 1125
Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1130 1135 1140
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser
1145 1150 1155
Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg
1160 1165 1170
Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1175 1180 1185
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
1190 1195 1200
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val
1205 1210 1215
Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
1220 1225 1230
Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
1235 1240 1245
Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1250 1255 1260
<210> 139
<211> 3843
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的
<400> 139
atggattgga cctggattct ttttctcgtt gcagctgcta cacgcgttca tagcagccag 60
tgtgtgaacc tgaccaccag aacacagctg cctcctgcct acaccaacag cttcaccaga 120
ggagtctact acccagacaa ggtgttcaga agctctgtgc tgcacagcac ccaggacctc 180
ttcctgcctt tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc tggcaccaac 240
ggcaccaaga gatttgacaa ccctgtgctg cctttcaatg atggtgtgta ctttgccagc 300
acagagaaga gcaacatcat ccgaggctgg atctttggca ccaccctgga cagcaaaaca 360
cagagcctgc tgatcgtgaa taatgccacc aacgtggtca tcaaggtgtg tgagttccag 420
ttctgcaatg accctttcct gggcgtgtac taccacaaga acaacaagtc ctggatggag 480
tctgagttcc gagtgtacag ctctgccaac aactgcacat ttgaatatgt gtcccagcct 540
ttcctgatgg acctggaggg caagcagggc aatttcaaga acctgagaga atttgtgttc 600
aagaacatcg atggctactt caagatctac agcaagcaca cacccatcaa cctggtgaga 660
gatcttcctc agggcttctc tgccctggag cctctggtgg acctgcccat cggcatcaac 720
atcacccgct ttcagaccct gctggccctg cacagaagct acctgacccc aggagacagc 780
agcagcggct ggacagctgg agctgctgcc tactacgtgg gctacctgca gccaagaacc 840
ttcctgctga agtacaacga aaatggcacc atcactgtgg ctgtggcctg tgccctggac 900
cctctttctg agaccaagtg caccctgaag tccttcacag tggagaaagg catctaccag 960
accagcaact tcagagttca gccaacagag agcatcgtga gatttccaaa catcaccaac 1020
ctgtgtcctt ttggagaagt cttcaatgcc accagatttg cttctgtgta cgcctggaac 1080
agaaaaagaa tcagcaactg tgtggctgac tactctgtgc tgtacaactc tgcctccttc 1140
tccaccttca agtgctacgg tgtgtctcct accaagctga atgacctgtg cttcaccaac 1200
gtgtatgctg acagctttgt catcagagga gatgaagtgc ggcagatcgc ccctggccag 1260
acaggcaaga ttgctgacta caactacaag ctgcctgatg acttcacagg ctgtgtcatc 1320
gcctggaaca gcaacaacct ggacagcaag gtgggcggca actacaacta cctgtacaga 1380
cttttcagga agagcaacct gaagcctttt gaaagagaca tctccacaga gatctaccag 1440
gctggcagca caccctgcaa tggagtggaa ggcttcaact gctacttccc tctgcagagc 1500
tacggcttcc agcccaccaa tggcgtgggc taccagcctt acagagtggt ggtgctgtcc 1560
tttgagctgc tgcacgcccc tgccacagtg tgtggcccca agaagagcac caacctggtg 1620
aagaacaaat gtgtgaactt caatttcaat ggcctgacag gcacaggagt gctgacagag 1680
agcaacaaga agttcctgcc tttccagcag tttggaagag acattgctga caccacagat 1740
gctgtgagag atcctcagac cctggagatc ctggacatca caccctgctc ctttggagga 1800
gtttctgtca tcacacctgg agccaacacc agcaaccaag tgacagtgct gtaccaagat 1860
gtgaactgca cagaagttcc tgtggccatc cacgctgacc agctgacccc aacctggaga 1920
gtctacagca caggcagcaa cgtgtttaaa acaagagctg gctgcctgat tggagcagag 1980
cacgtgaaca acagctatga atgtgacatc cctattggag ctggcatctg tgccagctac 2040
cagacccaaa ccaacagccc aagaagagcc aggagcacag ccagccagag catcatcgcc 2100
tacaccatga gcctgggagc agagaactct gtggcctaca gcaacaacag catcgtcatc 2160
cccaccaact tcaccatctc tgtgaccaca gagatcctgc ctgtgtccat gaccaagaca 2220
tctgtggact gcaccatgta catctgcagt gacagcacag aatgcagcaa ccctctgctg 2280
cagtacggct ccttctgcac ccagctgaac agagccctga caggcatcgc tgtggagcag 2340
gacaagaaca cacaggaagt gtttgcccag gtgaagcaga tctacaaaac accacccatc 2400
aaggactttg gaggcttcaa cttctcccag atcctgcctg accccagcaa gcccagcaag 2460
agaagcttca ttgaagacct gctgttcaac aaagtgaccc tggctgatgc tggcttcatc 2520
aaacaatatg gagactgcct gggagacatt gctgccagag acctgatctg tgcccagaag 2580
tttaatggcc tgactgtgct gcctcctctg ctgacagatg aaatgatcgc ccagtacaca 2640
tctgccctgc tggctggcac catcacatct ggctggacat ttggagctgg agctgccctg 2700
cagatccctt ttgccatgca gatggcctac agatttaatg gcatcagagt gacccagaac 2760
gtgctgtatg aaaaccagaa gctgatcgcc aaccagttca actctgccat cggcaagatc 2820
caggacagcc tgagcagcac agcctctgcc ctgggcaagc tgcaggatgt ggtgaaccaa 2880
aatgcccagg ccctgaacac cctggtgaag cagctgagca gcaccttctc caccatctcc 2940
agcgtgctga atgacatcct gagccggctg gacaaggtgg aagctgaggt gcagatcgac 3000
agactcatca caggccggct gcagagcctg cagacctacg tgacccagca gctgatcaga 3060
gctgctgaga tcagagcttc tgccaacctg aaggccacca agatgtcaga atgtgtgctg 3120
ggccagagca agagagtgga cttctgtggc aaaggctacc acctgatgtc cttccctcag 3180
tctgctcctc acggcgtggt gttcctgcac gtgacctacg tgcctgccca ggagaagaac 3240
ttcaccacag ctcctgccac ctgccacgat ggcaaagccc acttcccaag agaaggcgtc 3300
tttgtgtcca atggcaccca ctggttcgtg acccagagaa actttgatga gcctcagatc 3360
atcaccacag acaacacatt tgtttctggc aactgtgatg tggtcatcgg catcgtgaac 3420
aacacagttt atgaccctct gcagcctgag ctggacagct tcaaagaaga gctggacaag 3480
tacttcaaga accacacatc tccagatgtg gacctgggag acatctctgg catcaatgcc 3540
tctgtggtga acatccagaa ggaaattgac aggctgaacg aagtggccaa gaacctgaac 3600
gaaagcctca tcgacctgca ggagctgggc aagtacgagc agtacatcaa gtggccttgg 3660
tacatctggc tgggcttcat tgctggcctc atcgccatcg tgatggtgac catcatgctg 3720
tgctgcatga ccagctgctg ctcttgcctg aagggctgct gcagctgtgg cagctgctgc 3780
aagtttgatg aagatgactc tgagcctgtg ctgaagggcg tgaagctgca ctacacataa 3840
tga 3843
<210> 140
<211> 1279
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 140
Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val
1 5 10 15
His Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro
20 25 30
Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val
35 40 45
Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe
50 55 60
Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn
65 70 75 80
Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val
85 90 95
Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe
100 105 110
Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn
115 120 125
Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp
130 135 140
Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu
145 150 155 160
Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr
165 170 175
Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe
180 185 190
Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys
195 200 205
Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln
210 215 220
Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn
225 230 235 240
Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr
245 250 255
Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr
260 265 270
Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn
275 280 285
Gly Thr Ile Thr Val Ala Val Ala Cys Ala Leu Asp Pro Leu Ser Glu
290 295 300
Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln
305 310 315 320
Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro
325 330 335
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
340 345 350
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
355 360 365
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
370 375 380
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
385 390 395 400
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
405 410 415
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
420 425 430
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
435 440 445
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
450 455 460
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
465 470 475 480
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
485 490 495
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
500 505 510
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala
515 520 525
Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys
530 535 540
Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu
545 550 555 560
Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala
565 570 575
Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp
580 585 590
Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Ala
595 600 605
Asn Thr Ser Asn Gln Val Thr Val Leu Tyr Gln Asp Val Asn Cys Thr
610 615 620
Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg
625 630 635 640
Val Tyr Ser Thr Gly Ser Asn Val Phe Lys Thr Arg Ala Gly Cys Leu
645 650 655
Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile
660 665 670
Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg
675 680 685
Arg Ala Arg Ser Thr Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser
690 695 700
Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Val Ile
705 710 715 720
Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser
725 730 735
Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Ser Asp Ser
740 745 750
Thr Glu Cys Ser Asn Pro Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln
755 760 765
Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr
770 775 780
Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile
785 790 795 800
Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser
805 810 815
Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val
820 825 830
Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly
835 840 845
Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
850 855 860
Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr
865 870 875 880
Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala
885 890 895
Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
900 905 910
Asn Gly Ile Arg Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu
915 920 925
Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu
930 935 940
Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
945 950 955 960
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Thr Phe
965 970 975
Ser Thr Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys
980 985 990
Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln
995 1000 1005
Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu
1010 1015 1020
Ile Arg Ala Ser Ala Asn Leu Lys Ala Thr Lys Met Ser Glu Cys
1025 1030 1035
Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr
1040 1045 1050
His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe
1055 1060 1065
Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr
1070 1075 1080
Ala Pro Ala Thr Cys His Asp Gly Lys Ala His Phe Pro Arg Glu
1085 1090 1095
Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1100 1105 1110
Asn Phe Asp Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val
1115 1120 1125
Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val
1130 1135 1140
Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1145 1150 1155
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
1160 1165 1170
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
1175 1180 1185
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu
1190 1195 1200
Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp
1205 1210 1215
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile
1220 1225 1230
Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser
1235 1240 1245
Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp
1250 1255 1260
Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr
1265 1270 1275
Thr
<210> 141
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 141
Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val
1 5 10 15
His Ser
<210> 142
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 142
Pro His Gly Val Val Phe Leu His Val
1 5
<210> 143
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 143
Val Val Phe Leu His Val Thr Tyr Val
1 5
<210> 144
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 144
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
1 5 10 15
<210> 145
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 145
Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr
1 5 10 15
<210> 146
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 146
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
1 5 10 15
<210> 147
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 147
Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val
1 5 10 15
<210> 148
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 148
Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe
1 5 10 15
<210> 149
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 149
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1 5 10 15
<210> 150
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 150
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
1 5 10 15
<210> 151
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 151
Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser
1 5 10 15
<210> 152
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成的
<400> 152
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu
1 5 10 15
Claims (37)
1.一种抗SARS-CoV-2抗体或其片段,其中所述抗体选自由以下各项组成的组:单克隆抗体、多克隆抗体、单链抗体、免疫偶联物、去岩藻糖化的抗体和双特异性抗体。
2.根据权利要求1所述的抗SARS-CoV-2抗体或其片段,其中所述免疫偶联物包含治疗剂或检测部分。
3.根据权利要求1所述的抗SARS-CoV-2抗体或其片段,其中所述抗体选自由以下各项组成的组:人源化抗体、嵌合抗体、完全人抗体、抗体模拟物。
4.根据权利要求1所述的抗SARS-CoV-2抗体或其片段,其中所述抗体包含选自由以下各项组成的组中的至少一种:
a)选自SEQ ID NO:26、SEQ ID NO:80和SEQ ID NO:108的重链CDR1序列;
b)选自SEQ ID NO:27、SEQ ID NO:81和SEQ ID NO:109的重链CDR2序列;
c)选自SEQ ID NO:28、SEQ ID NO:82和SEQ ID NO:110的重链CDR3序列;
d)选自SEQ ID NO:34、SEQ ID NO:88和SEQ ID NO:116的轻链CDR1序列;
e)选自SEQ ID NO:35、SEQ ID NO:89和SEQ ID NO:117的轻链CDR2序列;以及
f)选自SEQ ID NO:36、SEQ ID NO:90和SEQ ID NO:118的轻链CDR3序列。
5.根据权利要求1所述的抗SARS-CoV-2抗体或其片段,其中所述抗体包含选自由以下各项组成的组中的至少一种:
a)抗SARS-CoV-2抗体重链,其包含与选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的氨基酸序列具有至少80%同一性的序列;
b)抗SARS-CoV-2抗体轻链,其包含与选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的氨基酸序列具有至少80%同一性的序列;
c)抗SARS-CoV-2抗体重链的片段,其包含选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ IDNO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的全长序列的至少80%;以及
d)抗SARS-CoV-2抗体轻链的片段,其包含选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ IDNO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的全长序列的至少80%。
6.根据权利要求1所述的抗SARS-CoV-2抗体或其片段,其中所述抗体包含选自由以下各项组成的组中的至少一种:
a)与选自由以下各项组成的组的氨基酸序列具有至少80%同一性的氨基酸序列:SEQID NO:10、SEQ ID NO:16、SEQ ID NO:22、SEQ ID NO:40、SEQ ID NO:46、SEQ ID NO:48、SEQID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQID NO:74、SEQ ID NO:76、SEQ ID NO:98、SEQ ID NO:104、SEQ ID NO:126和SEQ ID NO:132;以及
b)包含选自由以下各项组成的组的全长序列的至少80%的抗
SARS-CoV-2抗体重链的片段:SEQ ID NO:10、SEQ ID NO:16、SEQ ID NO:22、SEQ IDNO:40、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:98、SEQ IDNO:104、SEQ ID NO:126和SEQ ID NO:132。
7.一种核酸分子,其编码权利要求1至6中任一项所述的抗SARS-CoV-2抗体或其片段。
8.根据权利要求7所述的核酸分子,还包括编码切割结构域的核苷酸序列。
9.根据权利要求7所述的核酸分子,其中所述核酸分子包括选自由以下各项组成的组中的至少一种:
a)选自SEQ ID NO:23、SEQ ID NO:77和SEQ ID NO:105的编码所述重链CDR1序列的核苷酸序列;
b)选自SEQ ID NO:24、SEQ ID NO:78和SEQ ID NO:106的编码所述重链CDR2序列的核苷酸序列;
c)选自SEQ ID NO:25、SEQ ID NO:79和SEQ ID NO:107的编码所述重链CDR3序列的核苷酸序列;
d)选自SEQ ID NO:31、SEQ ID NO:85和SEQ ID NO:113的编码所述轻链CDR1序列的核苷酸序列;
e)选自SEQ ID NO:32、SEQ ID NO:86和SEQ ID NO:114的编码所述轻链CDR2序列的核苷酸序列;以及
f)选自SEQ ID NO:33、SEQ ID NO:87和SEQ ID NO:115的编码所述轻链CDR3序列的核苷酸序列。
10.根据权利要求7所述的核酸分子,其中所述核酸分子包括选自由以下各项组成的组中的至少一个核苷酸序列:
a)与选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQ ID NO:127的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体重链;
b)与选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体轻链;
c)包含选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQ ID NO:127的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体重链;以及
d)包含选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体轻链。
11.根据权利要求7所述的核酸分子,其中所述核酸分子包括由以下各项组成的组中的核苷酸序列:
a)与选自SEQ ID NO:9、SEQ ID NO:15、SEQ ID NO:21、SEQ ID NO:39、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ IDNO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:97、SEQ ID NO:103、SEQID NO:125和SEQ ID NO:131的核苷酸具有至少80%同一性的核苷酸序列;以及
b)包含选自SEQ ID NO:9、SEQ ID NO:15、SEQ ID NO:21、SEQ ID NO:39、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ IDNO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ IDNO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:97、SEQ ID NO:103、SEQID NO:125和SEQ ID NO:131的全长序列的至少80%的核苷酸序列的片段。
12.根据权利要求7至11中任一项所述的核酸分子,其中所述核苷酸序列编码前导序列。
13.根据权利要求7至11中任一项所述的核酸分子,其中所述核酸分子包括表达载体。
14.一种组合物,包含至少一种权利要求1至6中任一项所述的抗SARS-CoV-2抗体或其片段。
15.一种组合物,包含至少一种权利要求7至11中任一项所述的核酸分子。
16.根据权利要求15所述的组合物,包含第一核酸分子和第二核酸分子,所述第一核酸分子包含编码抗SARS-CoV-2刺突抗原合成抗体的重链的核苷酸序列;所述第二核酸分子包含编码抗SARS-CoV-2刺突抗原合成抗体的轻链的核苷酸序列。
17.根据权利要求16所述的组合物,其中所述第一核酸分子包括编码选自由以下各项组成的组中的至少一种的核苷酸序列:
a)抗SARS-CoV-2抗体重链,其包含与选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ ID NO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的氨基酸序列具有至少80%同一性的序列;以及
b)抗SARS-CoV-2抗体重链的片段,其包含选自SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:18、SEQ ID NO:30、SEQ ID NO:42、SEQ ID NO:84、SEQ ID NO:94、SEQ IDNO:100、SEQ ID NO:112、SEQ ID NO:122和SEQ ID NO:128的全长序列的至少80%;以及
其中,所述第二核酸分子包括编码选自由以下各项组成的组中的至少一种的核苷酸序列:
c)抗SARS-CoV-2抗体轻链,其包含与选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ ID NO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的氨基酸序列具有至少80%同一性的序列;以及
d)抗SARS-CoV-2抗体轻链的片段,其包含选自SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:20、SEQ ID NO:38、SEQ ID NO:44、SEQ ID NO:92、SEQ ID NO:96、SEQ IDNO:102、SEQ ID NO:120、SEQ ID NO:124和SEQ ID NO:130的全长序列的至少80%。
18.根据权利要求16所述的组合物,其中所述第一核酸分子包含选自由以下各项组成的组中的核苷酸序列:
a)与选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQ ID NO:127的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体重链;以及
b)包含选自SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:11、SEQ ID NO:17、SEQ ID NO:29、SEQ ID NO:41、SEQ ID NO:83、SEQ ID NO:93、SEQ ID NO:99、SEQ ID NO:111、SEQ ID NO:121和SEQ ID NO:127的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体重链;并且
其中,所述第二核酸分子包含选自由以下各项组成的组中的核苷酸序列:
c)与选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的核苷酸具有至少80%同一性的核苷酸序列,其编码抗SARS-CoV-2抗体轻链;以及
d)包含选自SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:19、SEQ ID NO:37、SEQ ID NO:43、SEQ ID NO:91、SEQ ID NO:95、SEQ ID NO:101、SEQ ID NO:119、SEQ ID NO:123和SEQ ID NO:129的全长序列的至少80%的核苷酸序列的片段,其编码抗SARS-CoV-2抗体轻链。
19.根据权利要求14所述的组合物,还包含药学上可接受的赋形剂。
20.根据权利要求15至18中任一项所述的组合物,还包含药学上可接受的赋形剂。
21.一种预防或治疗受试者中的疾病的方法,所述方法包括向所述受试者给予权利要求1至6中任一项所述的抗体或抗体片段、权利要求7至13中任一项所述的核酸分子或权利要求14至20中任一项所述的组合物。
22.根据权利要求21所述的方法,其中所述疾病是COVID-19。
23.根据权利要求22所述的方法,还包括给予所述受试者至少一种用于治疗COVID-19的另外的SARS-CoV-2疫苗或治疗剂。
24.一种在受试者中诱导针对SARS-CoV-2的免疫应答的方法,所述方法包括向该受试者给予权利要求1至6中任一项所述的抗体或抗体片段、权利要求7至13中任一项所述的核酸分子或权利要求14至20中任一项所述的组合物。
25.一种在有需要的受试者中诱导抗SARS-CoV-2免疫应答的方法,所述方法包括向所述受试者给予第一组合物和第二组合物的组合,所述第一组合物包含权利要求7至13中任一项所述的编码合成抗SARS-CoV-2抗体或其片段的核酸分子,所述第二组合物包含编码SARS-CoV-2抗原的核酸分子。
26.根据权利要求25所述的方法,其中,所述编码SARS-CoV-2抗原的核酸分子包含编码肽的核苷酸序列,所述肽包含在选自SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138和SEQID NO:140的氨基酸序列的全长上具有至少约90%同一性的氨基酸序列。
27.根据权利要求26所述的方法,其中所述编码SARS-CoV-2抗原的核酸分子包含编码选自SEQ ID NO:134、SEQ ID NO:136、SEQ IDNO:138和SEQ ID NO:140的氨基酸序列的核苷酸序列。
28.根据权利要求25所述的方法,其中,所述编码SARS-CoV-2抗原的核酸分子包含在选自SEQ ID NO:133、SEQ ID NO:135、SEQ IDNO:137和SEQ ID NO:139的核酸序列的全长上具有至少约90%同一性的核苷酸序列。
29.根据权利要求28所述的方法,其中所述编码SARS-CoV-2抗原的核酸分子包含选自SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137和SEQ ID NO:139的核苷酸序列。
30.根据权利要求25所述的方法,其中,给予包括电穿孔和注射中的至少一种。
31.一种治疗或保护有需要的受试者免于SARS-CoV-2或与其相关的疾病或病症感染的方法,所述方法包括将第一组合物和第二组合物的组合给予所述受试者,所述第一组合物包含权利要求7至13中任一项所述的编码合成抗SARS-CoV-2抗体或其片段的核酸分子,所述第二组合物包含编码SARS-CoV-2抗原的核酸分子。
32.根据权利要求31所述的方法,其中,所述疾病是COVID-19。
33.根据权利要求31所述的方法,其中,所述编码SARS-CoV-2抗原的核酸分子包含编码肽的核苷酸序列,所述肽包含在选自SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138和SEQID NO:140的氨基酸序列的全长上具有至少约90%同一性的氨基酸序列。
34.根据权利要求33所述的方法,其中所述编码SARS-CoV-2抗原的核酸分子包含编码选自SEQ ID NO:134、SEQ ID NO:136、SEQ IDNO:138和SEQ ID NO:140的氨基酸序列的核苷酸序列。
35.根据权利要求31所述的方法,其中,所述编码SARS-CoV-2抗原的核酸分子包含在选自SEQ ID NO:133、SEQ ID NO:135、SEQ IDNO:137和SEQ ID NO:139的核酸序列的全长上具有至少约90%同一性的核苷酸序列。
36.根据权利要求35所述的方法,其中编码SARS-CoV-2抗原的核酸分子包含选自SEQID NO:133、SEQ ID NO:135、SEQ ID NO:137和SEQ ID NO:139的核苷酸序列。
37.根据权利要求31所述的方法,其中,给予包括电穿孔和注射中的至少一种。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/036,809 | 2020-06-09 | ||
US63/036,795 | 2020-06-09 | ||
US63/068,868 | 2020-08-21 | ||
US63/083,173 | 2020-09-25 | ||
US202063114271P | 2020-11-16 | 2020-11-16 | |
US63/114,271 | 2020-11-16 | ||
PCT/US2021/036606 WO2021252620A2 (en) | 2020-06-09 | 2021-06-09 | Dna encoded antibodies for use against sars-cov-2 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116744966A true CN116744966A (zh) | 2023-09-12 |
Family
ID=87901642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180056190.7A Pending CN116744966A (zh) | 2020-06-09 | 2021-06-09 | Dna编码的用于抵抗sars-cov-2的抗体 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116744966A (zh) |
-
2021
- 2021-06-09 CN CN202180056190.7A patent/CN116744966A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020201853B2 (en) | DNA antibody constructs and method of using same | |
ES2602263T3 (es) | Anticuerpo monoclonal humano para CD134 (OX40) humana y procedimientos de preparación y utilización del mismo | |
JP5372500B2 (ja) | Ilt3結合分子およびその使用 | |
TW202438531A (zh) | 抗ccr8抗體及其用途 | |
AU2024203391A1 (en) | DNA antibody constructs and method of using same | |
JP7282401B2 (ja) | 癌治療のための抗fam19a5抗体の用途 | |
CN107427566B (zh) | Dna抗体构建体及其使用方法 | |
AU2024203766A1 (en) | DNA antibody constructs for use against Pseudomonas aeruginosa | |
US20230212267A1 (en) | Dna antibody constructs for use against sars-cov-2 | |
KR20210104064A (ko) | 항-il-27 항체 및 그의 용도 | |
KR20230042222A (ko) | 중증 급성 호흡기 증후군 코로나바이러스 2(sars-cov-2) 폴리펩티드 및 백신 목적을 위한 이의 용도 | |
CN110325546B (zh) | 靶向流感病毒的dna单克隆抗体 | |
CN116744966A (zh) | Dna编码的用于抵抗sars-cov-2的抗体 | |
JP2023554587A (ja) | Sars-cov-2 スパイクタンパク質の受容体結合ドメインにコンジュゲートまたは融合している抗体およびワクチン目的でのそれらの使用 | |
US20210047390A1 (en) | Nucleic acid antibody constructs for use against respiratory syncytial virus | |
US20240409619A1 (en) | Antibodies for use against sars-cov-2 | |
KR20210117359A (ko) | 라임병에 사용하기 위한 dna 항체 작제물 | |
TW202411246A (zh) | 經工程化之b型肝炎病毒中和抗體及其用途 | |
Lebedin et al. | SARS-CoV-2 neutralization and protection of hamsters via nasal administration of a humanized neutralizing antibody | |
RU2813829C2 (ru) | Конструкции днк-антител для применения против болезни лайма | |
KR20190114963A (ko) | 에볼라 바이러스에 대한 사용을 위한 dna 항체 작제물 | |
WO2024036313A9 (en) | Anti-sars-cov-2 antibodies and methods of use thereof | |
CN116710127A (zh) | 严重急性呼吸系统综合征冠状病毒2(sars-cov-2)多肽及其用于疫苗目的的用途 | |
JP2023539642A (ja) | ヒトIgG1の改変FC領域 及び少なくとも1つの異種抗原を含むポリペプチドをコードする核酸 | |
CN117295761A (zh) | 与sars-cov-2刺突蛋白的受体结合结构域偶联或融合的抗体以及其用于疫苗目的的用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40102827 Country of ref document: HK |