RU2812850C2 - MODULATION OF REP PROTEIN ACTIVITY WHEN PRODUCING CLOSED-END DNA (ceDNA) - Google Patents
MODULATION OF REP PROTEIN ACTIVITY WHEN PRODUCING CLOSED-END DNA (ceDNA) Download PDFInfo
- Publication number
- RU2812850C2 RU2812850C2 RU2021126774A RU2021126774A RU2812850C2 RU 2812850 C2 RU2812850 C2 RU 2812850C2 RU 2021126774 A RU2021126774 A RU 2021126774A RU 2021126774 A RU2021126774 A RU 2021126774A RU 2812850 C2 RU2812850 C2 RU 2812850C2
- Authority
- RU
- Russia
- Prior art keywords
- itr
- protein
- dna
- vector
- cell
- Prior art date
Links
- 230000004952 protein activity Effects 0.000 title 1
- 239000013598 vector Substances 0.000 claims abstract description 493
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 448
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 385
- 238000000034 method Methods 0.000 claims abstract description 227
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 199
- 230000027455 binding Effects 0.000 claims abstract description 78
- 108020004414 DNA Proteins 0.000 claims abstract description 76
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 72
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 59
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 59
- 239000002157 polynucleotide Substances 0.000 claims abstract description 59
- 230000010076 replication Effects 0.000 claims abstract description 28
- 230000004568 DNA-binding Effects 0.000 claims abstract description 16
- 238000001415 gene therapy Methods 0.000 claims abstract description 15
- 101710150114 Protein rep Proteins 0.000 claims abstract description 14
- 101710152114 Replication protein Proteins 0.000 claims abstract description 11
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 11
- 108091036055 CccDNA Proteins 0.000 claims description 348
- 210000004027 cell Anatomy 0.000 claims description 315
- 230000014509 gene expression Effects 0.000 claims description 233
- 239000002773 nucleotide Substances 0.000 claims description 163
- 125000003729 nucleotide group Chemical group 0.000 claims description 163
- 102000039446 nucleic acids Human genes 0.000 claims description 131
- 108020004707 nucleic acids Proteins 0.000 claims description 131
- 230000001105 regulatory effect Effects 0.000 claims description 121
- 239000013612 plasmid Substances 0.000 claims description 112
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims description 105
- 238000012217 deletion Methods 0.000 claims description 66
- 230000037430 deletion Effects 0.000 claims description 66
- 230000004048 modification Effects 0.000 claims description 61
- 238000012986 modification Methods 0.000 claims description 61
- 108091081024 Start codon Proteins 0.000 claims description 56
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 claims description 55
- 241000238631 Hexapoda Species 0.000 claims description 49
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 claims description 48
- 238000004519 manufacturing process Methods 0.000 claims description 45
- 230000003612 virological effect Effects 0.000 claims description 41
- 241000702421 Dependoparvovirus Species 0.000 claims description 38
- 241000125945 Protoparvovirus Species 0.000 claims description 37
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 claims description 33
- 238000003780 insertion Methods 0.000 claims description 32
- 230000037431 insertion Effects 0.000 claims description 32
- 210000000234 capsid Anatomy 0.000 claims description 31
- 230000001939 inductive effect Effects 0.000 claims description 30
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 29
- 230000001225 therapeutic effect Effects 0.000 claims description 28
- 230000035772 mutation Effects 0.000 claims description 25
- 210000004962 mammalian cell Anatomy 0.000 claims description 24
- 230000001124 posttranscriptional effect Effects 0.000 claims description 24
- 238000012384 transportation and delivery Methods 0.000 claims description 21
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 18
- 239000000427 antigen Substances 0.000 claims description 17
- 108091007433 antigens Proteins 0.000 claims description 17
- 102000036639 antigens Human genes 0.000 claims description 17
- 150000001413 amino acids Chemical group 0.000 claims description 16
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 14
- 102000053602 DNA Human genes 0.000 claims description 14
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 13
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 13
- 108091008146 restriction endonucleases Proteins 0.000 claims description 13
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 12
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 12
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 12
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 12
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 10
- 238000011144 upstream manufacturing Methods 0.000 claims description 10
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 9
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 9
- 241000255993 Trichoplusia ni Species 0.000 claims description 9
- 239000004471 Glycine Substances 0.000 claims description 8
- 210000004443 dendritic cell Anatomy 0.000 claims description 8
- 210000001616 monocyte Anatomy 0.000 claims description 8
- 108091062157 Cis-regulatory element Proteins 0.000 claims description 7
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 7
- 239000004473 Threonine Substances 0.000 claims description 7
- 239000000463 material Substances 0.000 claims description 7
- 241000894007 species Species 0.000 claims description 7
- 230000014621 translational initiation Effects 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 108091006112 ATPases Proteins 0.000 claims description 6
- 102000057290 Adenosine Triphosphatases Human genes 0.000 claims description 6
- 108060004795 Methyltransferase Proteins 0.000 claims description 6
- 108091034057 RNA (poly(A)) Proteins 0.000 claims description 6
- 210000004899 c-terminal region Anatomy 0.000 claims description 6
- 241001492404 Woodchuck hepatitis virus Species 0.000 claims description 4
- 230000029087 digestion Effects 0.000 claims description 4
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000010362 genome editing Methods 0.000 claims description 3
- 238000002955 isolation Methods 0.000 claims description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 2
- 229930182817 methionine Natural products 0.000 claims description 2
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims 12
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 claims 1
- 239000011230 binding agent Substances 0.000 claims 1
- 239000003145 cytotoxic factor Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 31
- 239000000126 substance Substances 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 327
- 108700019146 Transgenes Proteins 0.000 description 136
- 239000000203 mixture Substances 0.000 description 136
- 239000002299 complementary DNA Substances 0.000 description 67
- 239000002585 base Substances 0.000 description 59
- 239000003795 chemical substances by application Substances 0.000 description 49
- 241000282414 Homo sapiens Species 0.000 description 40
- 241000701447 unidentified baculovirus Species 0.000 description 40
- 230000000295 complement effect Effects 0.000 description 39
- 239000013607 AAV vector Substances 0.000 description 37
- 108090000765 processed proteins & peptides Proteins 0.000 description 37
- 102000004196 processed proteins & peptides Human genes 0.000 description 31
- 239000012636 effector Substances 0.000 description 30
- 229910052799 carbon Inorganic materials 0.000 description 29
- 150000002632 lipids Chemical class 0.000 description 29
- 239000003623 enhancer Substances 0.000 description 28
- 229920001184 polypeptide Polymers 0.000 description 28
- 210000001519 tissue Anatomy 0.000 description 28
- 238000013518 transcription Methods 0.000 description 28
- 230000035897 transcription Effects 0.000 description 28
- 230000014616 translation Effects 0.000 description 28
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 27
- 108010034634 Repressor Proteins Proteins 0.000 description 27
- 102000009661 Repressor Proteins Human genes 0.000 description 27
- 241000700605 Viruses Species 0.000 description 27
- 125000006850 spacer group Chemical group 0.000 description 27
- 238000006467 substitution reaction Methods 0.000 description 27
- 238000013519 translation Methods 0.000 description 27
- ZFXYFBGIUFBOJW-UHFFFAOYSA-N theophylline Chemical compound O=C1N(C)C(=O)N(C)C2=C1NC=N2 ZFXYFBGIUFBOJW-UHFFFAOYSA-N 0.000 description 26
- 102000040945 Transcription factor Human genes 0.000 description 24
- 108091023040 Transcription factor Proteins 0.000 description 24
- 239000012634 fragment Substances 0.000 description 23
- 108700012359 toxins Proteins 0.000 description 21
- 108091023037 Aptamer Proteins 0.000 description 20
- 239000003053 toxin Substances 0.000 description 20
- 231100000765 toxin Toxicity 0.000 description 20
- 108700026244 Open Reading Frames Proteins 0.000 description 19
- 239000002502 liposome Substances 0.000 description 19
- 230000007613 environmental effect Effects 0.000 description 18
- 230000000670 limiting effect Effects 0.000 description 18
- -1 RNAi Proteins 0.000 description 16
- 239000003814 drug Substances 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 230000008520 organization Effects 0.000 description 15
- 108060001084 Luciferase Proteins 0.000 description 14
- 239000000499 gel Substances 0.000 description 14
- 241000701022 Cytomegalovirus Species 0.000 description 13
- 230000001276 controlling effect Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 239000004055 small Interfering RNA Substances 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 12
- 241001465754 Metazoa Species 0.000 description 12
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 12
- 238000009472 formulation Methods 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 230000004083 survival effect Effects 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 210000001808 exosome Anatomy 0.000 description 11
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 11
- 239000003446 ligand Substances 0.000 description 11
- 239000002245 particle Substances 0.000 description 11
- 230000008488 polyadenylation Effects 0.000 description 11
- 150000003384 small molecules Chemical class 0.000 description 11
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 description 10
- 108090000565 Capsid Proteins Proteins 0.000 description 10
- 102100023321 Ceruloplasmin Human genes 0.000 description 10
- 239000005089 Luciferase Substances 0.000 description 10
- 239000002202 Polyethylene glycol Substances 0.000 description 10
- 210000004671 cell-free system Anatomy 0.000 description 10
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 10
- 229920001223 polyethylene glycol Polymers 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 229960000278 theophylline Drugs 0.000 description 10
- 241000649044 Adeno-associated virus 9 Species 0.000 description 9
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 9
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 229940079593 drug Drugs 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- 150000003522 tetracyclines Chemical class 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 8
- 108060003951 Immunoglobulin Proteins 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 102000018358 immunoglobulin Human genes 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 241000282412 Homo Species 0.000 description 7
- 241000714474 Rous sarcoma virus Species 0.000 description 7
- 108020004459 Small interfering RNA Proteins 0.000 description 7
- 239000004098 Tetracycline Substances 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000030833 cell death Effects 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 239000000411 inducer Substances 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 7
- 239000002105 nanoparticle Substances 0.000 description 7
- 230000036961 partial effect Effects 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 230000000717 retained effect Effects 0.000 description 7
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 229960002180 tetracycline Drugs 0.000 description 7
- 229930101283 tetracycline Natural products 0.000 description 7
- 235000019364 tetracycline Nutrition 0.000 description 7
- 230000002103 transcriptional effect Effects 0.000 description 7
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 6
- 241000283690 Bos taurus Species 0.000 description 6
- 101100091490 Caenorhabditis elegans hrp-1 gene Proteins 0.000 description 6
- 108700011259 MicroRNAs Proteins 0.000 description 6
- 101710154541 Modulator protein Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 108091081548 Palindromic sequence Proteins 0.000 description 6
- 241000701945 Parvoviridae Species 0.000 description 6
- 241000288906 Primates Species 0.000 description 6
- 108020004440 Thymidine kinase Proteins 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 239000008186 active pharmaceutical agent Substances 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 210000000170 cell membrane Anatomy 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 235000012000 cholesterol Nutrition 0.000 description 6
- 230000034994 death Effects 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000028993 immune response Effects 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 230000002147 killing effect Effects 0.000 description 6
- 230000011987 methylation Effects 0.000 description 6
- 238000007069 methylation reaction Methods 0.000 description 6
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 6
- 238000004806 packaging method and process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000012096 transfection reagent Substances 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- BIABMEZBCHDPBV-MPQUPPDSSA-N 1,2-palmitoyl-sn-glycero-3-phospho-(1'-sn-glycerol) Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@@H](O)CO)OC(=O)CCCCCCCCCCCCCCC BIABMEZBCHDPBV-MPQUPPDSSA-N 0.000 description 5
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 5
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 5
- 102000004877 Insulin Human genes 0.000 description 5
- 108090001061 Insulin Proteins 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 108020004422 Riboswitch Proteins 0.000 description 5
- 241000700584 Simplexvirus Species 0.000 description 5
- 108091027967 Small hairpin RNA Proteins 0.000 description 5
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 5
- 108020005202 Viral DNA Proteins 0.000 description 5
- 125000003275 alpha amino acid group Chemical group 0.000 description 5
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 230000010261 cell growth Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 102000051631 human SERPINA1 Human genes 0.000 description 5
- 229940125396 insulin Drugs 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 239000002679 microRNA Substances 0.000 description 5
- 239000011859 microparticle Substances 0.000 description 5
- 210000002845 virion Anatomy 0.000 description 5
- SNKAWJBJQDLSFF-NVKMUCNASA-N 1,2-dioleoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC SNKAWJBJQDLSFF-NVKMUCNASA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 241000283073 Equus caballus Species 0.000 description 4
- 206010021143 Hypoxia Diseases 0.000 description 4
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 108091027981 Response element Proteins 0.000 description 4
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 4
- 241000187432 Streptomyces coelicolor Species 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 102000006601 Thymidine Kinase Human genes 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 230000003833 cell viability Effects 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000012239 gene modification Methods 0.000 description 4
- 230000030279 gene silencing Effects 0.000 description 4
- 230000005017 genetic modification Effects 0.000 description 4
- 235000013617 genetically modified food Nutrition 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000001361 intraarterial administration Methods 0.000 description 4
- 238000001990 intravenous administration Methods 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 239000002207 metabolite Substances 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- VGEREEWJJVICBM-UHFFFAOYSA-N phloretin Chemical compound C1=CC(O)=CC=C1CCC(=O)C1=C(O)C=C(O)C=C1O VGEREEWJJVICBM-UHFFFAOYSA-N 0.000 description 4
- 150000003904 phospholipids Chemical class 0.000 description 4
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical group [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 4
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 229960002930 sirolimus Drugs 0.000 description 4
- 210000002027 skeletal muscle Anatomy 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 229940104230 thymidine Drugs 0.000 description 4
- 231100000331 toxic Toxicity 0.000 description 4
- 230000002588 toxic effect Effects 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- SDEURMLKLAEUAY-JFSPZUDSSA-N (2-{[(2r)-2,3-bis[(13z)-docos-13-enoyloxy]propyl phosphonato]oxy}ethyl)trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCC\C=C/CCCCCCCC SDEURMLKLAEUAY-JFSPZUDSSA-N 0.000 description 3
- HSINOMROUCMIEA-FGVHQWLLSA-N (2s,4r)-4-[(3r,5s,6r,7r,8s,9s,10s,13r,14s,17r)-6-ethyl-3,7-dihydroxy-10,13-dimethyl-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1h-cyclopenta[a]phenanthren-17-yl]-2-methylpentanoic acid Chemical compound C([C@@]12C)C[C@@H](O)C[C@H]1[C@@H](CC)[C@@H](O)[C@@H]1[C@@H]2CC[C@]2(C)[C@@H]([C@H](C)C[C@H](C)C(O)=O)CC[C@H]21 HSINOMROUCMIEA-FGVHQWLLSA-N 0.000 description 3
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 3
- YEJRWHAVMIAJKC-UHFFFAOYSA-N 4-Butyrolactone Chemical class O=C1CCCO1 YEJRWHAVMIAJKC-UHFFFAOYSA-N 0.000 description 3
- 102100026189 Beta-galactosidase Human genes 0.000 description 3
- 241001390356 Bovine adeno-associated virus Species 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 241000282465 Canis Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 102000053642 Catalytic RNA Human genes 0.000 description 3
- 108090000994 Catalytic RNA Proteins 0.000 description 3
- 241000255601 Drosophila melanogaster Species 0.000 description 3
- 241000283086 Equidae Species 0.000 description 3
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 3
- 102100031939 Erythropoietin Human genes 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 208000009889 Herpes Simplex Diseases 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- MVTQIFVKRXBCHS-SMMNFGSLSA-N N-[(3S,6S,12R,15S,16R,19S,22S)-3-benzyl-12-ethyl-4,16-dimethyl-2,5,11,14,18,21,24-heptaoxo-19-phenyl-17-oxa-1,4,10,13,20-pentazatricyclo[20.4.0.06,10]hexacosan-15-yl]-3-hydroxypyridine-2-carboxamide (10R,11R,12E,17E,19E,21S)-21-hydroxy-11,19-dimethyl-10-propan-2-yl-9,26-dioxa-3,15,28-triazatricyclo[23.2.1.03,7]octacosa-1(27),6,12,17,19,25(28)-hexaene-2,8,14,23-tetrone Chemical compound CC(C)[C@H]1OC(=O)C2=CCCN2C(=O)c2coc(CC(=O)C[C@H](O)\C=C(/C)\C=C\CNC(=O)\C=C\[C@H]1C)n2.CC[C@H]1NC(=O)[C@@H](NC(=O)c2ncccc2O)[C@@H](C)OC(=O)[C@@H](NC(=O)[C@@H]2CC(=O)CCN2C(=O)[C@H](Cc2ccccc2)N(C)C(=O)[C@@H]2CCCN2C1=O)c1ccccc1 MVTQIFVKRXBCHS-SMMNFGSLSA-N 0.000 description 3
- 241000121250 Parvovirinae Species 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 3
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 3
- 101710088839 Replication initiation protein Proteins 0.000 description 3
- 241000283984 Rodentia Species 0.000 description 3
- YASAKCUCGLMORW-UHFFFAOYSA-N Rosiglitazone Chemical compound C=1C=CC=NC=1N(C)CCOC(C=C1)=CC=C1CC1SC(=O)NC1=O YASAKCUCGLMORW-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 3
- 101150044878 US18 gene Proteins 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 230000000368 destabilizing effect Effects 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 108010057988 ecdysone receptor Proteins 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 3
- 230000007954 hypoxia Effects 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 238000001802 infusion Methods 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 239000012212 insulator Substances 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 229960003248 mifepristone Drugs 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 230000001323 posttranslational effect Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 108091092562 ribozyme Proteins 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 210000003491 skin Anatomy 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- WKOLLVMJNQIZCI-UHFFFAOYSA-N vanillic acid Chemical compound COC1=CC(C(O)=O)=CC=C1O WKOLLVMJNQIZCI-UHFFFAOYSA-N 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- CXNPLSGKWMLZPZ-GIFSMMMISA-N (2r,3r,6s)-3-[[(3s)-3-amino-5-[carbamimidoyl(methyl)amino]pentanoyl]amino]-6-(4-amino-2-oxopyrimidin-1-yl)-3,6-dihydro-2h-pyran-2-carboxylic acid Chemical compound O1[C@@H](C(O)=O)[C@H](NC(=O)C[C@@H](N)CCN(C)C(N)=N)C=C[C@H]1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-GIFSMMMISA-N 0.000 description 2
- ZWTDXYUDJYDHJR-UHFFFAOYSA-N (E)-1-(2,4-dihydroxyphenyl)-3-(2,4-dihydroxyphenyl)-2-propen-1-one Natural products OC1=CC(O)=CC=C1C=CC(=O)C1=CC=C(O)C=C1O ZWTDXYUDJYDHJR-UHFFFAOYSA-N 0.000 description 2
- CITHEXJVPOWHKC-UUWRZZSWSA-N 1,2-di-O-myristoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCC CITHEXJVPOWHKC-UUWRZZSWSA-N 0.000 description 2
- WTBFLCSPLLEDEM-JIDRGYQWSA-N 1,2-dioleoyl-sn-glycero-3-phospho-L-serine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC WTBFLCSPLLEDEM-JIDRGYQWSA-N 0.000 description 2
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 2
- PJYYBCXMCWDUAZ-JJJZTNILSA-N 2,3,14,20,22-pentahydroxy-(2β,3β,5β,22R)-Cholest-7-en-6-one Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 PJYYBCXMCWDUAZ-JJJZTNILSA-N 0.000 description 2
- FXCMGCFNLNFLSH-JTQLQIEISA-N 3-oxo-octanoic acid (2-oxo-tetrahydro-furan-3-yl)-amide Chemical compound CCCCCC(=O)CC(=O)N[C@H]1CCOC1=O FXCMGCFNLNFLSH-JTQLQIEISA-N 0.000 description 2
- ATRCOGLZUCICIV-UHFFFAOYSA-N 6-hydroxynicotine Chemical compound CN1CCCC1C1=CC=C(O)N=C1 ATRCOGLZUCICIV-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 2
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000714230 Avian leukemia virus Species 0.000 description 2
- 108020000946 Bacterial DNA Proteins 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 2
- 241000701922 Bovine parvovirus Species 0.000 description 2
- 241000282421 Canidae Species 0.000 description 2
- 241000701931 Canine parvovirus Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 208000003322 Coinfection Diseases 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 101710137619 DNA gyrase inhibitor Proteins 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 241000121256 Densovirinae Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 description 2
- 241000709744 Enterobacterio phage MS2 Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108010054218 Factor VIII Proteins 0.000 description 2
- 102000001690 Factor VIII Human genes 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000702617 Human parvovirus B19 Species 0.000 description 2
- 229930064664 L-arginine Natural products 0.000 description 2
- 235000014852 L-arginine Nutrition 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 102000007330 LDL Lipoproteins Human genes 0.000 description 2
- 108010007622 LDL Lipoproteins Proteins 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- YQHMWTPYORBCMF-UHFFFAOYSA-N Naringenin chalcone Natural products C1=CC(O)=CC=C1C=CC(=O)C1=C(O)C=C(O)C=C1O YQHMWTPYORBCMF-UHFFFAOYSA-N 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- FVJZSBGHRPJMMA-IOLBBIBUSA-N PG(18:0/18:0) Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@@H](O)CO)OC(=O)CCCCCCCCCCCCCCCCC FVJZSBGHRPJMMA-IOLBBIBUSA-N 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 241000702619 Porcine parvovirus Species 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000242680 Schistosoma mansoni Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000256251 Spodoptera frugiperda Species 0.000 description 2
- 229930182558 Sterol Natural products 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 101150110932 US19 gene Proteins 0.000 description 2
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 229930003756 Vitamin B7 Natural products 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000003782 apoptosis assay Methods 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 239000003613 bile acid Substances 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- CXNPLSGKWMLZPZ-UHFFFAOYSA-N blasticidin-S Natural products O1C(C(O)=O)C(NC(=O)CC(N)CCN(C)C(N)=N)C=CC1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-UHFFFAOYSA-N 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000036755 cellular response Effects 0.000 description 2
- BHYOQNUELFTYRT-DPAQBDIFSA-N cholesterol sulfate Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 BHYOQNUELFTYRT-DPAQBDIFSA-N 0.000 description 2
- 229940080277 cholesteryl sulfate Drugs 0.000 description 2
- 208000020832 chronic kidney disease Diseases 0.000 description 2
- CVSVTCORWBXHQV-UHFFFAOYSA-N creatine Chemical compound NC(=[NH2+])N(C)CC([O-])=O CVSVTCORWBXHQV-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 229960003724 dimyristoylphosphatidylcholine Drugs 0.000 description 2
- 229960005160 dimyristoylphosphatidylglycerol Drugs 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- BPHQZTVXXXJVHI-AJQTZOPKSA-N ditetradecanoyl phosphatidylglycerol Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@@H](O)CO)OC(=O)CCCCCCCCCCCCC BPHQZTVXXXJVHI-AJQTZOPKSA-N 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- NUVBSKCKDOMJSU-UHFFFAOYSA-N ethylparaben Chemical compound CCOC(=O)C1=CC=C(O)C=C1 NUVBSKCKDOMJSU-UHFFFAOYSA-N 0.000 description 2
- 229960000301 factor viii Drugs 0.000 description 2
- 229930003935 flavonoid Natural products 0.000 description 2
- 150000002215 flavonoids Chemical class 0.000 description 2
- 235000017173 flavonoids Nutrition 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000002271 gyrase inhibitor Substances 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000028709 inflammatory response Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000007913 intrathecal administration Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 2
- 239000004530 micro-emulsion Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- YJQPYGGHQPGBLI-KGSXXDOSSA-N novobiocin Chemical compound O1C(C)(C)[C@H](OC)[C@@H](OC(N)=O)[C@@H](O)[C@@H]1OC1=CC=C(C(O)=C(NC(=O)C=2C=C(CC=C(C)C)C(O)=CC=2)C(=O)O2)C2=C1C YJQPYGGHQPGBLI-KGSXXDOSSA-N 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- WFNDDSQUKATKNX-UHFFFAOYSA-N phenethyl butyrate Chemical compound CCCC(=O)OCCC1=CC=CC=C1 WFNDDSQUKATKNX-UHFFFAOYSA-N 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005522 programmed cell death Effects 0.000 description 2
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 102220000969 rs119450945 Human genes 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 150000003432 sterols Chemical class 0.000 description 2
- 235000003702 sterols Nutrition 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000005495 thyroid hormone Substances 0.000 description 2
- 229940036555 thyroid hormone Drugs 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000002463 transducing effect Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 239000011735 vitamin B7 Substances 0.000 description 2
- 235000011912 vitamin B7 Nutrition 0.000 description 2
- OPCHFPHZPIURNA-MFERNQICSA-N (2s)-2,5-bis(3-aminopropylamino)-n-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- LVNGJLRDBYCPGB-LDLOPFEMSA-N (R)-1,2-distearoylphosphatidylethanolamine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[NH3+])OC(=O)CCCCCCCCCCCCCCCCC LVNGJLRDBYCPGB-LDLOPFEMSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- YHOXIEXEPIIKMD-UHFFFAOYSA-N 9a-[(4-chlorophenyl)methyl]-7-hydroxy-4-[4-(2-piperidin-1-ylethoxy)phenyl]-2,9-dihydro-1h-fluoren-3-one Chemical compound C1C2=CC(O)=CC=C2C2=C(C=3C=CC(OCCN4CCCCC4)=CC=3)C(=O)CCC21CC1=CC=C(Cl)C=C1 YHOXIEXEPIIKMD-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000300529 Adeno-associated virus 13 Species 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 102000013918 Apolipoproteins E Human genes 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- 101100215617 Arabidopsis thaliana ADO3 gene Proteins 0.000 description 1
- 101100070555 Arabidopsis thaliana HSFA4C gene Proteins 0.000 description 1
- 101100523550 Arabidopsis thaliana RABF2A gene Proteins 0.000 description 1
- 241000282672 Ateles sp. Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 241000684285 Avian adeno-associated virus Species 0.000 description 1
- 101100389345 Bacillus subtilis (strain 168) ndoA gene Proteins 0.000 description 1
- 241000157302 Bison bison athabascae Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101150078024 CRY2 gene Proteins 0.000 description 1
- 102100032216 Calcium and integrin-binding protein 1 Human genes 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000010804 Caulobacter vibrioides Species 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 102100035673 Centrosomal protein of 290 kDa Human genes 0.000 description 1
- 101710198317 Centrosomal protein of 290 kDa Proteins 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 241001647372 Chlamydia pneumoniae Species 0.000 description 1
- 241000606153 Chlamydia trachomatis Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241000589518 Comamonas testosteroni Species 0.000 description 1
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 102100026398 Cyclic AMP-responsive element-binding protein 3 Human genes 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108010054814 DNA Gyrase Proteins 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000007528 DNA Polymerase III Human genes 0.000 description 1
- 108010071146 DNA Polymerase III Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000271571 Dromaius novaehollandiae Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000319170 Ethmodiscus rex Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 102000004315 Forkhead Transcription Factors Human genes 0.000 description 1
- 108090000852 Forkhead Transcription Factors Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 102100036264 Glucose-6-phosphatase catalytic subunit 1 Human genes 0.000 description 1
- 241001517118 Goose parvovirus Species 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 241000724709 Hepatitis delta virus Species 0.000 description 1
- 108010048671 Homeodomain Proteins Proteins 0.000 description 1
- 102000009331 Homeodomain Proteins Human genes 0.000 description 1
- 101000943475 Homo sapiens Calcium and integrin-binding protein 1 Proteins 0.000 description 1
- 101000855520 Homo sapiens Cyclic AMP-responsive element-binding protein 3 Proteins 0.000 description 1
- 101000930910 Homo sapiens Glucose-6-phosphatase catalytic subunit 1 Proteins 0.000 description 1
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000254022 Locusta migratoria Species 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- ROAIXOJGRFKICW-UHFFFAOYSA-N Methenamine hippurate Chemical compound C1N(C2)CN3CN1CN2C3.OC(=O)CNC(=O)C1=CC=CC=C1 ROAIXOJGRFKICW-UHFFFAOYSA-N 0.000 description 1
- 241000702623 Minute virus of mice Species 0.000 description 1
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 229920002505 N-(Carbonyl-Methoxypolyethylene Glycol 2000)-1,2-Distearoyl-Sn-Glycero-3-Phosphoethanolamine Polymers 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- YJQPYGGHQPGBLI-UHFFFAOYSA-N Novobiocin Natural products O1C(C)(C)C(OC)C(OC(N)=O)C(O)C1OC1=CC=C(C(O)=C(NC(=O)C=2C=C(CC=C(C)C)C(O)=CC=2)C(=O)O2)C2=C1C YJQPYGGHQPGBLI-UHFFFAOYSA-N 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- FXCMGCFNLNFLSH-UHFFFAOYSA-N OOHL Natural products CCCCCC(=O)CC(=O)NC1CCOC1=O FXCMGCFNLNFLSH-UHFFFAOYSA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 102100034574 P protein Human genes 0.000 description 1
- 101710181008 P protein Proteins 0.000 description 1
- 241001147838 Paenarthrobacter nicotinovorans Species 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 108010013639 Peptidoglycan Proteins 0.000 description 1
- 108090000029 Peroxisome Proliferator-Activated Receptors Proteins 0.000 description 1
- 102100038831 Peroxisome proliferator-activated receptor alpha Human genes 0.000 description 1
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 description 1
- 101710125939 Phenylalanine-4-hydroxylase Proteins 0.000 description 1
- 101710177166 Phosphoprotein Proteins 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- PJYYBCXMCWDUAZ-YKDQUOQBSA-N Ponasterone A Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@@](O)([C@@H](O)CCC(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 PJYYBCXMCWDUAZ-YKDQUOQBSA-N 0.000 description 1
- RLNUPSVMIYRZSM-UHFFFAOYSA-N Pristinamycin Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC(=CC=2)N(C)C)CCN(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O RLNUPSVMIYRZSM-UHFFFAOYSA-N 0.000 description 1
- 108010079780 Pristinamycin Proteins 0.000 description 1
- 102100025803 Progesterone receptor Human genes 0.000 description 1
- 101710103500 Protein Rep78 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 241000500703 Python regius Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 1
- 241000187562 Rhodococcus sp. Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- XRKZVXDFKCVICZ-IJLUTSLNSA-N SCB1 Chemical compound CC(C)CCCC[C@@H](O)[C@H]1[C@H](CO)COC1=O XRKZVXDFKCVICZ-IJLUTSLNSA-N 0.000 description 1
- 101100439280 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CLB1 gene Proteins 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 101100198283 Scheffersomyces stipitis (strain ATCC 58785 / CBS 6054 / NBRC 10063 / NRRL Y-11545) DHG2 gene Proteins 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 241001345428 Snake adeno-associated virus Species 0.000 description 1
- 241000425549 Snake parvovirus Species 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- 102000007451 Steroid Receptors Human genes 0.000 description 1
- 241000187759 Streptomyces albus Species 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 239000008049 TAE buffer Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 241000723677 Tobacco ringspot virus Species 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 108091008605 VEGF receptors Proteins 0.000 description 1
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108010080702 Virginiamycin Proteins 0.000 description 1
- 239000004188 Virginiamycin Substances 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- WTIJXIZOODAMJT-WBACWINTSA-N [(3r,4s,5r,6s)-5-hydroxy-6-[4-hydroxy-3-[[5-[[4-hydroxy-7-[(2s,3r,4s,5r)-3-hydroxy-5-methoxy-6,6-dimethyl-4-(5-methyl-1h-pyrrole-2-carbonyl)oxyoxan-2-yl]oxy-8-methyl-2-oxochromen-3-yl]carbamoyl]-4-methyl-1h-pyrrole-3-carbonyl]amino]-8-methyl-2-oxochromen- Chemical compound O([C@@H]1[C@H](C(O[C@H](OC=2C(=C3OC(=O)C(NC(=O)C=4C(=C(C(=O)NC=5C(OC6=C(C)C(O[C@@H]7[C@@H]([C@H](OC(=O)C=8NC(C)=CC=8)[C@@H](OC)C(C)(C)O7)O)=CC=C6C=5O)=O)NC=4)C)=C(O)C3=CC=2)C)[C@@H]1O)(C)C)OC)C(=O)C1=CC=C(C)N1 WTIJXIZOODAMJT-WBACWINTSA-N 0.000 description 1
- HIHOWBSBBDRPDW-PTHRTHQKSA-N [(3s,8s,9s,10r,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl] n-[2-(dimethylamino)ethyl]carbamate Chemical compound C1C=C2C[C@@H](OC(=O)NCCN(C)C)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HIHOWBSBBDRPDW-PTHRTHQKSA-N 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 208000037919 acquired disease Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229930188620 butyrolactone Natural products 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 101150102092 ccdB gene Proteins 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000022534 cell killing Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940038705 chlamydia trachomatis Drugs 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 238000011097 chromatography purification Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 229960003624 creatine Drugs 0.000 description 1
- 239000006046 creatine Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- RTINQKRHLKCKBZ-UHFFFAOYSA-N diaminophosphinic acid;morpholine Chemical compound NP(N)(O)=O.C1COCCN1 RTINQKRHLKCKBZ-UHFFFAOYSA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 150000002061 ecdysteroids Chemical class 0.000 description 1
- 230000005014 ectopic expression Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 235000010228 ethyl p-hydroxybenzoate Nutrition 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000001146 hypoxic effect Effects 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000464 low-speed centrifugation Methods 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 1
- 101150048352 mazF gene Proteins 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 101150034514 murC gene Proteins 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 229940071238 n-(carbonyl-methoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine Drugs 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- 229960002950 novobiocin Drugs 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 230000000174 oncolytic effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 210000004923 pancreatic tissue Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011170 pharmaceutical development Methods 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 108091008695 photoreceptors Proteins 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000009894 physiological stress Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 229960003961 pristinamycin Drugs 0.000 description 1
- DAIKHDNSXMZDCU-OUDXUNEISA-N pristinamycin-IIA Natural products CC(C)[C@H]1OC(=O)C2=CCCN2C(=O)c3coc(CC(=O)C[C@H](O)C=C(C)C=CCNC(=O)C=C[C@@H]1C)n3 DAIKHDNSXMZDCU-OUDXUNEISA-N 0.000 description 1
- JOOMGSFOCRDAHL-XKCHLWDXSA-N pristinamycin-IIB Natural products CC(C)[C@@H]1OC(=O)[C@H]2CCCN2C(=O)c3coc(CC(=O)C[C@@H](O)C=C(C)C=CCNC(=O)C=C[C@H]1C)n3 JOOMGSFOCRDAHL-XKCHLWDXSA-N 0.000 description 1
- 230000001566 pro-viral effect Effects 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 229960003415 propylparaben Drugs 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000011865 proteolysis targeting chimera technique Methods 0.000 description 1
- 229940124823 proteolysis targeting chimeric molecule Drugs 0.000 description 1
- YQUVCSBJEUQKSH-UHFFFAOYSA-N protochatechuic acid Natural products OC(=O)C1=CC=C(O)C(O)=C1 YQUVCSBJEUQKSH-UHFFFAOYSA-N 0.000 description 1
- 239000013608 rAAV vector Substances 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 239000003340 retarding agent Substances 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 102000027483 retinoid hormone receptors Human genes 0.000 description 1
- 108091008679 retinoid hormone receptors Proteins 0.000 description 1
- 101150076874 rha-1 gene Proteins 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229960004586 rosiglitazone Drugs 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 239000013017 sartobind Substances 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001235 sensitizing effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 108010026668 snake venom protein C activator Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- JJICLMJFIKGAAU-UHFFFAOYSA-M sodium;2-amino-9-(1,3-dihydroxypropan-2-yloxymethyl)purin-6-olate Chemical compound [Na+].NC1=NC([O-])=C2N=CN(COC(CO)CO)C2=N1 JJICLMJFIKGAAU-UHFFFAOYSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- WEPNHBQBLCNOBB-FZJVNAOYSA-N sucrose octasulfate Chemical compound OS(=O)(=O)O[C@@H]1[C@H](OS(O)(=O)=O)[C@H](COS(=O)(=O)O)O[C@]1(COS(O)(=O)=O)O[C@@H]1[C@H](OS(O)(=O)=O)[C@@H](OS(O)(=O)=O)[C@@H](OS(O)(=O)=O)[C@@H](COS(O)(=O)=O)O1 WEPNHBQBLCNOBB-FZJVNAOYSA-N 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 229960001082 trimethoprim Drugs 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 229940054541 urex Drugs 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- TUUBOHWZSQXCSW-UHFFFAOYSA-N vanillic acid Natural products COC1=CC(O)=CC(C(O)=O)=C1 TUUBOHWZSQXCSW-UHFFFAOYSA-N 0.000 description 1
- FGQOOHJZONJGDT-UHFFFAOYSA-N vanillin Natural products COC1=CC(O)=CC(C=O)=C1 FGQOOHJZONJGDT-UHFFFAOYSA-N 0.000 description 1
- MWOOGOJBHIARFG-UHFFFAOYSA-N vanillin Chemical compound COC1=CC(C=O)=CC=C1O MWOOGOJBHIARFG-UHFFFAOYSA-N 0.000 description 1
- 235000012141 vanillin Nutrition 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 229960003842 virginiamycin Drugs 0.000 description 1
- 235000019373 virginiamycin Nutrition 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Abstract
Description
РОДСТВЕННЫЕ ЗАЯВКИRELATED APPLICATIONS
[0001] Эта заявка испрашивает приоритет предварительной заявки США № 62/806076, поданной 15 февраля 2019 г., содержание которой полностью включено в данный документ посредством ссылки. [0001] This application claims priority to US Provisional Application No. 62/806076, filed February 15, 2019, the contents of which are incorporated herein by reference in their entirety.
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES
[0002] Данная заявка включает перечень последовательностей, полностью включенный в данный документ посредством ссылки. Указанная ASCII-копия, созданная 13 февраля 2020 г., имеет название 131698-05420_SL.txt и размер 388,896 байт.[0002] This application includes a sequence listing, which is incorporated herein by reference in its entirety. The ASCII copy in question, created on February 13, 2020, is named 131698-05420_SL.txt and is 388,896 bytes in size.
ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD
[0003] Данное изобретение относится к области генной терапии, в том числе к доставке экзогенных последовательностей ДНК в целевую клетку, ткань, орган или организм.[0003] This invention relates to the field of gene therapy, including the delivery of exogenous DNA sequences to a target cell, tissue, organ or organism.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE ART
[0004] Целью генной терапии является улучшение клинических исходов у пациентов, страдающих либо генетическими мутациями, либо приобретенными заболеваниями, вызываемыми аберрациями в профиле генной экспрессии. Генная терапия включает лечение или предотвращение медицинских состояний, обусловленных дефектными генами или аномальной регуляцией, или экспрессией, например, недостаточной экспрессией или избыточной экспрессией, которые могут приводить к расстройству, заболеванию, злокачественному новообразованию и т.п. Например, лечение, предотвращение или облегчение заболевания или расстройства, вызываемого дефектным геном, может быть осуществлено путем доставки пациенту корректирующего генетического материала, приводящей к терапевтической экспрессии указанного генетического материала у указанного пациента. Генная терапия основана на обеспечении транскрипционной кассеты с активным генным продуктом (иногда называемым трансгеном), например, что может приводить к положительному эффекту приобретения функции, отрицательному эффекту потери функции или другому исходу, такому как, например, онколитический эффект. Лечение моногенных расстройств у человека может осуществляться путем доставки и экспрессии нормального гена в целевых клетках. Доставка и экспрессия корректирующего гена в целевые клетки пациента могут быть осуществлены с применением многочисленных способов, в том числе с применением сконструированных вирусов и вирусных векторов для доставки генов. Среди множества доступных векторов вирусного происхождения (например, из рекомбинантного ретровируса, рекомбинантного лентивируса, рекомбинантного аденовируса и т.п.) рекомбинантный аденоассоциированный вирус (rAAV) набирает популярность в качестве универсального вектора для генной терапии.[0004] The goal of gene therapy is to improve clinical outcomes in patients suffering from either genetic mutations or acquired diseases caused by aberrations in the gene expression profile. Gene therapy includes the treatment or prevention of medical conditions caused by defective genes or abnormal regulation or expression, such as underexpression or overexpression, that can lead to a disorder, disease, cancer, or the like. For example, treating, preventing, or ameliorating a disease or disorder caused by a defective gene may be accomplished by delivering corrective genetic material to a patient, resulting in therapeutic expression of said genetic material in said patient. Gene therapy is based on the provision of a transcription cassette with an active gene product (sometimes called a transgene), for example, which can lead to a positive gain-of-function effect, a negative loss-of-function effect, or another outcome, such as, for example, an oncolytic effect. Treatment of monogenic disorders in humans can be achieved by delivering and expressing a normal gene in target cells. Delivery and expression of the corrective gene into the target cells of a patient can be accomplished using numerous methods, including the use of engineered viruses and viral vectors for gene delivery. Among the many viral-derived vectors available (eg, recombinant retrovirus, recombinant lentivirus, recombinant adenovirus, etc.), recombinant adeno-associated virus (rAAV) is gaining popularity as a versatile vector for gene therapy.
[0005] Аденоассоциированные вирусы (AAV) принадлежат к семейству Parvoviridae, более конкретно, они составляют род Dependoparvovirus. Геном AAV состоит из линейной одноцепочечной молекулы ДНК, которая содержит приблизительно 4,7 тысячи пар основ (т.п.о) и состоит из двух основных открытых рамок считывания (ORF), кодирующих неструктурный белок Rep (репликация) и структурный белок Cap (капсид). В гене cap была идентифицирована вторая ORF, которая кодирует белок (AAP) активирующий сборку. ДНК, фланкирующие кодирующие участки AAV, представляют собой две последовательности действующих в цис-положении инвертированных концевых повторов (ITR) длиной приблизительно 145 нуклеотидов, с прерывистыми палиндромными последовательностями, которые могут укладываться в энергетически стабильные шпилечные структуры, функционирующие в качестве праймеров при репликации ДНК. Наряду с ролью в репликации ДНК указанные последовательности ITR, как было показано, вовлечены в интеграцию вирусной ДНК в клеточный геном, «спасение» из генома хозяина или плазмиды, и заключение в капсид вирусной нуклеиновой кислоты в зрелых вирионах (Muzyczka, (1992) Curr. Top. Micro. Immunol. 158:97-129).[0005] Adeno-associated viruses (AAVs) belong to the family Parvoviridae, more specifically they constitute the genus Dependoparvovirus. The AAV genome consists of a linear, single-stranded DNA molecule that contains approximately 4.7 kilobase pairs (kb) and consists of two major open reading frames (ORFs) encoding the nonstructural protein Rep (replication) and the structural protein Cap (capsid ). A second ORF has been identified in the cap gene, which encodes an assembly-activating protein (AAP). The DNA flanking the AAV coding regions are two cis-acting inverted terminal repeat (ITR) sequences of approximately 145 nucleotides in length, with discontinuous palindromic sequences that can fold into energetically stable hairpin structures that function as primers for DNA replication. In addition to their role in DNA replication, these ITR sequences have been shown to be involved in the integration of viral DNA into the cellular genome, rescue from the host genome or plasmid, and encapsidation of the viral nucleic acid in mature virions (Muzyczka, (1992) Curr. Top Micro Immunol 158:97–129).
[0006] Векторы, происходящие из ААV (т.е. рекомбинантные ААV (rААV) или ААV-векторы), являются перспективным способом доставки генетического материала, поскольку (i) они способны инфицировать (трансдуцировать) широкий спектр типов неделящихся и делящихся клеток, в том числе миоциты и нейроны; (ii) они лишены вирусных структурных генов, что обеспечивает уменьшение ответов клетки-хозяина на вирусную инфекцию, например, интерферон-опосредованных ответов; (iii) вирусы дикого типа считаются непатогенными для человека; (iv) в отличие от ААV дикого типа, который способен к интеграции в геном клетки-хозяина, у дефектных по репликации ААV-векторов отсутствует ген rep, и они обычно персистируют в виде эписом, что ограничивает риск инсерционного мутагенеза или генотоксичности; и (v) по сравнению с другими векторными системами, ААV-векторы в целом считаются относительно слабыми иммуногенами и, соответственно, не вызывают значимого иммунного ответа (см. ii), обеспечивая таким образом персистенцию векторной ДНК и, потенциально, долгосрочную экспрессию терапевтических трансгенов. AAV-векторы могут также быть получены и введены в составы с высокими титрами, и доставлены путем внутриартериальных, внутривенных, или внутрибрюшинных инъекций, что обеспечивает распределение вектора и перенос генов в значимые мышечные области посредством однократной инъекции у грызунов (Goyenvalle et al., 2004; Fougerousse et al., 2007; Koppanati et al., 2010; Wang et al., 2009) и собак. В клиническом исследовании лечения спинальной мышечной дистрофии типа 1 AAV-векторы доставляли системно с целью воздействовать на головной мозг, что приводило к очевидным клиническим улучшениям. [0006] AAV-derived vectors (i.e., recombinant AAV (rAAV) or AAV vectors) are a promising method for delivering genetic material because (i) they are capable of infecting (transducing) a wide range of nondividing and dividing cell types, in including myocytes and neurons; (ii) they lack viral structural genes, which provides a reduction in host cell responses to viral infection, such as interferon-mediated responses; (iii) wild-type viruses are considered non-pathogenic to humans; (iv) unlike wild-type AAV, which is capable of integration into the host cell genome, replication-defective AAV vectors lack the rep gene and usually persist as episomes, which limits the risk of insertional mutagenesis or genotoxicity; and (v) compared to other vector systems, AAV vectors are generally considered to be relatively weak immunogens and, accordingly, do not induce a significant immune response (see ii), thus allowing persistence of vector DNA and potentially long-term expression of therapeutic transgenes. AAV vectors can also be prepared and formulated at high titers and delivered by intra-arterial, intravenous, or intraperitoneal injection, allowing vector distribution and gene transfer to relevant muscle regions through a single injection in rodents (Goyenvalle et al., 2004; Fougerousse et al., 2007; Koppanati et al., 2010; Wang et al., 2009) and dogs. In a clinical trial for the treatment of spinal muscular dystrophy type 1, AAV vectors were delivered systemically to target the brain, resulting in apparent clinical improvements.
[0007] Однако применение частиц AAV в качестве вектора для доставки генов имеет ряд серьезных недостатков. Один существенный недостаток, ассоциированный с rAAV, заключается в ограниченной емкости вирусной упаковки, составляющей приблизительно 4,5 т.п.о. гетерологичной ДНК (Dong et al., 1996; Athanasopoulos et al., 2004; Lai et al., 2010). В результате применение AAV-векторов было ограничено емкостью для кодирования белка менее чем 150 кДа. Второй недостаток заключается в том, что ввиду распространенности инфекции AAV дикого типа в популяции, кандидаты для генной терапии rAAV должны проходить скрининг на присутствие нейтрализующих антител, элиминирующих вектор из организма пациента. Третий недостаток связан с иммуногенностью капсида, препятствуещего повторному введению пациентам, которые не были отстранены от начального лечения. Иммунная система пациента может отвечать на вектор, который фактически выступает в роли «бустерной» прививки, стимулируя иммунную систему, генерирующую высокие титры антител против AAV, которые исключают возможность лечения в будущем. В некоторых недавних сообщениях выражены опасения, касающиеся иммуногенности в ситуациях, подразумевающих применение высоких доз. Другой заметный недостаток заключается в относительно медленном начале опосредованной AAV генной экспрессии, принимая во внимание то, что одноцепочечная ДНК AAV должна быть преобразована в двухцепочечную ДНК до экспрессии гетерологичного гена. Хотя были предприняты попытки обойти указанную проблему путем конструирования двухцепочечных ДНК-векторов, указанная стратегия дополнительно ограничивает размер трансгенной экспрессионной кассеты, которая может быть интегрирована в AAV-вектор (McCarty, 2008; Varenika et al., 2009; Foust et al., 2009). [0007] However, the use of AAV particles as a vector for gene delivery has a number of serious disadvantages. One significant disadvantage associated with rAAV is the limited viral packaging capacity of approximately 4.5 kb. heterologous DNA (Dong et al., 1996; Athanasopoulos et al., 2004; Lai et al., 2010). As a result, the use of AAV vectors has been limited to protein coding capacity of less than 150 kDa. The second drawback is that, due to the prevalence of wild-type AAV infection in the population, candidates for rAAV gene therapy must be screened for the presence of neutralizing antibodies that eliminate the vector from the patient. A third disadvantage relates to the immunogenicity of the capsid, which precludes re-administration in patients who were not withdrawn from the initial treatment. The patient's immune system may respond to the vector, which essentially acts as a "booster" shot, stimulating the immune system to generate high titers of anti-AAV antibodies that preclude future treatment. Some recent reports have raised concerns regarding immunogenicity in situations involving high doses. Another notable disadvantage is the relatively slow onset of AAV-mediated gene expression, given that single-stranded AAV DNA must be converted to double-stranded DNA before expression of the heterologous gene. Although attempts have been made to circumvent this problem by constructing double-stranded DNA vectors, this strategy further limits the size of the transgene expression cassette that can be integrated into the AAV vector (McCarty, 2008; Varenika et al., 2009; Foust et al., 2009) .
[0008] Кроме того, стандартные вирионы AAV с капсидами получают путем введения плазмиды или плазмид, содержащих геном AAV, гены rep и гены cap (Grimm et al., 1998). При введении указанных хелперных плазмид в транс-положение происходит «спасение» генома AAV (т.е. высвобождение с последующей амплификацией) из генома хозяина и его дальнейшее заключение в капсид (вирусные капсиды) с получением биологически активных AAV-векторов. Однако, как было обнаружено, такие заключенные в капсиды вирусные AAV-векторы неэффективно трансдуцируют определенные типы клеток и тканей. Указанные капсиды также индуцируют иммунный ответ.[0008] In addition, standard AAV capsid virions are prepared by introducing a plasmid or plasmids containing the AAV genome, rep genes, and cap genes (Grimm et al., 1998). When these helper plasmids are introduced into the trans position, the AAV genome is “rescued” (i.e., released followed by amplification) from the host genome and further enclosed in the capsid (viral capsids) to obtain biologically active AAV vectors. However, such capsid-enclosed viral AAV vectors have been found to be ineffective at transducing certain cell and tissue types. These capsids also induce an immune response.
[0009] Соответственно, применение векторов на основе аденоассоциированного вируса (AAV-векторов) для генной терапии ограничено однократным введением пациентам (из-за иммунного ответа у пациентов), ограниченным диапазоном трансгенного генетического материала, подходящего для доставки в AAV-векторах ввиду минимальной емкости вирусной упаковки (приблизительно 4,5 т.п.о.) ассоциированного капсида AAV, а также медленной AAV-опосредованной генной экспрессией. Применение клинической генной терапии с использованием rAAV дополнительно затруднено вариабельностью среди пациентов, которую нельзя предсказать на основании дозовой зависимости в сингенных моделях на мышах или других видах моделей.[0009] Accordingly, the use of adeno-associated virus vectors (AAV vectors) for gene therapy is limited to single administration to patients (due to the patient's immune response), limited to the range of transgenic genetic material suitable for delivery in AAV vectors due to the minimal viral capacity packaging (approximately 4.5 kb) of the associated AAV capsid, as well as slow AAV-mediated gene expression. The application of clinical gene therapy using rAAV is further complicated by variability among patients, which cannot be predicted based on dose response in syngeneic mouse models or other types of models.
[0010] Рекомбинантные бескапсидные AAV-векторы могут быть получены в виде выделенной линейной молекулы нуклеиновой кислоты, содержащей экспрессируемые участки трансгена и участки промотора, фланкированные двумя последовательностями инвертированных концевых повторов (ITR) AAV дикого типа, включая сайты связывания Rep и сайты концевого разрешения (TRS). Указанные рекомбинантные AAV-векторы не содержат последовательностей, кодирующих капсидный белок AAV, и могут быть одноцепочечными, двуцепочечными или дуплексными, где один или оба конца ковалентно связаны посредством двух палиндромных последовательностей ITR дикого типа (например, WO2012/123430, патент США 9598703). Они позволяют избежать многих проблем AAV-опосредованной генной терапии благодаря значительно большей трансгенной емкости, быстрому началу трансгенной экспрессии, и действительному распознаванию иммунной системой пациента молекул ДНК как вируса, который необходимо удалить. Однако постоянная экспрессия трансгена может быть желательной не во всех случаях, а канонические ITR AAV дикого типа могут не поддаваться оптимизации для использования в качестве зкДНК. Поэтому, все еще имеется значительная неудовлетворенная потребность в контролируемых рекомбинантных ДНК-векторах, а также в улучшенных характеристиках получения и/или экспрессии.[0010] Recombinant capsidless AAV vectors can be produced as an isolated linear nucleic acid molecule containing transgene expression regions and promoter regions flanked by two wild-type AAV inverted terminal repeat (ITR) sequences, including Rep binding sites and terminal resolution sites (TRS) ). These recombinant AAV vectors do not contain AAV capsid protein coding sequences and may be single-stranded, double-stranded, or duplex, where one or both ends are covalently linked through two palindromic wild-type ITR sequences (eg, WO2012/123430, US Pat. No. 9,598,703). They avoid many of the problems of AAV-mediated gene therapy due to significantly greater transgene capacity, rapid onset of transgene expression, and actual recognition by the patient's immune system of the DNA molecules as the virus that needs to be removed. However, persistent transgene expression may not be desirable in all cases, and canonical wild-type AAV ITRs may not be optimized for use as cccDNA. Therefore, there is still a significant unmet need for controlled recombinant DNA vectors, as well as improved production and/or expression characteristics.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
[0011] Описанное в данном документе изобретение относится к улучшенному получении невирусного бескапсидного ДНК-вектора с ковалентно-замкнутыми концами (называемом в данном документе «вектором с ДНК с замкнутыми концами», или «зкДНК-вектором»). ЗкДНК-векторы, которые получены способами описаными в данном документе, представляют собой бескапсидные линейные дуплексные молекулы ДНК, образованные непрерывной цепью комплементарной ДНК с ковалентно замкнутыми концами (линейная, непрерывная и не заключенная в капсид структура), которые содержат последовательность инвертированного 5'-концевого повтора (ITR) и последовательность инвертированного 3' ITR, которые отличаются друг от друга или являются асимметричными. [0011] The invention described herein relates to the improved production of a non-viral capsidless DNA vector with covalently closed ends (referred to herein as a “closed-end DNA vector” or “ccDNA vector”). CccDNA vectors, which are prepared by the methods described herein, are capsidless linear duplex DNA molecules formed by a continuous strand of complementary DNA with covalently closed ends (linear, contiguous, and non-capsidized structure) that contain an inverted 5'-terminal repeat sequence (ITR) and the inverted 3' ITR sequence, which are different from each other or are asymmetric.
[0012] Описанная технология относится к получению вектора зкДНК или вектора AAV в клетке (например, клетке насекомого, клетке млекопитающего) или в бесклеточной системе с единственным видом белка Rep. В частности, данное раскрытие частично основано на неожиданном открытии того, что достаточно одного только Rep78 или Rep68 для получения вектора зкДНК или вектора AAV в клетке. Это усовершенствованный и более эффективный способ получения вектора зкДНК, чем описанный в предшествующем уровне техники, в котором векторы AAV или зкДНК продуцируются в клетках (например, клетках насекомых), требующих два белка Rep; например, по меньшей мере, один малый белок Rep (например, Rep52 или Rep40) и по меньшей мере один большой белок Rep (например, Rep78 или Rep68). Таким образом, в предшествующем уровне техники описано, что получение векторов зкДНК или векторов AAV осуществляется с использованием двух белков Rep, либо кодируемых на отдельных конструктах нуклеиновых кислот, каждый из которых функционально связан с промотором, либо двух белков Rep, кодируемых на одном конструкте нуклеиновой кислоты с двумя сайты инициации, оперативно связанные с одним промотором.[0012] The described technology relates to the production of a cccDNA vector or an AAV vector in a cell (eg, insect cell, mammalian cell) or in a cell-free system with a single species of Rep protein. In particular, this disclosure is based in part on the unexpected discovery that Rep78 or Rep68 alone is sufficient to produce a cccDNA vector or an AAV vector in a cell. This is an improved and more efficient method for producing a cccDNA vector than that described in the prior art, in which AAV or cccDNA vectors are produced in cells (eg, insect cells) requiring two Rep proteins; for example, at least one small Rep protein (eg, Rep52 or Rep40) and at least one large Rep protein (eg, Rep78 or Rep68). Thus, the prior art describes the production of cccDNA vectors or AAV vectors using two Rep proteins, either encoded on separate nucleic acid constructs, each of which is operably linked to a promoter, or two Rep proteins, encoded on a single nucleic acid construct with two initiation sites operatively linked to a single promoter.
[0013] Соответственно, один аспект описанной здесь технологии относится к конструкту нуклеиновой кислоты для получения ДНК-векторов, например, зкДНК-векторов и других рекомбинантных парвовирусных (например, аденоассоциированных вирусов) векторов в клетках (например, клетках насекомых, клетках млекопитающих) и безклеточных систем, в которых, например, клетки насекомых или бесклеточная система содержат первую нуклеотидную последовательность, кодирующую единственный парвовирусный белок Rep, в которой нуклеотидная последовательность не имеет открытой рамки считывания (ORF) и не имеет функционального кодона инициации ниже первого инициирующего кодона и/или отсутствуют альтернативные сайты сплайсинга, предотвращающие пропуск экзона, тем самым обеспечивая трансляцию только одного парвовирусного белка Rep (например, белка Rep78 или Rep 68) без трансляции дополнительных белков Rep на более позднем инициирующем кодоне (например, любого одного или нескольких из Rep52 или Rep 40) в клетках насекомых или бесклеточной системе. То есть нуклеиновая кислота, кодирующая Rep78, также не продуцирует белок Rep52, и аналогично, нуклеиновая кислота, кодирующая Rep68, не продуцирует белок Rep40. Кроме того, никакой другой Rep белок не присутствует и не экспрессируется в системе. [0013] Accordingly, one aspect of the technology described herein relates to nucleic acid construct for the production of DNA vectors, e.g., cccDNA vectors and other recombinant parvovirus (e.g., adeno-associated virus) vectors in cells (e.g., insect cells, mammalian cells) and cell-free systems in which, for example, insect cells or a cell-free system contain a first nucleotide sequence encoding a single parvovirus Rep protein, in which the nucleotide sequence does not have an open reading frame (ORF) and does not have a functional initiation codon downstream of the first initiation codon and/or there are no alternative splice sites that prevent exon skipping, thereby allowing translation of only one parvovirus Rep protein (e.g., Rep78 or Rep 68 protein) without translation of additional Rep proteins at a later start codon (e.g., any one or more of Rep52 or Rep 40) in cells insects or acellular system. That is, the nucleic acid encoding Rep78 also does not produce the Rep52 protein, and similarly, the nucleic acid encoding Rep68 does not produce the Rep40 protein. Additionally, no other Rep protein is present or expressed in the system.
[0014] В некоторых вариантах реализации способы и композиции, описанные в данном документе для использования, единственный белок Rep может быть использован для получения любого вектора зкДНК, включая, помимо прочего, вектор зкДНК, содержащий асимметричные ITRы, как описано в международной патентной заявке PCT/US18/49996 поданной 7 сентября 2018 г. (см., например, Примеры 1-4); вектор зкДНК для редактирования генов, как описано в Международной патентной заявке PCT/US18/64242, поданной 6 декабря 2018 г. (см., например, Примеры 1-7), или вектор зкДНК для получения антител или слитых белков, как описано в Международной патентной заявке PCT/US19/18016, поданной 14 февраля 2019 г. (например, см. Примеры 1-4), все из которых полностью включены в данный документ посредством ссылки. В некоторых вариантах реализации также предполагается, что способы и композиции, описанные в данном документе, с использованием единственного белка Rep, могут быть использованы в синтетическом получении вектора зкДНК, например, в бесклеточной или не принадлежащей насекомым системе продуцирования зкДНК, как раскрыто в Международной заявке PCT/US19/14122, поданной 18 января 2019 г., полностью включенной в данный документ посредством ссылки, в которой единственный белок Rep может быть использован для лигирования содержащихся в нем олигонуклеотидов ITR с помощью белка. [0014] In some embodiments, the methods and compositions described herein for use, a single Rep protein can be used to produce any cccDNA vector, including, but not limited to, a cccDNA vector containing asymmetric ITRs, as described in PCT International Patent Application US18/49996 filed September 7, 2018 (see, for example, Examples 1-4); a cccDNA vector for gene editing, as described in International Patent Application PCT/US18/64242, filed December 6, 2018 (see, for example, Examples 1-7), or a cccDNA vector for producing antibodies or fusion proteins, as described in International patent application PCT/US19/18016, filed February 14, 2019 (for example, see Examples 1-4), all of which are incorporated herein by reference in their entirety. In some embodiments, it is also contemplated that the methods and compositions described herein, using a single Rep protein, can be used in the synthetic production of a cccDNA vector, for example, in a cell-free or non-insect ccDNA production system as disclosed in a PCT International Application /US19/14122, filed January 18, 2019, incorporated herein by reference in its entirety, in which a single Rep protein can be used to ligate ITR oligonucleotides contained therein with the protein.
[0015] Описанная здесь технология относится к усовершенствованному способу получения вектора зкДНК, содержащего по меньшей мере одну модифицированную последовательность инвертированного концевого повтора (ITR) AAV и экспрессируемый трансген. Согласно описанию в данном документе, зкДНК-векторы могут быть получены способами, описанными в данном документе, в эукариотических клетках и, соответственно, не содержать прокариотических модификаций ДНК и загрязнения бактериальным эндотоксином из клеток насекомых. [0015] The technology described herein relates to an improved method for producing a cccDNA vector containing at least one modified AAV inverted terminal repeat (ITR) sequence and an expressed transgene. As described herein, cccDNA vectors can be produced by the methods described herein in eukaryotic cells and are therefore free of prokaryotic DNA modifications and bacterial endotoxin contamination from insect cells.
[0016] Аспекты изобретения относятся к способам и композициям для получения векторов зкДНК и векторов AAV с использованием единственного белка Rep, как описано в данном документе. Другие варианты реализации относятся к зкДНК-вектору, полученному с применением способа и композиций согласно данному изобретению. [0016] Aspects of the invention relate to methods and compositions for producing cccDNA vectors and AAV vectors using a single Rep protein, as described herein. Other embodiments relate to a cccDNA vector produced using the method and compositions of the present invention.
[0017] В одном аспекте невирусные бескапсидные векторы ДНК с ковалентно-замкнутыми концами, полученные с применением способов описанных в данном документе, предпочтительно представляют собой линейные дуплексные молекулы и могут быть получены из векторного полинуклеотида, который кодирует гетерологичную нуклеиновую кислоту, функционально расположенную между двумя последовательностями разных инвертированных концевых повторов (ITR) (например, ITR AAV), причем по меньшей мере один из ITR содержит сайт концевого разрешения и сайт связывания белка репликации (RPS) (иногда называемый сайтом связывания репликативного белка), например, Rep-связывающий сайт, а один из ITR содержит делецию, вставку или замену относительно другого ITR. То есть один из ITR асимметричен по отношению к другому ITR. В одном варианте реализации по меньшей мере один из ITR представляет собой ITR AAV, например, ITR AAV дикого типа или модифицированный ITR AAV. В одном варианте реализации по меньшей мере один из ITR является модифицированным ITR относительно другого ITR, то есть зкДНК содержит ITR, которые являются асимметричными относительно друг друга. В одном варианте реализации по меньшей мере один из ITR является нефункциональным ITR.[0017] In one aspect, non-viral, capsidless, covalently terminated DNA vectors produced using the methods described herein are preferably linear duplex molecules and can be derived from a vector polynucleotide that encodes a heterologous nucleic acid operably located between two sequences different inverted terminal repeats (ITRs) (e.g., the AAV ITR), wherein at least one of the ITRs contains a terminal resolution site and a replication protein binding site (RPS) (sometimes called a replication protein binding site), e.g., a Rep binding site, and one of the ITRs contains a deletion, insertion, or substitution relative to another ITR. That is, one of the ITRs is asymmetric with respect to the other ITR. In one embodiment, at least one of the ITRs is an AAV ITR, such as a wild-type AAV ITR or a modified AAV ITR. In one embodiment, at least one of the ITRs is a modified ITR relative to another ITR, that is, the cccDNA contains ITRs that are asymmetrical relative to each other. In one embodiment, at least one of the ITRs is a non-functional ITR.
[0018] Согласно некоторым вариантам реализации указанный зкДНК-вектор, полученный способами и композициями, описанными в данном документе, содержит: (1) экспрессионную кассету, содержащую цис-регуляторный элемент, промотор и по меньшей мере один трансген; или (2) промотор, функционально связанный по меньшей мере с одним трансгеном, и (3) две самокомплементарные симметричные последовательности, например, симметричные модифицированные ITR, фланкирующие указанную экспрессионную кассету, причем указанный зкДНК-вектор не ассоциирован с капсидным белком. В некоторых вариантах реализации зкДНК-вектор содержит две самокомплементарные последовательности, присутствующие в геноме AAV, при этом по меньшей мере один ITR содержит функциональный Rep-связывающий элемент (RBE) (также иногда называемый в данном документе «RBS») и сайт концевого разрешения (trs) AAV или функциональный вариант RBE, и один или нескольких цис-регуляторных элементов, функционально связанных с трансгеном. В некоторых вариантах реализации зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторные переключатели, которые описаны в данном документе в разделе, озаглавленном «Регуляторные переключатели», для контроля и регулирования экспрессии трансгена, и может включать регуляторный переключатель, например, «аварийный выключатель», обеспечивающий контролируемую клеточную гибель клетки, содержащей зкДНК-вектор. [0018] In some embodiments, the cccDNA vector produced by the methods and compositions described herein comprises: (1) an expression cassette comprising a cis-regulatory element, a promoter, and at least one transgene; or (2) a promoter operably linked to at least one transgene, and (3) two self-complementary symmetrical sequences, for example symmetrical modified ITRs, flanking said expression cassette, wherein said cDNA vector is not associated with a capsid protein. In some embodiments, the cccDNA vector comprises two self-complementary sequences present in the AAV genome, wherein at least one ITR contains a functional Rep binding element (RBE) (also sometimes referred to herein as an "RBS") and a terminal resolution site (trs) ) AAV or functional RBE variant, and one or more cis-regulatory elements functionally associated with the transgene. In some embodiments, the cccDNA vector contains additional components for regulating transgene expression, such as regulatory switches, which are described herein in the section entitled “Regulatory Switches” for controlling and regulating transgene expression, and may include a regulatory switch, such as “ emergency switch" ensuring controlled cell death of the cell containing the cccDNA vector.
[0019] В некоторых вариантах реализации две самокомплементарные последовательности могут быть последовательностями ITR из любого известного парвовируса, например, депендовируса, такого как AAV (например, AAV1-AAV12). Может быть использован любой серотип AAV, включая, без ограничений, модифицированную последовательность ITR AAV2, которая сохраняет Rep-связывающий сайт (RBS), такой как 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531), и сайт концевого разрешения (trs) в дополнение к переменной палиндромной последовательности, позволяющей сформировать вторичную структуру шпильки. В некоторых вариантах реализации ITR представляет собой синтетическую последовательность ITR, которая сохраняет функциональный Rep-связывающий сайт (RBS), такой как 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531), и сайт концевого разрешения (TRS), в дополнение к вариабельной палиндромной последовательности, позволяющей формировать вторичную структуру шпильки. Согласно некоторым примерам, модифицированная последовательность ITR сохраняет последовательность RBS, trs, и структуру и положение связывающего элемента Rep, образующего концевую петлевую часть одной из шпилечных вторичных структур ITR, как в соответствующей последовательности AAV2 ITR дикого типа. [0019] In some embodiments, the two self-complementary sequences may be ITR sequences from any known parvovirus, for example, a dependovirus such as AAV (eg, AAV1-AAV12). Any AAV serotype may be used, including, but not limited to, a modified AAV2 ITR sequence that retains a Rep binding site (RBS), such as 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531), and a terminal resolution site (trs ) in addition to a variable palindromic sequence allowing the formation of a hairpin secondary structure. In some embodiments, the ITR is a synthetic ITR sequence that retains a functional Rep binding site (RBS), such as 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531), and a terminal resolution site (TRS), in addition to a variable palindromic sequence that allows the formation of the secondary hairpin structure. In some examples, the modified ITR sequence retains the RBS sequence, trs, and the structure and position of the Rep binding element forming the terminal loop portion of one of the ITR hairpin secondary structures, as in the corresponding wild-type AAV2 ITR sequence.
[0020] Типичными последовательностями ITR для использования в векторах зкДНК, полученных описанными здесь способами и композициями, могут быть любая одна или несколько из Таблиц 2-10A и 10B, или SEQ ID NO: 2, 52, 101-499 и 545-547, или частичные последовательности ITR, показанные на Фиг. 26А-26В. В некоторых вариантах реализации векторы зкДНК, полученные способами и композициями, описанными в данном документе, не имеют ITR, содержащего любую последовательность, выбранную из SEQ ID NO: 500-529. [0020] Exemplary ITR sequences for use in cccDNA vectors produced by the methods and compositions described herein may be any one or more of Tables 2-10A and 10B, or SEQ ID NOs: 2, 52, 101-499 and 545-547, or partial ITR sequences shown in FIG. 26A-26B. In some embodiments, cccDNA vectors produced by the methods and compositions described herein do not have an ITR comprising any sequence selected from SEQ ID NOs: 500-529.
[0021] Согласно некоторым вариантам реализации зкДНК-вектор, полученный способами и композициями, описанными в данном документе, может содержать ITR с модификацией в ITR, соответствующей любой из модификаций в последовательностях ITR или частичных последовательностях ITR, представленных в любой одной или более из таблиц 2, 3, 4, 5, 6, 7, 8, 9, 10A и 10B данного документа. [0021] In some embodiments, a cccDNA vector produced by the methods and compositions described herein may contain an ITR with a modification in the ITR corresponding to any of the modifications in the ITR sequences or partial ITR sequences presented in any one or more of Tables 2 , 3, 4, 5, 6, 7, 8, 9, 10A and 10B of this document.
[0022] В качестве типичного примера в данном изобретении представлен ДНК-вектор с замкнутыми концами, полученный способами и композициями, описанными в данном документе, содержит промотор, функционально связанный с трансгеном, при этом зкДНК лишена капсидных белков и: (а) продуцируется из зкДНК-плазмиды (например, см. Примеры 1-2 и/или Фиг. 1A-B), которая кодирует мутированную правую сторону ITR AAV2, имеющую то же число внутримолекулярных дуплексных пар оснований, что и SEQ ID NO:2, или мутированную левую сторону ITR AAV2, имеющую такое же число внутримолекулярных дуплексных пар оснований, что и SEQ ID NO:51 в конфигурации вторичной шпильки (предпочтительно, за исключением делеции любой AAA- или TTT-концевой петли в этой конфигурации по сравнению с такими референсными последовательностями), и (b) идентифицируется как зкДНК с использованием анализа для идентификации зкДНК методом электрофореза в агарозном геле, в нативном геле и денатурирующих условиях, указанных в Примере 1. Примеры таких модифицированных последовательностей ITR представлены в Таблицах 2, 3, 4, 5, 6, 7, 8, 9, 10A и 10B данного документа. [0022] As a typical example, this invention provides a closed-end DNA vector prepared by the methods and compositions described herein, contains a promoter operably linked to a transgene, wherein the cccDNA is devoid of capsid proteins and: (a) is produced from the cccDNA -plasmid (e.g., see Examples 1-2 and/or Fig. 1A-B) that encodes a mutated right side of the AAV2 ITR having the same number of intramolecular duplex base pairs as SEQ ID NO:2, or a mutated left side An AAV2 ITR having the same number of intramolecular duplex base pairs as SEQ ID NO:51 in a secondary hairpin configuration (preferably excluding deletion of any AAA or TTT terminal loop in this configuration compared to such reference sequences), and ( b) identified as cccDNA using the cccDNA identification assay by agarose gel electrophoresis, native gel and denaturing conditions specified in Example 1. Examples of such modified ITR sequences are presented in Tables 2, 3, 4, 5, 6, 7, 8 , 9, 10A and 10B of this document.
[0023] Технология, описанная в данном документе, также относится к получению зкДНК-вектору, который может быть использован для доставки и кодирования одного или более трансгенов в целевой клетке, например, если указанный зкДНК-вектор содержит мультицистронную последовательность, или если указанный трансген и его природный геномный контекст (например, трансген, интроны и эндогенные нетранслируемые участки) вместе включены в указанный зкДНК-вектор. Указанные трансгены могут представлять собой кодирующие белок транскрипты, некодирующие транскрипты, или и то, и другое. Указанный зкДНК-вектор, полученный способами и композициями, описанными в данном документе, может содержать несколько кодирующих последовательностей и неканонический сайт инициации трансляции или более одного промотора для экспрессии кодирующих белок транскриптов, некодирующих транскриптов или обоих. Указанный трансген может содержать последовательность, кодирующую более одного белка, или может представлять собой последовательность некодирующего транскрипта. Указанная экспрессионная кассета может содержать, например, более 4000 нуклеотидов, 5000 нуклеотидов, 10000 нуклеотидов или 20000 нуклеотидов, или 30000 нуклеотидов, или 40000 нуклеотидов, или 50000 нуклеотидов, или любой диапазон значений в пределах между примерно 4000-10000 нуклеотидов или 10000-50000 нуклеотидов, или более 50000 нуклеотидов. Указанные зкДНК-векторы, полученные способами и композициями, описанными в данном документе, не имеют ограничений по размеру, характерных для заключенных в капсиды AAV-векторов, что позволяет доставлять экспрессионную кассету значительного размера для обеспечения эффективной экспрессии трансгенов. В некоторых вариантах реализации вектор зкДНК, полученный способами и композициями, описанными в данном документе, лишен прокариот-специфичного метилирования. [0023] The technology described herein also relates to the production of a cccDNA vector that can be used to deliver and encode one or more transgenes in a target cell, for example, if the ccDNA vector contains a multicistronic sequence, or if the transgene and its natural genomic context (eg, transgene, introns and endogenous untranslated regions) are included together in said cccDNA vector. These transgenes may be protein-coding transcripts, non-coding transcripts, or both. Said cccDNA vector produced by the methods and compositions described herein may contain multiple coding sequences and a non-canonical translation initiation site or more than one promoter for the expression of protein-coding transcripts, non-coding transcripts, or both. The transgene may contain a sequence encoding more than one protein, or may be a non-coding transcript sequence. The indicated expression cassette may contain, for example, more than 4000 nucleotides, 5000 nucleotides, 10,000 nucleotides or 20,000 nucleotides, or 30000 nucleotides, or 40,000 nucleotides, or 50,000 nucleotides, or any range of values between approximately 4000-10000 nucleotides or 10000-50000 nucleotides , or more than 50,000 nucleotides. These cccDNA vectors produced by the methods and compositions described herein do not have the size limitations of encapsided AAV vectors, allowing delivery of a significant size expression cassette to ensure efficient transgene expression. In some embodiments, the cccDNA vector produced by the methods and compositions described herein lacks prokaryote-specific methylation.
[0024] Кассета экспрессии вектора зкДНК, полученная способами и композициями, описанными в данном документе, также может содержать внутренний сайт входа в рибосому (IRES) и/или элемент 2А. Цис-регуляторные элементы включают, не ограничиваясь перечисленными, промотор, рибопереключатель, инсулятор, miR-регулируемый элемент, посттранскрипционный регуляторный элемент, тканеспецифический и клеточноспецифический промотор и энхансер. Согласно некоторым вариантам реализации указанный ITR может действовать в качестве промотора для трансгена. Согласно некоторым вариантам реализации указанный зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена. Например, дополнительный регуляторный компонент может представлять собой регуляторный переключатель согласно описанию в данном документе, в том числе, но не ограничиваясь указанным, «аварийный выключатель», который способен убивать инфицированную зкДНК клетку, при необходимости, и другие индуцируемые и/или репрессируемые элементы.[0024] The cccDNA vector expression cassette produced by the methods and compositions described herein may also contain an internal ribosome entry site (IRES) and/or a 2A element. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a miR-regulated element, a post-transcriptional regulatory element, a tissue-specific and cell-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter for a transgene. In some embodiments, the cccDNA vector contains additional components for regulating transgene expression. For example, the additional regulatory component may be a regulatory switch as described herein, including, but not limited to, a “kill switch” that is capable of killing a cccDNA-infected cell, if necessary, and other inducible and/or repressible elements.
[0025] Описанная здесь технология дополнительно обеспечивает новые способы эффективного получения вектора зкДНК или другого вектора AAV, который может избирательно экспрессировать один или несколько трансгенов. ЗкДНК-вектор, полученный способами и композициями, описанными в данном документе, может поглощаться клетками-хозяевами, а также транспортироваться в ядро в отсутствие капсида AAV. Кроме того, зкДНК-векторы, полученные способами и композициями, описанными в данном документе, не имеют капсида и, соответственно, избегают иммунного ответа, который может возникать в ответ на капсид-содержащие векторы.[0025] The technology described herein further provides new methods for efficiently producing a cccDNA vector or other AAV vector that can selectively express one or more transgenes. The cccDNA vector produced by the methods and compositions described herein can be taken up by host cells as well as transported into the nucleus in the absence of the AAV capsid. In addition, cccDNA vectors produced by the methods and compositions described herein lack a capsid and, accordingly, avoid the immune response that may occur in response to capsid-containing vectors.
[0026] В одном варианте реализации свободный от капсида невирусный ДНК-вектор (зкДНК-вектор) получают из плазмиды (называемой здесь «зкДНК-плазмида»), содержащей матрицу конструкта для экспрессии полинуклеотидов, которая содержит в следующем порядке: первый 5'-инвертированный концевой повтор (например, AAV ITR); кассету экспрессии; и 3' ITR (например, AAV ITR), где по меньшей мере один из 5' и 3' ITR является модифицированным ITR, или когда оба 5' и 3' ITR являются модифицированными, причем они имеют модификации отличные друг от друга и не являются одной и той же последовательностью. В таком варианте реализации вектор зкДНК получают способом, который проиллюстрирован в примерах и показан на Фиг. 4A-4D, где для получения требуется только единственный белок Rep. [0026] In one embodiment, a capsid-free non-viral DNA vector (ccDNA vector) is derived from a plasmid (referred to herein as a “ccDNA plasmid”) containing a polynucleotide expression construct template that contains, in the following order: the first 5' inverted terminal repeat (eg AAV ITR); expression cassette; and 3' ITR (e.g., AAV ITR), where at least one of the 5' and 3' ITR is a modified ITR, or where both the 5' and 3' ITR are modified, and they have modifications different from each other and are not the same sequence. In such an embodiment, the cccDNA vector is prepared in a manner that is illustrated in the examples and shown in FIG. 4A-4D, where only a single Rep protein is required for production.
[0027] ЗкДНК-вектор, согласно описанию в данном документе, может быть получен несколькими способами, которые будут понятны обычному специалисту в данной области техники после прочтения данного документа. Например, полинуклеотидная матрица экспрессионного конструкта, используемая для генерирования зкДНК-векторов по данному изобретению, может представлять собой зкДНК-плазмиду (например, см. Таблицу 12 или Фиг. 10В), зкДНК-бакмиду и/или зкДНК-бакуловирус. В одном варианте реализации зкДНК-плазмида содержит сайт рестрикционного клонирования для возможной вставки (например, SEQ ID NO: 7), функционально расположенный между ITR, где может быть вставлена экспрессионная кассета, содержащая, например, промотор, функционально связанный с трансгеном, например, репортерным геном и/или терапевтическим геном. В некоторых вариантах реализации зкДНК-векторы получают из полинуклеотидной матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса), содержащей ITR, модифицированную по сравнению с соответствующей фланкирующей ITR AAV3 или последовательностью ITR AAV2 дикого типа, причем модификация представляет собой одно или несколько из делеции, вставки и/или замены. [0027] The cctDNA vector, as described herein, can be produced in several ways that will be apparent to one of ordinary skill in the art upon reading this document. For example, the expression construct polynucleotide template used to generate the ccDNA vectors of the present invention may be a ccDNA plasmid (eg, see Table 12 or FIG. 10B), a ccDNA bacmid, and/or a ccDNA baculovirus. In one embodiment, the cccDNA plasmid contains a restriction cloning site for possible insertion (e.g., SEQ ID NO: 7) operably located between the ITRs where an expression cassette can be inserted containing, for example, a promoter operably linked to a transgene, e.g., a reporter genome and/or therapeutic gene. In some embodiments, the cccDNA vectors are derived from a polynucleotide template (e.g., ccDNA plasmid, ccDNA bacmid, ccDNA baculovirus) containing an ITR modified from the corresponding flanking AAV3 ITR or wild-type AAV2 ITR sequence, wherein the modification is one or more than one of deletion, insertion and/or substitution.
[0028] Согласно некоторым аспектам раскрытие предлагает способ получения вектора зкДНК в клетке насекомого (например, клетках Sf9, Sf21, клетках Trichoplusia ni и клетках High Five) или клетках млекопитающих (например, HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты и зрелые и незрелые дендритные клетки); способ, включающий культивирование клетки насекомого или клетки млекопитающего, содержащей первую нуклеотидную последовательность, кодирующую единственный парвовирусный белок Rep, где в первой нуклеотидной последовательности отсутствует функциональный кодон инициации ниже первого кодона инициации и отсутствуют альтернативные сайты сплайсинга, предотвращающие пропуск экзона, что позволяет трансляцию только одного белка Rep (например, Rep78) без трансляции дополнительных белков Rep на более поздний кодон инициации (например,, любой один или несколько Rep52 или Rep40) или сплайсированный вариант полноразмерного (например, Rep68) в ячейку. [0028] In some aspects, the disclosure provides a method for producing a cccDNA vector in an insect cell (e.g., Sf9, Sf21 cells, Trichoplusia ni cells, and High Five cells) or mammalian cells (e.g., HEK293, Huh-7, HeLa, HepG2, HeplA, 911 , CHO, COS, MeWo, NIH3T3, A549, HT1080, monocytes and mature and immature dendritic cells); a method comprising culturing an insect cell or a mammalian cell containing a first nucleotide sequence encoding a single parvovirus Rep protein, wherein the first nucleotide sequence lacks a functional initiation codon downstream of the first initiation codon and lacks alternative splice sites that prevent exon skipping, allowing translation of only one protein Rep (eg, Rep78) without translation of additional Rep proteins to a later initiation codon (eg, any one or more Rep52 or Rep40) or a full-length splice variant (eg, Rep68) into the cell.
[0029] В соответствии с некоторыми другими аспектами в описании предложен способ получения вектора зкДНК в клетке насекомого (например, клетках Sf9, Sf21, Trichoplusia ni и клетках High Five) или клетках млекопитающих (например, HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты, а также зрелые и незрелые дендритные клетки); способ, включающий культивирование клетки насекомого или клетки млекопитающего, содержащей первую нуклеотидную последовательность, кодирующую однозначный парвовирусный белок Rep, при этом первая нуклеотидная последовательность лишена функционального инициирующего кодона, расположенного ниже первого инициирующего кодона, и содержит делецию на карбокси-конце срощенной последовательности (например, любая часть или полная длина c-концевого интрона/пропущенного экзона), тем самым обеспечивая трансляцию только сигнального белка Rep (например, Rep68) без трансляции дополнительных белков Rep в более позднем инициирующем кодоне (например, любой один или несколько из Rep52 или Rep40) или полноразмерный белок Rep72 в клетке. [0029] In accordance with certain other aspects, the disclosure provides a method for producing a cccDNA vector in an insect cell (e.g., Sf9, Sf21, Trichoplusia ni, and High Five cells) or mammalian cells (e.g., HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, monocytes, as well as mature and immature dendritic cells); a method comprising culturing an insect cell or mammalian cell containing a first nucleotide sequence encoding a single parvovirus Rep protein, wherein the first nucleotide sequence lacks a functional start codon located downstream of the first start codon and contains a deletion at the carboxy terminus of the splice sequence (e.g., any part or full length of the c-terminal intron/skipped exon), thereby allowing translation of only the Rep signal protein (e.g., Rep68) without translation of additional Rep proteins at a later start codon (e.g., any one or more of Rep52 or Rep40) or full-length Rep72 protein in the cell.
[0030] В соответствии с некоторыми другими аспектами в описании предложен способ получения вектора зкДНК в клетке насекомого (например, клетки Sf9, Sf21, Trichoplusia ni, клетки High Five) или клетке млекопитающего (например, HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты и зрелые и незрелые дендритные клетки); способ, включающий культивирование клетки насекомого или клетки млекопитающего, содержащей первую нуклеотидную последовательность, кодирующую один или два белка Rep (например, белок Rep 78 и/или Rep68), при этом в первой нуклеотидной последовательности отсутствует функциональный кодон инициации после первого кодона инициации и интактные альтернативные сайты сплайсинга, тем самым обеспечивая трансляцию только белка Rep78 и/или Rep68 без трансляции дополнительных белков Rep на более позднем инициирующем кодоне (например, любого одного или нескольких из Rep52 или Rep40).[0030] In accordance with certain other aspects, the disclosure provides a method of producing a cccDNA vector in an insect cell (e.g., Sf9, Sf21, Trichoplusia ni, High Five cells) or mammalian cell (e.g., HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, monocytes and mature and immature dendritic cells); a method comprising culturing an insect cell or a mammalian cell containing a first nucleotide sequence encoding one or two Rep proteins (e.g., Rep 78 and/or Rep68 protein), wherein the first nucleotide sequence lacks a functional initiation codon after the first initiation codon and intact alternative splice sites, thereby allowing translation of only Rep78 and/or Rep68 protein without translation of additional Rep proteins at a later start codon (eg, any one or more of Rep52 or Rep40).
[0031] Клетка, описанная в способах выше, может дополнительно содержать вторую нуклеотидную последовательность, содержащую по меньшей мере одну последовательность инвертированного концевого повтора (ITR) AAV, фланкирующую гетерологичную последовательность при условиях, что когда первая последовательность экспрессируется с получением Rep78 и/или Rep68, зкДНК продуцируется посредством белка Rep78 и/или Rep68 без присутствия Rep52 или Rep40. Затем вектор зкДНК может быть извлечен из клетки. Согласно некоторым вариантам реализации нуклеотидная последовательность, содержащая по меньшей мере один AAV, является частью экспрессионного конструкта. Согласно некоторым вариантам реализации гетерологичная последовательность включает терапевтическую нуклеиновую кислоту. Согласно некоторым вариантам реализации терапевтическая нуклеиновая кислота является частью экспрессионного конструкта. Согласно некоторым вариантам реализации клетка дополнительно содержит нуклеиновую кислоту, которая служит маркером. Согласно некоторым вариантам реализации нуклеиновая кислота, которая служит маркером, является частью экспрессионного конструкта. [0031] The cell described in the methods above may further comprise a second nucleotide sequence comprising at least one AAV inverted terminal repeat (ITR) sequence flanking a heterologous sequence under the conditions that when the first sequence is expressed to produce Rep78 and/or Rep68, cccDNA is produced by Rep78 and/or Rep68 protein without the presence of Rep52 or Rep40. The cccDNA vector can then be extracted from the cell. In some embodiments, the nucleotide sequence comprising at least one AAV is part of an expression construct. In some embodiments, the heterologous sequence includes a therapeutic nucleic acid. In some embodiments, the therapeutic nucleic acid is part of an expression construct. In some embodiments, the cell further comprises a nucleic acid that serves as a marker. In some embodiments, the nucleic acid that serves as a marker is part of an expression construct.
[0032] В пермиссивной клетке-хозяине, в присутствии, например, единственного белка Rep, полинуклеотидная матрица, содержащая по меньшей мере один модифицированный ITR, реплицируется, продуцируя зкДНК-векторы. Получение зкДНК-вектора проходит в два этапа: (i) вырезание («высвобождение») матрицы из остова матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловирусного генома и т.п.) посредством белков Rep; и (ii) опосредованной Rep репликации вырезанного зкДНК-вектора. Единственный Rep белок, необходимый для стадий (i) и (ii) эксцизии и репликации, может быть любым Rep-белком, описанным в данном документе. Белки Rep и сайты связывания Rep у различных серотипов AAV хорошо известны специалистам в данной области техники. [0032] In a permissive host cell, in the presence of, for example, a single Rep protein, a polynucleotide template containing at least one modified ITR is replicated to produce cccDNA vectors. Obtaining a cccDNA vector takes place in two stages: (i) excision (“release”) of the template from the template backbone (for example, ccDNA plasmid, ccDNA bacmid, ccDNA baculovirus genome, etc.) via Rep proteins; and (ii) Rep-mediated replication of the excised cccDNA vector. The single Rep protein required for steps (i) and (ii) of excision and replication may be any Rep protein described herein. Rep proteins and Rep binding sites in various AAV serotypes are well known to those skilled in the art.
[0033] Рядовой специалист в данной области техники понимает, что следует выбирать белок Rep из серотипа, который связывается с последовательностью нуклеиновой кислоты и реплицирует ее, на основе, по меньшей мере, одного функционального ITR. Например, если компетентный по репликации ITR относится к серотипу ААV2, соответствующий Rep будет принадлежать серотипу ААV, который работает с указанным серотипом, таким как ITR ААV2 с Rep ААV2 или ААV4, но не с Rep AAV5, который неспособен на это. После репликации (например, после стадии (ii)) зкДНК-вектор с ковалентно замкнутыми концами продолжает накапливаться в пермиссивных клетках, и зкДНК-вектор предпочтительно является достаточно стабильным во времени в присутствии белка Rep в стандартных условиях репликации, например, для накопления в количестве, составляющем по меньшей мере 1 пг/клетку, предпочтительно, по меньшей мере 2 пг/клетку, предпочтительно, по меньшей мере 3 пг/клетку, более предпочтительно, по меньшей мере 4 пг/клетку, еще более предпочтительно, по меньшей мере 5 пг/клетку. [0033] One of ordinary skill in the art will appreciate that a Rep protein should be selected from a serotype that binds to and replicates a nucleic acid sequence based on at least one functional ITR. For example, if a replication competent ITR is of serotype AAV2, the corresponding Rep will be of an AAV serotype that works with that serotype, such as the AAV2 ITR with Rep AAV2 or AAV4, but not with Rep AAV5, which is unable to do so. After replication (e.g., after step (ii)), the cccDNA vector with covalently closed ends continues to accumulate in permissive cells, and the ccDNA vector is preferably sufficiently stable over time in the presence of the Rep protein under standard replication conditions, for example, to accumulate in quantities at least 1 pg/cell, preferably at least 2 pg/cell, preferably at least 3 pg/cell, more preferably at least 4 pg/cell, even more preferably at least 5 pg/cell cell.
[0034] Соответственно, один аспект изобретения относится к способу, включающему следующие этапы: a) инкубация популяции клеток-хозяев (например, клеток насекомых), несущих указанный матричный полинуклеотидный экспрессионный конструкт (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), которая не содержит последовательностей, кодирующих вирусный капсид, в присутствии одного белка Rep в эффективных условиях и на протяжении времени, достаточного для индукции продуцирования зкДНК-вектора в клетках-хозяевах, причем указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбор и выделение указанного зкДНК-вектора из клеток-хозяев. Присутствие единственного белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR для продуцирования зкДНК-вектора в клетке-хозяине. Однако вирусные частицы (например, вирионы AAV) при этом не экспрессируются. Таким образом, отсутствуют ограничения по размеру, накладываемые вирионами. Предполагается, что если последовательность нуклеиновой кислоты, кодирующая белок Rep, кодирует большой белок Rep, например, белок Rep78 или Rep 68, то кодон инициации для меньших белков Rep модифицируется таким образом, что только большой белок Rep экспрессируется в клетка.[0034] Accordingly, one aspect of the invention relates to a method comprising the following steps: a) incubating a population of host cells (eg, insect cells) bearing said template polynucleotide expression construct (eg, ccDNA plasmid, ccDNA bacmid and/or ccDNA -baculovirus) that does not contain viral capsid coding sequences, in the presence of Rep protein alone, under effective conditions and for a period of time sufficient to induce production of the cDNA vector in host cells, wherein said host cells do not contain viral capsid coding sequences ; and b) collecting and isolating said cDNA vector from the host cells. The presence of a single Rep protein induces replication of the ITR-modified vector polynucleotide to produce a cccDNA vector in the host cell. However, viral particles (eg AAV virions) are not expressed. Thus, there are no size restrictions imposed by virions. It is proposed that if the nucleic acid sequence encoding the Rep protein encodes a large Rep protein, such as the Rep78 or Rep 68 protein, then the initiation codon for the smaller Rep proteins is modified such that only the large Rep protein is expressed in the cell.
[0035] Согласно некоторым аспектам в раскрытии представлена клетка насекомого (например, клетки Sf9, Sf21, Trichoplusia ni и клетки High Five) или клетка млекопитающего (например, HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты и зрелые и незрелые дендритные клетки); клетка насекомого или клеточная линия млекопитающего, содержащая первую нуклеотидную последовательность, кодирующую единственный парвовирусный белок Rep, где в первой нуклеотидной последовательности отсутствует функциональный кодон инициации ниже первого кодона инициации и отсутствуют альтернативные сайты сплайсинга, предотвращающие пропуск экзона, тем самым обеспечивая трансляцию только единственного белка Rep (например, Rep78) без трансляции дополнительных белков Rep на более поздний кодон инициации (например, любой один или несколько из Rep52 или Rep40) или сплайсированный вариант полноразмерного (например, Rep68) в камере. [0035] In some aspects, the disclosure provides an insect cell (e.g., Sf9, Sf21, Trichoplusia ni, and High Five cells) or a mammalian cell (e.g., HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, monocytes and mature and immature dendritic cells); an insect cell or mammalian cell line containing a first nucleotide sequence encoding a single parvovirus Rep protein, wherein the first nucleotide sequence lacks a functional initiation codon downstream of the first initiation codon and lacks alternative splice sites that prevent exon skipping, thereby allowing translation of only a single Rep protein ( e.g., Rep78) without translation of additional Rep proteins to a later initiation codon (e.g., any one or more of Rep52 or Rep40) or a full-length splice variant (e.g., Rep68) in the chamber.
[0036] Согласно некоторым другим аспектам в описании представлена клетка насекомого (например, клетки Sf9, Sf21, Trichoplusia ni и клетки High Five) или клетка млекопитающего (например, HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты и зрелые и незрелые дендритные клетки); клетка насекомого или клетка млекопитающего, содержащая первую нуклеотидную последовательность, кодирующую единственный парвовирусный белок Rep, где первая нуклеотидная последовательность не имеет функционального инициирующего кодона ниже первого инициирующего кодона и содержит делецию карбоксиконцевой сращенной последовательности (например, любой части или полноразмерный c-концевой интрон/пропущенный экзон), тем самым делая возможной трансляцию только сигнального белка Rep (например, Rep68) без трансляции дополнительных белков Rep на более поздний кодон инициации (например, любой из или более Rep52 или Rep40) или полноразмерный белок Rep72 в клетке. [0036] In certain other aspects, the disclosure provides an insect cell (e.g., Sf9, Sf21, Trichoplusia ni, and High Five cells) or a mammalian cell (e.g., HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS , MeWo, NIH3T3, A549, HT1080, monocytes and mature and immature dendritic cells); an insect cell or mammalian cell containing a first nucleotide sequence encoding a single parvovirus Rep protein, wherein the first nucleotide sequence does not have a functional start codon downstream of the first start codon and contains a deletion of a carboxy-terminal splice sequence (e.g., any portion or full-length c-terminal intron/skipped exon ), thereby allowing translation of only the Rep signal protein (e.g., Rep68) without translation of additional Rep proteins at a later initiation codon (e.g., any one or more Rep52 or Rep40) or full-length Rep72 protein in the cell.
[0037] Согласно некоторым другим аспектам в описании представлена клетка насекомого (например, Sf9, Sf21, клетки Trichoplusia ni, клетки High Five) или клетка млекопитающего (например, HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты и зрелые и незрелые дендритные клетки); клетка насекомого или клеточная линия млекопитающего, содержащая первую нуклеотидную последовательность, кодирующую один или два белка Rep (например, белок Rep78 и/или Rep68), где в первой нуклеотидной последовательности отсутствует функциональный кодон инициации ниже первого кодона инициации и интактные альтернативные сайты сплайсинга, тем самым обеспечивая трансляцию только белка Rep78 и/или Rep68, без трансляции дополнительных белков Rep на более поздний кодон инициации (например, любой один или несколько из Rep52 или Rep40)[0037] In certain other aspects, the disclosure provides an insect cell (e.g., Sf9, Sf21, Trichoplusia ni cells, High Five cells) or a mammalian cell (e.g., HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS , MeWo, NIH3T3, A549, HT1080, monocytes and mature and immature dendritic cells); an insect cell or mammalian cell line comprising a first nucleotide sequence encoding one or two Rep proteins (e.g., Rep78 and/or Rep68 protein), wherein the first nucleotide sequence lacks a functional initiation codon downstream of the first initiation codon and intact alternative splice sites, thereby allowing translation of only Rep78 and/or Rep68 protein, without translation of additional Rep proteins at a later initiation codon (e.g., any one or more of Rep52 or Rep40)
[0038] Описанная выше клетка может дополнительно содержать вторую нуклеотидную последовательность, содержащую по меньшей мере одну последовательность инвертированного концевого повтора (ITR) AAV, фланкирующую гетерологичную последовательность при условиях, что, когда первая последовательность экспрессируется для продуцирования Rep78 и/или Rep68, зкДНК продуцируется посредством белка Rep78 и/или Rep68 без присутствия Rep52 или Rep40. Затем вектор зкДНК может быть извлечен из клетки. Согласно некоторым вариантам реализации нуклеотидная последовательность, содержащая по меньшей мере один AAV, является частью экспрессионного конструкта. Согласно некоторым вариантам реализации гетерологичная последовательность включает терапевтическую нуклеиновую кислоту. Согласно некоторым вариантам реализации терапевтическая нуклеиновая кислота является частью экспрессионного конструкта. Согласно некоторым вариантам реализации клетка дополнительно содержит нуклеиновую кислоту, которая служит маркером. Согласно некоторым вариантам реализации нуклеиновая кислота, которая служит маркером, является частью экспрессионного конструкта. [0038] The cell described above may further comprise a second nucleotide sequence comprising at least one AAV inverted terminal repeat (ITR) sequence flanking the heterologous sequence under the conditions that when the first sequence is expressed to produce Rep78 and/or Rep68, cccDNA is produced by Rep78 and/or Rep68 proteins without the presence of Rep52 or Rep40. The cccDNA vector can then be extracted from the cell. In some embodiments, the nucleotide sequence comprising at least one AAV is part of an expression construct. In some embodiments, the heterologous sequence includes a therapeutic nucleic acid. In some embodiments, the therapeutic nucleic acid is part of an expression construct. In some embodiments, the cell further comprises a nucleic acid that serves as a marker. In some embodiments, the nucleic acid that serves as a marker is part of an expression construct.
[0039] Согласно некоторым аспектам в описании представлена бесклеточная система, содержащая первую нуклеотидную последовательность, кодирующую один парвовирусный белок Rep, где в нуклеотидной последовательности отсутствует функциональный кодон инициации ниже первого кодона инициации и/или отсутствуют альтернативные сайты сплайсинга, предотвращающие пропуск экзона, тем самым обеспечивая трансляцию только единственного парвовирусного белка Rep (например, белка Rep78 или Rep 68) без трансляции дополнительных белков Rep на более поздний кодон инициации (например, любой один или несколько Rep52 или Rep 40) в бесклеточной системе. Согласно некоторым вариантам реализации нуклеиновая кислота, кодирующая Rep78, также не продуцирует белок Rep52 или Rep40. Согласно некоторым вариантам реализации нуклеиновая кислота, кодирующая Rep68, не продуцирует белок Rep52 или Rep40. Согласно некоторым вариантам реализации клетка насекомого, клетка млекопитающего или бесклеточная система не экспрессируют какой-либо другой белок Rep. [0039] In some aspects, the disclosure provides a cell-free system comprising a first nucleotide sequence encoding a single parvovirus Rep protein, wherein the nucleotide sequence lacks a functional initiation codon downstream of the first initiation codon and/or lacks alternative splice sites that prevent exon skipping, thereby providing translation of only a single parvovirus Rep protein (eg, Rep78 or Rep 68 protein) without translation of additional Rep proteins at a later initiation codon (eg, any one or more Rep52 or Rep 40) in a cell-free system. In some embodiments, the nucleic acid encoding Rep78 also does not produce Rep52 or Rep40 protein. In some embodiments, the nucleic acid encoding Rep68 does not produce Rep52 or Rep40 protein. In some embodiments, the insect cell, mammalian cell, or cell-free system does not express any other Rep protein.
[0040] ЗкДНК-вектор, полученный способами описанными в данном документе, используя единственный Rep белок, выделяется из клеток-хозяев, а его присутствие может быть подтверждено путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим единственный сайт распознавания на зкДНК-векторе, и анализа расщепленного материала ДНК на денатурирующем и неденатурирующем гелях для подтверждения присутствия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК. [0040] An cccDNA vector prepared by the methods described herein using a single Rep protein is isolated from host cells, and its presence can be confirmed by digestion of DNA isolated from the host cell with a restriction enzyme having a single recognition site on the ccDNA -vector, and analysis of the digested DNA material on denaturing and non-denaturing gels to confirm the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
[0041] Фиг. 1А иллюстрирует типичную структуру вектора зкДНК, полученного с использованием одного белка Rep в соответствии со способами и композициями, описанными в данном документе. Согласно указанному варианту реализации указанный пример зкДНК-вектора содержит экспрессионную кассету, содержащую промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген люциферазы, вставляется в сайт клонирования (R3/R4) между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) ITR ААV2 дикого типа перед (на 5'-конце) и модифицированным ITR после (на 3'-конце) экспрессионной кассеты, таким образом, два ITR, фланкирующие экспрессионную кассету, являются асимметричными относительно друг друга. Рядовой специалист в данной области техники поймет, что можно использовать любой ITR. В иллюстративных целях, ITR в конструктах зкДНК на этой Фигуре и в Примерах этого документа представляют собой модифицированный ITR и ITR WT. Однако, данный документ охватывает зкДНК-векторы, содержащие последовательность гетерологичной нуклеиновой кислоты, расположенные между двумя последовательностями инвертированных концевых повторов (ITR), причем последовательности ITR могут быть асимметричной парой ITR или симметричной или по существу симметричной парой ITR, как эти термины определены в данном документе. ЗкДНК вектор, раскрытый в данном документе, может содержать последовательности ITR выбранные из любых из: (i) по меньшей мере, одного ITR дикого типа и по меньшей мере одного модифицированного инвертированного концевого повтора ААV (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию относительно друг друга (например, асимметричных модифицированных ITR), или (iii) пары симметричных или по существу симметричных ITR WT-WT, причем каждый из ITR-WT имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый из mod-ITR имеет одинаковую трехмерную пространственную организацию. В некоторых вариантах реализации способы данного раскрытия включают использование единственного белка rep для получения вектора зкДНК, который составлен в композицию, которая включает систему доставки, такую как, но не ограничиваясь этим, липосомная система доставки наночастиц.[0041] FIG. 1A illustrates a typical structure of a cccDNA vector produced using a single Rep protein in accordance with the methods and compositions described herein. According to the specified embodiment, the specified example cccDNA vector contains an expression cassette containing a CAG promoter, WPRE and BGHpA. The open reading frame (ORF) encoding the luciferase transgene is inserted into the cloning site (R3/R4) between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) of the wild-type AAV2 ITR upstream (at the 5' end) and a modified ITR downstream (at the 3' end) of the expression cassette, thus the two ITRs flanking the expression cassette are asymmetrical relative to each other. friend. One of ordinary skill in the art will appreciate that any ITR can be used. For illustrative purposes, the ITRs in the cccDNA constructs in this Figure and in the Examples of this document are the modified ITR and the WT ITR. However, this document covers cccDNA vectors containing a heterologous nucleic acid sequence located between two inverted terminal repeat (ITR) sequences, wherein the ITR sequences may be an asymmetric ITR pair or a symmetric or substantially symmetric ITR pair, as those terms are defined herein . The cccDNA vector disclosed herein may contain ITR sequences selected from any of: (i) at least one wild-type ITR and at least one modified AAV inverted terminal repeat (mod-ITR) (e.g., asymmetric modified ITRs) ; (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization relative to each other (e.g., asymmetric modified ITRs), or (iii) a symmetric or substantially symmetric WT-WT ITR pair, each of the ITR-WTs having the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each of the mod-ITRs having the same three-dimensional spatial organization. In some embodiments, the methods of this disclosure include using a single rep protein to produce a cccDNA vector that is formulated into a composition that includes a delivery system, such as, but not limited to, a liposomal nanoparticle delivery system.
[0042] Фиг. 1B иллюстрирует типичную структуру вектора зкДНК, полученного с использованием единственного белка Rep в соответствии со способами и композициями, описанными в данном документе, где вектор зкДНК включает кассету экспрессии, содержащую промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген люциферазы, вставляется в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) модифицированным ITR перед (на 5'-конце) и ITR дикого типа после (на 3'-конце) экспрессионной кассеты. Как показано на Фиг. 1A, квалифицированный специалист может легко выбрать последовательности ITR, которые будут асимметричной парой ITR или симметричной или по существу симметричной парой ITR, как эти термины определены в данном документе.[0042] FIG. 1B illustrates a typical structure of a cccDNA vector produced using a single Rep protein in accordance with the methods and compositions described herein, wherein the ccDNA vector includes an expression cassette containing a CAG promoter, WPRE and BGHpA. An open reading frame (ORF) encoding the luciferase transgene is inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs), a modified ITR upstream (at the 5' end) and a wild-type ITR downstream (at the 3' end) of the expression cassette. As shown in FIG. 1A, one of skill in the art can readily select ITR sequences that will be an asymmetric ITR pair or a symmetric or substantially symmetric ITR pair, as those terms are defined herein.
[0043] Фиг. 1C иллюстрирует типичную структуру вектора зкДНК, полученного с использованием единственного белка Rep в соответствии со способами и композициями, описанными в данном документе, где вектор зкДНК включает кассету экспрессии, содержащую энхансер/промотор, открытую рамку считывания (ORF) для вставки трансгена, посттранскрипционный элемент (WPRE) и сигнал полиА. Открытая рамка считывания (ORF) позволяет вставить трансген в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR), которые являются асимметричными относительно друг друга - модифицированным ITR слева от (на 5'-конце) и модифицированным ITR справа от (на 3'-конце) экспрессионной кассеты, причем 5'-ITR и 3'-ITR оба являются модифицированными ITR, но имеют разные модификации (т.е. они имеют неодинаковые модификации). Как показано на Фиг. 1A, квалифицированный специалист может легко выбрать последовательности ITR, которые будут асимметричной парой ITR или симметричной или по существу симметричной парой ITR, как эти термины определены в данном документе.[0043] FIG. 1C illustrates a typical structure of a cccDNA vector produced using a single Rep protein in accordance with the methods and compositions described herein, wherein the ccDNA vector includes an expression cassette containing an enhancer/promoter, an open reading frame (ORF) for transgene insertion, a post-transcriptional element ( WPRE) and polyA signal. The open reading frame (ORF) allows insertion of the transgene into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs), which are asymmetrical relative to each other - a modified ITR to the left of (at the 5' end) and a modified ITR to the right of (at the 3' end) the expression cassette, with the 5' ITR and The 3'-ITRs are both modified ITRs, but have different modifications (ie they do not have the same modifications). As shown in FIG. 1A, one of skill in the art can readily select ITR sequences that will be an asymmetric ITR pair or a symmetric or substantially symmetric ITR pair, as those terms are defined herein.
[0044] На Фиг. 2А представлена Т-образная структура стебель-петля левого ITR дикого типа AAV2 (SEQ ID NO: 538) с обозначенными A-A'-плечом, B-B'-плечом, C-C'-плечом, двумя сайтами связывания Rep (RBE и RBE'), а также с указанным сайтом концевого разрешения (trs). RBE содержит ряд из 4 дуплексных тетрамеров, предположительно, взаимодействующих с Rep 78 либо с Rep 68. Кроме того, RBE' также предположительно взаимодействует с комплексом Rep, собранным на ITR дикого типа или мутированном ITR в указанного конструкта. Участки D и D' содержат сайты связывания транскрипционных факторов и другие консервативные структуры. Фиг. 2B демонстрирует предполагаемую катализируемую Rep никующую и лигирующую активности левого ITR дикого типа (SEQ ID NO: 539), включая Т-образную структуру стебель-петля левого ITR дикого типа AAV2 с обозначенными A-A'-плечом, B-B'-плечом, C-C'-плечом, двумя сайтами связывания Rep (RBE и RBE'), а также с указанным сайтом концевого разрешения (TRS), и участок D и D', содержащий несколько сайтов связывания транскрипционных факторов и другую консервативную структуру. [0044] In FIG. 2A shows the T-shaped stem-loop structure of the left ITR wild type AAV2 (SEQ ID NO: 538) with the A-A' arm, B-B' arm, C-C' arm, two Rep binding sites (RBE) indicated and RBE'), as well as with the specified terminal resolution site (trs). RBE contains a series of 4 duplex tetramers believed to interact with either Rep 78 or Rep 68. In addition, RBE' is also believed to interact with the Rep complex assembled on a wild-type ITR or a mutated ITR of the construct. Regions D and D' contain transcription factor binding sites and other conserved structures. Fig. 2B shows the putative Rep-catalyzed nicking and ligation activities of the left-handed wild-type ITR (SEQ ID NO: 539), including the T-shaped stem-loop structure of the left-handed wild-type ITR of AAV2 labeled A-A' arm, B-B' arm, a C-C' arm, two Rep binding sites (RBE and RBE'), as well as a terminal resolution site (TRS), and a D and D' region containing several transcription factor binding sites and other conserved structure.
[0045] На Фиг. 3А представлена первичная структура (полинуклеотидная последовательность) (слева) и вторичная структура (справа) RBE-содержащих частей A-A'-плеча, и C-C'- и B-B'-плеча левого ITR AAV2 дикого типа (SEQ ID NO: 540). Фиг. 3B демонстрирует типичный пример последовательности мутированного ITR (также называемого модифицированным ITR) для левого ITR. Представлена первичная структура (слева) и предсказанная вторичная структура (справа) RBE-участка A-A'-плеча, C-плечо и B-B'-плечо типичного мутированного левого ITR (ITR-1, левый) (SEQ ID NO: 113). Фиг. 3C демонстрирует первичную структуру (слева) и вторичную структуру (справа) RBE-содержащей части петли A-A' и B-B' и C-C' плеч правого ITR AAV2 дикого типа (SEQ ID NO: 541). Фиг. 3D демонстрирует типичный пример правого модифицированного ITR. Представлены первичная структура (слева) и прогнозируемая вторичная структура (справа) RBE-содержащей части A-A' плеча, B-B' и C плеч типичного примера мутантного правого ITR (ITR-1, правый) (SEQ ID NO: 114). Может быть использована любая комбинация левого и правого ITR (например, AAV2 ITR или другого вирусного серотипа или синтетические ITR) при условии, что левый ITR асимметричен или отличается от правого ITR. Каждая из полинуклеотидных последовательностей на Фиг. 3А-3D относится к последовательностям, используемым в плазмиде или бакмиде/бакуловирусном геноме, применяемых для продуцирования зкДНК, как описано в данном документе. Также каждая из Фиг. 3A-3D включает соответствующие предполагаемые вторичные структуры зкДНК, полученные на основании конфигураций зкДНК-вектора в плазмиде или бакмиде/бакуловирусном геноме и предсказанных значений свободной энергии Гиббса.[0045] In FIG. 3A shows the primary structure (polynucleotide sequence) (left) and secondary structure (right) of the RBE-containing portions of the A-A' arm, and the C-C' and B-B' arms of the left ITR of wild-type AAV2 (SEQ ID NO : 540). Fig. 3B shows a typical example of a mutated ITR (also called modified ITR) sequence for the left ITR. Shown is the primary structure (left) and predicted secondary structure (right) of the RBE region of the A-A' arm, C arm, and B-B' arm of a typical mutated left ITR (ITR-1, left) (SEQ ID NO: 113 ). Fig. 3C shows the primary structure (left) and secondary structure (right) of the RBE-containing portion of the A-A' loop and the B-B' and C-C' arms of the right ITR of wild-type AAV2 (SEQ ID NO: 541). Fig. 3D shows a typical example of a right modified ITR. Shown are the primary structure (left) and predicted secondary structure (right) of the RBE-containing portion of the A-A' arm, B-B' and C arms of a representative example of a mutant right ITR (ITR-1, right) (SEQ ID NO: 114). Any combination of left and right ITRs (eg, AAV2 ITR or other viral serotype or synthetic ITRs) can be used, provided that the left ITR is asymmetric or different from the right ITR. Each of the polynucleotide sequences in FIG. 3A-3D refer to sequences used in the plasmid or bacmid/baculovirus genome used to produce cccDNA as described herein. Also each of FIGS. 3A-3D include corresponding predicted cccDNA secondary structures derived from the configurations of the cccDNA vector in the plasmid or bacmid/baculovirus genome and predicted Gibbs free energy values.
[0046] На Фиг. 4A приведено схематическое изображение предшествующего процесса получения инфицированных бакуловирусом клеток насекомых (BIIC), которые подходят для получения зкДНК способом, схематически представленным на Фиг. 4B. В этих вариантах реализации две бакмиды генерируются путем транспонирования плазмиды зкДНК или Rep-плазмиды (кодирующей единственный белок Rep) в вектор экспрессии бакуловируса для создания бакмиды вектора зкДНК (т.е. Бакмиды-1) и одной бакмиды Rep (Rep-Бакмиды), которые используются для трансфекции клеток насекомых с получением клеток насекомых с введенным бакуловирусом, BIIC-1 и BICC-2 (единственный Rep), соответственно. Фиг. 4B представляет собой схему типичного способа получения зкДНК с использованием клеток насекомых (например, BICC-2), содержащих Rep-Бакмиду, содержащую последовательность нуклеиновой кислоты для единственного белка Rep, а Фиг. 4С иллюстрирует биохимический метод и процесс подтверждения продукции вектора зкДНК с использованием описанной здесь методологии единственного Rep-белка. На Фиг. 4D и Фиг. 4Е представлены схематические изображения, описывающие процесс идентификации присутствия зкДНК в ДНК, собранной из клеточных осадков, полученных в процессе продуцирования зкДНК в соответствии с Фиг. 4В. Фиг. 4E демонстрирует ДНК, имеющую прерывистую структуру. ЗкДНК может быть разрезана рестрикционной эндонуклеазой, имеющей один сайт распознавания на зкДНК-векторе, с образованием двух фрагментов ДНК разного размера (1 т.п.о. и 2 т.п.о.) как в нейтральных, так и в денатурирующих условиях. На Фиг. 4E также продемонстрирована зкДНК, имеющая линейную и непрерывную структуру. Указанный зкДНК-вектор может быть разрезан рестрикционной эндонуклеазой с образованием двух фрагментов ДНК, которые мигрируют в виде фрагментов размером 1 т.п.о. и 2 т.п.о. в нейтральных условиях, однако в денатурирующих условиях указанные цепи остаются соединенными и образуют одиночные цепи, которые мигрируют в виде фрагментов размером 2 т.п.о. и 4 т.п.о. На Фиг. 4D схематически представлены ожидаемые полосы для типичной зкДНК, нерасщепленной или расщепленной рестрикционной эндонуклеазой, а затем подвергнутой электрофорезу либо на нативном, либо на денатурирующем геле. На крайней схеме слева показан нативный гель и несколько полос, указывающих на то, что в дуплексной и неразрезанной форме зкДНК существует по меньшей мере в мономерном и димерном состояниях, которые проявляются в виде быстрее мигрирующего мономера меньшего размера и медленнее мигрирующего димера с размером, в 2 раза большим, чем у мономера. Второе слева схематическое изображение демонстрирует, что при разрезании зкДНК рестрикционной эндонуклеазой, исходные полосы исчезают, а появляются полосы мигрирующие быстрее (например, меньшего размера), которые соответствуют ожидаемым размерам фрагментов, остающихся после расщепления. В денатурирующих условиях исходная дуплексная ДНК является одноцепочечной и мигрирует в виде объекта вдвое большего размера по сравнению с наблюдаемым на нативном геле, поскольку комплементарные цепи ковалентно связаны. Соответственно, на второй справа схеме расщепленная зкДНК демонстрирует распределение полос, аналогичное наблюдаемому на нативном геле, однако указанные полосы мигрируют как фрагменты, размер которых в два раза больше их эквивалентов на нативном геле. Крайняя справа схема демонстрирует, что неразрезанная зкДНК в денатурирующих условиях мигрирует в виде одноцепочечного раскрытого кольца, и, соответственно, наблюдаемые полосы имеют в два раза больший размер, чем наблюдаемые в нативных условиях, когда кольцо не раскрыто. На указанной фигуре «т.п.о.» используется для указания относительного размера нуклеотидных молекул, основанного, в зависимости от контекста, либо на длине нуклеотидной цепи (например, для одноцепочечных молекул, наблюдаемых в денатурирующих условиях), либо на числе пар оснований (например, для двуцепочечных молекул, наблюдаемых в нативных условиях). [0046] In FIG. 4A is a schematic representation of a prior process for producing baculovirus-infected insect cells (BIICs) that are suitable for producing cccDNA by the method schematically illustrated in FIG. 4B. In these embodiments, two bacmids are generated by transposing a cccDNA plasmid or a Rep plasmid (encoding a single Rep protein) into a baculovirus expression vector to create a cccDNA vector bacmid (i.e., Bacmid-1) and one Rep bacmid (Rep-Bacmids), which are used to transfect insect cells to produce baculovirus-injected insect cells, BIIC-1 and BICC-2 (single Rep), respectively. Fig. 4B is a diagram of an exemplary method for producing cccDNA using insect cells (eg, BICC-2) containing a Rep-Bacmid containing the nucleic acid sequence for a single Rep protein, and FIG. 4C illustrates the biochemical method and process for confirming the production of a cccDNA vector using the single Rep protein methodology described herein. In FIG. 4D and Fig. 4E is a schematic diagram describing the process of identifying the presence of cccDNA in DNA collected from cell pellets obtained during the ccDNA production process of FIG. 4B. Fig. 4E shows DNA having a discontinuous structure. CCDNA can be cut by a restriction endonuclease that has a single recognition site on the CCDNA vector to produce two DNA fragments of different sizes (1 kb and 2 kb) under both neutral and denaturing conditions. In FIG. 4E also shows cccDNA having a linear and continuous structure. The cccDNA vector can be cut with a restriction endonuclease to produce two DNA fragments that migrate as 1 kb fragments. and 2 kb. under neutral conditions, but under denaturing conditions these chains remain connected and form single chains that migrate as 2 kb fragments. and 4 kb. In FIG. 4D is a schematic representation of the expected bands for typical cccDNA undigested or restriction endonuclease digested and then electrophoresed on either a native or denaturing gel. The diagram on the far left shows a native gel and several bands indicating that, in duplex and uncut form, cccDNA exists in at least monomeric and dimeric states, which appear as a smaller faster-migrating monomer and a slower-migrating dimer with a size of 2 times greater than that of the monomer. The second schematic from the left shows that when cccDNA is cut with a restriction endonuclease, the original bands disappear and faster-migrating bands (e.g., smaller) appear, which correspond to the expected sizes of fragments remaining after cleavage. Under denaturing conditions, the original duplex DNA is single-stranded and migrates as an object twice the size of that observed on the native gel because the complementary strands are covalently linked. Accordingly, in the second diagram from the right, digested ccDNA exhibits a band distribution similar to that observed on the native gel, however, these bands migrate as fragments that are twice the size of their equivalents on the native gel. The diagram on the far right shows that uncut cccDNA under denaturing conditions migrates as a single-stranded open ring and, accordingly, the bands observed are twice as large as those observed under native conditions when the ring is not open. In the indicated figure, “t.p.o.” used to indicate the relative size of nucleotide molecules, based, depending on the context, on either the length of the nucleotide chain (for example, for single-stranded molecules observed under denaturing conditions) or the number of base pairs (for example, for double-stranded molecules observed under native conditions) .
[0047] Фиг. 5 демонстрирует иллюстративное изображение прогона в денатурирующем геле примеров зкДНК-векторов с (+) или без (-) расщепления эндонуклеазами (EcoRI для зкДНК-конструктов 1 и 2; BamH1 для зкДНК-конструктов 3 и 4; SpeI для зкДНК-конструктов 5 и 6; и XhoI для зкДНК-конструктов 7 и 8). Размеры для полос, помеченных звездочкой, определены и приведены в нижней части чертежа. [0047] FIG. 5 shows an exemplary denaturing gel run of example cccDNA vectors with (+) or without (-) endonuclease digestion (EcoRI for cccDNA constructs 1 and 2; BamH1 for cccDNA constructs 3 and 4; SpeI for cccDNA constructs 5 and 6 ; and XhoI for cDNA constructs 7 and 8). The dimensions for stripes marked with an asterisk are defined and shown at the bottom of the drawing.
[0048] На Фиг. 6A показаны результаты анализа экспрессии белка in vitro, измеряющего активность люциферазы (ось y, RQ (Luc)) в клетках HEK293 через 48 часов после трансфекции 400 нг (черный), 200 нг (серый) или 100 нг (белый) конструктом, идентифицированным на оси абсцисс (конструкт-1, конструкт-3, конструкт-5, конструкт-7 (Таблица 12). На Фиг. 6B показана активность люциферазы (ось y, RQ (Luc)), измеренная в клетках HEK293 через 48 часов после трансфекции 400 нг (черный), 200 нг (серый) или 100 нг (белый) конструктами, идентифицированными на оси x (конструкт-2, конструкт-4, конструкт-6, конструкт-8) (Таблица 12). Также представлены активности люциферазы, измеренные в клетках HEK293, обработанных Fugene без каких-либо плазмид («Fugene»), или в необработанных клетках HEK293 («Необработанные»). [0048] In FIG. 6A shows the results of an in vitro protein expression assay measuring luciferase activity (y-axis, RQ (Luc)) in HEK293 cells 48 hours after transfection with 400 ng (black), 200 ng (gray), or 100 ng (white) of the construct identified in x-axis (construct-1, construct-3, construct-5, construct-7 (Table 12). Figure 6B shows luciferase activity (y-axis, RQ (Luc)) measured in HEK293 cells 48 hours after transfection of 400 ng (black), 200 ng (gray) or 100 ng (white) constructs identified on the x-axis (construct-2, construct-4, construct-6, construct-8) (Table 12) Also presented are the luciferase activities measured in HEK293 cells treated with Fugene without any plasmids (“Fugene”), or in untreated HEK293 cells (“Untreated”).
[0049] Фиг. 7A показывает жизнеспособность клеток HEK293 (ось y) через 48 часов после трансфекции 400 нг (черный), 200 нг (серый) или 100 нг (белый) конструктами, идентифицированными на оси x (конструкт-1, конструкт-3, конструкт-5, конструкт-7). Фиг. 7B показывает жизнеспособность клеток HEK293 (ось y) через 48 часов после трансфекции 400 нг (черный), 200 нг (серый) или 100 нг (белый) конструктами, идентифицированной на оси x (конструкт-2, конструкт-4, конструкт-6, конструкт-8). [0049] FIG. 7A shows the viability of HEK293 cells (y-axis) 48 hours after transfection with 400 ng (black), 200 ng (gray), or 100 ng (white) constructs identified on the x-axis (construct-1, construct-3, construct-5, construct-7). Fig. 7B shows HEK293 cell viability (y-axis) 48 hours after transfection with 400 ng (black), 200 ng (gray), or 100 ng (white) constructs identified on the x-axis (construct-2, construct-4, construct-6, construct-8).
[0050] Фиг. 8A представляет собой типичную Rep-бакмиду в плазмиде pFBDLSR, содержащей последовательности нуклеиновых кислот для модифицированного белка Rep78, где модифицированный белок Rep 78 представляет собой модификацию аминокислотного остатка 225 (Met) SEQ ID NO: 530, причем аминокислотный остаток 225 заменен на глицин (Gly) (например, M225G или Met225Gly) или треонин (Thr) (например, M225T или Met225Thr). Эта иллюстративная Rep-бакмида содержит: фрагмент промотора IE1 (SEQ ID NO: 66); нуклеотидную последовательность Rep78, кодирующую модифицированный белок Rep78, в котором отсутствует функциональный инициирующий кодон ниже первого инициирующего кодона, тем самым обеспечивая трансляцию одного белка Rep78. Как будет понятно специалисту в данной области, можно модифицировать эту модифицированную бакмиду Rep78 или модифицированную плазмиду Rep78 нуклеиновой кислотой, кодирующей любой единственный белок Rep (например, Rep68, Rep52, Rep40), которая была модифицирована так, чтобы иметь единственный инициирующий кодон и поэтому кодирует единственный белок Rep. На Фиг. 8B приведено схематическое изображение примера зкДНК-плазмиды-1, с wt-L ITR (левым ITR дикого типа), промотором CAG, трансгеном люциферазы, WPRE и последовательностью полиаденилирования; и mod-R (модифицированным правым) ITR. [0050] FIG. 8A is a representative Rep bacmid in plasmid pFBDLSR containing nucleic acid sequences for a modified Rep78 protein, wherein the modified Rep 78 protein is a modification of amino acid residue 225 (Met) of SEQ ID NO: 530, with amino acid residue 225 replaced by glycine (Gly) (eg M225G or Met225Gly) or threonine (Thr) (eg M225T or Met225Thr). This exemplary Rep bacmid contains: an IE1 promoter fragment (SEQ ID NO: 66); a Rep78 nucleotide sequence encoding a modified Rep78 protein that lacks a functional start codon downstream of the first start codon, thereby allowing translation of a single Rep78 protein. As one skilled in the art will appreciate, it is possible to modify this modified Rep78 bacmid or modified Rep78 plasmid with a nucleic acid encoding any single Rep protein (e.g., Rep68, Rep52, Rep40) that has been modified to have a single start codon and therefore encodes a single protein Rep. In FIG. 8B is a schematic representation of an example ccDNA plasmid-1, with wt-L ITR (wild-type left ITR), CAG promoter, luciferase transgene, WPRE and polyadenylation sequence; and mod-R (modified right) ITR.
[0051] На Фиг. 9A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A' и C-C' плеча типичного модифицированного левого ITR («ITR-2 (Левый)» SEQ ID NO: 101), а на Фиг. 9B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' и C-C' плеча типичного модифицированного правого ITR («ITR-2 (Правый)» SEQ ID NO: 102). Предполагается, что они образуют структуру с одним плечом (C-C') и одной непарной петлей. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -72,6 ккал/моль. [0051] In FIG. 9A shows the predicted lowest energy structure containing the RBE portions of the A-A' and C-C' arms of a typical modified left ITR ("ITR-2 (Left)" SEQ ID NO: 101), and FIG. 9B shows the predicted lowest energy structure of the RBE portions of the A-A' and C-C' arms of a typical modified right ITR ("ITR-2 (Right)" SEQ ID NO: 102). They are predicted to form a structure with one arm (C-C') and one unpaired loop. The predicted values of their Gibbs free energies for unfolding are −72.6 kcal/mol.
[0052] На Фиг. 10A показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' и B-B' плеча типичного модифицированного левого ITR («ITR-3 (Левый)» SEQ ID NO: 103), а на Фиг. 10B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' и B-B' плеча типичного модифицированного правого ITR («ITR-3 (Правый)» SEQ ID NO: 104). Предполагается, что они образуют структуру с одним плечом (B-B') и одной непарной петлей. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -74,8 ккал/моль. [0052] In FIG. 10A shows the predicted lowest energy structure of the RBE-containing portions of the A-A' and B-B' arms of a typical modified left ITR ("ITR-3 (Left)" SEQ ID NO: 103), and FIG. 10B shows the predicted lowest energy structure of the RBE portions of the A-A' and B-B' arms of a typical modified right ITR ("ITR-3 (Right)" SEQ ID NO: 104). They are predicted to form a structure with one arm (B-B') and one unpaired loop. The predicted values of their Gibbs free energies for unfolding are −74.8 kcal/mol.
[0053] На Фиг. 11A показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' и C-C' плеча типичного модифицированного левого ITR («ITR-4 (Левый)» SEQ ID NO: 105), а на Фиг. 11B показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A' и C-C' плеча типичного модифицированного правого ITR («ITR-4 (Правый)» SEQ ID NO: 106). Предполагается, что они образуют структуру с одним плечом (C-C') и одной непарной петлей. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -76,9 ккал/моль. [0053] In FIG. 11A shows the predicted lowest energy structure of the RBE portions of the A-A' and C-C' arms of a typical modified left ITR ("ITR-4 (Left)" SEQ ID NO: 105), and FIG. 11B shows the predicted lowest energy structure containing the RBE portions of the A-A' and C-C' arms of a typical modified right ITR ("ITR-4 (Right)" SEQ ID NO: 106). They are predicted to form a structure with one arm (C-C') and one unpaired loop. The predicted values of their Gibbs free energies for unfolding are −76.9 kcal/mol.
[0054] На Фиг. 12A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A' и частей C-C' и B-B' типичного модифицированного левого ITR, которая показывает комплементарные пары оснований частей C-B 'и C'-B («ITR-10 (Левый)» SEQ ID NO: 107), а на Фиг. 12B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' и частей C-C' и B-B' типичного модифицированного левого ITR, которая показывает комплементарные пары оснований частей C-B 'и C'-B («ITR-10 (Правый)» SEQ ID NO: 108). Предполагается, что они образуют структуру с одним плечом (часть C'-B и C-B'или часть B'-C и B-C') и одной непарной петлей. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -83,7 ккал/моль. [0054] In FIG. 12A shows the predicted lowest energy structure containing the RBE of the A-A' arm portion and the C-C' and B-B' portions of a typical modified left ITR, which shows the complementary base pairs of the C-B' and C'-B portions ("ITR-10 (Left)" SEQ ID NO: 107), and in Fig. 12B shows the predicted lowest energy structure of the RBE portion of the A-A' arm and the C-C' and B-B' portions of a typical modified left-handed ITR, which shows the complementary base pairs of the C-B' and C'-B portions (“ITR-10 (Right)” SEQ ID NO : 108). They are assumed to form a structure with one arm (part C'-B and C-B' or part B'-C and B-C') and one unpaired loop. Their predicted Gibbs free energies for unfolding are −83.7 kcal/mol.
[0055] На Фиг. 13A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A' и частей C-C' и B-B' типичного модифицированного левого ITR («ITR-17 (Левый)» SEQ ID NO: 109); на Фиг. 13B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' и частей C-C' и B-B' типичного модифицированного левого ITR («ITR-17 (Правый)» SEQ ID NO: 110). Предполагается, что как ITR-17 (левый), так и ITR-17 (правый) образуют структуру с одним плечом (B-B') и одной непарной петлей. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -73,3 ккал/моль. [0055] In FIG. 13A shows the predicted lowest energy structure containing the RBE of the arm portion A-A' and the portions C-C' and B-B' of a typical modified left ITR (“ITR-17 (Left)” SEQ ID NO: 109); in Fig. 13B shows the predicted lowest energy structure of the RBE-containing arm portion A-A' and the portions C-C' and B-B' of a typical modified left ITR (“ITR-17 (Right)” SEQ ID NO: 110). Both ITR-17 (left) and ITR-17 (right) are predicted to form a structure with one arm (B-B') and one unpaired loop. The predicted values of their Gibbs free energies for unfolding are −73.3 kcal/mol.
[0056] На Фиг. 14A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A' типичного модифицированного левого ITR («ITR-6 (Левый)» SEQ ID NO: 111), а на Фиг. 14B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A' типичного модифицированного правого ITR («ITR-6 (Правый)» SEQ ID NO: 112). Предполагается, что как ITR-6 (левый), так и ITR-6 (правый) образуют структуру с одним плечом. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -54,4 ккал/моль. [0056] In FIG. 14A shows the predicted lowest energy structure containing the RBE portion of the A-A' arm of a typical modified left ITR (“ITR-6 (Left)” SEQ ID NO: 111), and FIG. 14B shows the predicted lowest energy structure of the RBE-containing portion of the A-A' arm of a typical modified right ITR (“ITR-6 (Right)” SEQ ID NO: 112). Both ITR-6 (left) and ITR-6 (right) are hypothesized to form a single-arm structure. Their predicted Gibbs free energies for unfolding are −54.4 kcal/mol.
[0057] На Фиг. 15A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C и плеча B-B' типичного модифицированного левого ITR («ITR-1 (Левый)» SEQ ID NO: 113), а на Фиг. 15B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плечо C и плечо B-B' типичного модифицированного правого ITR («ITR-1 (Правый)» SEQ ID NO: 114). Предполагается, что как ITR-1 (левый), так и ITR-1 (правый) образуют структуру с двумя плечами, одно из которых является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -74,7 ккал/моль. [0057] In FIG. 15A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C arm, and the B-B' arm of a typical modified left ITR ("ITR-1 (Left)" SEQ ID NO: 113), and FIG. 15B shows the predicted lowest energy structure of the RBE portions of arm A-A', arm C, and arm B-B' of a typical modified right ITR (“ITR-1 (Right)” SEQ ID NO: 114). It is proposed that both ITR-1 (left) and ITR-1 (right) form a structure with two arms, one of which is truncated. The predicted values of their Gibbs free energies for unfolding are −74.7 kcal/mol.
[0058] На Фиг. 16A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C и плеча B-B' типичного модифицированного левого ITR («ITR-5 (Левый)» SEQ ID NO: 545), а на Фиг. 16B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плечо B-B' и плечо C типичного модифицированного правого ITR («ITR-5 (Правый)» SEQ ID NO: 116). Предполагается, что как ITR-5 (левый), так и ITR-5 (правый) образуют структуру с двумя плечами, одно из которых (например, плечо C') является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -73,4 ккал/моль.[0058] In FIG. 16A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C arm, and the B-B' arm of a typical modified left ITR ("ITR-5 (Left)" SEQ ID NO: 545), and FIG. 16B shows the predicted lowest energy structure of the RBE portions of arm A-A', arm B-B', and arm C of a typical modified right ITR (“ITR-5 (Right)” SEQ ID NO: 116). It is assumed that both ITR-5 (left) and ITR-5 (right) form a structure with two arms, one of which (eg, arm C') is truncated. The predicted values of their Gibbs free energies for unfolding are −73.4 kcal/mol.
[0059] На Фиг. 17A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-7 (Левый)» SEQ ID NO: 117), а на Фиг. 17B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плечо C-C' и плечо B-B' типичного модифицированного правого ITR («ITR-7 (Правый)» SEQ ID NO: 118). Предполагается, что как ITR-17 (левый), так и ITR-17 (правый) образуют структуру с двумя плечами, одно из которых (например, плечо B-B') является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -89,6 ккал/моль.[0059] In FIG. 17A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-7 (Left)" SEQ ID NO: 117), and FIG. 17B shows the predicted lowest energy structure of the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right ITR ("ITR-7 (Right)" SEQ ID NO: 118). It is assumed that both ITR-17 (left) and ITR-17 (right) form a structure with two arms, one of which (eg, arm B-B') is truncated. Their predicted Gibbs free energies for unfolding are −89.6 kcal/mol.
[0060] На Фиг. 18A показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-8 (Левый)» SEQ ID NO: 119), а на Фиг. 18B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плечо C-C' и плечо B-B' типичного модифицированного правого ITR («ITR-8 (Правый)» SEQ ID NO: 120). Предполагается, что как ITR-8 (левый), так и ITR-8 (правый) образуют структуру с двумя плечами, одно из которых является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -86,9 ккал/моль.[0060] In FIG. 18A shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-8 (Left)" SEQ ID NO: 119), and FIG. 18B shows the predicted lowest energy structure of the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right-handed ITR (“ITR-8 (Right)” SEQ ID NO: 120). It is assumed that both ITR-8 (left) and ITR-8 (right) form a structure with two arms, one of which is truncated. Their predicted Gibbs free energies for unfolding are −86.9 kcal/mol.
[0061] На Фиг. 19A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-9 (Левый)» SEQ ID NO: 121), а на Фиг. 19B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-9 (Правый)» SEQ ID NO: 122). Предполагается, что как ITR-9 (левый), так и ITR-9 (правый) образуют структуру с двумя плечами, одно из которых является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -85,0 ккал/моль.[0061] In FIG. 19A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-9 (Left)" SEQ ID NO: 121), and FIG. 19B shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right ITR ("ITR-9 (Right)" SEQ ID NO: 122). It is assumed that both ITR-9 (left) and ITR-9 (right) form a structure with two arms, one of which is truncated. Their predicted Gibbs free energies for unfolding are −85.0 kcal/mol.
[0062] На Фиг. 20A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-11 (Левый)» SEQ ID NO: 123), а на Фиг. 20B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-11 (Правый)» SEQ ID NO: 124). Предполагается, что как ITR-11 (левый), так и ITR-11 (правый) образуют структуру с двумя плечами, одно из которых является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -89,5 ккал/моль.[0062] In FIG. 20A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-11 (Left)" SEQ ID NO: 123), and FIG. 20B shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right-handed ITR (“ITR-11 (Right)” SEQ ID NO: 124). It is assumed that both ITR-11 (left) and ITR-11 (right) form a structure with two arms, one of which is truncated. Their predicted Gibbs free energies for unfolding are −89.5 kcal/mol.
[0063] На Фиг. 21A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-12 (Левый)» SEQ ID NO: 125), а на Фиг. 21B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-12 (Правый)» SEQ ID NO: 126). Предполагается, что как ITR-12 (левый), так и ITR-12 (правый) образуют структуру с двумя плечами, одно из которых является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -86,2 ккал/моль.[0063] In FIG. 21A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-12 (Left)" SEQ ID NO: 125), and FIG. 21B shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right ITR ("ITR-12 (Right)" SEQ ID NO: 126). It is assumed that both ITR-12 (left) and ITR-12 (right) form a structure with two arms, one of which is truncated. The predicted values of their Gibbs free energies for unfolding are −86.2 kcal/mol.
[0064] На Фиг. 22A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-13 (Левый)» SEQ ID NO: 127), а на Фиг. 22B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-13 (Правый)» SEQ ID NO: 128). Предполагается, что как ITR-13 (левый), так и ITR-13 (правый) образуют структуру с двумя плечами, одно из которых (например, плечо B-B') является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -82,9 ккал/моль.[0064] In FIG. 22A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-13 (Left)" SEQ ID NO: 127), and FIG. 22B shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right ITR ("ITR-13 (Right)" SEQ ID NO: 128). It is assumed that both ITR-13 (left) and ITR-13 (right) form a structure with two arms, one of which (eg, arm B-B') is truncated. Their predicted Gibbs free energies for unfolding are −82.9 kcal/mol.
[0065] На Фиг. 23A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-14 (Левый)» SEQ ID NO: 129), а на Фиг. 23B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-14 (Правый)» SEQ ID NO: 130). Предполагается, что как ITR-14 (левый), так и ITR-14 (правый) образуют структуру с двумя плечами, одно из которых (например, плечо B-B') является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -80,5 ккал/моль.[0065] In FIG. 23A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-14 (Left)" SEQ ID NO: 129), and FIG. 23B shows the predicted lowest energy structure of the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right-handed ITR (“ITR-14 (Right)” SEQ ID NO: 130). It is assumed that both ITR-14 (left) and ITR-14 (right) form a structure with two arms, one of which (eg, arm B-B') is truncated. Their predicted Gibbs free energies for unfolding are −80.5 kcal/mol.
[0066] На Фиг. 24A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-15 (Левый)» SEQ ID NO: 131), а на Фиг. 24B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-15 (Правый)» SEQ ID NO: 132). Предполагается, что как ITR-15 (левый), так и ITR-15 (правый) образуют структуру с двумя плечами, одно из которых (например, плечо B-B') является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -77,2 ккал/моль.[0066] In FIG. 24A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-15 (Left)" SEQ ID NO: 131), and FIG. 24B shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right ITR ("ITR-15 (Right)" SEQ ID NO: 132). It is assumed that both ITR-15 (left) and ITR-15 (right) form a structure with two arms, one of which (eg, arm B-B') is truncated. The predicted values of their Gibbs free energies for unfolding are −77.2 kcal/mol.
[0067] На Фиг. 25A показана предсказанная структура с наименьшей энергией, содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного левого ITR («ITR-16 (Левый)» SEQ ID NO: 133), а на Фиг. 25B показана предсказанная структура с наименьшей энергией содержащей RBE части плеча A-A', плеча C-C' и плеча B-B' типичного модифицированного правого ITR («ITR-16 (Правый)» SEQ ID NO: 134). Предполагается, что как ITR-16 (левый), так и ITR-16 (правый) образуют структуру с двумя плечами, одно из которых (например, плечо B-B') является усеченным. Прогнозируемые значения их свободных энергий Гиббса для развертывания составляют -73,9 ккал/моль.[0067] In FIG. 25A shows the predicted lowest energy structure containing the RBE portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified left ITR ("ITR-16 (Left)" SEQ ID NO: 133), and FIG. 25B shows the predicted lowest energy structure of the RBE-containing portions of the A-A' arm, the C-C' arm, and the B-B' arm of a typical modified right ITR ("ITR-16 (Right)" SEQ ID NO: 134). It is assumed that both ITR-16 (left) and ITR-16 (right) form a structure with two arms, one of which (eg, arm B-B') is truncated. Their predicted Gibbs free energies for unfolding are −73.9 kcal/mol.
[0068] На Фиг. 26А показаны предсказанные структуры RBE-содержащей части плеча A-A' и модифицированного плеча B-B' и/или модифицированного плеча C-C' типичных примеров модифицированных правых ITR, приведенных в Таблице 10A. Фиг. 26B демонстрирует прогнозируемые структуры RBE-содержащей части плеча A-A' и модифицированного плеча C-C' и/или модифицированного плеча B-B' примеров модифицированных правых ITR, приведенных в Таблице 10B. Показанные структуры являются предсказанными структурами с наименьшей свободной энергией. Обозначение условными цветами: красный = вероятность >99%; оранжевый = вероятность 99% - 95%; бежевый = вероятность 95-90%; темно-зеленый 90% - 80%; ярко-зеленый = 80% - 70%; голубой = 70% - 60%; темно-синий 60% - 50%; и розовый = < 50%.[0068] In FIG. 26A shows the predicted structures of the RBE-containing portion of the A-A' arm and the modified B-B' arm and/or the modified C-C' arm of representative examples of the modified right ITRs shown in Table 10A. Fig. 26B shows the predicted structures of the RBE-containing portion of the arm A-A' and the modified arm C-C' and/or the modified arm B-B' of the examples of modified right ITRs shown in Table 10B. The structures shown are the predicted structures with the lowest free energy. Designation by conventional colors: red = probability >99%; orange = 99% - 95% probability; beige = 95-90% probability; dark green 90% - 80%; bright green = 80% - 70%; blue = 70% - 60%; dark blue 60% - 50%; and pink = < 50%.
[0069] Фиг. 27 демонстрирует люциферазную активность клеток насекомых Sf9 GlycoBac, трансфицированных выбранными асимметричными мутантными вариантами ITR из Таблиц 10A и 10B. Вектор зкДНК имел ген люциферазы, фланкированный ITR дикого типа, и модифицированный асимметричный ITR, выбранный из Таблиц 10A или 10B. «ITR-50 R no rep» является известным спасаемым мутантом без коинфекции Rep- содержащим бакуловирусом. «Ложные» условия представлены только реагентами для трансфекции, без донорной ДНК. [0069] FIG. 27 shows the luciferase activity of Sf9 GlycoBac insect cells transfected with selected asymmetric ITR mutant variants from Tables 10A and 10B. The cccDNA vector had a luciferase gene flanked by a wild-type ITR and a modified asymmetric ITR selected from Tables 10A or 10B. “ITR-50 R no rep” is a known rescue mutant without Rep-containing baculovirus coinfection. “Mock” conditions are represented by transfection reagents only, without donor DNA.
[0070] Фиг. 28 показывает нативный агарозный гель (1% агарозы, 1x буфер TAE) репрезентативных неочищенных экстрактов зкДНК из культур клеток насекомых Sf9, трансфицированных зкДНК-плазмидами, содержащими левый wt-ITR с другим ITR, выбранным из различных мутантных правых ITR, раскрытых в таблице 10A. На каждую дорожку вносили 2 мкг общего экстракта. Слева направо: полоса 1) маркеры 1 т.п.о. плюс, дорожка 2) правый ITR-18, дорожка 3) правый ITR-49 дорожка 4) правый ITR-19, дорожка 5) правый ITR-20, дорожка 6) правый ITR-21, дорожка 7) правый ITR-22, дорожка 8) правый ITR-23, дорожка 9) правый ITR-24, дорожка 10) Правый ITR-25, дорожка 11) правый ITR-26, дорожка 12) правый ITR-27, дорожка 13), правый ITR-28, дорожка 14) правый ITR-50, дорожка 15) 1 т.п.о. плюс маркеры.[0070] FIG. 28 shows a native agarose gel (1% agarose, 1x TAE buffer) of representative crude cccDNA extracts from Sf9 insect cell cultures transfected with ccDNA plasmids containing a left-handed wt-ITR with a different ITR selected from the various mutant right-handed ITRs disclosed in Table 10A. 2 μg of total extract was added to each lane. From left to right: lane 1) 1 kb markers. plus, track 2) right ITR-18, track 3) right ITR-49 track 4) right ITR-19, track 5) right ITR-20, track 6) right ITR-21, track 7) right ITR-22, track 8) right ITR-23, track 9) right ITR-24, track 10) Right ITR-25, track 11) right ITR-26, track 12) right ITR-27, track 13), right ITR-28, track 14 ) right ITR-50, track 15) 1 kb. plus markers.
[0071] Фиг. 29 показывает денатурирующий гель (0,8% щелочной агарозы) репрезентативных конструктов из библиотеки мутантов ITR. Вектор зкДНК получают из плазмидных конструктов, содержащих левую ITR дикого типа с другой ITR, выбранной из различных мутантных правых ITR, описанных в таблице 10А. Слева направо, дорожка 1) маркеры 1 т.п.о. плюс, дорожка 2) правый нерасщепленный ITR-18, дорожка 3) правый расщепленный ITR-18, дорожка 4) правый неразрезанный ITR-19, дорожка 5) правый расщепленный ITR- 19, дорожка 6) правый неразрезанный ITR-21, полоса 7) правый расщепленный ITR-21, дорожка 8) правый расщепленный ITR-25, дорожка 9) правый расщепленный ITR-25. Экстракты обрабатывали эндонуклеазой рестрикции EcoRI. Ожидается, что каждая мутантная зкДНК будет иметь единственный сайт распознавания EcoRI, дающий два характерных фрагмента, ~ 2000 п.о. и ~ 3000 п.о., которые в денатурирующих условиях будут иметь длину ~ 4000 и ~ 6000 п.о., соответственно. Необработанные экстракты зкДНК имеют размер ~ 5000 п.о., и ожидается, что они будут мигрировать в денатурирующих условиях на ~ 11000 п.о.[0071] FIG. 29 shows a denaturing gel (0.8% alkaline agarose) of representative constructs from the ITR mutant library. The cccDNA vector is prepared from plasmid constructs containing a wild-type left ITR with another ITR selected from the various right ITR mutants described in Table 10A. From left to right, lane 1) 1 kb markers. plus, lane 2) right unsplit ITR-18, lane 3) right split ITR-18, lane 4) right uncut ITR-19, lane 5) right split ITR-19, lane 6) right uncut ITR-21, lane 7) right split ITR-21, track 8) right split ITR-25, track 9) right split ITR-25. Extracts were treated with restriction endonuclease EcoRI. Each mutant cccDNA is expected to have a single EcoRI recognition site, yielding two characteristic fragments, ~2000 bp. and ~3000 bp, which under denaturing conditions will be ~4000 and ~6000 bp in length, respectively. Raw cccDNA extracts are ~5000 bp in size and are expected to migrate to ~11,000 bp under denaturing conditions.
[0072] Фиг. 30 показывает активность люциферазы in vitro в клетках HEK293 мутантов ITR правого ITR-18, правого ITR-19, правого ITR-21 и правого ITR-25, и ITR-49, где левый ITR в векторе зкДНК представляет собой WT ITR. «Ложные» условия представлены только реагентами для трансфекции, без донорной ДНК, а необработанные являются негативным контролем.[0072] FIG. 30 shows in vitro luciferase activity in HEK293 cells of the ITR mutants right ITR-18, right ITR-19, right ITR-21 and right ITR-25, and ITR-49, where the left ITR in the cccDNA vector is the WT ITR. “Mock” conditions are represented by transfection reagents only, without donor DNA, and untreated is a negative control.
[0073] Фиг. 31 представляет собой таблицу, показывающую различные свойства и активности (например, связывание ДНК, никирование ДНК, геликазную активность, АТФазную активность и активность Zn-пальцев) различных видов Rep-белков (например, Rep78 дикого типа, Rep68 дикого типа, Rep52 дикого типа и Rep40 дикого типа) и модифицированные виды Rep68, например, в которых аминокислота белка Rep78 модифицирована до любого из Y156, K340H, Met→ Gly (M225G). При модификации Met→ Gly (M225G) Rep78 сохраняет все свойства и активности белка Rep78 дикого типа. [0073] FIG. 31 is a table showing various properties and activities (eg, DNA binding, DNA nicking, helicase activity, ATPase activity, and Zn-finger activity) of different types of Rep proteins (eg, wild-type Rep78, wild-type Rep68, wild-type Rep52, and wild-type Rep40) and modified Rep68 species, for example, in which the amino acid of the Rep78 protein is modified to any of Y156, K340H, Met→Gly (M225G). When modified Met→Gly (M225G), Rep78 retains all the properties and activities of the wild-type Rep78 protein.
[0074] Фиг. 32A и 32B представляют собой неденатурирующие гели, показывающие присутствие высокостабильных ДНК-векторов и характерные полосы, подтверждающие присутствие вектора высокостабильной ДНК с замкнутыми концами (зкДНК), полученного с использованием единственного белка Rep, с использованием описанных здесь способов. На Фиг. 32A более высокие количества вектора зкДНК продуцируются с использованием нуклеиновой кислоты модифицированного Rep78 с модификацией Rep78 в Met→ Gly (M225G) (дорожка 1) или Rep в Met→Thr (M225T) (дорожка 2) по сравнению с получением при использовании нуклеиновой кислоты, кодирующей Rep78 дикого типа (дорожка 5), в котором нуклеиновая кислота экспрессирует как белок Rep78/68, так и белок Rep52/40. Вектор зкДНК не был получен со связывающими/никирующими мутантами Rep78, содержащими модификации Gly (Y156F) (дорожка 3) или Thr (Y156F) (дорожка 4). На Фиг. 32B, мутанты Rep68 Met→ Gly (M225G) и Rep68 Met→Thr (M225T) также продуцировали вектор зкДНК на уровнях, равных или превышающих количество вектора зкДНК, полученного с использованием нуклеиновой кислоты модифицированного Rep78 с модификацией Rep78 в Met→ Gly (M225G) или Rep Met→Thr (M225T). DLSR: плазмидный конструкт, экспрессирующий длинный (Rep78) и короткий (Rep52) белок Rep в тандеме; pIE78: полноразмерная последовательность Rep78 дикого типа; Rep78 M→G: полноразмерный Rep78, содержащий одиночную мутацию M225G; Rep78M→Т: полноразмерный Rep78, содержащий одиночную мутацию M225T; Rep78Y156F: полноразмерный Rep78, имеющий единственную мутацию в никазном домене. [0074] FIG. 32A and 32B are non-denaturing gels showing the presence of highly stable DNA vectors and characteristic bands confirming the presence of a highly stable closed-end DNA (ccDNA) vector produced using a single Rep protein using the methods described herein. In FIG. 32A, higher amounts of cccDNA vector are produced using a modified Rep78 nucleic acid with the modification of Rep78 to Met→Gly (M225G) (lane 1) or Rep to Met→Thr (M225T) (lane 2) compared to production using a nucleic acid encoding Wild-type Rep78 (lane 5), in which the nucleic acid expresses both the Rep78/68 protein and the Rep52/40 protein. The cccDNA vector was not produced with Rep78 binding/nicking mutants containing Gly (Y156F) (lane 3) or Thr (Y156F) (lane 4) modifications. In FIG. 32B, the Rep68 Met→Gly (M225G) and Rep68 Met→Thr (M225T) mutants also produced cccDNA vector at levels equal to or greater than the amount of ccDNA vector produced using Rep78-modified nucleic acid with the Rep78 modification to Met→Gly (M225G) or Rep Met→Thr (M225T). DLSR: plasmid construct expressing long (Rep78) and short (Rep52) Rep protein in tandem; pIE78: full-length wild-type Rep78 sequence; Rep78 M→G: full-length Rep78 containing a single mutation M225G; Rep78M→T: full-length Rep78 containing a single mutation M225T; Rep78Y156F: Full-length Rep78, which has a single mutation in the nickase domain.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
I. ОпределенияI. Definitions
[0075] Если в данном документе не указано иное, научные и технические термины, используемые применительно к данной заявке, будут иметь значения, общепринятые для специалистов в области техники, к которой относится данное изобретение. Следует понимать, что данное изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.п., описанными в данном документе, и, соответственно, предусматривает различные варианты. Используемая в данном документе терминология служит только для описания конкретных вариантов реализации, и не предназначена для ограничения объема данного изобретения, который определяется исключительно формулой изобретения. Определения общепринятых терминов иммунологии и молекулярной биологии можно найти в следующих источниках: The Merck Manual of Diagnosis and Therapy, 19-е изд., опубликовано Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ред.), Fields Virology, 6-е изд., опубликовано Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ред.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, опубликовано Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); и Robert A. Meyers (ред.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, опубликовано VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, опубликовано Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (ред.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, опубликовано Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4е изд., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ред.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ред.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ред.), John Wiley and Sons, Inc., 2005; и Current Protocols in Immunology (CPI) (John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (ред.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), содержание которых в полном объеме включено в данный документ посредством ссылок.[0075] Unless otherwise defined herein, scientific and technical terms used in connection with this application will have the meanings commonly understood by those skilled in the art to which this invention relates. It should be understood that the present invention is not limited to the specific methodology, protocols and reagents, etc. described herein and, accordingly, is subject to various variations. The terminology used herein is intended to describe specific embodiments only and is not intended to limit the scope of the invention, which is defined solely by the claims. Definitions of common immunology and molecular biology terms can be found in the following sources: The Merck Manual of Diagnosis and Therapy, 19th ed., published by Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ed.), Fields Virology, 6th ed., published by Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ed.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, published by Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); and Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, published by Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, published by Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005; and Current Protocols in Immunology (CPI) (John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), contents which are incorporated herein by reference in their entirety.
[0076] В данном документе термины «гетерологичная нуклеотидная последовательность» и «трансген» используются взаимозаменяемо и относятся к представляющей интерес нуклеиновой кислоте (отличной от нуклеиновой кислоты, кодирующей полипептид капсида), которая встроена в зкДНК-вектор и может быть доставлена и экспрессирована зкДНК-вектором согласно описанию в данном документе. Представляющие интерес трансгены включают, не ограничиваясь перечисленным, нуклеиновые кислоты, кодирующие полипептиды, предпочтительно, терапевтические (например, для применения в медицинских, диагностических или ветеринарных целях) или иммуногенные полипептиды (например, для вакцин). Согласно некоторым вариантам реализации представляющие интерес нуклеиновые кислоты включают нуклеиновые кислоты, которые транскрибируются в терапевтическую РНК. Трансгены, включенные для использования в зкДНК-векторах по изобретению, включают, без ограничений, экспрессирующие или кодирующие один или несколько полипептидов, пептидов, рибозимов, аптамеров, пептидных нуклеиновых кислот, миРНК, РНКи, микроРНК, днкРНК (длинных некодирующих РНК), антисмысловых олиго- или полинуклеотидов, антител, антигенсвязывающих фрагментов, или любую их комбинацию.[0076] As used herein, the terms “heterologous nucleotide sequence” and “transgene” are used interchangeably and refer to a nucleic acid of interest (other than a nucleic acid encoding a capsid polypeptide) that is inserted into a cccDNA vector and can be delivered and expressed by a cccDNA vector. vector as described in this document. Transgenes of interest include, but are not limited to, nucleic acids encoding polypeptides, preferably therapeutic (eg, for medical, diagnostic or veterinary purposes) or immunogenic polypeptides (eg, for vaccines). In some embodiments, the nucleic acids of interest include nucleic acids that are transcribed into therapeutic RNA. Transgenes included for use in cccDNA vectors of the invention include, but are not limited to, those expressing or encoding one or more polypeptides, peptides, ribozymes, aptamers, peptide nucleic acids, siRNAs, RNAi, microRNAs, lncRNAs (long non-coding RNAs), antisense oligos - or polynucleotides, antibodies, antigen-binding fragments, or any combination thereof.
[0077] В данном документе термины «экспрессионная кассета» и «транскрипционная кассета» используются взаимозаменяемо и относятся к линейному отрезку нуклеиновых кислот, который содержит трансген, функционально связанный с одним или несколькими промоторами или другими регуляторными последовательностями, достаточными для направления транскрипции указанного трансгена, но не содержит кодирующие капсид последовательности, другие векторные последовательности или участки инвертированных концевых повторов. Экспрессионная кассета может дополнительно содержать одну или более действующих в цис-положении последовательностей (например, промоторов, энхансеров или репрессоров), один или более интронов, и один или более посттранскрипционных регуляторных элементов. [0077] As used herein, the terms "expression cassette" and "transcription cassette" are used interchangeably and refer to a linear stretch of nucleic acids that contains a transgene operably linked to one or more promoters or other regulatory sequences sufficient to direct transcription of the transgene, but does not contain capsid coding sequences, other vector sequences or inverted terminal repeat regions. The expression cassette may further comprise one or more cis-acting sequences (eg, promoters, enhancers, or repressors), one or more introns, and one or more post-transcriptional regulatory elements.
[0078] В данном документе термин «концевой повтор» или «TR» включает любой вирусный концевой повтор или любую синтетическую последовательность, которая содержит по меньшей мере одну минимальную требуемую точку начала репликации и участок, содержащий палиндромную шпилечную структуру. Связывающая Rep последовательность («RBS») (также называемая RBE (связывающий Rep элемент)) и сайт концевого разрешения («TRS») вместе образуют «минимальную требуемую точку начала репликации» и, соответственно, TR содержит по меньшей мере одну RBS и по меньшей мере один TRS. Каждый из TR, обратно-комплементарных друг относительно друга в пределах определенного отрезка полинуклеотидной последовательности, как правило, называют «инвертированным концевым повтором» или «ITR». В контексте вируса, ITR опосредуют репликацию, упаковку вируса, интеграцию и высвобождение провируса. Как было неожиданно обнаружено авторами данного изобретения, концевые повторы, не являющиеся обратно комплементарными по всей их длине, могут, тем не менее, выполнять традиционные функции ITR и, таким образом, термин ITR в данном документе относится к КП в геноме зкДНК или зкДНК-векторе, который способен опосредовать репликацию зкДНК-вектора. Специалисту в данной области техники будет понятно, что в зкДНК-векторах сложной конфигурации может присутствовать более двух пар ITR или асимметричных ITR. Указанный ITR может представлять собой AAV ITR или ITR не из AAV, или может происходить из AAV ITR или из ITR не из AAV. Например, указанный ITR может происходить из семейства Parvoviridae, куда входят парвовирусы и депендовирусы (например, парвовирус собачьих, парвовирус крупного рогатого скота, парвовирус мышей, парвовирус свиньи, парвовирус человека B-19), или шпилька SV40, которая служит в качестве точки начала репликации SV40, может быть использована как ITR, который дополнительно может быть модифицирован путем усечения, замены, делеции, вставки и/или добавления. Семейство вирусов Parvoviridae состоит из двух подсемейств: Parvovirinae, инфицирующих позвоночных, и Densovirinae, инфицирующих беспозвоночных. Депендопарвовирусы включают вирусное семейство аденоассоциированных вирусов (ААV), которые способны к репликации у позвоночных животных-хозяев, включая, без ограничений, человека, виды приматов, бычьих, собачьих, лошадей и овец. Для удобства в данном документе ITR, расположенный в 5' направлении (выше) относительно экспрессионной кассеты в зкДНК-векторе, называется «5' ITR» или «левым ITR», а ITR, расположенный в 3' направлении (ниже) экспрессионной кассеты в зкДНК-векторе, называется «3' ITR» или «правым ITR». [0078] As used herein, the term “terminal repeat” or “TR” includes any viral terminal repeat or any synthetic sequence that contains at least one minimum required origin of replication and a region containing a palindromic hairpin structure. The Rep binding sequence (“RBS”) (also called the RBE (Rep binding element)) and the terminal resolution site (“TRS”) together form the “minimum required origin of replication” and, accordingly, the TR contains at least one RBS and at least at least one TRS. Each of the TRs that are inversely complementary to each other within a specific stretch of polynucleotide sequence is generally referred to as an “inverted terminal repeat” or “ITR.” In the context of a virus, ITRs mediate viral replication, packaging, integration, and proviral release. It has been surprisingly discovered by the present inventors that terminal repeats that are not reverse complementary throughout their entire length can still perform traditional ITR functions and thus the term ITR herein refers to a CP in a cccDNA genome or cccDNA vector , which is capable of mediating the replication of the cDNA vector. One skilled in the art will appreciate that cccDNA vectors of complex configuration may contain more than two pairs of ITRs or asymmetric ITRs. Said ITR may be an AAV ITR or a non-AAV ITR, or may be derived from an AAV ITR or a non-AAV ITR. For example, the ITR may be from the Parvoviridae family, which includes parvoviruses and dependoviruses (eg, canine parvovirus, bovine parvovirus, murine parvovirus, porcine parvovirus, human parvovirus B-19), or the SV40 hairpin, which serves as an origin of replication SV40 may be used as an ITR, which may further be modified by truncation, substitution, deletion, insertion and/or addition. The Parvoviridae family of viruses consists of two subfamilies: Parvovirinae, which infect vertebrates, and Densovirinae, which infect invertebrates. Dependoparvoviruses include the adeno-associated virus (AAV) family of viruses that are capable of replication in vertebrate hosts, including, but not limited to, human, primate, bovine, canine, equine, and sheep species. For convenience, herein the ITR located 5' upstream of the expression cassette in the cccDNA vector is referred to as the "5' ITR" or "left ITR", and the ITR located 3' downstream of the expression cassette in the cccDNA vector. -vector, is called the “3' ITR” or “right ITR”.
[0079] «ITR дикого типа» или «WT-ITR» относится к последовательности встречающейся в природе ITR-последовательности ААV или другого депендовируса, которая сохраняет, например, активность связывания Rep и никующую способность Rep. Нуклеотидная последовательность WT-ITR из любого серотипа AAV может незначительно отличаться от канонической встречающейся в природе последовательности из-за вырожденности генетического кода или дрейфа, и, соответственно, последовательности WT-ITR, предусмотренные для применения в данном документе, включают последовательности WT-ITR, образованные в результате встречающихся в природе изменений, происходящих в ходе процесса продуцирования (например, ошибки репликации).[0079] “Wild-type ITR” or “WT-ITR” refers to a naturally occurring AAV or other dependovirus ITR sequence that retains, for example, Rep binding activity and Rep nicking ability. The nucleotide sequence of the WT-ITR from any AAV serotype may differ slightly from the canonical naturally occurring sequence due to degeneracy of the genetic code or drift, and accordingly, the WT-ITR sequences provided for use herein include the WT-ITR sequences generated as a result of naturally occurring changes that occur during the production process (for example, replication errors).
[0080] В данном документе термин «по существу симметричные WT-ITR» или «пара по существу симметричных WT-ITR» относится к паре WT-ITR в составе одного зкДНК-генома или зкДНК-вектора, где оба ITR представляют собой ITR дикого типа, которые имеют обратно-комплементарную последовательность по всей длине. Например, ITR может считаться последовательностью дикого типа, даже если он содержит один или более нуклеотидов, отличающихся от нуклеотидов в канонической встречающейся в природе последовательности, при условии, что указанные изменения не влияют на свойства и общую трехмерную структуру последовательности. Согласно некоторым аспектам, указанные отличающиеся нуклеотиды представляют собой консервативные изменения последовательностей. Неограничивающий пример представлен последовательностью, по меньшей мере на 95%, 96%, 97%, 98% или 99% идентичной канонической последовательности (по оценке, например, с помощью BLAST при параметрах, устанавливаемых по умолчанию), а также имеет симметричную трехмерную пространственную организацию относительно другого WT-ITR, так что их трехмерная структура имеет одинаковую форму в геометрическом пространстве. Указанный по существу симметричный WT-ITR содержит такие же петли A, C-C' и B-B' в трехмерном пространстве. Может быть функционально подтверждено, что по существу симметричный WT-ITR является WT, путем определения наличия в нем функционального сайта связывания Rep (RBE или RBE') и сайта концевого разрешения (trs), который спаривается с соответствующим белком Rep. Можно дополнительно проверить другие функции, включая экспрессию трансгена в пермиссивных условиях.[0080] As used herein, the term “substantially symmetric WT-ITRs” or “substantially symmetric WT-ITR pair” refers to a pair of WT-ITRs within a single ccDNA genome or ccDNA vector, where both ITRs are wild-type ITRs , which have a reverse complementary sequence along their entire length. For example, an ITR may be considered a wild-type sequence even if it contains one or more nucleotides that differ from nucleotides in the canonical naturally occurring sequence, provided that such changes do not affect the properties and overall three-dimensional structure of the sequence. In some aspects, said differing nucleotides represent conservative sequence changes. A non-limiting example is a sequence that is at least 95%, 96%, 97%, 98%, or 99% identical to the canonical sequence (as assessed, for example, by BLAST using default parameters), and also has a symmetrical three-dimensional spatial organization relative to another WT-ITR such that their 3D structure has the same shape in geometric space. This substantially symmetrical WT-ITR contains the same A, C-C' and B-B' loops in three-dimensional space. An essentially symmetrical WT-ITR can be functionally confirmed to be WT by determining whether it contains a functional Rep binding site (RBE or RBE') and a terminal resolution site (trs) that pairs with the corresponding Rep protein. Other functions can be further tested, including transgene expression under permissive conditions.
[0081] В данном документе выражения «модифицированный ITR» или «mod-ITR» или «мутантный ITR» используются в данном документе взаимозаменяемо и относятся к ITR, который содержит мутацию по меньшей мере в одном или более нуклеотидах по сравнению с WT-ITR из того же серотипа. Указанная мутация может приводить к изменению в одной или более из участков A, C, C', B, B' в ITR, и может приводить к изменению трехмерной пространственной организации (т.е. трехмерной структуры в геометрическом пространстве) по сравнению с трехмерной пространственной организацией WT-ITR из того же серотипа.[0081] As used herein, the expressions “modified ITR” or “mod-ITR” or “mutant ITR” are used interchangeably herein and refer to an ITR that contains a mutation in at least one or more nucleotides compared to the WT-ITR from the same serotype. The mutation may result in a change in one or more of regions A, C, C', B, B' in the ITR, and may result in a change in three-dimensional spatial organization (i.e., three-dimensional structure in geometric space) compared to three-dimensional spatial organization by the WT-ITR organization from the same serotype.
[0082] Используемый в данном документе термин «асимметричные ITR», также называемый «асимметричными парами ITR», относится к паре ITR в одном геноме зкДНК или зкДНК-векторе, которые не являются обратными комплементами по их полной длине. В качестве одного неограничивающего примера, в асимметричной паре ITR не имеют симметричной трехмерной пространственной организации со своим ITR-партнером, и их трехмерные структуры имеют разные формы в геометрическом пространстве. Другими словами, асимметричная пара ITR имеет разные общие геометрические структуры, т.е. они имеют разную организацию своих A, C-C'- и B-B'-петель в трехмерном пространстве (например, один ITR может иметь короткое плечо C-C' и/или короткое плечо B-B' по сравнению с родственным ITR). Различие в последовательностях между двумя ITR может быть связано с вставкой, делецией, усечением или точечной мутацией одного или нескольких нуклеотидов. В одном варианте реализации, один ITR асимметричной пары ITR может быть последовательностью ITR ААV дикого типа, а другой ITR - модифицированным ITR, как определено в данном документе (например, последовательностью ITR не-дикого типа или синтетической). В другом варианте реализации ни один из ITR асимметричной пары ITR не является последовательностью ААV дикого типа, и указанные два ITR представляют собой модифицированные ITR, которые имеют разные формы в геометрическом пространстве (т.е. разную общую геометрическую структуру). В некоторых вариантах реализации один mod-ITR асимметричной пары ITR может иметь короткое C-C'-плечо, а другой ITR может иметь другую модификацию (например, одно плечо или короткое B-B'-плечо и т.д.), так что они имеют различную трехмерную пространственную организацию по сравнению с парным ему асимметричным mod-ITR. [0082] As used herein, the term “asymmetric ITRs,” also referred to as “asymmetric ITR pairs,” refers to a pair of ITRs in the same ccDNA genome or ccDNA vector that are not reverse complements in their full length. As one non-limiting example, in an asymmetric pair, the ITRs do not have a symmetrical three-dimensional spatial organization with their partner ITR, and their three-dimensional structures have different shapes in geometric space. In other words, an asymmetric ITR pair has different overall geometric structures, i.e. they have different organizations of their A, C-C' and B-B' loops in three-dimensional space (e.g., one ITR may have a short C-C' arm and/or a short B-B' arm compared to a cognate ITR). The sequence difference between two ITRs may be due to insertion, deletion, truncation, or point mutation of one or more nucleotides. In one embodiment, one ITR of an asymmetric ITR pair may be a wild-type AAV ITR sequence and the other ITR a modified ITR as defined herein (eg, a non-wild-type or synthetic ITR sequence). In another embodiment, neither of the ITRs of an asymmetric ITR pair is a wild-type AAV sequence, and the two ITRs are modified ITRs that have different shapes in geometric space (ie, a different overall geometric structure). In some embodiments, one mod-ITR of an asymmetric ITR pair may have a short C-C' arm, and the other ITR may have a different modification (e.g., single arm or short B-B' arm, etc.), such that they have a different three-dimensional spatial organization compared to its paired asymmetric mod-ITR.
[0083] В данном документе термин «симметричный ITR» относится к паре ITR в составе одного зкДНК-генома или зкДНК-вектора, мутированных или модифицированных относительно последовательностей депендовирусного ITR дикого типа, и обратно-комплементарных по всей длине. Ни один из ITR не является последовательностью ITR ААV2 дикого типа (т.е. они представляют собой модифицированные ITR, также называемые мутантными ITR), и могут отличаться от последовательности ITR дикого типа вследствие вставки, делеции, замены, усечения или точечной мутации нуклеотидов. Для удобства в данном документе ITR, расположенный в 5' направлении (выше) относительно экспрессионной кассеты в зкДНК-векторе, называется «5' ITR» или «левым ITR», а ITR, расположенный в 3' направлении (ниже) экспрессионной кассеты в зкДНК-векторе, называется «3' ITR» или «правым ITR». [0083] As used herein, the term “symmetrical ITR” refers to a pair of ITRs within a single cccDNA genome or ccDNA vector that are mutated or modified relative to the wild-type dependoviral ITR sequences, and are reverse complementary throughout their entire length. Neither ITR is the wild-type AAV2 ITR sequence (ie, they are modified ITRs, also called mutant ITRs), and may differ from the wild-type ITR sequence due to insertion, deletion, substitution, truncation, or point mutation of nucleotides. For convenience, herein the ITR located 5' upstream of the expression cassette in the cccDNA vector is referred to as the "5' ITR" or "left ITR", and the ITR located 3' downstream of the expression cassette in the cccDNA vector. -vector, is called the “3' ITR” or “right ITR”.
[0084] Используемый в данном документе термин «по существу симметричные модифицированные ITR» или «по существу симметричная пара mod-ITR» относится к паре модифицированных ITR в одном геноме зкДНК или зкДНК-векторе, которые оба имеют обратно комплементарные последовательности по всей своей длине. Например, модифицированный ITR может считаться по существу симметричным, даже имея некоторые нуклеотидные последовательности, отклоняющиеся от обратно комплементарной последовательности, если указанные изменения не влияют на свойства и общую форму. Один неограничивающий пример представлен последовательностью, которая по меньшей мере на 85%, 90%, 95%, 96%, 97%, 98% или 99% идентична канонической последовательности (по оценке в BLAST при использовании параметров, устанавливаемых по умолчанию), а также имеет симметричную трехмерную пространственную организацию в отношении родственного модифицированного ITR, так что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. Иными словами, пара по существу симметричных модифицированных ITR содержит одинаково организованные в трехмерном пространстве петли A, C-C' и B-B'. Согласно некоторым вариантам реализации ITR из пары mod-ITR могут содержать разные обратно-комплементарные нуклеотидные последовательности, но все же иметь одинаковую симметричную трехмерную пространственную организацию - то есть оба ITR содержат мутации, которые приводят к одной и той же общей трехмерной форме. Например, один ITR (например, 5' ITR) в паре mod-ITR может быть взят из одного серотипа, а другой ITR (например, 3' ITR) может быть взят из другого серотипа, однако оба ITR могут содержать одинаковую соответствующую мутацию (например, в том случае, если 5'ITR содержит делецию в участке C, родственный модифицированный 3'ITR из другого серотипа содержит делецию в аналогичном положении в участке C'), таким образом, что ITR в паре модифицированных ITR имеют одинаковую симметричную трехмерную пространственную организацию. В таких вариантах реализации каждый ITR в паре модифицированных ITR может принадлежать к разным серотипам (например, AAV1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12), таким как комбинация ААV2 и ААV6, причем модификация одного ITR отображается в соответствующем положении родственного ITR другого серотипа. Согласно одному варианту реализации пара по существу симметричных модифицированных ITR относится к паре модифицированных ITR (mod-ITR) при условии, что различие нуклеотидных последовательностей указанных ITR не влияет на свойства или общую форму, и они имеют по существу одинаковую форму в трехмерном пространстве. Неограничивающий пример представлен mod-ITR, последовательность которого по меньшей мере на 95%, 96%, 97%, 98% или 99% идентична каноническому mod-ITR по оценке с применением стандартных способов, хорошо известных в данной области техники, таких как BLAST (Basic Local Alignment Search Tool) или BLASTN, при параметрах, устанавливаемых по умолчанию, а также имеет симметричную трехмерную пространственную организацию, так что их трехмерная структура имеет одинаковую форму в геометрическом пространстве. ITR в паре по существу симметричных mod-ITR содержит одинаковые петли A, C-C'и B-B' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR содержит делецию в плече C-C', то родственный mod-ITR содержит соответствующую делецию в плече C-C', а также имеет аналогичную трехмерную структуру остальных петель A и B-B', принимающую такую же форму в геометрическом пространстве, что и у родственного mod-ITR.[0084] As used herein, the term “substantially symmetric modified ITRs” or “substantially symmetric mod-ITR pair” refers to a pair of modified ITRs in a single ccDNA genome or ccDNA vector that both have reverse complementary sequences throughout their entire length. For example, a modified ITR may be considered substantially symmetrical even though it has some nucleotide sequences that deviate from the reverse complementary sequence, as long as the changes do not affect the properties and overall shape. One non-limiting example is a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, or 99% identical to the canonical sequence (as assessed by BLAST using default parameters), and has a symmetrical three-dimensional spatial organization with respect to the related modified ITR, such that their three-dimensional structures have the same shape in geometric space. In other words, a pair of essentially symmetrical modified ITRs contains loops A, C-C' and B-B' that are identically organized in three-dimensional space. In some embodiments, the ITRs of a mod-ITR pair may contain different reverse complementary nucleotide sequences but still have the same symmetrical three-dimensional spatial organization—that is, both ITRs contain mutations that result in the same overall three-dimensional shape. For example, one ITR (eg, 5' ITR) in a mod-ITR pair may be from one serotype, and the other ITR (eg, 3' ITR) may be from a different serotype, but both ITRs may contain the same corresponding mutation (eg , in the event that a 5'ITR contains a deletion in region C, a related modified 3'ITR from a different serotype contains a deletion at a similar position in region C'), such that the ITRs in a pair of modified ITRs have the same symmetrical three-dimensional spatial organization. In such embodiments, each ITR in a pair of modified ITRs may belong to a different serotype (e.g., AAV1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, and 12), such as a combination of AAV2 and AAV6, wherein the modification of one ITR is mapped to the corresponding position of the related ITR of the other serotype. In one embodiment, a pair of substantially symmetrical modified ITRs is referred to as a modified ITR (mod-ITR) pair, provided that the nucleotide sequence differences between the ITRs do not affect the properties or overall shape and they have substantially the same shape in three-dimensional space. A non-limiting example is provided by a mod-ITR that is at least 95%, 96%, 97%, 98%, or 99% sequence identical to the canonical mod-ITR as assessed using standard methods well known in the art, such as BLAST ( Basic Local Alignment Search Tool, or BLASTN, at its default settings, also has a symmetrical three-dimensional spatial organization, so that their three-dimensional structure has the same shape in geometric space. An ITR in a pair of essentially symmetric mod-ITRs contains identical A, C-C', and B-B' loops in three-dimensional space, e.g., if a modified ITR in a pair of essentially symmetric mod-ITRs contains a deletion in the C-C' arm, then the cognate mod -ITR contains a corresponding deletion in the C-C' arm and also has a similar three-dimensional structure of the remaining A and B-B' loops, adopting the same shape in geometric space as the related mod-ITR.
[0085] Термин «фланкирование» касается относительного положения одной последовательности нуклеиновой кислоты по отношению к другой последовательности нуклеиновой кислоты. В общем, в последовательности ABC A и C фланкируют B. То же самое верно для расположения AxBxC. Таким образом, фланкирующая последовательность предшествует или следует за фланкируемой последовательностью, но не обязательно должна быть смежной с, или непосредственно прилегающей к, фланкируемой последовательности. В одном варианте реализации термин фланкирование относится к концевым повторам на каждом конце линейного дуплексного зкДНК-вектора.[0085] The term “flanking” refers to the relative position of one nucleic acid sequence with respect to another nucleic acid sequence. In general, in the ABC sequence, A and C flank B. The same is true for the AxBxC arrangement. Thus, the flanking sequence precedes or follows the flanking sequence, but need not be adjacent to, or immediately adjacent to, the flanking sequence. In one embodiment, the term flanking refers to the terminal repeats at each end of a linear duplex ccDNA vector.
[0086] Используемый в данном документе термин «геном зкДНК» относится к экспрессионной кассете, которая дополнительно включает по меньшей мере один участок инвертированного концевого повтора. ЗкДНК-геном может дополнительно содержать одну или более спейсерных участков. В некоторых вариантах реализации геном зкДНК включен в виде межмолекулярного дуплексного полинуклеотида ДНК в плазмиду или вирусный геном.[0086] As used herein, the term “ccDNA genome” refers to an expression cassette that further includes at least one inverted terminal repeat region. The cDNA genome may further comprise one or more spacer regions. In some embodiments, the cccDNA genome is included as an intermolecular duplex DNA polynucleotide in a plasmid or viral genome.
[0087] Используемый в данном документе термин «спейсерный участок зкДНК» относится к промежуточной последовательности, которая разделяет функциональные элементы в указанном зкДНК-векторе или геноме зкДНК. Согласно некоторым вариантам реализации спейсерные участки зкДНК удерживают два функциональных элемента на требуемом расстоянии для оптимальной функциональности. Согласно некоторым вариантам реализации спейсерные участки зкДНК обеспечивают или повышают генетическую стабильность зкДНК-генома в составе, например, плазмиды или бакуловируса. Согласно некоторым вариантам реализации спейсерные участки зкДНК облегчают подготовленные генетические манипуляции с зкДНК-геномом, обеспечивая удобное расположение для сайтов клонирования и т.п. Например, согласно определенным аспектам олигонуклеотидный «полилинкер», содержащий несколько сайтов рестрикции эндонуклеазами или последовательность не из открытой рамки считывания, сконструированный так, чтобы он не содержал известных сайтов связывания белка (например, транскрипционного фактора), может быть размещен в зкДНК-геноме для разделения цис-действующих факторов, например, путем вставки 6-мера, 12-мера, 18-мера, 24-мера, 48-мера, 86-мера, 176-мера и т.п. между сайтом концевого разрешения и расположенным в направлении 5' регуляторным элементом транскрипции. Аналогичным образом, спейсер может быть встроен между сигнальной последовательностью полиаденилирования и 3'-сайтом концевого разрешения.[0087] As used herein, the term “cDNA spacer region” refers to an intervening sequence that separates functional elements in a specified ccDNA vector or ccDNA genome. In some embodiments, the cccDNA spacer regions hold two functional elements at a desired distance for optimal functionality. In some embodiments, the cDNA spacer regions provide or enhance the genetic stability of the cDNA genome within, for example, a plasmid or baculovirus. In some embodiments, cccDNA spacer regions facilitate prepared genetic manipulation of the cccDNA genome by providing convenient locations for cloning sites and the like. For example, in certain aspects, an oligonucleotide "polylinker" containing multiple restriction endonuclease sites or non-open reading frame sequence, designed to not contain known protein (e.g., transcription factor) binding sites, can be placed in the cccDNA genome for separation cis-acting factors, for example, by insertion of a 6-mer, 12-mer, 18-mer, 24-mer, 48-mer, 86-mer, 176-mer, etc. between the terminal resolution site and the 5' transcriptional regulatory element. Likewise, a spacer can be inserted between the polyadenylation signal sequence and the 3' end resolution site.
[0088] В данном документе термины «сайт связывания Rep», «связывающий Rep элемент», «RBE» и «RBS» используются взаимозаменяемо и относятся к сайту связывания для белка Rep (например, AAV Rep 78 или AAV Rep 68), который после связывания белком Rep позволяет белку Rep осуществлять сайт-специфическую эндонуклеазную активность в отношении последовательности, включающей RBS. Последовательность RBS вместе с ее обратным комплементом образуют один RBS. Последовательности RBS известны в данной области техники и включают, например, 5'-GCGCGCTCGCTCGCTC-3′ (SEQ ID NO: 531), представляющую собой последовательность RBS, идентифицированную в AAV2. Любая известная последовательность RBS может применяться во вариантах реализации данного изобретения, в том числе другие известные последовательности RBS AAV и другие известные встречающиеся в естественной среде или синтетические последовательности RBS. Без связи с какой-либо теорией, считается, что нуклеазный домен белка Rep связывается с дуплексной последовательностью нуклеотидов GCTC и, соответственно, на дуплексном олигонуклеотиде 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3' (SEQ ID NO: 531) происходит прямое связывание и стабильная сборка двух известных белков Rep AAV. Кроме того, растворимые агрегированные конформеры (т.е., неопределенное число взаимосвязанных белков Rep) диссоциируют и связываются с олигонуклеотидами, которые содержат сайты связывания Rep. Каждый белок Rep взаимодействует и с азотистыми основаниями, и с фосфодиэфирным остовом на каждой цепи. Взаимодействия с азотистыми основаниями обеспечивают специфичность в отношении последовательности, тогда как взаимодействия с фосфодиэфирным остовом неспецифичны или менее специфичны в отношении последовательностей и стабилизируют комплекс белка с ДНК.[0088] As used herein, the terms “Rep binding site,” “Rep binding element,” “RBE,” and “RBS” are used interchangeably and refer to the binding site for a Rep protein (e.g., AAV Rep 78 or AAV Rep 68) that is binding by the Rep protein allows the Rep protein to perform site-specific endonuclease activity against the sequence including the RBS. The RBS sequence together with its reverse complement form one RBS. RBS sequences are known in the art and include, for example, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531), which is the RBS sequence identified in AAV2. Any known RBS sequence may be used in embodiments of the present invention, including other known AAV RBS sequences and other known naturally occurring or synthetic RBS sequences. Without being bound by any theory, it is believed that the nuclease domain of the Rep protein binds to the duplex nucleotide sequence GCTC and, accordingly, on the duplex oligonucleotide 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3' (SEQ ID NO : 531) direct binding and stable assembly of two known AAV Rep proteins occurs. In addition, soluble aggregated conformers (i.e., an indefinite number of interconnected Rep proteins) dissociate and bind to oligonucleotides that contain Rep binding sites. Each Rep protein interacts with both nitrogenous bases and phosphodiester backbones on each chain. Interactions with nitrogenous bases provide sequence specificity, whereas interactions with the phosphodiester backbone are nonspecific or less sequence specific and stabilize the protein-DNA complex.
[0089] Используемые в данном документе термины «сайт концевого разрешения» и «TRS» используются взаимозаменяемо и относятся к участку, в котором Rep образует тирозин-фосфодиэфирную связь с 5'-тимидином, с образованием 3'-ОН, который служит субстратом для удлинения ДНК с помощью клеточной ДНК-полимеразы, например, ДНК-полимеразой дельта или ДНК-полимеразой эпсилон. Как вариант, комплекс Rep-тимидин может принимать участие в скоординированной реакции лигирования. Согласно некоторым вариантам реализации TRS охватывает, как минимум, неспаренное тимидиновое основание. Согласно некоторым вариантам реализации никирующую эффективность TRS по меньшей мере отчасти можно контролировать за счет расстояния между ним и RBS в пределах одной молекулы. Если акцепторный субстрат представляет собой комплементарный ITR, итоговый продукт представляет собой внутримолекулярный дуплекс. TRS последовательности известны в данной области техники, и включают, например, 5'-GGTTGA-3' (SEQ ID NO: 45), представляющую собой гексануклеотидную последовательность, идентифицированную в AAV2. Согласно вариантам реализации данного изобретения может применяться любая известная последовательность TRS, в том числе другие известные последовательности TRS AAV и другие известные природные или синтетические последовательности TRS, такие как AGTT (SEQ ID NO: 46), GGTTGG (SEQ ID NO: 47), AGTTGG (SEQ ID NO: 48), AGTTGA (SEQ ID NO: 49); и другие мотивы, такие как RRTTRR (SEQ ID NO: 50). [0089] As used herein, the terms "terminal resolution site" and "TRS" are used interchangeably and refer to the region at which Rep forms a tyrosine phosphodiester bond with a 5'-thymidine to form a 3'-OH, which serves as a substrate for elongation DNA using a cellular DNA polymerase, such as DNA polymerase delta or DNA polymerase epsilon. Alternatively, the Rep-thymidine complex may participate in a coordinated ligation reaction. In some embodiments, the TRS spans at least an unpaired thymidine base. In some embodiments, the nicking efficiency of the TRS can be controlled at least in part by the distance between it and the RBS within a single molecule. If the acceptor substrate is a complementary ITR, the resulting product is an intramolecular duplex. TRS sequences are known in the art and include, for example, 5'-GGTTGA-3' (SEQ ID NO: 45), which is a hexanucleotide sequence identified in AAV2. In embodiments of the present invention, any known TRS sequence may be used, including other known AAV TRS sequences and other known natural or synthetic TRS sequences, such as AGTT (SEQ ID NO: 46), GGTTGG (SEQ ID NO: 47), AGTTGG (SEQ ID NO: 48), AGTTGA (SEQ ID NO: 49); and other motifs such as RRTTRR (SEQ ID NO: 50).
[0090] Используемый в данном документе термин «зкДНК-плазмида» относится к плазмиде, которая содержит зкДНК-геном в виде межмолекулярного дуплекса.[0090] As used herein, the term “ccDNA plasmid” refers to a plasmid that contains the cccDNA genome as an intermolecular duplex.
[0091] Используемый в данном документе термин «зкДНК-бакмида» относится к геному инфекционного бакуловируса, включающему геном зкДНК в виде межмолекулярного дуплекса, способному размножаться в E. coli в виде плазмиды и, соответственно, выполнять роль челночного вектора для бакуловируса.[0091] As used herein, the term “ccDNA bacmid” refers to an infectious baculovirus genome comprising the cccDNA genome as an intermolecular duplex capable of propagating in E. coli as a plasmid and thus serving as a shuttle vector for the baculovirus.
[0092] В данном документе термин «зкДНК-бакуловирус» относится к бакуловирусу, который содержит геном зкДНК-геном в виде межмолекулярного дуплекса в составе генома бакуловируса.[0092] As used herein, the term “ccDNA-baculovirus” refers to a baculovirus that contains a cccDNA genome as an intermolecular duplex within the baculovirus genome.
[0093] В данном документе термины «инфицированная зкДНК-бакуловирусом клетка насекомого» и «зкДНК-BIIC» используются взаимозаменяемо и относятся к клетке-хозяину беспозвоночного животного (включая, без ограничений, клетку насекомого (например, клетку Sf9)), инфицированную зкДНК-бакуловирусом.[0093] As used herein, the terms “ccDNA-baculovirus-infected insect cell” and “ccDNA-BIIC” are used interchangeably and refer to an invertebrate animal host cell (including, without limitation, an insect cell (e.g., an Sf9 cell)) infected with cccDNA-BIIC. baculovirus.
[0094] В данном документе термин «зкДНК» относится к бескапсидной замкнутой линейной двухцепочечной (дц) дуплексной ДНК для невирусного переноса генов, синтетической или другой. Подробное описание зкДНК приведено в международной заявке PCT/US2017/020828, поданной 3 марта 2017 г., содержание которой полностью явным образом включено в данный документ посредством ссылки. Некоторые способы получения зкДНК-вектора, содержащего различные последовательности и конфигурации инвертированных концевых повторов (ITR), с использованием клеточных методов описаны в примере 1 в международной заявке PCT/US18/49996, поданной 7 сентября 2018 г., и международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., каждая из которых полностью включена в данный документ посредством ссылки. Некоторые способы получения синтетических зкДНК-векторов содержащие различные последовательности и конфигурации ITR, описаны, например, в международной заявке PCT/US2019/14122, поданной 18 января 2019 г., содержание которой полностью включено в данный документ посредством ссылки. [0094] As used herein, the term “ccDNA” refers to capsidless, closed linear double-stranded (ds) duplex DNA for non-viral gene transfer, synthetic or otherwise. A detailed description of cccDNA is contained in international application PCT/US2017/020828, filed March 3, 2017, the contents of which are expressly incorporated herein by reference in their entirety. Some methods for producing a cccDNA vector containing various sequences and inverted terminal repeat (ITR) configurations using cellular methods are described in example 1 in international application PCT/US18/49996, filed September 7, 2018, and international application PCT/US2018/ 064242, filed December 6, 2018, each of which is incorporated herein by reference in its entirety. Some methods for producing synthetic cccDNA vectors containing different ITR sequences and configurations are described, for example, in international application PCT/US2019/14122, filed January 18, 2019, the contents of which are incorporated herein by reference in their entirety.
[0095] Используемый в данном документе термин «ДНК-вектор с замкнутыми концами» относится к бескапсидному ДНК-вектору с по меньшей мере одним ковалентно замкнутым концом, причем по меньшей мере часть вектора имеет структуру внутримолекулярного дуплекса. [0095] As used herein, the term “closed-end DNA vector” refers to a non-capsid DNA vector with at least one covalently closed end, wherein at least a portion of the vector has an intramolecular duplex structure.
[0096] Используемые в данном документе термины «зкДНК-вектор» и «зкДНК» используются взаимозаменяемо и относятся к ДНК-вектору с замкнутыми концами, содержащему по меньшей мере один концевой палиндром. Согласно некоторым вариантам реализации указанная зкДНК содержит два ковалентно замкнутых конца. [0096] As used herein, the terms “ccDNA vector” and “ccDNA” are used interchangeably and refer to a closed-ended DNA vector containing at least one terminal palindrome. In some embodiments, the cccDNA comprises two covalently closed ends.
[0097] В данном документе термин «нкДНК» или «никированная зкДНК» относится к ДНК с замкнутыми концами, содержащей разрыв или пропуск размером 1-100 пар оснований в участке «стебля» или спейсерном участке 5', расположенном выше открытой рамки считывания (например, промотор и трансген для экспрессии). [0097] As used herein, the term “ncDNA” or “nicked cccDNA” refers to closed-ended DNA containing a 1-100 base pair break or gap in the stem region or 5' spacer region located upstream of the open reading frame (eg , promoter and transgene for expression).
[0098] В данном документе термины «пропуск» и «разрыв» используются взаимозаменяемо и относятся к прерванной части синтетического ДНК-вектора согласно данному изобретению, создавая отрезок части одноцепочечной ДНК в двухцепочечной зкДНК. Длина пропуска может составлять от одной 1 пары оснований до 100 пар оснований в одной цепи дуплексной ДНК. Типичные пропуски, разработанные и созданные с применением способов, описанных в данном документе, и синтетические векторы, полученные указанными способами, могут иметь длину, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 или 60 пар оснований. Примеры пропусков в данном описании могут иметь длину от 1 пар оснований до 10 пар оснований, от 1 до 20 пар оснований, от 1 до 30 пар оснований. [0098] As used herein, the terms “gap” and “break” are used interchangeably and refer to the interrupted portion of the synthetic DNA vector of the present invention, creating a stretch of a portion of single-stranded DNA in double-stranded ccDNA. The length of the gap can be from one 1 base pair to 100 base pairs in one strand of duplex DNA. Typical gaps designed and created using the methods described herein, and synthetic vectors obtained by these methods, may have a length of, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 , 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 or 60 base pairs . Examples of gaps herein may range in length from 1 bp to 10 bp, from 1 to 20 bp, from 1 to 30 bp.
[0099] Как определено в данном документе, «репортеры» относятся к белкам, которые могут использоваться для обеспечения детектируемых показаний. Репортеры обычно продуцируют измеримый сигнал, например, флуоресцентный, цветовой или люминесцентный. Кодирующие последовательности репортерных белков кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Типичные примеры репортерных полипептидов, пригодных для экспериментальных или диагностических целей, включают, без ограничений, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (ЩФ), тимидинкиназу (TK), зеленый флуоресцентный белок (ЗФБ) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (ХАТ), люциферазу и другие, хорошо известные в данной области техники. [0099] As defined herein, “reporters” refer to proteins that can be used to provide detectable readouts. Reporters typically produce a measurable signal, such as fluorescence, color, or luminescence. Reporter protein coding sequences encode proteins whose presence in a cell or organism can be easily observed. For example, fluorescent proteins cause a cell to fluoresce when excited by light of a specific wavelength, luciferases cause a cell to catalyze a reaction that generates light, and enzymes such as β-galactosidase convert a substrate into a colored product. Typical examples of reporter polypeptides useful for experimental or diagnostic purposes include, but are not limited to, β-lactamase, β-galactosidase (LacZ), alkaline phosphatase (ALP), thymidine kinase (TK), green fluorescent protein (GFP), and other fluorescent proteins. chloramphenicol acetyltransferase (ChAT), luciferase and others well known in the art.
[00100] Используемый в данном документе термин «эффекторный белок» относится к полипептиду, который обеспечивает детектируемые показания, либо, например, как репортерный полипептид, либо, более предпочтительно, как полипептид, убивающий клетку, например, токсин, или агент, придающий клетке чувствительность к убиванию определенным агентом или при отсутствии определенного агента. Эффекторные белки включают любой белок или пептид, который прямо нацелен на ДНК и/или РНК клетки-хозяина или повреждает их. Например, эффекторные белки могут включать, не ограничиваясь перечисленными, рестрикционную эндонуклеазу, которая нацелена на последовательность ДНК клетки-хозяина (геномный или внехромосомный элемент), протеазу, расщепляющую полипептид-мишень, необходимый для выживания клетки, ингибитор ДНК-гиразы и токсин рибонуклеазного типа. В некоторых вариантах реализации экспрессия эффекторного белка, контролируемая синтетическим биологическим контуром, как описано в данном документе, может принимать участие в качестве фактора в другом синтетическом биологическом контуре, с расширением таким образом диапазона и сложности отклика системы биологического контура. [00100] As used herein, the term "effector protein" refers to a polypeptide that provides a detectable readout, either, for example, as a reporter polypeptide, or, more preferably, as a cell killing polypeptide, such as a toxin, or a cell sensitizing agent. to killing by a specific agent or in the absence of a specific agent. Effector proteins include any protein or peptide that directly targets or damages the DNA and/or RNA of a host cell. For example, effector proteins may include, but are not limited to, a restriction endonuclease that targets a host cell DNA sequence (genomic or extrachromosomal element), a protease that cleaves a target polypeptide essential for cell survival, a DNA gyrase inhibitor, and a ribonuclease-type toxin. In some embodiments, effector protein expression controlled by a synthetic biological circuit as described herein may participate as a factor in another synthetic biological circuit, thereby expanding the range and complexity of the response of the biological circuit system.
[00101] Регуляторы транскрипции относятся к активаторам и репрессорам транскрипции, которые либо активируют, либо подавляют транскрипцию гена, представляющего интерес. Промоторы представляют собой участки нуклеиновой кислоты, которые инициируют транскрипцию конкретного гена. Активаторы транскрипции обычно связываются поблизости от транскрипционных промоторов и рекрутируют РНК-полимеразу, чтобы прямо инициировать транскрипцию. Репрессоры связываются с промоторами транскрипции и стерически препятствуют инициации транскрипции РНК-полимеразой. Другие регуляторы транскрипции могут служить либо активатором, либо репрессором в зависимости от места их связывания и условий в клетке и окружающей среде. Неограничивающие примеры классов регуляторов транскрипции включают, без ограничений, гомеодоменные белки, белки с мотивом «цинковый палец», белки с мотивом «крылатая спираль» (forkhead-белки) и белки с мотивом «лейциновая застежка».[00101] Transcription regulators refer to transcriptional activators and repressors that either activate or repress transcription of a gene of interest. Promoters are sections of nucleic acid that initiate transcription of a particular gene. Transcription activators typically bind in the vicinity of transcriptional promoters and recruit RNA polymerase to directly initiate transcription. Repressors bind to transcriptional promoters and sterically interfere with the initiation of transcription by RNA polymerase. Other transcriptional regulators can serve as either an activator or a repressor depending on where they bind and the conditions in the cell and environment. Non-limiting examples of classes of transcription regulators include, but are not limited to, homeodomain proteins, zinc finger proteins, forkhead proteins, and leucine zipper proteins.
[00102] При использовании в данном документе, «белок-репрессор» или «белок-индуктор» представляет собой белок, который связывается с элементом регуляторной последовательности и подавляет или активирует, соответственно, транскрипцию последовательностей, функционально связанных с указанным элементом регуляторной последовательности. Предпочтительные репрессорные и индукторные белки согласно описанию в данном документе чувствительны к присутствию или отсутствию по меньшей мере одного входного агента или фактора внешней среды. Предпочтительные белки, как описано в данном документе, являются модульными по форме и содержат, например, отделяемые ДНК-связывающие и связывающие вводимые агенты, или откликающиеся на них элементы или домены. [00102] As used herein, a “repressor protein” or an “inducer protein” is a protein that binds to a regulatory sequence element and represses or activates, respectively, the transcription of sequences operably associated with said regulatory sequence element. Preferred repressor and inducer proteins as described herein are sensitive to the presence or absence of at least one input agent or environmental factor. Preferred proteins, as described herein, are modular in form and contain, for example, detachable DNA-binding and binding input agents, or elements or domains responsive thereto.
[00103] Используемый в данном документе термин «носитель» включает любые и все возможные растворители, дисперсионные среды, основы, покрытия, разбавители, антибактериальные и противогрибковые агенты, изотонические и замедляющие абсорбцию агенты, буферы, растворы-носители, суспензии, коллоиды и т.п. Применение таких сред и агентов для фармацевтически активных веществ хорошо известно в данной области техники. Также вспомогательные активные ингредиенты могут быть включены в указанные композиции. Выражение «фармацевтически приемлемый» относится к молекулярным объектам и композициям, которые не приводят к токсической, аллергической или аналогичной нежелательной реакции при введении хозяину. [00103] As used herein, the term “carrier” includes any and all possible solvents, dispersion media, bases, coatings, diluents, antibacterial and antifungal agents, isotonic and absorption retarding agents, buffers, carrier solutions, suspensions, colloids, etc. P. The use of such media and agents for pharmaceutically active substances is well known in the art. Also, auxiliary active ingredients can be included in these compositions. The expression "pharmaceutically acceptable" refers to molecular entities and compositions that do not result in a toxic, allergic or similar adverse reaction when administered to a host.
[00104] Используемый в данном документе термин «домен, реагирующий на вводимый агент», представляет собой домен транскрипционного фактора, который связывает или иначе отвечает на условие или вводимый агент, обеспечивая реакцию присоединенного к нему ДНК-связывающего слитого домена на наличие указанного условия или входного воздействия. Согласно одному варианту реализации присутствие указанного условия или входного агента приводит к конформационному изменению в отвечающем на входной агент домене, или в белке, с которым он слит, которое модифицирует модулирующую транскрипцию активность транскрипционного фактора.[00104] As used herein, the term “input agent responsive domain” is a transcription factor domain that binds or otherwise responds to a condition or input agent by causing the DNA binding fusion domain attached thereto to respond to the presence of the condition or input impact. In one embodiment, the presence of said condition or input agent results in a conformational change in the input agent response domain, or in the protein to which it is fused, that modifies the transcription modulating activity of the transcription factor.
[00105] Термин «in vivo» относится к анализам или способам, которые реализуют на организме или в организме, таком как многоклеточное животное. Согласно некоторым описанным здесь аспектам, может быть указано, что способ или применение реализуют «in vivo», если используется одноклеточный организм, такой как бактерия. Термин «ex vivo» относится к способам и применению, которые реализуют с использованием живой клетки с интактной мембраной, находящейся вне организма многоклеточного животного или растения, например, эксплантаты, культивируемые клетки, в том числе первичные клетки и линии клеток, трансформированные линии клеток, и экстрагированные ткани или клетки, включая, в том числе, клетки крови. Термин «in vitro» относится к анализам и способам, которые не требуют присутствия клетки с интактной мембраной, например, клеточных экстрактов, и могут относиться к введению программируемой синтетической биологической цепи в бесклеточной системе, такой как среда, не содержащая клеток или клеточных систем, таких как клеточные экстракты.[00105] The term "in vivo" refers to assays or methods that are performed on or in an organism, such as a multicellular animal. In certain aspects described herein, the method or use may be stated to be performed "in vivo" if a single cell organism, such as a bacterium, is used. The term "ex vivo" refers to methods and uses that are carried out using a living cell with an intact membrane located outside the body of a multicellular animal or plant, for example, explants, cultured cells, including primary cells and cell lines, transformed cell lines, and extracted tissues or cells, including but not limited to blood cells. The term "in vitro" refers to assays and methods that do not require the presence of a cell with an intact membrane, such as cell extracts, and may refer to the introduction of a programmable synthetic biological circuit in a cell-free system, such as an environment containing no cells or cellular systems such as cell extracts.
[00106] Термин «промотор» в данном документе относится к любой последовательности нуклеиновой кислоты, которая регулирует экспрессию другой последовательности нуклеиновой кислоты за счет управления транскрипцией указанной последовательности нуклеиновой кислоты, которая может представлять собой гетерологичный целевой ген, кодирующий белок или РНК. Промоторы может быть конститутивными, индуцируемыми, репрессируемыми, тканеспецифическими или представлять собой любую комбинацию перечисленного. Промотор представляет собой контрольный участок последовательности нуклеиновой кислоты, в которой осуществляется контроль инициации и скорости транскрипции остальной части последовательности нуклеиновой кислоты. Промотор может также содержать генетические элементы, с которыми могут связываться регуляторные белки и молекулы, такие как РНК-полимераза и другие транскрипционные факторы. Согласно некоторым вариантам реализации описанных в данном документе аспектов промотор может управлять экспрессией транскрипционного фактора, который регулирует экспрессию самого промотора, или экспрессию другого промотора, используемого в другом модульном компоненте синтетических биологических цепей, описанных в данном документе. В последовательности промотора расположен сайт инициации транскрипции, а также связывающие белки домены, отвечающие за связывание РНК-полимеразы. Эукариотические промоторы часто, однако не всегда содержат «TATA»-боксы и «CAT»-боксы. Различные промоторы, в том числе индуцируемые промоторы, могут применяться для управления экспрессией трансгенов в зкДНК-векторах согласно описанию в данном документе.[00106] The term “promoter” as used herein refers to any nucleic acid sequence that regulates the expression of another nucleic acid sequence by driving the transcription of said nucleic acid sequence, which may be a heterologous target gene encoding a protein or RNA. Promoters can be constitutive, inducible, repressible, tissue specific, or any combination of the above. A promoter is a control region of a nucleic acid sequence that controls the initiation and rate of transcription of the rest of the nucleic acid sequence. A promoter may also contain genetic elements to which regulatory proteins and molecules, such as RNA polymerase and other transcription factors, can bind. In some embodiments of aspects described herein, a promoter may drive the expression of a transcription factor that controls the expression of the promoter itself, or the expression of another promoter used in another modular component of the synthetic biological circuits described herein. The promoter sequence contains the transcription initiation site, as well as protein-binding domains responsible for binding RNA polymerase. Eukaryotic promoters often, but not always, contain TATA boxes and CAT boxes. Various promoters, including inducible promoters, can be used to drive the expression of transgenes in cDNA vectors as described herein.
[00107] Термин «энхансер» в данном документе относится к действующей в цис-положении (цис-действующей) регуляторной последовательности (например, размером 50-1500 пар оснований), которая связывает один или более белков (например, белки-активаторы или транскрипционный фактор) для усиления транскрипционной активации последовательности нуклеиновой кислоты. Энхансеры могут быть расположены на расстоянии до 1 000 000 пар оснований в 5'-направлении от сайта начала гена или в 3'-направлении от сайта начала гена, который они регулируют. Энхансер может быть расположен в пределах интронного участка или в экзонном участке неродственного гена. [00107] The term “enhancer” as used herein refers to a cis-acting regulatory sequence (e.g., 50-1500 base pairs in size) that binds one or more proteins (e.g., activator proteins or transcription factor ) to enhance transcriptional activation of a nucleic acid sequence. Enhancers can be located up to 1,000,000 base pairs 5' from the start site of the gene or 3' from the start site of the gene they regulate. The enhancer may be located within an intronic region or within an exonic region of an unrelated gene.
[00108] Можно сказать, что промотор управляет экспрессией или управляет транскрипцией последовательности нуклеиновой кислоты, которую он регулирует. Выражения «функционально связанный», «функционально расположенный», «с функциональной связью», «под контролем» и «под транскрипционным контролем» указывают, что промотор находится в корректном функциональном положении и/или ориентации относительно последовательности нуклеиновой кислоты, которую он регулирует, для контроля инициации транскрипции и/или экспрессии этой последовательности. «Инвертированный промотор» в данном документе относится к промотору, последовательность нуклеиновой кислоты в котором располагается в обратной ориентации, так что цепь, которая была смысловой, становится некодирующей цепью, и наоборот. Последовательности инвертированных промоторов могут применяться, согласно различным вариантам реализации, для регуляции состояния переключателя. Кроме того, согласно различным вариантам реализации промотор может применяться в сочетании с энхансером.[00108] A promoter can be said to drive the expression or drive the transcription of the nucleic acid sequence that it regulates. The expressions "operably linked", "operably located", "functionally linked", "under control" and "under transcriptional control" indicate that the promoter is in the correct functional position and/or orientation relative to the nucleic acid sequence that it regulates for control of transcription initiation and/or expression of this sequence. "Inverted promoter" as used herein refers to a promoter in which the nucleic acid sequence is arranged in reverse orientation such that a strand that was a sense strand becomes a non-coding strand and vice versa. Inverted promoter sequences can be used, according to various embodiments, to regulate the state of a switch. Additionally, in various embodiments, a promoter may be used in combination with an enhancer.
[00109] Промотор может быть представлен промотором, в естественных условиях, ассоциированным с геном или последовательностью, а также может быть получен путем выделения некодирующих 5' последовательностей, расположенных в 5' направлении от кодирующего сегмента и/или экзона определенного гена или последовательности. Такой промотор может называться «эндогенным». Аналогичным образом, согласно некоторым вариантам реализации энхансер может быть представлен энхансером, в естественных условиях ассоциированным с последовательностью нуклеиновой кислоты, расположенной либо в 5'-3', либо в 3'-5' направлении от указанной последовательности. [00109] A promoter can be a promoter naturally associated with a gene or sequence, and can also be obtained by isolating 5' non-coding sequences located 5' in the direction of the coding segment and/or exon of a particular gene or sequence. Such a promoter may be called "endogenous". Likewise, in some embodiments, an enhancer may be an enhancer naturally associated with a nucleic acid sequence located either in the 5'-3' or 3'-5' direction of the sequence.
[00110] Согласно некоторым вариантам реализации кодирующий сегмент нуклеиновой кислоты расположен под контролем «рекомбинантного промотора» или «гетерологичного промотора»; оба указанных термина относятся к промотору, в норме не ассоциированному с кодируемой последовательностью нуклеиновой кислоты, с которой промотор функционально связан в естественной среде. Рекомбинантный или гетерологичный энхансер относится к энхансеру, в норме не ассоциированному с определенной последовательностью нуклеиновой кислоты в естественной среде. Такие промоторы или энхансеры могут включать промоторы или энхансеры других генов; промоторы или энхансеры, выделенные из любой другой прокариотической, вирусной или эукариотической клетки; и синтетические промоторы или энхансеры, которые не являются «встречающимися в природе», т.е., содержат другие элементы других транскрипционных регуляторных участков, и/или мутации, которые изменяют экспрессию, полученные с помощью способов генетического конструирования, которые известны в данной области техники. Наряду с получением последовательностей нуклеиновых кислот промоторов и энхансеров синтетическим путем, последовательности промоторов могут быть получены с применением технологии рекомбинантного клонирования и/или амплификации нуклеиновой кислоты, в том числе ПЦР, применительно к синтетическим биологическим цепям и модулям согласно описанию в данном документе (см., например, патент США №4683202, патент США №5928906, каждый из которых включен в данный документ посредством ссылки). Кроме того, предусматривается также возможность применения контрольных последовательностей, которые направляют транскрипцию и/или экспрессию последовательностей в неядерных органеллах, таких как митохондрии, хлоропласты и т.п.[00110] In some embodiments, the coding segment of the nucleic acid is located under the control of a “recombinant promoter” or “heterologous promoter”; both of these terms refer to a promoter not normally associated with the encoded nucleic acid sequence to which the promoter is operably associated in the natural environment. A recombinant or heterologous enhancer refers to an enhancer that is not normally associated with a particular nucleic acid sequence in its natural environment. Such promoters or enhancers may include promoters or enhancers of other genes; promoters or enhancers isolated from any other prokaryotic, viral or eukaryotic cell; and synthetic promoters or enhancers that are not "naturally occurring", i.e., contain other elements of other transcriptional regulatory regions, and/or mutations that alter expression, obtained using genetic engineering methods that are known in the art . In addition to obtaining promoter and enhancer nucleic acid sequences synthetically, promoter sequences can be obtained using recombinant cloning and/or nucleic acid amplification technology, including PCR, in relation to synthetic biological circuits and modules as described herein (see, for example, US Patent No. 4683202, US Patent No. 5928906, each of which is incorporated herein by reference). In addition, it is also possible to use control sequences that direct transcription and/or expression of sequences in non-nuclear organelles such as mitochondria, chloroplasts, and the like.
[00111] Как описано в данном документе, «индуцибельный промотор» представляет собой промотор, который характеризуется инициацией или усилением транскрипционной активности в присутствии, под влиянием, или при контакте с, индуктором или индуцирующим агентом. «Индуктор» или «индуцирующий агент» согласно определению в данном документе может быть эндогенным или в норме экзогенным соединением или белком, который вводят таким образом, чтобы он был активен в отношении индукции транскрипционной активности индуцируемого промотора. Согласно некоторым вариантам реализации указанный индуктор или индуцирующий агент, т.е., химическое вещество, соединение или белок, сам может быть результатом транскрипции или экспрессии последовательности нуклеиновой кислоты (т.е., индуктор может представлять собой индукторный белок, экспрессируемый другим компонентом или модулем), который сам может быть под контролем или представлять собой индуцируемый промотор. Согласно некоторым вариантам реализации индуцируемый промотор индуцируется в отсутствие определенных агентов, таких как репрессор. Примеры индуцируемых промоторов включают, не ограничиваясь перечисленными, тетрациклин, металлотионин, экдизон, вирусы млекопитающих (например, поздний аденовирусный промотор; длинный концевой повтор вируса опухоли молочной железы мышей (MMTV-LTR)) и другие отвечающие на стероиды промоторы, промоторы, отвечающие на рапамицин и т.п. [00111] As described herein, an “inducible promoter” is a promoter that is characterized by initiation or enhancement of transcriptional activity in the presence of, under the influence of, or upon contact with, an inducer or inducing agent. An "inducer" or "inducing agent" as defined herein may be an endogenous or normally exogenous compound or protein that is administered such that it is active in inducing the transcriptional activity of an inducible promoter. In some embodiments, said inducer or inducing agent, i.e., a chemical, compound, or protein, may itself be the result of transcription or expression of a nucleic acid sequence (i.e., the inducer may be an inducer protein expressed by another component or module ), which itself may be under the control or be an inducible promoter. In some embodiments, the inducible promoter is induced in the absence of certain agents, such as a repressor. Examples of inducible promoters include, but are not limited to, tetracycline, metallothioneine, ecdysone, mammalian viruses (eg, adenoviral late promoter; murine mammary tumor virus long terminal repeat (MMTV-LTR)) and other steroid-responsive promoters, rapamycin-responsive promoters and so on.
[00112] Термин «субъект» в данном документе относится к человеку или животному, для которого предложено лечение, в том числе профилактическое лечение, зкДНК-вектором в соответствии с данным изобретением. Обычно указанное животное представляет собой позвоночное, такое как, не ограничиваясь перечисленными, примат, грызун, домашнее животное или дичь. Приматы включают, не ограничиваясь перечисленными, шимпанзе, яванского макака, паукообразных обезьян и макак, например, макака-резус. Грызуны включают мышей, крыс, сурков, хорьков, кроликов и хомяков. Домашние и дикие животные включают, не ограничиваясь перечисленными, коров, лошадей, свиней, оленей, бизонов, буйволов, кошачьих, например, домашних кошек, собачьих, например, собак, лисиц, волков, виды птиц, например, курицу, эму, страуса, и рыб, например, форель, сома и лосося. Согласно определенным вариантам реализации аспектов, описанных в данном документе, указанный субъект представляет собой млекопитающее, например, примата или человека. Субъект может быть мужского или женского пола. Кроме того, субъект может представлять собой младенца или ребенка. Согласно некоторым вариантам реализации указанный субъект может представлять собой новорожденного или нерожденного субъекта, например, субъект находится in utero. Предпочтительно, указанный субъект представляет собой млекопитающее. Указанное млекопитающее может представлять собой человека, не человекообразного примата, мышь, крысу, собаку, кошку, лошадь или корову, однако указанные примеры не являются ограничивающими. Млекопитающие, отличные от человека, могут быть целесообразным образом использованы в качестве субъектов в животных моделях заболеваний и расстройств. Кроме того, описанные в данном документе способы и композиции могут применяться для одомашненных животных и/или домашних питомцев. Субъект-человек может быть любого возраста, пола, принадлежать к любой расе или этнической группе, например, представлять собой европеоида (белая раса), азиата, африканца, чернокожего, афроамериканца, афро-европейца, латиноамериканца, иметь ближневосточное происхождение и т.п. Согласно некоторым вариантам реализации субъект может представлять собой пациента или другого субъекта в клинических условиях. Согласно некоторым вариантам реализации указанный субъект уже проходит лечение. [00112] The term “subject” as used herein refers to a human or animal subject to treatment, including prophylactic treatment, with a cccDNA vector in accordance with this invention. Typically, said animal is a vertebrate such as, but not limited to, a primate, rodent, domestic animal or game. Primates include, but are not limited to, chimpanzees, cynomolgus monkeys, spider monkeys, and macaques such as rhesus monkeys. Rodents include mice, rats, marmots, ferrets, rabbits and hamsters. Domestic and wild animals include, but are not limited to, cows, horses, pigs, deer, bison, buffalo, felines such as domestic cats, canids such as dogs, foxes, wolves, bird species such as chicken, emu, ostrich, and fish such as trout, catfish and salmon. In certain embodiments of the aspects described herein, the subject is a mammal, such as a primate or a human. The subject may be male or female. In addition, the subject may be an infant or child. In some embodiments, the subject may be a newborn or unborn subject, for example, the subject is in utero. Preferably, said subject is a mammal. The mammal may be a human, non-human primate, mouse, rat, dog, cat, horse or cow, but these examples are not limiting. Mammals other than humans may be usefully used as subjects in animal models of diseases and disorders. In addition, the methods and compositions described herein can be used for domesticated animals and/or pets. The human subject may be of any age, gender, race or ethnicity, such as Caucasian (White), Asian, African, Black, African American, Afro-European, Hispanic, Middle Eastern, etc. In some embodiments, the subject may be a patient or other subject in a clinical setting. In some embodiments, the subject is already undergoing treatment.
[00113] В данном контексте термин «антитело» используется в самом широком смысле и охватывает различные структуры антител, в том числе, но не ограничиваясь перечисленными, моноклональные антитела, поликлональные антитела, мультиспецифические антитела (например, биспецифические антитела) и фрагменты антител, при условии, что они демонстрируют требуемую антигенсвязывающую активность. «Фрагмент антитела» относится к молекуле, отличной от интактного антитела, которая содержит часть интактного антитела, которая связывает тот же антиген, с которым связывается интактное антитело. Согласно одному варианту реализации антитело или его фрагмент содержит цепь иммуноглобулина или фрагмент антитела и по меньшей мере одну последовательность вариабельного домена иммуноглобулина. Примеры антител или их фрагментов включают, не ограничиваясь перечисленными, Fv, scFv, Fab-фрагмент, Fab', F(ab')2, Fab'-SH, однодоменное антитело (dAb), тяжелую цепь, легкую цепь, тяжелую и легкую цепь, полное антитело (например, включающее все из Fc, Fab, тяжелых цепей, легких цепей, вариабельных участков и т.п.), биспецифическое антитело, диатело, линейное антитело, одноцепочечное антитело, интратело, моноклональное антитело, химерное антитело, мультиспецифическое антитело или мультимерное антитело. Антитело или его фрагмент может относиться к любому классу, в том числе, но не ограничиваясь перечисленными, IgA, IgD, IgE, IgG и IgM, и любому их подклассу, в том числе, но не ограничиваясь перечисленными, IgG1, IgG2, IgG3, IgG4, IgA1 и IgA2. Кроме того, антитело может быть получено от любого млекопитающего, например, приматов, людей, крыс, мышей, лошадей, коз и т.д. Согласно одному варианту реализации указанное антитело представляет собой антитело человека или гуманизированное антитело. Согласно некоторым вариантам реализации указанное антитело представляет собой модифицированное антитело. Согласно некоторым вариантам реализации компоненты антитела могут экспрессироваться отдельно, таким образом, чтобы после экспрессии белковых компонентов происходила самосборка антитела. Согласно некоторым вариантам реализации указанное антитело «гуманизировано» для снижения иммуногенных реакций у человека. Согласно некоторым вариантам реализации указанное антитело обладает требуемой функцией, например, функцией взаимодействия с нужным белком и его ингибирование для лечения заболевания или симптома заболевания. Согласно одному варианту реализации указанное антитело или его антигенсвязывающий фрагмент содержит каркасный участок или участок Fc.[00113] As used herein, the term "antibody" is used in the broadest sense to cover a variety of antibody structures, including, but not limited to, monoclonal antibodies, polyclonal antibodies, multispecific antibodies (e.g., bispecific antibodies), and antibody fragments, provided that they demonstrate the required antigen-binding activity. "Antibody fragment" refers to a molecule, other than an intact antibody, that contains a portion of the intact antibody that binds the same antigen to which the intact antibody binds. In one embodiment, the antibody or fragment thereof comprises an immunoglobulin chain or antibody fragment and at least one immunoglobulin variable domain sequence. Examples of antibodies or fragments thereof include, but are not limited to, Fv, scFv, Fab fragment, Fab', F(ab') 2 , Fab'-SH, single domain antibody (dAb), heavy chain, light chain, heavy and light chain , a complete antibody (e.g., including all of Fc, Fab, heavy chains, light chains, variable regions, etc.), bispecific antibody, diabody, linear antibody, single chain antibody, intrabody, monoclonal antibody, chimeric antibody, multispecific antibody, or multimeric antibody. The antibody or fragment thereof may belong to any class, including, but not limited to, IgA, IgD, IgE, IgG and IgM, and any subclass thereof, including, but not limited to, IgG1, IgG2, IgG3, IgG4 , IgA1 and IgA2. In addition, the antibody can be obtained from any mammal, such as primates, humans, rats, mice, horses, goats, etc. In one embodiment, said antibody is a human antibody or a humanized antibody. In some embodiments, the antibody is a modified antibody. In some embodiments, the antibody components may be expressed separately such that the antibody self-assembles upon expression of the protein components. In some embodiments, the antibody is "humanized" to reduce immunogenic reactions in humans. In some embodiments, the antibody has a desired function, for example, the function of interacting with and inhibiting a desired protein to treat a disease or symptom of a disease. In one embodiment, said antibody or antigen-binding fragment thereof comprises a framework region or Fc region.
[00114] В данном документе термин «антигенсвязывающий домен» молекулы антитела относится к части молекулы антитела, например, молекулы иммуноглобулина (Ig), которая принимает участие в связывании антигена. Согласно вариантам реализации указанный сайт связывания антигена образован остатками аминокислот вариабельных (V) участков тяжелой (H) и легкой (L) цепей. Три высоконеоднородных участка в вариабельных участках тяжелой и легкой цепей, называемые гипервариабельными участками, располагаются между более консервативными фланкирующими отрезками, называемыми «каркасными участками» (FR). FR представляют собой аминокислотные последовательности, которые в естественных условиях расположены между гипервариабельными участками в иммуноглобулинах и примыкают к ним. Согласно вариантам реализации в молекуле антитела три гипервариабельных участка легкой цепи и три гипервариабельных участка тяжелой цепи расположены друг относительно друга в трехмерном пространстве таким образом, что они образуют антигенсвязывающую поверхность, комплементарную трехмерной поверхности связываемого антигена. Указанные три гипервариабельные участки каждой из тяжелой и легкой цепей называются «определяющими комплементарность участками» или «CDR». Каркасный участок и CDR были определены и описаны, например, в источниках: Kabat, E. A., et al. (1991) Sequences of Proteins of Immunological Interest, Fifth Edition, U.S. Department of Health and Human Services, NIH Publication No. 91-3242, и Chothia, C. et al. (1987) J. Mol. Biol. 196:901-917. Каждая вариабельная цепь (например, вариабельная тяжелая цепь и вариабельная легкая цепь), как правило, состоит из трех CDR и четырех FR, расположенных в последовательности аминокислот, в направлении от аминоконца к карбоксильному концу, в следующем порядке: FR1, CDR1, FR2, CDR2, FR3, CDR3 и FR4.[00114] As used herein, the term “antigen binding domain” of an antibody molecule refers to the portion of an antibody molecule, such as an immunoglobulin (Ig) molecule, that is involved in binding an antigen. In embodiments, said antigen binding site is formed by amino acid residues of the variable (V) regions of the heavy (H) and light (L) chains. Three highly heterogeneous regions in the variable regions of the heavy and light chains, called hypervariable regions, are located between more conserved flanking regions called “framework regions” (FR). FRs are amino acid sequences that naturally occur between and adjacent to hypervariable regions in immunoglobulins. In embodiments, the antibody molecule has three light chain hypervariable regions and three heavy chain hypervariable regions located relative to each other in three-dimensional space such that they form an antigen-binding surface complementary to the three-dimensional surface of the antigen being bound. These three hypervariable regions of each of the heavy and light chains are called “complementarity determining regions” or “CDRs”. The framework region and CDR have been defined and described, for example, in: Kabat, E. A., et al. (1991) Sequences of Proteins of Immunological Interest, Fifth Edition, U.S. Department of Health and Human Services, NIH Publication No. 91-3242, and Chothia, C. et al. (1987) J. Mol. Biol. 196:901-917. Each variable chain (eg, variable heavy chain and variable light chain) typically consists of three CDRs and four FRs arranged in amino acid sequence, from the amino terminus to the carboxyl terminus, in the following order: FR1, CDR1, FR2, CDR2 , FR3, CDR3 and FR4.
[00115] В данном документе термин «полноразмерное антитело» относится к молекуле иммуноглобулина (Ig) (например, IgG-антителу), например, встречающейся в природе и образующейся в результате нормальных процессов рекомбинации фрагментов иммуноглобулиновых генов.[00115] As used herein, the term “full-length antibody” refers to an immunoglobulin (Ig) molecule (e.g., an IgG antibody), for example, naturally occurring and resulting from normal recombination processes of immunoglobulin gene fragments.
[00116] В данном документе термин «функциональный фрагмент антитела» относится к фрагменту, который связывается с тем же антигеном, что и распознаваемый интактным (например, полноразмерным) антителом. Термины «фрагмент антитела» или «функциональный фрагмент» также включают выделенные фрагменты, состоящие из вариабельных участков, такие как «Fv»-фрагменты, состоящие из вариабельных участков тяжелых и легких цепей, или рекомбинантных одноцепочечных полипептидных молекул, в которых легкие и тяжелые вариабельные участки связаны пептидным линкером («scFv-белки»). Согласно некоторым вариантам реализации фрагмент антитела не содержит частей антител без антигенсвязывающей активности, таких как Fc-фрагменты или отдельные остатки аминокислот.[00116] As used herein, the term “functional antibody fragment” refers to a fragment that binds to the same antigen as recognized by an intact (eg, full-length) antibody. The terms "antibody fragment" or "functional fragment" also include isolated fragments consisting of variable regions, such as "Fv" fragments consisting of heavy and light chain variable regions, or recombinant single chain polypeptide molecules in which light and heavy variable regions linked by a peptide linker (“scFv proteins”). In some embodiments, the antibody fragment does not contain portions of the antibodies without antigen-binding activity, such as Fc fragments or individual amino acid residues.
[00117] В данном документе «последовательность вариабельного домена иммуноглобулина» относится к последовательности аминокислот, которая может образовывать структуру вариабельного домена иммуноглобулина. Например, указанная последовательность может включать полностью или частично последовательность аминокислот встречающегося в природе вариабельного домена. Например, указанная последовательность может включать или не включать одну, две или более N- или C-концевых аминокислот, или может включать другие изменения, которые совместимы с образованием структуры белка.[00117] As used herein, “immunoglobulin variable domain sequence” refers to an amino acid sequence that can form the structure of an immunoglobulin variable domain. For example, the sequence may comprise all or part of the amino acid sequence of a naturally occurring variable domain. For example, the sequence may or may not include one, two or more N- or C-terminal amino acids, or may include other changes that are compatible with the formation of the protein structure.
[00118] Термины «полинуклеотид» и «нуклеиновая кислота», используемые в данном документе взаимозаменяемо, относятся к полимерной форме нуклеотидов любой длины, будь то рибонуклеотиды либо дезоксирибонуклеотиды. Таким образом, этот термин включает одно-, двух- или многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, включающий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания. «Олигонуклеотид» обычно относится к полинуклеотидам, содержащим от примерно 5 до примерно 100 нуклеотидов одно- или двухцепочечной ДНК. Однако для целей данного изобретения не существует верхнего предела длины олигонуклеотида. Олигонуклеотиды также известны как «олигомеры» или «олиго» (oligos) и могут быть выделены из генов или химически синтезированы способами, известными в данной области. Термины «полинуклеотид» и «нуклеиновая кислота» следует понимать как включающие, применительно к описываемым вариантам реализации, одноцепочечные (такие как смысловые или антисмысловые) и двухцепочечные полинуклеотиды. ДНК может находиться в форме, например, антисмысловых молекул, плазмидной ДНК, дуплексов ДНК-ДНК, предварительно конденсированной ДНК, продуктов ПЦР, векторов (P1, PAC, BAC, YAC, искусственные хромосомы), экспрессионных кассет, химерных последовательностей, хромосомной ДНК, или производных и комбинаций указанных групп. ДНК может находиться в форме миникольца, плазмиды, бакмиды, минигена, служебной ДНК (линейного ковалентно замкнутого ДНК-вектора), линейной дуплексной ДНК с замкнутыми концами (CELiD или зкДНК), ДНК Doggybone (dbDNA ™), гантелеобразную ДНК, минималистичного вектора для иммунологически определенной генной экспрессии (MIDGE), вирусного вектора или невирусных векторов. РНК может находиться в форме короткой интерферирующей РНК (киРНК), дцРНК - субстрата Dicer, малой шпилечной РНК (мшРНК), aсимметричной интерферирующей РНК (аиРНК), микроРНК (миРНК), мРНК, рРНК, тРНК, вирусной РНК (вРНК) и их комбинаций. Нуклеиновые кислоты включают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки остова или связи, которые являются синтетическими, встречающимися в природе и не встречающимися в природе, которые имеют связывающие свойства, аналогичные свойствам референсной нуклеиновой кислоты. Примеры таких аналогов и/или модифицированных остатков включают, без ограничения, фосфотиоаты, фосфородиамидат-морфолиновый олигомер (морфолино), фосфорамидаты, метилфосфонаты, хиральные метилфосфонаты, 2'-O-метил рибонуклеотиды, закрытую нуклеиновую кислоту (LNA™) и пептидные нуклеиновые кислоты (ПНК). За исключением конкретно указанных ограничений термин охватывает известные аналоги природных нуклеотидов, которые имеют связывающие свойства, аналогичные свойствам референсной нуклеиновой кислоты. Если не указано иное, подразумевается также, что конкретная последовательность нуклеиновой кислоты также охватывает консервативно модифицированные варианты (например, вырожденные замены кодонов), аллели, ортологи, однонуклеотидные полиморфизмы (SNP) и комплементарные последовательности, а также последовательность, указанная явным образом.[00118] The terms "polynucleotide" and "nucleic acid", used interchangeably herein, refer to the polymeric form of nucleotides of any length, whether ribonucleotides or deoxyribonucleotides. Thus, the term includes single-, double- or multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids, or a polymer comprising purine and pyrimidine bases or other natural, chemically or biochemically modified, non-natural or derivatized nucleotide bases. "Oligonucleotide" generally refers to polynucleotides containing from about 5 to about 100 nucleotides of single- or double-stranded DNA. However, for the purposes of this invention, there is no upper limit on the length of the oligonucleotide. Oligonucleotides are also known as "oligomers" or "oligos" and can be isolated from genes or chemically synthesized by methods known in the art. The terms “polynucleotide” and “nucleic acid” should be understood to include, for the purposes of the described embodiments, single-stranded (such as sense or antisense) and double-stranded polynucleotides. The DNA may be in the form of, for example, antisense molecules, plasmid DNA, DNA-DNA duplexes, pre-condensed DNA, PCR products, vectors (P1, PAC, BAC, YAC, artificial chromosomes), expression cassettes, chimeric sequences, chromosomal DNA, or derivatives and combinations of these groups. The DNA may be in the form of a minicircle, plasmid, bacmid, minigene, utility DNA (linear covalently closed DNA vector), linear closed-end duplex DNA (CELiD or cccDNA), Doggybone DNA (dbDNA™), dumbbell DNA, minimalistic vector for immunological defined gene expression (MIDGE), viral vector or non-viral vectors. The RNA may be in the form of short interfering RNA (siRNA), Dicer substrate dsRNA, small hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA), mRNA, rRNA, tRNA, viral RNA (vRNA), and combinations thereof . Nucleic acids include nucleic acids containing known nucleotide analogues or modified backbone residues or linkages that are synthetic, naturally occurring and non-naturally occurring, that have binding properties similar to those of the reference nucleic acid. Examples of such analogues and/or modified residues include, but are not limited to, phosphorothioates, phosphorodiamidate-morpholine oligomer (morpholino), phosphoramidates, methylphosphonates, chiral methylphosphonates, 2'-O-methyl ribonucleotides, locked nucleic acid (LNA™) and peptide nucleic acids ( PNK). Except as specifically stated, the term covers known analogues of natural nucleotides that have binding properties similar to those of the reference nucleic acid. Unless otherwise indicated, the specific nucleic acid sequence is also intended to include conservatively modified variants (eg, degenerate codon substitutions), alleles, orthologs, single nucleotide polymorphisms (SNPs), and complementary sequences, as well as explicitly stated sequence.
[00119] «Нуклеотиды» содержат сахар дезоксирибозу (ДНК) или рибозу (РНК), основание и фосфатную группу. Нуклеотиды соединены между собой указанными фосфатными группами. [00119] "Nucleotides" contain the sugar deoxyribose (DNA) or ribose (RNA), a base, and a phosphate group. The nucleotides are connected to each other by the indicated phosphate groups.
[00120] «Основания» включают пурины и пиримидины, которые дополнительно включают природные соединения аденин, тимин, гуанин, цитозин, урацил, инозин и природные аналоги, а также синтетические производные пуринов и пиримидинов, которые включают, но не ограничиваются ими, модификации, которые вводят новые реакционноспособные группы, такие как, но не ограничиваясь ими, амины, спирты, тиолы, карбоксилаты и алкилгалогениды. [00120] "Bases" include purines and pyrimidines, which further include the natural compounds adenine, thymine, guanine, cytosine, uracil, inosine and natural analogs, as well as synthetic derivatives of purines and pyrimidines, which include, but are not limited to, modifications that introduce new reactive groups such as, but not limited to, amines, alcohols, thiols, carboxylates and alkyl halides.
[00121] Под «гибридизуемым» или «комплементарным» или «по существу комплементарным» подразумевается, что нуклеиновая кислота (например, РНК) включает последовательность нуклеотидов, которая позволяет ей нековалентно связываться, т.е. формировать пары оснований по Уотсону-Крику и/или пары оснований G/U, подвергаться «отжигу» или «гибридизироваться» с другой нуклеиновой кислотой специфичным для последовательности, антипараллельным образом (т.е. нуклеиновая кислота специфически связывается с комплементарной нуклеиновой кислотой) в соответствующих in vitro и/или in vivo условиях температуры и ионной силы раствора. Как известно в данной области техники, стандартное спаривание оснований по Уотсону-Крику включает спаривание аденина (A) с тимидином (T), спаривание аденина (A) с урацилом (U) и спаривание гуанина (G) с цитозином (C). Кроме того, в данной области техники также известно, что при гибридизации двух молекул РНК (например, дцРНК) гуаниновое (G) основание спаривается с урацилом (U). Например, спаривание оснований G/U частично отвечает за вырожденность (т.е. избыточность) генетического кода в контексте спаривания оснований анти-кодонов тРНК с кодонами в мРНК. В контексте данного изобретения, гуанин (G) связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК по данному изобретению считается комплементарным урацилу (U), и наоборот. Таким образом, когда пара оснований G/U может быть получена в данном нуклеотидном положении со связывающим белок сегментом (дуплекс дцРНК) нацеливающей на ДНК молекулы РНК по данному изобретению, это положение не рассматривается как некомплементарное, но вместо этого считается комплементарным.[00121] By "hybridizable" or "complementary" or "substantially complementary" is meant that the nucleic acid (eg, RNA) includes a nucleotide sequence that allows it to bind non-covalently, i.e. form Watson-Crick base pairs and/or G/U base pairs, undergo "annealing" or "hybridize" with another nucleic acid in a sequence-specific, antiparallel manner (i.e., the nucleic acid specifically binds to a complementary nucleic acid) in appropriate in vitro and/or in vivo conditions of temperature and ionic strength of the solution. As is known in the art, standard Watson-Crick base pairing includes adenine (A) pairing with thymidine (T), adenine (A) pairing with uracil (U), and guanine (G) pairing with cytosine (C). In addition, it is also known in the art that when two RNA molecules (eg, dsRNA) are hybridized, a guanine (G) base is paired with a uracil (U). For example, G/U base pairing is partially responsible for the degeneracy (i.e., redundancy) of the genetic code in the context of the base pairing of tRNA anti-codons with codons in mRNA. In the context of the present invention, the guanine (G) of the protein-binding segment (dsRNA duplex) of the DNA-targeting RNA molecule of the present invention is considered complementary to uracil (U), and vice versa. Thus, when a G/U base pair can be produced at a given nucleotide position with the protein binding segment (dsRNA duplex) of the DNA-targeting RNA molecule of the present invention, that position is not considered to be non-complementary, but instead is considered to be complementary.
[00122] Используемый в данном документе термин «конструкт нуклеиновой кислоты» относится к молекуле нуклеиновой кислоты, одноцепочечной или двухцепочечной, которая выделена из встречающегося в природе гена, или модифицирована так, чтобы она содержала сегменты нуклеиновых кислот способом, не существующим в природе, или является синтетической. Термин «конструкт нуклеиновой кислоты» является синонимом термина «экспрессионная кассета», когда конструкт нуклеиновой кислоты содержит контрольные последовательности, необходимые для экспрессии кодирующей последовательности по данному изобретению. «Экспрессионная кассета» включает кодирующую последовательность ДНК, функционально связанную с промотором.[00122] As used herein, the term “nucleic acid construct” refers to a nucleic acid molecule, single-stranded or double-stranded, that is isolated from a naturally occurring gene, or is modified to contain nucleic acid segments in a manner not found in nature, or is synthetic. The term "nucleic acid construct" is synonymous with the term "expression cassette" when the nucleic acid construct contains control sequences necessary for expression of the coding sequence of the present invention. An "expression cassette" includes a DNA coding sequence operably linked to a promoter.
[00123] В данном документе выражения «терапевтическое средство с нуклеиновой кислотой», «терапевтическая нуклеиновая кислота» и «ТНК» используются взаимозаменяемо и относятся к любому варианту терапевтического средства с использованием нуклеиновых кислот в качестве активного компонента терапевтического агента для лечения заболевания или расстройства. В данном документе указанные выражения относятся к терапевтическим средствам на основе РНК и терапевтическим средствам на основе ДНК. Неограничивающие примеры терапевтических средств на основе РНК включают мРНК, антисмысловую РНК и олигонуклеотиды, рибозимы, аптамеры, интерферирующие РНК (РНКи), дцРНК - субстрата Dicer, малую шпилечную РНК (мшРНК), асимметричные интерферирующие РНК (аиРНК), микроРНК (миРНК). Неограничивающие примеры терапевтических средств на основе ДНК включают миникольцо ДНК, миниген, вирусную ДНК (например, геном лентивируса или AAV) или невирусные синтетические ДНК-векторы, линейную дуплексную ДНК с замкнутыми концами (зкДНК/CELiD), плазмиды, бакмиды, ДНК-векторы Doggybone (dbDNA™), минималистичный вектор для иммунологически определенной генной экспрессии (MIDGE)-вектор, невирусный служебный ДНК-вектор (линейный ковалентно замкнутый ДНК-вектор) или гантелеобразный минимальный ДНК-вектор («гантелеобразная ДНК»).[00123] As used herein, the terms “nucleic acid therapeutic,” “nucleic acid therapeutic,” and “TNA” are used interchangeably and refer to any therapeutic option using nucleic acids as the active component of a therapeutic agent for treating a disease or disorder. As used herein, these expressions refer to RNA-based therapeutics and DNA-based therapeutics. Non-limiting examples of RNA therapeutics include mRNA, antisense RNA and oligonucleotides, ribozymes, aptamers, RNA interfering (RNAi), Dicer substrate dsRNA, small hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA). Non-limiting examples of DNA-based therapeutics include minicircle DNA, minigene, viral DNA (eg, lentivirus or AAV genome) or non-viral synthetic DNA vectors, closed-end linear duplex DNA (ccDNA/CELiD), plasmids, bacmids, Doggybone DNA vectors (dbDNA™), minimalistic immunologically defined gene expression (MIDGE) vector, non-viral utility DNA vector (linear covalently closed DNA vector), or dumbbell minimal DNA vector (“dumbbell DNA”).
[00124] Термины «пептид», «полипептид» и «белок» используются в данном документе взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты, и полипептиды, имеющие модифицированные пептидные остовы.[00124] The terms "peptide", "polypeptide" and "protein" are used interchangeably herein and refer to the polymeric form of amino acids of any length, which may include encoded and non-encoded amino acids, chemically or biochemically modified or derivatized amino acids, and polypeptides having modified peptide backbones.
[00125] В данном документе термины «синтетический AAV-вектор» и «получение AAV-вектора синтетическим путем» относятся к AAV-вектору и способам его получения синтетическим путем в полностью бесклеточной среде. [00125] As used herein, the terms “synthetic AAV vector” and “synthetic production of AAV vector” refer to the AAV vector and methods for producing it synthetically in a completely cell-free environment.
[00126] В данном документе термин «содержащий» («включающий») или «содержит» («включает») используется в отношении композиций, способов и их соответствующего компонента (компонентов), существенных для указанного способа или композиции, но допускающих включение не указанных элементов, существенных или нет.[00126] As used herein, the term “comprising” or “comprising” is used to refer to compositions, methods, and their respective component(s) essential to the specified method or composition, but capable of including unspecified elements, significant or not.
[00127] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для определенного варианта реализации. Указанный термин допускает присутствие элементов, не влияющих существенным образом на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации.[00127] As used herein, the term “consisting essentially of” refers to elements required for a particular implementation. The specified term allows for the presence of elements that do not significantly affect the basic and new or functional characteristic(s) of the specified embodiment.
[00128] Термин «состоящий из» относится к композициям, способам и их соответствующим компонентам согласно описанию в данном документе, которые не включают каких-либо элементов, не указанных в приведенном описании варианта реализации.[00128] The term “consisting of” refers to compositions, methods and their respective components as described herein, which do not include any elements not specified in the above description of an embodiment.
[00129] В данном описании и прилагаемой формуле изобретения термины в единственном числе включают их эквиваленты во множественном числе, если иное явным образом не следует из контекста. Соответственно, например, «способ» включает один или более способов, и/или этапов типа, описанного в данном документе, и/или таких, которые будут очевидными для специалистов в данной области техники после прочтения данного описания, и т.п. Аналогичным образом термин «или» включает «и», если из контекста явным образом не следует иное. Хотя при практической реализации или тестировании данного изобретения могут применяться способы и материалы, аналогичные или эквивалентные описанным в данном документе, ниже описаны подходящие способы и материалы. Выражение «например» в данном документе указывает на неограничивающий пример. Соответственно, выражение «например» синонимично выражению «к примеру».[00129] In this specification and the accompanying claims, terms in the singular include their plural equivalents unless the context clearly indicates otherwise. Accordingly, for example, “method” includes one or more methods and/or steps of the type described herein and/or those that would be apparent to those skilled in the art upon reading this specification, and the like. Likewise, the term “or” includes “and” unless the context clearly requires otherwise. Although methods and materials similar or equivalent to those described herein may be used in the practice or testing of this invention, suitable methods and materials are described below. The expression “for example” as used herein indicates a non-limiting example. Accordingly, the expression “for example” is synonymous with the expression “for example”.
[00130] За исключением рабочих примеров или, если указано иное, все числа, выражающие количества ингредиентов или условий реакции, используемые в данном документе, следует понимать как модифицированные термином «приблизительно» во всех случаях. Термин «приблизительно» при использовании применительно к процентам может означать ±1%. Данное изобретение дополнительно подробно разъяснено на приведенных ниже примерах, однако они не предназначены для ограничения объема данного изобретения.[00130] Except in the working examples, or where otherwise indicated, all numbers expressing amounts of ingredients or reaction conditions used herein are to be understood as modified by the term “about” in all cases. The term "about" when used in relation to a percentage may mean ±1%. The present invention is further explained in detail by the following examples, but they are not intended to limit the scope of the present invention.
[00131] Следует понимать, что данное изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.п., описанными в данном документе, и, соответственно, предусматривает различные варианты. Используемая в данном документе терминология служит только для описания конкретных вариантов реализации, и не предназначена для ограничения объема данного изобретения, который определяется исключительно формулой изобретения.[00131] It should be understood that the present invention is not limited to the specific methodology, protocols and reagents, etc. described herein and, accordingly, is subject to various variations. The terminology used herein is intended to describe specific embodiments only and is not intended to limit the scope of the invention, which is defined solely by the claims.
II. Белки инициатора репликации (Rep)II. Initiator of replication proteins (Rep)
[00132] Как описано в данном документе, описанная здесь технология относится к композиции и улучшенным способам получения ДНК-векторов, например, вектора зкДНК, как описано в данном документе, или вектора AAV с единственным видом белка Rep. В соответствии с некоторыми аспектами в описании предложен способ получения ДНК-вектора, например, вектора зкДНК, как описано в данном документе, или вектора AAV с использованием одного белка Rep, где белок Rep не является Rep52 или Rep40. Согласно некоторым вариантам реализации, единственным белком Rep является Rep78. Согласно некоторым вариантам реализации, единственным белком Rep является Rep68. Это усовершенствованный и более эффективный метод получения вектора зкДНК, который дает более высокий выход вектора зкДНК, чем способы, описанные в предшествующем уровне техники, в которых используются два белка Rep, включающие Rep78 или 68 и Rep52 или 40 (например, Rep78 и Rep 52, см. Фиг. 32). Действительно, до данного изобретения считалось, что для продуцирования частиц AAV должны присутствовать два Rep-белка, один длинный (например, Rep78 или Rep 68) и один короткий (например, Rep52 или Rep40). В частности, считалось, что Rep78 и Rep52 должны присутствовать либо в виде отдельных единиц, либо с использованием одной кодирующей последовательности для белков Rep78 и Rep52 для получения частиц AAV. [00132] As described herein, the technology described herein relates to the composition and improved methods for producing DNA vectors, for example, a cccDNA vector as described herein, or an AAV vector with a single Rep protein species. In accordance with certain aspects, the disclosure provides a method for producing a DNA vector, such as a cccDNA vector as described herein, or an AAV vector using a single Rep protein, wherein the Rep protein is not Rep52 or Rep40. In some embodiments, the only Rep protein is Rep78. In some embodiments, the only Rep protein is Rep68. This is an improved and more efficient method for producing cccDNA vector, which gives a higher yield of cccDNA vector than methods described in the prior art, which use two Rep proteins, including Rep78 or 68 and Rep52 or 40 (for example, Rep78 and Rep 52, see Fig. 32). Indeed, prior to this invention, it was believed that in order to produce AAV particles, two Rep proteins must be present, one long (eg Rep78 or Rep 68) and one short (eg Rep52 or Rep40). In particular, it was thought that Rep78 and Rep52 must be present either as separate units or using a single coding sequence for the Rep78 and Rep52 proteins to produce AAV particles.
[00133] Соответственно, один аспект технологии, описанной в данном документе, относится к способу получения вектора ДНК, например вектора зкДНК, как описано в данном документе, или вектора AAV с использованием единственного белка Rep, в отличие от использования двух белков Rep. Согласно некоторым вариантам реализации, единственным белком Rep является Rep78. Согласно некоторым вариантам реализации, единственным белком Rep является Rep68. Согласно некоторым вариантам реализации белок Rep может быть Rep78 и Rep68, но не Rep52 или Rep40.[00133] Accordingly, one aspect of the technology described herein relates to a method of producing a DNA vector, such as a cccDNA vector as described herein, or an AAV vector using a single Rep protein, as opposed to using two Rep proteins. In some embodiments, the only Rep protein is Rep78. In some embodiments, the only Rep protein is Rep68. In some embodiments, the Rep protein may be Rep78 and Rep68, but not Rep52 or Rep40.
[00134] Другой аспект технологии, описанной в данном документе, относится к композиции, содержащей конструкт нуклеиновой кислоты, который содержит первую нуклеотидную последовательность, кодирующую один парвовирусный белок Rep, где нуклеотидная последовательность не имеет открытой рамки считывания (ORF) и не содержит функционального инициирующего кодона, расположенного ниже первого инициирующего кодона и/или в нем отсутствуют альтернативные сайты сплайсинга, предотвращающие пропуск экзонов, тем самым обеспечивая трансляцию одного парвовирусного белка Rep (например, белка Rep78 или Rep68) без трансляции дополнительных белков Rep (например, любого одного или нескольких из Rep52 или Rep40) в клетках насекомых или бесклеточной системе. То есть нуклеиновая кислота, кодирующая Rep78, также не продуцирует белок Rep52, и аналогично, нуклеиновая кислота, кодирующая Rep68, не продуцирует белок Rep40. Кроме того, никакой другой белок Rep не присутствует и не экспрессируется в системе конструкта нуклеиновой кислоты для получения ДНК-векторов, например, зкДНК-векторов и других рекомбинантных парвовирусных (например, аденоассоциированных вирусов) векторов в клетках (например, клетках насекомых, клетках млекопитающих) и бесклеточных системах, например, клетках насекомых или бесклеточных системах.[00134] Another aspect of the technology described herein relates to a composition comprising a nucleic acid construct that contains a first nucleotide sequence encoding a single parvovirus Rep protein, wherein the nucleotide sequence does not have an open reading frame (ORF) and does not contain a functional start codon , located downstream of the first start codon and/or lacks alternative splice sites that prevent exon skipping, thereby allowing translation of a single parvovirus Rep protein (e.g., Rep78 or Rep68 protein) without translation of additional Rep proteins (e.g., any one or more of Rep52 or Rep40) in insect cells or a cell-free system. That is, the nucleic acid encoding Rep78 also does not produce the Rep52 protein, and similarly, the nucleic acid encoding Rep68 does not produce the Rep40 protein. Additionally, no other Rep protein is present or expressed in the nucleic acid construct system for producing DNA vectors, e.g., cccDNA vectors and other recombinant parvovirus (e.g., adeno-associated virus) vectors in cells (e.g., insect cells, mammalian cells) and cell-free systems, such as insect cells or cell-free systems.
Rep-белки в общемRep proteins in general
[00135] Rep-гены воспроизводят вирусный геном. В нуклеиновой кислоте дикого типа, кодирующей Rep78 или Rep68, событие сплайсинга в открытой рамке считывания Rep либо Rep78, либо Rep68 приводит к появлению двух белков Rep при трансляции: Rep52 и Rep40, соответственно. То есть белок Rep78 и белок Rep68 кодируются одной нуклеиновой кислотой, которая подвергается дифференциальному сплайсингу с продуцированием Rep78 и Rep68. Точно так же белок Rep52 и белок Rep40 кодируются одной нуклеиновой кислотой, которая подвергается дифференциальному сплайсингу с продуцированием белков Rep52 и Rep40. Rep78 представляет собой полноразмерный белок, продуцируемый из исходного первого сайта инициации трансляции, тогда как Rep52 является продуктом трансляции из нижележащего внутреннего «второго (AUG)» сайта инициации трансляции. Следовательно, когда экспрессируется полноразмерный геном AAV дикого типа, обычно присутствуют все четыре вида Rep-белков (например, Rep78, Rep68, Rep52 и Rep40) в основном из-за двух разных сайтов инициации трансляции, а также из-за того, что сайты альтернативного сплайсинга около карбоксильного конца. Каждый белок Rep имеет различные функциональные возможности, например, никирование ДНК, связывание ДНК, геликазную активность, лигазную и АТФазную активность. Функциональность данного белка Rep дополнительно описана на Фиг. 31. Ранее сообщалось, что и Rep78, и Rep52 белки необходимы для получения вектора AAV или вектора зкДНК в различных системах, например, клетках насекомых и клеточных системах млекопитающих. Однако, как обсуждается в данном документе, авторы изобретения демонстрируют, что только один белок Rep или, альтернативно, по меньшей мере, комбинация длинных белков Rep (Rep78 и Rep68), но не коротких белков Rep (Rep52 и Rep40), может использоваться для получения вектора AAV или вектора зкдНК. Единственный вид Rep-белка, используемый в композициях и способе, описанных в данном документе, включает все три функции: никирование ДНК, связывание ДНК и функциональное лигирование ДНК. В некоторых вариантах реализации единственный белок Rep дополнительно содержит функциональные группы геликазы и АТФазы. [00135] Rep genes reproduce the viral genome. In a wild-type nucleic acid encoding Rep78 or Rep68, a splicing event in the Rep open reading frame of either Rep78 or Rep68 results in two Rep proteins upon translation: Rep52 and Rep40, respectively. That is, the Rep78 protein and the Rep68 protein are encoded by the same nucleic acid, which undergoes differential splicing to produce Rep78 and Rep68. Similarly, Rep52 protein and Rep40 protein are encoded by the same nucleic acid, which undergoes differential splicing to produce Rep52 and Rep40 proteins. Rep78 is a full-length protein produced from the original first translation initiation site, whereas Rep52 is a translation product from the downstream internal “second (AUG)” translation initiation site. Therefore, when the full-length wild-type AAV genome is expressed, all four types of Rep proteins (e.g., Rep78, Rep68, Rep52, and Rep40) are typically present, largely due to the two different translation initiation sites and also because the alternative splicing near the carboxyl end. Each Rep protein has different functionalities, such as DNA nicking, DNA binding, helicase activity, ligase activity, and ATPase activity. The functionality of this Rep protein is further described in FIG. 31 It has been previously reported that both Rep78 and Rep52 proteins are required for the production of AAV vector or cctDNA vector in various systems, such as insect cells and mammalian cell systems. However, as discussed herein, the inventors demonstrate that only one Rep protein, or alternatively at least a combination of long Rep proteins (Rep78 and Rep68), but not short Rep proteins (Rep52 and Rep40), can be used to produce AAV vector or cDNA vector. The only type of Rep protein used in the compositions and method described herein includes all three functions: DNA nicking, DNA binding, and functional DNA ligation. In some embodiments, the single Rep protein further comprises helicase and ATPase functional groups.
[00136] В некоторых вариантах реализации единственный вид белка Rep, используемый в композициях и способах, описанных в данном документе, представляет собой белок Rep AAV2, если ITR относится к серотипу 2 (например, AAV2). В альтернативных вариантах реализации единственный белок Rep может происходить из любого из 42 серотипов AAV или, более предпочтительно, из белка Rep AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 или белка AAV12 Rep. В некоторых вариантах реализации единственный белок Rep, охватываемый для использования в раскрытых здесь способах и композициях, соответствует белку Rep парвовируса животных, если ITR относится к серотипу 2 (например, AAV2). Белок Rep работает как часть системы с ITR, для связывания с ITR и инициации репликации с конечным разрешением и катализированием образования векторной молекулы зкДНК с замкнутыми концами.[00136] In some embodiments, the only type of Rep protein used in the compositions and methods described herein is the AAV2 Rep protein if the ITR is serotype 2 (eg, AAV2). In alternative embodiments, the single Rep protein may be derived from any of the 42 AAV serotypes or, more preferably, from the AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 Rep protein or the AAV12 Rep protein. In some embodiments, the only Rep protein covered for use in the methods and compositions disclosed herein corresponds to the Rep protein of an animal parvovirus if the ITR is serotype 2 (eg, AAV2). The Rep protein works as part of the ITR system to bind to the ITR and initiate finite resolution replication and catalyze the formation of a closed-ended cccDNA vector molecule.
[00137] В некоторых вариантах реализации единственный белок Rep, используемый в композициях и способах, описанных в данном документе, представляет собой Rep78. В альтернативных вариантах реализации единственный белок Rep, используемый в композициях и способах, описанных в данном документе является Rep68. В альтернативных вариантах реализации единственный вид Rep-белка представляет собой Rep52 или Rep40, который был модифицирован таким образом, чтобы содержать функциональность Rep78 или Rep68, например, чтобы иметь ДНК-связующую, ДНК-никирующую, геликазную и АТФазную активность. Альтернативно, в некоторых вариантах реализации белок Rep, используемый в композиции и способе, описанных в данном документе, может представлять собой комбинацию длинных белков Rep (например, Rep78 и Rep68) без Rep52 или Rep40, коротких белков Rep.[00137] In some embodiments, the only Rep protein used in the compositions and methods described herein is Rep78. In alternative embodiments, the only Rep protein used in the compositions and methods described herein is Rep68. In alternative embodiments, a single species of Rep protein is Rep52 or Rep40 that has been modified to contain the functionality of Rep78 or Rep68, for example, to have DNA binding, DNA nicking, helicase, and ATPase activities. Alternatively, in some embodiments, the Rep protein used in the composition and method described herein may be a combination of long Rep proteins (eg, Rep78 and Rep68) without Rep52 or Rep40, short Rep proteins.
[00138] Другой аспект описанной здесь технологии относится к конструкту нуклеиновой кислоты, кодирующий единственный белок Rep, в котором нуклеиновая кислота не индуцирует и не позволяет экспрессию второго белка Rep. Соответственно, в одном аспекте конструкт нуклеиновой кислоты, кодирующий единственный белок Rep, модифицирован так, что в ней отсутствует функциональный кодон инициации для другого белка Rep.[00138] Another aspect of the technology described herein relates to a nucleic acid construct encoding a single Rep protein, in which the nucleic acid does not induce or allow expression of a second Rep protein. Accordingly, in one aspect, the nucleic acid construct encoding a single Rep protein is modified so that it lacks a functional initiation codon for another Rep protein.
[00139] В одном варианте реализации присутствие единственного вида Rep (например, при отсутствии других видов) определяется специфическими мутациями, которые предотвращают трансляцию p19 Rep, и отсутствием других видов Rep на вестерн-блоттинге с использованием анти-Rep антител известных в данной области техники.[00139] In one embodiment, the presence of a single Rep species (eg, in the absence of other species) is determined by specific mutations that prevent translation of p19 Rep and the absence of other Rep species on Western blotting using anti-Rep antibodies known in the art.
[00140] Конструкты нуклеиновых кислот, кодирующие модифицированные белки Rep[00140] Nucleic acid constructs encoding modified Rep proteins
[00141] В одном варианте реализации единственный вид белка Rep кодируется нуклеотидной последовательностью, кодирующей модифицированный белок Rep, например, он может кодировать модифицированный белок Rep78, при этом нуклеотидная последовательность не имеет функционального кодона инициации для кодирования Rep52 белка, а также отсутствуют сайты сплайсинга для пропуска экзонов для получения Rep68 или Rep40. Например, модифицированная нуклеотидная последовательность Rep78 включает модификацию или мутацию в кодоне инициации для Rep52, так что кодон инициации (например, AUG) для Rep52 изменен и больше не кодирует метионин, а кодирует другую аминокислоту. В некоторых вариантах реализации кодон инициации (Met) для Rep52 в последовательности нуклеиновой кислоты Rep78 мутирован для кодирования глицина (например, AUG мутирован в один из: GGU, GGC, GGA, GGG, который кодирует Gly) или аминокислоту треонин (например, AUG мутирован в один из ACT, ACC, ACA и ACG, который кодирует Thr). [00141] In one embodiment, a single species of Rep protein is encoded by a nucleotide sequence encoding a modified Rep protein, for example, it may encode a modified Rep78 protein, wherein the nucleotide sequence does not have a functional initiation codon to encode the Rep52 protein, and there are no splice sites to skip exons to produce Rep68 or Rep40. For example, the modified nucleotide sequence of Rep78 includes a modification or mutation in the initiation codon for Rep52, such that the initiation codon (eg, AUG) for Rep52 is changed and no longer encodes methionine, but encodes a different amino acid. In some embodiments, the initiation codon (Met) for Rep52 in the Rep78 nucleic acid sequence is mutated to encode glycine (e.g., AUG is mutated to one of: GGU, GGC, GGA, GGG, which encodes Gly) or the amino acid threonine (e.g., AUG is mutated to one of ACT, ACC, ACA and ACG, which encodes Thr).
Модифицированные Rep белкиModified Rep proteins
[00142] В некоторых вариантах реализации модифицированная нуклеотидная последовательность Rep78 может кодировать модифицированный белок Rep78, который содержит модификацию аминокислотного остатка 225 (Met) SEQ ID NO: 530, в котором аминокислотный остаток 225 заменен на глицин (Gly) (например, M225G или Met225Gly) или треонин (Thr) (например, M225T или Met225Thr). В одном варианте реализации мутированный белок Rep78 содержит последовательность SEQ ID NO: 530 или включает последовательность, содержащую по меньшей мере 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичности последовательности с SEQ ID NO: 530, в которой аминокислота в положении 225 не является Met, и где модифицированный белок Rep имеет, по меньшей мере, функциональность связывания ДНК и никирования ДНК, а кодирующий его ген не способствует получению второго белка Rep. Специалист в данной области сможет создать точечную мутацию, используя, например, сайт-направленный мутагенез. Чтобы оценить, была ли мутация в нуклеотидной последовательности сгенерирована правильно, можно выполнить выравнивание последовательности с модифицированным белком Rep (т.е. белком Rep, содержащим точечную мутацию) по сравнению с белком Rep дикого типа. [00142] In some embodiments, the modified Rep78 nucleotide sequence may encode a modified Rep78 protein that contains a modification of amino acid residue 225 (Met) of SEQ ID NO: 530, in which amino acid residue 225 is replaced by glycine (Gly) (e.g., M225G or Met225Gly) or threonine (Thr) (eg, M225T or Met225Thr). In one embodiment, the mutated Rep78 protein comprises the sequence of SEQ ID NO: 530 or comprises a sequence comprising at least 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92 %, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity to SEQ ID NO: 530, wherein the amino acid at position 225 is not Met, and wherein the modified Rep protein is, at least DNA binding and DNA nicking functionality, and the gene encoding it does not contribute to the production of the second Rep protein. One skilled in the art will be able to create a point mutation using, for example, site-directed mutagenesis. To assess whether a mutation in a nucleotide sequence was generated correctly, a sequence alignment can be performed with a modified Rep protein (ie, a Rep protein containing a point mutation) compared to the wild-type Rep protein.
[00143] В одном варианте реализации нуклеотидная последовательность, кодирующая единственный белок Rep, используемый в композициях и способах, раскрытых в данном документе, включает последовательность контроля экспрессии, например, промотор, цис-регуляторные элементы или регуляторный переключатель, как описано в данном документе, расположенную перед кодоном инициации нуклеотидной последовательности, кодирующей парвовирусный белок Rep78, в которой последовательность нуклеиновой кислоты не имеет функционального инициирующего кодона для Rep52. В одном варианте реализации нуклеотидная последовательность, кодирующая единственный белок Rep, используемый в композициях и способах, раскрытых в данном документе, включает последовательность контроля экспрессии перед кодоном инициации нуклеотидной последовательности, кодирующей парвовирусный белок Rep78, в которой последовательность нуклеиновой кислоты не имеет функциональных сайтов сплайсингу для кодирования Rep68. [00143] In one embodiment, the nucleotide sequence encoding a single Rep protein used in the compositions and methods disclosed herein includes an expression control sequence, such as a promoter, cis-regulatory elements, or a regulatory switch as described herein, located before the initiation codon of a nucleotide sequence encoding the parvovirus protein Rep78, in which the nucleic acid sequence does not have a functional initiation codon for Rep52. In one embodiment, the nucleotide sequence encoding a single Rep protein used in the compositions and methods disclosed herein includes an expression control sequence upstream of the initiation codon of the nucleotide sequence encoding the parvovirus Rep78 protein, wherein the nucleic acid sequence does not have functional splice sites for encoding Rep68.
[00144] То есть в некоторых вариантах реализации нуклеиновая кислота, кодирующая Rep78, имеет только один инициирующий кодон, что позволяет осуществлять трансляцию только белка Rep78 или белка Rep68. В таких вариантах реализации нуклеиновая кислота Rep78 имеет функциональный первый инициирующий кодон, обеспечивающий трансляцию белка Rep78, но модифицированный (или нефункциональный) инициирующий кодон ниже исходного инициирующего кодона, что приводит к тому, что Rep52 не экспрессируется. [00144] That is, in some embodiments, the nucleic acid encoding Rep78 has only one start codon, allowing translation of only the Rep78 protein or the Rep68 protein. In such embodiments, the Rep78 nucleic acid has a functional first start codon allowing translation of the Rep78 protein, but a modified (or non-functional) start codon downstream of the original start codon, resulting in Rep52 not being expressed.
[00145] Во всех случаях не используются никакие другие векторы, которые кодируют другой Rep. Также не используется белок Rep, который уже присутствует в клетках насекомых или клетках млекопитающих, используемых в способах создания ДНК-векторов, например, векторах зкДНК или векторах AAV, в соответствии со способами, описанными в данном документе. [00145] In all cases, no other vectors that encode a different Rep are used. Also not used is the Rep protein that is already present in insect cells or mammalian cells used in methods for creating DNA vectors, such as cccDNA vectors or AAV vectors, in accordance with the methods described herein.
[00146] В одном варианте реализации единственный белок Rep, используемый в композициях и способах, раскрытых в данном документе, относится к семейству парвовирусов. В другом варианте реализации единственный белок Rep, используемый в композициях и способах, раскрытых в данном документе, предпочтительно происходит из подсемейства Dependovirus вируса Rep. В другом варианте реализации единственный Rep-белок, используемый в композициях и способах, раскрытых в данном документе, более предпочтительно является AAV Rep. [00146] In one embodiment, the only Rep protein used in the compositions and methods disclosed herein is from the parvovirus family. In another embodiment, the single Rep protein used in the compositions and methods disclosed herein preferably comes from the Dependovirus subfamily of the Rep virus. In another embodiment, the only Rep protein used in the compositions and methods disclosed herein is more preferably AAV Rep.
[00147] В одном варианте реализации нуклеотидная последовательность по изобретению включает последовательность контроля экспрессии, кодирующую белок Rep 68 AAV, где последовательность нуклеиновой кислоты не имеет функционального инициирующего кодона для Rep40, но имеет делецию в последовательности интрона на его карбокси-конце, результатом чего является Rep68. В другом варианте реализации последовательность нуклеиновой кислоты имеет делецию в интронной последовательности полноразмерного Rep78 и не имеет других функциональных сайтов сплайсинга, что приводит к получению транскрипта, который способен быть транслирован только в Rep68. То есть в некоторых вариантах реализации нуклеиновая кислота, кодирующая Rep68, имеет только один инициирующий кодон, что позволяет осуществлять трансляцию только белка Rep68 с удаленной с-концевой последовательностью интрона. В таких вариантах реализации нуклеиновая кислота Rep68 имеет функциональный первый инициирующий кодон, обеспечивающий трансляцию белка Rep68, но инициирующий кодон, расположенный ниже исходного инициирующего кодона, модифицирован или нефункционален мутацией (например, M225G или M225T), которая приводит к тому, что Rep40 не экспресируется. Альтернативно, нуклеиновая кислота, кодирующая Rep68, модифицирована так, что второй инициирующий кодон модифицирован или нефункционален мутацией (например, M225G или M225T), но расположенные ниже c-концевые сайты сплайсинга являются функциональными и позволяют экспрессию белка Rep78 и белка Rep68.[00147] In one embodiment, the nucleotide sequence of the invention includes an expression control sequence encoding an AAV Rep 68 protein, wherein the nucleic acid sequence does not have a functional start codon for Rep40, but has a deletion in the intron sequence at its carboxy terminus, resulting in Rep68 . In another embodiment, the nucleic acid sequence has a deletion in the intronic sequence of full-length Rep78 and no other functional splice sites, resulting in a transcript that is capable of translation only into Rep68. That is, in some embodiments, the nucleic acid encoding Rep68 has only one start codon, allowing translation of only the Rep68 protein with the C-terminal intron sequence removed. In such embodiments, the Rep68 nucleic acid has a functional first start codon allowing translation of the Rep68 protein, but the start codon located downstream of the original start codon is modified or rendered non-functional by a mutation (e.g., M225G or M225T) that results in Rep40 not being expressed. Alternatively, the nucleic acid encoding Rep68 is modified such that the second start codon is modified or nonfunctional by mutation (eg, M225G or M225T), but the downstream c-terminal splice sites are functional and allow expression of the Rep78 protein and the Rep68 protein.
[00148] Последовательность, практически идентичная нуклеотидной последовательности SEQ. ID NO: 530 представляет собой последовательность, которая имеет по меньшей мере 60%, 70%, 80% или 90% идентичности с SEQ ID NO: 530. [00148] A sequence substantially identical to the nucleotide sequence of SEQ. ID NO: 530 is a sequence that has at least 60%, 70%, 80%, or 90% identity with SEQ ID NO: 530.
III. Подробное описание способа получения зкДНК-вектора с использованием одного белка RepIII. Detailed description of the method for producing cccDNA vector using a single Rep protein
A. Получение в общемA. Receipt in general
[00149] Как описано в данном документе, вектор зкДНК может быть получен способом с использованием только одного белка Rep, в отличие от более чем одного, например, двух белков Rep. Соответственно, один аспект данного изобретения относится к способу, включающему следующие этапы: a) инкубация популяции клеток-хозяев (например, клеток насекомых), несущих указанный матричный полинуклеотидный экспрессионный конструкт (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), который не содержит последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в эффективных условиях и на протяжении времени, достаточного для индукции продуцирования зкДНК-вектора в клетках-хозяевах, причем указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбор и выделение указанного зкДНК-вектора из клеток-хозяев. Присутствие единственного белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR для продуцирования зкДНК-вектора в клетке-хозяине. Однако вирусные частицы (например, вирионы AAV) при этом не экспрессируются. Таким образом, отсутствуют ограничения по размеру, такие как естественным образом присутствующие в AAV-векторах или других вирусных векторах. [00149] As described herein, a cccDNA vector can be produced by a method using only one Rep protein, as opposed to more than one, eg, two Rep proteins. Accordingly, one aspect of the present invention relates to a method comprising the following steps: a) incubating a population of host cells (eg, insect cells) bearing said template polynucleotide expression construct (eg, ccDNA plasmid, ccDNA bacmid and/or ccDNA baculovirus ), which does not contain sequences encoding the viral capsid, in the presence of the Rep protein under effective conditions and for a period of time sufficient to induce production of the cDNA vector in host cells, wherein said host cells do not contain sequences encoding the viral capsid; and b) collecting and isolating said cDNA vector from the host cells. The presence of a single Rep protein induces replication of the ITR-modified vector polynucleotide to produce a cccDNA vector in the host cell. However, viral particles (eg AAV virions) are not expressed. Thus, there are no size restrictions such as those naturally present in AAV vectors or other viral vectors.
[00150] Присутствие зкДНК-вектора, выделенного из клеток-хозяев, может быть подтверждено путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на неденатурирующем геле для подтверждения присутствия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК. [00150] The presence of a cccDNA vector isolated from host cells can be confirmed by digesting DNA isolated from a host cell with a restriction enzyme having a single recognition site on the ccDNA vector and analyzing the digested DNA material on a non-denaturing gel for confirmation the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA.
[00151] В еще одном аспекте изобретение предусматривает применение линий клеток-хозяев, имеющих стабильно интегрированную в собственный геном полинуклеотидную матрицу экспрессионного ДНК-вектора (зкДНК-матрицу), при продуцировании невирусного ДНК-вектора, например, как описано в: Lee, L. et al. (2013) Plos One 8(8): e69879. Предпочтительно Rep добавляют в клетки-хозяева с величиной МЗ (множественность заражения), равной приблизительно 3. Если линия клеток-хозяев представляет собой линию клеток млекопитающего, например, клетки HEK293, то указанные линии клеток могут содержать стабильно интегрированную полинуклеотидную векторную матрицу, а второй вектор, например, герпесвирусный, может применяться для введения в клетки белка Rep, обеспечивающего вырезание и амплификацию зкДНК в присутствии Rep и хелперного вируса. [00151] In another aspect, the invention provides for the use of host cell lines having a DNA expression vector polynucleotide template (ccDNA template) stably integrated into its own genome in the production of a non-viral DNA vector, for example, as described in: Lee, L. et al. (2013) Plos One 8(8): e69879. Preferably, Rep is added to host cells at an MOI (multiplicity of infection) of approximately 3. If the host cell line is a mammalian cell line, for example HEK293 cells, then said cell lines may contain a stably integrated polynucleotide vector template, and the second vector , for example, herpesvirus, can be used to introduce the Rep protein into cells, which ensures the excision and amplification of cctDNA in the presence of Rep and a helper virus.
[00152] Согласно одному варианту реализации клетки-хозяева, используемые для получения зкДНК-векторов, описанных в данном документе, представляют собой клетки насекомых, и для доставки как полинуклеотида, который кодирует белок Rep, так и матричный полинуклеотидный экспрессионный конструкт невирусного ДНК-вектора для зкДНК используют бакуловирус, например, согласно описанию на Фиг. 4A-4C и в Примере 1. Согласно некоторым вариантам реализации клетку-хозяина модифицируют таким образом, чтобы она экспрессировала единственный белок Rep. [00152] In one embodiment, the host cells used to produce the cccDNA vectors described herein are insect cells, and to deliver both the polynucleotide that encodes the Rep protein and the template polynucleotide expression construct of the non-viral DNA vector for cccDNA is used by baculovirus, for example as described in FIG. 4A-4C and Example 1. In some embodiments, a host cell is modified to express a single Rep protein.
[00153] Затем зкДНК-вектор собирают и выделяют из клеток-хозяев. Время сбора и извлечения зкДНК-векторов, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы обеспечить получение указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, роста клеток и т.д. Согласно одному варианту реализации клетки культивируют в достаточных условиях и собирают через достаточное время после инфекции бакуловирусом, чтобы получить зкДНК-векторы, но до начала гибели большинства клеток вследствие токсичности бакуловируса. Указанные ДНК-векторы могут быть выделены с применением наборов для очистки плазмид, таких как наборы без эндотоксина для выделения плазмид (Endo-Free Plasmid Kits) от Qiagen. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для ДНК-векторов. Как правило, могут быть использованы любые способы очистки нуклеиновых кислот. [00153] The cccDNA vector is then collected and isolated from the host cells. The timing of collection and recovery of the cccDNA vectors described herein from cells can be selected and optimized to ensure that the cccDNA vectors are obtained in high yield. For example, the collection time may be selected based on cell viability, cell morphology, cell growth, etc. In one embodiment, the cells are cultured under sufficient conditions and harvested sufficiently after infection with the baculovirus to produce cccDNA vectors, but before the majority of the cells begin to die due to toxicity of the baculovirus. These DNA vectors can be isolated using plasmid purification kits, such as Endo-Free Plasmid Kits from Qiagen. Other methods developed for isolating plasmids can also be adapted for DNA vectors. In general, any method for purifying nucleic acids can be used.
[00154] Указанные ДНК-векторы могут быть очищены любыми способами очистки ДНК, известными специалистам в данной области техники. Согласно одному варианту реализации очищенные зкДНК-векторы получают в виде молекул ДНК. Согласно другому варианту реализации очищенные зкДНК-векторы получают в виде экзосом или микрочастиц.[00154] These DNA vectors can be purified by any DNA purification methods known to those skilled in the art. In one embodiment, purified cccDNA vectors are obtained as DNA molecules. In another embodiment, purified cDNA vectors are produced in the form of exosomes or microparticles.
[00155] Присутствие зкДНК-вектора может быть подтверждено путем расщепления векторной ДНК, выделенной из клеток, рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, и анализа как расщепленного, так и нерасщепленного ДНК-материала с применением гель-электрофореза для подтверждения присутствия характерных полос линейной и непрерывной ДНК, отличных от полос линейной и прерывистой ДНК. Фиг. 4C и Фиг. 4E иллюстрируют один вариант реализации идентификации присутствия зкДНК-векторов с замкнутыми концами, продуцируемых описанными в данном документе способами. Фиг. 5 изображает гель, подтверждающий получение зкДНК из множества плазмидных конструктов с использованием способа, описанного в примерах. [00155] The presence of a cccDNA vector can be confirmed by digesting vector DNA isolated from cells with a restriction enzyme having a single recognition site on the DNA vector and analyzing both digested and uncleaved DNA material using gel electrophoresis to confirm the presence characteristic bands of linear and continuous DNA, different from those of linear and discontinuous DNA. Fig. 4C and FIG. 4E illustrates one embodiment for identifying the presence of end-closed cccDNA vectors produced by the methods described herein. Fig. 5 depicts a gel confirming the production of cccDNA from multiple plasmid constructs using the method described in the examples.
B. зкДНК-плазмидаB. cDNA plasmid
[00156] зкДНК-плазмида представляет собой плазмиду, используемую для последующего получения зкДНК-вектора. В некоторых вариантах реализации зкДНК-плазмида может быть сконструирована с применением известных методик для обеспечения по меньшей мере нижеперечисленного, в виде функционально связанных компонентов, в направлении транскрипции: (1) 5'-ITR; (2) экспрессионной кассеты, содержащей цис-регуляторный элемент, например, промотор, индуцибельный промотор, регуляторный переключатель, энхансеры и т.п.; и (3) 3'-ITR, причем последовательность 3'-ITR является ассимметричной к последовательности 5'-ITR. Согласно некоторым вариантам реализации указанная экспрессионная кассета, фланкированная ITR, содержит сайт клонирования для введения экзогенной последовательности. Указанная экспрессионная кассета заменяет кодирующие участки rep и cap геномов AAV. [00156] A cDNA plasmid is a plasmid used to subsequently produce a cDNA vector. In some embodiments, the cDNA plasmid can be constructed using known techniques to provide at least the following, as operably linked components, in the direction of transcription: (1) 5'-ITR; (2) an expression cassette containing a cis-regulatory element, for example, a promoter, an inducible promoter, a regulatory switch, enhancers, and the like; and (3) 3'-ITR, wherein the 3'-ITR sequence is asymmetric to the 5'-ITR sequence. In some embodiments, the ITR-flanked expression cassette contains a cloning site for introducing an exogenous sequence. This expression cassette replaces the rep and cap coding regions of the AAV genomes.
[00157] В одном аспекте зкДНК-вектор получают из плазмиды, называемой в данном документе «зкДНК-плазмида», кодирующей, в указанном порядке: первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (AAV), экспрессионную кассету, содержащую трансген, и мутированный или модифицированный ITR AAV, причем указанная зкДНК-плазмида не содержит кодирующих последовательностей капсидного белка AAV. В альтернативных вариантах реализации такая зкДНК-плазмида кодирует, в указанном порядке: первый (или 5') модифицированный или мутированный ITR ААV, экспрессионную кассету, содержащую трансген, и второй (или 3') ITR ААV дикого типа, причем указанная зкДНК-плазмида лишена кодирующих последовательностей капсидного белка ААV, а 5'- и 3'-ITR являются ассимметричными друг относительно друга. В альтернативных вариантах реализации зкДНК-плазмида кодирует, в указанном порядке: первый (или 5') модифицированный или мутированный ITR ААV, экспрессионную кассету, содержащую трансген, и второй (или 3') мутированный или модифицированный ITR ААV, причем указанная зкДНК-плазмида лишена кодирующих последовательностей капсидного белка ААV, а модифицированные 5'- и 3'-ITR отличаются и не имеют одинаковых модификаций. [00157] In one aspect, the ccDNA vector is derived from a plasmid, referred to herein as a "ccDNA plasmid", encoding, in this order: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), an expression cassette containing the transgene, and a mutated or a modified AAV ITR, wherein said cDNA plasmid does not contain coding sequences for the AAV capsid protein. In alternative embodiments, such a ccDNA plasmid encodes, in that order: a first (or 5') modified or mutated AAV ITR, an expression cassette containing the transgene, and a second (or 3') wild-type AAV ITR, wherein said ccDNA plasmid lacks coding sequences of the AAV capsid protein, and the 5'- and 3'-ITRs are asymmetrical relative to each other. In alternative embodiments, the ccDNA plasmid encodes, in that order: a first (or 5') modified or mutated AAV ITR, an expression cassette containing the transgene, and a second (or 3') mutated or modified AAV ITR, wherein said ccDNA plasmid lacks coding sequences of the AAV capsid protein, and the modified 5'- and 3'-ITRs are different and do not have the same modifications.
[00158] Согласно дополнительному варианту реализации система зкДНК-плазмиды лишена кодирующих последовательностей вирусного капсидного белка (т.е. не содержит генов капсида AAV, а также генов капсидов других вирусов). Кроме того, согласно конкретному варианту реализации зкДНК-плазмида также лишена кодирующих последовательностей белка Rep AAV. Соответственно, в предпочтительном варианте реализации зкДНК-плазмида лишена функциональных генов cap ААV и rep ААV, GG-3′ для AAV2), а также вариабельной палиндромной последовательности, обеспечивающей образование шпильки. [00158] In a further embodiment, the cDNA plasmid system is devoid of viral capsid protein coding sequences (i.e., does not contain AAV capsid genes as well as capsid genes of other viruses). In addition, in a particular embodiment, the cccDNA plasmid also lacks AAV Rep protein coding sequences. Accordingly, in a preferred embodiment, the cccDNA plasmid lacks the functional AAV cap and AAV rep genes, GG-3′ for AAV2), as well as the variable palindromic sequence responsible for hairpin formation.
[00159] ЗкДНК-плазмида по данному изобретению может быть получена с использованием природных нуклеотидных последовательностей геномов любых серотипов AAV, хорошо известных в данной области техники. В одном варианте реализации, остов плазмиды зкДНК получают из генома ААV1, ААV2, ААV3, ААV4, AAV5, AAV5, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV12, AAVrh8, AAVrh10, AAV-DJ и AAV-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; из указателя вирусов Kotin and Smith («The Springer Index of Viruses»), доступного по ссылке, поддерживаемой Springer (веб-адрес: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (примечание: ссылки на указатель URL или базу данных подразумевают содержание доступного по ссылке ресурса URL или базы данных на фактическую дату подачи данной заявки). В конкретном варианте реализации остов зкДНК-плазмиды получают из генома AAV2. В другом конкретном варианте реализации, остов зкДНК-плазмиды представляет собой синтетический остов, сконструированный методами генной инженерии с включением на 5'- и 3'-концах ITR, происходящих из одного из указанных геномов AAV. [00159] The cDNA plasmid of this invention can be obtained using natural nucleotide sequences from the genomes of any AAV serotypes well known in the art. In one embodiment, the cccDNA plasmid backbone is derived from the genome of AAV1, AAV2, AAV3, AAV4, AAV5, AAV5, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV12, AAVrh8, AAVrh10, AAV-DJ, and AAV-DJ8. For example, NCBI: NC 002077; NC001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; from the Kotin and Smith virus index ("The Springer Index of Viruses"), available at a link maintained by Springer (web address: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (note: links URL or database refers to the contents of the URL or database available from the link as of the actual filing date of this application). In a specific embodiment, the cDNA plasmid backbone is derived from the AAV2 genome. In another specific embodiment, the cDNA plasmid backbone is a synthetic backbone engineered to include ITRs at the 5' and 3' ends derived from one of the AAV genomes.
[00160] ЗкДНК-плазмида может необязательно включать селектируемый или селективный маркер для использования при создании линии клеток, продуцирующей зкДНК-вектор. Согласно одному варианту реализации указанный селективный маркер может быть инсертирован ниже (то есть в направлении 3') относительно последовательности 3'ITR. Согласно другому варианту реализации указанный селективный маркер может быть инсертирован выше (т.е., в направлении 5') относительно последовательности 5' ITR. Подходящие селективные маркеры включают, например, маркеры, придающие устойчивость к лекарственному средству. Селекционными маркерами могут быть, например, гены устойчивости к бластицидину S, канамицину, генетицину и т.п. Согласно предпочтительному варианту реализации селективный маркер для отбора по чувствительности к лекарственному средству представляет собой ген устойчивости к бластицидину S. [00160] The cccDNA plasmid may optionally include a selectable or selectable marker for use in creating a cell line that produces the ccDNA vector. In one embodiment, said selectable marker may be inserted downstream (ie, in the 3' direction) of the 3'ITR sequence. In another embodiment, said selectable marker may be inserted upstream (ie, in the 5' direction) of the 5' ITR sequence. Suitable selectable markers include, for example, markers that confer drug resistance. Selection markers can be, for example, genes for resistance to blasticidin S, kanamycin, geneticin, etc. In a preferred embodiment, the selectable marker for selecting for drug sensitivity is a blasticidin S resistance gene.
[00161] Типичную зкДНК (например, rAAV0) продуцируют из плазмиды рAAV. Способ получения вектора rAAV может включать: (а) доставку в клетку-хозяина плазмиды rAAV, как описано выше, при этом как клетка-хозяин, так и плазмида не содержат генов, кодирующих капсидный белок, (b) культивирование указанной клетки-хозяина в условиях, обеспечивающих продуцирование генома зкДНК; и (c) сбор клеток и выделение генома AAV, продуцированного указанными клетками.[00161] A typical cccDNA (eg, rAAV0) is produced from the pAAV plasmid. A method for producing an rAAV vector may include: (a) delivering an rAAV plasmid to a host cell as described above, wherein both the host cell and the plasmid do not contain genes encoding a capsid protein, (b) culturing said host cell under conditions , ensuring the production of the cDNA genome; and (c) collecting cells and isolating the AAV genome produced by said cells.
C. Примеры способа получения зкДНК-векторов из зкДНК-плазмидC. Examples of a method for obtaining cDNA vectors from cDNA plasmids
[00162] В данном документе также предложены способы получения бескапсидных зкДНК-векторов, в частности, способ с достаточно высоким выходом для обеспечения достаточного количества вектора для экспериментов in vivo. [00162] This document also provides methods for producing capsidless cccDNA vectors, in particular, a method with sufficiently high yield to provide sufficient quantities of vector for in vivo experiments.
[00163] Согласно некоторым вариантам реализации способ получения зкДНК-вектора включает следующие этапы: (1) введение конструкта нуклеиновых кислот, содержащего экспрессионную кассету и две ассимметричных последовательности ITR, в клетку-хозяина (например, клетки Sf9), (2) необязательно, получение клональной линии клеток, например, с применением селективного маркера, присутствующего в плазмиде, (3) введение гена кодирующего Rep (путем трансфекции или инфекции бакуловирусом, несущим указанный ген) в указанную клетку насекомого; и (4) сбор клеток и очистка зкДНК-вектора. Конструкт нуклеиновых кислот, содержащий экспрессионную кассету и две последовательности ITR, описанных выше, для получения бескапсидного AAV-вектора, может находиться в форме cfAAV-плазмиды, или бакмиды, или бакуловируса, полученных из cfAAV-плазмиды согласно приведенному ниже описанию. Указанный конструкт нуклеиновых кислот может быть введен в клетку-хозяина путем трансфекции, вирусной трансдукции, стабильной интеграции или других способов, известных в данной области техники. [00163] In some embodiments, a method for producing a cccDNA vector includes the following steps: (1) introducing a nucleic acid construct containing an expression cassette and two asymmetric ITR sequences into a host cell (e.g., Sf9 cells), (2) optionally obtaining clonal cell line, for example, using a selectable marker present on a plasmid, (3) introducing a gene encoding Rep (by transfection or infection with a baculovirus carrying the gene) into said insect cell; and (4) cell collection and cDNA vector purification. The nucleic acid construct containing the expression cassette and the two ITR sequences described above to produce a capsidless AAV vector may be in the form of a cfAAV plasmid, or a bacmid or baculovirus derived from a cfAAV plasmid as described below. Said nucleic acid construct can be introduced into a host cell by transfection, viral transduction, stable integration, or other methods known in the art.
D. Клеточные линии:D. Cell lines:
[00164] Линии клеток-хозяев, используемые для продуцирования зкДНК-вектора, могут включать линии клеток насекомых, полученные из Spodoptera frugiperda, такие как клетки Sf9, Sf21 или клетки Trichoplusia ni, или линии клеток других беспозвоночных животных, позвоночных животных или других эукариот, в том числе клетки млекопитающих. Также могут быть использованы другие линии клеток, известные специалисту в данной области техники, такие как HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, моноциты, а также зрелые и незрелые дендритные клетки. Линии клеток-хозяев могут быть трансфицированы для стабильной экспрессии зкДНК-плазмиды для продуцирования зкДНК-вектора с высоким выходом. [00164] The host cell lines used to produce the cccDNA vector may include insect cell lines derived from Spodoptera frugiperda, such as Sf9, Sf21 cells or Trichoplusia ni cells, or cell lines of other invertebrates, vertebrates or other eukaryotes, including mammalian cells. Other cell lines known to one skilled in the art may also be used, such as HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1080, monocytes, and mature and immature dendritic cells. Host cell lines can be transfected to stably express the cccDNA plasmid to produce a ccDNA vector in high yield.
[00165] ЗкДНК-плазмиды могут быть введены в клетки Sf9 путем транзиентной трансфекции с использованием реагентов (например, липосом, фосфата кальция) или физических методов (например, электропорации), известных в данной области. Как вариант, могут быть созданы стабильные линии клеток Sf9, которые стабильно интегрировали зкДНК-плазмиду в геном. Такие стабильные линии клеток могут быть созданы путем включения селективного маркера в зкДНК-плазмиду согласно описанию выше. Если зкДНК-плазмида, используемая для трансфекции линии клеток, включает селективный маркер, такой как антибиотик, клетки, которые были трансфицированы зкДНК-плазмидой и интегрировали зкДНК-плазмиду в геном, могут быть отобраны путем добавления антибиотика в среду для роста клеток. Затем устойчивые клоны клеток могут быть выделены с помощью методов разведения отдельных клеток или переноса колоний и размножены. [00165] CCDNA plasmids can be introduced into Sf9 cells by transient transfection using reagents (eg, liposomes, calcium phosphate) or physical methods (eg, electroporation) known in the art. Alternatively, stable Sf9 cell lines can be generated that stably integrate the cccDNA plasmid into the genome. Such stable cell lines can be created by incorporating a selectable marker into a cccDNA plasmid as described above. If the cccDNA plasmid used to transfect a cell line includes a selectable marker, such as an antibiotic, cells that have been transfected with the ccDNA plasmid and have integrated the ccDNA plasmid into the genome can be selected by adding the antibiotic to the cell growth medium. Stable cell clones can then be isolated using single cell expansion or colony transfer methods and expanded.
E. Выделение и очистка зкДНК-векторовE. Isolation and purification of cDNA vectors
[00166] Примеры способа получения и выделения зкДНК-векторов представлены на Фиг. 4A-4E и в конкретных примерах ниже. ЗкДНК-векторы согласно описанию в данном документе могут быть получены из клеток-продуцентов, экспрессирующих белок (белки) AAV Rep, дополнительно трансформированных зкДНК-плазмидой, зкДНК-бакмидой или зкДНК-бакуловирусом. Плазмиды, подходящие для получения зкДНК-векторов, включают плазмиды, показанные на Фиг. 8A (подходят для получения Rep BIIC), Фиг. 8B (плазмида, используемая для получения зкДНК-вектора).[00166] Examples of the method for preparing and isolating cccDNA vectors are presented in FIG. 4A-4E and in the specific examples below. The ccDNA vectors as described herein can be derived from producer cells expressing the AAV Rep protein(s) further transformed with a ccDNA plasmid, a ccDNA bacmid, or a ccDNA baculovirus. Plasmids suitable for the production of cccDNA vectors include those shown in FIG. 8A (suitable for obtaining Rep BIIC), FIG. 8B (plasmid used to produce the cDNA vector).
[00167] В одном аспекте полинуклеотид кодирует белок Rep AAV (Rep78 или 68), доставляемый в клетку-продуцент в плазмиде (Rep-плазмиде), бакмиде (Rep-бакмиде) или бакуловирусе (Rep-бакуловирусе). Rep-плазмида, Rep-бакмида и Rep-бакуловирус могут быть получены описанными выше способами. [00167] In one aspect, the polynucleotide encodes an AAV Rep protein (Rep78 or 68) delivered to the producing cell on a plasmid (Rep-plasmid), bacmid (Rep-bacmid), or baculovirus (Rep-baculovirus). Rep plasmid, Rep bacmid and Rep baculovirus can be produced by the methods described above.
[00168] Способы получения зкДНК-вектора, который представляет собой пример зкДНК-вектора, описаны в данном документе. Экспрессионные конструкты, используемые для получения зкДНК-векторов согласно данному изобретению, могут представлять собой плазмиду (например, зкДНК-плазмиды), бакмиду (например, зкДНК-бакмиду) и/или бакуловирус (например, зкДНК-бакуловирус). В неограничивающем примере зкДНК-вектор может быть получен из клеток, коинфицированных зкДНК-бакуловирусом и Rep-бакуловирусом. Белки Rep продуцированные с Rep-бакуловируса, могут реплицировать зкДНК-бакуловирус с получением зкДНК-векторов. Альтернативно, векторы зкДНК могут быть получены из клеток, стабильно трансфицированных конструктов, содержащей последовательность, кодирующую один белок Rep AAV (например, Rep78, Rep68 или Rep52), доставленный в Rep-плазмидах, Rep-бакмидах или Rep-бакуловирусе. ЗкДНК-бакуловирусом можно транзиентно трансфицировать клетки, он может быть реплицирован белком Rep и может продуцировать зкДНК-векторы. [00168] Methods for producing a cccDNA vector, which is an example of a ccDNA vector, are described herein. Expression constructs used to produce cccDNA vectors of the present invention may be a plasmid (eg, ccDNA plasmids), bacmid (eg, ccDNA-baculovirus), and/or baculovirus (eg, ccDNA-baculovirus). In a non-limiting example, the cDNA vector can be obtained from cells coinfected with cDNA baculovirus and Rep baculovirus. Rep proteins produced from Rep baculovirus can replicate cccDNA baculovirus to produce cccDNA vectors. Alternatively, cccDNA vectors can be prepared from cells stably transfected with constructs containing a sequence encoding a single AAV Rep protein (eg, Rep78, Rep68, or Rep52) delivered in Rep plasmids, Rep bacmids, or Rep baculovirus. The cDNA baculovirus can transiently transfect cells, can be replicated by the Rep protein, and can produce cDNA vectors.
[00169] Бакмидой (например, зкДНК-бакмидой) могут быть трансфицированы пермиссивные клетки насекомых, такие как Sf9, Sf21, клетки Tni (Trichoplusia ni), клетки High Five, и указанная бакмида продуцирует зкДНК-бакуловирус, который представляет собой рекомбинантный бакуловирус, включающий последовательности, содержащие ассимметричные ITR и экспрессионную кассету. Затем клетки насекомых могут быть инфицированы зкДНК-бакуловирусом для получения нового поколения рекомбинантного бакуловируса. Необязательно, указанный этап может быть повторен один или более раз для получения большего количества рекомбинантного бакуловируса.[00169] Permissive insect cells such as Sf9, Sf21, Tni (Trichoplusia ni), High Five cells can be transfected with a bacmid (e.g., cccDNA bacmid), and said bacmid produces a cccDNA baculovirus, which is a recombinant baculovirus comprising sequences containing asymmetric ITRs and an expression cassette. The insect cells can then be infected with the cDNA baculovirus to produce a new generation of recombinant baculovirus. Optionally, this step can be repeated one or more times to obtain more recombinant baculovirus.
[00170] Время сбора и извлечения зкДНК-векторов, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы обеспечить получение указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, роста клеток и т.п. Как правило, клетки могут быть собраны по прошествии достаточного времени после инфицирования бакуловирусом для продуцирования зкДНК-векторов (например, зкДНК-векторов), но до того, как большинство клеток начнут умирать вследствие токсичности вируса. ЗкДНК-векторы можно выделить из клеток Sf9 с использованием наборов для очистки плазмид, таких как наборы ENDO-FREE PLASMID® от Qiagen. Другие методы, разработанные для выделения плазмид, также могут быть адаптированы для зкДНК-векторов. Как правило, можно использовать любые известные в данной области способы очистки нуклеиновых кислот, а также коммерчески доступные наборы для экстракции ДНК. [00170] The timing of collection and recovery of the cccDNA vectors described herein from cells can be selected and optimized to ensure that the cccDNA vectors are obtained in high yield. For example, the collection time may be selected based on cell viability, cell morphology, cell growth, and the like. Typically, cells can be harvested after sufficient time has passed after baculovirus infection to produce cDNA vectors (eg, cDNA vectors) but before most cells begin to die due to viral toxicity. CctDNA vectors can be isolated from Sf9 cells using plasmid purification kits such as the ENDO-FREE PLASMID® kits from Qiagen. Other methods developed for plasmid isolation can also be adapted for cDNA vectors. In general, any nucleic acid purification methods known in the art, as well as commercially available DNA extraction kits, can be used.
[00171] Как вариант, очистка может быть проведена путем щелочного лизиса клеточного осадка, центрифугирования полученного лизата и выполнения хроматографического разделения. В качестве одного неограничивающего примера, указанный процесс может быть осуществлен путем загрузки супернатанта на ионообменную колонку (например, SARTOBIND Q®), которая удерживает нуклеиновые кислоты, с последующей элюцией (например, 1,2 M раствором NaCl), и проведения дополнительной хроматографической очистки на гель-фильтрационной колонке (например, 6 Fast Flow GE). Затем выделяют бескапсидный вектор AAV, например, путем осаждения.[00171] Alternatively, purification can be accomplished by alkaline lysis of the cell pellet, centrifuging the resulting lysate, and performing chromatographic separation. As one non-limiting example, this process can be accomplished by loading the supernatant onto an ion exchange column (e.g., SARTOBIND Q®) that retains nucleic acids, followed by elution (e.g., 1.2 M NaCl), and further chromatographic purification on gel filtration column (for example, 6 Fast Flow GE). The capsidless AAV vector is then isolated, for example by sedimentation.
[00172] Согласно некоторым вариантам реализации зкДНК-векторы могут также быть очищены в форме экзосом, или микрочастиц. В данной области техники известно, что многие типы клеток высвобождают не только растворимые белки, но и сложные белковые/нуклеиновокислотные грузы путем шеддинга мембранных микровезикул (Cocucci et al, 2009; EP 10306226.1). Такие везикулы включают микровезикулы (также называемые микрочастицами) и экзосомы (также называемые нановезикулами); и первые, и вторые содержат белки и РНК в качестве груза. Микровезикулы образуются в результате прямого отпочковывания от плазматической мембраны, а экзосомы высвобождаются во внеклеточную среду при слиянии мультивезикулярных эндосом с плазматической мембраной. Соответственно, содержащие зкДНК-вектор микровезикулы и/или экзосомы могут быть выделены из клеток, трансдуцированных с зкДНК-плазмидой, или бакмидой, или бакуловирусом, полученными с применением зкДНК-плазмиды.[00172] In some embodiments, cccDNA vectors may also be purified in the form of exosomes, or microparticles. It is known in the art that many cell types release not only soluble proteins, but also complex protein/nucleic acid cargos by shedding membrane microvesicles (Cocucci et al, 2009; EP 10306226.1). Such vesicles include microvesicles (also called microparticles) and exosomes (also called nanovesicles); both the former and the latter contain proteins and RNA as cargo. Microvesicles are formed by direct budding from the plasma membrane, and exosomes are released into the extracellular environment upon fusion of multivesicular endosomes with the plasma membrane. Accordingly, cccDNA vector-containing microvesicles and/or exosomes can be isolated from cells transduced with the ccDNA plasmid, or bacmid, or baculovirus produced using the ccDNA plasmid.
[00173] Микровезикулы можно выделить, выполнив фильтрацию или ультрацентрифугирование культуральной среды при 20000 x g, а экзосомы - при 100000 x g. Оптимальная продолжительность ультрацентрифугирования может быть определена экспериментально и зависит от конкретного типа клеток, из которых выделяют везикулы. Предпочтительно, культуральную среду сначала очищают низкоскоростным центрифугированием (например, при 2000 x g в течение 5-20 минут) и подвергают центрифугированию с использованием, например, спин-колонки AMICON® (Millipore, Уотфорд, Великобритания). Микровезикулы и экзосомы могут быть дополнительно очищены с помощью FACS или MACS с применением специфических антител, распознающих специфические поверхностные антигены, присутствующие на микровезикулах и экзосомах. Другие методы очистки микровезикул и экзосом включают, не ограничиваясь перечисленными, иммунопреципитацию, аффинную хроматографию, фильтрацию и магнитные гранулы, покрытые специфическими антителами или аптамерами. После очистки везикулы промывают, например, физиологическим раствором с фосфатным буфером. Одним из преимуществ использования микровезикул или экзосом для доставки зкДНК-содержащих везикул является то, что эти везикулы могут быть нацелены на клетки различных типов путем включения в их мембраны белков, распознаваемых специфическими рецепторами на соответствующих типах клеток. (см. также EP 10306226).[00173] Microvesicles can be isolated by filtering or ultracentrifuging the culture medium at 20,000 x g, and exosomes at 100,000 x g. The optimal duration of ultracentrifugation can be determined experimentally and depends on the specific cell type from which the vesicles are isolated. Preferably, the culture medium is first cleared by low-speed centrifugation (eg at 2000 x g for 5-20 minutes) and subjected to centrifugation using, for example, an AMICON® spin column (Millipore, Watford, UK). Microvesicles and exosomes can be further purified by FACS or MACS using specific antibodies that recognize specific surface antigens present on microvesicles and exosomes. Other methods for purifying microvesicles and exosomes include, but are not limited to, immunoprecipitation, affinity chromatography, filtration, and magnetic beads coated with specific antibodies or aptamers. After purification, the vesicles are washed, for example, with phosphate-buffered saline. One advantage of using microvesicles or exosomes to deliver cccDNA-containing vesicles is that these vesicles can be targeted to different cell types by incorporating proteins into their membranes that are recognized by specific receptors on the relevant cell types. (see also EP 10306226).
[00174] Другой аспект данного изобретения относится к способам очистки зкДНК-векторов из линий клеток-хозяев, которые стабильно интегрировали конструкт зкДНК в геном. Согласно одному варианту реализации очищенные зкДНК-векторы получают в виде молекул ДНК. Согласно другому варианту реализации очищенные зкДНК-векторы получают в виде экзосом или микрочастиц.[00174] Another aspect of the present invention relates to methods for purifying cccDNA vectors from host cell lines that have stably integrated the cccDNA construct into the genome. In one embodiment, purified cccDNA vectors are obtained as DNA molecules. In another embodiment, purified cDNA vectors are produced in the form of exosomes or microparticles.
[00175] На Фиг. 5 показан гель, подтверждающий получение зкДНК с нескольких конструктов зкДНК-плазмид с применением способа, описанного в разделе Примеры. ЗкДНК подтверждается характерным рисунком полос в геле, как описано со ссылкой на Фиг. 4D в Примерах. Другие характеристики процесса продуцирования зкДНК и промежуточных продуктов суммированы на Фиг. 6A и 6B и Фиг. 7A и 7B, как описано в Примерах.[00175] In FIG. 5 shows a gel confirming the production of cccDNA from several ccDNA plasmid constructs using the method described in the Examples section. The cctDNA is confirmed by a characteristic banding pattern in the gel, as described with reference to FIG. 4D in Examples. Other characteristics of the cccDNA production process and intermediates are summarized in FIG. 6A and 6B and FIG. 7A and 7B, as described in the Examples.
IV. зкДНК векторIV. cccDNA vector
[00176] Как описано в данном документе, способы и композиции, в которых используется единственный белок Rep, применимы для получения бескапсидной молекулы зкДНК с векторами с ковалентно замкнутыми концами (зкДНК). В некоторых вариантах реализации эти векторы зкДНК могут быть продуцированы в пермиссивных клетках-хозяевах, которые содержат единственный белок Rep, и получены из конструктов экспрессии (например, плазмиды зкДНК, бакмиды зкДНК, бакуловируса зкДНК или интегрированной клеточной линии), содержащий гетерологичный ген (трансген), расположенный между двумя последовательностями инвертированных концевых повторов (ITR), где последовательности ITR могут быть асимметричной парой ITR или симметричной или по существу симметричной парой ITR, как эти термины определены в данном документе. ЗкДНК-вектор содержащий NLS как описано в данном документе, может содержать последовательности ITR, которые выбраны из любых из: (i) по меньшей мере одного ITR дикого типа (WT) и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) AAV (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию друг относительно друга (например, асимметричных модифицированных ITR), или (iii) пары симметричных или по существу симметричных ITR WT-WT, в которой каждый ITR-WT имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, в которой каждый mod-ITR имеет одинаковую трехмерную пространственную организацию, при этом способы по данному изобретению могут дополнительно включать систему доставки, такую как, без ограничений, система доставки на основе липосомных наночастиц. [00176] As described herein, methods and compositions that use a single Rep protein are useful for producing a capsidless ccDNA molecule with covalently closed-end (ccDNA) vectors. In some embodiments, these cccDNA vectors can be produced in permissive host cells that contain a single Rep protein and are derived from expression constructs (e.g., ccDNA plasmid, ccDNA bacmid, baculovirus ccDNA, or integrated cell line) containing a heterologous gene (transgene) , located between two inverted terminal repeat (ITR) sequences, where the ITR sequences may be an asymmetric ITR pair or a symmetric or substantially symmetric ITR pair, as those terms are defined herein. A cccDNA vector containing an NLS as described herein may contain ITR sequences that are selected from any of: (i) at least one wild-type (WT) ITR and at least one modified AAV inverted terminal repeat (mod-ITR) (for example, asymmetric modified ITR); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization relative to each other (e.g., asymmetric modified ITRs), or (iii) a symmetric or substantially symmetric WT-WT ITR pair, in which each ITR-WT has the same three-dimensional spatial organization, or (iv) pairs of symmetrical or substantially symmetrical modified ITRs, wherein each mod-ITR has the same three-dimensional spatial organization, wherein the methods of this invention may further include a delivery system, such as, but not limited to, a delivery system based on liposomal nanoparticles.
[00177] ЗкДНК-вектор предпочтительно является дуплексным, например, самокомплементарным, по меньшей мере в части молекулы, такой как экспрессионная кассета (например, зкДНК не является двухцепочечной кольцевой молекулой). ЗкДНК-вектор имеет ковалентно замкнутые концы и, таким образом, устойчив к расщеплению экзонуклеазой (например, экзонуклеазой I или экзонуклеазой III), например, в течение часа при 37°С.[00177] The cccDNA vector is preferably duplex, eg, self-complementary, in at least part of the molecule, such as an expression cassette (eg, the ccDNA is not a double-stranded circular molecule). The cDNA vector has covalently closed ends and is thus resistant to digestion by an exonuclease (eg, exonuclease I or exonuclease III), for example, for an hour at 37°C.
[00178] ЗкДНК-вектор, полученный в соответствии со способами и композициями с использованием единственного белка Rep, описанными в данном документе, не имеет ограничений, связанных с упаковкой, накладываемых ограниченным пространством внутри вирусного капсида. ЗкДНК-векторы представляют собой жизнеспособную эукариотически-продуцируемую альтернативу прокариотически-продуцируемым векторам плазмидной ДНК, в отличие от инкапсулированных геномов AAV. Это позволяет вставлять контрольные элементы, например, регуляторные переключатели, как описано в данном документе, большие трансгены, множественные трансгены и т.д.[00178] The cctDNA vector produced in accordance with the methods and compositions using a single Rep protein described herein does not have the packaging limitations imposed by limited space within the viral capsid. CCDNA vectors provide a viable eukaryotic-produced alternative to prokaryotic-produced plasmid DNA vectors, as opposed to encapsulated AAV genomes. This allows the insertion of control elements, such as regulatory switches as described herein, large transgenes, multiple transgenes, etc.
[00179] В одном варианте реализации зкДНК-вектор, полученный в соответствии со способами и композициями с использованием единственного белка Rep, описанными в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (AAV), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, как описано в данном документе), и второй ITR AAV, причем первый ITR и второй ITR являются асимметричными относительно друг друга, т.е. они отличаются друг от друга. В качестве типичного варианта реализации первая ITR может быть ITR дикого типа, а вторая ITR может быть мутированной или модифицированной ITR. В некоторых вариантах реализации первая ITR может быть мутированной или модифицированной ITR, а вторая ITR - ITR дикого типа. В другом варианте реализации первый ITR и второй ITR оба являются модифицированными, но представляют собой разные последовательности, или имеют разные модификации, или не являются идентично модифицированными ITR. Другими словами, ITR асимметричны в том смысле, что любые изменения в одном ITR не отражаются в другом ITR; или, альтернативно, если ITR отличаются друг от друга. Типичные примеры асимметричных ITR в зкДНК-векторе и для использования при получении зкДНК-плазмиды описаны ниже в разделе, озаглавленном «ITR».[00179] In one embodiment, a cccDNA vector prepared in accordance with the methods and compositions using a single Rep protein described herein comprises, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus ( AAV), a nucleotide sequence of interest (e.g., an expression cassette as described herein), and a second AAV ITR, wherein the first ITR and the second ITR are asymmetric with respect to each other, i.e. they are different from each other. As an exemplary embodiment, the first ITR may be a wild-type ITR, and the second ITR may be a mutated or modified ITR. In some embodiments, the first ITR may be a mutated or modified ITR, and the second ITR may be a wild-type ITR. In another embodiment, the first ITR and the second ITR are both modified, but are different sequences, or have different modifications, or are not identically modified ITRs. In other words, ITRs are asymmetrical in the sense that any changes in one ITR are not reflected in the other ITR; or alternatively if the ITRs are different from each other. Typical examples of asymmetric ITRs in a cDNA vector and for use in making a cDNA plasmid are described below in the section entitled “ITRs”.
[00180] Последовательности ITR дикого типа или мутированные или иным образом модифицированные, представленные в данном документе, представляют собой последовательности ДНК, включенные в экспрессионный конструкт (например, зкДНК-плазмиду, зкДНК-бакмиду, зкДНК-бакуловирус) для продуцирования зкДНК-вектора. Соответственно, последовательности ITR, фактически содержащиеся в указанном зкДНК-векторе, продуцируемом с зкДНК-плазмиды или другого экспрессионного конструкта, могут быть или не быть идентичными последовательностям ITR по данному изобретению, что обусловлено естественными изменениями, происходящими в процессе получения (например, ошибкой репликации). [00180] Wild-type or mutated or otherwise modified ITR sequences provided herein are DNA sequences included in an expression construct (eg, ccDNA plasmid, ccDNA bacmid, ccDNA baculovirus) to produce a ccDNA vector. Accordingly, the ITR sequences actually contained in said cccDNA vector produced from a cccDNA plasmid or other expression construct may or may not be identical to the ITR sequences of the present invention due to natural variations occurring during production (e.g., replication error). .
[00181] Согласно некоторым вариантам реализации зкДНК-вектор, полученный в соответствии со способами и композициями с использованием единственного белка Rep, описанными в данном документе, содержит экспрессионную кассету с трансгеном, который может представлять собой, например, регуляторную последовательность, последовательность, кодирующую нуклеиновую кислоту (например, такую как miR или антисмысловая последовательность), или последовательность, кодирующую полипептид (например, такую как трансген). Согласно одному варианту реализации указанный трансген может быть функционально связан с одной или более регуляторными последовательностями, которые обеспечивают или контролируют экспрессию трансгена. Согласно одному варианту реализации указанный полинуклеотид содержит первую последовательность ITR и вторую последовательность ITR, причем представляющая интерес нуклеотидная последовательность фланкирована первой и второй последовательностями ITR, и указанные первая и вторая последовательности ITR асимметричны друг другу.[00181] In some embodiments, a cccDNA vector produced in accordance with the methods and compositions using a single Rep protein described herein comprises a transgene expression cassette, which may be, for example, a regulatory sequence, a nucleic acid coding sequence (eg, such as a miR or antisense sequence), or a polypeptide coding sequence (eg, such as a transgene). In one embodiment, the transgene may be operably linked to one or more regulatory sequences that provide or control expression of the transgene. In one embodiment, said polynucleotide comprises a first ITR sequence and a second ITR sequence, wherein the nucleotide sequence of interest is flanked by the first and second ITR sequences, and the first and second ITR sequences are asymmetric to each other.
[00182] В одном варианте реализации в каждом из указанных аспектов экспрессионная кассета расположена между двумя ITR, которые содержат, в следующем порядке, вместе с чем-либо одним или более из перечисленного: промотор, функционально связанный с трансгеном, посттранскрипционный регуляторный элемент; и сигнал полиаденилирования и терминации. В одном варианте реализации промотор является регулируемым - индуцибельным или репрессируемым. Промотор может представлять собой любую последовательность, которая облегчает транскрипцию трансгена. В одном варианте реализации указанный промотор представляет собой промотор CAG (например, SEQ ID NO: 03) или его вариант. Указанный посттранскрипционный регуляторный элемент представляет собой последовательность, которая модулирует экспрессию трансгена, в неограничивающем примере - любую последовательность, образующую третичную структуру, которая усиливает экспрессию трансгена. [00182] In one embodiment, in each of these aspects, the expression cassette is located between two ITRs that contain, in the following order, together with one or more of the following: a promoter operably linked to the transgene, a post-transcriptional regulatory element; and polyadenylation and termination signal. In one embodiment, the promoter is regulated - inducible or repressible. A promoter can be any sequence that facilitates transcription of a transgene. In one embodiment, said promoter is a CAG promoter (eg, SEQ ID NO: 03) or a variant thereof. Said post-transcriptional regulatory element is a sequence that modulates the expression of a transgene, in a non-limiting example, any sequence forming a tertiary structure that enhances the expression of a transgene.
[00183] В одном варианте реализации указанный посттранскрипционный регуляторный элемент содержит WPRE (например, SEQ ID NO: 08). В одном варианте реализации указанный сигнал полиаденилирования и терминации содержит поли(A) BGH (например, SEQ ID NO: 09). Дополнительно может быть использован любой цис-регуляторный элемент, известный в данной области техники, или их комбинация, например, энхансерная 5'-последовательность позднего сигнала полиаденилирования SV40 (USE) или другие элементы посттранскрипционного процессинга, в том числе, но не ограничиваясь перечисленными, ген тимидинкиназы вируса простого герпеса или вируса гепатита B (HBV). Согласно одному варианту реализации длина экспрессионной кассеты в 5'-3' направлении больше известной максимальной длины последовательности, заключаемой в капсид вириона AAV. Согласно одному варианту реализации указанная длина составляет более 4,6 т.п.о., или более 5 т.п.о., или более 6 т.п.о., или более 7 т.п.о. Различные примеры экспрессионных кассет представлены в данном документе.[00183] In one embodiment, said post-transcriptional regulatory element comprises a WPRE (eg, SEQ ID NO: 08). In one embodiment, said polyadenylation and termination signal comprises poly(A) BGH (eg, SEQ ID NO: 09). Additionally, any cis-regulatory element known in the art, or a combination thereof, can be used, for example, the SV40 late polyadenylation signal 5' enhancer sequence (USE) or other post-transcriptional processing elements, including, but not limited to, the gene thymidine kinase of herpes simplex virus or hepatitis B virus (HBV). In one embodiment, the length of the expression cassette in the 5'-3' direction is greater than the known maximum length of sequence enclosed in the AAV virion capsid. In one embodiment, said length is greater than 4.6 kb, or greater than 5 kb, or greater than 6 kb, or greater than 7 kb. Various examples of expression cassettes are presented herein.
[00184] Указанная экспрессионная кассета в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, описанным в данном документе, может содержать более 4000 нуклеотидов, 5000 нуклеотидов, 10000 нуклеотидов или 20000 нуклеотидов, или 30000 нуклеотидов, или 40000 нуклеотидов, или 50000 нуклеотидов, или любой диапазон значений в пределах между примерно 4000-10000 нуклеотидов или 10000-50000 нуклеотидов, или более 50000 нуклеотидов. В некоторых вариантах реализации экспрессионная кассета может содержать трансген или нуклеиновую кислоту имеющий длину в диапазоне от 500 до 50000 нуклеотидов. В некоторых вариантах реализации экспрессионная кассета может содержать трансген или нуклеиновую кислоту имеющий длину в диапазоне от 500 до 75000 нуклеотидов. В некоторых вариантах реализации экспрессионная кассета может содержать трансген или нуклеиновую кислоту имеющий длину в диапазоне от 500 до 10000 нуклеотидов. В некоторых вариантах реализации экспрессионная кассета может содержать трансген или нуклеиновую кислоту имеющий длину в диапазоне от 1000 до 10000 нуклеотидов. В некоторых вариантах реализации экспрессионная кассета может содержать трансген или нуклеиновую кислоту имеющий длину в диапазоне от 500 до 5000 нуклеотидов. Указанные зкДНК-векторы не имеют ограничений по размеру, характерных для заключенных в капсиды AAV-векторов, что позволяет доставлять экспрессионную кассету значительного размера для обеспечения эффективной экспрессии трансгенов. Согласно некоторым вариантам реализации указанный зкДНК-вектор не содержит специфического для прокариот метилирования. [00184] Said expression cassette in a cccDNA vector prepared in accordance with the methods and compositions using a single Rep protein described herein may contain more than 4000 nucleotides, 5000 nucleotides, 10000 nucleotides or 20000 nucleotides, or 30000 nucleotides, or 40000 nucleotides , or 50,000 nucleotides, or any range between about 4,000-10,000 nucleotides, or 10,000-50,000 nucleotides, or greater than 50,000 nucleotides. In some embodiments, the expression cassette may comprise a transgene or nucleic acid having a length ranging from 500 to 50,000 nucleotides. In some embodiments, the expression cassette may comprise a transgene or nucleic acid having a length ranging from 500 to 75,000 nucleotides. In some embodiments, the expression cassette may comprise a transgene or nucleic acid having a length ranging from 500 to 10,000 nucleotides. In some embodiments, the expression cassette may comprise a transgene or nucleic acid having a length in the range of 1000 to 10,000 nucleotides. In some embodiments, the expression cassette may comprise a transgene or nucleic acid having a length in the range of 500 to 5000 nucleotides. These cccDNA vectors do not have the size restrictions characteristic of capsid-enclosed AAV vectors, which allows delivery of a significant size expression cassette to ensure efficient transgene expression. In some embodiments, the cDNA vector does not contain prokaryote-specific methylation.
[00185] В некоторых вариантах реализации кассета экспрессии в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, также может содержать внутренний сайт входа в рибосому (IRES) и/или элемент 2A. Цис-регуляторные элементы включают, не ограничиваясь перечисленными, промотор, рибопереключатель, инсулятор, miR-регулируемый элемент, посттранскрипционный регуляторный элемент, тканеспецифический и клеточноспецифический промотор и энхансер. Согласно некоторым вариантам реализации указанный ITR может действовать в качестве промотора для трансгена. В некоторых вариантах реализации указанный зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии указанного трансгена, например, один или несколько регуляторных переключателей, которые описаны в данном документе в разделе «Регуляторные переключатели», для контроля и регуляции экспрессии указанного трансгена, и может содержать, при необходимости, регуляторный переключатель, который представляет собой «аварийный выключатель», позволяющий обеспечивать контролируемую смерть клетки, содержащей зкДНК-вектор.[00185] In some embodiments, an expression cassette in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may also comprise an internal ribosome entry site (IRES) and/or a 2A element. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a miR-regulated element, a post-transcriptional regulatory element, a tissue-specific and cell-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter for a transgene. In some embodiments, said cccDNA vector contains additional components for regulating the expression of said transgene, for example, one or more regulatory switches, which are described herein in the "Regulatory Switches" section, for controlling and regulating the expression of said transgene, and may comprise, at necessary, a regulatory switch that provides a “safety switch” to allow controlled death of the cell containing the cccDNA vector.
[00186] На Фиг. 1А-1С приведены схематические изображения неограничивающих типичных примеров зкДНК-векторов, или соответствующая последовательность зкДНК-плазмид. ЗкДНК-векторы являются бескапсидными и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, экспрессируемую трансгенную кассету и второй ITR, при этом по меньшей мере одна из последовательностей первого и/или второго ITR мутирована относительно соответствующей последовательности ITR AAV2 дикого типа. Указанная экспрессируемая трансгенная кассета предпочтительно включает в указанном порядке, что-либо одно или более из следующего: энхансер/промотор, ORF-репортер (трансген), посттранскрипционный регуляторный элемент (например, WPRE) и сигнал полиаденилирования и терминации (например, поли(А) BGH). [00186] In FIG. 1A-1C are schematic representations of non-limiting exemplary examples of cDNA vectors, or the corresponding sequence of cDNA plasmids. CccDNA vectors are capsidless and can be derived from a plasmid encoding, in this order: a first ITR, an expressed transgene cassette, and a second ITR, wherein at least one of the first and/or second ITR sequences is mutated relative to the corresponding wild-type AAV2 ITR sequence . Said expressed transgene cassette preferably includes, in that order, one or more of the following: an enhancer/promoter, an ORF reporter (transgene), a post-transcriptional regulatory element (e.g., WPRE), and a polyadenylation and termination signal (e.g., poly(A) BGH).
[00187] Кассета экспрессии в векторе зкДНК, полученном в соответствии со способами и композициями с использованием одного белка Rep, как раскрыто в данном документе, может содержать любой интересующий трансген. Трансгены, представляющие интерес, включают, не ограничиваясь перечисленными, нуклеиновые кислоты, кодирующие полипептиды, или некодирующие нуклеиновые кислоты (например, РНКи, miR и т.п.) предпочтительно терапевтические (например, для применения в медицинских, диагностических или ветеринарных целях) или иммуногенные полипептиды (например, для вакцин) полипептиды. Согласно некоторым вариантам реализации трансгены в экспрессионной кассете кодируют один или более полипептидов, пептидов, рибозимов, пептидных нуклеиновых кислот, киРНК, РНКи, антисмысловых олигонуклеотидов, антисмысловых полинуклеотидов, антител, антигенсвязывающих фрагментов или любой комбинации перечисленного. Согласно некоторым вариантам реализации указанный трансген представляет собой терапевтический ген или маркерный белок. Согласно некоторым вариантам реализации указанный трансген представляет собой агонист или антагонист. Согласно некоторым вариантам реализации указанный антагонист представляет собой миметик антитела или фрагмент антитела, или его антигенсвязывающий фрагмент, например, нейтрализующее антитело или фрагмент антитела и т.п. Согласно некоторым вариантам реализации указанный трансген кодирует антитело, в том числе полноразмерное антитело или фрагмент антитела согласно определению в данном документе. Согласно некоторым вариантам реализации указанное антитело представляет собой антигенсвязывающий домен или последовательность вариабельного домена иммуноглобулина согласно определению в данном документе.[00187] An expression cassette in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may contain any transgene of interest. Transgenes of interest include, but are not limited to, polypeptide-encoding nucleic acids or non-coding nucleic acids (e.g., RNAi, miR, etc.), preferably therapeutic (e.g., for medical, diagnostic, or veterinary purposes) or immunogenic polypeptides (for example, for vaccines) polypeptides. In some embodiments, the transgenes in the expression cassette encode one or more polypeptides, peptides, ribozymes, peptide nucleic acids, siRNA, RNAi, antisense oligonucleotides, antisense polynucleotides, antibodies, antigen binding fragments, or any combination thereof. In some embodiments, the transgene is a therapeutic gene or marker protein. In some embodiments, the transgene is an agonist or antagonist. In some embodiments, said antagonist is an antibody mimetic or antibody fragment, or an antigen-binding fragment thereof, e.g., a neutralizing antibody or antibody fragment, or the like. In some embodiments, the transgene encodes an antibody, including a full-length antibody or antibody fragment as defined herein. In some embodiments, the antibody is an antigen binding domain or an immunoglobulin variable domain sequence as defined herein.
[00188] В частности, указанный трансген может кодировать один или более терапевтических агентов, в том числе, но не ограничиваясь перечисленными, например, белок (белки), полипептид(ы), пептид(ы), фермент(ы), антитела, антигенсвязывающие фрагменты, а также их варианты и/или активные фрагменты для применения при лечении, профилактике и/или облегчении одного или более симптомов заболеваний, дисфункции, повреждения и/или расстройства. Примеры трансгенов описаны в данном документе в разделе, названном «Способ лечения».[00188] In particular, the transgene may encode one or more therapeutic agents, including, but not limited to, protein(s), polypeptide(s), peptide(s), enzyme(s), antibodies, antigen-binding fragments, as well as variants and/or active fragments thereof, for use in the treatment, prevention and/or alleviation of one or more symptoms of diseases, dysfunctions, injuries and/or disorders. Examples of transgenes are described herein in the section entitled "Method of Treatment".
[00189] Существует множество структурных признаков зкДНК-векторов, полученных в соответствии со способами и композициями с использованием единого белка Rep, как раскрыто в данном документе, которые отличают их от экспрессионных векторов на основе плазмид. ЗкДНК-векторы могут обладать одним или более из следующих признаков: отсутствие оригинальной (т.е. не инсертированной) бактериальной ДНК, отсутствие прокариотической точки начала репликации, автономность, т.е., они не требуют каких-либо последовательностей, кроме двух ITR, включая связывающие Rep сайты и сайты концевого разрешения (RBS и TRS), и экзогенной последовательности между ITR, присутствие последовательностей ITR, которые образуют шпильки, эукариотического происхождения (т.е., они продуцируются в эукариотических клетках), и отсутствие метилирования ДНК бактериального типа или, по сути, любого другого метилирования, воспринимаемого как аномальное хозяином-млекопитающим. В целом, предпочтительно, чтобы предложенные векторы не содержали какой-либо прокариотической ДНК, однако предусматривается возможность вставки какой-либо прокариотической ДНК в виде экзогенной последовательности, в качестве неограничивающего примера, в промоторном или энхансерном участке. Другой важный признак, отличающий зкДНК-векторы от плазмидных экспрессионных векторов, заключается в том, что зкДНК-векторы представляют собой одноцепочечную линейную ДНК с замкнутыми концами, тогда как плазмиды всегда представлены двуцепочечной ДНК.[00189] There are many structural features of cccDNA vectors produced in accordance with methods and compositions using a single Rep protein as disclosed herein that distinguish them from plasmid-based expression vectors. CccDNA vectors may have one or more of the following characteristics: the absence of original (i.e., not inserted) bacterial DNA, the absence of a prokaryotic origin of replication, autonomy, i.e., they do not require any sequences other than two ITRs, including Rep binding sites and terminal resolution sites (RBS and TRS), and exogenous sequence between ITRs, the presence of ITR sequences that form hairpins are of eukaryotic origin (i.e., they are produced in eukaryotic cells), and the absence of bacterial-type DNA methylation or , essentially any other methylation perceived as abnormal by the mammalian host. In general, it is preferred that the present vectors do not contain any prokaryotic DNA, but it is possible to insert some prokaryotic DNA as an exogenous sequence, by way of non-limiting example, in a promoter or enhancer region. Another important feature that distinguishes cccDNA vectors from plasmid expression vectors is that cccDNA vectors are single-stranded linear DNA with closed ends, while plasmids are always double-stranded DNA.
[00190] ЗкДНК-векторы, полученных в соответствии со способами и композициями с использованием единого белка Rep, как раскрыто в данном документе, предпочтительно имеют линейную и непрерывную структуру, а не прерывистую структуру, при определении с помощью анализа расщепления рестриктазой (Фиг. 4D). Считается, что линейная и непрерывная структура более устойчива к атаке клеточными эндонуклеазами, а также с меньшей вероятностью подвергается рекомбинации и вызывает мутагенез. Соответственно, зкДНК-вектор, имеющий линейную и непрерывную структуру, представляет собой предпочтительный вариант реализации. Непрерывный линейный одноцепочечный зкДНК-вектор с внутримолекулярным дуплексом может иметь ковалентно связанные концы без последовательностей, кодирующих белки капсида AAV. Указанные зкДНК-плазмиды структурно отличаются от плазмид (включая зкДНК-плазмиды, описанные в данном документе), которые представляют собой кольцевые дуплексные молекулы нуклеиновых кислот бактериального происхождения. Комплементарные цепи плазмид могут быть разделены после денатурации с получением двух молекул нуклеиновой кислоты, тогда как, напротив, зкДНК-векторы, содержащие комплементарные цепи, представлены единственной молекулой ДНК и, соответственно, даже после денатурации остаются в виде единственной молекулы. В некоторых вариантах реализации зкДНК-векторы, как описано в данном документе, могут быть получены без метилирования оснований ДНК по прокариотическому типу, в отличие от плазмид. Соответственно, зкДНК-векторы и зкДНК-плазмиды отличаются как структурой (в частности, линейной или кольцевой), так и способами, применяемыми для получения и очистки указанных отличающихся объектов (см. ниже), а также характером метилирования ДНК, которое происходит по прокариотическому типу в зкДНК-плазмидах и по эукариотическому типу в зкДНК-векторе. [00190] CctDNA vectors prepared in accordance with methods and compositions using a single Rep protein as disclosed herein preferably have a linear and continuous structure rather than a discontinuous structure, as determined by a restriction enzyme digestion assay (Figure 4D) . A linear and continuous structure is thought to be more resistant to attack by cellular endonucleases and is also less likely to undergo recombination and cause mutagenesis. Accordingly, a cccDNA vector having a linear and continuous structure is a preferred embodiment. A continuous linear single-stranded cccDNA vector with an intramolecular duplex can have covalently linked ends without AAV capsid protein coding sequences. These cDNA plasmids are structurally different from plasmids (including the cDNA plasmids described herein), which are circular duplex nucleic acid molecules of bacterial origin. The complementary strands of plasmids can be separated after denaturation to produce two nucleic acid molecules, while, on the contrary, cccDNA vectors containing complementary strands are represented by a single DNA molecule and, accordingly, even after denaturation remain as a single molecule. In some embodiments, cccDNA vectors, as described herein, can be produced without prokaryotic DNA base methylation, unlike plasmids. Accordingly, cccDNA vectors and ccDNA plasmids differ both in structure (in particular, linear or circular), and in the methods used to obtain and purify these different objects (see below), as well as in the nature of DNA methylation, which occurs in a prokaryotic manner in cDNA plasmids and in the eukaryotic type in the cDNA vector.
[00191] Несколько преимуществ использования зкДНК-вектора, как описано в данном документе, по сравнению с экспрессионными векторами на основе плазмид, включают, без ограничений, следующие: 1) плазмиды содержат последовательности бактериальной ДНК и подвергаются специфическому прокариотическому метилированию, например, метилированию с образованием 6-метиладенозина и 5-метилцитозина, тогда как бескапсидные последовательности AAV-вектора имеют эукариотическое происхождение и не подвергаются специфическому прокариотическому метилированию; в результате бескапсидные AAV-векторы будут с меньшей вероятностью индуцировать воспалительные и иммунные ответы по сравнению с плазмидами; 2) если плазмиды требуют наличия гена устойчивости в процессе получения, то зкДНК-векторы - нет; 3) если кольцевая плазмида не доставляется в ядро при введении в клетку и требует избыточной нагрузки, чтобы избежать разложения клеточными нуклеазами, то зкДНК-векторы содержат вирусные цис-элементы, т.е. ITR, придающие устойчивость к нуклеазам, и могут быть сконструированы для нацеливания и доставки в ядро. Выдвинуто предположение, что минимальными определяющими элементами, обязательными для функции ITR, являются Rep-связывающий сайт (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531) для AAV2) и сайт концевого разрешения (TRS; 5'-AGTTGG-3' (SEQ ID NO: 48) для AAV2), плюс вариабельная палиндромная последовательность, обеспечивающая образование шпильки; и 4) зкДНК-векторы не характеризуются часто обнаруживаемой в происходящих из прокариот плазмидах чрезмерной представленностью CpG-динуклеотидов, которые, по имеющимся данным, связываются с представителем Toll-подобного семейства рецепторов, вызывая опосредованный T-клетками иммунный ответ. Напротив, трансдукция бескапсидными AAV-векторами согласно описанию в данном документе может быть эффективно нацелена на типы клеток и тканей, которые трудно трансдуцировать стандартными вирионами AAV с применением различных реагентов для доставки. [00191] Several advantages of using a cccDNA vector as described herein over plasmid-based expression vectors include, but are not limited to: 1) plasmids contain bacterial DNA sequences and are subject to specific prokaryotic methylation, e.g. 6-methyladenosine and 5-methylcytosine, whereas the capsid-free sequences of the AAV vector are of eukaryotic origin and are not subject to specific prokaryotic methylation; as a result, capsidless AAV vectors will be less likely to induce inflammatory and immune responses compared to plasmids; 2) if plasmids require the presence of a resistance gene during production, then ccDNA vectors do not; 3) if the circular plasmid is not delivered to the nucleus when introduced into the cell and requires an excess load to avoid degradation by cellular nucleases, then ccDNA vectors contain viral cis-elements, i.e. ITRs confer nuclease resistance and can be engineered to target and deliver to the nucleus. It has been proposed that the minimum defining elements required for ITR function are the Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531) for AAV2) and the terminal resolution site (TRS; 5'-AGTTGG- 3' (SEQ ID NO: 48) for AAV2), plus a variable palindromic hairpin sequence; and 4) cccDNA vectors do not exhibit the common overrepresentation of CpG dinucleotides found in prokaryotic-derived plasmids, which have been shown to bind to a member of the Toll-like receptor family to elicit a T cell-mediated immune response. In contrast, transduction with capsidless AAV vectors as described herein can effectively target cell and tissue types that are difficult to transduce with standard AAV virions using different delivery reagents.
V. ITRV. ITR
[00192] Вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, содержит гетерологичный ген, расположенный между двумя последовательностями инвертированных концевых повторов (ITR), которые отличаются друг от друга (т.е. являются асимметричными ITR). В некоторых вариантах реализации по меньшей мере один из ITR модифицирован путем делеции, вставки и/или замены по сравнению с последовательностью ITR дикого типа (например, ITR AAV); и по меньшей мере один из ITR содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для AAV2, SEQ ID NO: 531) и функциональный сайт терминального разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 46.) В одном варианте реализации, по меньшей мере один из указанных ITR является нефункциональным ITR. В одном варианте реализации не каждый из разных или модифицированных ITR является ITR дикого типа из разных серотипов.[00192] A cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein contains a heterologous gene located between two inverted terminal repeat (ITR) sequences that are different from each other (i.e. are asymmetric ITRs). In some embodiments, at least one of the ITRs is modified by deletion, insertion, and/or substitution relative to the wild-type ITR sequence (eg, AAV ITR); and at least one of the ITRs contains a functional Rep binding site (RBS; e.g., 5'-GCGCGCTCGCTCGCTC-3' for AAV2, SEQ ID NO: 531) and a functional terminal resolution site (TRS; e.g., 5'-AGTT-3' SEQ ID NO: 46.) In one embodiment, at least one of the ITRs is a non-functional ITR. In one embodiment, not each of the different or modified ITRs is a wild-type ITR from different serotypes.
[00193] Хотя ITR, приведенные для иллюстрации в данном документе в описании и Примерах, представляют собой ITR AAV2, специалисту в данной области техники известно, что, как было указано выше, можно использовать ITR из любого известного парвовируса, например, депендовируса, такого как AAV (например, из генома AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV12, AAVrh8, AAVrh10, AAV-DJ и AAV-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261), химерные ITR или ITR из любых синтетических AAV. Согласно некоторым вариантам реализации указанный AAV способен инфицировать теплокровных животных, например, представлен аденоассоциированными вирусами птиц (AAAV), крупного рогатого скота (BAAV), собачьих, лошадей и овец. Согласно некоторым вариантам реализации ITR взят из парвовируса B19 (номер доступа GenBank: NC 000883), мелкого вируса мышей (MVM) (номер доступа GenBank NC 001510); парвовируса гусей (номер доступа в GenBank NC 001701); парвовируса змей 1 (номер доступа GenBank NC 006148). [00193] Although the ITRs given for illustration herein in the Description and Examples are the AAV2 ITRs, one skilled in the art will recognize that, as stated above, ITRs from any known parvovirus, for example a dependovirus, such as AAV (e.g., from the genome of AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV12, AAVrh8, AAVrh10, AAV-DJ, and AAV-DJ8. For example, NCBI: NC 002077 ; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261), chimeric ITRs or ITRs from any synthetic AAV. In some embodiments, the AAV is capable of infecting warm-blooded animals, such as avian adeno-associated viruses (AAAV), bovine adeno-associated virus (BAAV), canine, equine, and sheep. In some embodiments, the ITR is derived from parvovirus B19 (GenBank accession number: NC 000883), mouse small virus (MVM) (GenBank accession number NC 001510); goose parvovirus (GenBank accession number NC 001701); snake parvovirus 1 (GenBank accession number NC 006148).
[00194] Согласно некоторым вариантам реализации указанная последовательность ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может быть взята из вирусов семейства Parvoviridae, которое включает два подсемейства: Parvovirinae, которые инфицируют позвоночных, и Densovirinae, которые инфицируют насекомых. Подсемейство Parvovirinae (называемое парвовирусами) включает род Dependovirus, представители которого, в большинстве случаев, нуждаются в коинфицировании хелперным вирусом, таким как аденовирус или вирус герпеса, для продуктивной инфекции. Род Dependovirus включает аденоассоциированный вирус (AAV), который обычно инфицирует людей (например, серотипы 2, 3A, 3B, 5 и 6) или приматов (например, серотипы 1 и 4), и родственные вирусы, которые инфицируют других теплокровных животных (например, аденоассоциированные вирусы крупного рогатого скота, собачьих, лошадей, овец). Общее описание парвовирусов и других представителей семейства Parvoviridae приведено в источнике: Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication," глава 69 издания «FIELDS VIROLOGY» (3 издание, 1996).[00194] In some embodiments, said ITR sequence in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may be from viruses of the Parvoviridae family, which includes two subfamilies: Parvovirinae, which infect vertebrates, and Densovirinae, which infect insects. The subfamily Parvovirinae (called parvoviruses) includes the genus Dependovirus, members of which, in most cases, require coinfection with a helper virus, such as adenovirus or herpes virus, for productive infection. The genus Dependovirus includes adeno-associated virus (AAV), which commonly infects humans (e.g., serotypes 2, 3A, 3B, 5, and 6) or primates (e.g., serotypes 1 and 4), and related viruses that infect other warm-blooded animals (e.g. adeno-associated viruses of cattle, canines, horses, sheep). For a general description of parvoviruses and other members of the family Parvoviridae, see Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication," chapter 69 of FIELDS VIROLOGY (3rd edition, 1996).
[00195] Специалисту в данной области техники известно, что последовательности ITR имеют общую структуру, содержащую двухцепочечную структуру Холлидея, которая, как правило, представляет собой T-образную или Y-образную шпилечную структуру (см., например, Фиг. 2A и Фиг. 3A), при этом каждый ITR образован двумя палиндромными плечами или петлями (B-B' и C-C'), погруженными в палиндромное плечо большего размера (A-A'), и одноцепочечную последовательность D (при этом порядок указанных палиндромных последовательностей определяет ориентацию ITR), и, соответственно, можно легко определить соответствующие модифицированные последовательности ITR из любого серотипа AAV для применения в зкДНК-векторе или зкДНК-плазмиде на основе типичных последовательностей AAV2 ITR приведенных в данном документе. См., например, описание структурного анализа и сравнения последовательностей ITR из разных серотипов AAV (AAV1-AAV6) в источниках Grimm et al., J. Virology, 2006; 80(1); 426-439; Yan et al., J. Virology, 2005; 364-379; Duan et al., Virology 1999; 261; 8-14. [00195] One skilled in the art will recognize that ITR sequences have a general structure containing a double-stranded Holliday structure, which is typically a T-shaped or Y-shaped hairpin structure (see, for example, FIG. 2A and FIG. 3A), with each ITR formed by two palindromic arms or loops (B-B' and C-C') embedded in a larger palindromic arm (A-A'), and a single-stranded sequence D (the order of these palindromic sequences determining the orientation of the ITR ), and accordingly, appropriate modified ITR sequences from any AAV serotype can be easily determined for use in a ccDNA vector or ccDNA plasmid based on the representative AAV2 ITR sequences provided herein. See, for example, for a description of the structural analysis and comparison of ITR sequences from different AAV serotypes (AAV1-AAV6) in Grimm et al., J. Virology, 2006; 80(1); 426-439; Yan et al., J. Virology, 2005; 364-379; Duan et al., Virology 1999; 261; 8-14.
[00196] Конкретные изменения и мутации в ITR подробно описаны в данном документе, но в контексте «измененных» или «мутированных» или «модифицированных» ITR, эти определения указывают на то, что нуклеотиды были вставлены, удалены и/или замещены относительно принадлежащей к дикому типу, референсной или исходной последовательности ITR, и могут быть изменены относительно другого фланкирующего ITR в векторе зкДНК, имеющем два фланкирующих ITR. Измененный или мутированный ITR может представлять собой сконструированный ITR. В данном документе «сконструированный» относится к аспекту, который подвергается манипуляциям человека. Например, полипептид считается «рекомбинантным», когда по меньшей мере один аспект полипептида, например, его последовательность, был подвергнут манипуляциям со стороны человека для создания отличий от аспекта, в котором он существует в природе.[00196] Specific changes and mutations in ITRs are described in detail herein, but in the context of "altered" or "mutated" or "modified" ITRs, these definitions indicate that nucleotides have been inserted, deleted and/or substituted relative to those belonging to wild type, reference or original ITR sequence, and may be modified relative to another flanking ITR in a ccDNA vector having two flanking ITRs. The altered or mutated ITR may be an engineered ITR. In this document, “constructed” refers to an aspect that is subject to human manipulation. For example, a polypeptide is considered "recombinant" when at least one aspect of the polypeptide, such as its sequence, has been manipulated by humans to be different from the aspect in which it exists in nature.
[00197] В некоторых вариантах реализации ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может быть синтетическим. Согласно одному варианту реализации синтетический ITR основан на последовательностях ITR более чем из одного серотипа AAV. Согласно другому варианту реализации синтетический ITR не включает последовательностей на основе AAV. Согласно еще одному варианту реализации, синтетический ITR сохраняет описанную выше структуру ITR, хотя и содержит только часть или не содержит последовательности, происходящей из AAV. В некоторых аспектах синтетический ITR может взаимодействовать преимущественно с Rep дикого типа или с Rep определенного серотипа, или, в некоторых случаях, не будет распознаваться Rep дикого типа и будет распознаваться только мутированным Rep.[00197] In some embodiments, the ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may be synthetic. In one embodiment, the synthetic ITR is based on ITR sequences from more than one AAV serotype. In another embodiment, the synthetic ITR does not include AAV-based sequences. In yet another embodiment, the synthetic ITR retains the ITR structure described above, although it contains only part or no AAV-derived sequence. In some aspects, the synthetic ITR may interact preferentially with wild-type Rep or with Rep of a particular serotype, or, in some cases, will not be recognized by wild-type Rep and will be recognized only by mutated Rep.
[00198] Последовательности ITR устроены однотипно и содержат двуцепочечную структуру Холлидея, которая, как правило, представляет собой T-образную или Y-образную шпилечную структуру (см., например, Фиг. 2A и Фиг. 3A), при этом каждый ITR образован двумя палиндромными плечами или петлями (B-B' и C-C'), встроенными в палиндромное плечо большего размера (A-A'), и одноцепочечной последовательностью D (где порядок указанных палиндромных последовательностей определяет направление ориентации ITR). Рядовой специалист в данной области техники может легко определить последовательности ITR или модифицированного ITR из любого серотипа AAV для применения в зкДНК-векторе или зкДНК-плазмиде, на основании примеров последовательностей ITR AAV2, приведенных в данном документе. См., например, сравнение последовательностей ITR из различных серотипов AAV (AAV1-AAV6 и AAV птиц (AAAV) и AAV крупного рогатого скота (BAAV)), описанное в Grimm et al., J. Virology, 2006; 80(1); 426-439; где приведены % идентичности левого ITR AAV2 и левых ITR из других серотипов: AAV-1 (84%), AAV-3 (86%), AAV-4 (79%), AAV-5 (58%) AAV-6 (левый ITR) (100%) и AAV-6 (правый ITR) (82%). [00198] ITR sequences are uniformly arranged and contain a double-stranded Holliday structure, which is typically a T-shaped or Y-shaped hairpin structure (see, for example, Fig. 2A and Fig. 3A), with each ITR formed by two palindromic arms or loops (B-B' and C-C') embedded in a larger palindromic arm (A-A'), and a single-stranded sequence D (where the order of said palindromic sequences determines the direction of ITR orientation). One of ordinary skill in the art can readily determine ITR or modified ITR sequences from any AAV serotype for use in a ccDNA vector or ccDNA plasmid based on the example AAV2 ITR sequences provided herein. See, for example, comparison of ITR sequences from different AAV serotypes (AAV1-AAV6 and avian AAV (AAAV) and bovine AAV (BAAV)) described in Grimm et al., J. Virology, 2006; 80(1); 426-439; where the % identity of the left ITR of AAV2 and the left ITRs from other serotypes are given: AAV-1 (84%), AAV-3 (86%), AAV-4 (79%), AAV-5 (58%) AAV-6 (left ITR) (100%) and AAV-6 (right ITR) (82%).
[00199] Соответственно, в то время как ITR AAV2 используются в качестве иллюстративных ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием одного белка Rep, как раскрыто в данном документе, вектор зкДНК может быть получен с ITR любого известного серотипа AAV или на его основе, включая, например, AAV серотип 1 (AAV1), AAV серотип 2 (AAV2), AAV серотип 4 (AAV4), AAV серотип 5 (AAV5), AAV серотип 6 (AAV6), AAV серотип 7 (AAV7), AAV серотип 8 (AAV8), AAV серотип 9 (AAV9), AAV серотип 10 (AAV10), AAV серотип 11 (AAV11) или AAV серотип 12 (AAV12). Специалист в данной области техники сможет определить соответствующую последовательность в других серотипах известными способами. Например, путем определения того, находится ли изменение в участке A, A', B, B', C, C' или D, и определения соответствующего участка в другом серотипе. Можно использовать BLAST® (Basic Local Alignment Search Tool) или другие программы выравнивания для определения гомологии с настройками по умолчанию для определения соответствующей последовательности. Согласно данному изобретению также предложены популяции и совокупности зкДНК-векторов, содержащих ITR из комбинации разных серотипов AAV - то есть один ITR может быть взят из одного серотипа AAV, а другой ITR может быть взят из другого серотипа. Не связываясь какой-либо теорией, укажем, что в одном варианте реализации один ITR может быть взят из последовательности ITR AAV2 или быть на ней основан, а другой ITR зкДНК-вектора может быть взят из или быть основан на любой одной или нескольких последовательностях ITR AAV серотипа 1 (AAV1), AAV серотипа 4 (AAV4), AAV серотипа 5 (AAV5), AAV серотипа 6 (AAV6), AAV серотипа 7 (AAV7), AAV серотипа 8 (AAV8), AAV серотипа 9 (AAV9), AAV серотипа 10 (AAV10), AAV серотипа 11 (AAV11) или AAV серотипа 12 (AAV12). [00199] Accordingly, while AAV2 ITRs are used as exemplary ITRs in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein, a cccDNA vector can be prepared with the ITRs of any known AAV serotype or based thereon, including, for example, AAV serotype 1 (AAV1), AAV serotype 2 (AAV2), AAV serotype 4 (AAV4), AAV serotype 5 (AAV5), AAV serotype 6 (AAV6), AAV serotype 7 (AAV7) , AAV serotype 8 (AAV8), AAV serotype 9 (AAV9), AAV serotype 10 (AAV10), AAV serotype 11 (AAV11), or AAV serotype 12 (AAV12). One skilled in the art will be able to determine the corresponding sequence in other serotypes by known methods. For example, by determining whether the change is in region A, A', B, B', C, C', or D, and identifying the corresponding region in a different serotype. BLAST® (Basic Local Alignment Search Tool) or other homology alignment programs can be used with default settings to determine the corresponding sequence. The present invention also provides populations and sets of cccDNA vectors containing ITRs from a combination of different AAV serotypes - that is, one ITR can be taken from one AAV serotype and another ITR can be taken from a different serotype. Without being bound by any theory, in one embodiment, one ITR may be taken from or based on an AAV2 ITR sequence, and the other cDNA vector ITR may be taken from or be based on any one or more AAV ITR sequences serotype 1 (AAV1), AAV serotype 4 (AAV4), AAV serotype 5 (AAV5), AAV serotype 6 (AAV6), AAV serotype 7 (AAV7), AAV serotype 8 (AAV8), AAV serotype 9 (AAV9), AAV serotype 10 (AAV10), AAV serotype 11 (AAV11), or AAV serotype 12 (AAV12).
[00200] Любой парвовирусный ITR может использоваться как ITR или в качестве базового ITR для модификации. Предпочтительно, указанный парвовирус представляет собой депендовирус. Более предпочтительно указанный парвовирус представляет собой AAV. Выбор серотипа может быть основан на тканевом тропизме серотипа. AAV2 обладает тропизмом к широкому ряду тканей, AAV1 преимущественно нацелен на нервную ткань и скелетные мышцы, а AAV5 преимущественно нацелен на нервную ткань, пигментированный эпителий сетчатки и фоторецепторы. AAV6 преимущественно нацелен на скелетные мышцы и легкие. AAV8 преимущественно нацелен на печень, скелетные мышцы, сердце и ткани поджелудочной железы. AAV9 преимущественно направлен на печень, скелетные мышцы и ткани легких. В одном варианте реализации модифицированный ITR основан на ITR AAV2. Например, он выбран из группы, состоящей из: SEQ ID NO: 2 и SEQ ID NO: 52. В одном варианте каждого из этих аспектов векторный полинуклеотид содержит пару ITR, выбранных из группы, состоящей из: SEQ ID NO: 1 и SEQ ID NO: 52; и SEQ ID NO: 2 и SEQ ID NO: 51. В одном варианте каждого из этих аспектов векторный полинуклеотид или невирусные, бескапсидные ДНК-векторы с ковалентно замкнутыми концами содержат пару различных ITR, выбранных из группы, состоящей из: SEQ ID NO: 101 и SEQ ID NO. : 102; SEQ ID NO: 103 и SEQ ID NO: 104, SEQ ID NO: 105 и SEQ ID NO: 106; SEQ ID NO: 107 и SEQ ID NO: 108; SEQ ID NO: 109 и SEQ ID NO: 110; SEQ ID NO: 111 и SEQ ID NO: 112; SEQ ID NO: 113 и SEQ ID NO: 114; и SEQ ID NO: 115 и SEQ ID NO: 116. В некоторых вариантах реализации модифицированный ITR выбран из любой из ITR или частичных последовательностей ITR SEQ ID NO: 2, 52, 63, 64, 101-499 или 545-547.[00200] Any parvovirus ITR can be used as an ITR or as a base ITR for modification. Preferably, said parvovirus is a dependovirus. More preferably, said parvovirus is AAV. Serotype selection may be based on tissue tropism of the serotype. AAV2 has tropism for a wide range of tissues, AAV1 predominantly targets neural tissue and skeletal muscle, and AAV5 predominantly targets neural tissue, retinal pigmented epithelium and photoreceptors. AAV6 predominantly targets skeletal muscle and lungs. AAV8 predominantly targets the liver, skeletal muscle, heart, and pancreatic tissue. AAV9 is predominantly targeted to the liver, skeletal muscle, and lung tissue. In one embodiment, the modified ITR is based on the AAV2 ITR. For example, it is selected from the group consisting of: SEQ ID NO: 2 and SEQ ID NO: 52. In one embodiment of each of these aspects, the vector polynucleotide comprises a pair of ITRs selected from the group consisting of: SEQ ID NO: 1 and SEQ ID NO: 52; and SEQ ID NO: 2 and SEQ ID NO: 51. In one embodiment of each of these aspects, the vector polynucleotide or non-viral, non-capsid DNA vectors with covalently closed ends comprise a pair of different ITRs selected from the group consisting of: SEQ ID NO: 101 and SEQ ID NO. : 102; SEQ ID NO: 103 and SEQ ID NO: 104, SEQ ID NO: 105 and SEQ ID NO: 106; SEQ ID NO: 107 and SEQ ID NO: 108; SEQ ID NO: 109 and SEQ ID NO: 110; SEQ ID NO: 111 and SEQ ID NO: 112; SEQ ID NO: 113 and SEQ ID NO: 114; and SEQ ID NO: 115 and SEQ ID NO: 116. In some embodiments, the modified ITR is selected from any of the ITR or partial ITR sequences of SEQ ID NO: 2, 52, 63, 64, 101-499, or 545-547.
[00201] Согласно некоторым вариантам реализации зкДНК-вектор, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может содержать ITR с модификацией в ITR, соответствующей любой из модификаций в последовательностях ITR или частичных последовательностях ITR, представленных в любой одной или более из таблиц 2, 3, 4, 5, 6, 7, 8, 9, 10A и 10B данного документа, или последовательностей представленных на Фиг 26A или 26B.[00201] In some embodiments, a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may contain an ITR with a modification in the ITR corresponding to any of the modifications in the ITR sequences or partial ITR sequences, presented in any one or more of tables 2, 3, 4, 5, 6, 7, 8, 9, 10A and 10B of this document, or the sequences presented in Fig. 26A or 26B.
[00202] В некоторых вариантах реализации вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, может образовывать внутримолекулярную дуплексную вторичную структуру. В неограничивающем примере вторичная структура первого ITR и асимметричного второго ITR представлена в контексте ITR дикого типа (см., например, фиг. 2A, 3A, 3C) и/или модифицированных структур ITR (см., например, Фиг. 2B и Фиг. 3B, 3D). Вторичные структуры выводят или предсказывают на основании последовательностей ITR плазмиды, используемой для получения зкДНК-вектора. Примерные вторичные структуры модифицированных ITR, в которых удалена часть структуры стебель-петля, показаны на Фиг. 9A-25B и Фиг. 26A-26B, а также показаны в Таблицах 10A и 10B. Типичные вторичные структуры модифицированных ITR, содержащих единственный стебель и две петли, приведены на Фиг. 9A-13B. Примерная вторичная структура модифицированного ITR с одним стеблем и одной петлей показана на Фиг. 14. Согласно некоторым вариантам реализации указанная вторичная структура может быть выведена, как показано в данном документе, с использованием термодинамических методов, основанных на правилах ближайшего соседа, которые предсказывают стабильность структуры, количественно определяемую изменением свободной энергии укладки. Например, указанная структура может быть предсказана путем нахождения структуры с наименьшей свободной энергией. Согласно некоторым вариантам реализации для предсказания структуры ITR может быть использован алгоритм, описанный в источнике: Reuter, J. S., & Mathews, D. H. (2010) RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11, 129, и реализованный в программном обеспечении RNAstructure (доступно в сети Интернет по адресу: «rna.urmc.rochester.edu/RNAstructureWeb/index.html”). Указанный алгоритм может также включать как параметры изменения свободной энергии при 37°C, так и параметры изменения энтальпии, полученные из экспериментальной литературы, что позволяет прогнозировать стабильность конформации при произвольной температуре. С применением программного обеспечения для анализа структуры РНК могут быть предсказаны некоторые из модифицированных структур ITR в виде модифицированных T-образных структур типа «петля-на-стебле» с расчетной свободной энергией Гиббса(ΔG) для разворачивания в физиологических условиях, представленными на Фиг. 3A-3D. С применением программного обеспечения для анализа структуры РНК предсказаны три типа модифицированных ITR, имеющие более высокую свободную энергию Гиббса для разворачивания, чем ITR дикого типа AAV2 (-92, 9 ккал/моль); указанные ITR представлены следующими: (a) модифицированные ITR со структурой с единственным плечом/единственной неспаренной петлей согласно данному изобретению, согласно прогнозу имеющие свободную энергию Гиббса для разворачивания в диапазоне от -85 до -70 ккал/моль. (b) предсказано, что модифицированные ITR, имеющие структуру с единственной шпилькой, описанные в данном документе, будут иметь свободную энергию Гиббса для разворачивания в диапазоне от -70 до -40 ккал/моль. (c) предсказано, что модифицированные ITR, имеющие структуру с двумя плечами, описанные в данном документе, будут иметь свободную энергию Гиббса для разворачивания в диапазоне от -90 до -70 ккал/моль. Без связи с какой-либо теорией, структуры с более высокой свободной энергией Гиббса будут легче разворачиваться для репликации белками репликации Rep 68 или Rep 78. Таким образом, модифицированные ITR, имеющие более высокую свободную энергию Гиббса для разворачивания - например, структура с одним плечом/одной непарной петлей, структура с одной шпилькой, усеченная структура - демонстрируют тенденцию к более эффективной репликации, чем ITR дикого типа. [00202] In some embodiments, a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may form an intramolecular duplex secondary structure. In a non-limiting example, the secondary structure of the first ITR and the asymmetric second ITR is presented in the context of wild-type ITR (see, e.g., Figures 2A, 3A, 3C) and/or modified ITR structures (see, e.g., Figure 2B and Figure 3B , 3D). Secondary structures are inferred or predicted based on the ITR sequences of the plasmid used to generate the cccDNA vector. Exemplary secondary structures of modified ITRs in which part of the stem-loop structure has been removed are shown in FIG. 9A-25B and FIG. 26A-26B and are also shown in Tables 10A and 10B. Typical secondary structures of modified ITRs containing a single stem and two loops are shown in Fig. 9A-13B. An exemplary secondary structure of a modified one-stem, one-loop ITR is shown in FIG. 14. In some embodiments, said secondary structure can be inferred, as shown herein, using thermodynamic methods based on nearest neighbor rules, which predict structure stability as quantified by changes in folding free energy. For example, the specified structure can be predicted by finding the structure with the lowest free energy. In some embodiments, the algorithm described in Reuter, J. S., & Mathews, D. H. (2010) RNAstructure: software for RNA secondary structure prediction and analysis can be used to predict ITR structure. BMC Bioinformatics. 11, 129, and implemented in the RNAstructure software (available on the Internet at: “rna.urmc.rochester.edu/RNAstructureWeb/index.html”). This algorithm can also include both free energy change parameters at 37°C and enthalpy change parameters obtained from the experimental literature, which allows predicting conformational stability at an arbitrary temperature. Using RNA structure analysis software, some of the modified ITR structures can be predicted as modified T-shaped loop-on-stem structures with the estimated Gibbs free energy (ΔG) for unfolding under physiological conditions presented in FIG. 3A-3D. Using RNA structure analysis software, three types of modified ITRs are predicted to have a higher Gibbs free energy for unfolding than the wild-type AAV2 ITR (−92.9 kcal/mol); these ITRs are as follows: (a) modified ITRs with a single arm/single unpaired loop structure according to the present invention, predicted to have a Gibbs free energy for unfolding in the range of -85 to -70 kcal/mol. (b) the modified ITRs having a single hairpin structure described herein are predicted to have a Gibbs free energy for unfolding in the range of -70 to -40 kcal/mol. (c) The modified ITRs having the two-arm structure described herein are predicted to have a Gibbs free energy for unfolding in the range of -90 to -70 kcal/mol. Without wishing to be bound by any theory, structures with a higher Gibbs free energy will be more easily unfolded for replication by the Rep 68 or Rep 78 replication proteins. Thus, modified ITRs having a higher Gibbs free energy for unfolding - for example, a single-arm structure single unpaired loop, single hairpin structure, truncated structure - show a tendency to replicate more efficiently than the wild type ITR.
[00203] В одном варианте реализации левый ITR вектора зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, модифицирован или мутирован по отношению к структуре ITR AAV дикого типа (wt), а правый ITR является диким типа AAV ITR. Согласно одному варианту реализации правый ITR зкДНК-вектора модифицирован относительно структуры AAV ITR дикого типа, а левый ITR симметричен (обратно-комплементарен) ему и содержит такие же мутации. Согласно такому варианту реализации модификация ITR (например, левого или правого ITR) может быть получена путем делеции, вставки или замены одного или более нуклеотидов ITR дикого типа, происходящего из генома AAV. [00203] In one embodiment, the left ITR of a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein is modified or mutated from the wild type (wt) AAV ITR structure, and the right ITR is wild type AAV ITR. In one embodiment, the right ITR of the cccDNA vector is modified relative to the structure of the wild-type AAV ITR, and the left ITR is symmetrical (reverse complementary) to it and contains the same mutations. In such an embodiment, a modification of the ITR (eg, left or right ITR) can be achieved by deletion, insertion, or substitution of one or more nucleotides of a wild-type ITR derived from the AAV genome.
[00204] Используемые согласно данному изобретению ITR могут быть разрешаемыми и неразрешаемыми, и выбранные для применения в зкДНК-векторах ITR предпочтительно представляют собой последовательности AAV, причем предпочтительными являются последовательности из серотипов 1, 2, 3, 4, 5, 6, 7, 8 и 9. Разрешаемые AAV ITR не обязательно представлены последовательностью ITR дикого типа (например, эндогенная последовательность AAV ITR или последовательность AAV ITR дикого типа может быть изменена путем вставки, делеции, усечения и/или введения миссенс-мутаций), при условии, что указанный концевой повтор опосредует требуемые функции, например, репликацию, упаковку, интеграцию вируса и/или «спасение» провируса, и т.п. Как правило, но не обязательно, ITR взяты из одного серотипа AAV, например, обе последовательности ITR зкДНК-вектора взяты из AAV2. ITR могут быть синтетическими последовательностями, которые функционируют как инвертированные концевые повторы AAV, такими как «последовательность с двойной D», как описано в патенте США No. № 5478745, Samulski et al. Хотя это не обязательно, ITR могут быть от одного и того же парвовируса, например, обе последовательности ITR происходят от AAV2.[00204] The ITRs used in this invention can be resolvable or non-resolvable, and the ITRs selected for use in cDNA vectors are preferably AAV sequences, with sequences from serotypes 1, 2, 3, 4, 5, 6, 7, 8 being preferred and 9. The permitted AAV ITRs are not necessarily represented by the wild-type ITR sequence (e.g., the endogenous AAV ITR sequence or the wild-type AAV ITR sequence may be altered by insertion, deletion, truncation, and/or introduction of missense mutations), provided that the specified terminal the repeat mediates required functions, such as replication, packaging, virus integration and/or provirus rescue, etc. Typically, but not necessarily, the ITRs are from the same AAV serotype, for example, both ITR sequences of a cccDNA vector are from AAV2. ITRs can be synthetic sequences that function as AAV inverted terminal repeats, such as the “double D sequence” as described in US Pat. No. No. 5478745, Samulski et al. Although not required, ITRs can be from the same parvovirus, for example both ITR sequences are derived from AAV2.
[00205] Согласно одному варианту реализации зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может включать структуру ITR, которая мутирована относительно одного из ITR дикого типа как раскрыто в данном документе, однако при этом мутированный или модифицированный ITR сохраняет функциональный сайт связывания Rep (RBE или RBE') и сайт концевого разрешения (trs). Согласно одному варианту реализации указанный мутированный зкДНК ITR включает функциональный сайт белка репликации (RPS-1), и при продуцировании используют репликативно-компетентный белок, который связывает сайт RPS-1. [00205] In one embodiment, the cccDNA produced in accordance with the methods and compositions using a single Rep protein as disclosed herein may include an ITR structure that is mutated relative to one of the wild type ITRs as disclosed herein, however the mutated or modified ITR retains a functional Rep binding site (RBE or RBE') and a terminal resolution site (trs). In one embodiment, the mutated ITR cDNA includes a functional replication protein site (RPS-1) and is produced using a replication competent protein that binds the RPS-1 site.
[00206] В одном варианте реализации по меньшей мере одна из ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, представляет собой дефектную ITR в отношении связывания Rep и/или репликации. Согласно одному варианту реализации указанный дефект представлен по меньшей мере 30%, согласно другим вариантам реализации - по меньшей мере 35%..., 50%..., 65%..., 75%..., 85%..., 90%..., 95%..., 98%..., недостаточностью функции относительно ITR дикого типа или ее полным отсутствием, или недостаточностью функции, соответствующей какому-либо промежуточному значению. Клетки-хозяева не экспрессируют вирусные капсидные белки и полинуклеотидная векторная матрица не содержит каких-либо последовательностей, кодирующих вирусный капсид. Согласно одному варианту реализации указанные полинуклеотидные векторные матрицы и клетки-хозяева, которые не содержат генов капсида AAV и итогового белка, также не кодируют или экспрессируют генов капсидов других вирусов. Кроме того, согласно конкретному варианту реализации указанная молекула нуклеиновой кислоты также не содержит последовательностей, кодирующих белок Rep AAV.[00206] In one embodiment, at least one of the ITRs in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein is a defective ITR for Rep binding and/or replication. According to one implementation option, the specified defect is represented by at least 30%, according to other implementation options - at least 35%..., 50%..., 65%..., 75%..., 85%... , 90%..., 95%..., 98%..., lack of function relative to the wild-type ITR or its complete absence, or lack of function corresponding to any intermediate value. The host cells do not express viral capsid proteins and the polynucleotide vector template does not contain any viral capsid coding sequences. In one embodiment, said polynucleotide vector templates and host cells that do not contain AAV capsid genes and resulting protein also do not encode or express capsid genes of other viruses. In addition, in a particular embodiment, said nucleic acid molecule also does not contain sequences encoding the AAV Rep protein.
[00207] Согласно некоторым вариантам реализации структурный элемент ITR может быть представлен любым структурным элементом, который вовлечен в функциональное взаимодействие ITR с единственным большим белком Rep (например, Rep 78 или Rep 68). Согласно некоторым вариантам реализации указанный структурный элемент обеспечивает селективность взаимодействия ITR с единственным большим белком Rep, т.е., определяет по меньшей мере частично, какой белок Rep функционально взаимодействует с указанным ITR. Согласно другим вариантам реализации указанный структурный элемент физически взаимодействует с единственным большим белком Rep при связывании указанного белка Rep с ITR. Каждый структурный элемент может представлять собой, например, вторичную структуру ITR, нуклеотидную последовательность ITR, промежуточную последовательность между двумя или более элементами; или комбинацию любых вышеперечисленных элементов. Согласно одному варианту реализации указанные структурные элементы выбраны из группы, состоящей из плеча A и плеча A', плеча B и плеча B', плеча C и плеча C', плеча D, связывающего Rep сайта (RBE) и RBE' (т.е. последовательности, комплементарной RBE), и сайта концевого разрешения (trs).[00207] In some embodiments, the ITR structural element can be any structural element that is involved in the functional interaction of the ITR with a single large Rep protein (eg, Rep 78 or Rep 68). In some embodiments, the structural element provides selectivity for the interaction of the ITR with a single large Rep protein, i.e., determines at least in part which Rep protein functionally interacts with the ITR. In other embodiments, said structural element physically interacts with a single large Rep protein upon binding of said Rep protein to the ITR. Each structural element may be, for example, an ITR secondary structure, an ITR nucleotide sequence, an intermediate sequence between two or more elements; or a combination of any of the above. In one embodiment, said structural elements are selected from the group consisting of arm A and arm A', arm B and arm B', arm C and arm C', arm D, Rep binding site (RBE) and RBE' (i.e. sequence complementary to the RBE) and a terminal resolution site (trs).
[00208] Более конкретно, способность структурного элемента ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, функционально взаимодействовать с конкретным единственным белком Rep, например, большим белком Rep или малым белком Rep, можно изменить, изменив структурный элемент. Например, нуклеотидная последовательность структурного элемента может быть модифицирована по сравнению с последовательностью ITR дикого типа. Согласно одному варианту реализации структурный элемент (например, плечо A, плечо A', плечо B, плечо B', плечо C, плечо C', плечо D, RBE, RBE' и trs) ITR может быть удален и заменен структурным элементом дикого типа из другого парвовируса. Например, заменяющая структура может быть взята из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, парвовируса змей (например, парвовируса королевского питона), парвовируса крупного рогатого скота, парвовируса коз, парвовируса птиц, парвовируса собачьих, парвовируса лошадиных, парвовируса креветок, свиного парвовируса или AAV насекомых. Например, ITR может представлять собой ITR AAV2, и плечо A или A', или RBE могут быть заменены структурным элементом из AAV5. В другом примере, ITR может представлять собой ITR AAV5, а плечи C или C', RBE и trs могут быть заменены структурным элементом из AAV2. В другом примере ITR AAV может представлять собой ITR AAV5, в котором плечи B и B' заменены плечами B и B' ITR AAV2.[00208] More specifically, the ability of an ITR structural element in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein to operably interact with a particular single Rep protein, e.g., a large Rep protein or a small Rep protein , can be changed by changing the structural element. For example, the nucleotide sequence of the structural element may be modified compared to the wild-type ITR sequence. In one embodiment, the structural element (e.g., arm A, arm A', arm B, arm B', arm C, arm C', arm D, RBE, RBE', and trs) of the ITR may be removed and replaced with a wild-type structural element from another parvovirus. For example, the replacement structure may be taken from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, snake parvovirus (eg, royal python parvovirus), bovine parvovirus, parvovirus goat, avian parvovirus, canine parvovirus, equine parvovirus, shrimp parvovirus, porcine parvovirus or insect AAV. For example, the ITR may be an AAV2 ITR, and the A or A' arm or RBE may be replaced by a structural element from AAV5. In another example, the ITR may be the AAV5 ITR, and the C or C' arms, RBE and trs may be replaced by a structural element from AAV2. In another example, the AAV ITR may be an AAV5 ITR in which arms B and B' are replaced by arms B and B' of the AAV2 ITR.
[00209] Исключительно для примера в Таблице 1 приведены иллюстративные модификации по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в участках модифицированных ITR, где X указывает на модификацию по меньшей мере одной нуклеиновой кислоты (например, делецию, вставку и/или замену) в указанном участке относительно соответствующего ITR дикого типа. Согласно некоторым вариантам реализации при любой модификации по меньшей мере одного нуклеотида (например, делеции, вставки и/или замены) в любом из участков C и/или C', и/или B, и/или B' сохраняется три последовательных нуклеотида T (т.е. ТТТ) по меньшей мере в одной концевой петле. Например, если указанная модификация приводит к чему-либо из: ITR с единственным плечом (например, с единственным плечом C-C' или единственным плечом B-B'), или с модифицированным плечом C-B' или плечом C'-B, или ITR с двумя плечами, содержащему по меньшей мере одно усеченное плечо (например, усеченное плечо C-C' и/или усеченное плечо B-B'), то по меньшей мере в указанном единственном плече, или по меньшей мере в одном из плеч ITR с двумя плечами (у которого одно плечо может быть усеченным) сохраняются три последовательных нуклеотида T (т.е. TTT) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации усеченное плечо C-C' и/или усеченное плечо B-B' содержит три последовательных нуклеотида T (т.е. TTT) в концевой петле.[00209] By way of example only, Table 1 shows exemplary modifications of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in modified ITR regions, wherein X indicates modification of at least one nucleic acid (e.g., deletion, insertion and/or substitution) in the indicated region relative to the corresponding wild-type ITR. In some embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in any of regions C and/or C' and/or B and/or B' retains three consecutive nucleotides T ( i.e. TTT) in at least one terminal loop. For example, if the specified modification results in any of: an ITR with a single arm (for example, a single C-C' arm or a single B-B' arm), or a modified C-B' arm or a C'-B arm, or an ITR with two arms comprising at least one truncated arm (e.g., a truncated arm C-C' and/or a truncated arm B-B'), then in at least said single arm, or in at least one of the ITR arms with two arms (at of which one arm may be truncated) three consecutive T nucleotides (i.e. TTT) are retained in at least one terminal loop. In some embodiments, the C-C' truncated arm and/or the B-B' truncated arm contains three consecutive T nucleotides (ie, TTT) in the terminal loop.
Таблица 1: Примеры комбинаций модификаций по меньшей мере одного нуклеотида (например, делеции, вставки и/или замены) в разных участках или плечах B-B' и C-C' ITR (X указывает на модификацию нуклеотида, например, добавление, делецию или замену по меньшей мере одного нуклеотида в указанном участке).Table 1: Examples of combinations of modifications to at least one nucleotide (e.g., deletion, insertion, and/or substitution) in different regions or arms B-B' and C-C' of the ITR (X indicates a nucleotide modification, e.g., addition, deletion, or substitution of at least one nucleotide in the indicated region).
[00210] Согласно некоторым вариантам реализации модифицированный ITR для применения в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может содержать любую из комбинаций модификаций, представленных в Таблице 1, и также модификацию по меньшей мере одного нуклеотида в любом одном или более участках, выбранных из: участка между A' и C, между C и C', между C' и B, между B и B' и между B' и A. Согласно некоторым вариантам реализации при любой модификации по меньшей мере одного нуклеотида (например, делеции, вставки и/или замене) в участке C, или C', или B, или B', все же сохраняется концевая петля структуры «петля-на-стебле». Согласно некоторым вариантам реализации при любой модификации по меньшей мере одного нуклеотида (например, делеции, вставки и/или замене) между C и C' и/или B и B' сохраняются три последовательных нуклеотида T (т.е., TTT) по меньшей мере в одной концевой петле. В альтернативных вариантах реализации любая модификация по меньшей мере одного нуклеотида (например, делеции, вставки и/или замене) между C и C' и/или B и B' сохраняет три последовательных нуклеотида «A» (т.е. AAA) по меньшей мере в одной концевой петле. В некоторых вариантах реализации модифицированный ITR для применения в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может содержать любую одну из комбинаций модификаций, представленных в Таблице 1, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в любом из одного или нескольких участков, выбранных из: A', A и/или D. Например, в некоторых вариантах реализации модифицированный ITR для использования по данному изобретению может содержать любую из комбинаций модификаций, представленных в Таблице 1, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в участке А. Согласно некоторым вариантам реализации модифицированный ITR для применения в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может содержать любую из комбинаций модификаций, представленных в Таблице 1, а также модификацию по меньшей мере одного нуклеотида (например, делецию, инсерцию и/или замену) в участке A'. Согласно некоторым вариантам реализации модифицированный ITR для применения в данном документе может содержать любую из комбинаций модификаций, представленных в Таблице 1, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в участке A и/или A'. Согласно некоторым вариантам реализации модифицированный ITR для применения в данном документе может содержать любую из комбинаций модификаций, представленных в Таблице 1, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в участке D.[00210] In some embodiments, a modified ITR for use in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may contain any of the combinations of modifications presented in Table 1, and also modification by at least one nucleotide in any one or more regions selected from: the region between A' and C, between C and C', between C' and B, between B and B', and between B' and A. In some embodiments, when any modification of at least one nucleotide (eg, deletion, insertion and/or substitution) in region C or C' or B or B' still retains the terminal loop of the stem-loop structure. In some embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) between C and C' and/or B and B' preserves three consecutive T nucleotides (i.e., TTT) of at least at least in one terminal loop. In alternative embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) between C and C' and/or B and B' preserves three consecutive "A" (i.e., AAA) nucleotides at least in one terminal loop. In some embodiments, a modified ITR for use in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may contain any one of the combinations of modifications presented in Table 1, as well as a modification of at least single nucleotide (e.g., deletion, insertion, and/or substitution) at any of one or more regions selected from: A', A, and/or D. For example, in some embodiments, a modified ITR for use herein may comprise any of combinations of modifications presented in Table 1, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in region A. In some embodiments, a modified ITR for use in a cccDNA vector prepared in accordance with the methods and compositions using a single Rep protein as disclosed herein, may contain any of the combinations of modifications presented in Table 1, as well as a modification of at least one nucleotide (eg, deletion, insertion and/or substitution) in the A' region. In some embodiments, a modified ITR for use herein may comprise any of the combinations of modifications presented in Table 1, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in the A and/or A' region . In some embodiments, a modified ITR for use herein may comprise any of the combinations of modifications presented in Table 1, as well as a modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in region D.
[00211] Согласно одному варианту реализации нуклеотидная последовательность структурного элемента может быть модифицирована (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, или 20, или более нуклеотидов, или любого числа нуклеотидов в промежуточном диапазоне) с получением модифицированного структурного элемента. В одном варианте реализации конкретные модификации ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, проиллюстрированы здесь примерами (например, SEQ ID NO: 2, 52, 63, 64, 101-499, или 545-547). Согласно некоторым вариантам реализации ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может быть модифицирован (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, или 20, или более нуклеотидов, или любого числа нуклеотидов в промежуточном диапазоне). В других вариантах реализации ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может иметь по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более, идентичности последовательности с одной из модифицированных ITR SEQ ID NOS: 469-499 или 545-547, или RBE-содержащего отдела плеча A-A' и плеч C-C' и B-B' SEQ ID NO: 101-134 или 545-547.[00211] In one embodiment, the nucleotide sequence of the building block may be modified (e.g., by modifying 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19, or 20 or more nucleotides, or any number of nucleotides in between) to produce a modified structural element. In one embodiment, specific ITR modifications in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein are exemplified herein (e.g., SEQ ID NO: 2, 52, 63, 64, 101- 499, or 545-547). In some embodiments, the ITR in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein may be modified (e.g., by modifying 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 or more nucleotides, or any number of nucleotides in between). In other embodiments, the ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may be at least 80%, at least 85%, at least 90%, at least at least 95%, at least 96%, at least 97%, at least 98%, at least 99% or more sequence identity with one of the modified ITR SEQ ID NOS: 469-499 or 545-547, or RBE-containing section of arm A-A' and arms C-C' and B-B' SEQ ID NO: 101-134 or 545-547.
[00212] Согласно некоторым вариантам реализации модифицированный ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может, например, включать удаление или делецию конкретного плеча полностью, например, полное или частичное удаление или делецию плеча A-A', или полное или частичное удаление или делеция плеча B-B', или полное или частичное удаление или делеция плеча C-C', или, как вариант, удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований, образующих стебель петли, при условии сохранения итоговой петли, которой завершается стебель (например, единственного плеча) (например, см. ITR-6). Согласно некоторым вариантам реализации модифицированный ITR может включать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча B-B'. Согласно некоторым вариантам реализации модифицированный ITR может включать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча C-C'. Согласно некоторым вариантам реализации модифицированный ITR может включать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча C-C' и удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча B-B'. Предусмотрена любая комбинация удаления пар оснований, например, 6 пар оснований могут быть удалены в плече C-C 'и 2 пары оснований в плече B-B'. В качестве иллюстративного примера, Фиг. 13A-13B демонстрируют пример модифицированного ITR с делецией по меньшей мере 7 пар оснований из каждой из части C и части C', заменой нуклеотида в петле между участком C и C', и делецией по меньшей мере одной пары оснований из каждого из участка B и участка B', так что модифицированный ITR содержит два плеча, по меньшей мере одно из которых (например, C-C') является усеченным. Обратим внимание, что в указанном примере, поскольку модифицированный ITR содержит по меньшей мере одну делецию пар оснований в каждом из участков B и B', плечо B-B' также усечено по сравнению с WT ITR.[00212] In some embodiments, a modified ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may, for example, include deleting or deleting a particular arm entirely, such as complete or partial deletion or deletion of arm A-A', or complete or partial deletion or deletion of arm B-B', or complete or partial deletion or deletion of arm C-C', or alternatively deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs forming a stem loop, as long as the resulting loop that terminates the stem (e.g., a single arm) is retained (e.g., see ITR-6). In some embodiments, the modified ITR may include removing 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the B-B' arm. In some embodiments, the modified ITR may include removing 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the C-C' arm. In some embodiments, the modified ITR may include deleting 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the C-C' arm and deleting 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs from arm B-B'. Any combination of base pair deletions is possible, for example, 6 base pairs may be deleted in the C-C' arm and 2 base pairs in the B-B' arm. As an illustrative example, FIG. 13A-13B show an example of a modified ITR with a deletion of at least 7 base pairs from each of part C and part C', a nucleotide substitution in the loop between region C and C', and a deletion of at least one base pair from each of region B and section B', such that the modified ITR contains two arms, at least one of which (eg, C-C') is truncated. Note that in this example, since the modified ITR contains at least one base pair deletion in each of the B and B' regions, the B-B' arm is also truncated compared to the WT ITR.
[00213] Согласно некоторым вариантам реализации 1, 2, 3, 4, 5, 6, 7, 8, 9 или более комплементарных пар оснований удаляют как из C-части, так и из C'-части плеча C-C', таким образом, что плечо C-C' становится усеченным. Иначе говоря, при удалении основания из C-части плеча C-C', удаляют комплементарную пару оснований из C'-части, с усечением таким образом плеча C-C'. Согласно таким вариантам реализации удаляют 2, 4, 6, 8 или более пар оснований из плеча C-C', таким образом, что плечо C-C' становится усеченным. Согласно альтернативным вариантам реализации удаляют 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из C-части плеча C-C' таким образом, чтобы сохранилась только C'-часть плеча. Согласно альтернативным вариантам реализации удаляют 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из C'-части плеча C-C' таким образом, чтобы сохранилась только C-часть плеча. [00213] In some embodiments, 1, 2, 3, 4, 5, 6, 7, 8, 9, or more complementary base pairs are removed from both the C portion and the C' portion of the C-C' arm, such such that the C-C' arm becomes truncated. In other words, when a base is removed from the C portion of the C-C' arm, the complementary base pair is removed from the C' portion, thereby truncating the C-C' arm. In such embodiments, 2, 4, 6, 8, or more base pairs are removed from the C-C' arm such that the C-C' arm is truncated. In alternative embodiments, 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs are removed from the C portion of the C-C' arm such that only the C' portion of the arm is retained. Alternative embodiments remove 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs from the C' portion of the C-C' arm such that only the C portion of the arm is retained.
[00214] Согласно некоторым вариантам реализации удаляют 1, 2, 3, 4, 5, 6, 7, 8, 9 или более комплементарных пар оснований как из B-части, так и из B'-части плеча B-B' таким образом, чтобы плечо B-B' становится усеченным. Иначе говоря, при удалении основания из B-части плеча B-B' удаляют комплементарную пару оснований из B'-части, с усечением таким образом плеча B-B'. Согласно таким вариантам реализации удаляют 2, 4, 6, 8 или более пар оснований из плеча B-B' таким образом, что плечо B-B' становится усеченным. Согласно альтернативным вариантам реализации удаляют 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из B-части плеча B-B' таким образом, чтобы сохранилась только B'-часть плеча. Согласно альтернативным вариантам реализации удаляют 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из B'-части плеча B-B' таким образом, чтобы сохранилась только B-часть плеча. [00214] In some embodiments, 1, 2, 3, 4, 5, 6, 7, 8, 9, or more complementary base pairs are removed from both the B portion and the B' portion of the B-B' arm such that arm B-B' becomes truncated. In other words, when a base is removed from the B portion of the B-B' arm, the complementary base pair is removed from the B' portion, thereby truncating the B-B' arm. Such embodiments remove 2, 4, 6, 8, or more base pairs from the B-B' arm such that the B-B' arm is truncated. Alternative embodiments remove 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs from the B portion of the B-B' arm such that only the B portion of the arm is retained. Alternative embodiments remove 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs from the B' portion of the B-B' arm such that only the B portion of the arm is retained.
[00215] Согласно некоторым вариантам реализации модифицированный ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может содержать от 1 до 50 (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50) делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа. Согласно некоторым вариантам реализации модифицированный ITR может содержать от 1 до 30 делеций нуклеотидов относительно полноразмерной последовательности WT ITR. Согласно некоторым вариантам реализации модифицированный ITR содержит от 2 до 20 делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа. [00215] In some embodiments, a modified ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may contain from 1 to 50 (e.g., 1, 2, 3, 4, 5 , 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 , 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, or 50) nucleotide deletions relative to the full-length wild-type ITR sequence. In some embodiments, the modified ITR may contain from 1 to 30 nucleotide deletions relative to the full-length WT ITR sequence. In some embodiments, the modified ITR contains 2 to 20 nucleotide deletions relative to the full-length wild-type ITR sequence.
[00216] Согласно некоторым вариантам реализации модифицированный ITR образует две противопоставленных продольно-симметричных «петли-на-стебле», например, петля C-C' имеет длину, отличную от длины петли B-B'. Согласно некоторым вариантам реализации одна из противопоставленных продольно-симметричных петель-на-стебле модифицированного ITR содержит часть стебля C-C' и/или B-B' с длиной в диапазоне от 8 до 10 пар оснований, и петлевую часть (например, между C-C' или между B-B'), которая содержит от 2 до 5 неспаренных дезоксирибонуклеотидов. Согласно некоторым вариантам реализации одна из продольно-симметричных петель-на-стебле модифицированного ITR содержит часть стебля C-C' и/или B-B' длиной менее 8 или менее 7, 6, 5, 4, 3, 2, 1 пар оснований и петлевую часть (например, между C-C' или между B-B'), которая содержит 0-5 нуклеотидов. Согласно некоторым вариантам реализации модифицированный ITR с продольно-асимметричной петлей-на-стебле содержит часть стебля C-C' и/или B-B' длиной менее чем 3 пары оснований. [00216] In some embodiments, the modified ITR forms two opposing, longitudinally symmetrical "loops-on-stem", eg, the C-C' loop has a different length than the B-B' loop. In some embodiments, one of the opposed longitudinally symmetrical stem-loops of the modified ITR comprises a C-C' and/or B-B' stem portion with a length ranging from 8 to 10 base pairs, and a loop portion (e.g., between C-C' or between B -B'), which contains from 2 to 5 unpaired deoxyribonucleotides. In some embodiments, one of the longitudinally symmetrical stem-loops of the modified ITR comprises a C-C' and/or B-B' stem portion less than 8 or less than 7, 6, 5, 4, 3, 2, 1 base pairs in length and a loop portion ( for example, between C-C' or between B-B'), which contains 0-5 nucleotides. In some embodiments, the modified longitudinally asymmetric stem-loop ITR comprises a C-C' and/or B-B' stem portion less than 3 base pairs in length.
[00217] В некоторых вариантах реализации модифицированный ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, не содержит каких-либо нуклеотидных делеций в RBE-содержащей части участков A или A', чтобы не мешать репликации ДНК (например, связыванию с RBE белка Rep или никированию в сайте концевого разрешения). Согласно некоторым вариантам реализации модифицированный ITRв зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, содержит одну или более делеций в участке B, B', C и/или C согласно описанию в данном документе. Несколько неограничивающих примеров модифицированных ITR показаны на Фиг. 9A-26B. [00217] In some embodiments, the modified ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein does not contain any nucleotide deletions in the RBE-containing portion of the A or A' regions, so as not to interfere with DNA replication (for example, binding to the RBE of the Rep protein or nicking at the end resolution site). In some embodiments, a modified ITR in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein contains one or more deletions in the B, B', C, and/or C region as described herein . Several non-limiting examples of modified ITRs are shown in FIG. 9A-26B.
[00218] В некоторых вариантах реализации модифицированный ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может включать делецию плеча B-B', так что плечо C-C' остается, например, см. типичные ITR -2 (левый) и ITR-2 (правый), показанные на Фиг. 9A-9B, и ITR-4 (левый) и ITR-4 (правый) (Фиг. 11A-11B). Согласно некоторым вариантам реализации модифицированный ITR может включать делецию плеча C-C', таким образом, сохраняется плечо B-B', например, см. типичные ITR-3 (левый) and ITR-3 (правый) приведенные на Фиг. 10A-10B. Согласно некоторым вариантам реализации модифицированный ITR может включать делецию плеча B-B' и плеча C-C', таким образом, чтобы сохранялась единственная петля-на-стебле, например, см. типичные ITR-6 (левый) и ITR-6 (правый), показанные на Фиг. 14A-14B, и ITR-21 (левый) и ITR-37 (правый). В некоторых вариантах реализации модифицированный ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может включать делецию участка C', так что остается усеченная C-петля и плечо B-B', например см. типичные ITR-1 (левый) и ITR-1 (правый), показанные на Фиг. 15A-15B. Аналогичным образом, в некоторых вариантах реализации модифицированный ITR может содержать делецию участка C, так что остается усеченная C'-петля и плечо B-B', например, см. типичные ITR-5 (левый) и ITR-5 (правый), показанные на Фиг. 16A-16B.[00218] In some embodiments, the modified ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may include deletion of the B-B' arm such that the C-C' arm remains, e.g. see typical ITR-2 (left) and ITR-2 (right) shown in FIG. 9A-9B, and ITR-4 (left) and ITR-4 (right) (FIGS. 11A-11B). In some embodiments, the modified ITR may include a deletion of the C-C' arm, thereby retaining the B-B' arm, for example, see the typical ITR-3 (left) and ITR-3 (right) shown in FIG. 10A-10B. In some embodiments, the modified ITR may include a deletion of the B-B' arm and the C-C' arm such that a single stem-loop is retained, e.g., see typical ITR-6 (left) and ITR-6 (right), shown in Fig. 14A-14B, and ITR-21 (left) and ITR-37 (right). In some embodiments, the modified ITR in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein may include deletion of the C' region so that a truncated C-loop and B-B' arm are left. for example, see the typical ITR-1 (left) and ITR-1 (right) shown in FIG. 15A-15B. Likewise, in some embodiments, the modified ITR may contain a deletion of the C region such that a truncated C' loop and B-B' arm remains, for example, see the typical ITR-5 (left) and ITR-5 (right) shown in Fig. 16A-16B.
[00219] Согласно некоторым вариантам реализации модифицированный ITR в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может включать делецию пар оснований в любой одной или более из: C-части, C'-части, B-части или B'-части, таким образом, чтобы между частями C-B' и частями C'-B происходило спаривание комплементарных оснований с получением единственного плеча, например, см. ITR-10 (правый) и ITR-10 (левый) (Фиг. 12А-12В). [00219] In some embodiments, a modified ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may include a base pair deletion in any one or more of: the C portion, the C' portion -part, B-part or B'-part, so that between the C-B' parts and the C'-B parts, complementary base pairing occurs to produce a single arm, for example, see ITR-10 (right) and ITR-10 ( left) (Fig. 12A-12B).
[00220] Согласно некоторым вариантам реализации наряду с модификацией в одном или более нуклеотидов в участке C, C', B и/или B', модифицированный ITR для применения в зкДНК векторе, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может содержать модификацию (например, делецию, замену или добавление) по меньшей мере 1, 2, 3, 4, 5, 6 нуклеотидов в любом одном или более участков, выбранных из: участок между A' и C, между C и C', между C' и B, между B и B' и между B' и A. Например, нуклеотид A между B' и C в модифицированном правом ITR может быть заменен на G, C или A или удален, или может быть добавлен один или более нуклеотидов; нуклеотид T между C' и B в модифицированном левом ITR может быть заменен на G, C или A, или удален, или может быть добавлен один или более нуклеотидов. [00220] In some embodiments, along with modification at one or more nucleotides in the C, C', B, and/or B' region, the modified ITR for use in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein, as disclosed herein, may comprise a modification (e.g., deletion, substitution, or addition) of at least 1, 2, 3, 4, 5, 6 nucleotides in any one or more regions selected from: the region between A' and C, between C and C', between C' and B, between B and B', and between B' and A. For example, nucleotide A between B' and C in a modified right-handed ITR may be replaced by G, C, or A, or deleted, or one or more nucleotides may be added; the T nucleotide between C' and B in the modified left ITR may be replaced by G, C or A, or deleted, or one or more nucleotides may be added.
[00221] В некоторых вариантах реализации вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, не имеет модифицированного ITR, состоящего из нуклеотидной последовательности, выбранной из любой из: SEQ ID NO: 550-557. В некоторых вариантах реализации вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, не имеет модифицированного ITR, содержащего нуклеотидную последовательность, выбранную из любой из: SEQ ID NO: 550-557. [00221] In some embodiments, a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein does not have a modified ITR consisting of a nucleotide sequence selected from any of: SEQ ID NO: 550- 557. In some embodiments, the cccDNA vector produced in accordance with the methods and compositions using a single Rep protein as disclosed herein does not have a modified ITR comprising a nucleotide sequence selected from any of: SEQ ID NO: 550-557.
[00222] В некоторых вариантах реализации зкДНК-вектор содержит регуляторный переключатель, как описано в данном документе, и выбранный модифицированный ITR имеющий нуклеотидную последовательность, выбранную из любых из группы, состоящей из: SEQ ID NO: 550-557.[00222] In some embodiments, the cccDNA vector comprises a regulatory switch, as described herein, and a selected modified ITR having a nucleotide sequence selected from any of the group consisting of: SEQ ID NO: 550-557.
[00223] В другом варианте реализации структура структурного элемента ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может быть изменена. Например, в указанном структурном элементе изменена высота стебля и/или число нуклеотидов в петле. Например, высота стебля может составлять примерно 2, 3, 4, 5, 6, 7, 8 или 9 нуклеотидов или более или соответствовать любому диапазону значений. В одном варианте реализации стебель может иметь высоту от примерно 5 нуклеотидов до примерно 9 нуклеотидов и функционально взаимодействовать с Rep. В другом варианте реализации стебель может иметь высоту около 7 нуклеотидов и функционально взаимодействовать с Rep. В другом примере петля может иметь 3, 4, 5, 6, 7, 8, 9 или 10 нуклеотидов или более, или любой диапазон указанных значений. [00223] In another embodiment, the structure of the ITR structural element in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may be altered. For example, in the specified structural element the height of the stem and/or the number of nucleotides in the loop are changed. For example, the stem height may be about 2, 3, 4, 5, 6, 7, 8 or 9 nucleotides or more, or any range of values. In one embodiment, the stem may be from about 5 nucleotides to about 9 nucleotides in height and operably interact with Rep. In another embodiment, the stem may be about 7 nucleotides in height and operably interact with Rep. In another example, the loop may be 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides or more, or any range thereof.
[00224] В другом варианте реализации, число сайтов связывания GAGY или связанных с GAGY сайтов связывания в пределах RBE или расширенного RBE может быть увеличено или уменьшено. Согласно одному примеру RBE или расширенный RBE может содержать 1, 2, 3, 4, 5 или 6 или более сайтов связывания GAGY, или любое их количество в диапазоне указанных значений. Каждый сайт связывания GAGY может независимым образом представлять собой точную последовательность GAGY или последовательность, аналогичную GAGY, при условии, что эта последовательность является достаточной для связывания белка Rep. [00224] In another embodiment, the number of GAGY binding sites or GAGY-related binding sites within an RBE or extended RBE may be increased or decreased. According to one example, an RBE or extended RBE may contain 1, 2, 3, 4, 5 or 6 or more GAGY binding sites, or any number within the range of these values. Each GAGY binding site may independently be the exact GAGY sequence or a sequence similar to GAGY, provided that the sequence is sufficient for binding of the Rep protein.
[00225] Согласно другому варианту реализации промежуточная последовательность между двумя элементами (такими как, без ограничений, RBE и шпилька) может быть изменена (например, увеличена или уменьшена), для изменения функционального взаимодействия с единственным большим белком Rep. Например, указанный промежуток может составлять приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или 21 нуклеотидов или более, или любой диапазон указанных значений. [00225] In another embodiment, the intervening sequence between two elements (such as, but not limited to, an RBE and a hairpin) may be changed (eg, increased or decreased) to change the functional interaction with a single large Rep protein. For example, the spacing may be approximately 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, or 21 nucleotides, or more, or any range of specified values.
[00226] ЗкДНК-вектор, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может включать структуру ITR, которая модифицирована относительно структуры ITR AAV2 дикого типа, раскрытой в данном документе, но все еще сохраняет функциональную часть RBE, trs и RBE'. На Фиг. 2А и Фиг. 2B продемонстрирован один из возможных механизмов работы сайта trs в части структуры ITR дикого типа зкДНК-вектора. В некоторых вариантах реализации зкДНК-вектор содержит одну или несколько функциональных полинуклеотидных последовательностей ITR, которые содержат Rep-связывающий сайт (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531) для AAV2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 46)). В некоторых вариантах реализации по меньшей мере один ITR (дикого типа или модифицированный ITR) является функциональным. В альтернативных вариантах реализации, в тех случаях, когда зкДНК-вектор содержит два модифицированных ITR, которые отличаются друг от друга или асимметричны друг относительно друга, по меньшей мере один модифицированный ITR является функциональным и по меньшей мере один модифицированный ITR является нефункциональным. [00226] A cctDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may include an ITR structure that is modified from the wild type AAV2 ITR structure disclosed herein but still retains functionality part of RBE, trs and RBE'. In FIG. 2A and Fig. Figure 2B demonstrates one of the possible mechanisms of operation of the trs site in part of the ITR structure of the wild type ccDNA vector. In some embodiments, the cccDNA vector contains one or more functional ITR polynucleotide sequences that contain a Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 531) for AAV2) and a terminal resolution site (TRS; 5 '-AGTT (SEQ ID NO: 46)). In some embodiments, at least one ITR (wild type or modified ITR) is functional. In alternative embodiments, when the cccDNA vector contains two modified ITRs that are different from or asymmetrical with respect to each other, at least one modified ITR is functional and at least one modified ITR is non-functional.
[00227] В некоторых вариантах реализации вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, не имеет модифицированного ITR, выбранного из какой-либо последовательности, состоящей из или состоящей по существу из: SEQ ID NO: 500-529, как предусмотрено в данном документе. Согласно некоторым вариантам реализации зкДНК-вектор не содержит ITR, который выбран из любой последовательности, выбранной из SEQ ID NO: 500-529. [00227] In some embodiments, a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein does not have a modified ITR selected from any sequence consisting of or consisting essentially of: SEQ ID NO: 500-529, as provided herein. In some embodiments, the cccDNA vector does not contain an ITR that is selected from any sequence selected from SEQ ID NO: 500-529.
[00228] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, имеет модификации внутри петлевого плеча, усеченного плеча или спейсера. Типичные последовательности ITR, имеющие модификации в петлевом плече, усеченном плече или спейсере, перечислены в Таблице 2.[00228] In some embodiments, the modified ITR (e.g., left or right) of a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein has modifications within a loop arm, truncated arm, or spacer. Typical ITR sequences having modifications in the loop arm, truncated arm, or spacer are listed in Table 2.
[00229] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, имеет модификации в пределах петлевого плеча и усеченного плеча. Типичные последовательности ITR, имеющие модификации в петлевом плече и усеченном плече, перечислены в Таблице 3.[00229] In some embodiments, the modified ITR (e.g., left or right) of a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein has modifications within the loop arm and the truncated arm. Representative ITR sequences having modifications in the loop arm and truncated arm are listed in Table 3.
[00230] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, имеет модификации внутри петлевого плеча и спейсера. Типичные последовательности ITR, имеющие модификации в петлевом плече и спейсере, перечислены в Таблице 4.[00230] In some embodiments, the modified ITR (e.g., left or right) of a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein has modifications within the loop arm and spacer. Typical ITR sequences having modifications in the loop arm and spacer are listed in Table 4.
[00231] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, имеет модификации внутри усеченного плеча и спейсера. Типичные последовательности ITR, имеющие модификации в усеченном плече и спейсере, перечислены в Таблице 5.[00231] In some embodiments, a modified ITR (e.g., left or right) of a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein has modifications within the truncated arm and spacer. Typical ITR sequences having modifications in the truncated arm and spacer are listed in Table 5.
[00232] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, имеет модификации в петлевом плече, усеченном плече и спейсере. Типичные последовательности ITR, имеющие модификации в петлевом плече, усеченном плече и спейсере, перечислены в Таблице 6.[00232] In some embodiments, the modified ITR (e.g., left or right) of a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein has modifications in the loop arm, truncated arm, and spacer. Typical ITR sequences having modifications in the loop arm, truncated arm, and spacer are listed in Table 6.
[00233] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, модифицирован таким образом, чтобы он имел самую низкую энергию разворачивания («низкоэнергетическая структура»). Низкая энергия будет иметь меньшую свободную энергию Гиббса по сравнению с ITR дикого типа. Типичные последовательности ITR, которые модифицированы до низкой (то есть с пониженной) энергией для разворачивания, представлены здесь в Таблице 7-9. [00233] In some embodiments, the modified ITR (e.g., left or right) of a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein is modified so that it has the lowest unfolding energy (“low energy structure”). Low energy will have lower Gibbs free energy compared to wild type ITR. Representative ITR sequences that are modified to low (ie, reduced) energy for unfolding are presented here in Table 7-9.
[00234] В некоторых вариантах реализации модифицированный ITR (например, левый или правый) вектора зкДНК, полученного в соответствии со способами и композициями с использованием единственного Rep-белка, как раскрыто в данном документе, выбран из любого белка или их комбинации, показанных в Таблицах 2-9, 10A или 10B.[00234] In some embodiments, the modified ITR (e.g., left or right) of a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein is selected from any of the proteins or combinations thereof shown in the Tables 2-9, 10A or 10B.
[00235] Таблица 2: Последовательности ITR с изменениями в петлевом плече, усеченном плече или спейсере. Они включают последовательность RBS GCGCGCTCGCTCGCTC (SEQ ID NO: 531) на 5'-конце и комплементарную последовательность RBE' GAGCGAGCGAGCGCGC (SEQ ID NO: 536) на самом 3'-конце.[00235] Table 2: ITR sequences with changes in the loop arm, truncated arm or spacer. These include the RBS sequence GCGCGCTCGCTCGCTC (SEQ ID NO: 531) at the 5' end and the complementary RBE sequence GAGCGAGCGAGCGCGC (SEQ ID NO: 536) at the 3' end.
Таблица 3: Модифицированные последовательности ITR с модификациями в петлевом плече и усеченном плече Table 3: Modified ITR sequences with modifications in the loop arm and truncated arm
Таблица 4: Последовательности ITR с изменениями в петлевом плече и спейсереTable 4: ITR sequences with loop arm and spacer changes
Таблица 5: Последовательности ITR с изменениями в усеченном плече и спейсереTable 5: ITR sequences with truncated arm and spacer changes
Таблица 6: Последовательности ITR с изменениями в петлевом плече, усеченном плече и спейсереTable 6: ITR sequences with changes in loop arm, truncated arm and spacer
[00236] Как раскрыто в данном документе модифицированный ITR в векторе зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, раскрытого в данном документе, может быть создан, чтобы включать делецию, вставку или замену одного или нескольких нуклеотидов из ITR дикого типа, полученного из AAV генома. Модифицированный ITR может быть получен путем генетической модификации во время намножения в плазмиде в Escherichia coli или в виде генома бакуловируса в клетках Spodoptera frugiperda или другими биологическими методами, например in vitro с использованием полимеразной цепной реакции или химического синтеза. [00236] As disclosed herein, a modified ITR in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein disclosed herein can be constructed to include the deletion, insertion, or substitution of one or more nucleotides from the wild ITR type derived from the AAV genome. The modified ITR can be produced by genetic modification during plasmid propagation in Escherichia coli or as a baculovirus genome in Spodoptera frugiperda cells or by other biological methods, for example in vitro using polymerase chain reaction or chemical synthesis.
[00237] В некоторых вариантах реализации модифицированный ITR в векторе зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может включать делецию, вставку или замену одного или нескольких нуклеотидов из ITR дикого типа AAV2 (слева) (SEQ ID NO: 51) или ITR дикого типа AAV2 (справа) (SEQ ID NO: 1). В частности, один или несколько нуклеотидов удалены, вставлены или заменены из B-C' или C-C' в Т-образной структуре стебель-петля. Кроме того, модифицированный ITR не включает в себя модификацию Rep-связывающих элементов (RBE) и сайта конечного разрешения (trs) ITR дикого типа AAV2, хотя RBE' (TTT) может присутствовать или отсутствовать в зависимости от того, подверглась ли матрица одному циклу репликации, тем самым преобразовав триплет AAA в комплементарный RBE' - TTT.[00237] In some embodiments, a modified ITR in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein may include the deletion, insertion, or substitution of one or more nucleotides from the AAV2 wild-type ITR (left ) (SEQ ID NO: 51) or wild-type AAV2 ITR (right) (SEQ ID NO: 1). Specifically, one or more nucleotides are deleted, inserted, or replaced from B-C' or C-C' in a T-shaped stem-loop structure. Additionally, the modified ITR does not include modification of the Rep binding elements (RBEs) and terminal resolution site (trs) of the wild-type AAV2 ITR, although the RBE' (TTT) may or may not be present depending on whether the template has undergone one round of replication , thereby converting the triplet AAA into the complementary RBE' - TTT.
[00238] Приведены примеры трех типов модифицированных ITR: (1) модифицированный ITR, имеющий структуру с наименьшей энергией, включающую одно плечо и одну непарную петлю («структура с одним плечом/одной непарной петлей»); (2) модифицированный ITR, имеющий структуру с наименьшей энергией с одной шпилькой («структура с одной шпилькой»); и (3) модифицированный ITR, имеющий структуру с наименьшей энергией с двумя плечами, одно из которых усечено («усеченная структура»). [00238] Examples of three types of modified ITRs are provided: (1) a modified ITR having a lowest energy structure of one arm and one unpaired loop (“single arm/one unpaired loop structure”); (2) a modified ITR having the lowest energy single hairpin structure (“single hairpin structure”); and (3) a modified ITR having a lowest energy structure with two arms, one of which is truncated (“truncated structure”).
[00239] Модифицированный ITR с одним плечем/структурой с одинарной непарной петлей.[00239] Modified single arm/single unpaired loop ITR.
[00240] ITR дикого типа можно модифицировать для образования вторичной структуры, содержащей одно плечо и одну непарную петлю (т.е. «структура с одним плечом/одной непарной петлей»). Свободная энергия Гиббса (ΔG) для разворачивания структуры может находиться в диапазоне от -85 ккал/моль до -70 ккал/моль. Приведены типичные структуры модифицированных ITR. [00240] A wild-type ITR can be modified to form a secondary structure containing one arm and one unpaired loop (ie, a “single arm/one unpaired loop structure”). The Gibbs free energy (ΔG) for unfolding a structure can range from -85 kcal/mol to -70 kcal/mol. Typical structures of modified ITRs are given.
[00241] Предполагается, что модифицированные ITR формируют структуру с одним плечом/одной непарной петлей, которая может включать делецию, вставку или замену одного или более нуклеотидов относительно ITR дикого типа в последовательностях, образующих плечо B и B' и/или плечо C и C'. Модифицированный ITR может быть получен путем генетической модификации или биологического и/или химического синтеза. [00241] The modified ITRs are contemplated to form a single arm/single unpaired loop structure, which may include deletion, insertion or substitution of one or more nucleotides relative to the wild type ITR in the sequences forming arms B and B' and/or arms C and C '. The modified ITR can be obtained by genetic modification or biological and/or chemical synthesis.
[00242] Например, ITR-2, левый и правый, представленные на Фиг. 9A-9B (SEQ ID NO: 101 и 102) созданы таким образом, чтобы включать делецию двух нуклеотидов из плеча C-C' и делецию 16 нуклеотидов из плеча B-B' в ITR дикого типа AAV2. Три нуклеотида, оставшиеся в плече B-B' модифицированного ITR, не образуют комплементарного спаривания. Таким образом, левый и правый ITR-2 имеют структуру с наименьшей энергией с одним плечом C-C' и одним непарной петлей. Свободная энергия Гиббса для разворачивания структуры составляет около -72,6 ккал/моль. [00242] For example, ITR-2 left and right shown in FIG. 9A-9B (SEQ ID NOs: 101 and 102) are designed to include a two-nucleotide deletion from the C-C' arm and a 16-nucleotide deletion from the B-B' arm of the wild-type AAV2 ITR. The three nucleotides remaining in the B-B' arm of the modified ITR do not form complementary pairing. Thus, the left and right ITR-2 have the lowest energy structure with one C-C' arm and one unpaired loop. The Gibbs free energy for unfolding the structure is about -72.6 kcal/mol.
[00243] Левый и правый ITR-3, представленные на Фиг. 10A и 10B (SEQ ID NO: 103 и 104) созданы таким образом, чтобы включать 19 нуклеотидных делеций в плече C-C' из ITR дикого типа AAV2. Три нуклеотида, оставшиеся в плече B-B' модифицированного ITR, не образуют комплементарного спаривания. Таким образом, левый и правый ITR-3 имеют структуру с наименьшей энергией с одним плечом B-B' и одной непарной петлей. Свободная энергия Гиббса для разворачивания структуры составляет около -74,8 ккал/моль. [00243] The left and right ITR-3 shown in FIG. 10A and 10B (SEQ ID NOs: 103 and 104) are designed to include 19 nucleotide deletions in the C-C' arm of the wild-type AAV2 ITR. The three nucleotides remaining in the B-B' arm of the modified ITR do not form complementary pairing. Thus, the left and right ITR-3 have the lowest energy structure with one B-B' arm and one unpaired loop. The Gibbs free energy for unfolding the structure is about -74.8 kcal/mol.
[00244] Левый и правый ITR-4, представленные на Фиг. 11A и 11B (SEQ ID NO: 105 и 106) созданы таким образом, чтобы включать 19 нуклеотидных делеций в плече B-B' из ITR дикого типа AAV2. Три нуклеотида, оставшиеся в плече B-B' модифицированного ITR, не образуют комплементарного спаривания. Таким образом, левый и правый ITR-4 имеют структуру с наименьшей энергией с одним плечом C-C' и одной непарной петлей. Свободная энергия Гиббса для разворачивания структуры составляет около -76,9 ккал/моль.[00244] The left and right ITR-4 shown in FIG. 11A and 11B (SEQ ID NOs: 105 and 106) are designed to include 19 nucleotide deletions in the B-B' arm of the wild-type AAV2 ITR. The three nucleotides remaining in the B-B' arm of the modified ITR do not form complementary pairing. Thus, the left and right ITR-4 have the lowest energy structure with one C-C' arm and one unpaired loop. The Gibbs free energy for unfolding the structure is about -76.9 kcal/mol.
[00245] Правый и левый ITR-10, представленные на Фиг. 12A и 12B (SEQ ID NO: 107 и 108) созданы таким образом, чтобы включать 8 нуклеотидных делеций в плече B-B' из ITR дикого типа AAV2. Нуклеотиды, оставшиеся в плечах B-B' и C-C', образуют новые дополнительные связи между мотивами B и C' (левый ITR-10) или между мотивами C и B' (правый ITR-10). Таким образом, левый и правый ITR-10 имеют структуру с наименьшей энергией с одним плечом B-C' или C-B' и одной непарной петлей. Свободная энергия Гиббса для разворачивания структуры составляет около -83,7 ккал/моль. [00245] The right and left ITR-10 shown in FIG. 12A and 12B (SEQ ID NOs: 107 and 108) are designed to include 8 nucleotide deletions in the B-B' arm of the wild-type AAV2 ITR. The nucleotides remaining in the B-B' and C-C' arms form new additional bonds between motifs B and C' (left ITR-10) or between motifs C and B' (right ITR-10). Thus, the left and right ITR-10 have the lowest energy structure with one B-C' or C-B' arm and one unpaired loop. The Gibbs free energy for unfolding the structure is about -83.7 kcal/mol.
[00246] Левый и правый ITR-17, представленные на Фиг. 13A и 13B (SEQ ID NO: 109 и 110) созданы таким образом, чтобы включать 14 нуклеотидных делеций в C-C' плече из ITR дикого типа AAV2. Восемь нуклеотидов, оставшихся в плече C-C', не образуют дополнительных связей. В результате, левый и правый ITR-17 имеют структуру с наименьшей энергией с одним плечом B-B' и одной непарной петлей. Свободная энергия Гиббса для разворачивания структуры составляет около -73,3 ккал/моль.[00246] The left and right ITR-17 shown in FIG. 13A and 13B (SEQ ID NOs: 109 and 110) are designed to include 14 nucleotide deletions in the C-C' arm of the wild-type AAV2 ITR. The eight nucleotides remaining in the C-C' arm do not form additional bonds. As a result, the left and right ITR-17 have the lowest energy structure with one B-B' arm and one unpaired loop. The Gibbs free energy for unfolding the structure is about -73.3 kcal/mol.
[00247] Левые и правые последовательности ITR дикого типа (вверху) и различные левые и правые модифицированные ITR (внизу), которые, как предполагается, формируют структуру с одним плечом/одной непарной петлей, выровнены и представлены ниже в Таблице 7. [00247] Left and right wild-type ITR sequences (top) and various left and right modified ITRs (bottom) that are predicted to form a single arm/single unpaired loop structure are aligned and presented below in Table 7.
[00248] Таблица 7: Выравнивание wt-ITR и модифицированных ITR (ITR-2, ITR-3, ITR-4, ITR-10 и ITR-17) с одноцепочечной/одинарной непарной петлей.[00248] Table 7: Alignment of wt-ITR and modified ITRs (ITR-2, ITR-3, ITR-4, ITR-10 and ITR-17) with single-stranded/single unpaired loop.
(SEQ ID NO)Modified ITR
(SEQ ID NO)
ITR-2
(SEQ:101) Left
ITR-2
(SEQ:101)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::: :: ::::::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGAAA--CCCGGGCGT---GCG--------
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::
--------CCTCAGTGAGCGAGCGAGCGCGC
50 60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::::::: :::::::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGGAAA--CCCGGGCGT---GCG--------
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::
--------CCTCAGTGAGCGAGCGAGCGCGC
50 60 70
ITR-2
(SEQ:102)Right
ITR-2
(SEQ:102)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACG--CCCGGGCGGC
:::::::::::::::::::::::: : :::::: ::::::::::
GCGCGCTCGCTCGCTCACTGAGGC------------GCACGCCCGGGTTTCCCGGGCGGC
10 20 30 40
60 70 80
CTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::
CTCAGTGAGCGAGCGAGCGCGC
50 60 70 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACG--CCCGGGCGGC
:::::::::::::::::::::::: : :::::: ::::::::::
GCGCGCTCGCTCGCTCACTGAGGC------------------GCACGCCCGGGTTTCCCGGGCGGC
10 20 30 40
60 70 80
CTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::
CTCAGTGAGCGAGCGAGCGCGC
50 60 70
ITR-3
(SEQ:103)Left
ITR-3
(SEQ:103)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::: :::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCG-------------------TCGGGCGACCTTTGG
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
50 60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCG------------------TCGGGCGACCTTTGG
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
50 60 70
ITR-3
(SEQ:104)Right
ITR-3
(SEQ:104)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
:::::::::::::::::::::::::::::::::::::::::::::::: ::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACG--------GCCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
::::::::::::::::::::::::::::::::::::::::::::::::: :: ::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACG--------GCCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70
ITR-4
(SEQ:105)Left
ITR-4
(SEQ:105)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGG-----------
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::
--------CCTCAGTGAGCGAGCGAGCGCGC
50 60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGG-----------
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::
--------CCTCAGTGAGCGAGCGAGCGCGC
50 60 70
ITR-4
(SEQ:106)Right
ITR-4
(SEQ:106)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
:::::::::::::::::::::::::: : : :: : :::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCG--------ACGCCCGGGCTTTGCCCGGGCGGCCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
::::::::::::::::::::::::::: : : :: : :::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCG--------ACGCCCGGGCTTTGCCCGGGCGGCCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70
ITR-10
(SEQ:107)Left
ITR-10
(SEQ:107)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::::::::::::::::::::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGC----TTT--
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::
--GCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::::::::::::::::: : :::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGC----TTT--
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::
--GCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-10
(SEQ:108)Right
ITR-10
(SEQ:108)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAG---GTCGCCCGAC----GCCCGG
::::::::::::::::::::::::::::: :::: : :::::: ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGC----AAAGCCCGACGCCCGGGCTTTGCCCGG
10 20 30 40 50
60 70 80
GCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::
GCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAG---GTCGCCCGAC----GCCCGG
::::::::::::::::::::::::::::: :::: : :::::: ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGC----AAAGCCCGACGCCCGGGCTTTGCCCGG
10 20 30 40 50
60 70 80
GCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::
GCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-17
(SEQ:109)Left
ITR-17
(SEQ:109)
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
:::::::::::::::::::::::::: ::: :::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCG-------AAA-------CGTCGGGCGACCTTTGG
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
50 60 70 10 20 30 40 50 60
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
:::::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCG-------AAA-------CGTCGGGCGACCTTTGG
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
50 60 70
ITR-17
(SEQ:110)Right
ITR-17
(SEQ:110)
gcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggcggcct
:::::::::::::::::::::::::::::::::::::::::::::::: ::::::
gcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgttt---cggcct
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70 10 20 30 40 50 60
gcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggcggcct
::::::::::::::::::::::::::::::::::::::::::::::::: :: ::::
gcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgttt---cggcct
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70
[00249] Модифицированный ITR со структурой с единственной шпилькой [00249] Modified ITR with single pin structure
[00250] ITR дикого типа можно модифицировать, чтобы получить структуру с наименьшей энергией, включающую структуру с единственной шпилькой. Свободная энергия Гиббса (ΔG) для разворачивания структуры может находиться в диапазоне от -70 ккал/моль до -40 ккал/моль. Типичные структуры модифицированных ITR представлены на Фиг. 14A и 14B. [00250] The wild type ITR can be modified to obtain the lowest energy structure including a single hairpin structure. The Gibbs free energy (ΔG) for unfolding a structure can range from -70 kcal/mol to -40 kcal/mol. Typical structures of modified ITRs are shown in Fig. 14A and 14B.
[00251] Предполагается, что модифицированные ITR формируют структуру с единственной шпилькой, которая может включать делецию, вставку или замену одного или более нуклеотидов относительно ITR дикого типа в последовательностях, образующих плечо B и B' и/или плечо C и C'. Модифицированный ITR может быть получен путем генетической модификации или биологического и/или химического синтеза.[00251] The modified ITRs are contemplated to form a single hairpin structure, which may include deletion, insertion, or substitution of one or more nucleotides relative to the wild-type ITR in the sequences forming arms B and B' and/or arms C and C'. The modified ITR can be obtained by genetic modification or biological and/or chemical synthesis.
[00252] Например, левый и правый ITR-6, представленные на Фиг. 14A-14B (SEQ ID NO: 111 и 112), включают делеции 40 нуклеотидов в плечах B-B' и C-C' по сравнению с ITR AAV2 дикого типа. Предполагается, что нуклеотиды, оставшиеся в модифицированном ITR, образуют структуру с единственной шпилькой. Свободная энергия Гиббса для разворачивания структуры составляет около -54,4 ккал/моль. [00252] For example, the left and right ITR-6 shown in FIG. 14A-14B (SEQ ID NOs: 111 and 112), include deletions of 40 nucleotides in arms B-B' and C-C' compared to the wild-type AAV2 ITR. The nucleotides remaining in the modified ITR are predicted to form a single hairpin structure. The Gibbs free energy for unfolding the structure is about -54.4 kcal/mol.
[00253] Последовательности ITR дикого типа и ITR-6 (как левого, так и правого) выровнены и представлены ниже в Таблице 8.[00253] The wild-type and ITR-6 ITR sequences (both left and right) have been aligned and are presented below in Table 8.
[00254] Таблица 8: Выравнивание wt-ITR и модифицированного ITR-6 со структурой с единственной шпилькой[00254] Table 8: Alignment of wt-ITR and modified ITR-6 with single hairpin structure
(SEQ ID NO)Modified ITR
(SEQ ID NO)
ITR-6
(SEQ:111)Left
ITR-6
(SEQ:111)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::: ::::::
GCGCGCTCGCTCGCTCACTGAGGC---------AAAGCC---------------------
10 20 30
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::
----------TCAGTGAGCGAGCGAGCGCGC
40 50 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::: ::::::
GCGCGCTCGCTCGCTCACTGAGGC--------AAAGCC---------------------
10 20 30
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::
----------TCAGTGAGCGAGCGAGCGCGC
40 50
ITR-6 (SEQ:544)Right
ITR-6 (SEQ:544)
, GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCT
:::::::::::::::::::::::: :::: :::
, GCGCGCTCGCTCGCTCACTGAGGCC-------------------TTTG---------CCT
10 20
20 10
, CAGTGAGCGAGCGAGCGCGC (SEQ ID NO: 543)
::::::::::::::::::::
, CAGTGAGCGAGCGAGCGCGC (SEQ ID NO: 544)
40 5080 70 60 50 40 30
, GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCT
::::::::::::::::::::::::: :::: :::
, GCGCGCTCGCTCGCTCACTGAGGCC-------------------TTTG---------CCT
10 20
20 10
, CAGTGAGCGAGCGAGCGCGC (SEQ ID NO: 543)
::::::::::::::::::::
, CAGTGAGCGAGCGAGCGCGC (SEQ ID NO: 544)
40 50
[00255] Модифицированный ITR с усеченной структурой[00255] Modified ITR with truncated structure
[00256] ITR дикого типа можно модифицировать, чтобы иметь структуру с наименьшей энергией, состоящую из двух плеч, одно из которых усечено. Их свободная энергия Гиббса (ΔG) для разворачивания находится в диапазоне от -90 до -70 ккал/моль. Таким образом, их свободные энергии для разворачивания по Гиббсу ниже, чем ITR дикого типа AAV2. [00256] The wild-type ITR can be modified to have a lowest energy structure consisting of two arms, one of which is truncated. Their Gibbs free energy (ΔG) for unfolding ranges from -90 to -70 kcal/mol. Thus, their free energies for Gibbs unfolding are lower than the wild-type AAV2 ITR.
[00257] Модифицированные ITR могут включать делецию, вставку или замену одного или более нуклеотидов относительно ITR дикого типа в последовательностях, образующих плечо B и B' и/или плечо C и C'. В некоторых вариантах реализации модифицированный ITR может, например, включать удаление всей конкретной петли, например, петли A-A', петли B-B' или петли C-C', или, альтернативно, удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований, образующих стебель петли, при условии, что последняя петля на конце стебля все еще присутствует. Модифицированный ITR может быть получен путем генетической модификации или биологического и/или химического синтеза.[00257] Modified ITRs may include the deletion, insertion, or substitution of one or more nucleotides relative to the wild-type ITR in the sequences forming arms B and B' and/or arms C and C'. In some embodiments, the modified ITR may, for example, include deleting an entire particular loop, such as an A-A' loop, a B-B' loop, or a C-C' loop, or alternatively, deleting 1, 2, 3, 4, 5, 6 , 7, 8, 9 or more base pairs forming a stem loop, provided that the last loop at the end of the stem is still present. The modified ITR can be obtained by genetic modification or biological and/or chemical synthesis.
[00258] Типичные структуры модифицированных ITR с усеченной структурой представлены на Фиг. 15А-15В.[00258] Typical structures of modified truncated ITRs are shown in FIG. 15A-15B.
[00259] Предполагается, что последовательности различных модифицированных ITR образуют усеченную структуру, выровнены с последовательностью ITR дикого типа и представлены ниже в Таблице 9. [00259] The sequences of the various modified ITRs are predicted to form a truncated structure, aligned with the wild-type ITR sequence, and are presented below in Table 9.
[00260] Таблица 9: Выравнивание wt-ITR и модифицированных ITR (ITR-5, ITR-7, ITR-8, ITR-9, ITR-11, ITR-12, ITR-13, ITR-14, ITR-1 и ITR-16) с усеченной структурой. [00260] Table 9: Alignment of wt-ITR and modified ITRs (ITR-5, ITR-7, ITR-8, ITR-9, ITR-11, ITR-12, ITR-13, ITR-14, ITR-1 and ITR-16) with a truncated structure.
(SEQ ID NO)Modified ITR
(SEQ ID NO)
ITR-5
(SEQ:545)Left
ITR-5
(SEQ:545)
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
:::::::::::::::::::::::: ::::::::::::::::::::::::
gcgcgctcgctcgctcactgaggc------------gcccgggcgtcgggcgacctttgg
10 20 30 40
70 80 90
tcgcccggcctcagtgagcgagcgagcgcgc
:::::::::::::::::::::::::::::::
tcgcccggcctcagtgagcgagcgagcgcgc (SEQ ID NO: 545)
50 60 70 10 20 30 40 50 60
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
::::::::::::::::::::::::::::::::::::::::::::::::::
gcgcgctcgctcgctcactgaggc------------gcccgggcgtcgggcgacctttgg
10 20 30 40
70 80 90
tcgcccggcctcagtgagcgagcgagcgcgc
::::::::::::::::::::::::::::::::
tcgcccggcctcagtgagcgagcgagcgcgc (SEQ ID NO: 545)
50 60 70
ITR-5
(SEQ:116)Right
ITR-5
(SEQ:116)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
:::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCG-CCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
:::::::::::::::::::::::::::::::::::::::::::::::::: :::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCG-CCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70
ITR-7
(SEQ:117)Left
ITR-7
(SEQ:117)
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
:::::::::::::::::::::::::::::::::::::::::::::::::::::: :: :
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgac--tttg
10 20 30 40 50
70 80 90
tcgcccggcctcagtgagcgagcgagcgcgc
:::::::::::::::::::::::::::::::
tcgcccggcctcagtgagcgagcgagcgcgc
60 70 80 10 20 30 40 50 60
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
:::::::::::::::::::::::::::::::::::::::::::::::::: :::: :: :
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgac--tttg
10 20 30 40 50
70 80 90
tcgcccggcctcagtgagcgagcgagcgcgc
::::::::::::::::::::::::::::::::
tcgcccggcctcagtgagcgagcgagcgcgc
60 70 80
ITR-7
(SEQ:118)Right
ITR-7
(SEQ:118)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGC-----
:::::::::::::::::::::::::::::::: :: ::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACAAA--GTCGCCCGACGCCCGGGCTTTGC
10 20 30 40 50
60 70 80
------GGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::
CCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGC-----
:::::::::::::::::::::::::::::::::::: ::::::::::::::::: ::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACAAA--GTCGCCCGACGCCCGGGCTTTGC
10 20 30 40 50
60 70 80
------GGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::
CCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-8
(SEQ:119)Left
ITR-8
(SEQ:119)
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
::::::::::::::::::::::::::::::::::::::::::::::::::::: :::
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcga--ttt--
10 20 30 40 50
70 80 90
tcgcccggcctcagtgagcgagcgagcgcgc
:::::::::::::::::::::::::::::::
tcgcccggcctcagtgagcgagcgagcgcgc
60 70 80 10 20 30 40 50 60
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttgg
:::::::::::::::::::::::::::::::::::::::::::::::::: ::: :::
gcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcga--ttt--
10 20 30 40 50
70 80 90
tcgcccggcctcagtgagcgagcgagcgcgc
::::::::::::::::::::::::::::::::
tcgcccggcctcagtgagcgagcgagcgcgc
60 70 80
ITR-8
(SEQ:120)Right
ITR-8
(SEQ:120)
gcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggc-----
::::::::::::::::::::::::::::::: ::: :::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGA--AAA--TCGCCCGACGCCCGGGCTTTGC
10 20 30 40 50
60 70 80
------GGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::
CCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50
gcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggc-----
::::::::::::::::::::::::::::::: ::: :::::::::::::::: :
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGA--AAA--TCGCCCGACGCCCGGGCTTTGC
10 20 30 40 50
60 70 80
------GGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::
CCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-9
(SEQ:121)Left
ITR-9
(SEQ:121)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::::::::::::::::::: ::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCG----TT--
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::::::::::::::::: :: ::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCG----TT--
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-9
(SEQ:122)Right
ITR-9
(SEQ:122)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGC-----
::::::::::::::::::::::::::::::: :: ::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGA--AA----CGCCCGACGCCCGGGCTTTGC
10 20 30 40 50
60 70 80
------GGCCTCAGTGAGCGAGCGAGCGCGC
CCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGC-----
:::::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGA--AA----CGCCCCGACGCCCGGGCTTTGC
10 20 30 40 50
60 70 80
------GGCCTCAGTGAGCGAGCGAGCGCGC
CCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-11
(SEQ:123)Left
ITR-11
(SEQ:123)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::: :: :::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGAAA--CCCGGGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::: ::::::::::::::::: :::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGGAAA--CCCGGGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-11
(SEQ:124)Right
ITR-11
(SEQ:124)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGG------
::::::::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGTTTCCC
70 80 90 100 110 120
60 70 80
---CGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::
GGGCGGCCTCAGTGAGCGAGCGAGCGCGC
130 140 150 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGG------
:::::::::::::::::::::::::::::::::::::::::::::::::: ::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGTTTCCC
70 80 90 100 110 120
60 70 80
---CGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::
GGGCGGCCTCAGTGAGCGAGCGAGCGCGC
130 140 150
ITR-12
(SEQ:125)Left
ITR-12
(SEQ:125)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::: ::: ::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGG--AAA-CCGGGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::: ::: :::::::::::::::: ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGG--AAA-CCGGGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-12
(SEQ:126)Right
ITR-12
(SEQ:126)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGG-------
:::::::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGTTTCCGG
10 20 30 40 50 60
60 70 80
GCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::
GCGGCCTCAGTGAGCGAGCGAGCGCGC
70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCG-------
:::::::::::::::::::::::::::::::::::::::::::::::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGTTTCCGG
10 20 30 40 50 60
60 70 80
GCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::
GCGGCCTCAGTGAGCGAGCGAGCGCGC
70 80
ITR-13
(SEQ:127)Left
ITR-13
(SEQ:127)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::: ::: :::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCG---AAA---CGGGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCCG---AAA---CGGGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-13
(SEQ:128)Right
ITR-13
(SEQ:128)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCG-----GGC
:::::::::::::::::::::::::::::::::::::::::::::::::::: :::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGTTTCGGGC
10 20 30 40 50 60
60 70 80
GGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::
GGCCTCAGTGAGCGAGCGAGCGCGC
70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCG-----GGC
:::::::::::::::::::::::::::::::::::::::::::::::::: :: :::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGTTTCGGGC
10 20 30 40 50 60
60 70 80
GGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::
GGCCTCAGTGAGCGAGCGAGCGCGC
70 80
ITR-14
(SEQ:129)Left
ITR-14
(SEQ:129)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::: :::: :::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCCC----AAAG----GGCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::
GCGCGCTCGCTCGCTCACTGAGGCCGCCC----AAAG----GGCGTCGGGCGACCTTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-14
(SEQ:130)Right
ITR-14
(SEQ:130)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCC---GGGCGG
::::::::::::::::::::::::::::::::::::::::::::::::::: ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCTTTGGGCGG
10 20 30 40 50 60
60 70 80
CCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::
CCTCAGTGAGCGAGCGAGCGCGC
70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCC---GGGCGG
:::::::::::::::::::::::::::::::::::::::::::::::::: : ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCTTTGGGCGG
10 20 30 40 50 60
60 70 80
CCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::
CCTCAGTGAGCGAGCGAGCGCGC
70 80
ITR-15
(SEQ:131)Left
ITR-15
(SEQ:131)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
:::::::::::::::::::::::::::: :::: ::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCC-----AAAG-----GCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGCC-----AAAG-----GCGTCGGGCGACCTTTGG
10 20 30 40 50
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
60 70 80
ITR-15
(SEQ:132)Right
ITR-15
(SEQ:132)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCG-GGCGGCC
:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCTTTGGCGGCC
10 20 30 40 50 60
60 70 80
TCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::
TCAGTGAGCGAGCGAGCGCGC
70 80 10 20 30 40 50
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCG-GGCGGCC
:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCTTTGGCGGCC
10 20 30 40 50 60
60 70 80
TCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::
TCAGTGAGCGAGCGAGCGCGC
70 80
ITR-16
(SEQ:133)Left
ITR-16
(SEQ:133)
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::: ::::: ::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGC------AAAGC------GTCGGGCGACCTTTGG
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
:::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
50 60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGG
::::::::::::::::::::::::::: ::::: ::::::::::::::::
GCGCGCTCGCTCGCTCACTGAGGCCGC------AAAGC------GTCGGGCGACCTTTTGG
10 20 30 40
70 80 90
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::::::::::::::
TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC
50 60 70
ITR-16
(SEQ:134)Right
ITR-16
(SEQ:134)
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
::::::::::::::::::::::::::::::::::::::::::::::::: : ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCTTTG-CGGCCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70 10 20 30 40 50 60
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCT
:::::::::::::::::::::::::::::::::::::::::::::::::: : ::::::
GCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCTTTG-CGGCCT
10 20 30 40 50
70 80
CAGTGAGCGAGCGAGCGCGC
::::::::::::::::::::
CAGTGAGCGAGCGAGCGCGC
60 70
[00261] Дополнительные типичные модифицированные ITR в каждом из вышеуказанных классов для использования в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, представлены в таблицах 10A и 10B. Предсказанная вторичная структура правых модифицированных ITR в таблице 10A показана на Фиг. 26A, и предсказанная вторичная структура левых модифицированных ITR в Таблице 10B показана на Фиг. 26B.[00261] Additional exemplary modified ITRs in each of the above classes for use in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein are presented in Tables 10A and 10B. The predicted secondary structure of the right modified ITRs in Table 10A is shown in FIG. 26A, and the predicted secondary structure of the left modified ITRs in Table 10B is shown in FIG. 26B.
[00262] Таблица 10A и Таблица 10B показывают типичные правые и левые модифицированные ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе.[00262] Table 10A and Table 10B show typical right-handed and left-handed modified ITRs in a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein.
[00263] Таблица 10А: Типичные правые модифицированные ITR. Эти типичные модифицированные правые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3′ (SEQ ID NO: 531), спейсер ACTGAGGC (SEQ ID NO: 532), комплемент спейсера GCCTCAGT (SEQ ID NO: 535) и RBE' (т.е. комплемент RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 536).[00263] Table 10A: Typical Right Modified ITRs. These typical modified right ITRs may contain the RBE GCGCGCTCGCTCGCTC-3′ (SEQ ID NO: 531), the spacer ACTGAGGC (SEQ ID NO: 532), the spacer complement GCCTCAGT (SEQ ID NO: 535) and the RBE' (i.e., the complement RBE ) GAGCGAGCGAGCGCGC (SEQ ID NO: 536).
[00264] ТАБЛИЦА 10В: Типичные модифицированные левые ITR в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе. Эти примеры модифицированных левых ITR могут содержать RBE GCGCGCTCGCTCGCTC-3′ (SEQ ID NO: 531), спейсер ACTGAGGC (SEQ ID NO: 532), комплемент спейсера GCCTCAGT (SEQ ID NO: 535) и комплемент RBE (RBE') GAGCGAGCGAGCGCGC (SEQ ID NO: 536).[00264] TABLE 10B: Representative modified left-handed ITRs in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as disclosed herein. These examples of modified left ITRs may contain the RBE GCGCGCTCGCTCGCTC-3′ (SEQ ID NO: 531), the spacer ACTGAGGC (SEQ ID NO: 532), the spacer complement GCCTCAGT (SEQ ID NO: 535), and the complement RBE (RBE') GAGCGAGCGAGCGCGC (SEQ ID NO: 536).
[00265] Согласно вариантам реализации данного изобретения зкДНК-вектор, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, не содержит модифицированных ITR, имеющих нуклеотидную последовательность, выбранную из любой последовательности из группы SEQ ID No: 550, 551, 552, 553, 553, 554, 555, 556 и 557. [00265] In embodiments of the present invention, a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein does not contain modified ITRs having a nucleotide sequence selected from any of the following SEQ ID Nos: 550, 551, 552, 553, 553, 554, 555, 556 and 557.
[00267] В той степени, в которой вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, имеет модифицированный ITR, который имеет одну из модификаций в участке B, B', C или C', как описано в SEQ ID NO: 550-557, как определено в одном или нескольких пунктах формулы данной заявки, или в любом изобретении, которое будет определено в измененной формуле изобретения, которая в будущем может быть подана в этой заявке или в любом патенте, полученном на ее основе, и в той степени, в которой законы любой соответствующей страны или стран, к которым применяются те или иные требования, настоящим оставляется право отказать в указанном раскрытии из пунктов формулы данной заявки или любого патента, полученного из нее, в той степени, в которой это необходимо для предотвращения признания недействительной данной заявки или любого другого патента, полученного на основании этого.[00267] To the extent that a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein has a modified ITR that has one of the modifications at the B, B', C, or C region ' as described in SEQ ID NO: 550-557, as defined in one or more claims of this application, or in any invention to be defined in amended claims that may hereafter be filed in this application or in any patent derived from it, and to the extent that the laws of any relevant country or countries to which certain requirements apply, the right is hereby reserved to deny said disclosure of the claims of this application or any patent derived therefrom, to the extent to the extent necessary to prevent the invalidation of the application or any other patent obtained thereunder.
[00267] Например, без ограничений, оставляется право отказать в рассмотрении любого из следующих предметов из любого пункта формулы данной заявки, в данное время или с поправками, внесенными в будущем, или любого патента, полученного на его основе:[00267] For example, without limitation, the right is reserved to refuse consideration of any of the following items from any claim of this application, now or as hereafter amended, or any patent derived therefrom:
[00268] A. модифицированный ITR, выбранный из любой группы, состоящей из: SEQ ID NO: 2, 52, 63, 64, 113, 114, 550, 551; 552, 553, 553, 554, 555, 556, 557, используемые в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как описано в данном документе, без регуляторного переключателя[00268] A. a modified ITR selected from any of the group consisting of: SEQ ID NO: 2, 52, 63, 64, 113, 114, 550, 551; 552, 553, 553, 554, 555, 556, 557, used in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as described herein, without a regulatory switch
[00269] B. указанные выше модифицированные ITR в A., в векторе зкДНК, полученном в соответствии со способами и композициями с использованием единственного белка Rep, как описано в данном документе, без регуляторной последовательности, в котором гетерологичная нуклеиновая кислота кодирует ABCA4, USA2A var1, VEGFR CEP290, фактор VIII BDD (FVIII), фактор VIII, vWF_His, vWF, лецитин-холестерин-ацетилтрансферазу, PAH, G6PC или CFTR[00269] B. the above modified ITRs in A., in a cccDNA vector prepared in accordance with methods and compositions using a single Rep protein as described herein, without a regulatory sequence, in which the heterologous nucleic acid encodes ABCA4, USA2A var1 , VEGFR CEP290, factor VIII BDD (FVIII), factor VIII, vWF_His, vWF, lecithin-cholesterol acetyltransferase, PAH, G6PC or CFTR
VI. Регуляторные элементы.VI. Regulatory elements.
[00270] Композиция, используемая в способах получения зкДНК-вектора, например, вектора зкДНК, как описано в данном документе, или вектора AAV, содержит последовательность нуклеиновой кислоты, кодирующую единственный модифицированный белок Rep, может дополнительно содержать регуляторный элемент, например, цис-регуляторный элемент, как описано в этом документе, перед или функционально связанной с нуклеиновой кислотой, кодирующей единственный модифицированный белок Rep. Например, нуклеотидная последовательность, кодирующая модифицированный белок Rep, например, кодирующая модифицированный белок Rep 78, но не содержащая функциональный кодон инициации для кодирования белка Rep 52 или сайты сплайсинга для пропуска экзона для получения Rep 68 или Rep40, является функционально связанной с регуляторным элементом, например, цис-регуляторным элементом. [00270] The composition used in methods for producing a cccDNA vector, for example, a cccDNA vector as described herein, or an AAV vector, contains a nucleic acid sequence encoding a single modified Rep protein, may further contain a regulatory element, for example, a cis-regulatory element element, as described herein, before or operably linked to a nucleic acid encoding a single modified Rep protein. For example, a nucleotide sequence encoding a modified Rep protein, such as encoding a modified Rep 78 protein, but not containing a functional initiation codon to encode Rep 52 protein or splice sites for exon skipping to produce Rep 68 or Rep40, is operably linked to a regulatory element, e.g. , a cis-regulatory element.
[00271] В одном варианте реализации нуклеотидная последовательность, кодирующая единственный белок Rep, используемый в композициях и способах, раскрытых в данном документе, включает последовательность контроля экспрессии, например, промотор, цис-регуляторные элементы или регуляторный переключатель, как описано в данном документе, расположенные выше кодона инициации нуклеотидной последовательности, кодирующей парвовирусный белок Rep78, в которой последовательность нуклеиновой кислоты не имеет функционального инициирующего кодона для Rep52 и/или сайтов сплайсинга для пропуска экзона для получения Rep 68 или Rep40. В одном варианте реализации нуклеотидная последовательность, кодирующая единственный белок Rep, используемый в композициях и способах, раскрытых в данном документе, включает последовательность контроля экспрессии перед кодоном инициации нуклеотидной последовательности, кодирующей парвовирусный белок Rep78, в которой последовательность нуклеиновой кислоты не имеет функциональных сайтов сплайсингу для кодирования Rep68. [00271] In one embodiment, the nucleotide sequence encoding a single Rep protein used in the compositions and methods disclosed herein includes an expression control sequence, such as a promoter, cis-regulatory elements, or a regulatory switch as described herein, located upstream of the initiation codon of a nucleotide sequence encoding the parvovirus Rep78 protein, wherein the nucleic acid sequence does not have a functional initiation codon for Rep52 and/or splice sites for exon skipping to produce Rep 68 or Rep40. In one embodiment, the nucleotide sequence encoding a single Rep protein used in the compositions and methods disclosed herein includes an expression control sequence upstream of the initiation codon of the nucleotide sequence encoding the parvovirus Rep78 protein, wherein the nucleic acid sequence does not have functional splice sites for encoding Rep68.
[00272] Аналогично, вектор зкДНК, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может быть получен из экспрессионных конструктов, которые дополнительно содержат конкретную комбинацию цис-регуляторных элементов. Цис-регуляторные элементы включают, не ограничиваясь перечисленными, промотор, рибопереключатель, инсулятор, miR-регулируемый элемент, посттранскрипционный регуляторный элемент, тканеспецифический и клеточноспецифический промотор и энхансер. Согласно некоторым вариантам реализации указанный ITR может действовать в качестве промотора для трансгена. Согласно некоторым вариантам реализации указанный зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторные переключатели согласно описанию в данном документе, для регулирования экспрессии трансгена, или «аварийный выключатель», который способен убить клетку, содержащую указанный зкДНК-вектор. [00272] Likewise, a cccDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein can be produced from expression constructs that further contain a particular combination of cis-regulatory elements. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a miR-regulated element, a post-transcriptional regulatory element, a tissue-specific and cell-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter for a transgene. In some embodiments, the cccDNA vector contains additional components for regulating expression of the transgene, such as regulatory switches as described herein to regulate expression of the transgene, or a “kill switch” that is capable of killing a cell containing the cccDNA vector.
[00273] ЗкДНК-вектор, полученный в соответствии со способами и композициями с использованием единственного белка Rep, как раскрыто в данном документе, может быть получен из экспрессирующих конструктов, которые дополнительно содержат специфическую комбинацию цис-регуляторных элементов, таких как посттранскрипционный регуляторный элемент WHP (WPRE) (например, SEQ ID NO: 8) и поли(А) BGH (SEQ ID NO: 9). Подходящие экспрессионные кассеты для применения в экспрессионных конструктах не имеют налагаемых вирусным капсидом ограничений упаковки. Экспрессионные кассеты по данному изобретению включают промотор, который может влиять на общие уровни экспрессии, а также на клеточную специфичность. Для экспрессии трансгена они могут включать высокоактивный немедленный ранний промотор вирусного происхождения. Экспрессионные кассеты могут содержать тканеспецифические эукариотические промоторы для ограничения трансгенной экспрессии конкретными типами клеток и снижения токсических эффектов и иммунных ответов, обусловленных нерегулируемой эктопической экспрессией. [00273] A cctDNA vector produced in accordance with methods and compositions using a single Rep protein as disclosed herein can be produced from expression constructs that further contain a specific combination of cis-regulatory elements, such as the post-transcriptional regulatory element WHP ( WPRE) (eg, SEQ ID NO: 8) and poly(A) BGH (SEQ ID NO: 9). Suitable expression cassettes for use in expression constructs do not have the packaging restrictions imposed by the viral capsid. The expression cassettes of this invention include a promoter that can influence overall expression levels as well as cell specificity. For transgene expression, they may include a highly active viral-derived immediate early promoter. Expression cassettes may contain tissue-specific eukaryotic promoters to restrict transgene expression to specific cell types and reduce toxic effects and immune responses caused by unregulated ectopic expression.
[00274] В предпочтительных вариантах реализации промоторы или регуляторные элементы для использования при экспрессии модифицированного единственного Rep-белка или в экспрессионной кассете вектора зкДНК, полученного описанными здесь способами, могут содержать синтетический регуляторный элемент, такой как промотор CAG (SEQ ID NO: 3). Промотор CAG содержит (i) ранний энхансерный элемент цитомегаловируса (CMV), (ii) промотор, первый экзон и первый интрон гена бета-актина курицы, и (iii) акцептор сплайсинга гена бета-глобина кролика. Альтернативно, промоторы или регуляторные элементы для использования при экспрессии модифицированного единственного Rep-белка или в экспрессионной кассете вектора зкДНК, полученного описанными здесь способами, могут содержать промотор альфа-1-антрипсина (AAT) (SEQ ID NO: 4 или SEQ ID NO: 74), печень-специфический (LP1) промотор (SEQ ID NO: 5 или SEQ ID NO: 16) или промотор фактора удлинения-1-альфа (EF1a) человека (например, SEQ ID NO: 6 или SEQ ID NO: 15). В некоторых вариантах реализации промоторы или регуляторные элементы для использования при экспрессии модифицированного единственного Rep-белка или в экспрессионной кассете вектора зкДНК, полученного описанными здесь способами, выбраны из одного или нескольких конститутивных промоторов, например ретровируса. промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV) или немедленный ранний промотор цитомегаловируса (CMV) (необязательно с энхансером CMV, например, SEQ ID NO: 22). Альтернативно, индуцибельный промотор, нативный промотор для трансгена, тканеспецифический промотор или различные промоторы, известные в данной области, могут быть функционально связаны с нуклеиновой кислотой, кодирующей модифицированный единственный белок Rep, или в кассете экспрессии вектора зкДНК, полученного способами, раскрытыми в данном документе.[00274] In preferred embodiments, promoters or regulatory elements for use in expressing a modified single Rep protein or in an expression cassette of a cccDNA vector produced by the methods described herein may comprise a synthetic regulatory element, such as a CAG promoter (SEQ ID NO: 3). The CAG promoter contains (i) the cytomegalovirus (CMV) early enhancer element, (ii) the promoter, first exon, and first intron of the chicken beta-actin gene, and (iii) the splice acceptor of the rabbit beta-globin gene. Alternatively, promoters or regulatory elements for use in expressing a modified single Rep protein or in an expression cassette of a cccDNA vector produced by the methods described herein may comprise an alpha-1-antripsin (AAT) promoter (SEQ ID NO: 4 or SEQ ID NO: 74 ), liver-specific (LP1) promoter (SEQ ID NO: 5 or SEQ ID NO: 16) or human elongation factor-1-alpha (EF1a) promoter (eg, SEQ ID NO: 6 or SEQ ID NO: 15). In some embodiments, promoters or regulatory elements for use in expressing a modified single Rep protein or in an expression cassette of a cccDNA vector produced by the methods described herein are selected from one or more constitutive promoters, such as a retrovirus. a Rous sarcoma virus (RSV) LTR promoter (optionally with an RSV enhancer) or a cytomegalovirus (CMV) immediate early promoter (optionally with a CMV enhancer, e.g., SEQ ID NO: 22). Alternatively, an inducible promoter, a native promoter for a transgene, a tissue-specific promoter, or various promoters known in the art can be operably linked to a nucleic acid encoding a modified single Rep protein or in an expression cassette of a cccDNA vector produced by the methods disclosed herein.
[00275] Подходящие промоторы, в том числе описанные выше, могут происходить из вирусов и, соответственно, могут называться вирусными промоторами, или они могут происходить из любого организма, в том числе прокариотических или эукариотических организмов. Для управления экспрессией с помощью любой РНК-полимеразы (например, pol I, pol II, pol III) могут применяться подходящие промоторы. Типичные промоторы, которые могут быть функционально связаны с нуклеиновой кислотой, кодирующей модифицированный единственный белок Rep, или c кассетой экспрессии вектора зкДНК, полученной описанными здесь способами, включают, без ограничений, ранний промотор SV40, промотор из длинного концевого повтора вируса опухоли молочной железы мышей (LTR); аденовирусный большой поздний промотор (Ad MLP); промотор вируса простого герпеса (HSV), промотор цитомегаловируса (CMV), такой как участок немедленного раннего промотора CMV (CMVIE), промотор вируса саркомы Рауса (RSV), промотор U6 малой ядерной РНК человека (U6, например, SEQ ID NO: 18) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), усиленный промотор U6 (например, Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), промотор H1 человека (H1) (например, SEQ ID NO: 19), промотор CAG, промотор альфа-1-антитрипсина человека (HAAT) (например, SEQ ID NO: 21), и т.п. Согласно вариантам реализации указанные промоторы изменяют на содержащем интрон 3′-конце так, чтобы они включали один или более сайтов расщепления нуклеазами. Согласно некоторым вариантам реализации ДНК, содержащая сайт(ы) расщепления нуклеазой, является чужеродной для ДНК промотора.[00275] Suitable promoters, including those described above, may be derived from viruses and may thus be referred to as viral promoters, or they may be derived from any organism, including prokaryotic or eukaryotic organisms. Suitable promoters can be used to drive expression by any RNA polymerase (eg, pol I, pol II, pol III). Exemplary promoters that may be operably linked to a nucleic acid encoding a modified single Rep protein or to a cccDNA vector expression cassette produced by the methods described herein include, but are not limited to, the SV40 early promoter, the murine mammary tumor virus long terminal repeat promoter ( LTR); adenoviral large late promoter (Ad MLP); herpes simplex virus (HSV) promoter, cytomegalovirus (CMV) promoter such as the CMV immediate early (CMVIE) promoter region, Rous sarcoma virus (RSV) promoter, human small nuclear RNA U6 promoter (U6, e.g., SEQ ID NO: 18) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), enhanced U6 promoter (e.g. Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), human H1 promoter (H1) (eg, SEQ ID NO: 19), CAG promoter, human alpha-1 antitrypsin (HAAT) promoter (eg, SEQ ID NO: 21), etc. In embodiments, the promoters are modified at the intron-containing 3′ end to include one or more nuclease cleavage sites. In some embodiments, the DNA containing the nuclease cleavage site(s) is foreign to the promoter DNA.
[00276] Промотор может содержать одну или более специфических регуляторных последовательностей транскрипции для дополнительного усиления экспрессии, и/или для пространственного и/или временнóго изменения экспрессии. Промотор может также включать дистальные энхансерные или репрессорные элементы, которые могут быть локализованы на расстоянии нескольких тысяч пар оснований от сайта старта транскрипции. Промотор может происходить из источников, включающих вирусы, бактерии, грибы, растения, насекомые и животные. Промотор может регулировать экспрессию генного компонента конститутивно или дифференциально в отношении клетки, ткани или органа, где происходит экспрессия, или в отношении стадии развития, на которой происходит экспрессия, или в ответ на внешние стимулы, такие как физиологические стрессы, патогены, ионы металлов или индуцирующие агенты. Репрезентативные примеры промоторов, которые могут быть функционально связаны с нуклеиновой кислотой, кодирующей модифицированный единственный белок Rep, или c кассетой экспрессии вектора зкДНК, полученной описанными здесь способами, включают, без ограничений, промотор бактериофага Т7, промотор бактериофага T3, промотор SP6, оператор-промотор lac, промотор tac, поздний промотор SV40, ранний промотор SV40, промотор RSV-LTR, промотор CMV IE, ранний промотор SV40 или поздний промотор SV40 и промотор CMV IE, а также промоторы перечисленые ниже. Такие промоторы и/или энхансеры можно применять для экспрессии любого представляющего интерес гена, например, молекул для редактирования генов, донорной последовательности, терапевтических белков и т.п. Например, указанный вектор может содержать промотор, который функционально связан с последовательностью нуклеиновой кислоты, кодирующей терапевтический белок. Указанный промотор, функционально связанный с кодирующей последовательностью терапевтического белка, может представлять собой промотор вируса обезьян 40 (SV40), промотор вируса опухоли молочной железы мышей (MMTV), промотор вируса иммунодефицита человека (ВИЧ), например, промотор длинного концевого повтора (LTR) вируса иммунодефицита крупного рогатого скота (BIV), промотор вируса Молони, промотор вируса лейкоза птиц (ALV), промотор цитомегаловируса (CMV), такой как ранний промотор CMV, промотор вируса Эпштейна-Барр (EBV) или промотор вируса саркомы Рауса (RSV). Согласно некоторым вариантам реализации промотор также может представлять собой промотор гена человека, такого как убиквитин С человека (hUbC), актин человека, миозин человека, гемоглобин человека, мышечный креатин человека или металлотионеин человека. Промотор также может представлять собой тканеспецифичный промотор, такой как специфический для печени промотор, такой как промотор альфа-1-антитрипсина человека (HAAT), природный или синтетический. В одном варианте реализации доставка в печень может быть достигнута с использованием эндогенного ApoE-специфического нацеливания композиции, содержащей зкДНК-вектор, на гепатоциты посредством рецептора липопротеина низкой плотности (LDL), присутствующего на поверхности гепатоцитов.[00276] A promoter may contain one or more specific transcriptional regulatory sequences to further enhance expression, and/or to alter expression spatially and/or temporally. The promoter may also include distal enhancer or repressor elements, which may be located several thousand base pairs away from the transcription start site. The promoter can come from sources including viruses, bacteria, fungi, plants, insects and animals. A promoter may regulate expression of a gene component constitutively or differentially with respect to the cell, tissue or organ where expression occurs, or with respect to the developmental stage at which expression occurs, or in response to external stimuli such as physiological stresses, pathogens, metal ions or inducing agents. Representative examples of promoters that may be operably linked to a nucleic acid encoding a modified single Rep protein or to a cccDNA vector expression cassette produced by the methods described herein include, but are not limited to, bacteriophage T7 promoter, bacteriophage T3 promoter, SP6 promoter, operator promoter lac, tac promoter, SV40 late promoter, SV40 early promoter, RSV-LTR promoter, CMV IE promoter, SV40 early promoter or SV40 late promoter and CMV IE promoter, as well as the promoters listed below. Such promoters and/or enhancers can be used to express any gene of interest, for example, gene editing molecules, donor sequence, therapeutic proteins, and the like. For example, the vector may contain a promoter that is operably linked to a nucleic acid sequence encoding a therapeutic protein. Said promoter operably linked to the coding sequence of the therapeutic protein may be a simian virus 40 (SV40) promoter, a murine mammary tumor virus (MMTV) promoter, a human immunodeficiency virus (HIV) promoter, such as a long terminal repeat (LTR) virus promoter bovine immunodeficiency virus (BIV) promoter, Moloney virus promoter, avian leukemia virus (ALV) promoter, cytomegalovirus (CMV) promoter such as CMV early promoter, Epstein-Barr virus (EBV) promoter or Rous sarcoma virus (RSV) promoter. In some embodiments, the promoter may also be a human gene promoter, such as human ubiquitin C (hUbC), human actin, human myosin, human hemoglobin, human muscle creatine, or human metallothionein. The promoter may also be a tissue-specific promoter, such as a liver-specific promoter, such as the human alpha-1 antitrypsin (HAAT) promoter, natural or synthetic. In one embodiment, delivery to the liver can be achieved using endogenous ApoE-specific targeting of a cccDNA vector-containing composition to hepatocytes via the low-density lipoprotein (LDL) receptor present on the surface of hepatocytes.
[00277] Согласно одному варианту реализации используемый промотор представляет собой нативный промотор гена, кодирующий терапевтический белок. Промоторы и другие регуляторные последовательности соответствующих генов, кодирующих терапевтические белки, известны и были охарактеризованы. Используемый участок промотора может дополнительно включать одну или несколько дополнительных регуляторных последовательностей (например, нативных), например, энхансеров (например, SEQ ID NO: 22 и SEQ ID NO: 23).[00277] In one embodiment, the promoter used is the native promoter of a gene encoding a therapeutic protein. The promoters and other regulatory sequences of the corresponding genes encoding therapeutic proteins are known and have been characterized. The promoter region used may further include one or more additional regulatory sequences (eg, native), such as enhancers (eg, SEQ ID NO: 22 and SEQ ID NO: 23).
[00278] Неограничивающие примеры подходящих промоторов для использования при экспрессии модифицированного единственного Rep-белка или вектора зкДНК, полученного описанными здесь способами, включают промотор CAG, например (SEQ ID NO: 3), промотор HAAT (SEQ ID NO: 21), промотор EF1-α человека (SEQ ID NO: 6) или фрагмент промотора EF1a (SEQ ID NO: 15), промотор IE2 (например, SEQ ID NO: 20) и промотор EF1-α крысы (SEQ ID NO: 24). [00278] Non-limiting examples of suitable promoters for use in the expression of a modified single Rep protein or cccDNA vector produced by the methods described herein include the CAG promoter, for example (SEQ ID NO: 3), the HAAT promoter (SEQ ID NO: 21), the EF1 promoter human -α (SEQ ID NO: 6) or a fragment of the EF1a promoter (SEQ ID NO: 15), the IE2 promoter (eg, SEQ ID NO: 20) and the rat EF1-α promoter (SEQ ID NO: 24).
[00279] Последовательности полиаденилирования: В некоторых вариантах реализации последовательность, кодирующая последовательность полиаденилирования, может быть функционально связана с нуклеиновой кислотой, кодирующей модифицированный единственный белок Rep, или вектор зкДНК, полученный способами, описанными в данном документе, для стабилизации экспрессируемой мРНК, и/или для помощи в ядерном экспорте и трансляции. В одном варианте реализации конструкт, содержащаяий нуклеиновую кислоту, кодирующую единственный модифицированный белок Rep, или вектор зкДНК, полученный описанными здесь способами, не включает последовательность полиаденилирования. Согласно другим вариантам реализации конструкт, содержащий нуклеиновую кислоту, кодирующую единственный модифицированный белок Rep, или вектор зкДНК, полученный описанными здесь способами включает по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50 или более адениновых динуклеотидов. В некоторых вариантах реализации указанная последовательность полиаденилирования содержит примерно 43 нуклеотида, примерно 40-50 нуклеотидов, примерно 40-55 нуклеотидов, примерно 45-50 нуклеотидов, примерно 35-50 нуклеотидов, или в любом диапазоне между указанными значениями. [00279] Polyadenylation sequences: In some embodiments, the sequence encoding the polyadenylation sequence may be operably linked to a nucleic acid encoding a modified single Rep protein or a cccDNA vector produced by the methods described herein to stabilize the expressed mRNA, and/or to assist with nuclear export and broadcast. In one embodiment, the construct comprising a nucleic acid encoding a single modified Rep protein or a cccDNA vector produced by the methods described herein does not include a polyadenylation sequence. In other embodiments, a construct comprising a nucleic acid encoding a single modified Rep protein or cccDNA vector produced by the methods described herein comprises at least 1, at least 2, at least 3, at least 4, at least 5, at least 10, at least 15, at least 20, at least 25, at least 30, at least 40, at least 45, at least 50 or more adenine dinucleotides. In some embodiments, the polyadenylation sequence is about 43 nucleotides, about 40-50 nucleotides, about 40-55 nucleotides, about 45-50 nucleotides, about 35-50 nucleotides, or any range between these values.
[00280] Конструкт, содержащий нуклеиновую кислоту, кодирующую единственный модифицированный белок Rep, или вектор зкДНК, полученный описанными здесь способами, может включать последовательность полиаденилирования, известную в данной области техники, или ее вариант, например, встречающуюся в природе последовательность, выделенную из бычьей BGHpA (например, SEQ ID NO: 74), или из вирусной SV40pA (например, SEQ ID NO: 10), или синтетическую последовательность (например, SEQ ID NO: 27). Некоторые экспрессионные кассеты также включают последовательность 5'-энхансера позднего поли(А)-сигнала (USE) SV40. Согласно некоторым вариантам реализации указанные USE могут применяться в комбинации с SV40pA или гетерологичным поли(A)-сигналом.[00280] A construct containing a nucleic acid encoding a single modified Rep protein, or a cccDNA vector produced by the methods described herein, may include a polyadenylation sequence known in the art, or a variant thereof, for example, a naturally occurring sequence isolated from bovine BGHpA (eg, SEQ ID NO: 74), or from viral SV40pA (eg, SEQ ID NO: 10), or a synthetic sequence (eg, SEQ ID NO: 27). Some expression cassettes also include the SV40 5' late poly(A) signal enhancer (USE) sequence. In some embodiments, these USEs may be used in combination with SV40pA or a heterologous poly(A) signal.
[00281] Указанные экспрессионные кассеты могут также включать посттранскрипционный элемент для повышения экспрессии трансгена. В некоторых вариантах реализации для повышения экспрессии трансгена применяют посттранскрипционный регуляторный элемент (WPRE) вируса гепатита сурков (WHP) (например, SEQ ID NO: 8). Могут применяться другие элементы посттранскрипционного процессинга, такие как посттранскрипционный элемент гена тимидинкиназы вируса простого герпеса или вируса гепатита B (HBV). К трансгенам могут быть присоединены секреторные последовательности, например, последовательности VH-02 и VK-A26, например, SEQ ID NO: 25 и SEQ ID NO: 26.[00281] These expression cassettes may also include a post-transcriptional element to enhance expression of the transgene. In some embodiments, a woodchuck hepatitis virus (WHP) post-transcriptional regulatory element (WPRE) is used to enhance transgene expression (eg, SEQ ID NO: 8). Other post-transcriptional processing elements may be used, such as a post-transcriptional element of the herpes simplex virus or hepatitis B virus (HBV) thymidine kinase gene. Secretory sequences, such as VH-02 and VK-A26 sequences, such as SEQ ID NO: 25 and SEQ ID NO: 26, can be attached to the transgenes.
VI. Регуляторные переключателиVI. Regulatory switches
[00282] Молекулярный регуляторный переключатель - это переключатель, который генерирует измеряемое изменение состояния в ответ на сигнал. Такие регуляторные переключатели можно успешно комбинировать с конструктом, содержащим нуклеиновую кислоту, кодирующую модифицированный единственный белок Rep, или вектор зкДНК, полученный описанными здесь способами, для контроля выхода вектора зкДНК. В некоторых вариантах реализации конструкт, содержащая нуклеиновую кислоту, кодирующую один модифицированный белок Rep, или вектор зкДНК, полученный описанными здесь способами, содержит регуляторный переключатель, который служит для точной настройки экспрессии одного белка Rep или трансгена в зкДНК векторе. Например, он может служить для обеспечения функции биологического сдерживания зкДНК-вектора. Согласно некоторым вариантам реализации указанный переключатель представляет собой «двухпозиционный» переключатель, который сконструирован таким образом, чтобы запускать или останавливать (т.е. прекращать) экспрессию представляющего интерес гена в зкДНК контролируемым и регулируемым образом. Согласно некоторым вариантам реализации указанный переключатель может включать «аварийный выключатель», который может давать клетке, содержащей указанный зкДНК-вектор, команду для запуска механизма запрограммированной клеточной смерти после активации переключателя.[00282] A molecular regulatory switch is a switch that generates a measurable change of state in response to a signal. Such regulatory switches can be advantageously combined with a construct containing a nucleic acid encoding a modified single Rep protein or a cccDNA vector prepared by the methods described herein to control the yield of the ccDNA vector. In some embodiments, a construct comprising a nucleic acid encoding a single modified Rep protein or a cccDNA vector produced by methods described herein comprises a regulatory switch that serves to fine-tune the expression of a single Rep protein or transgene in the cccDNA vector. For example, it may serve to provide a biocontainment function to the cDNA vector. In some embodiments, the switch is a “toggle” switch that is designed to start or stop (ie, stop) expression of a gene of interest in cccDNA in a controlled and regulated manner. In some embodiments, the switch may include a "kill switch" that may instruct a cell containing the cccDNA vector to initiate programmed cell death upon activation of the switch.
[00283] A. Бинарные регуляторные переключатели[00283] A. Binary Regulator Switches
[00284] Согласно некоторым вариантам реализации указанный зкДНК-вектор содержит регулятор, который может служить для контролируемой модуляции экспрессии трансгена. Согласно такому варианту реализации указанная экспрессионная кассета, локализованная между ITR зкДНК-вектора, может дополнительно содержать регуляторный участок, например, промотор, цис-элемент, репрессор, энхансер и т.п., функционально связанную с представляющим интерес геном, причем указанный регуляторный участок регулирует один или более кофакторов или экзогенных агентов. Соответственно, согласно одному варианту реализации транскрипция и экспрессия представляющего интерес гена с зкДНК-вектора будет происходить только тогда, когда в клетке присутствуют указанные один или более кофакторов или экзогенных агентов. Согласно другому варианту реализации один или более кофакторов или экзогенных агентов могут применяться для дерепрессии транскрипции и экспрессии представляющего интерес гена. [00284] In some embodiments, the cDNA vector contains a regulator that can serve to controllably modulate transgene expression. In such an embodiment, said expression cassette located between the ITRs of the cccDNA vector may further comprise a regulatory region, such as a promoter, cis-element, repressor, enhancer, etc., operably linked to the gene of interest, wherein said regulatory region regulates one or more cofactors or exogenous agents. Accordingly, in one embodiment, transcription and expression of the gene of interest from the cccDNA vector will occur only when said one or more cofactors or exogenous agents are present in the cell. In another embodiment, one or more cofactors or exogenous agents can be used to derepress transcription and expression of a gene of interest.
[00285] Любые регуляторные участки нуклеиновых кислот, известные специалисту в данной области техники, могут применяться в зкДНК-векторе, разработанном так, чтобы содержать регуляторный переключатель. В неограничивающем примере регуляторные участки могут модулировать низкомолекулярные переключатели или индуцируемые или репрессируемые промоторы. Неограничивающими примерами индуцибельных промоторов являются индуцируемые гормонами или индуцируемые металлами промоторы. Другие примеры индуцируемых промоторных/энхансерных элементов включают, не ограничиваясь перечисленными, индуцируемый RU486 промотор, индуцируемый экдизоном промотор, индуцируемый рапамицином промотор и промотор металлотионеина. Предусмотрено применение классических переключателей на основе тетрациклина или других антибиотиков, в том числе описанных в источнике: (Fussenegger et al., Nature Biotechnol. 18: 1203-1208 (2000)). [00285] Any nucleic acid regulatory regions known to one of ordinary skill in the art may be used in a cccDNA vector designed to contain a regulatory switch. In a non-limiting example, regulatory regions may modulate small molecule switches or inducible or repressible promoters. Non-limiting examples of inducible promoters are hormone inducible or metal inducible promoters. Other examples of inducible promoter/enhancer elements include, but are not limited to, the RU486 inducible promoter, the ecdysone inducible promoter, the rapamycin inducible promoter, and the metallothionein promoter. The use of classical switches based on tetracycline or other antibiotics, including those described in the source: (Fussenegger et al., Nature Biotechnol. 18: 1203-1208 (2000)) is envisaged.
[00286] B. Низкомолекулярные регуляторные переключатели[00286] B. Small Molecule Regulatory Switches
[00287] Различные известные из уровня техники регуляторные переключатели на основе малых молекул известны в данной области техники и могут быть скомбинированы с зкДНК-векторами согласно описанию в данном документе с образованием контролируемого регуляторным переключателем зкДНК-вектора. Согласно некоторым вариантам реализации указанный регуляторный переключатель может быть выбранным из чего-либо одного или из комбинации следующего: ортогональная пара лиганд/ядерный рецептор, например, вариант ретиноидного рецептора/LG335 и GRQCIMFI, наряду с искусственным промотором, контролирующим экспрессию функционально связанного трансгена, например, согласно описанию в источнике: Taylor, et al. BMC Biotechnology 10 (2010): 15; сконструированные стероидные рецепторы, например, модифицированный рецептор прогестерона с усечением на C-конце, который не способен связывать прогестерон, но связывает RU486 (мифепристон) (Патент США № 5364791); рецептор экдизона из Drosophila и их экдистероидные лиганды (Saez, et al., PNAS, 97(26)(2000), 14512-14517; или переключатель, управляемый антибиотиком триметопримом (TMP), согласно описанию в источнике: Sando R 3rd; Nat Methods. 2013, 10(11):1085-8. [00287] Various small molecule regulatory switches known in the art are known in the art and can be combined with cccDNA vectors as described herein to form a regulatory switch-controlled cccDNA vector. In some embodiments, said regulatory switch may be selected from any one or combination of the following: an orthogonal ligand/nuclear receptor pair, e.g., retinoid receptor variant/LG335 and GRQCIMFI, along with an artificial promoter controlling expression of an operably linked transgene, e.g. as described in: Taylor, et al. BMC Biotechnology 10 (2010): 15; engineered steroid receptors, such as a modified C-terminal truncated progesterone receptor that is unable to bind progesterone but binds RU486 (mifepristone) (US Patent No. 5,364,791); Drosophila ecdysone receptor and their ecdysteroid ligands (Saez, et al., PNAS, 97(26)(2000), 14512-14517; or the antibiotic trimethoprim (TMP) switch as described in Sando R 3 rd ; Nat Methods 2013, 10(11):1085-8.
[00288] Другие регуляторные переключатели на основе малых молекул, известные специалисту в данной области техники, также предусмотрены для применения для контроля трансгенной экспрессии зкДНК и включают, не ограничиваясь перечисленными, описанные в источнике: Buskirk et al., Cell; Chem and Biol., 2005; 12(2); 151-161; чувствительный к абсцизовой кислоте положительный переключатель; такой как описанный в источнике: Liang, F.-S., et al., (2011) Science Signaling, 4(164); чувствительные к экзогенному L-аргинину положительные переключатели, такие как описанные в источнике: Hartenbach, et al. Nucleic Acids Research, 35(20), 2007, синтетические чувствительные к желчным кислотам положительные переключатели, такие как описанные в источнике: Rössger et al., Metab Eng. 2014, 21: 81-90; чувствительные к биотину положительные переключатели, такие как описанные в источнике: Weber et al., Metab. Eng. 2009 Mar; 11(2): 117-124; регуляторные переключатели с двойным входным сигналом, чувствительные к пищевым добавкам бензоата/ванилина, такие как описанные в источнике: Xie et al., Nucleic Acids Research, 2014; 42(14);e116; чувствительные к 4-гидрокситамоксифену переключатели, такие как описанные в источнике: Giuseppe et al., Molecular Therapy, 6(5), 653 - 663; и чувствительные к флавоноиду (флоретину) регуляторные переключатели, такие как описанные в источнике: Gitzinger et al., Proc. Natl. Acad. Sci. U S A. 2009 Jun 30; 106(26): 10638-10643. [00288] Other small molecule regulatory switches known to one of ordinary skill in the art are also contemplated for use in controlling transgene expression of cccDNA and include, but are not limited to, those described in: Buskirk et al., Cell; Chem and Biol., 2005; 12(2); 151-161; abscisic acid sensitive positive switch; such as described in: Liang, F.-S., et al., (2011) Science Signaling, 4(164); exogenous L-arginine-sensitive positive switches, such as those described in Hartenbach, et al. Nucleic Acids Research, 35(20), 2007, synthetic bile acid-sensitive positive switches such as those described in: Rössger et al., Metab Eng. 2014, 21: 81-90; biotin-sensitive positive switches such as those described in Weber et al., Metab. Eng. Mar 2009; 11(2): 117-124; benzoate/vanillin supplement-sensitive dual input regulatory switches such as those described in Xie et al., Nucleic Acids Research, 2014; 42(14);e116; 4-hydroxytamoxifen sensitive switches such as those described in: Giuseppe et al., Molecular Therapy, 6(5), 653-663; and flavonoid (phloretin)-sensitive regulatory switches such as those described in Gitzinger et al., Proc. Natl. Acad. Sci. U S A. 2009 Jun 30; 106(26): 10638-10643.
[00289] Согласно некоторым вариантам реализации регуляторный переключатель для контроля трансгена или экспрессируемый зкДНК-вектором представляет собой переключатель для активации пролекарств, такой как описанные в патентах США 8771679 и 6339070.[00289] In some embodiments, the regulatory switch for controlling the transgene or expressed by the cccDNA vector is a switch for activating prodrugs, such as those described in US Pat. Nos. 8,771,679 and 6,339,070.
[00290] Примеры регуляторных переключателей для применения в зкДНК-векторах включают, не ограничиваясь перечисленными, представленные в Таблице 11.[00290] Examples of regulatory switches for use in cDNA vectors include, but are not limited to, those presented in Table 11.
[00291] C. Регуляторные переключатели «с кодом доступа»[00291] C. Regulatory switches "with access code"
[00292] Согласно некоторым вариантам реализации указанный регуляторный переключатель может представлять собой «переключатель с кодом доступа» или «цепь с кодом доступа». Переключатели с кодом доступа позволяют точно настроить контроль экспрессии трансгена с зкДНК-вектора при возникновении конкретных условий - то есть для реализации трансгенной экспрессии и/или репрессии должна выполняться комбинация условий. Например, для осуществления экспрессии трансгена должны возникнуть по меньшей мере условия A и B. Регуляторный переключатель с кодом доступа может требовать выполнения любого количества условий, например, для осуществления трансгенной экспрессии должны возникнуть по меньшей мере 2 условия, или по меньшей мере 3, или по меньшей мере 4, или по меньшей мере 5, или по меньшей мере 6 или по меньшей мере 7 или более условий. Согласно некоторым вариантам реализации должны возникнуть по меньшей мере 2 условия (например, условия A, B); согласно некоторым вариантам реализации должны возникнуть по меньшей мере 3 условия (например, A, B и C, или A, B и D). Согласно неограничивающему примеру для осуществления генной экспрессии с зкДНК, содержащей регуляторный переключатель с кодом доступа «ABC», должны выполняться условия A, B и C. Условия A, B и C могут быть следующими; условие A представлено наличием состояния или заболевания, условие B представляет собой гормональный ответ, а условие C представляет собой ответ на трансгенную экспрессию. В неограничивающем типичном примере, когда трансген представлен инсулином, условие A выполняется в том случае, если субъект страдает диабетом, условие B - высокий уровень сахара в крови, а условие C - уровень эндогенного инсулина при его недостаточной экспрессии. Как только уровень сахара снижается или достигается требуемый уровень инсулина, трансген (например, инсулин) «отключается» до тех пор, пока снова не возникнут указанные 3 условия, «включающие» его повторно. В другом типичном примере, в том случае, если трансген представлен EPO, условием A является наличие хронической болезни почек (ХПН), условие B выполняется при гипоксических состояниях в почках субъекта, условие C выполняется при нарушении рекрутинга эритропоэтин-продуцирующих клеток (EPC) в почках; или, как вариант, нарушении активации HIF-2. Как только повышается уровень кислорода или достигается требуемый уровень EPO, трансген (например, EPO) «отключается» до тех пор, пока снова не возникнут указанные 3 условия, «включающие» его повторно. [00292] In some embodiments, said control switch may be a "passcode switch" or a "passcode circuit." Switches with an access code allow you to fine-tune the control of transgene expression from a cDNA vector when specific conditions arise - that is, a combination of conditions must be met to implement transgene expression and/or repression. For example, for transgene expression to occur, at least conditions A and B must occur. A regulatory access code switch may require any number of conditions to occur, for example, at least 2 conditions, or at least 3, or either must occur for transgene expression to occur. at least 4, or at least 5, or at least 6, or at least 7 or more conditions. In some embodiments, at least 2 conditions must occur (eg, conditions A, B); in some embodiments, at least 3 conditions must occur (eg, A, B, and C, or A, B, and D). According to a non-limiting example, to perform gene expression with cccDNA containing a regulatory switch with access code "ABC", conditions A, B and C must be met. Conditions A, B and C may be as follows; condition A represents the presence of a condition or disease, condition B represents a hormonal response, and condition C represents a response to transgene expression. In a non-limiting exemplary example, where the transgene is insulin, condition A is satisfied if the subject has diabetes, condition B is high blood sugar, and condition C is the level of endogenous insulin when it is underexpressed. Once the sugar level drops or the required insulin level is reached, the transgene (eg insulin) is “turned off” until the above 3 conditions occur again, “turning it on” again. In another typical example, if the transgene is EPO, condition A is the presence of chronic kidney disease (CKD), condition B is satisfied under hypoxic conditions in the subject's kidneys, condition C is satisfied when the recruitment of erythropoietin-producing cells (EPC) to the kidneys is impaired ; or, alternatively, impaired HIF-2 activation. Once the oxygen level rises or the required EPO level is reached, the transgene (eg EPO) is "turned off" until the above 3 conditions occur again to "turn it on" again.
[00293] Регуляторные переключатели с кодом доступа подходят для точной настройки экспрессии трансгена с зкДНК-вектора. Например, регуляторный переключатель с кодом доступа может быть модульным, то есть он содержит несколько переключателей, например, тканеспецифический индуцируемый промотор, который включается только в присутствии определенного уровня метаболита. Согласно такому варианту реализации для осуществления трансгенной экспрессии с зкДНК-вектора индуцируемый агент должен присутствовать (условие A) в клетках требуемого типа (условие B), а уровень метаболита должен быть равен, быть выше или быть ниже определенного порогового значения (условие C). Согласно альтернативным вариантам реализации указанный регуляторный переключатель с кодом доступа может быть разработан таким образом, чтобы трансгенная экспрессия «включалась» при выполнении условий A и B, но «выключалась» при выполнении условия C. Такой вариант реализации полезен, когда выполнение условия C является прямым результатом экспрессии трансгена - то есть условие C используется в качестве положительной обратной связи для отключения трансгенной экспрессии с зкДНК-вектора, после того как указанный трансген оказал достаточный требуемый терапевтический эффект. [00293] Access code regulatory switches are suitable for fine tuning transgene expression from a cccDNA vector. For example, a passcode regulatory switch may be modular, that is, it contains multiple switches, such as a tissue-specific inducible promoter that is turned on only in the presence of a certain level of a metabolite. In this embodiment, to achieve transgene expression from a cccDNA vector, the inducible agent must be present (condition A) in the desired cell type (condition B), and the level of the metabolite must be equal to, above, or below a certain threshold value (condition C). In alternative embodiments, said regulatory passcode switch may be designed such that transgene expression is "on" when conditions A and B are met, but "off" when condition C is met. This embodiment is useful when meeting condition C is a direct result expression of the transgene - that is, condition C is used as positive feedback to turn off transgene expression from the cccDNA vector after said transgene has had sufficient of the desired therapeutic effect.
[00294] Согласно некоторым вариантам реализации регуляторный переключатель с кодом доступа, предусмотренный для применения в зкДНК-векторе, раскрыт в WO2017/059245, содержание которой полностью включено в данный документ посредством ссылки, в которой описан переключатель, называемый «переключателем с кодом доступа» («Passcode switch») или «цепью с кодом доступа» («Passcode circuit») или «аварийным выключателем с кодом доступа» («Passcode kill switch»), который представляет собой синтетическую биологическую цепь, задействующую гибридные транскрипционные факторы (ТФ) для конструирования комплексных требований к условиям среды для выживания клеток. Регуляторные переключатели с кодом доступа описанные в WO2017/059245, в частности, подходят для применения в зкДНК-векторах, поскольку являются модульными и настраиваемыми, как в отношении условий окружающей среды, контролирующих активацию цепи, так и в отношении выходных модулей, контролирующих судьбу клеток. Кроме того, в частности, «цепь с кодом доступа» подходит для применения в зкДНК-векторах, так как без надлежащих молекул «кода доступа» он позволяет трансгенной экспрессии происходить только при выполнении необходимых заранее заданных условий. В том случае, если с клеткой произойдет что-либо непредусмотренное или по какой-то причине больше не будет нужна трансгенная экспрессия, может быть запущен соответствующий «аварийный выключатель» (т.е. переключатель-блокатор). [00294] In some embodiments, a passcode regulatory switch for use in a cccDNA vector is disclosed in WO2017/059245, the contents of which are incorporated herein by reference in their entirety, which describes a switch called a “passcode switch” ( "Passcode switch" or "Passcode circuit" or "Passcode kill switch", which is a synthetic biological circuit that uses hybrid transcription factors (TFs) to construct complex requirements for environmental conditions for cell survival. The access code regulatory switches described in WO2017/059245 are particularly suitable for use in cccDNA vectors because they are modular and tunable, both in terms of the environmental conditions that control circuit activation and the output modules that control cell fate. In addition, the access code strand in particular is suitable for use in cccDNA vectors because, without proper access code molecules, it allows transgene expression to occur only when the necessary predefined conditions are met. In the event that something unexpected happens to the cell, or for some reason transgene expression is no longer needed, an appropriate “safety switch” (i.e., blocking switch) can be activated.
[00295] Согласно некоторым вариантам реализации регуляторный переключатель с кодом доступа или «цепь с кодом доступа», предусмотренный для применения в зкДНК-векторе, содержит гибридные транскрипционные факторы (ТФ) для расширения диапазона и сложности сигналов среды, используемых для задания условий биологического сдерживания. В отличие от переключателя-блокатора, который запускает клеточную смерть при выполнении заранее заданного условия, «цепь с кодом доступа» обеспечивает выживание клеток или трансгенную экспрессию в присутствии конкретного «кода доступа» и может быть легко перепрограммирована, чтобы обеспечивать трансгенную экспрессию и/или выживание клеток только при выполнении заранее заданного условия среды или присутствии кода доступа.[00295] In some embodiments, a passcode regulatory switch or “passcode circuit” provided for use in a cccDNA vector comprises hybrid transcription factors (TFs) to expand the range and complexity of environmental signals used to set biocontainment conditions. Unlike a blocking switch, which triggers cell death when a predetermined condition is met, a passcode circuit ensures cell survival or transgene expression in the presence of a specific passcode and can be easily reprogrammed to allow transgene expression and/or survival cells only when a predetermined environmental condition is met or an access code is present.
[00296] Согласно одному аспекту система «с кодом доступа», которая ограничивает рост клеток присутствием заранее заданного набора из по меньшей мере двух выбранных агентов, включает одну или более конструктов нуклеиновых кислот, кодирующих модули экспрессии, включающие: i) модуль экспрессии токсина, который кодирует токсин, токсичный для клетки-хозяина, отличающийся тем, что последовательность, кодирующая токсин, функционально связана с промотором P1, репрессия которого происходит при связывании первого гибридного репрессорного белка hRP1; ii) модуль экспрессии первого гибридного репрессорного белка, который кодирует первый гибридный репрессорный белок hRP1, отличающийся тем, что экспрессию hRP1 контролирует логический И-элемент, образуемый двумя гибридными транскрипционными факторами hTF1 и hTF2, связывание или активность которых зависят от агентов A1 и A2, соответственно, таким образом, что для экспрессии hRP1 необходимы оба агента A1 и A2, при этом в отсутствие A1 или A2 экспрессия hRP1 недостаточна для репрессии модуля промотора токсина P1 и продуцирования токсина, так что клетка-хозяин погибает. В указанной системе все гибридные факторы, hTF1, hTF2 и hRP1, содержат чувствительный к среде модуль из одного транскрипционного фактора и модуль распознавания ДНК из другого транскрипционного фактора, что делает связывание соответствующего регуляторного переключателя с кодом доступа чувствительным к присутствию агента среды, A1 или A2, который отличается от агента, с которым соответствующие субъединицы обычно связываются в природе. [00296] In one aspect, a passcode system that restricts cell growth to the presence of a predetermined set of at least two selected agents includes one or more nucleic acid constructs encoding expression modules, including: i) a toxin expression module that encodes a toxin that is toxic to the host cell, characterized in that the sequence encoding the toxin is functionally linked to the P1 promoter, the repression of which occurs upon binding of the first hybrid repressor protein hRP1; ii) an expression module of the first hybrid repressor protein, which encodes the first hybrid repressor protein hRP1, characterized in that the expression of hRP1 is controlled by a logical AND element formed by two hybrid transcription factors hTF1 and hTF2, the binding or activity of which depends on agents A1 and A2, respectively , such that both agents A1 and A2 are required for hRP1 expression, and in the absence of A1 or A2, hRP1 expression is insufficient to repress the P1 toxin promoter module and produce toxin, such that the host cell dies. In this system, the hybrid factors, hTF1, hTF2 and hRP1, all contain an environment-sensitive module from one transcription factor and a DNA recognition module from another transcription factor, which makes the binding of the corresponding regulatory switch to the access code sensitive to the presence of an environment agent, A1 or A2, which is different from the agent to which the corresponding subunits typically bind in nature.
[00297] Соответственно, зкДНК-вектор может содержать «регуляторную цепь с кодом доступа», которая требует присутствия и/или отсутствия конкретных молекул для активации выходного модуля. Согласно некоторым вариантам реализации в тех случаях, когда гены, кодирующие клеточные токсины, помещают в выходной модуль, указанная регуляторная цепь с кодом доступа может быть использована не только для регуляции трансгенной экспрессии, но и для создания механизма «аварийного выключателя», в котором цепь убивает клетку в том случае, если указанная клетка ведет себя нежелательным образом (например, покидает конкретную среду, определяемую сенсорными доменами, или дифференцирует в клетку другого типа). В одном неограничивающем примере модульная структура гибридных транскрипционных факторов, архитектура цепи и выходной модуль позволяют переконфигурировать цепь для восприятия других сигналов среды, реакции на сигналы среды иным образом и контроля других функций в клетке, наряду с индуцируемой клеточной смертью, как известно в данной области техники.[00297] Accordingly, the cccDNA vector may contain a “passcode regulatory circuit” that requires the presence and/or absence of specific molecules to activate the output module. In some embodiments, when genes encoding cellular toxins are placed in an output module, the access coded regulatory circuit can be used not only to regulate transgene expression, but also to create a "safety switch" mechanism in which the circuit kills cell if the specified cell behaves in an undesirable manner (for example, leaves a particular environment defined by sensory domains, or differentiates into a different cell type). In one non-limiting example, the modular structure of hybrid transcription factors, circuit architecture, and output module allow the circuit to be reconfigured to sense other environmental signals, respond to environmental signals in a different manner, and control other functions in the cell, along with inducible cell death, as is known in the art.
[00298] Для регуляторного переключателя с кодом доступа согласно описанию в данном документе могут применяться любые комбинации регуляторных переключателей согласно описанию в данном документе, например, низкомолекулярные переключатели, переключатели на основе нуклеиновых кислот, гибридные переключатели на основе малых молекул и нуклеиновых кислот, переключатели для посттранскрипционной регуляции трансгенов, посттрансляционные регуляторы, контролируемые излучением переключатели, опосредованные гипоксией переключатели и другие регуляторные переключатели, известные специалистам в данной области техники. Регуляторные переключатели, предусмотренные для применения, также описаны в обзорной статье Kis et al., J R Soc Interface. 12: 20141000 (2015), и обобщены в Таблице 1 указанной статьи. В некоторых вариантах реализации регуляторный переключатель для применения в системе с паролем может быть выбран из любых переключателей, приведенных в Таблице 11, или их комбинации.[00298] For a regulatory switch with an access code as described herein, any combination of regulatory switches as described herein can be used, for example, small molecule switches, nucleic acid-based switches, small molecule-nucleic acid hybrid switches, post-transcriptional switches transgene regulation, post-translational regulators, radiation-controlled switches, hypoxia-mediated switches, and other regulatory switches known to those skilled in the art. The control switches provided for the application are also described in the review article Kis et al., J R Soc Interface. 12: 20141000 (2015), and are summarized in Table 1 of the cited article. In some embodiments, the control switch for use in a password system may be selected from any of the switches shown in Table 11 or a combination thereof.
[00299] D. Регуляторные переключатели на основе нуклеиновых кислот для контроля трансгенной экспрессии.[00299] D. Nucleic acid-based regulatory switches to control transgene expression.
[00300] Согласно некоторым вариантам реализации регуляторный переключатель для контроля трансгена, экспрессируемого зкДНК, основан на механизме контроля на основе нуклеиновых кислот. Примеры механизмов контроля на основе нуклеиновых кислот известны в данной области техники и предусмотрены для применения. Например, такие механизмы включают рибопереключатели, такие как описанные, например, в US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, патенте США US 9222093 и заявке EP288071, все из которых полностью включены в данный документ посредством ссылки, а также раскрыты в обзорной работе Villa JK et al., Microbiol Spectr. 2018 May; 6 (3), содержание которой полностью включено в данный документ посредством ссылки. Также включены транскрипционные биосенсоры, отвечающие на метаболиты, такие как описанные в источнике: WO2018/075486 и WO2017/147585, содержание которой полностью включено в данный документ посредством ссылки. Другие известные в данной области техники механизмы, предусмотренные для применения, включают сайленсинг трансгена с помощью молекулы миРНК или РНКи (например, miR, мшРНК). Например, зкДНК-вектор может содержать регуляторный переключатель, который кодирует молекулу РНКи, комплементарную трансгену, экспрессируемому зкДНК-вектором. При экспрессии такой РНКи даже в том случае, когда зкДНК-вектор экспрессирует трансген, будет происходить его сайленсинг под действием комплементарной молекулы РНКи, а если РНКи не экспрессируется при экспрессии трансгена зкДНК-вектором, сайленсинг трансгена под действием РНКи не происходит. Такой пример молекулы РНКи, контролирующей генную экспрессию, или используемой в качестве регуляторного переключателя, описан в US2017/0183664. Согласно некоторым вариантам реализации указанный регуляторный переключатель содержит репрессор, который блокирует экспрессию трансгена с зкДНК-вектора. Согласно некоторым вариантам реализации указанный положительный/отрицательный переключатель представляет собой переключатель на основе малой активирующей транскрипцию РНК («Small transcription activating RNA», STAR), например, такую как описанная в источниках: Chappell J. et al., Nat Chem Biol. 2015 Mar;11(3):214-20; и Chappell et al., Microbiol Spectr. 2018 May;6(3). Согласно некоторым вариантам реализации указанный регуляторный переключатель представляет собой переключатель типа «toehold», такой как описанный в источниках: US2009/0191546, US2016/0076083, WO2017/087530, US2017/0204477, WO2017/075486 и Green et al, Cell, 2014; 159(4); 925-939 все из которых полностью включены в данный документ посредством ссылки.[00300] In some embodiments, the regulatory switch for controlling the transgene expressed by the cccDNA is based on a nucleic acid-based control mechanism. Examples of nucleic acid-based control mechanisms are known in the art and are contemplated for use. For example, such mechanisms include riboswitches such as those described, for example, in US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, US patent US 9222093 and application EP288071, all of which are incorporated herein by reference in their entirety and also disclosed in the review work by Villa JK et al., Microbiol Spectr. May 2018; 6(3), the contents of which are incorporated herein by reference in their entirety. Also included are transcriptional biosensors that respond to metabolites, such as those described in reference: WO2018/075486 and WO2017/147585, the contents of which are incorporated herein by reference in their entirety. Other mechanisms known in the art for use include transgene silencing using an miRNA or RNAi molecule (eg, miR, shRNA). For example, the cccDNA vector may contain a regulatory switch that encodes an RNAi molecule complementary to the transgene expressed by the cccDNA vector. When such RNAi is expressed, even if the cDNA vector expresses the transgene, its silencing will occur under the action of a complementary RNAi molecule, and if RNAi is not expressed when the transgene is expressed by the cDNA vector, silencing of the transgene under the influence of RNAi will not occur. Such an example of an RNAi molecule controlling gene expression, or used as a regulatory switch, is described in US2017/0183664. In some embodiments, the regulatory switch comprises a repressor that blocks expression of the transgene from the cccDNA vector. In some embodiments, the positive/negative switch is a small transcription activating RNA (STAR) switch, such as those described in Chappell J. et al., Nat Chem Biol. 2015 Mar;11(3):214-20; and Chappell et al., Microbiol Spectr. 2018 May;6(3). In some embodiments, the control switch is a toehold switch such as those described in US2009/0191546, US2016/0076083, WO2017/087530, US2017/0204477, WO2017/075486 and Green et al, Cell, 2014; 159(4); 925-939, all of which are incorporated herein by reference in their entirety.
[00301] Согласно некоторым вариантам реализации указанный регуляторный переключатель представляет собой тканеспецифический самоинактивирующийся регуляторный переключатель, например, согласно описанию в US2002/0022018, отличающийся тем, что он преднамеренно отключает трансгенную экспрессию в сайте, где в противном случае трансгенная экспрессия могла бы быть неблагоприятной. Согласно некоторым вариантам реализации регуляторный переключатель представляет собой обратимую с помощью рекомбиназы систему генной экспрессии, например, согласно описанию в US2014/0127162 и патенте США 8324436. [00301] In some embodiments, said regulatory switch is a tissue-specific self-inactivating regulatory switch, for example, as described in US2002/0022018, characterized in that it deliberately disables transgene expression at a site where transgene expression would otherwise be detrimental. In some embodiments, the regulatory switch is a recombinase-reversible gene expression system, for example, as described in US2014/0127162 and US Pat. No. 8,324,436.
[00302] Согласно некоторым вариантам реализации регуляторный переключатель для контроля представляющего интерес трансгена или гена, экспрессируемого зкДНК-вектором, представляет собой гибрид механизма контроля на основе нуклеиновых кислот и низкомолекулярной регуляторной системы. Такие системы хорошо известны специалистам в данной области техники и предусмотрены для применения в данном документе. Примеры таких регуляторных переключателей включают, не ограничиваясь перечисленными, систему LTRi или систему «Lac-Tet-RNAi», например, согласно описанию в источниках: US2010/0175141, Deans T. et al., Cell., 2007, 130(2); 363-372, WO2008/051854 и патент США 9388425.[00302] In some embodiments, the regulatory switch for controlling a transgene of interest or a gene expressed by a cccDNA vector is a hybrid of a nucleic acid-based control mechanism and a small molecule regulatory system. Such systems are well known to those skilled in the art and are provided for use herein. Examples of such regulatory switches include, but are not limited to, the LTRi system or the Lac-Tet-RNAi system, for example, as described in US2010/0175141, Deans T. et al., Cell., 2007, 130(2); 363-372, WO2008/051854 and US Patent 9388425.
[00303] Согласно некоторым вариантам реализации регуляторный переключатель для контроля представляющего интерес трансгена или гена, экспрессируемого зкДНК-вектором, включает циклическую перестановку согласно описанию в патенте США 8338138. Согласно такому варианту реализации указанный молекулярный переключатель является мультистабильным, т.е. способен переключаться между по меньшей мере двумя состояниями, или, как вариант, бистабильным, т.е. находится либо в "выключенном", либо во "включенном" состоянии, например, способен или неспособен испускать свет, способен или неспособен связываться, способен или неспособен катализировать, способен или неспособен переносить электроны, и так далее. Согласно другому аспекту, в молекулярном переключателе используют слитую молекулу, за счет чего указанный переключатель способен переключаться между более чем двумя состояниями. Например, в ответ на конкретное пороговое состояние, демонстрируемое вставочной последовательностью или акцепторной последовательностью, соответствующая другая последовательность слитой молекулы может демонстрировать диапазон состояний (например, диапазон связывающей активности, диапазон ферментного катализа и т.п.). Соответственно, вместо переключения между «включенным» и «выключенным» состоянием слитая молекула может демонстрировать дифференцированный ответ на стимул. [00303] In some embodiments, a regulatory switch for controlling a transgene of interest or a gene expressed by a cccDNA vector includes cycling as described in US Pat. No. 8,338,138. In such an embodiment, the molecular switch is multistable, i.e. capable of switching between at least two states, or alternatively bistable, i.e. is either in an "off" or "on" state, such as being able or unable to emit light, able or unable to bind, able or unable to catalyze, able or unable to transfer electrons, and so on. According to another aspect, the molecular switch uses a fusion molecule, whereby the switch is capable of switching between more than two states. For example, in response to a particular threshold state exhibited by an insertion sequence or an acceptor sequence, a corresponding other fusion molecule sequence may exhibit a range of states (eg, a range of binding activity, a range of enzyme catalysis, etc.). Accordingly, rather than switching between an “on” and “off” state, the fusion molecule may exhibit a differential response to a stimulus.
[00304] Согласно некоторым вариантам реализации регуляторный переключатель на основе нуклеиновой кислоты может быть выбран из любого переключателя или комбинации переключателей из Таблицы 11.[00304] In some embodiments, the nucleic acid regulatory switch may be selected from any switch or combination of switches from Table 11.
[00305] E. Посттранскрипционный и посттрансляционные регуляторные переключатели.[00305] E. Post-transcriptional and post-translational regulatory switches.
[00306] Согласно некоторым вариантам реализации регуляторный переключатель для контроля представляющего интерес трансгена или гена, экспрессируемого зкДНК-вектором, представляет собой систему посттранскрипционной модификации. Например, такой регуляторный переключатель может представлять собой аптазимный рибопереключатель, чувствительный к тетрациклину или теофиллину, согласно описанию в US2018/0119156, GB201107768, WO2001/064956A3, патенте EP 2707487 и Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et al., Elife. 2016 Nov 2;5. pii: e18858. Согласно некоторым вариантам реализации предполагается, что специалист в данной области техники может закодировать как трансген, так и ингибиторную киРНК, которая содержит чувствительный к лиганду аптамер (отрицательный переключатель), в результате чего будет сформирован положительный переключатель, чувствительный к лиганду.[00306] In some embodiments, the regulatory switch for controlling a transgene of interest or a gene expressed by a cccDNA vector is a post-transcriptional modification system. For example, such a regulatory switch may be an aptazyme riboswitch sensitive to tetracycline or theophylline, as described in US2018/0119156, GB201107768, WO2001/064956A3, EP 2707487 and Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et al., Elife. 2016 Nov 2;5. pii: e18858. In some embodiments, it is contemplated that one skilled in the art can encode both the transgene and an inhibitory siRNA that contains a ligand-sensitive aptamer (negative switch), thereby generating a positive ligand-sensitive switch.
[00307] Согласно некоторым вариантам реализации регуляторный переключатель для контроля представляющего интерес трансгена или гена, экспрессируемого зкДНК-вектором, представляет собой систему посттрансляционной модификации. Согласно альтернативным вариантам реализации представляющий интерес ген или белок экспрессируется в виде пропротеина или пре-пропротеина, или содержит сигнальный элемент ответа (SRE) или дестабилизирующий домен (DD), присоединенный к экспрессируемому белку, что предотвращает корректную укладку и/или активность белка до тех пор, пока не произойдет посттрансляционная модификация. В случае дестабилизирующего домена (DD) или SRE указанный дестабилизирующий домен посттрансляционно расщепляется в присутствии экзогенного агента или малой молекулы. Специалист в данной области техники сможет использовать такие способы контроля согласно описанию в патенте США 8173792 и заявке PCT WO2017180587. Другие переключатели посттранскрипционного контроля, предусмотренные для применения в зкДНК-векторе для контроля активности функционального трансгена, раскрыты в источниках: Rakhit et al., Chem Biol. 2014; 21 (9): 1238-52 и Navarro et al., ACS Chem Biol. 2016; 19; 11 (8): 2101-2104A.[00307] In some embodiments, the regulatory switch for controlling a transgene of interest or a gene expressed by a cccDNA vector is a post-translational modification system. In alternative embodiments, the gene or protein of interest is expressed as a proprotein or pre-proprotein, or contains a signal response element (SRE) or destabilizing domain (DD) attached to the expressed protein, which prevents the correct folding and/or activity of the protein until until post-translational modification occurs. In the case of a destabilizing domain (DD) or SRE, said destabilizing domain is post-translationally cleaved in the presence of an exogenous agent or small molecule. One skilled in the art will be able to use such control methods as described in US Pat. No. 8,173,792 and PCT Application WO2017180587. Other post-transcriptional control switches provided for use in a cccDNA vector to control the activity of a functional transgene are disclosed in: Rakhit et al., Chem Biol. 2014; 21 (9): 1238-52 and Navarro et al., ACS Chem Biol. 2016; 19; 11 (8): 2101-2104A.
[00308] Согласно некоторым вариантам реализации регуляторный переключатель для контроля представляющего интерес трансгена или гена, экспрессируемого зкДНК-вектором, представляет собой систему посттрансляционной модификации, которая встраивает чувствительные к лиганду интеины в кодирующую последовательность трансгена таким образом, чтобы указанный трансген или экспрессируемый белок оставался ингибированным до сплайсинга. Например, это было продемонстрировано с применением 4-гидрокситамоксифена и тиреоидного гормона (см., например, патенты США 7541450, 9200045; 7192739, Buskirk, et al, Proc Natl Acad Sci U S A. 2004 Jul 20; 101(29): 10505-10510; ACS Synth Biol. 2016 Dec 16; 5(12): 1475-1484; и 2005 Feb; 14(2): 523-532. Согласно некоторым вариантам реализации посттранскрипционный регуляторный переключатель может быть выбран из любого переключателя или их комбинации из Таблицы 11.[00308] In some embodiments, the regulatory switch for controlling a transgene of interest or a gene expressed by a cccDNA vector is a post-translational modification system that inserts ligand-responsive inteins into the coding sequence of the transgene such that the transgene or expressed protein remains inhibited until splicing. For example, this has been demonstrated using 4-hydroxytamoxifen and thyroid hormone (see, for example, US Patents 7541450, 9200045; 7192739, Buskirk, et al, Proc Natl Acad Sci U S A. 2004 Jul 20; 101(29): 10505- 10510; ACS Synth Biol. 2016 Dec 16; 5(12): 1475-1484; and 2005 Feb; 14(2): 523-532. In some embodiments, the post-transcriptional regulatory switch may be selected from any switch or combination thereof from Table eleven.
[00309] F. Другие примеры регуляторных переключателей[00309] F. Other Examples of Regulatory Switches
[00310] Любой известный регуляторный переключатель может быть использован в зкДНК-векторе для контроля генной экспрессии трансгена, экспрессируемого зкДНК-вектором, включая переключатели, запускаемые изменениями окружающей среды. Дополнительные примеры включают, не ограничиваясь перечисленными: метод BOC Сузуки и соавторов (Suzuki et al., Scientific Reports 8; 10051 (2018)); расширение генетического кода и нефизиологическая аминокислота; управляемые излучением или ультразвуком положительные/отрицательные переключатели (см., например, Scott S et al., Gene Ther. 2000 Jul;7(13):1121-5; патенты США 5612318; 5571797; 5770581; 5817636; и WO1999/025385A1). Согласно некоторым вариантам реализации указанный регуляторный переключатель контролирует имплантируемая система, например, согласно патенту США 7840263; US2007/0190028A1, где генную экспрессию контролирует одна или более форм энергии, в том числе электромагнитная энергия, которая активирует промоторы, функционально связанные с трансгеном в зкДНК-векторе.[00310] Any known regulatory switch can be used in a cccDNA vector to control gene expression of a transgene expressed by the cccDNA vector, including switches triggered by environmental changes. Additional examples include, but are not limited to: Suzuki et al.'s BOC method (Suzuki et al., Scientific Reports 8; 10051 (2018)); genetic code expansion and non-physiological amino acid; radiation or ultrasound controlled positive/negative switches (see, for example, Scott S et al., Gene Ther. 2000 Jul;7(13):1121-5; US patents 5612318; 5571797; 5770581; 5817636; and WO1999/025385A1) . In some embodiments, said regulatory switch is controlled by an implantable system, such as US Pat. No. 7,840,263; US2007/0190028A1, where gene expression is controlled by one or more forms of energy, including electromagnetic energy, which activates promoters operably linked to the transgene in the cDNA vector.
[00311] Согласно некоторым вариантам реализации регуляторный переключатель, предусмотренный для применения в зкДНК-векторе, представляет собой опосредуемый гипоксией или активируемый стрессом переключатель, например, такой как описанные в источниках: WO1999060142A2, патенты США 5834306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, а также элементы FROG, TOAD и NRSE и индуцируемые условиями элементы сайленсинга, в том числе элементы ответа на гипоксию (HRE), элементы ответа на воспаление (IRE) и активируемые сдвиговым напряжением элементы (SSAE), например, согласно описанию в патенте США 9394526. Такой вариант реализации подходит для "включения" экспрессии трансгена с зкДНК-вектора после ишемии или в ишемических тканях и/или в опухолях.[00311] In some embodiments, the regulatory switch provided for use in the cccDNA vector is a hypoxia-mediated or stress-activated switch, such as those described in WO1999060142A2, US Pat. No. 5,834,306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, as well as FROG, TOAD and NRSE elements and condition-inducible silencing elements, including hypoxia response elements (HRE), inflammatory response elements (IRE) and shear-activated voltage elements (SSAE), for example, as described in US Pat. No. 9,394,526. This embodiment is suitable for “switching on” transgene expression from a cDNA vector after ischemia or in ischemic tissues and/or tumors.
[00312] Согласно некоторым вариантам реализации регуляторный переключатель, предусмотренный для применения в зкДНК-векторе, представляет собой оптогенетический (например, контролируемый светом) регуляторный переключатель, например, такой как один из переключателей, которые рассмотрены в источнике: Poleskaya et al., BMC Neurosci. 2018; 19 (Suppl 1): 12, и также предусмотрены для применения согласно данному изобретению. Согласно таким вариантам реализации зкДНК-вектор может содержать генетические элементы, которые являются светочувствительными и могут регулировать трансгенную экспрессию в ответ на свет в видимом диапазоне длин волн (например, синий свет, ближняя ИК-область спектра). зкДНК-векторы, содержащие оптогенетические регуляторные переключатели, подходят для экспрессии трансгена в местоположениях в организме, доступных для таких источников света, например, в коже, глазах, мышцах и т.п., и могут также быть использованы при экспрессии зкДНК-векторов во внутренних органах и тканях, куда световой сигнал может быть доставлен подходящим способом (например, с помощью имплантируемого устройства согласно описанию в данном документе). Такие оптогенетические регуляторные переключатели включают применение светочувствительных элементов или индуцируемых светом транскрипционных эффекторов (LITE) (например, согласно описанию в 2014/0287938), системы Light-On (например, согласно описанию в источнике: Wang et al., Nat Methods. 2012 Feb 12;9(3):266-9); которая, как сообщалось, позволяет in vivo контролировать экспрессию трансгена инсулина, системы Cry2/CIB1 (например, согласно описанию в источнике: Kennedy et al., Nature Methods; 7, 973-975 (2010); и системы FKF1/GIGANTEA (например, согласно описанию в источнике: Yazawa et al., Nat Biotechnol. 2009 Oct;27(10):941-5).[00312] In some embodiments, the regulatory switch provided for use in the cccDNA vector is an optogenetic (eg, light-controlled) regulatory switch, such as one of the switches discussed in: Poleskaya et al., BMC Neurosci . 2018; 19 (Suppl 1): 12, and are also provided for use according to this invention. In such embodiments, the cccDNA vector may contain genetic elements that are light-sensitive and can regulate transgene expression in response to light in the visible wavelength range (eg, blue light, near-infrared). cccDNA vectors containing optogenetic regulatory switches are suitable for transgene expression in locations in the body accessible to such light sources, such as skin, eyes, muscles, etc., and can also be used to express cccDNA vectors in internal organs and tissues where the light signal can be delivered in a suitable manner (for example, using an implantable device as described herein). Such optogenetic regulatory switches include the use of light-sensitive elements or light-inducible transcription effectors (LITEs) (eg, as described in 2014/0287938), the Light-On system (eg, as described in Wang et al., Nat Methods. 2012 Feb 12 ;9(3):266-9); which has been reported to allow in vivo control of insulin transgene expression, the Cry2/CIB1 system (eg, as described in Kennedy et al., Nature Methods; 7, 973-975 (2010); and the FKF1/GIGANTEA system (eg, as described in: Yazawa et al., Nat Biotechnol. 2009 Oct;27(10):941-5).
[00313] G. «Аварийные выключатели»[00313] G. "Emergency Switches"
[00314] Другие варианты реализации данного изобретения относятся к зкДНК-вектору, содержащему «аварийный выключатель». «Аварийный выключатель» согласно описанию в данном документе позволяет убить клетку, содержащую указанный зкДНК-вектор, или обеспечить ее программируемую клеточную смерть в качестве способа окончательного удаления введенного зкДНК-вектора из системы субъекта. Специалисту в данной области техники будет понятно, что применение «аварийных выключателей» в зкДНК-векторах согласно данному изобретению, как правило, сопряжено с нацеливанием зкДНК-вектора на ограниченное число клеток, потеря которого является приемлемой для субъекта, или на тип клеток, апоптоз которых желателен (например, на раковые клетки). Во всех аспектах «аварийный выключатель» согласно описанию в данном документе разработан таким образом, чтобы обеспечить быстрый и надежный киллинг клетки, содержащей зкДНК-вектор, в отсутствие входящего сигнала выживания или другого заданного условия. Другими словами, «аварийный выключатель», кодируемый зкДНК-вектором согласно данному документу, может ограничивать выживание клетки, содержащей зкДНК-вектор, средой, задаваемой специфическими входными сигналами. Такие «аварийные выключатели» служат для обеспечения функции биологического сдерживания, если требуется либо удалить зкДНК-вектор из субъекта, либо обеспечить отсутствие экспрессии с него кодируемого трансгена. Соответственно, «аварийные выключатели» представляют собой синтетические биологические цепи в зкДНК-векторе, сопрягающие сигналы внешней среды с обусловленным выживанием клетки, содержащей указанный зкДНК-вектор. Согласно некоторым вариантам реализации разные зкДНК-векторы может быть разработаны так, что они имеют разные «аварийные выключатели». Это обеспечивает возможность контролировать, киллинг каких клеток, экспрессирующих трансген, происходит при использовании коктейлей зкДНК-векторов. [00314] Other embodiments of the present invention provide a cccDNA vector containing a "kill switch". A “kill switch” as described herein allows the cell containing the specified cccDNA vector to be killed or undergo programmed cell death as a means of permanently removing the introduced cccDNA vector from the subject's system. One skilled in the art will appreciate that the use of "kill switches" in the cccDNA vectors of this invention typically involves targeting the cccDNA vector to a limited number of cells that the subject can tolerate losing, or to a cell type that is apoptotic. desirable (for example, on cancer cells). In all aspects, the "kill switch" as described herein is designed to provide rapid and reliable killing of a cell containing the cccDNA vector in the absence of an incoming survival signal or other specified condition. In other words, the "safety switch" encoded by the cccDNA vector herein may limit the survival of the cell containing the cccDNA vector to an environment defined by specific input signals. Such "kill switches" serve to provide a biological containment function if it is necessary to either remove the cccDNA vector from a subject or ensure that it does not express the encoded transgene. Accordingly, “kill switches” are synthetic biological circuits in the cDNA vector that couple environmental signals to the conditional survival of the cell containing said cDNA vector. In some embodiments, different cDNA vectors may be designed to have different "kill switches". This provides the ability to control which cells expressing the transgene are killed when using cocktails of cccDNA vectors.
[00315] Согласно некоторым вариантам реализации зкДНК-вектор может содержать «аварийный выключатель», который представляет собой модульную цепь биологического сдерживания. Согласно некоторым вариантам реализации «аварийный выключатель», предусмотренный для применения в зкДНК-векторе, описан в WO2017/059245, где описан переключатель, называемый «аварийным блокиратором», который содержит по меньшей мере две репрессируемые последовательности, расположенные взаимно ингибирующим образом, так что сигнал окружающей среды репрессирует активность второй молекулы в конструкте (например, связывающий малые молекулы транскрипционный фактор используют, чтобы обеспечить состояние «выживания» за счет репрессии продуцирования токсина). В клетках, содержащих зкДНК-вектор, содержащий «аварийный блокиратор», после потери сигнала окружающей среды цепь окончательно переключается в состояние «блокировки», при котором происходит дерепрессия токсина, приводящая к продуцированию токсина, что убивает клетку. Согласно другому варианту реализации предложена синтетическая биологическая цепь, называемая «цепью с кодом доступа» или «аварийным выключателем с кодом доступа», где использованы гибридные транскрипционные факторы (ТФ) для конструирования комплексных требований к условиям среды для выживания клеток. «Аварийные блокираторы» и «аварийные выключатели с кодом доступа», описанные в WO2017/059245, в частности, подходят для применения в зкДНК-векторах, поскольку они являются модульными и настраиваемыми, как в отношении условий окружающей среды, контролирующих активацию цепи, так и в отношении выходных модулей, контролирующих судьбу клеток. При правильном подборе токсинов, которые включают, не ограничиваясь указанным, эндонуклеазу, например, EcoRI, «цепи с кодами доступа», присутствующие в зкДНК-векторе, которые можно применять не только для уничтожения клетки-хозяина, содержащей вектор зкДНК, но также для разрушения ее генома и сопутствующих плазмид.[00315] In some embodiments, the cccDNA vector may comprise a “kill switch” that is a modular biological containment circuit. In some embodiments, a "safety switch" provided for use in a cccDNA vector is described in WO2017/059245, which describes a switch called a "safety switch" that contains at least two repressible sequences arranged in a mutually inhibitory manner such that the signal environment represses the activity of the second molecule in the construct (eg, a small molecule binding transcription factor is used to promote a "survival" state by repressing toxin production). In cells containing a cccDNA vector containing a "safety blocker", after loss of the environmental signal, the circuit finally switches to a "blocked" state in which derepression of the toxin occurs, leading to the production of the toxin, which kills the cell. Another embodiment provides a synthetic biological circuit, referred to as a "passcode circuit" or a "passcode kill switch", which uses hybrid transcription factors (TFs) to engineer complex environmental requirements for cell survival. “Emergency Interlocks” and “Access Code Emergency Stoppers” described in WO2017/059245 are particularly suitable for use in cccDNA vectors because they are modular and tunable, both in terms of the environmental conditions controlling circuit activation and in relation to output modules that control cell fate. With the proper selection of toxins, which include, but are not limited to, an endonuclease such as EcoRI, the "access code strands" present in the cccDNA vector, which can be used not only to kill the host cell containing the cccDNA vector, but also to destroy its genome and accompanying plasmids.
[00316] Другие «аварийные выключатели», известные специалисту в данной области техники, предусмотрены для применения в зкДНК-векторе согласно описанию в данном документе, например, согласно описанию в US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, а также «аварийные выключатели», описанные в источниках: Jusiak et al, Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; и Reinshagen et al., Science Translational Medicine, 2018, 11.[00316] Other "kill switches" known to one skilled in the art are provided for use in a cccDNA vector as described herein, for example, as described in US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, as well as the “kill switches” described in Jusiak et al, Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; and Reinshagen et al., Science Translational Medicine, 2018, 11.
[00317] Соответственно, согласно некоторым вариантам реализации указанный зкДНК-вектор может содержать конструкт нуклеиновой кислоты «аварийного выключателя», который содержит нуклеиновую кислоту, кодирующую эффекторный токсин или репортерный белок, причем экспрессию эффекторного токсина (например, белка смерти) или репортерного белка контролирует заранее заданное условие. Например, заранее заданным условием может быть присутствие агента окружающей среды, такого как, например, экзогенный агент, без которого клетка по умолчанию будет экспрессировать эффекторный токсин (например, белок смерти) и погибнет. Согласно альтернативным вариантам реализации заранее заданным условием является присутствие двух или более агентов окружающей среды, например, клетка выживет только при поступлении двух или более необходимых экзогенных агентов, и без какого-либо из них клетка, содержащая зкДНК-вектор, погибнет. [00317] Accordingly, in some embodiments, said cccDNA vector may comprise a “kill switch” nucleic acid construct that contains a nucleic acid encoding an effector toxin or reporter protein, wherein expression of the effector toxin (e.g., death protein) or reporter protein is controlled in advance given condition. For example, a predetermined condition may be the presence of an environmental agent, such as an exogenous agent, without which the cell will by default express an effector toxin (eg, a death protein) and die. In alternative embodiments, the predetermined condition is the presence of two or more environmental agents, for example, the cell will survive only when supplied with two or more required exogenous agents, and without any of them, the cell containing the cccDNA vector will die.
[00318] Согласно некоторым вариантам реализации зкДНК-вектор модифицируют так, чтобы он содержал «аварийный выключатель» для уничтожения клеток, содержащих указанный зкДНК-вектор, для эффективного прекращения in vivo экспрессии трансгена, экспрессируемого указанным зкДНК-вектором (например, терапевтического гена, белка или пептида, и т.е.). В частности, также зкДНК-вектор генетически сконструирован для экспрессии белка-переключателя, который не функционирует в клетках млекопитающих в нормальных физиологических условиях. Клетки, экспрессирующие белок-переключатель, будут уничтожены только после введения лекарственного средства или воздействия условия внешней среды, специфически нацеленных на указанный белок-переключатель, и, соответственно, тогда будет прекращена экспрессия терапевтического белка или пептида. Например, сообщалось, что клетки, экспрессирующие HSV-тимидинкиназу, могут погибать при введении таких лекарственных средств, как ганцикловир и цитозиндезаминаза. См., например, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), в источнике: Targets in Gene Therapy, под редакцией You (2011); и Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999). Согласно некоторым вариантам реализации зкДНК-вектор может содержать «аварийный выключатель» киРНК, называемый DISE (смерть, вызываемая элиминацией гена выживания, «Death Induced by Survival gene Elimination») (Murmann et al., Oncotarget. 2017; 8:84643-84658. Induction of DISE in ovarian cancer cells in vivo).[00318] In some embodiments, the cccDNA vector is modified to include a "kill switch" to kill cells containing the cccDNA vector to effectively stop in vivo expression of a transgene expressed by the cccDNA vector (e.g., a therapeutic gene, protein or peptide, etc.). In particular, the cccDNA vector is also genetically engineered to express a switch protein that does not function in mammalian cells under normal physiological conditions. Cells expressing the switch protein will only be killed upon administration of a drug or environmental condition specifically targeting said switch protein, and accordingly, expression of the therapeutic protein or peptide will then cease. For example, it has been reported that cells expressing HSV thymidine kinase can be killed by the administration of drugs such as ganciclovir and cytosine deaminase. See, for example, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), in Targets in Gene Therapy, edited You (2011); and Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699–8704 (1999). In some embodiments, the cccDNA vector may contain a siRNA “kill switch” called DISE (Death Induced by Survival Gene Elimination) (Murmann et al., Oncotarget. 2017;8:84643-84658. Induction of DISE in ovarian cancer cells in vivo).
[00319] Согласно некоторым аспектам «аварийный блокиратор» представляет собой биологическую цепь или систему, придающую клеточному ответу чувствительность к заранее определенному условию, такому как отсутствие агента в среде, где растут клетки, например, экзогенного агента. Такая цепь или система может содержать нуклеиновую кислоту, содержащую экспрессионные модули, которые образуют аварийную регуляторную цепь, чувствительную к заранее заданному условию, при этом указанный конструкт содержит:[00319] In some aspects, a "kill blocker" is a biological circuit or system that renders a cellular response sensitive to a predetermined condition, such as the absence of an agent in the environment in which the cells grow, such as an exogenous agent. Such a chain or system may comprise a nucleic acid containing expression modules that form an emergency regulatory circuit sensitive to a predetermined condition, said construct comprising:
i) модуль экспрессии первого репрессорного белка, отличающегося тем, что указанный первый репрессорный белок связывает нуклеиновую кислоту связывающего элемента первого репрессорного белка, и репрессирует транскрипцию с кодирующей последовательности, содержащей указанный связывающий элемент первого репрессорного белка, при этом репрессорная активность первого репрессорного белка чувствительна к ингибированию первым экзогенным агентом, присутствие или отсутствие которого определяет заранее заданное условие;i) a first repressor protein expression module, characterized in that said first repressor protein binds a nucleic acid of a first repressor protein binding element, and represses transcription from a coding sequence containing said first repressor protein binding element, wherein the repressor activity of the first repressor protein is sensitive to inhibition the first exogenous agent, the presence or absence of which determines a predetermined condition;
ii) модуль экспрессии второго репрессорного белка, отличающегося тем, что второй репрессорный белок связывает нуклеиновую кислоту связывающего элемента второго репрессорного белка и репрессирует транскрипцию с кодирующей последовательности, содержащей указанный связывающий элемент второго репрессорного белка, при этом второй репрессорный белок отличается от первого репрессорного белка; иii) a second repressor protein expression module, characterized in that the second repressor protein binds a nucleic acid of a second repressor protein binding element and represses transcription from a coding sequence containing said second repressor protein binding element, wherein the second repressor protein is different from the first repressor protein; And
iii) модуль экспрессии эффектора, содержащий последовательность нуклеиновой кислоты, кодирующую эффекторный белок, функционально связанный с генетическим элементом, содержащим связывающий элемент второго репрессорного белка, так что экспрессия второго репрессорного белка вызывает репрессию экспрессии эффектора с модуля экспрессии эффектора, при этом второй модуль экспрессии содержит элемент, связывающий нуклеиновую кислоту первого репрессорного белка, который обеспечивает репрессию транскрипции второго репрессорного белка, если указанный элемент связан первым репрессорным белком; соответствующие модули образуют регуляторную цепь таким образом, что в отсутствие первого экзогенного агента, первый репрессорный белок продуцируется с модуля экспрессии первого репрессорного белка и репрессирует транскрипцию с модуля экспрессии второго репрессорного белка, так что подавление экспрессии эффектора вторым репрессорным белком устраняется, что обеспечивает экспрессию эффекторного белка, но в присутствии первого экзогенного агента активность первого репрессорного белка ингибирована, что разрешает экспрессию второго репрессорного белка, который поддерживает экспрессию эффекторного белка в «выключенном» состоянии, таким образом, первый экзогенный агент в цепи необходим для поддержания экспрессии эффекторного белка в «выключенном» состоянии, и удаление или отсутствие первого экзогенного агента приводит к экспрессии эффекторного белка по умолчанию.iii) an effector expression module comprising a nucleic acid sequence encoding an effector protein operably linked to a genetic element comprising a second repressor protein binding element, such that expression of the second repressor protein causes repression of effector expression from the effector expression module, wherein the second expression module comprises the element , binding a nucleic acid of the first repressor protein, which provides transcriptional repression of the second repressor protein if the specified element is bound by the first repressor protein; the corresponding modules form a regulatory chain such that, in the absence of a first exogenous agent, a first repressor protein is produced from the expression module of the first repressor protein and represses transcription from the expression module of the second repressor protein, such that the inhibition of effector expression by the second repressor protein is eliminated, allowing expression of the effector protein , but in the presence of the first exogenous agent, the activity of the first repressor protein is inhibited, which allows expression of the second repressor protein, which maintains the expression of the effector protein in the "off" state, thus the first exogenous agent in the chain is required to maintain expression of the effector protein in the "off" state , and removal or absence of the first exogenous agent results in expression of the effector protein by default.
[00320] Согласно некоторым вариантам реализации указанный эффектор представляет собой токсин или белок, который индуцирует программу клеточной смерти. Может быть использован любой белок, токсичный для клетки-хозяина. Согласно некоторым вариантам реализации указанный токсин убивает только те клетки, в которых происходит его экспрессия. Согласно другим вариантам реализации указанный токсин убивает и другие клетки того же организма-хозяина. Для использования в «аварийном блокираторе» подходят любые из множества продуктов, которые приводят к клеточной смерти. В частности, целесообразно использование агентов, которые ингибируют репликацию ДНК, трансляцию белка или другие процессы или, например, разрушают нуклеиновую кислоту клетки-хозяина. Для идентификации эффективного механизма уничтожения клеток-хозяев при активации цепи, было протестировано несколько генов токсинов, которые непосредственно повреждают ДНК или РНК клетки-хозяина. Тестировали эндонуклеазу ecoRI21, ингибитор ДНК-гиразы ccdB22 и токсин рибонуклеазного типа mazF23, поскольку они подробно описаны, являются нативными для E. coli и обеспечивают диапазон механизмов уничтожения. Чтобы повысить надежность цепи и обеспечить независимый способ обуславливаемой цепью смерти клеток, указанная система может быть дополнительно адаптирована для экспрессии, например, нацеленной протеазы или нуклеазы, которая дополнительно взаимодействует с репрессором, который поддерживает ген смерти в "выключенном" состоянии. При утрате или отмене сигнала выживания репрессия гена смерти устраняется еще эффективнее за счет, например, активного разложения репрессорного белка или его транскрипта. В неограничивающем примере использовали протеазу mf -Lon не только для разложения LacI, но и для нацеливания на важные белки для их разложения. Метка разложения mf-Lon pdt#1 может быть присоединена к 3'-концу пяти важных генов, белковые продукты которых, в частности, чувствительны к разложению mf-Lon20; жизнеспособность клеток измеряли после удаления ATc. Среди протестированных важных целевых генов ген биосинтеза пептидогликана murC обеспечивал наиболее выраженный и быстрый фенотип клеточной смерти (доля выживших клеток < 1 x 10-4 не более чем через 6 часов).[00320] In some embodiments, the effector is a toxin or protein that induces a cell death program. Any protein that is toxic to the host cell can be used. In some embodiments, the toxin kills only those cells in which it is expressed. In other embodiments, the toxin also kills other cells of the same host organism. Any of a variety of products that cause cell death are suitable for use in a "kill blocker". In particular, it is advisable to use agents that inhibit DNA replication, protein translation or other processes or, for example, destroy the nucleic acid of the host cell. To identify an effective mechanism for killing host cells upon circuit activation, several toxin genes that directly damage host cell DNA or RNA were tested. The endonuclease ecoRI 21 , the DNA gyrase inhibitor ccdB 22 , and the ribonuclease type toxin mazF 23 were tested because they are well characterized, are native to E. coli, and provide a range of killing mechanisms. To increase the reliability of the chain and provide a chain-independent mode of cell death, the system can be further adapted to express, for example, a targeted protease or nuclease that further interacts with a repressor that keeps the death gene in an "off" state. When the survival signal is lost or abolished, repression of the death gene is eliminated even more effectively due to, for example, active degradation of the repressor protein or its transcript. In a non-limiting example, mf-Lon protease was used not only to degrade LacI, but also to target important proteins for their degradation. The mf-Lon degradation tag pdt#1 can be attached to the 3′ end of five important genes whose protein products, in particular, are sensitive to mf-Lon degradation 20 ; cell viability was measured after ATc removal. Among the important target genes tested, the peptidoglycan biosynthesis gene murC provided the most pronounced and rapid cell death phenotype (proportion of surviving cells < 1 x 10 -4 after no more than 6 hours).
[00321] В данном документе термин «заранее заданный входной сигнал» относится к агенту или состоянию, которое известным образом влияет на активность полипептида транскрипционного фактора. Обычно такие агенты способны связывать полипептид транскрипционного фактора и/или изменять его конформацию, тем самым модифицируя активность указанного полипептида транскрипционного фактора. Примеры заранее заданных входных сигналов включают, не ограничиваясь перечисленными, входные агенты среды, не требуемые для выживания определенного организма-хозяина (т.е. в отсутствие синтетической биологической цепи согласно описанию в данном документе). Условия, которые могут обеспечивать заранее заданный входной сигнал, включают, например, температуру, например, если активность одного или более факторов чувствительна к температуре, присутствие или отсутствие света, в том числе света с длинами волн определенного спектра, и концентрацию газа, соли, металла или минерала. Входные агенты среды включают, например, малую молекулу, биологические агенты, такие как феромоны, гормоны, факторы роста, метаболиты, питательные вещества и т.п., и их аналоги; концентрации химических веществ, побочные продукты среды, ионы металлов и другие такие молекулы или агенты; уровни света; температуру; механическое напряжение или давление; или электрические сигналы, такие как токи и напряжения.[00321] As used herein, the term “predetermined input signal” refers to an agent or condition that is known to influence the activity of a transcription factor polypeptide. Typically, such agents are capable of binding a transcription factor polypeptide and/or changing its conformation, thereby modifying the activity of said transcription factor polypeptide. Examples of predetermined inputs include, but are not limited to, environmental inputs not required for the survival of a particular host organism (ie, in the absence of a synthetic biological circuit as described herein). Conditions that may provide a predetermined input signal include, for example, temperature, for example if the activity of one or more factors is temperature sensitive, the presence or absence of light, including light at wavelengths of a particular spectrum, and the concentration of a gas, salt, metal or mineral. Environmental inputs include, for example, small molecule, biological agents such as pheromones, hormones, growth factors, metabolites, nutrients, etc., and analogs thereof; concentrations of chemicals, environmental byproducts, metal ions and other such molecules or agents; light levels; temperature; mechanical stress or pressure; or electrical signals such as currents and voltages.
[00322] Согласно некоторым вариантам реализации используют репортеры для количественной оценки силы или активности сигнала, принимаемого модулями или программируемыми синтетическими биологическими цепями согласно данному изобретению. Согласно некоторым вариантам реализации репортеры могут быть слиты внутри рамки с другими кодирующими последовательностями для идентификации локализации белка в клетке или организме. Люциферазы могут применяться в качестве эффекторных белков в различных вариантах реализации данного изобретения, например, для изменения низких уровней генной экспрессии, поскольку клетки, как правило, практически не имеют или совершенно не имеют фоновой люминесценции в отсутствие люциферазы. Согласно другим вариантам реализации ферменты, которые продуцируют окрашенные субстраты, можно количественно оценивать с применением спектрофотометров или других позволяющих измерять поглощение инструментов, в том числе планшет-ридеров. Как и люциферазы, такие ферменты, как β-галактозидаза, могут применяться для измерения низких уровней генной экспрессии, поскольку они имеют тенденцию усиливать слабые сигналы. Согласно некоторым вариантам реализации эффекторный белок может представлять собой фермент, который может разлагать или иным образом уничтожать определенный токсин. Согласно некоторым вариантам реализации эффекторный белок может представлять собой фермент-одоратор, который превращает субстрат в продукт, имеющий запах. Согласно некоторым вариантам реализации эффекторный белок может представлять собой фермент, который фосфорилирует или дефосфорилирует либо малые молекулы, либо другие белки, или фермент, который метилирует или деметилирует другие белки или ДНК.[00322] In some embodiments, reporters are used to quantify the strength or activity of a signal received by modules or programmable synthetic biological circuits of the present invention. In some embodiments, reporters can be fused in-frame to other coding sequences to identify the location of a protein in a cell or organism. Luciferases can be used as effector proteins in various embodiments of the present invention, for example, to alter low levels of gene expression, since cells typically have little or no background luminescence in the absence of luciferase. In other embodiments, enzymes that produce colored substrates can be quantified using spectrophotometers or other absorbance-measuring instruments, including plate readers. Like luciferases, enzymes such as β-galactosidase can be used to measure low levels of gene expression because they tend to amplify weak signals. In some embodiments, the effector protein may be an enzyme that can degrade or otherwise destroy a particular toxin. In some embodiments, the effector protein may be an odorant enzyme that converts the substrate into an odor-bearing product. In some embodiments, the effector protein may be an enzyme that phosphorylates or dephosphorylates either small molecules or other proteins, or an enzyme that methylates or demethylates other proteins or DNA.
[00323] Согласно некоторым вариантам реализации эффекторный белок может представлять собой рецептор, лиганд, или литический белок. Рецепторы, как правило, имеют три домена: внеклеточный домен для связывания лигандов, таких как белки, пептиды или малые молекулы, трансмембранный домен и внутриклеточный или цитоплазматический домен, который часто может участвовать в каком-либо явлении при передаче сигнала, таком как фосфорилирование. Согласно некоторым вариантам реализации в качестве эффекторных белков используют последовательности генов транспортеров, каналов или насосов. Неограничивающие примеры и последовательности эффекторных белков для применения с «аварийными выключателями» согласно описанию в данном документе можно найти в Реестре стандартных биологических компонентов во всемирной сети Интернет по адресу: parts.igem.org. [00323] In some embodiments, the effector protein may be a receptor, a ligand, or a lytic protein. Receptors typically have three domains: an extracellular domain for binding ligands such as proteins, peptides or small molecules, a transmembrane domain, and an intracellular or cytoplasmic domain, which can often be involved in some signal transduction phenomenon such as phosphorylation. In some embodiments, transporter, channel, or pump gene sequences are used as effector proteins. Non-limiting examples and sequences of effector proteins for use with "kill switches" as described herein can be found in the Registry of Standard Biological Parts on the World Wide Web at parts.igem.org.
[00324] В данном документе «белок-модулятор» представляет собой белок, который модулирует экспрессию с целевой последовательности нуклеиновой кислоты. Белки-модуляторы включают, например, транскрипционные факторы, в том числе транскрипционные активаторы и репрессоры, а также белки которые связываются или модифицируют транскрипционный фактор и влияют на его активность. Согласно некоторым вариантам реализации белок-модулятор включает, например, протеазу, которая разлагает белковый фактор, вовлеченный в регуляцию экспрессии с последовательности целевой нуклеиновой кислоты. Предпочтительные белки-модуляторы включают модульные белки, в которых, например, связывающие ДНК и связывающие входной агент, или ответные элементы или домены разделены и могут быть перенесены, так что, например, слияние связывающего ДНК домена первого белка-модулятора с отвечающим на входной агент доменом второго белка-модулятора приводит к образованию нового белка, который связывает последовательность ДНК, распознаваемую первым белком, но чувствителен к входному агенту, на который в норме отвечает второй белок. Соответственно, в данном документе термин «полипептид-модулятор», более конкретно - «репрессорный полипептид» включает, наряду с указанными полипептидами, например, «(репрессорный) полипептид LacI», варианты или производные таких полипептидов, которые отвечают на другой входной агент или вариант входного агента. Соответственно, в случае полипептида LacI предусмотрены мутанты или варианты LacI, которые связываются с агентами, не являющимися лактозой или IPTG. В данной области техники известен широкий спектр таких агентов. [00324] As used herein, a “modulator protein” is a protein that modulates expression from a target nucleic acid sequence. Modulator proteins include, for example, transcription factors, including transcription activators and repressors, as well as proteins that bind or modify a transcription factor and influence its activity. In some embodiments, the modulator protein includes, for example, a protease that degrades a protein factor involved in regulating expression of a target nucleic acid sequence. Preferred modulator proteins include modular proteins in which, for example, the DNA binding and entry agent binding or response elements or domains are separated and can be transferred so that, for example, the DNA binding domain of the first modulator protein is fused to the entry agent response domain the second modulator protein leads to the formation of a new protein that binds the DNA sequence recognized by the first protein, but is sensitive to the input agent to which the second protein normally responds. Accordingly, as used herein, the term “modulator polypeptide,” more specifically “repressor polypeptide,” includes, along with said polypeptides such as “LacI (repressor) polypeptide,” variants or derivatives of such polypeptides that respond to a different input agent or variant entry agent. Accordingly, in the case of the LacI polypeptide, LacI mutants or variants are provided that bind to agents other than lactose or IPTG. A wide variety of such agents are known in the art.
[00325] Таблица 11. Примеры регуляторных переключателей. bВозможность включения эффектором; отличная от удаления эффектора, который обеспечивает выключенное состояние. cВозможность выключения эффектором; отличная от удаления эффектора, который обеспечивает включенное состояние. dЛиганд или другой физический стимул (например, температура, электромагнитное излучение, электричество), который стабилизирует переключатель либо во включенном, либо в выключенном состоянии. eОтносится к референсному числу, указанному в источнике: Kis et al., J R Soc Interface. 12:20141000 (2015), содержание которого вместе с цитируемыми источниками включено в данный документ посредством ссылки. [00325] Table 11. Examples of control switches . b Possibility of activation by the effector; different from removing the effector that provides the off state. c Possibility of switching off by the effector; different from removing the effector that provides the on state. d A ligand or other physical stimulus (e.g., temperature, electromagnetic radiation, electricity) that stabilizes the switch in either the on or off state. e Refers to the reference number given in: Kis et al., JR Soc Interface. 12:20141000 (2015), the contents of which, along with references cited, are incorporated herein by reference.
VII. Фармацевтические композицииVII. Pharmaceutical compositions
[00326] Согласно другому аспекту предложены фармацевтические композиции. Указанная фармацевтическая композиция содержит зкДНК-вектор согласно описанию в данном документе и фармацевтически приемлемый носитель или разбавитель.[00326] In another aspect, pharmaceutical compositions are provided. Said pharmaceutical composition contains a cccDNA vector as described herein and a pharmaceutically acceptable carrier or diluent.
[00327] ДНК-векторы согласно описанию в данном документе могут быть включены в фармацевтические композиции, подходящие для введения субъекту для доставки in vivo в клетки, ткани или органы субъекта. Как правило, указанная фармацевтическая композиция содержит зкДНК-вектор согласно описанию в данном документе и фармацевтически приемлемый носитель. Например, зкДНК-векторы описанные в данном документе могут быть включены в фармацевтическую композицию, подходящую для требуемого пути терапевтического введения (например, парентерального введения). Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция. Фармацевтические композиции для терапевтических целей могут быть введены в состав раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем введения соединения зкДНК-вектора в необходимом количестве в соответствующий буфер с одним ингредиентом или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизующей фильтрацией. [00327] DNA vectors as described herein can be included in pharmaceutical compositions suitable for administration to a subject for in vivo delivery to cells, tissues or organs of the subject. Typically, said pharmaceutical composition contains a cccDNA vector as described herein and a pharmaceutically acceptable carrier. For example, the cccDNA vectors described herein can be included in a pharmaceutical composition suitable for the desired route of therapeutic administration (eg, parenteral administration). Passive tissue transduction by intravenous or intra-arterial high-pressure infusion, as well as intracellular injection such as intranuclear microinjection or intracytoplasmic injection, is also contemplated. Pharmaceutical compositions for therapeutic purposes can be formulated in a solution, microemulsion, dispersion, liposome or other ordered structure suitable for high concentration of cccDNA vector. Sterile injection solutions can be prepared by introducing the cDNA vector compound in the required amount into an appropriate buffer with one or a combination of ingredients listed above, if necessary, followed by sterilizing filtration.
[00328] Фармацевтически активные композиции, содержащие зкДНК-вектор, могут быть введены в состав для доставки трансгена в нуклеиновой кислоте в клетки реципиента, что приводит к терапевтической экспрессии в них указанного трансгена. Указанная композиция также может включать фармацевтически приемлемый носитель. [00328] Pharmaceutically active compositions containing a cccDNA vector can be formulated to deliver a transgene in nucleic acid into recipient cells, resulting in therapeutic expression of the transgene therein. The composition may also include a pharmaceutically acceptable carrier.
[00329] ЗкДНК-вектор согласно описанию в данном документе может быть введен в фармацевтическую композицию, подходящую для местного, системного, внутриамниотического, интратекального, интракраниального, внутриартериального, внутривенного, внутрилимфатического, внутрибрюшинного, подкожного, трахеального, внутритканевого (например, внутримышечного, внутрисердечного, внутрипеченочного, внутри почечного, интрацеребрального), интратекального, интравезикального, конъюнктивальное (например, внеорбитального, интраорбитального, ретроорбитального, интраретинального, субретинального, хориоидального, субхориоидального, интрастромального, интракамерального и интравитреального), интракохлеарного и мукозального (например, перорального, ректального, назального) введение. Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция.[00329] The cccDNA vector as described herein can be formulated into a pharmaceutical composition suitable for local, systemic, intra-amniotic, intrathecal, intracranial, intra-arterial, intravenous, intralymphatic, intraperitoneal, subcutaneous, tracheal, interstitial (e.g., intramuscular, intracardiac, intrahepatic, intrarenal, intracerebral), intrathecal, intravesical, conjunctival (eg, extraorbital, intraorbital, retroorbital, intraretinal, subretinal, choroidal, subchoroidal, intrastromal, intracameral and intravitreal), intracochlear and mucosal (eg, oral, rectal, nasal) administration . Passive tissue transduction by intravenous or intra-arterial high-pressure infusion, as well as intracellular injection such as intranuclear microinjection or intracytoplasmic injection, is also contemplated.
[00330] Фармацевтические композиции для терапевтических целей, как правило, должны быть стерильными и стабильными в условиях изготовления и хранения. Указанная композиция может быть введена в состав раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем введения соединения зкДНК-вектора в необходимом количестве в соответствующий буфер с одним ингредиентом или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизующей фильтрацией.[00330] Pharmaceutical compositions for therapeutic purposes generally must be sterile and stable under the conditions of manufacture and storage. The composition may be formulated into a solution, microemulsion, dispersion, liposome or other ordered structure suitable for high concentration of cDNA vector. Sterile injection solutions can be prepared by introducing the cDNA vector compound in the required amount into an appropriate buffer with one or a combination of ingredients listed above, if necessary, followed by sterilizing filtration.
[00331] В данной области техники известны различные методы и способы доставки нуклеиновых кислот в клетки. Например, нуклеиновые кислоты, такие как зкДНК, могут быть введены в состав липидных наночастиц (ЛНЧ), липидоидов, липосом, липидных наночастиц, липоплексов или наночастиц типа ядро/оболочка. Как правило, ЛНЧ состоят из молекул нуклеиновой кислоты (например, зкДНК), одного или более ионизируемых или катионных липидов (или их солей), одного или более неионогенных или нейтральных липидов (например, фосфолипида), молекулы, которая предотвращает агрегацию (например, ПЭГ или ПЭГ-липидного конъюгата), и необязательно стерола (например, холестерина).[00331] Various methods and methods for delivering nucleic acids into cells are known in the art. For example, nucleic acids such as cccDNA can be formulated into lipid nanoparticles (LNPs), lipidoids, liposomes, lipid nanoparticles, lipoplexes or core/shell nanoparticles. Typically, LNPs consist of a nucleic acid molecule (e.g., cccDNA), one or more ionizable or cationic lipids (or salts thereof), one or more nonionic or neutral lipids (e.g., a phospholipid), a molecule that prevents aggregation (e.g., PEG or PEG-lipid conjugate), and optionally a sterol (eg cholesterol).
[00332] Другой способ доставки нуклеиновых кислот, таких как зкДНК, в клетку, заключается в конъюгировании нуклеиновой кислоты с лигандом, который интернализуется указанной клеткой. Например, указанный лиганд может связывать рецептор на поверхности клетки и интернализоваться посредством эндоцитоза. Указанный лиганд может быть ковалентно связан с нуклеотидом в нуклеиновой кислоте. Примеры конъюгатов для доставки нуклеиновых кислот в клетку описаны, например, в WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 и WO2017/177326.[00332] Another method of delivering nucleic acids, such as cctDNA, into a cell is by conjugating the nucleic acid to a ligand that is internalized by the cell. For example, the ligand may bind to a cell surface receptor and be internalized through endocytosis. Said ligand may be covalently linked to a nucleotide in the nucleic acid. Examples of conjugates for delivering nucleic acids into a cell are described, for example, in WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO 2004/090108, WO2004/091515 and WO2017 /177326.
[00333] Нуклеиновые кислоты, такие как зкДНК, могут также быть доставлены в клетку путем трансфекции. Подходящие способы трансфекции включают, не ограничиваясь перечисленными, опосредованную липидами трансфекцию, опосредованную катионным полимером трансфекцию или осаждение фосфатом кальция. Реагенты для трансфекции хорошо известны в данной области техники и включают, не ограничиваясь перечисленными, TurboFect Transfection Reagent (Thermo Fisher Scientific), Pro-Ject Reagent (Thermo Fisher Scientific), TRANSPASS™ P Protein Transfection Reagent (New England Biolabs), CHARIOT™ Protein Delivery Reagent (Active Motif), PROTEOJUICE™ Protein Transfection Reagent (EMD Millipore), реагент 293fectin, липофектамин - LIPOFECTAMINE ™ 2000, LIPOFECTAMINE ™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE ™ (Thermo Fisher Scientific), липофектин - LIPOFECTIN™ (Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Базель, Швейцария), FUGENE™ HD (Roche), TRANSFECTAM™(трансфектам, Promega, Мэдисон, Висконсин), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Геркулес, Калифорния), SILENTFECT™ (Bio-Rad), Effectene™ (Qiagen, Валенсия, Калифорния), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, Сан-Диего, Калифорния), DHARMAFECT 1™ (Dharmacon, Лафайет, Колорадо), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, Сент-Луис, Миссури) и ESCORT™ IV (Sigma Chemical Co.). Нуклеиновые кислоты, такие как зкДНК, также могут быть доставлены в клетку с помощью способов микрофлюидики, известных специалистам в данной области техники.[00333] Nucleic acids, such as cctDNA, can also be delivered into a cell by transfection. Suitable transfection methods include, but are not limited to, lipid-mediated transfection, cationic polymer-mediated transfection, or calcium phosphate precipitation. Transfection reagents are well known in the art and include, but are not limited to, TurboFect Transfection Reagent (Thermo Fisher Scientific), Pro-Ject Reagent (Thermo Fisher Scientific), TRANSPASS™ P Protein Transfection Reagent (New England Biolabs), CHARIOT™ Protein Delivery Reagent (Active Motif), PROTEOJUICE™ Protein Transfection Reagent (EMD Millipore), 293fectin Reagent, Lipofectamine - LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), Lipofectin - LIPOFECTIN™ (The rmo Fisher Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Basel, Switzerland), FUGENE™ HD (Roche), TRANSFECTAM™ (transfectam, Promega, Madison, WI), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Hercules, CA), SILENTFECT™ (Bio-Rad), Effectene™ ( Qiagen, Valencia, CA), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, San Diego, CA), DHARMAFECT 1™ (Dharmacon, Lafayette, CO), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3 ™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, St. Louis, MO), and ESCORT™ IV (Sigma Chemical Co.). Nucleic acids, such as cctDNA, can also be delivered into cells using microfluidics techniques known to those skilled in the art.
[00334] Способы невирусной доставки нуклеиновых кислот in vivo или ex vivo включают электропорацию, липофекцию (см. патент США №5049386; 4946787; и коммерчески доступные реагенты, такие как трансфектам (Transfectam™) и липофектин (Lipofectin™)), микроинъекцию, биолистику, виросомы, липосомы (см., например, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США № 4186183, №4217344, №4235871, №4261975, №4485054, №4501728, №4774085, №4837028 и №4946787), иммунолипосомы, конъюгаты нуклеиновых кислот с поликатионами или липидами, «голую» ДНК и усиленное агентами поглощение ДНК. Сонопорация с использованием, например, системы Sonitron 2000 (Rich-Mar) также может быть использована для доставки нуклеиновых кислот.[00334] Methods for non-viral delivery of nucleic acids in vivo or ex vivo include electroporation, lipofection (see US Pat. No. 5,049,386; 4,946,787; and commercially available reagents such as Transfectam™ and Lipofectin™), microinjection, biolistics , virosomes, liposomes (see, for example, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52: 4817-4820 (1992); US patents No. 4186183, No. 4217344, No. 4235871, No. 4261975, No. 4485054, No. 4501728, No. 4774085, No. 4837028 and No. 4946787), immunoliposomes, conjugates of nucleic acids with polycations or lipids, “naked” DNA and agent-enhanced DNA uptake. Sonoporation using, for example, the Sonitron 2000 system (Rich-Mar) can also be used to deliver nucleic acids.
[00335] ЗкДНК-векторы согласно описанию в данном документе могут также быть введены прямо в организм для трансдукции клеток in vivo. Введение осуществляют любым из путей, обычно используемых для приведения молекулы в максимальный контакт с клетками крови или тканей, в том числе, но не ограничиваясь перечисленным, инъекцию, инфузию, местное нанесение и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники, и хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более быструю и более эффективную реакцию по сравнению с другим путем введения.[00335] CCDNA vectors as described herein can also be administered directly into the body to transduce cells in vivo. Administration is by any of the routes commonly used to bring the molecule into maximum contact with blood or tissue cells, including, but not limited to, injection, infusion, topical application, and electroporation. Suitable routes for administering such nucleic acids are available and well known to those skilled in the art, and although more than one route may be used to administer a particular composition, a particular route can often provide a faster and more efficient response than another route of administration.
[00336] Способы введения зкДНК-вектора из нуклеиновых кислот согласно описанию в данном документе могут включать доставку в гематопоэтические стволовые клетки, например, способами, описанными, например, в патенте США № 5928638. [00336] Methods of introducing a cccDNA nucleic acid vector as described herein may include delivery to hematopoietic stem cells, for example, by methods described, for example, in US Pat. No. 5,928,638.
[00337] ЗкДНК-векторы в соответствии с данным изобретением могут быть добавлены в липосомы для доставки в клетку или целевой орган субъекта. Липосомы представляют собой везикулы, имеющие по меньшей мере один липидный бислой. Липосомы часто используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтических разработок. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, хотя указанные композиции могут также включать другие липиды.[00337] CCDNA vectors in accordance with this invention can be added to liposomes for delivery to a cell or target organ of a subject. Liposomes are vesicles having at least one lipid bilayer. Liposomes are often used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, although these compositions may also include other lipids.
[00338] Согласно некоторым аспектам данного изобретения предложен липосомальный состав, который включает одно или более соединений с функциональной группой полиэтиленгликоля (ПЭГ) (так называемые «пегилированные соединения»), которые могут снижать иммуногенность/антигенность, обеспечивать гидрофильность и гидрофобность указанному соединению (соединениям) и снижение частоты его дозирования. В других случаях, липосомальная композиция просто содержит полимер полиэтиленгликоля (ПЭГ) в качестве дополнительного компонента. В таких аспектах молекулярная масса ПЭГ или функциональной группы ПЭГ может составлять от 62 Да до примерно 5000 Да.[00338] According to some aspects of the present invention, there is provided a liposomal formulation that includes one or more polyethylene glycol (PEG) functional compounds (so-called “PEGylated compounds”) that can reduce immunogenicity/antigenicity, provide hydrophilicity and hydrophobicity to the compound(s) and reducing the frequency of its dosing. In other cases, the liposomal composition simply contains a polyethylene glycol (PEG) polymer as an additional component. In such aspects, the molecular weight of the PEG or PEG functionality may range from 62 Da to about 5000 Da.
[00339] В некоторых аспектах данное изобретение относится к композиции липосом, которая доставляет АФИ с профилем пролонгированного или контролируемого высвобождения на протяжении периода времени от нескольких часов до недель. Согласно некоторым родственным аспектам указанный липосомальный состав может включать водные камеры, которые связаны липидными бислоями. Согласно другим родственным аспектам указанный липосомальный состав инкапсулирует АФИ с компонентами, которые претерпевают физический переход при повышенной температуре, который высвобождает АФИ в течение периода от нескольких часов до недель.[00339] In some aspects, the present invention provides a liposome composition that delivers an API with a sustained or controlled release profile over a period of time ranging from hours to weeks. In some related aspects, the liposomal composition may include aqueous chambers that are connected by lipid bilayers. In other related aspects, the liposomal formulation encapsulates the API with components that undergo a physical transition at elevated temperature that releases the API over a period of hours to weeks.
[00340] Согласно некоторым аспектам указанный липосомальный состав содержит сфингомиелин и один или более липидов согласно описанию в данном документе. В некоторых аспектах липосомная композиция содержит оптисомы. [00340] In some aspects, the liposomal formulation comprises sphingomyelin and one or more lipids as described herein. In some aspects, the liposome composition contains optisomes.
[00341] В некоторых аспектах данное изобретение предусматривает липосомальную композицию, которая включает один или несколько липидов, выбранных из: натриевой соли N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина, (дистеароил-sn-глицерофосфоэтаноламина), MPEG (метоксиполиэтиленгликоль)-конъюгированного липида, HSPC (гидрогенизированного соевого фосфатидилхолина); ПЭГ (полиэтиленгликоля); DSPE (дистеароил-sn-глицерофосфоэтаноламина); DSPC (дистеароилфосфатидилхолина); DOPC (диолеоилфосфатидилхолина); DPPG (дипальмитоилфосфатидилглицерина); EPC (яичного фосфатидилхолина); DOPS (диолеоилфосфатидилсерина); POPC (пальмитоилолеоилфосфатидилхолина); SM (сфингомиелина); MPEG (метоксиполиэтиленгликоля); DMPC (димиристоилфосфатидилхолина); DMPG (димиристоилфосфатидилглицерина); DSPG (дистеароилфосфатидилглицерина); DEPC (диэрукоилфосфатидилхолина); DOPE (диолеоил-sn-глицерофосфоэтаноламина), холестерилсульфата (CS), дипальмитоилфосфатидилглицерина (DPPG), DOPC (диолеоил-sn-глицерофосфатидилхолина) или любой их комбинации.[00341] In some aspects, the present invention provides a liposomal composition that includes one or more lipids selected from: N-(carbonylmethoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine sodium salt, (distearoyl-sn- glycerophosphoethanolamine), MPEG (methoxypolyethylene glycol)-conjugated lipid, HSPC (hydrogenated soy phosphatidylcholine); PEG (polyethylene glycol); DSPE (distearoyl-sn-glycerophosphoethanolamine); DSPC (distearoylphosphatidylcholine); DOPC (dioleoylphosphatidylcholine); DPPG (dipalmitoylphosphatidylglycerol); EPC (egg phosphatidylcholine); DOPS (dioleoylphosphatidylserine); POPC (palmitoyloleoylphosphatidylcholine); SM (sphingomyelin); MPEG (methoxy polyethylene glycol); DMPC (dimyristoylphosphatidylcholine); DMPG (dimyristoylphosphatidylglycerol); DSPG (distearoylphosphatidylglycerol); DEPC (dierucoylphosphatidylcholine); DOPE (dioleoyl-sn-glycerophosphoethanolamine), cholesteryl sulfate (CS), dipalmitoylphosphatidylglycerol (DPPG), DOPC (dioleoyl-sn-glycerophosphatidylcholine) or any combination thereof.
[00342] В некоторых аспектах данное изобретение предусматривает липосомальную композицию, содержащую фосфолипид, холестерин и пегилированный липид в молярном соотношении 56:38:5. Согласно некоторым аспектам общее содержание липидов в липосомальном составе составляет 2-16 мг/мл. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид, в молярном соотношении 3:0,015:2, соответственно. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, холестерин и пегилированный липид. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу и холестерин. Согласно некоторым аспектам указанный пегилированный липид представлен PEG-2000-DSPE. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий DPPG, соевый ФХ, конъюгат липида с MPEG-DSPE и холестерин. [00342] In some aspects, the present invention provides a liposomal composition comprising a phospholipid, cholesterol, and PEGylated lipid in a molar ratio of 56:38:5. In some aspects, the total lipid content of the liposomal formulation is 2-16 mg/ml. According to some aspects of the present invention, there is provided a liposomal composition comprising a phosphatidylcholine-functional lipid, an ethanolamine-functional lipid, and a PEGylated lipid. According to some aspects of the present invention, there is provided a liposomal composition comprising a phosphatidylcholine-functional lipid, an ethanolamine-functional lipid, and a PEGylated lipid in a molar ratio of 3:0.015:2, respectively. According to some aspects of the present invention, there is provided a liposomal composition comprising a lipid containing a phosphatidylcholine functionality, cholesterol and a pegylated lipid. According to some aspects of the present invention, there is provided a liposomal composition comprising a lipid containing a phosphatidylcholine functionality and cholesterol. In some aspects, said PEGylated lipid is PEG-2000-DSPE. According to some aspects of the present invention, there is provided a liposomal formulation comprising DPPG, soy PC, MPEG-DSPE lipid conjugate and cholesterol.
[00343] Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий один или более липидов, содержащих фосфатидилхолиновую функциональную группу, и один или более липидов, содержащих этаноламиновую функциональную группу. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, содержащий что-либо одно или более из: липидов, содержащих фосфатидилхолиновую функциональную группу, липидов, содержащих этаноламиновую функциональную группу, и стеролов, например, холестерина. Согласно некоторым аспектам указанный липосомальный состав содержит DOPC/ DEPC; и DOPE.[00343] In some aspects of the present invention, there is provided a liposomal formulation comprising one or more phosphatidylcholine-functional lipids and one or more ethanolamine-functional lipids. According to some aspects of the present invention, there is provided a liposomal formulation comprising any one or more of: phosphatidylcholine-functional lipids, ethanolamine-functional lipids, and sterols, such as cholesterol. In some aspects, the liposomal formulation comprises DOPC/DEPC; and DOPE.
[00344] Согласно некоторым аспектам данного изобретения предложен липосомальный состав, дополнительно содержащий одно или более фармацевтических вспомогательных веществ, например, сахарозу и/или глицин.[00344] According to some aspects of the present invention, there is provided a liposomal formulation further containing one or more pharmaceutical excipients, for example, sucrose and/or glycine.
[00345] Согласно некоторым аспектам данного изобретения предложен липосомальный состав, имеющий униламеллярную или мультиламеллярную структуру. В некоторых аспектах данное изобретение относится к липосомной композиции, которая включает мультивезикулярные частицы и/или частицы на основе пены. В некоторых аспектах данное изобретение предусматривает композицию липосом, размер которых больше, чем у обычных наночастиц, и составляет примерно от 150 до 250 нм. В некоторых аспектах липосомальная композиция представляет собой лиофилизированный порошок.[00345] According to some aspects of the present invention, there is provided a liposomal composition having a unilamellar or multilamellar structure. In some aspects, the present invention relates to a liposomal composition that includes multivesicular particles and/or foam-based particles. In some aspects, the present invention provides a composition of liposomes that are larger in size than conventional nanoparticles, ranging from about 150 to 250 nm. In some aspects, the liposomal composition is a lyophilized powder.
[00346] Согласно некоторым аспектам данного изобретения предложен липосомальный состав, который получают и нагружают зкДНК-векторами, раскрытыми или описанными в данном документе, путем добавления слабого основания к смеси, содержащей выделенную зкДНК, вне липосомы. Указанное добавление повышает значение pH вне липосом до приблизительно 7,3 и стимулирует вход АФИ в липосому. Согласно некоторым аспектам данного изобретения предложен липосомальный состав, имеющий значения pH, кислотные внутри липосом. В таких случаях значение pH внутри липосом может составлять 4-6,9 и более предпочтительно - pH 6,5. Согласно другим аспектам данного изобретения предложен липосомальный состав, полученный с применением технологии внутрилипосомальной стабилизации лекарственных средств. В таких случаях используют полимерные или неполимерные высокозаряженные анионы и внутрилипосомальные захватывающие агенты, например, полифосфат или октасульфат сахарозы. [00346] In some aspects of the present invention, a liposomal formulation is provided that is prepared and loaded with cccDNA vectors disclosed or described herein by adding a weak base to a mixture containing isolated cccDNA outside of a liposome. This addition increases the pH outside the liposomes to approximately 7.3 and stimulates the entry of the API into the liposome. According to some aspects of the present invention, there is provided a liposomal composition having pH values that are acidic within the liposomes. In such cases, the pH value within the liposomes may be 4-6.9, and more preferably pH 6.5. According to other aspects of the present invention, a liposomal formulation is provided using intraliposomal drug stabilization technology. In such cases, polymeric or non-polymeric highly charged anions and intraliposomal entrapment agents, such as polyphosphate or sucrose octasulfate, are used.
[00347] В других аспектах данное изобретение предлагает липосомную композицию, содержащую фосфолипиды, лецитин, фосфатидилхолин и фосфатидилэтаноламин.[00347] In other aspects, the present invention provides a liposome composition containing phospholipids, lecithin, phosphatidylcholine and phosphatidylethanolamine.
[00348] Реагенты для доставки, такие как липосомы, нанокапсулы, микрочастицы, микросферы, липидные частицы, везикулы и т.п., можно использовать для введения композиций по данному изобретению в подходящие клетки-хозяева. В частности, композиции нуклеиновых кислот могут быть составлены для доставки в инкапсулированном виде в липидной частице, липосоме, везикуле, наносфере, наночастице, частице золота и т.п. Такие составы могут быть предпочтительными для введения фармацевтически приемлемых композиций нуклеиновых кислот, раскрытых в данном документе.[00348] Delivery reagents, such as liposomes, nanocapsules, microparticles, microspheres, lipid particles, vesicles, and the like, can be used to introduce the compositions of this invention into suitable host cells. In particular, nucleic acid compositions can be formulated for delivery encapsulated in a lipid particle, liposome, vesicle, nanosphere, nanoparticle, gold particle, and the like. Such formulations may be preferred for administering the pharmaceutically acceptable nucleic acid compositions disclosed herein.
[00349] Различные способы доставки, известные в данной области, или их модификации, могут быть использованы для доставки зкДНК-векторов in vitro или in vivo. Например, согласно некоторым вариантам реализации зкДНК-векторы доставляют путем транзиентного проникновения через клеточную мембрану с использованием механической, электрической, ультразвуковой, гидродинамической или лазерной энергии для облегчения входа ДНК в целевые клетки. Например, зкДНК-вектор может быть доставлен путем транзиентного разрыва клеточной мембраны путем продавливания клетки через канал ограниченного размера или другими способами, известными в данной области техники. В некоторых случаях прямо вводят зкДНК-вектор по отдельности в виде депротеинизированной ДНК в клетки кожи, вилочковой железы, сердечной мышцы, скелетных мышц или печени. [00349] Various delivery methods known in the art, or modifications thereof, can be used to deliver cccDNA vectors in vitro or in vivo. For example, in some embodiments, cccDNA vectors are delivered by transiently permeating the cell membrane using mechanical, electrical, ultrasonic, hydrodynamic, or laser energy to facilitate entry of DNA into target cells. For example, the cccDNA vector can be delivered by transiently disrupting the cell membrane by forcing the cell through a channel of limited size or other methods known in the art. In some cases, the cccDNA vector is directly injected individually as deproteinized DNA into skin, thymus, cardiac, skeletal muscle, or liver cells.
[00350] В некоторых случаях зкДНК-вектор доставляют с помощью генной пушки. Сферические частицы золота или вольфрама (диаметром 1-3 мкм), покрытые бескапсидными AAV-векторами, могут быть разогнаны до высокой скорости с помощью сжатого газа для проникновения в клетки целевой ткани.[00350] In some cases, the cccDNA vector is delivered using a gene gun. Spherical gold or tungsten particles (1-3 µm in diameter) coated with capsidless AAV vectors can be accelerated to high speed using pressurized gas to penetrate target tissue cells.
[00351] Согласно некоторым вариантам реализации для доставки зкДНК-векторов используют электропорацию. Электропорация вызывает временную дестабилизацию клеточной мембраны клеток целевой ткани в результате введения в ткань пары электродов, так что молекулы ДНК из среды вокруг дестабилизированной мембраны могут проникать в цитоплазму и нуклеоплазму указанной клетки. Электропорацию использовали in vivo для многих типов тканей, таких как кожа, легкие и мышцы. [00351] In some embodiments, electroporation is used to deliver cccDNA vectors. Electroporation causes temporary destabilization of the cell membrane of target tissue cells by introducing a pair of electrodes into the tissue, so that DNA molecules from the environment around the destabilized membrane can penetrate into the cytoplasm and nucleoplasm of the specified cell. Electroporation has been used in vivo for many tissue types such as skin, lung, and muscle.
[00352] В некоторых случаях зкДНК-вектор доставляют путем гидродинамической инъекции, которая представляет собой простой и высокоэффективный способ прямой внутриклеточной доставки любых водорастворимых соединений и частиц во внутренние органы и скелетные мышцы во всей конечности. [00352] In some cases, the cccDNA vector is delivered by hydrodynamic injection, which is a simple and highly effective method for direct intracellular delivery of any water-soluble compounds and particles to the internal organs and skeletal muscles throughout the limb.
[00353] В некоторых случаях зкДНК-векторы доставляют с помощью ультразвука, создавая наноскопические поры в мембране для облегчения внутриклеточной доставки частиц ДНК в клетки внутренних органов или опухолей, поэтому размер и концентрация плазмидной ДНК имеют большое значение для эффективности системы. В некоторых случаях зкДНК-векторы доставляют путем магнитофекции с использованием магнитных полей для концентрации частиц, содержащих нуклеиновую кислоту, в целевых клетках. [00353] In some cases, cccDNA vectors are delivered using ultrasound, creating nanoscopic pores in the membrane to facilitate intracellular delivery of DNA particles into internal organ or tumor cells, so the size and concentration of plasmid DNA is of great importance to the efficiency of the system. In some cases, cccDNA vectors are delivered by magnetofection, using magnetic fields to concentrate particles containing the nucleic acid into target cells.
[00354] В некоторых случаях могут быть использованы химические системы доставки, например, с использованием наномерных комплексов, которые включают уплотнение отрицательно заряженной нуклеиновой кислоты поликатионными наномерными частицами, в составе катионных липосом/мицелл или катионных полимеров. Катионные липиды, используемые в указанном способе доставки, включают, без ограничений, моновалентные катионные липиды, поливалентные катионные липиды, гуанидин-содержащие соединения, соединения-производные холестерина, катионные полимеры (например, полиэтиленимин, поли-L-лизин, протамин, другие катионные полимеры), и гибриды липид-полимер. [00354] In some cases, chemical delivery systems can be used, for example, using nanometer complexes that involve the compaction of negatively charged nucleic acid with polycationic nanometer particles, formulated in cationic liposomes/micelles or cationic polymers. Cationic lipids used in this delivery method include, but are not limited to, monovalent cationic lipids, polyvalent cationic lipids, guanidine-containing compounds, cholesterol-derived compounds, cationic polymers (e.g., polyethylenimine, poly-L-lysine, protamine, other cationic polymers ), and lipid-polymer hybrids.
[00355] А. Экзосомы: [00355] A. Exosomes:
[00356] В некоторых вариантах реализации зкДНК-вектор, как раскрыто в данном документе, доставляют путем упаковки в экзосому. Экзосомы представляют собой небольшие мембранные везикулы эндоцитарного происхождения, которые высвобождаются во внеклеточную среду после слияния мультивезикулярных телец с плазматической мембраной. Их поверхность состоит из липидного бислоя клеточной мембраны донорной клетки, они содержат цитозоль из клетки, которая продуцировала экзосому, и экспонируют на поверхности мембранные белки родительской клетки. Экзосомы продуцируются различными типами клеток, в том числе эпителиальными клетками, В- и Т-лимфоцитами, тучными клетками (MC), а также дендритными клетками (DC). Согласно некоторым вариантам реализации предусмотрены для применения экзосомы с диаметром от 10 нм до 1 мкм, от 20 нм до 500 нм, от 30 нм до 250 нм, от 50 до 100 нм. Экзосомы могут быть выделены для доставки в целевые клетки либо с применением донорных клеток, либо путем введения в них конкретных нуклеиновых кислот. Различные подходы, известные в данной области техники, могут применяться для получения экзосом, содержащих бескапсидные AAV-векторы согласно данному изобретению. [00356] In some embodiments, a cccDNA vector as disclosed herein is delivered by packaging into an exosome. Exosomes are small membrane vesicles of endocytic origin that are released into the extracellular environment after the fusion of multivesicular bodies with the plasma membrane. Their surface consists of the lipid bilayer of the cell membrane of the donor cell, they contain cytosol from the cell that produced the exosome, and they expose membrane proteins of the parent cell on the surface. Exosomes are produced by various cell types, including epithelial cells, B and T lymphocytes, mast cells (MC), and dendritic cells (DC). In some embodiments, exosomes with a diameter of 10 nm to 1 μm, 20 nm to 500 nm, 30 nm to 250 nm, or 50 to 100 nm are provided for use. Exosomes can be isolated for delivery to target cells either using donor cells or by introducing specific nucleic acids into them. Various approaches known in the art can be used to obtain exosomes containing capsidless AAV vectors according to this invention.
[00357] B. Микрочастицы/наночастицы [00357] B. Microparticles/nanoparticles
[00358] Согласно некоторым вариантам реализации зкДНК-вектор согласно описанию в данном документе доставляют на липидной наночастице. Обычно липидные наночастицы содержат ионизируемый аминолипид (например, гептатриаконта-6, 9, 28, 31-тетраен-19-ил 4- (диметиламино)бутаноат, DLin-MC3-DMA, фосфатидилхолин(1,2-дистеароил-sn-глицеро-3-фосфохолин, DSPC), холестерин и липид оболочки (полиэтиленгликоль- димиристоилглицерин, ПЭГ-ДМГ), например, как описано в источнике: Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507. [00358] In some embodiments, a cccDNA vector as described herein is delivered on a lipid nanoparticle. Typically, lipid nanoparticles contain an ionizable aminolipid (e.g., heptatriakonta-6, 9, 28, 31-tetraen-19-yl 4-(dimethylamino)butanoate, DLin-MC3-DMA, phosphatidylcholine (1,2-distearoyl-sn-glycero-3 -phosphocholine, DSPC), cholesterol and envelope lipid (polyethylene glycol-dimyristoylglycerol, PEG-DMG), for example, as described in Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498 -507.
[00359] В некоторых вариантах реализации липидная наночастица имеет средний диаметр от примерно 10 до примерно 1000 нм. В некоторых вариантах реализации липидная наночастица имеет диаметр менее 300 нм. В некоторых вариантах реализации липидная наночастица имеет диаметр от примерно 10 до примерно 300 нм. В некоторых вариантах реализации липидная наночастица имеет диаметр менее 200 нм. В некоторых вариантах реализации липидная наночастица имеет диаметр от примерно 25 до примерно 200 нм. В некоторых вариантах реализации препарат липидных наночастиц (например, композиция, содержащая множество липидных наночастиц) имеет распределение по размерам, при котором средний размер (например, диаметр) составляет от примерно 70 нм до примерно 200 нм, и более типично средний размер составляет примерно 100 нм или меньше.[00359] In some embodiments, the lipid nanoparticle has an average diameter of from about 10 nm to about 1000 nm. In some embodiments, the lipid nanoparticle has a diameter of less than 300 nm. In some embodiments, the lipid nanoparticle has a diameter of from about 10 nm to about 300 nm. In some embodiments, the lipid nanoparticle has a diameter of less than 200 nm. In some embodiments, the lipid nanoparticle has a diameter of from about 25 nm to about 200 nm. In some embodiments, the lipid nanoparticle formulation (e.g., a composition containing a plurality of lipid nanoparticles) has a size distribution such that the average size (e.g., diameter) is from about 70 nm to about 200 nm, and more typically the average size is about 100 nm or less.
[00360] Различные липидные наночастицы, известные в данной области, могут быть использованы для доставки зкДНК-вектора, раскрытого в данном документе. Например, различные способы доставки с применением липидных наночастиц описаны в патентах США №9404127, №9006417 и №9518272. [00360] Various lipid nanoparticles known in the art can be used to deliver the cDNA vector disclosed herein. For example, various delivery methods using lipid nanoparticles are described in US patents No. 9404127, No. 9006417 and No. 9518272.
[00361] Согласно некоторым вариантам реализации a зкДНК-вектор согласно описанию в данном документе доставляют на золотой наночастице. Как правило, нуклеиновая кислота может быть ковалентно связана с золотой наночастицей или нековалентно связана с золотой наночастицей (например, связана заряд-зарядным взаимодействием), например, согласно описанию в источнике: Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. Согласно некоторым вариантам реализации конъюгаты золотых наночастиц и нуклеиновой кислоты получают с использованием способов, описанных, например, в патенте США № 6812334.[00361] In some embodiments, a cccDNA vector as described herein is delivered on a gold nanoparticle. Typically, the nucleic acid may be covalently associated with the gold nanoparticle or non-covalently associated with the gold nanoparticle (eg, associated by charge-charge interaction), for example, as described in Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. In some embodiments, gold nanoparticle-nucleic acid conjugates are prepared using methods described, for example, in US Pat. No. 6,812,334.
[00362] C. Липосомы [00362] C. Liposomes
[00363] Получение и применение липосом в целом известно специалистам в данной области техники. Были разработаны липосомы с улучшенной стабильностью в сыворотке и временем полужизни в циркуляторной системе (патент США № 5741516). Кроме того, были описаны различные способы получения липосомальных и подобных липосомальным составов в качестве потенциальных носителей лекарственных средств (патенты США №5567434; №5552157; №5565213; №5738868 и №5795587). [00363] The preparation and use of liposomes is generally known to those skilled in the art. Liposomes with improved serum stability and circulatory half-life have been developed (US Patent No. 5,741,516). In addition, various methods for preparing liposomal and liposomal-like formulations as potential drug carriers have been described (US Pat. No. 5,567,434; US Pat. No. 5,552,157; US Pat. No. 5,565,213; US Pat. No. 5,738,868 and US Pat. No. 5,795,587).
[00364] Липосомы успешно применялись с некоторыми типами клеток, которые обычно устойчивы к трансфекции с использованием других процедур. Кроме того, липосомы свободны от ограничений по длине ДНК, типичных для систем доставки на основе вирусов. Липосомы эффективно применялись для введения генов, лекарственных средств, радиотерапевтических агентов, вирусов, транскрипционных факторов и аллостерических эффекторов в различные культивируемые линии клеток и в организм животных. Кроме того, было завершено несколько успешных клинических испытаний для изучения эффективности опосредованной липосомами доставки лекарственных средств. [00364] Liposomes have been used successfully with certain cell types that are generally resistant to transfection using other procedures. In addition, liposomes are free of DNA length restrictions typical of viral-based delivery systems. Liposomes have been used effectively to introduce genes, drugs, radiotherapeutic agents, viruses, transcription factors, and allosteric effectors into a variety of cultured cell lines and animals. In addition, several successful clinical trials have been completed to study the effectiveness of liposome-mediated drug delivery.
[00365] Липосомы образуются из фосфолипидов, которые диспергированы в водной среде, и спонтанно образуют мультиламеллярные концентрические бислойные везикулы (также называемые многослойными везикулами (MLV). MLV обычно имеют диаметр от 25 нм до 4 мкм. Обработка MLV ультразвуком приводит к образованию малых однослойных везикул (SUV) с диаметром в диапазоне от 200 до 500 ангстрем, содержащих водный раствор в ядре.[00365] Liposomes are formed from phospholipids that are dispersed in an aqueous environment and spontaneously form multilamellar concentric bilayer vesicles (also called multilamellar vesicles (MLV). MLVs typically have a diameter of 25 nm to 4 μm. Sonication of MLVs results in the formation of small unilamellar vesicles (SUV) with a diameter ranging from 200 to 500 angstroms containing an aqueous solution in the core.
[00366] Согласно некоторым вариантам реализации липосома содержит катионные липиды. Термин «катионный липид» включает липиды и синтетические липиды, имеющие как полярные, так и неполярные домены, которые могут быть положительно заряженными при физиологических значениях pH или около них, и которые связываются с полианионами, такими как нуклеиновые кислоты, и способствуют доставке нуклеиновых кислот в клетки. Согласно некоторым вариантам реализации катионные липиды включают насыщенные и ненасыщенные алкильные и алициклические простые эфиры и сложные эфиры аминов, амидов или их производных. В некоторых вариантах реализации катионные липиды включают неразветвленные, разветвленные алкильные, алкенильные группы, или любую комбинацию вышеуказанного. В некоторых вариантах реализации катионные липиды содержат от 1 до примерно 25 атомов углерода (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 атомов углерода). В некоторых вариантах реализации катионные липиды содержат более 25 атомов углерода. Согласно некоторым вариантам реализации прямоцепочечные или разветвленные алкильные или алкеновые группы содержат шесть или более атомов углерода. Катионный липид может также содержать, согласно некоторым вариантам реализации, одну или более алициклических групп. Неограничивающие примеры алициклических групп включают холестерин и другие стероидные группы. Согласно некоторым вариантам реализации политических липидов с использованием одного или более противоионов. Примеры противоионов (анионов) включают, не ограничиваясь перечисленными, Cl-, Br-, I-, F-, ацетат, трифторацетат, сульфат, нитрит и нитрат.[00366] In some embodiments, the liposome contains cationic lipids. The term "cationic lipid" includes lipids and synthetic lipids having both polar and nonpolar domains that may be positively charged at or near physiological pH, and that bind to polyanions, such as nucleic acids, and facilitate the delivery of nucleic acids to cells. In some embodiments, cationic lipids include saturated and unsaturated alkyl and alicyclic ethers and esters of amines, amides, or derivatives thereof. In some embodiments, the cationic lipids include straight-chain, branched-chain alkyl, alkenyl groups, or any combination of the foregoing. In some embodiments, cationic lipids contain from 1 to about 25 carbon atoms (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 , 18, 19, 20, 21, 22, 23, 24 or 25 carbon atoms). In some embodiments, the cationic lipids contain more than 25 carbon atoms. In some embodiments, the straight-chain or branched alkyl or alkene groups contain six or more carbon atoms. The cationic lipid may also contain, in some embodiments, one or more alicyclic groups. Non-limiting examples of alicyclic groups include cholesterol and other steroid groups. In some embodiments, political lipids are implemented using one or more counterions. Examples of counterions (anions) include, but are not limited to, Cl-, Br-, I-, F-, acetate, trifluoroacetate, sulfate, nitrite and nitrate.
[00367] Неограничивающие примеры катионных липидов включают звездчатые дендримеры полиэтиленимина и полиамидоамина (PAMAM), липофектин (комбинация DOTMA и DOPE), липофектазу, липофектамин (LIPOFECTAMINE™, например, LIPOFECTAMINE™ 2000), DOPE, цитофектин (Gilead Sciences, Фостер-Сити, Калифорния) и эуфектины (JBL, Сан-Луис-Обиспо, Калифорния). Примеры катионных липосом могут быть получены из N-[1-(2, 3-диолеолокси)-пропил]-N, N,N-триметилхлорида аммония (DOTMA), N-[1-(2, 3-диолеолокси)-пропил]-N,N,N-триметиламмония метилсульфата (DOTAP), 3β-[N-(N′, N′-диметиламиноэтан)карбамоил]холестерина (DC-Chol), 2, 3-диолеилокси-N-[2(сперминкарбоксамидо)этил]-N,N-диметил-1- пропанаминия трифторацетата (DOSPA), 1,2-димиристилоксипропил-3-диметил-гидроксиэтиламмония бромида; и диметилдиоктадециламмония бромида (DDAB). Нуклеиновые кислоты (например, CELiD) могут также быть введены в комплексы, например, с поли(L-лизином) или авидином, и липиды, например, стерил-поли(L-лизин), могут быть включены или не включены в указанную смесь.[00367] Non-limiting examples of cationic lipids include star dendrimers of polyethylenimine and polyamidoamine (PAMAM), lipofectin (combination of DOTMA and DOPE), lipofectase, lipofectamine (LIPOFECTAMINE™, e.g. LIPOFECTAMINE™ 2000), DOPE, cytofectin (Gilead Sciences, Foster City, California) and eupectins (JBL, San Luis Obispo, CA). Examples of cationic liposomes can be prepared from N-[1-(2, 3-dioleoloxy)-propyl]-N, N,N-trimethyl ammonium chloride (DOTMA), N-[1-(2, 3-dioleoloxy)-propyl] -N,N,N-trimethylammonium methyl sulfate (DOTAP), 3β-[N-(N′, N′-dimethylaminoethane)carbamoyl]cholesterol (DC-Chol), 2, 3-dioleyloxy-N-[2(sperminecarboxamido)ethyl ]-N,N-dimethyl-1-propanaminium trifluoroacetate (DOSPA), 1,2-dimyristyloxypropyl-3-dimethylhydroxyethylammonium bromide; and dimethyldioctadecylammonium bromide (DDAB). Nucleic acids (eg, CELiD) may also be complexed with, for example, poly(L-lysine) or avidin, and lipids, such as steryl-poly(L-lysine), may or may not be included in the mixture.
[00368] Согласно некоторым вариантам реализации зкДНК-вектор согласно описанию в данном документе доставляют с применением катионного липида, описанного в патенте США №8158601, или полиаминного соединения или липида согласно описанию в патенте США №8034376.[00368] In some embodiments, the cccDNA vector as described herein is delivered using a cationic lipid described in US Pat. No. 8,158,601, or a polyamine compound or lipid as described in US Pat. No. 8,034,376.
[00369] C. Конъюгаты[00369] C. Conjugates
[00370] Согласно некоторым вариантам реализации зкДНК-вектор согласно описанию в данном документе конъюгирован (например, ковалентно связан с агентом, который повышает поглощение клетками). «Агент, который повышает поглощение клетками» представляет собой молекулу, которая облегчает транспорт нуклеиновой кислоты через липидную мембрану. Например, нуклеиновая кислота может быть конъюгирована с липофильным соединением (например, холестерином, токоферолом и т.п.), проникающим в клетки пептидом (СРР) (например, пенетратином, ТАТ, Syn1B и т.п.) и полиаминами (например, спермином). Дополнительные примеры агентов, которые повышают поглощение клетками, раскрыты, например, в источнике: Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.[00370] In some embodiments, the cccDNA vector as described herein is conjugated (eg, covalently linked to an agent that enhances cellular uptake). A "cellular uptake enhancing agent" is a molecule that facilitates the transport of nucleic acid across a lipid membrane. For example, the nucleic acid may be conjugated to a lipophilic compound (e.g., cholesterol, tocopherol, etc.), cell penetrating peptide (CPP) (e.g., penetratin, TAT, Syn1B, etc.), and polyamines (e.g., spermine ). Additional examples of agents that enhance cellular uptake are disclosed, for example, in Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.
[00371] Согласно некоторым вариантам реализации зкДНК-вектор согласно описанию в данном документе конъюгирован с полимером (например, полимерной молекулой) или молекулой фолата (например, молекулой фолиевой кислоты). В целом, доставка нуклеиновых кислот, конъюгированных с полимерами, известна в данной области техники, например, описана в WO2000/34343 и WO2008/022309. Согласно некоторым вариантам реализации зкДНК-вектор согласно описанию в данном документе конъюгирован с поли(амидным) полимером, например, согласно описанию в патенте США № 8987377. Согласно некоторым вариантам реализации нуклеиновая кислота, описанная в данном документе, конъюгирована с молекулой фолиевой кислоты согласно описанию в патенте США № 8507455.[00371] In some embodiments, the cccDNA vector as described herein is conjugated to a polymer (eg, a polymer molecule) or a folate molecule (eg, a folic acid molecule). In general, delivery of nucleic acids conjugated to polymers is known in the art, for example, described in WO2000/34343 and WO2008/022309. In some embodiments, the cccDNA vector as described herein is conjugated to a poly(amide) polymer, for example, as described in US Pat. No. 8,987,377. In some embodiments, the nucleic acid described herein is conjugated to a folic acid molecule as described in US Patent No. 8507455.
[00372] Согласно некоторым вариантам реализации зкДНК-вектор согласно описанию в данном документе конъюгирован с углеводом, например, согласно описанию в патенте США № 8450467. [00372] In some embodiments, the cccDNA vector as described herein is conjugated to a carbohydrate, for example, as described in US Pat. No. 8,450,467.
[00373] Е. Нанокапсула[00373] E. Nanocapsule
[00374] Как вариант, могут применяться нанокапсульные составы зкДНК-вектора согласно описанию в данном документе. Как правило, нанокапсулы могут захватывать вещества стабильным и воспроизводимым образом. Чтобы избежать побочных эффектов, обусловленных внутриклеточной перегрузки полимерами, такие ультратонкие частицы (размером около 0,1 мкм) необходимо конструировать с использованием полимеров, способных разлагаться in vivo. Предусмотрены для применения биоразлагаемые наночастицы полиалкилцианоакрилата, которые отвечают указанным требованиям.[00374] Alternatively, cDNA vector nanocapsule formulations as described herein may be used. Generally, nanocapsules can entrap substances in a stable and reproducible manner. To avoid side effects due to intracellular polymer overload, such ultrafine particles (about 0.1 μm in size) must be constructed using polymers that are degradable in vivo. Biodegradable polyalkyl cyanoacrylate nanoparticles that meet the specified requirements are provided for use.
VIII. Способы доставки зкДНК-векторовVIII. Methods for delivering cccDNA vectors
[00375] Согласно некоторым вариантам реализации зкДНК-вектор может быть доставлен в целевую клетку in vitro или in vivo различными подходящими способами. Могут применяться или вводиться зкДНК-векторы по отдельности. ЗкДНК-векторы могут быть доставлены в клетку без помощи реагента для трансфекции или другого физического способа. Как вариант, зкДНК-векторы могут быть доставлены с применением любого известного в данной области техники реагента для трансфекции или другого известного в данной области техники физического способа, который облегчает вход ДНК в клетку, например, липосом, спиртов, богатых полилизином соединений, богатых аргинином соединений, фосфата кальция, микровезикул, микроинъекции, электропорации и т.п. [00375] In some embodiments, the cccDNA vector can be delivered to the target cell in vitro or in vivo by various suitable methods. The cccDNA vectors can be used or introduced separately. CctDNA vectors can be delivered into cells without the need for a transfection reagent or other physical method. Alternatively, cccDNA vectors can be delivered using any transfection reagent known in the art or other physical method known in the art that facilitates DNA entry into the cell, e.g., liposomes, alcohols, polylysine-rich compounds, arginine-rich compounds , calcium phosphate, microvesicles, microinjections, electroporation, etc.
[00376] Напротив, трансдукция бескапсидными AAV-векторами согласно описанию в данном документе может быть эффективно нацелена на типы клеток и тканей, которые трудно трансдуцировать стандартными вирионами AAV с применением различных реагентов для доставки. [00376] In contrast, transduction with capsidless AAV vectors as described herein can effectively target cell and tissue types that are difficult to transduce with standard AAV virions using different delivery reagents.
IX. Дополнительные применения зкДНК-векторов IX. Additional applications of cccDNA vectors
[00377] Композиции и зкДНК-векторы согласно данному описанию можно использовать для доставки трансгена с различными целями. Согласно некоторым вариантам реализации указанный трансген кодирует белок или функциональную РНК, которая предназначена для использования в исследовательских целях, например, для создания соматической модели на трансгенных животных, несущих трансген, например, для изучения функции продукта трансгена. В другом примере указанный трансген кодирует белок или функциональную РНК, которая предназначена для использования с целью создания модели заболевания на животных. Согласно некоторым вариантам реализации указанный трансген кодирует один или более пептидов, полипептидов или белков, которые подходят для лечения, профилактики или облегчения болезненных состояний или расстройств у субъекта - млекопитающего. Указанный трансген может быть перенесен в организм субъекта (например, экспрессироваться у пациента) в количестве, достаточном для лечения заболевания, ассоциированного с пониженной экспрессией, отсутствием экспрессии или дисфункцией указанного гена. Согласно некоторым вариантам реализации указанный трансген может быть перенесен в организм субъекта (например, экспрессироваться у субъекта) в количестве, достаточном для лечения заболевания, ассоциированного с повышенной экспрессией, активностью продукта гена или неадекватной стимулирующей регуляцией гена, который супрессирует или экспрессию которого снижает иным образом указанный трансген. [00377] The compositions and cccDNA vectors described herein can be used to deliver a transgene for a variety of purposes. In some embodiments, the transgene encodes a protein or functional RNA that is intended to be used for research purposes, for example, to create a somatic model of transgenic animals carrying the transgene, for example, to study the function of the transgene product. In another example, the transgene encodes a protein or functional RNA that is intended for use in creating an animal model of a disease. In some embodiments, the transgene encodes one or more peptides, polypeptides, or proteins that are useful for treating, preventing, or alleviating disease states or disorders in a mammalian subject. The transgene may be transferred into a subject (eg, expressed in a patient) in an amount sufficient to treat a disease associated with decreased expression, absence of expression, or dysfunction of the gene. In some embodiments, the transgene may be transferred into a subject (e.g., expressed in the subject) in an amount sufficient to treat a disease associated with increased expression, activity of a gene product, or inappropriate stimulatory regulation of a gene that suppresses or otherwise reduces expression of the gene. transgene
X. Способы примененияX. Directions for use
[00378] ЗкДНК-вектор, согласно данному изобретению, также можно использовать в способе доставки представляющей интерес нуклеотидной последовательности в целевую клетку. Указанный способ, в частности, может представлять собой способ доставки представляющего интерес терапевтического гена в клетку нуждающегося в этом субъекта. Данное изобретение позволяет осуществлять экспрессию in vivo полипептида, белка или олигонуклеотида, кодируемого терапевтической экзогенной последовательностью ДНК в клетках субъекта таким образом, чтобы происходила экспрессия указанного полипептида, белка или олигонуклеотида на терапевтических уровнях. Указанные результаты наблюдаются как в in vivo, так и в in vitro режимах доставки зкДНК-вектора. [00378] The cDNA vector of the present invention can also be used in a method for delivering a nucleotide sequence of interest to a target cell. The method may in particular be a method of delivering a therapeutic gene of interest to a cell of a subject in need thereof. This invention allows for in vivo expression of a polypeptide, protein or oligonucleotide encoded by a therapeutic exogenous DNA sequence in cells of a subject such that the polypeptide, protein or oligonucleotide is expressed at therapeutic levels. These results are observed both in vivo and in vitro delivery modes of the cDNA vector.
[00379] Способ доставки представляющей интерес нуклеиновой кислоты в клетку субъекта может включать введение указанному субъекту зкДНК-вектора согласно данному изобретению, содержащего указанную представляющую интерес нуклеиновую кислоту. Кроме того, согласно данному изобретению предложен способ доставки представляющей интерес нуклеиновой кислоты в клетку нуждающегося в этом субъекта, включающий многократное введение зкДНК-вектора согласно данному изобретению, содержащего указанную нуклеиновую представляющую интерес кислоту. Поскольку вектор зкДНК, согласно данному изобретению, не индуцирует иммунного ответа, такая стратегия многократного введения не будет нарушать ответ иммунной системы хозяина против зкДНК-вектора согласно данному изобретению, в отличие от ситуации, которая наблюдается с заключенными в капсиды векторами. [00379] A method of delivering a nucleic acid of interest to a cell of a subject may include administering to the subject a cccDNA vector of the present invention containing said nucleic acid of interest. The present invention further provides a method for delivering a nucleic acid of interest to a cell of a subject in need thereof, comprising repeatedly administering a cccDNA vector of the present invention containing said nucleic acid of interest. Since the cccDNA vector of the present invention does not induce an immune response, this multiple administration strategy will not disrupt the host immune system response against the cccDNA vector of the present invention, unlike the situation that occurs with encapsidated vectors.
[00380] Нуклеиновую кислоту (кислоты) зкДНК-вектора вводят в достаточных количествах для трансфекции клеток нужной ткани и для обеспечения достаточных уровней переноса и экспрессии генов без нежелательных побочных эффектов. Обычные и фармацевтически приемлемые пути введения включают, без ограничений, внутривенный (например, в липосомном составе), прямую доставку в выбранный орган (например, внутрипортальную доставку в печень), внутримышечный и другие парентеральные пути введения. Пути введения могут быть скомбинированы, если требуется.[00380] The cccDNA vector nucleic acid(s) are administered in sufficient quantities to transfect cells of the desired tissue and to ensure sufficient levels of gene transfer and expression without undesirable side effects. Conventional and pharmaceutically acceptable routes of administration include, but are not limited to, intravenous (eg, in a liposomal formulation), direct delivery to an organ of choice (eg, intraportal delivery to the liver), intramuscular, and other parenteral routes of administration. Routes of administration can be combined if required.
[00381] ЗкДНК-вектор не ограничен одним видом зкДНК-вектора. Следовательно, согласно другому аспекту несколько зкДНК-векторов, содержащих разные экзогенные последовательности ДНК, могут быть одновременно или последовательно доставлены в целевые клетку, ткань, орган или организм субъекта. Соответственно, указанная стратегия может обеспечивать экспрессию нескольких генов. Доставка также может осуществляться неоднократно и, что важно для генной терапии в клинических условиях, с последующим увеличением или снижением доз, учитывая отсутствие иммунного ответа хозяина против капсида благодаря отсутствию вирусного капсида. Ожидается, что никакой реакции против капсида возникать не будет из-за отсутствия капсида.[00381] The cccDNA vector is not limited to one type of ccDNA vector. Therefore, in another aspect, multiple cDNA vectors containing different exogenous DNA sequences can be delivered simultaneously or sequentially to a target cell, tissue, organ, or body of a subject. Accordingly, this strategy can ensure the expression of multiple genes. Delivery can also be done multiple times and, importantly for gene therapy in a clinical setting, with subsequent increases or decreases in doses given the lack of host immune response against the capsid due to the absence of the viral capsid. It is expected that no reaction against the capsid will occur due to the absence of the capsid.
[00382] Согласно данному изобретению также предложен способ лечения заболевания у субъекта, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, необязательно с фармацевтически приемлемым носителем. Хотя указанный зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Предложенный зкДНК-вектор содержит представляющую интерес нуклеотидную последовательность, подходящую для лечения заболевания. В частности, указанный зкДНК-вектор может содержать требуемую экзогенную последовательность ДНК, функционально связанную с контрольными элементами, способными направлять транскрипцию требуемого полипептида, белка или олигонуклеотида, кодируемого указанной экзогенной последовательность ДНК при введении субъекту. Указанный зкДНК-вектор может быть введен любым подходящим путем, как описано выше и в других разделах данного документа.[00382] The present invention also provides a method of treating a disease in a subject, comprising administering to a target cell in need thereof (particularly a muscle cell or tissue) of said subject a therapeutically effective amount of a cccDNA vector, optionally with a pharmaceutically acceptable carrier. Although said cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The proposed cccDNA vector contains a nucleotide sequence of interest suitable for treating a disease. In particular, said cDNA vector may contain a desired exogenous DNA sequence operably linked to control elements capable of directing transcription of the desired polypeptide, protein or oligonucleotide encoded by said exogenous DNA sequence when administered to a subject. The specified cDNA vector can be introduced by any suitable route, as described above and elsewhere in this document.
XI. Способы леченияXI. Treatment options
[00383] Описанная в данном документе технология также демонстрирует способы получения, а также способы применения раскрытых зкДНК-векторов разнообразными путями, включая, например, варианты применения, методы, диагностические процедуры и/или схемы генной терапии ex situ, in vitro и in vivo. [00383] The technology described herein also demonstrates methods for producing, as well as methods for using, the disclosed cccDNA vectors in a variety of ways, including, for example, uses, methods, diagnostic procedures and/or gene therapy regimens ex situ, in vitro and in vivo.
[00384] Согласно данному изобретению предложен способ лечения заболевания или расстройства у субъекта, включающий введение в нуждающуюся в этом целевую клетку (например, мышечную клетку или ткань, или другой тип пораженных клеток) субъекта терапевтически эффективного количества зкДНК-вектора, необязательно с фармацевтически приемлемым носителем. Хотя указанный зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Предложенный зкДНК-вектор содержит представляющую интерес нуклеотидную последовательность, подходящую для лечения заболевания. В частности, указанный зкДНК-вектор может содержать требуемую экзогенную последовательность ДНК, функционально связанную с контрольными элементами, способными направлять транскрипцию требуемого полипептида, белка или олигонуклеотида, кодируемого указанной экзогенной последовательность ДНК при введении субъекту. Указанный зкДНК-вектор может быть введен любым подходящим путем, как описано выше и в других разделах данного документа.[00384] The present invention provides a method of treating a disease or disorder in a subject, comprising administering to a target cell in need thereof (e.g., a muscle cell or tissue, or other type of diseased cell) of the subject a therapeutically effective amount of a cccDNA vector, optionally with a pharmaceutically acceptable carrier. . Although said cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The proposed cccDNA vector contains a nucleotide sequence of interest suitable for treating a disease. In particular, said cDNA vector may contain a desired exogenous DNA sequence operably linked to control elements capable of directing transcription of the desired polypeptide, protein or oligonucleotide encoded by said exogenous DNA sequence when administered to a subject. The specified cDNA vector can be introduced by any suitable route, as described above and elsewhere in this document.
[00385] Любой трансген может быть доставлен с помощью зкДНК-векторов согласно описанию в данном документе. Трансгены, представляющие интерес, включают нуклеиновые кислоты, кодирующие полипептиды, или некодирующие нуклеиновые кислоты (например, РНКи, miR и т.п.), предпочтительно терапевтические (например, для медицинского, диагностического или ветеринарного применения) или иммуногенные (например, для вакцин) полипептиды. [00385] Any transgene can be delivered using cDNA vectors as described herein. Transgenes of interest include polypeptide-encoding nucleic acids or non-coding nucleic acids (e.g., RNAi, miR, etc.), preferably therapeutic (e.g., for medical, diagnostic or veterinary use) or immunogenic (e.g., for vaccines) polypeptides.
[00386] Согласно некоторым вариантам реализации трансгены, которые требуется экспрессировать с помощью зкДНК-векторов, описанных в данном документе, экспрессируют или кодируют один или более полипептидов, пептидов, рибозимов, пептидных нуклеиновых кислот, киРНК, РНКи, антисмысловых олигонуклеотидов, антисмысловых полинуклеотидов, антител, антигенсвязывающих фрагментов, или любую комбинацию перечисленного. [00386] In some embodiments, the transgenes to be expressed by the cccDNA vectors described herein express or encode one or more polypeptides, peptides, ribozymes, peptide nucleic acids, siRNA, RNAi, antisense oligonucleotides, antisense polynucleotides, antibodies , antigen-binding fragments, or any combination of the above.
[00387] В частности, указанный трансген может кодировать один или более терапевтических агентов, включая, но не ограничиваясь перечисленными, например, белок (белки), полипептид(ы), пептид(ы), фермент(ы), антитела, антигенсвязывающие фрагменты, а также варианты и/или активные фрагменты перечисленного, агонисты, антагонисты, миметики для применения при лечении, профилактике и/или облегчении одного или более симптомов заболевания, дисфункции, повреждения и/или расстройства. Согласно одному аспекту заболевание, дисфункция, травма, повреждение и/или расстройство представляет собой заболевание, дисфункцию, травму, повреждение и/или расстройство у человека.[00387] In particular, the transgene may encode one or more therapeutic agents, including, but not limited to, protein(s), polypeptide(s), peptide(s), enzyme(s), antibodies, antigen binding fragments, as well as variants and/or active fragments of the above, agonists, antagonists, mimetics for use in the treatment, prevention and/or alleviation of one or more symptoms of a disease, dysfunction, injury and/or disorder. In one aspect, the disease, dysfunction, injury, injury, and/or disorder is a disease, dysfunction, injury, injury, and/or disorder in a human.
[00388] Как отмечено в данном документе, указанный трансген может кодировать терапевтический белок или пептид, или последовательность терапевтической нуклеиновой кислоты или терапевтического агента, в том числе, но не ограничиваясь перечисленными, один или более агонистов, антагонистов, антиапоптотических факторов, ингибиторов, рецепторов, цитокинов, цитотоксинов, эритропоэтических агентов, гликопротеинов, факторов роста, рецепторов факторов роста, гормонов, рецепторов гормонов, интерферонов, интерлейкинов, рецепторов интерлейкина, факторов роста нервов, нейроактивных пептидов, рецепторов нейроактивных пептидов, протеаз, ингибиторов протеаз, протеиндекарбоксилаз, протеинкиназ, ингибиторов протеинкиназ, ферментов, связывающих рецепторы белков, транспортных белков или одного или более их ингибиторов, рецепторов серотонина или одного или более ингибиторов его поглощения, серпинов, рецепторов серпинов, супрессоров опухоли, диагностических молекул, химиотерапевтических агентов, цитотоксинов, или любой комбинации перечисленного.[00388] As noted herein, the transgene may encode a therapeutic protein or peptide, or a therapeutic nucleic acid sequence or therapeutic agent, including, but not limited to, one or more agonists, antagonists, antiapoptotic factors, inhibitors, receptors, cytokines, cytotoxins, erythropoietic agents, glycoproteins, growth factors, growth factor receptors, hormones, hormone receptors, interferons, interleukins, interleukin receptors, nerve growth factors, neuroactive peptides, neuroactive peptide receptors, proteases, protease inhibitors, protein decarboxylases, protein kinases, protein kinase inhibitors , enzymes, receptor binding proteins, transport proteins or one or more inhibitors thereof, serotonin receptors or one or more serotonin uptake inhibitors, serpins, serpin receptors, tumor suppressors, diagnostic molecules, chemotherapeutic agents, cytotoxins, or any combination of the above.
[00389] Согласно некоторым вариантам реализации трансген в экспрессионной кассете, экспрессионного конструкта или зкДНК-векторе, описанном в данном документе, может быть кодон-оптимизирован для клетки-хозяина. В данном документе термин «кодон-оптимизированный» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках представляющих интерес позвоночных, например, мыши или человека (например, гуманизированные последовательности), путем замены по меньшей мере одного, более чем одного или значимого числа кодонов нативной последовательности (например, прокариотической последовательности) на кодоны, которые чаще или наиболее часто используются в генах указанного позвоночного. У различных видов наблюдается конкретный систематический перевес определенных кодонов для конкретных аминокислот. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность оригинального транслируемого белка. Оптимизированные кодоны могут быть определены с применением, например, платформы для оптимизации кодонов и индивидуализированного синтеза генов Gene Forge® от Aptagen (Aptagen, Inc.) или другой общедоступной базы данных.[00389] In some embodiments, a transgene in an expression cassette, expression construct, or cDNA vector described herein may be codon-optimized for a host cell. As used herein, the term “codon-optimized” or “codon optimization” refers to the process of modifying a nucleic acid sequence to enhance expression in vertebrate cells of interest, e.g., mouse or human (e.g., humanized sequences), by replacing at least one, more than one or a significant number of codons of a native sequence (eg, a prokaryotic sequence) to the codons that are most or most frequently used in the genes of the specified vertebrate. Different species exhibit specific systematic preponderance of certain codons for specific amino acids. Typically, codon optimization does not change the amino acid sequence of the original translated protein. Optimized codons can be determined using, for example, the Gene Forge® codon optimization and customized gene synthesis platform from Aptagen (Aptagen, Inc.) or other publicly available database.
[00390] В данном документе раскрыты композиции и составы зкДНК-векторов, которые включают один или более зкДНК-векторов согласно данному изобретению вместе с одним или несколькими фармацевтически приемлемыми буферами, разбавителями или вспомогательными веществами. Такие композиции могут быть включены в один или более диагностических или терапевтических наборов для диагностики, предотвращения, лечения или облегчения одного или более симптомов заболевания, повреждения, расстройства, травмы или дисфункции. Согласно одному аспекту указанное заболевание, повреждение, расстройство, травма или дисфункция представляют собой заболевание, повреждение, расстройство, травму или дисфункцию у человека.[00390] Disclosed herein are compositions and formulations of cccDNA vectors that include one or more ccDNA vectors of this invention along with one or more pharmaceutically acceptable buffers, diluents, or excipients. Such compositions may be included in one or more diagnostic or therapeutic kits for diagnosing, preventing, treating, or alleviating one or more symptoms of a disease, injury, disorder, injury, or dysfunction. In one aspect, said disease, injury, disorder, injury, or dysfunction is a disease, injury, disorder, injury, or dysfunction in a human.
[00391] Другой аспект технологии, описанной в данном документе, предусматривает способ обеспечения нуждающегося в этом субъекта диагностически или терапевтически эффективным количеством зкДНК-вектора, причем указанный способ включает введение в клетку, ткань или орган нуждающегося в этом субъекта некоторого количества зкДНК-вектора согласно описанию в данном документе в течение периода времени, обеспечивающего возможность экспрессии трансгена с зкДНК-вектора, с обеспечением таким образом субъекта диагностически или терапевтически эффективным количеством белка, пептида, нуклеиновой кислоты, экспрессируемых указанным зкДНК-вектором. Согласно дополнительному аспекту указанный субъект представляет собой человека.[00391] Another aspect of the technology described herein provides a method of providing a diagnostically or therapeutically effective amount of a cccDNA vector to a subject in need thereof, the method comprising introducing into a cell, tissue or organ of the subject in need thereof an amount of the cccDNA vector as described herein herein for a period of time allowing the transgene to be expressed from a cccDNA vector, thereby providing the subject with a diagnostically or therapeutically effective amount of the protein, peptide, nucleic acid expressed by said cccDNA vector. According to a further aspect, said subject is a human.
[00392] Согласно другому аспекту технологии, описанной в данном документе, предложен способ диагностики, предотвращения, лечения или облегчения по меньшей мере одного или более симптомов заболевания, расстройства, нарушения функции, повреждения, аномального состояния или травмы у субъекта. В общем и широком смысле указанный способ включает, по меньшей мере, этап введения нуждающемуся в этом субъекту одного или более раскрытых зкДНК-векторов, в количестве и в течение времени, достаточных для диагностики, предотвращения, лечения или облегчения одного или более симптомов заболевания, расстройства, дисфункции, повреждения, аномального состояния или травмы у субъекта. Согласно дополнительному аспекту указанный субъект представляет собой человека.[00392] According to another aspect of the technology described herein, there is provided a method of diagnosing, preventing, treating, or alleviating at least one or more symptoms of a disease, disorder, dysfunction, injury, abnormal condition, or injury in a subject. In a general and broad sense, the method includes at least the step of administering to a subject in need thereof one or more disclosed cccDNA vectors, in an amount and for a duration of time sufficient to diagnose, prevent, treat, or alleviate one or more symptoms of a disease, disorder , dysfunction, damage, abnormal condition, or injury in the subject. According to a further aspect, said subject is a human.
[00393] Другой аспект представлен применением указанного зкДНК-вектора в качестве инструмента для лечения или снижения одного или более симптомов заболевания или болезненных состояний. Существует ряд наследственных заболеваний, для которых известны дефектные гены, и которые, как правило, делят на два класса: состояния недостаточности, как правило, недостаточности ферментов, которые обычно наследуются по рецессивному типу, и состояния дисбаланса, в которые могут быть вовлечены регуляторные или структурные белки, и которые, как правило, но не всегда, наследуются по доминантному типу. В случае заболеваний с состояниями недостаточности зкДНК-векторы могут применяться для доставки трансгенов с целью введения нормального гена в пораженные ткани для заместительной терапии, а также, согласно некоторым вариантам реализации, для создания моделей заболевания на животных с применением антисмысловых мутаций. В случае болезненных состояний разбалансированности, зкДНК-векторы могут применяться для создания болезненного состояния в модельной системе, которая затем может использоваться для противодействия указанному болезненному состоянию. Таким образом, зкДНК-векторы и способы, раскрытые в данном документе, позволяют лечить генетические заболевания. Согласно данному документу лечение болезненного состояния осуществляют путем частичного или полного устранения недостаточности или дисбаланса, которые вызывают заболевание или делают его более тяжелым. [00393] Another aspect is provided by the use of said cccDNA vector as a tool for treating or reducing one or more symptoms of a disease or disease state. There are a number of hereditary diseases for which defective genes are known and which are generally divided into two classes: states of deficiency, usually enzyme deficiencies, which are usually inherited in a recessive manner, and states of imbalance, which may involve regulatory or structural proteins, and which are usually, but not always, inherited in a dominant manner. For diseases with deficiency conditions, cccDNA vectors can be used to deliver transgenes to introduce the normal gene into diseased tissues for replacement therapy, and, in some embodiments, to create animal models of the disease using antisense mutations. In the case of disease states of imbalance, cccDNA vectors can be used to create a disease state in a model system, which can then be used to counteract said disease state. Thus, the cccDNA vectors and methods disclosed herein enable the treatment of genetic diseases. According to this document, treatment of a disease state is carried out by partially or completely eliminating the deficiency or imbalance that causes the disease or makes it more severe.
[00394] В еще одном дополнительном аспекте зкДНК-вектор согласно описанию в данном документе может применяться для доставки гетерологичной нуклеотидной последовательности в ситуациях, когда требуется регуляция уровня трансгенной экспрессии (например, экспрессии трансгенов, кодирующих гормоны или факторы роста, согласно описанию в данном документе). [00394] In yet another additional aspect, a cccDNA vector as described herein can be used to deliver a heterologous nucleotide sequence in situations where regulation of the level of transgene expression (for example, the expression of transgenes encoding hormones or growth factors, as described herein) is required. .
[00395] Соответственно, согласно некоторым вариантам реализации зкДНК-вектор, описанный в данном документе, может применяться для коррекции аномального уровня и/или функции генного продукта (например, отсутствия или дефекта белка), который приводит к заболеванию или расстройству. Указанный зкДНК-вектор может продуцировать функциональный белок и/или модифицировать уровни указанного белка для облегчения или снижения симптомов, возникающих в результате конкретного заболевания или расстройства, вызываемого отсутствием или дефектом белка или обеспечивать преимущество при указанном заболевании или расстройстве. Например, лечение недостаточности OTC может осуществляться путем продуцирования функционального фермента OTC; лечение гемофилии A и B может осуществляться путем модификации уровней фактора VIII, фактора IX и фактора X; лечение ФКУ может осуществляться путем модификации уровней фермента фенилаланингидроксилазы; лечение болезни Фабри или болезни Гоше может осуществляться путем продуцирования функциональной альфа-галактозидазы или бета-глюкоцереброзидазы, соответственно; лечение MLD или MPSII может осуществляться путем продуцирования функциональной арилсульфатазы A или идуронат-2-сульфатазы, соответственно; лечение кистозного фиброза может осуществляться путем продуцирования функционального регулятора трансмембранной проводимости при кистозном фиброзе; лечение болезни накопления гликогена может осуществляться путем восстановления функции функционального фермента глюкозо-6-фосфатазы; и лечение PFIC может осуществляться путем получения функциональных генов ATP8B1, ABCB11, ABCB4 или TJP2. [00395] Accordingly, in some embodiments, a cccDNA vector described herein can be used to correct an abnormal level and/or function of a gene product (eg, a missing or defective protein) that results in a disease or disorder. Said cccDNA vector may produce a functional protein and/or modify levels of said protein to alleviate or reduce symptoms resulting from or provide an advantage to a particular disease or disorder caused by the absence or defect of the protein. For example, treatment of OTC deficiency can be achieved by producing a functional OTC enzyme; treatment of hemophilia A and B can be achieved by modifying the levels of factor VIII, factor IX and factor X; treatment of PKU can be achieved by modifying levels of the enzyme phenylalanine hydroxylase; treatment of Fabry disease or Gaucher disease can be achieved by producing functional alpha-galactosidase or beta-glucocerebrosidase, respectively; treatment of MLD or MPSII can be achieved by producing functional arylsulfatase A or iduronate-2-sulfatase, respectively; treatment of cystic fibrosis can be carried out by producing a functional regulator of transmembrane conductance in cystic fibrosis; treatment of glycogen storage disease can be carried out by restoring the function of the functional enzyme glucose-6-phosphatase; and treatment of PFIC can be achieved by obtaining functional ATP8B1, ABCB11, ABCB4 or TJP2 genes.
[00396] Согласно альтернативным вариантам реализации зкДНК-векторы согласно описанию в данном документе могут применяться для обеспечения клетки антисмысловой нуклеиновой кислотой in vitro или in vivo. Например, если трансген представляет собой молекулу РНКи, экспрессия антисмысловой нуклеиновой кислоты или РНКи в целевой клетке снижает уровень экспрессии конкретного белка указанной клеткой. Соответственно, трансгены, представляющие собой молекулы РНКи или антисмысловые нуклеиновые кислоты, могут быть введены для снижения уровня экспрессии конкретного белка у нуждающегося в этом субъекта. Антисмысловые нуклеиновые кислоты также можно вводить в клетки in vitro для регуляции физиологии клеток, например, для оптимизации систем культивирования клеток или тканей.[00396] In alternative embodiments, cccDNA vectors as described herein can be used to provide antisense nucleic acid to a cell in vitro or in vivo. For example, if the transgene is an RNAi molecule, expression of an antisense nucleic acid or RNAi in a target cell reduces the level of expression of a particular protein by that cell. Accordingly, transgenes, which are RNAi molecules or antisense nucleic acids, can be introduced to reduce the level of expression of a particular protein in a subject in need thereof. Antisense nucleic acids can also be introduced into cells in vitro to regulate cell physiology, for example to optimize cell or tissue culture systems.
[00379] В некоторых вариантах реализации типичные примеры трансгенов, кодируемых зкДНК-вектором, включают, без ограничений: X, лизосомальные ферменты (например, гексозаминидазу A, ассоциированную с болезнью Тея-Сакса, или идуронатсульфатазу, ассоциированную с синдромом Гунтера/MPS II), эритропоэтин, ангиостатин, эндостатин, супероксиддисмутазу, глобин, лептин, каталазу, тирозингидроксилазу, а также цитокины (например, интерферон, β-интерферон, интерферон-γ, интерлейкин-2, интерлейкин-4, интерлейкин 12, гранулоцитарно-макрофагальный колониестимулирующий фактор, лимфотоксин и т.п.), пептидные факторы роста и гормоны (например, соматотропин, инсулин, инсулиноподобные факторы роста 1 и 2, тромбоцитарный фактор роста (ТРФ), эпидермальный фактор роста (ЭФР), фактор роста фибробластов (ФРФ), фактор роста нервов (ФРН), нейротрофический фактор-3 и 4, нейротрофический фактор головного мозга (BDNF), глиальный фактор роста (GDNF), трансформирующие факторы роста α и β; и т.п.), рецепторы (например, рецептор фактора некроза опухоли). В некоторых примерах вариантов реализации указанный трансген кодирует моноклональное антитело, специфическое в отношении одной или более требуемых мишеней. В некоторых примерах вариантов реализации указанный зкДНК-вектор кодирует более одного трансгена. В некоторых примерах вариантов реализации указанный трансген кодирует слитый белок, содержащий два разных представляющих интерес полипептида. Согласно некоторым вариантам реализации указанный трансген кодирует антитело, в том числе полноразмерное антитело или фрагмент антитела согласно определению в данном документе. Согласно некоторым вариантам реализации указанное антитело представляет собой последовательность антигенсвязывающего домена или вариабельного домена иммуноглобулина согласно определению в данном документе. Другие иллюстративные примеры трансгенных последовательностей кодируют продукты суицидных генов (тимидинкиназу, цитозиндезаминазу, дифтерийный токсин, цитохром P450, дезоксицитидинкиназу и фактор некроза опухоли), белки, придающие устойчивость к лекарственным средствам, применяемым в противораковой терапии, и продукты генов-супрессоров опухолей. [00379] In some embodiments, representative examples of transgenes encoded by a cccDNA vector include, but are not limited to: X, lysosomal enzymes (e.g., hexosaminidase A associated with Tay-Sachs disease or iduronate sulfatase associated with Gunther syndrome/MPS II), erythropoietin, angiostatin, endostatin, superoxide dismutase, globin, leptin, catalase, tyrosine hydroxylase, and cytokines (eg, interferon, β-interferon, interferon-γ, interleukin-2, interleukin-4, interleukin 12, granulocyte-macrophage colony-stimulating factor, lymphotoxin etc.), peptide growth factors and hormones (for example, somatotropin, insulin, insulin-like growth factors 1 and 2, platelet-derived growth factor (TRF), epidermal growth factor (EGF), fibroblast growth factor (FGF), nerve growth factor (NGF), neurotrophic factor-3 and 4, brain-derived neurotrophic factor (BDNF), glial growth factor (GDNF), transforming growth factors α and β; etc.), receptors (eg, tumor necrosis factor receptor). In some example embodiments, the transgene encodes a monoclonal antibody specific for one or more desired targets. In some example embodiments, the cDNA vector encodes more than one transgene. In some example embodiments, the transgene encodes a fusion protein comprising two different polypeptides of interest. In some embodiments, the transgene encodes an antibody, including a full-length antibody or antibody fragment as defined herein. In some embodiments, the antibody is an antigen binding domain or immunoglobulin variable domain sequence as defined herein. Other illustrative examples of transgene sequences encode suicide gene products (thymidine kinase, cytosine deaminase, diphtheria toxin, cytochrome P450, deoxycytidine kinase, and tumor necrosis factor), proteins that confer resistance to drugs used in anticancer therapy, and tumor suppressor gene products.
[00398] Согласно репрезентативному варианту реализации экспрессируемый указанным зкДНК-вектором трансген может применяться для лечения мышечной дистрофии у нуждающегося в этом субъекта, при этом указанный способ включает: введение эффективного для лечения, облегчения или предотвращения количества зкДНК-вектора, описанного в данном документе, причем указанный зкДНК-вектор содержит гетерологичную нуклеиновую кислоту, кодирующую дистрофин, минидистрофин, микродистрофин, пропептид миостатина, фоллистатин, растворимый рецептор активина II типа, ИФР-1, противовоспалительные полипептиды, такие как доминантный мутант I-каппа-B, саркоспан, утрофин, микродистрофин, ламинин-α2, α-саркогликан, β-саркогликан, γ-саркогликан, Δ-саркогликан, ИФР-1, антитело или фрагмент антитела против миостатина или пропептида миостатина, и/или РНКи, направленная против миостатина. Согласно конкретным вариантам реализации указанный зкДНК-вектор может быть введен в скелетную, диафрагмальную и/или сердечную мышцу согласно описанию в тексте данного документа. [00398] In an exemplary embodiment, a transgene expressed by said cccDNA vector can be used to treat muscular dystrophy in a subject in need thereof, the method comprising: administering an effective amount of the cccDNA vector described herein to treat, alleviate, or prevent, said cccDNA vector contains a heterologous nucleic acid encoding dystrophin, minidystrophin, microdystrophin, myostatin propeptide, follistatin, soluble type II activin receptor, IGF-1, anti-inflammatory polypeptides such as dominant mutant I-kappa-B, sarcospan, utrophin, microdystrophin, laminin-α2, α-sarcoglycan, β-sarcoglycan, γ-sarcoglycan, Δ-sarcoglycan, IGF-1, antibody or antibody fragment against myostatin or myostatin propeptide, and/or RNAi directed against myostatin. In specific embodiments, the cccDNA vector can be introduced into skeletal, diaphragmatic, and/or cardiac muscle as described herein.
[00399] В некоторых вариантах реализации указанный зкДНК-вектор может применяться для доставки трансгена в скелетную, сердечную или диафрагмальную мышцу, для продуцирования полипептида (например, фермента) или функциональной РНК (например, РНК-интерференции, микроРНК, антисмысловой РНК), которая в норме циркулирует в крови, или для системной доставки в другие ткани, для лечения, облегчения и/или предотвращения расстройства (например, метаболического расстройства, такого как диабет (например, инсулина), гемофилии (например, VIII), мукополисахаридозного расстройства (например, синдрома Слая, синдрома Гурлер, синдрома Шейе, синдрома Гурлер-Шейе, синдрома Гунтера, синдрома Санфилиппо A, B, C, D, синдрома Моркио, синдрома Марото-Лами и т.п.) или расстройства лизосомального накопления (такого как болезнь Гоше [глюкоцереброзидаза], болезнь Помпе [лизосомальная кислая альфа-глюкозидаза] или болезнь Фабри [альфа-галактозидаза A]) или расстройства накопления гликогена (такие как болезнь Помпе [лизосомальная кислая альфа-глюкозидаза]). Другие подходящие белки для лечения, облегчения и/или предотвращения метаболических расстройств описаны выше.[00399] In some embodiments, the cccDNA vector can be used to deliver a transgene to skeletal, cardiac, or diaphragmatic muscle to produce a polypeptide (e.g., enzyme) or functional RNA (e.g., RNA interference, microRNA, antisense RNA) that normally circulates in the blood, or for systemic delivery to other tissues, to treat, alleviate, and/or prevent a disorder (eg, a metabolic disorder such as diabetes (eg, insulin), hemophilia (eg, VIII), mucopolysaccharidosis disorder (eg, Sly's syndrome, Hurler's syndrome, Scheie's syndrome, Hurler-Scheie's syndrome, Gunther's syndrome, Sanfilippo's syndrome A, B, C, D, Morquio's syndrome, Maroteaux-Lamy syndrome, etc., or a lysosomal storage disorder (such as Gaucher's disease [glucocerebrosidase ], Pompe disease [lysosomal acid alpha-glucosidase] or Fabry disease [alpha-galactosidase A]) or glycogen storage disorders (such as Pompe disease [lysosomal acid alpha-glucosidase]). Other suitable proteins for the treatment, amelioration and/or prevention of metabolic disorders are described above.
[00400] Согласно другим вариантам реализации зкДНК-вектор согласно описанию в данном документе может применяться для доставки трансгена в способе лечения, облегчения и/или предотвращения метаболического расстройства у нуждающегося в этом субъекта. Иллюстративные примеры метаболических расстройств и трансгенов, кодирующих полипептиды, описаны в данном документе. Необязательно, указанный полипептид секретируется (например, полипептид, который представляет собой секретируемый полипептид в естественном состоянии, или полипептид, сконструированный таким образом, чтобы обеспечить его секрецию, например, за счет достижения функциональной связи с секреторной сигнальной последовательностью, как известно специалистам в данной области техники). [00400] In other embodiments, a cccDNA vector as described herein can be used to deliver a transgene in a method of treating, ameliorating, and/or preventing a metabolic disorder in a subject in need thereof. Illustrative examples of metabolic disorders and transgenes encoding polypeptides are described herein. Optionally, the polypeptide is secreted (e.g., a polypeptide that is a naturally occurring secreted polypeptide, or a polypeptide that is engineered to be secreted, e.g., by achieving functional association with a secretory signal sequence, as is known to those skilled in the art ).
[00401] Согласно другим вариантам реализации зкДНК-вектор согласно описанию в данном документе можно применять для лечения судорог, например, для снижения возникновения, частоты или тяжести судорог. Эффективность терапевтического лечения судорог может быть оценена на основании поведенческих признаков (например, дрожи, глазных или ротовых тиков) и/или электрографическими способами (большинство судорог характеризуются отличительными электрографическими аномалиями). Таким образом, зкДНК-вектор, описанный в данном документе, также можно применять для лечения эпилепсии, для которой характерны множественные припадки во временной перспективе. Согласно одному репрезентативному варианту реализации соматостатин (или его активный фрагмент) вводят в головной мозг с применением зкДНК-вектора согласно описанию в данном документе для лечения опухоли гипофиза. В соответствии с указанным вариантом реализации зкДНК-вектор согласно описанию в данном документе, кодирующий соматостатин (или его активный фрагмент), вводят в гипофиз путем микроинфузии. Аналогичным образом, такое лечение можно применять для лечения акромегалии (аномальной секреции гормона роста гипофизом). Последовательности нуклеиновой кислоты (например, № доступа GenBank J00306) и последовательность аминокислот (например, № доступа GenBank P01166; содержит процессированные активные пептиды соматостатин-28 и соматостатин-14) соматостатинов известны специалистам в данной области техники. Согласно конкретным вариантам реализации указанный зкДНК-вектор может кодировать трансген, который содержит секреторный сигнал, согласно описанию в патенте США № 7071172. [00401] In other embodiments, a cccDNA vector as described herein can be used to treat seizures, for example, to reduce the occurrence, frequency, or severity of seizures. The effectiveness of therapeutic treatment of seizures can be assessed based on behavioral signs (eg, trembling, eye or oral tics) and/or electrographic methods (most seizures are characterized by distinctive electrographic abnormalities). Thus, the cccDNA vector described herein can also be used to treat epilepsy, which is characterized by multiple seizures over time. In one exemplary embodiment, somatostatin (or an active fragment thereof) is administered to the brain using a cccDNA vector as described herein for the treatment of a pituitary tumor. In accordance with this embodiment, a cccDNA vector as described herein encoding somatostatin (or an active fragment thereof) is introduced into the pituitary gland by microinfusion. Similarly, this treatment can be used to treat acromegaly (abnormal secretion of growth hormone by the pituitary gland). The nucleic acid sequence (eg, GenBank Accession No. J00306) and amino acid sequence (eg, GenBank Accession No. P01166; contains the processed active peptides somatostatin-28 and somatostatin-14) of somatostatins are known to those skilled in the art. In specific embodiments, the cccDNA vector may encode a transgene that contains a secretory signal as described in US Pat. No. 7,071,172.
[00402] Другой аспект данного изобретения относится к применению зкДНК-вектора согласно описанию в данном документе для получения антисмысловой РНК, РНКи или другой функциональной РНК (например, рибозима) для системной доставки субъекту in vivo. Соответственно, согласно некоторым вариантам реализации указанный зкДНК-вектор может содержать трансген, который кодирует антисмысловую нуклеиновую кислоту, рибозим (например, согласно описанию в патенте США №5877022), РНК, которые влияют на опосредованный сплайсосомой транс-сплайсинг (см. Puttaraju et al., (1999) Nature Biotech. 17:246; патент США №6013487; патент США №6083702), интерферирующие РНК (РНКи), опосредующие сайленсинг генов (см. Sharp et al., (2000) Science 287:2431), или другие нетранслируемые РНК, такие как «гидовые» РНК (Gorman et al., (1998) Proc. Nat. Acad. Sci. USA 95:4929; патент США № 5869248, выданный Yuan с соавторами); и т.п.[00402] Another aspect of the present invention relates to the use of a cccDNA vector as described herein to produce antisense RNA, RNAi, or other functional RNA (eg, a ribozyme) for systemic delivery to a subject in vivo. Accordingly, in some embodiments, the cccDNA vector may contain a transgene that encodes an antisense nucleic acid, a ribozyme (e.g., as described in US Pat. No. 5,877,022), RNAs that affect spliceosome-mediated trans-splicing (see Puttaraju et al. , (1999) Nature Biotech. 17:246; US Patent No. 6013487; US Patent No. 6083702), interfering RNAs (RNAi) mediating gene silencing (see Sharp et al., (2000) Science 287:2431), or others untranslated RNAs such as guide RNAs (Gorman et al., (1998) Proc. Nat. Acad. Sci. USA 95:4929; US Pat. No. 5,869,248 to Yuan et al.); and so on.
[00403] Согласно некоторым вариантам реализации указанный зкДНК-вектор может дополнительно также содержать трансген, который кодирует репортерный полипептид (например, фермент, такой как зеленый флуоресцентный белок или щелочная фосфатаза). Согласно некоторым вариантам реализации трансген, который кодирует репортерный белок, подходящий для экспериментальных или диагностических целей, выбирают из любого из следующих трансгенов: β-лактамазы, β-галактозидазы (LacZ), щелочной фосфатазы, тимидинкиназы, зеленого флуоресцентного белка (GFP), хлорамфениколацетилтрансферазы (CAT), люциферазы и других генов, хорошо известных в данной области техники. Согласно некоторым аспектам зкДНК-векторы, содержащие трансген, кодирующие репортерный полипептид, могут быть использованы в диагностических целях или в качестве маркеров активности зкДНК-вектора у субъекта, которому их вводят. [00403] In some embodiments, the cccDNA vector may further also contain a transgene that encodes a reporter polypeptide (eg, an enzyme such as green fluorescent protein or alkaline phosphatase). In some embodiments, the transgene that encodes a reporter protein suitable for experimental or diagnostic purposes is selected from any of the following transgenes: β-lactamase, β-galactosidase (LacZ), alkaline phosphatase, thymidine kinase, green fluorescent protein (GFP), chloramphenicol acetyltransferase ( CAT), luciferase and other genes well known in the art. In some aspects, cccDNA vectors containing a transgene encoding a reporter polypeptide can be used for diagnostic purposes or as markers of cccDNA vector activity in a subject to which they are administered.
[00404] Согласно некоторым вариантам реализации указанный зкДНК-вектор может содержать трансген или гетерологичную нуклеотидную последовательность, который(ая) обладает гомологией в отношении локуса на хромосоме хозяина и рекомбинирует с ним. Указанный подход может быть использован для коррекции генетического дефекта в клетке-хозяине. [00404] In some embodiments, the cccDNA vector may contain a transgene or heterologous nucleotide sequence that has homology to and recombines with a locus on the host chromosome. This approach can be used to correct a genetic defect in a host cell.
XII. ВведениеXII. Introduction
[00405] Согласно конкретным вариантам реализации может быть проведено более одного введения (например, два, три, четыре или более введений) для достижения желаемого уровня экспрессии гена на протяжении периода времени с интервалами различной продолжительности, например, ежедневно, еженедельно, ежемесячно, ежегодно и т.п. [00405] In certain embodiments, more than one administration (e.g., two, three, four, or more administrations) may be administered to achieve the desired level of gene expression over a period of time at intervals of varying lengths, such as daily, weekly, monthly, annually, and etc.
[00406] Примеры способов введения зкДНК-вектора, описанного в данном документе, включают пероральное, ректальное, трансмукозальное, интраназальное, ингаляционное (например, в аэрозоле), буккальное (например, сублингвальное), вагинальное, интратекальное, внутриглазное, чрескожное, интраэндотелиальное введение, введение in utero (или in ovo), парентеральное (например, внутривенное, подкожное, внутрикожное, внутричерепное, внутримышечное [в том числе введение в скелетную, диафрагмальную и/или сердечную мышцу], внутриплевральное, интрацеребральное и внутрисуставное), местное (например, введение на поверхность кожи и слизистых оболочек, в том числе поверхности дыхательных путей, и чрескожное введение), внутрилимфатическое введение и т.п., а также прямую инъекцию в ткань или орган (например, в печень, глаз, скелетную мышцу, сердечную мышцу, диафрагмальную мышцу или головной мозг).[00406] Examples of routes for administering the cccDNA vector described herein include oral, rectal, transmucosal, intranasal, inhalation (e.g., aerosol), buccal (e.g., sublingual), vaginal, intrathecal, intraocular, transdermal, intraendothelial, in utero (or in ovo), parenteral (e.g., intravenous, subcutaneous, intradermal, intracranial, intramuscular [including skeletal, diaphragmatic, and/or cardiac], intrapleural, intracerebral, and intraarticular), local (e.g., on the surface of the skin and mucous membranes, including the surface of the respiratory tract, and percutaneous administration), intralymphatic administration, etc., as well as direct injection into a tissue or organ (for example, into the liver, eye, skeletal muscle, cardiac muscle, diaphragm muscle or brain).
[00407] Введение указанного зкДНК-вектора субъекту может осуществляться на любом участке, включая, без ограничений, участок, выбранный из группы, состоящей из головного мозга, скелетной мышцы, гладкой мышцы, сердца, диафрагмы, эпителия дыхательных путей, печени, почки, селезенки, поджелудочной железы, кожи и глаза. Также может осуществляться введение зкДНК-вектора в опухоль (например, внутрь опухоли или лимфатического узла или рядом с ней). Наиболее подходящий путь в том или ином конкретном случае зависит от природы и тяжести состояния, лечение, облегчение и/или предотвращение которого проводят, и от природы конкретного используемого зкДНК-вектора. Кроме того, зкДНК позволяет вводить более одного трансгена в единственном векторе или в нескольких зкДНК-векторах (например, в коктейле зкДНК).[00407] Administration of said cccDNA vector to a subject may be at any site, including, but not limited to, a site selected from the group consisting of brain, skeletal muscle, smooth muscle, heart, diaphragm, respiratory epithelium, liver, kidney, spleen , pancreas, skin and eyes. The cccDNA vector may also be introduced into a tumor (eg, into or near a tumor or lymph node). The most appropriate route in any given case depends on the nature and severity of the condition being treated, ameliorated and/or prevented, and the nature of the particular cccDNA vector used. In addition, cccDNA allows the introduction of more than one transgene in a single vector or in multiple cccDNA vectors (eg, a cccDNA cocktail).
[00408] А. Диапазоны доз[00408] A. Dose Ranges
[00409] Необязательно могут быть использованы анализы in vivo и/или in vitro для определения оптимальных диапазонов дозировок для применения. Точная доза для использования в композиции будет также зависеть от пути введения и серьезности состояния и должна определяться на основании решения специалиста в данной области техники и с учетом обстоятельств каждого субъекта. Эффективные дозы могут быть экстраполированы из кривых доза-ответ, полученных из тест-систем in vitro или на животных моделях. [00409] Optionally, in vivo and/or in vitro assays may be used to determine optimal dosage ranges for use. The exact dosage to be used in the composition will also depend on the route of administration and the severity of the condition and should be determined based on the judgment of one skilled in the art and taking into account the circumstances of each subject. Effective doses can be extrapolated from dose-response curves obtained from in vitro test systems or animal models.
[00410] ЗкДНК-вектор вводят в достаточных количествах для трансфекции клеток требуемой ткани и обеспечения достаточных уровней переноса генов и экспрессии без чрезмерных нежелательных явлений. Стандартные и фармацевтически приемлемые пути введения включают, не ограничиваясь перечисленными, описанные ниже в разделе «Введение», такие как прямая доставка в выбранный орган (например, интрапортальная доставка в печень), пероральная доставка, ингаляция (в том числе интраназальная и внутритрахеальная доставка), интраокулярная, внутривенная, внутримышечная, подкожная, внутрикожная, внутриопухолевая доставка; и другие парентеральные пути введения. Пути введения могут быть скомбинированы, если требуется.[00410] The cccDNA vector is administered in sufficient quantities to transfect cells of the desired tissue and provide sufficient levels of gene transfer and expression without excessive adverse effects. Standard and pharmaceutically acceptable routes of administration include, but are not limited to, those described below in the Introduction section, such as direct delivery to the target organ (e.g., intraportal delivery to the liver), oral delivery, inhalation (including intranasal and intratracheal delivery), intraocular, intravenous, intramuscular, subcutaneous, intradermal, intratumoral delivery; and other parenteral routes of administration. Routes of administration can be combined if required.
[00411] Доза количества зкДНК-вектора, необходимая для достижения определенного «терапевтического эффекта», будет варьировать в зависимости от нескольких факторов, в том числе, но не ограничиваясь перечисленными: от пути введения нуклеиновой кислоты, уровня экспрессии гена или РНК, необходимого для достижения терапевтического эффекта, конкретного заболевания или расстройства, лечение которого проводят, и стабильности гена (генов), РНК-продукта (продуктов) или итогового экспрессируемого белка (белков). Специалист в данной области техники легко сможет определить диапазон доз зкДНК-вектора для лечения пациента, имеющего конкретное заболевание или расстройство, на основе вышеупомянутых факторов, а также других факторов, хорошо известных в данной области техники.[00411] The dosage amount of cccDNA vector required to achieve a given "therapeutic effect" will vary depending on several factors, including, but not limited to: the route of administration of the nucleic acid, the level of gene or RNA expression required to achieve therapeutic effect, the specific disease or disorder being treated, and the stability of the gene(s), RNA product(s), or resulting protein(s) expressed. One skilled in the art will readily be able to determine a dosage range of a cccDNA vector for treating a patient having a particular disease or disorder based on the above factors as well as other factors well known in the art.
[00412] Режим дозирования может быть скорректирован для обеспечения оптимального терапевтического ответа. Например, олигонуклеотид может вводиться неоднократно, например, ежедневно может вводиться несколько доз, или доза может быть пропорционально снижена с учетом диктуемой терапевтической ситуацией необходимости. Специалист в данной области техники сможет легко определить подходящие дозы и схемы введения олигонуклеотидов согласно данному изобретению, как для введения в клетки, так и для введения субъектам.[00412] The dosage regimen may be adjusted to provide an optimal therapeutic response. For example, the oligonucleotide may be administered repeatedly, for example multiple doses may be administered daily, or the dose may be proportionally reduced based on the therapeutic situation dictated. One skilled in the art will readily be able to determine suitable dosages and administration schedules for the oligonucleotides of this invention, both for administration to cells and for administration to subjects.
[00413] «Терапевтически эффективная доза» находится в относительно широком диапазоне значений, который может быть определен в ходе клинических испытаний и зависит от конкретного применения (нервные клетки потребуют очень незначительных количеств, тогда как для системных инъекций потребуются значительные количества). Например, для прямой инъекции in vivo в скелетную или сердечную мышцу человека, величина терапевтически эффективной дозы будет составлять от примерно 1 мкг до 100 г зкДНК-вектора. Если для доставки зкДНК-вектора используются экзосомы или микрочастицы, то терапевтически эффективная доза может быть определена экспериментально, но ожидается, что она должна доставить от 1 мкг до примерно 100 г вектора.[00413] A "therapeutically effective dose" is within a relatively wide range of values that can be determined in clinical trials and depends on the specific application (nerve cells will require very small amounts, whereas systemic injections will require significant amounts). For example, for direct in vivo injection into human skeletal or cardiac muscle, a therapeutically effective dose would range from about 1 μg to 100 g of cccDNA vector. If exosomes or microparticles are used to deliver the cccDNA vector, the therapeutically effective dose can be determined experimentally but is expected to deliver between 1 μg and approximately 100 g of vector.
[00414] Приготовление фармацевтически приемлемых вспомогательных веществ и растворов носителей хорошо известно специалистам в данной области, как и разработка подходящих режимов дозирования и лечения для применения конкретных композиций, описанных в данном документе, в различных схемах лечения. [00414] The preparation of pharmaceutically acceptable excipients and carrier solutions is well known to those skilled in the art, as is the development of suitable dosage and treatment regimens for use of the specific compositions described herein in various treatment regimens.
[00415] Для трансфекции in vitro эффективное количество зкДНК-вектора, которое нужно доставить в клетки (1×106 клеток), составляет порядка 0,1-100 мкг зкДНК-вектора, предпочтительно от 1 до 20 мкг, и более предпочтительно от 1 до 15 мкг, или от 8 до 10 мкг. Для зкДНК-векторов большего размера требуются более высокие дозы. Если используются экзосомы или микрочастицы, эффективная доза in vitro может быть определена экспериментально, однако она должна обеспечивать доставку, в общем, такого же количества зкДНК-вектора.[00415] For in vitro transfection, the effective amount of ccDNA vector to be delivered into cells (1×10 6 cells) is on the order of 0.1-100 μg of ccDNA vector, preferably from 1 to 20 μg, and more preferably from 1 up to 15 mcg, or from 8 to 10 mcg. Larger cccDNA vectors require higher doses. If exosomes or microparticles are used, the effective in vitro dose can be determined experimentally, but must deliver generally the same amount of cccDNA vector.
[00416] Лечение может включать введение разовой дозы или нескольких доз. Согласно некоторым вариантам реализации субъекту может быть введено более одной дозы; фактически, дозы могут вводиться многократно по мере необходимости, поскольку зкДНК-вектор не вызывает у хозяина иммунного ответа против капсида ввиду отсутствия вирусного капсида. Следовательно, специалист в данной области может легко определить подходящее количество доз. Количество вводимых доз может составлять, например, примерно 1-100, предпочтительно 2-20 доз.[00416] Treatment may include administration of a single dose or multiple doses. In some embodiments, more than one dose may be administered to a subject; in fact, doses can be administered multiple times as needed since the cccDNA vector does not induce an immune response against the capsid in the host due to the absence of a viral capsid. Therefore, one skilled in the art can easily determine the appropriate number of doses. The number of doses administered may be, for example, about 1-100, preferably 2-20 doses.
[00417] Без связи с какой-либо конкретной теорией отметим, что отсутствие типичного противовирусного иммунного ответа при введении зкДНК-вектора согласно описанию в данном документе (т.е. отсутствие капсидных компонентов) позволяет вводить зкДНК-вектор хозяину неоднократно. Согласно некоторым вариантам реализации число введений гетерологичной нуклеиновой кислоты субъекту составляет от 2 до 10 раз (например, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз). Согласно некоторым вариантам реализации зкДНК-вектор доставляют субъекту более 10 раз.[00417] Without wishing to be bound by any particular theory, the absence of a typical antiviral immune response upon administration of a cccDNA vector as described herein (ie, the absence of capsid components) allows the cccDNA vector to be administered to a host repeatedly. In some embodiments, the number of times the heterologous nucleic acid is administered to a subject is 2 to 10 times (eg, 2, 3, 4, 5, 6, 7, 8, 9, or 10 times). In some embodiments, the cccDNA vector is delivered to a subject more than 10 times.
[00418] Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не более одного раза в календарный день (например, за 24-часовой период). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не более одного раза в 2, 3, 4, 5, 6, или 7 календарных дней. Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не более одного раза в календарную неделю (например, 7 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в две недели (например, один раз за период, равный двум календарным неделям). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не более одного раза в календарный месяц (например, один раз в 30 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не более одного раза в шесть календарных месяцев. Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не более одного раза в календарный год (например, за 365 дней или 366 дней в высокосном году).[00418] In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar day (eg, in a 24-hour period). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every 2, 3, 4, 5, 6, or 7 calendar days. In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar week (eg, 7 calendar days). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every two weeks (eg, once every two calendar weeks). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar month (eg, once every 30 calendar days). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every six calendar months. In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar year (eg, 365 days or 366 days in a high year).
[00419] В. Единичные лекарственные формы[00419] B. Unit Dosage Forms
[00420] В некоторых вариантах реализации фармацевтические композиции могут быть удобно представлены в виде единичной лекарственной формы. Единичная лекарственная форма обычно будет адаптирована к одному или нескольким конкретным путям введения фармацевтической композиции. Согласно некоторым вариантам реализации указанная единичная лекарственная форма адаптирована для введения путем ингаляции. Согласно некоторым вариантам реализации указанная единичная лекарственная форма адаптирована для введения с помощью испарителя. Согласно некоторым вариантам реализации указанная единичная лекарственная форма адаптирована для введения с помощью небулайзера. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью генератора аэрозоля. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для перорального введения, для буккального введения или для сублингвального введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для внутривенного, внутримышечного или подкожного введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для интратекального или интрацеребровентрикулярного введения. Согласно некоторым вариантам реализации фармацевтическая композиция представлена составом для местного введения. Количество активного ингредиента, которое может быть скомбинировано с материалом носителя для получения единичной лекарственной формы, обычно представлено таким количеством указанного соединения, которое обеспечивает терапевтический эффект.[00420] In some embodiments, the pharmaceutical compositions may be conveniently presented in a unit dosage form. The unit dosage form will typically be adapted to one or more specific routes of administration of the pharmaceutical composition. In some embodiments, said unit dosage form is adapted for administration by inhalation. In some embodiments, said unit dosage form is adapted for administration via a vaporizer. In some embodiments, said unit dosage form is adapted for administration via a nebulizer. In some embodiments, the unit dosage form is adapted for administration using an aerosol generator. In some embodiments, the unit dosage form is adapted for oral administration, for buccal administration, or for sublingual administration. In some embodiments, the unit dosage form is adapted for intravenous, intramuscular, or subcutaneous administration. In some embodiments, the unit dosage form is adapted for intrathecal or intracerebroventricular administration. In some embodiments, the pharmaceutical composition is a formulation for topical administration. The amount of active ingredient that can be combined with the carrier material to form a unit dosage form is usually that amount of said compound that provides a therapeutic effect.
XIII. Различные применения XIII. Various Applications
[00421] Композиции и зкДНК-векторы, представленные в данном документе, можно использовать для доставки трансгена с различными целями, как описано выше. Согласно некоторым вариантам реализации указанный трансген кодирует белок или функциональную РНК, которая предназначена для использования в исследовательских целях, например, для создания соматической модели на трансгенных животных, несущих трансген, например, для изучения функции продукта трансгена. В другом примере указанный трансген кодирует белок или функциональную РНК, которая предназначена для использования с целью создания модели заболевания на животных.[00421] The compositions and cccDNA vectors presented herein can be used to deliver a transgene for various purposes, as described above. In some embodiments, the transgene encodes a protein or functional RNA that is intended to be used for research purposes, for example, to create a somatic model of transgenic animals carrying the transgene, for example, to study the function of the transgene product. In another example, the transgene encodes a protein or functional RNA that is intended for use in creating an animal model of a disease.
[00422] Согласно некоторым вариантам реализации указанный трансген кодирует один или более пептидов, полипептидов или белков, которые подходят для лечения, облегчения или предотвращения болезненных состояний у субъекта-млекопитающего. Указанный трансген может быть перенесен в организм пациента (например, экспрессироваться у пациента) в количестве, достаточном для лечения заболевания, ассоциированного с пониженной экспрессией, отсутствием экспрессии или дисфункцией указанного гена. [00422] In some embodiments, the transgene encodes one or more peptides, polypeptides, or proteins that are useful for treating, ameliorating, or preventing disease states in a mammalian subject. The transgene may be transferred into a patient's body (eg, expressed in the patient) in an amount sufficient to treat a disease associated with decreased expression, absence of expression, or dysfunction of the gene.
[00423] Согласно некоторым вариантам реализации предусмотрено применение указанных зкДНК-векторов в способах диагностики и скрининга, где трансген транзиентно или стабильно экспрессируют в системе культуры клеток или, как вариант, в модели на трансгенных животных. [00423] Some embodiments provide for the use of these cccDNA vectors in diagnostic and screening methods where the transgene is transiently or stably expressed in a cell culture system or, alternatively, in a transgenic animal model.
[00424] Согласно другому аспекту описанная в данном документе технология обеспечивает способ трансдукции популяции клеток млекопитающих. В общем и широком смысле указанный способ включает, по меньшей мере, этап введения в одну или более клеток популяции композиции, которая содержит эффективное количество одной или более зкДНК согласно описанию в данном документе.[00424] In another aspect, the technology described herein provides a method for transducing a population of mammalian cells. In a general and broad sense, the method includes at least the step of introducing into one or more cells of a population a composition that contains an effective amount of one or more cccDNAs as described herein.
[00425] Кроме того, согласно данному изобретению предложены композиции, а также терапевтические и/или диагностические наборы, которые включают один или более раскрытых зкДНК-векторов или одну или более раскрытых композиций зкДНК, в составах, полученных с использованием одного или более дополнительных ингредиентов, или подготовленных вместе с одной или более инструкциями по их применению.[00425] In addition, the present invention provides compositions, as well as therapeutic and/or diagnostic kits, that include one or more disclosed cccDNA vectors or one or more disclosed cccDNA compositions, in formulations prepared using one or more additional ingredients, or prepared together with one or more instructions for their use.
ПРИМЕРЫEXAMPLES
[00426] Приведенные ниже примеры предназначены для иллюстрации, а не для ограничения.[00426] The following examples are intended to be illustrative and not limiting.
ПРИМЕР 1: Конструирование зкДНК-векторовEXAMPLE 1: Construction of cDNA vectors
[00427] Описано получение зкДНК-векторов с использованием матрицы полинуклеотидного конструкта. Например, матрица полинуклеотидного конструкта, используемая для получения зкДНК-векторов согласно данному изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус. Без ограничения теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, матрица полинуклеотидного конструкта, содержащая два ITR и экспрессионный конструкт, где по меньшей мере один из ITR модифицирован, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («спасение») матрицы из остова матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, генома зкДНК-бакуловируса и т.п.) посредством белков Rep, и, во-вторых, опосредованная Rep репликация вырезанного зкДНК-вектора. [00427] The preparation of cDNA vectors using a polynucleotide construct template is described. For example, the polynucleotide construct template used to produce the cDNA vectors of the present invention may be a cDNA plasmid, a cDNA bacmid, and/or a cDNA baculovirus. Without being limited by theory, in a permissive host cell in the presence of, for example, Rep, a polynucleotide construct template containing two ITRs and an expression construct where at least one of the ITRs is modified is replicated to produce cccDNA vectors. Obtaining a cccDNA vector takes place in two stages: first, excision (“rescue”) of the template from the matrix backbone (for example, ccDNA plasmid, ccDNA bacmid, ccDNA baculovirus genome, etc.) using Rep proteins, and, second, Rep-mediated replication of the excised cccDNA vector.
[00428] Примером способа получения зкДНК-векторов является зкДНК-плазмида согласно описанию в данном документе. На Фиг. 1А и 1В матрица полинуклеотидного конструкта каждой из зкДНК-плазмид включает как левый мутированный ITR, так и правый мутированный ITR, с расположенными между указанными ITR следующими последовательностями: (i) энхансера/промотора; (ii) сайта клонирования трансгена; (iii) посттранскрипционного элемента ответа (например, посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE)); и (iv) сигнала полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Также между всеми компонентами были введены уникальные сайты распознавания рестрикционными эндонуклеазами (R1-R6) (показаны на Фиг. 1A и Фиг. 1B) для облегчения введения новых генетических компонентов в конкретные сайты конструкта. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 7) и R4 (PacI) TTAATTAA (SEQ ID NO: 542) встраивают в сайт клонирования для введения открытой рамки считывания трансгена. Указанные последовательности клонировали в плазмиду pFastBac HT B, полученную от ThermoFisher Scientific. [00428] An example of a method for producing cccDNA vectors is a ccDNA plasmid as described herein. In FIG. 1A and 1B, the polynucleotide construct template of each ccDNA plasmid includes both a left mutated ITR and a right mutated ITR, with the following sequences located between said ITRs: (i) an enhancer/promoter; (ii) the transgene cloning site; (iii) a post-transcriptional response element (eg, woodchuck hepatitis virus post-transcriptional regulatory element (WPRE)); and (iv) a polyadenylation signal (eg, from the bovine growth hormone gene (BGHpA)). Unique restriction endonuclease recognition sites (R1-R6) were also introduced between all components (shown in Fig. 1A and Fig. 1B) to facilitate the introduction of new genetic components into specific sites of the construct. Enzyme sites R3 (PmeI) GTTTAAAC (SEQ ID NO: 7) and R4 (PacI) TTAATTAA (SEQ ID NO: 542) are inserted into the cloning site to introduce the open reading frame of the transgene. The indicated sequences were cloned into the pFastBac HT B plasmid obtained from ThermoFisher Scientific.
[00429] Вкратце, ряд зкДНК-векторов получали из конструктов зкДНК-плазмид, показанных в Таблице 12, используя способ, показанный на Фиг. 4A-4C. В Таблице 12 указано количество соответствующих полинуклеотидных последовательностей для каждого компонента, включая последовательности, активные в качестве сайта белка репликации (RPS) (например, сайта связывания Rep) на любом конце промотора, функционально связанного с трансгеном. Номера в Таблице 12 относятся к SEQ ID NO в данном документе, соответствующим последовательностям каждого компонента. [00429] Briefly, a number of cccDNA vectors were prepared from the ccDNA plasmid constructs shown in Table 12 using the method shown in FIG. 4A-4C. Table 12 lists the number of corresponding polynucleotide sequences for each component, including sequences active as a replication protein site (RPS) (eg, a Rep binding site) at either end of the promoter operably linked to the transgene. The numbers in Table 12 refer to the SEQ ID NOs herein corresponding to the sequences of each component.
[00430] Таблица 12: Типичные зкДНК-конструкты[00430] Table 12: Typical cccDNA constructs
[00431] Согласно некоторым вариантам реализации конструкт для получения зкДНК-векторов содержит промотор, который представляет собой регуляторный переключатель согласно описанию в данном документе, например, индуцируемый промотор. Другие конструкты использовали для создания векторов зкДНК, например, конструкт-10, конструкт-11, конструкт-12 и конструкт-13 (см., например, Таблицу 14A), которые содержат промотор MND или HLCR, функционально связанный с трансгеном люциферазы.[00431] In some embodiments, the cccDNA vector construct comprises a promoter that is a regulatory switch as described herein, such as an inducible promoter. Other constructs have been used to generate cccDNA vectors, such as Construct-10, Construct-11, Construct-12, and Construct-13 (see, e.g., Table 14A), which contain an MND or HLCR promoter operably linked to a luciferase transgene.
[00432] Продуцирование зкДНК-бакмид:[00432] Production of cccDNA-bacmid:
[00433] Как изображено на Фиг. 4А, компетентные клетки DH10Bac (компетентные клетки MAX EFFICIENCY® DH10Bac™, Thermo Fisher) трансформировали либо тестируемой, либо контрольной плазмидой согласно протоколу в соответствии с инструкциями производителя. Индуцировали рекомбинацию между плазмидой и бакуловирусным челночным вектором в клетках DH10Bac для получения рекомбинантных зкДНК-бакмид. Рекомбинантные бакмиды отбирали путем скрининга с положительным отбором на основе сине-белого скрининга в E.coli (маркер Φ80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG с антибиотиками, для отбора трансформантов и поддержания бакмиды и транспозазных плазмид. Белые колонии, образующиеся в результате транспозиции, которая разрушает индикаторный ген β-галактозида, отбирали и культивировали в 10 мл среды. [00433] As shown in FIG. 4A, DH10Bac competent cells (MAX EFFICIENCY® DH10Bac™ competent cells, Thermo Fisher) were transformed with either the test or control plasmid according to the protocol according to the manufacturer's instructions. Recombination between the plasmid and the baculovirus shuttle vector was induced in DH10Bac cells to produce recombinant cccDNA bacmids. Recombinant bacmids were selected by positive selection based blue-white screening in E. coli (marker Φ80dlacZΔM15 provides α-complementation of the β-galactosidase gene from the bacmid vector) on a bacterial agar plate containing X-gal and IPTG with antibiotics for selection transformants and maintenance of bacmid and transposase plasmids. White colonies resulting from transposition that disrupts the β-galactoside indicator gene were selected and cultured in 10 ml of medium.
[00434] Рекомбинантные зкДНК-бакмиды выделяли из E. coli и трансфицировали ими клетки насекомых Sf9 или Sf21 с применением FugeneHD для получения инфекционного бакуловируса. Адгезивные клетки насекомых Sf9 или Sf21 культивировали в 50 мл среды в колбах T25 при 25 °С. Через 4 дня культуральную среду (содержащую вирус P0) отделяли от клеток, фильтровали через фильтр с размером пор 0,45 мкм, отделяя инфекционные бакуловирусные частицы от клеток или клеточного дебриса.[00434] Recombinant cccDNA bacmids were isolated from E. coli and transfected into Sf9 or Sf21 insect cells using FugeneHD to produce infectious baculovirus. Adherent insect cells Sf9 or Sf21 were cultured in 50 ml of medium in T25 flasks at 25 °C. After 4 days, the culture medium (containing P0 virus) was separated from the cells and filtered through a 0.45-μm pore size filter, separating infectious baculovirus particles from cells or cellular debris.
[00435] Необязательно, первое поколение бакуловируса (P0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 в 50-500 мл среды. Клетки культивировали в суспензионных культурах в инкубаторе с орбитальным шейкером при 130 об/мин при 25°С, отслеживая диаметр и жизнеспособность клеток до тех пор, пока клетки не достигнут диаметра 18-19 нм (от диаметра наивных клеток, равного 14-15 нм) и плотности около 4,0E+6 клеток/мл. Через 3-8 суток после инфицирования бакуловирусные частицы P1 в среде собирали после центрифугирования для удаления клеток и дебриса, с последующей фильтрацией через фильтр с размером пор 0,45 мкм. [00435] Optionally, the first generation of baculovirus (P0) was amplified by infecting naive Sf9 or Sf21 insect cells in 50-500 ml of medium. Cells were cultured in suspension cultures in an orbital shaker incubator at 130 rpm at 25°C, monitoring cell diameter and cell viability until the cells reached a diameter of 18-19 nm (from a naïve cell diameter of 14-15 nm) and a density of about 4.0E+6 cells/ml. 3–8 days after infection, baculovirus P1 particles in the medium were collected after centrifugation to remove cells and debris, followed by filtration through a 0.45-μm pore size filter.
[00436] ЗкДНК-бакуловирус, содержащий тестируемые конструкты, собирали и определяли инфекционную активность или титр бакуловируса. В частности, 4 × 20 мл культуры клеток Sf9 с плотностью 2,5E+6 клеток/мл обрабатывали бакуловирусом P1 в следующих разведениях: 1/1000, 1/10000, 1/50000, 1/100000, и инкубировали при 25-27°C. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток. [00436] The cDNA baculovirus containing the test constructs was collected and the infectivity or titer of the baculovirus was determined. In particular, 4 × 20 ml of Sf9 cell culture with a density of 2.5E+6 cells/ml were treated with baculovirus P1 in the following dilutions: 1/1000, 1/10000, 1/50000, 1/100000, and incubated at 25-27°C C. Infectivity was determined daily for 4-5 days by the increase in cell diameter and cell cycle arrest, as well as changes in cell viability.
[00437] Ссылаясь на Фиг. 4A, «Rep-плазмида», которая содержит единственный белок Rep (см., например, Фиг. 8A), была продуцирована в экспрессионном векторе pFASTBAC™-Dual (ThermoFisher). [00437] Referring to FIG. 4A, a “Rep plasmid” that contains a single Rep protein (see, e.g., FIG. 8A), was produced in the expression vector pFASTBAC™-Dual (ThermoFisher).
[00438] Указанной Rep-плазмидой трансформировали компетентные клетки DH10Bac (MAX EFFICIENCY® DH10Bac™ Competent Cells (Thermo Fisher)), следуя предоставленному производителем протоколу. Индуцировали рекомбинацию между Rep-плазмидой и бакуловирусным челночным вектором в клетках DH10Bac для получения рекомбинантных бакмид («Rep-бакмид»). Рекомбинантные бакмиды отбирали путем положительного отбора, который включал сине-белый скрининг в E. coli (маркер Φ80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG. Изолированные белые колонии собирали и инокулировали в 10 мл селективной среды (канамицин, гентамицин, тетрациклин в бульоне LB). Рекомбинантные бакмиды (Rep-бакмиды) выделяли из E.coli, и указанными Rep-бакмидами трансфицировали клетки насекомых Sf9 или Sf21 для получения инфекционного бакуловируса. [00438] The Rep plasmid was transformed into DH10Bac competent cells (MAX EFFICIENCY® DH10Bac™ Competent Cells (Thermo Fisher)) following the protocol provided by the manufacturer. Recombination between the Rep plasmid and the baculovirus shuttle vector was induced in DH10Bac cells to produce recombinant bacmids (“Rep bacmid”). Recombinant bacmids were selected by positive selection, which involved blue-white screening in E. coli (marker Φ80dlacZΔM15 provides α-complementation of the β-galactosidase gene from the bacmid vector) on a bacterial agar plate containing X-gal and IPTG. Isolated white colonies were collected and inoculated into 10 ml of selective medium (kanamycin, gentamicin, tetracycline in LB broth). Recombinant bacmids (Rep bacmids) were isolated from E. coli, and Sf9 or Sf21 insect cells were transfected with these Rep bacmids to produce infectious baculovirus.
[00439] Клетки насекомых Sf9 или Sf21 культивировали в 50 мл среды в течение 4 дней и выделяли из культуры инфекционный рекомбинантный бакуловирус («Rep-бакуловирус»). Необязательно, Rep-бакуловирус первого поколения (P0) амплифицировали путем инфицирования необработанных клеток насекомых Sf9 или Sf21 и культивирования в 50-500 мл среды. Через 3-8 дней после инфицирования бакуловирусные частицы P1 в среде собирали, отделяя клетки путем центрифугирования или фильтрации, или используя другой способ фракционирования. Собирали Rep-бакуловирус и определяли инфекционную активность бакуловируса. В частности, 4 x 20 мл культур клеток Sf9 при плотности 2,5x106 клеток/мл обрабатывали бакуловирусом P1 в следующих разведениях: 1/1000, 1/10000, 1/50000, 1/100000, и инкубировали. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток. [00439] Sf9 or Sf21 insect cells were cultured in 50 ml of medium for 4 days and an infectious recombinant baculovirus (“Rep-baculovirus”) was isolated from the culture. Optionally, first generation Rep baculovirus (P0) was amplified by infecting untreated insect cells with Sf9 or Sf21 and culturing in 50-500 ml of medium. After 3 to 8 days postinfection, baculovirus P1 particles in the medium were collected by separating cells by centrifugation or filtration, or using another fractionation method. Rep-baculovirus was collected and the infectivity of the baculovirus was determined. Specifically, 4 x 20 ml Sf9 cell cultures at a density of 2.5 x 10 6 cells/ml were treated with baculovirus P1 at the following dilutions: 1/1000, 1/10000, 1/50000, 1/100000, and incubated. Infectivity was determined daily for 4-5 days by the increase in cell diameter and cell cycle arrest, as well as changes in cell viability.
[00440] Получение и характеризация зкДНК-вектора[00440] Preparation and characterization of cccDNA vector
[00441] Как показано на Фиг. 4B, затем добавляли культуральную среду для клеток насекомых Sf9, содержащую либо (1) образец, содержащий зкДНК-бакмиду или зкДНК-бакуловирус, либо (2) Rep-бакуловирус, описанные выше, в свежую культуру клеток Sf9 (2,5E+6 клеток/мл, 20 мл) в соотношении 1:1000 и 1:10000, соответственно. Затем клетки культивировали при 130 об/мин при 25 °С. Через 4-5 дней после коинфицирования детектировали диаметр и жизнеспособность клеток. Когда диаметр клеток достигал 18-20 нм при жизнеспособности, составляющей приблизительно 70-80%, клеточные культуры центрифугировали, среду удаляли и собирали клеточные осадки. Клеточные осадки сначала ресуспендировали в достаточном объеме водной среды - либо воды, либо буфера. ЗкДНК-вектор выделяли из клеток и очищали с использованием протокола очистки Qiagen MIDI PLUS™ (Qiagen, обработка 0,2 мг массы клеточного осадка на колонку). [00441] As shown in FIG. 4B, Sf9 insect cell culture medium containing either (1) a sample containing cccDNA bacmid or cccDNA baculovirus or (2) Rep baculovirus described above was then added to a fresh Sf9 cell culture (2.5E+6 cells /ml, 20 ml) in a ratio of 1:1000 and 1:10000, respectively. Cells were then cultured at 130 rpm at 25°C. Cell diameter and viability were detected 4–5 days after coinfection. When the cell diameter reached 18-20 nm with a viability of approximately 70-80%, the cell cultures were centrifuged, the medium was removed and the cell pellets were collected. Cell pellets were first resuspended in a sufficient volume of aqueous medium, either water or buffer. The cccDNA vector was isolated from cells and purified using the Qiagen MIDI PLUS™ purification protocol (Qiagen, treatment 0.2 mg cell pellet weight per column).
[00442] Значения выхода для зкДНК-векторов, продуцированных и очищенных из клеток насекомых Sf9, первоначально определяли на основании поглощения в УФ-диапазоне при 260 нм. Выходы различных векторов зкДНК, определенные на основе УФ-поглощения, представлены ниже в Таблице 13.[00442] Yield values for cccDNA vectors produced and purified from Sf9 insect cells were initially determined based on UV absorbance at 260 nm. The yields of various cccDNA vectors determined based on UV absorbance are presented below in Table 13.
[00443] Таблица 13: Выход векторов зкДНК из типичных конструктов.[00443] Table 13: Yield of cccDNA vectors from typical constructs.
(Диаметр в микрометрах)Culture parameters
(Diameter in micrometers)
Жизнеспособность: 53,3%
Диаметр: 18,4Total: 6.02 x10e 6
Viability: 53.3%
Diameter: 18.4
[00444] Оценка зкДНК-векторов может быть проведена путем идентификации с применением электрофореза на агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на Фиг. 4D, где наблюдается (a) присутствие характеристических полос, мигрирующих с вдвое большим размером на денатурирующих гелях по сравнению с нативными гелями после расщепления рестрикционной эндонуклеазой и гель-электрофоретического анализа, и (b) наличие полос мономера и димера (2×) на денатурирующих гелях для нерасщепленного материала, что характерно для присутствия зкДНК-вектора. [00444] Evaluation of cccDNA vectors can be accomplished by identification using agarose gel electrophoresis under native or denaturing conditions, as illustrated in FIG. 4D, where there is (a) the presence of characteristic bands migrating at twice the size on denaturing gels compared to native gels after restriction endonuclease digestion and gel electrophoretic analysis, and (b) the presence of monomer and dimer bands (2×) on denaturing gels for undigested material, which is characteristic of the presence of a cDNA vector.
[00445] Структуры выделенных зкДНК-векторов дополнительно анализировали путем расщепления ДНК, полученной из коинфицированных клеток Sf9 (согласно описанию в данном документе) рестрикционными эндонуклеазами, выбранными на основании a) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения итоговых фрагментов достаточно большого размера, чтобы они были четко видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п.о.). Как продемонстрировано на Фиг. 4E, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой будет давать фрагменты размером 1 т.п.о. и 2 т.п.о., а неинкапсидированный вектор с непрерывной структурой - фрагменты размером 2 т.п.о. и 4 т.п.о. [00445] The structures of the isolated cccDNA vectors were further analyzed by digesting DNA obtained from coinfected Sf9 cells (as described herein) with restriction endonucleases selected based on a) the presence of only one cut site in the ccDNA vectors, and b) obtaining the resulting fragments large enough to be clearly visible when fractionated on a 0.8% denaturing agarose gel (>800 bp). As shown in FIG. 4E, linear discontinuous DNA vectors and linear and continuous cccDNA vectors can be distinguished by the size of the reaction products—for example, a discontinuous DNA vector is expected to produce 1 kb fragments. and 2 kb, and the unencapsidated vector with a continuous structure - fragments of 2 kb. and 4 kb.
[00446] Таким образом, для того, чтобы качественным образом продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной в контексте последовательности конкретного ДНК-вектора, как эндонуклеаза с одним сайтом рестрикции, предпочтительно, обеспечивающая образование двух продуктов расщепления неравного размера (например, 1000 п.о. и 2000 п.о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК), линейная ДНК, не являющаяся ковалентно замкнутой, будет разделяться на фрагменты размером 1000 п.о. и 2000 п.о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п.о. и 4000 п.о.), так как две цепи ДНК связаны, а после разворачивания будут иметь вдвое большую длину (хотя и будут одноцепочечными). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связывания концов мультимерных ДНК-векторов (см. Фиг. 4D).[00446] Thus, in order to qualitatively demonstrate that the isolated cccDNA vectors have covalently closed ends as required by their definition, samples were digested with a restriction endonuclease identified in the context of the specific DNA vector sequence as a single site restriction endonuclease, preferably providing the formation of two cleavage products of unequal size (eg, 1000 bp and 2000 bp). After digestion and electrophoresis on a denaturing gel (which separates two complementary DNA strands), linear DNA that is not covalently closed will be separated into 1000 bp fragments. and 2000 bp, while covalently closed DNA (i.e. cDNA vector) will be divided into fragments 2 times larger (2000 bp and 4000 bp), since two chains The DNA is linked, and after unfolding it will be twice as long (although single-stranded). Additionally, when the monomeric, dimeric, and n-mer forms of DNA vectors are digested, they will all separate into fragments of equal sizes due to the end-binding of the multimeric DNA vectors (see Figure 4D).
[00447] Фиг. 5 представляет собой иллюстративную картину денатурирующего геля с векторами зкДНК следующим образом: конструкт-1, конструкт-2, конструкт-3, конструкт-4, конструкт-5, конструкт-6, конструкт-7 и конструкт-8 (все описанные в Таблице 12 выше), с (+) или без (-) расщепления эндонуклеазой. Каждый вектор зкДНК от конструкта-1 до конструкта-8 давал две полосы (*) после эндонуклеазной реакции. Размеры их двух полос, определенные на основе размера маркера, представлены в нижней части рисунка. Размеры полос подтверждают, что каждый из векторов зкДНК, полученных из плазмид, содержащих от конструкта-1 до конструкта-8, имеет непрерывную структуру. [00447] FIG. 5 is an illustrative picture of a denaturing gel with cccDNA vectors as follows: construct-1, construct-2, construct-3, construct-4, construct-5, construct-6, construct-7, and construct-8 (all described in Table 12 above), with (+) or without (-) endonuclease cleavage. Each cccDNA vector from construct-1 to construct-8 produced two bands (*) after the endonuclease reaction. The sizes of their two stripes, determined based on the size of the marker, are presented at the bottom of the figure. The sizes of the bands confirm that each of the cccDNA vectors derived from the plasmids containing construct-1 to construct-8 has a continuous structure.
[00448] В данном документе фраза «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле в условиях нативного и денатурирующего геля» относится к анализу для оценки наличия замкнутых концов зкДНК путем проведения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Один пример такого анализа приведен ниже, хотя специалисту в данной области техники будет понятно, что возможно осуществление многих известных в данной области техники вариантов указанного примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или обессоливающие «центрифужные колонки», например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, являются примерами известных в данной области техники средств для расщепления эндонуклеазами. Указанный анализ включает, например, i) расщепление ДНК подходящей рестрикционной эндонуклеазой (эндонуклеазами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10x денатурирующего раствора (10× = 0,5 М NaOH, 10 мМ EDTA), добавление 10x не забуференного раствора красителя и проведение анализа вместе с маркерами ДНК, полученными путем добавления 10x денатурирующего раствора к 4х, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ EDTA и 200 мМ NaOH для обеспечения однородности концентрации NaOH в геле и гелевой камере, и проведение геля в присутствии 1× денатурирующего раствора (50 мМ NaOH, 1 мМ EDTA). Специалисту в данной области техники будет понятно, какое напряжение следует использовать для проведения электрофореза в зависимости от размеров и желаемого времени получения результатов. После электрофореза гели подсушивают и нейтрализуют в 1× TBE или TAE и переносят в дистиллированную воду или 1× TBE/TAE с 1× SYBR Gold. Затем полосы могут быть визуализированы, например, с применением красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (концентрат 10 000X в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм).[00448] As used herein, the phrase “assay for identifying DNA vectors by agarose gel electrophoresis under native and denaturing gel conditions” refers to an assay for assessing the presence of closed ends of cccDNA by performing restriction endonuclease digestion followed by electrophoretic assessment of the digestion products. One example of such an analysis is given below, although one skilled in the art will appreciate that many variations of this example known in the art can be performed. The restriction endonuclease is selected to be the enzyme that makes a single cut of the cDNA vector of interest to produce products that are approximately 1/3× and 2/3× the length of the DNA vector. This ensures band separation on both native and denaturing gels. It is important to remove the buffer from the sample before denaturation. Qiagen's PCR Product Purification Kit or desalting “spun columns,” such as the GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 columns, are examples of endonuclease digestion agents known in the art. This analysis includes, for example, i) digestion of DNA with suitable restriction endonuclease(s), 2) addition, for example, to a Qiagen PCR purification kit, eluting with distilled water, iii) addition of a 10x denaturing solution (10× = 0.5 M NaOH, 10 mM EDTA), adding 10x unbuffered dye solution and running the analysis along with DNA markers obtained by adding 10x denaturing solution to a 4x, 0.8-1.0% gel pre-incubated with 1 mM EDTA and 200 mM NaOH to ensure uniform NaOH concentration in the gel and gel chamber, and run the gel in the presence of 1× denaturing solution (50 mM NaOH, 1 mM EDTA). One skilled in the art will understand what voltage should be used to perform electrophoresis depending on the size and desired time to obtain results. After electrophoresis, the gels are dried and neutralized in 1× TBE or TAE and transferred to distilled water or 1× TBE/TAE with 1× SYBR Gold. The bands can then be visualized, for example, using Thermo Fisher's SYBR® Gold Nucleic Acid Gel Stain (10,000X concentrate in DMSO) and epifluorescent light (blue) or UV (312 nm).
[00449] Чистота полученного зкДНК-вектора может быть оценена с применением любого известного в данной области техники способа. Согласно одному неограничивающему примеру способа вклад зкДНК-плазмиды в общее поглощение УФ образцом может быть рассчитан путем сравнения интенсивности флуоресцентности зкДНК-вектора и стандарта. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресцентности зкДНК-вектора эквивалентна полосе 2 т.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса - например, если общее количество зкДНК-вектора соответствует 8 т.п.о., а вырезанная сравнительная полоса соответствует 2 т.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, рассчитывают количество для полосы зкДНК-вектора по уравнению линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.[00449] The purity of the resulting cccDNA vector can be assessed using any method known in the art. In one non-limiting example of a method, the contribution of the ccDNA plasmid to the total UV absorbance of the sample can be calculated by comparing the fluorescence intensity of the ccDNA vector and the standard. For example, if based on UV absorbance it is determined that 4 μg of ccDNA vector is loaded on the gel, and the fluorescence intensity of the ccDNA vector is equivalent to a 2 kb band. with a known mass of 1 μg, then the mass of the ccDNA vector is 1 μg, and the ccDNA vector constitutes 25% of the total amount of UV absorbing material. The intensity of the band on the gel is then plotted against the calculated input amount to which the band corresponds - for example, if the total amount of ccDNA vector corresponds to 8 kb, and the excised comparative band corresponds to 2 kb, then the intensity of the indicated the bars on the graph will correspond to 25% of the total amount administered, which in this case would be 0.25 mcg when 1.0 mcg was administered. Using titration of the cccDNA vector plasmid to construct a standard curve, the quantity for the cccDNA vector band is calculated from the regression line equation, which can then be used to determine the percentage of the total input amount represented by the cccDNA vector, or the percentage purity.
ПРИМЕР 2: получение вирусной ДНК в зкДНК клеткахEXAMPLE 2: obtaining viral DNA in cDNA cells
[00450] Векторы зкДНК были также получены из конструктов 11, 12, 13 и 14, показанных в Таблице 14A. ЗкДНК-плазмиды, содержащие конструкты 11-14, были получены методами молекулярного клонирования, хорошо известными в данной области. Плазмиды в Таблице 14A были сконструированы с WPRE, содержащим SEQ ID NO: 8, за которым следует BGHpA, содержащий SEQ ID NO: 9, в 3'-нетранслируемом участке между трансгеном и правым ITR. [00450] cccDNA vectors were also obtained from constructs 11, 12, 13 and 14 shown in Table 14A. CctDNA plasmids containing constructs 11-14 were obtained by molecular cloning methods well known in the art. The plasmids in Table 14A were constructed with a WPRE containing SEQ ID NO: 8 followed by BGHpA containing SEQ ID NO: 9 in the 3' untranslated region between the transgene and the right ITR.
Таблица 14ATable 14A
[00451] Векторный остов для конструктов 11-14 выглядит следующим образом: (i) asymITR-MND -люцифераза-wPRE-BGH-polyA-ITR в pFB-HTb (конструкт-11), (ii) ITR-MND-люцифераза -wPRE-BGH-polyA-asymITR в pFB-HTb (конструкт-12), (iii) asymITR-HLCR-AAT-luc-wPRE(O)-BGH-polyA-ITR в pFB-HTb (конструкт-13); и ITR -HLCR-AAT-luc-wPRE(O)-BGH-polyA-asymITR в pFB-HTb (конструкт-14), каждый конструкт имеет по меньшей мере один асимметричный ITR относительно друг друга. Эти конструкты также содержат одну или несколько из следующих последовательностей: wPRE0 (SEQ ID NO: 72) и последовательность BGH-PolyA (SEQ ID NO: 73), или последовательности, которые по меньшей мере 85%, или по меньшей мере 90%, или по меньшей мере 95%. идентичны указанным последовательностям.[00451] The vector backbone for constructs 11-14 is as follows: (i) asymITR-MND -luciferase-wPRE-BGH-polyA-ITR in pFB-HTb (construct-11), (ii) ITR-MND-luciferase -wPRE -BGH-polyA-asymITR in pFB-HTb (construct-12), (iii) asymITR-HLCR-AAT-luc-wPRE(O)-BGH-polyA-ITR in pFB-HTb (construct-13); and ITR -HLCR-AAT-luc-wPRE(O)-BGH-polyA-asymITR in pFB-HTb (construct-14), each construct having at least one asymmetric ITR relative to each other. These constructs also contain one or more of the following sequences: wPRE0 (SEQ ID NO: 72) and a BGH-PolyA sequence (SEQ ID NO: 73), or sequences that are at least 85%, or at least 90%, or at least 95%. identical to the indicated sequences.
[00452] Затем проводили получение вектора зкДНК в соответствии с процедурой, показанной на Фиг. 4A-4C, например, (а) получение рекомбинантной зкДНК-бакмидной ДНК и трансфекция клеток насекомых рекомбинантной зкДНК-бакмидной ДНК; (b) получение исходного материала P1 (низкого титра), исходного раствора P2 (высокого титра) и определение титра вируса с помощью количественной ПЦР для получения 5 мл, >1E+7 бляшкообразующих или инфекционных единиц «БОЕ» на мл бакуловирусного объема, согласно сертификату анализа бакуловирусного объема. Выделение вектора зкДНК осуществляли путем совместного инфицирования 50 мл клеток насекомых бакуловирусным объемом, для последующих пар инфицирования: Rep-bacmid, как описано в данном документе, и по меньшей мере, одним из следующих конструктов: конструкт-11, конструкт-12, конструкт-13 и конструкт-14. Выделение вектора зкДНК проводили с использованием набора QIAGEN Plasmid Midi Kit для получения очищенного ДНК-материала для дальнейшего анализа. Таблица 14B и Таблица 14C показывают выход (определенный по показателям OD) вектора зкДНК, полученного из конструктов 11-14. [00452] The cccDNA vector was then prepared according to the procedure shown in FIG. 4A-4C, for example, (a) producing recombinant cccDNA-bacmid DNA and transfecting insect cells with the recombinant ccDNA-bacmid DNA; (b) obtain a P1 (low titer) stock, a P2 (high titer) stock solution and determine the virus titer by qPCR to obtain 5 ml, >1E+7 plaque-forming units or infectious units "PFU" per ml baculovirus volume, according to the certificate analysis of baculovirus volume. Isolation of the cccDNA vector was carried out by co-infecting 50 ml of insect cells with a baculovirus volume, for subsequent infection pairs: Rep-bacmid, as described herein, and at least one of the following constructs: construct-11, construct-12, construct-13 and construct-14. Isolation of the cccDNA vector was performed using the QIAGEN Plasmid Midi Kit to obtain purified DNA material for further analysis. Table 14B and Table 14C show the yield (as determined by OD values) of the cccDNA vector obtained from constructs 11-14.
[00453] Таблица 14B: Выход (определенный по показателям OD) типичных векторов зкДНК, полученных из конструктов 11-14. [00453] Table 14B: Yield (determined by OD metrics) of typical cccDNA vectors derived from constructs 11-14.
[00454] В Таблице 14C показано количество материала ДНК, полученного (определено по показателям OD) с использованием конструктов 12 и 14 из Таблицы 14C. Выход материала общей ДНК был приемлемым по сравнению с типичными выходами около 3 мг/л материала ДНК из способа в вышеизложенного Примера 1 (Таблица 13). [00454] Table 14C shows the amount of DNA material obtained (determined by OD values) using constructs 12 and 14 from Table 14C. The yield of total DNA material was acceptable compared to typical yields of about 3 mg/L of DNA material from the process in Example 1 above (Table 13).
ПРИМЕР 3: экспрессирование зкДНК-вектором трансгена люциферазы in vitroEXAMPLE 3: Expression of a luciferase transgene by a cccDNA vector in vitro
[00455] Конструкты получали путем введения открытой рамки считывания, кодирующей репортерный ген люциферазы, в сайт клонирования плазмидных конструктов зкДНК: конструкт-1, конструкт-3, конструкт-5 и конструкт-7. ЗкДНК-плазмиды (см. выше в Таблице 12), включая кодирующую последовательность люциферазы, называются плазмидным конструктом 1-Luc, c плазмидным конструктом-3-Luc, плазмидном конструктом -5-Luc и плазмидным конструктом 7-Luc соответственно. [00455] The constructs were obtained by introducing an open reading frame encoding a luciferase reporter gene into the cloning site of the cccDNA plasmid constructs: construct-1, construct-3, construct-5 and construct-7. The cDNA plasmids (see Table 12 above), including the luciferase coding sequence, are referred to as the 1-Luc plasmid construct, the 3-Luc plasmid construct, the -5-Luc plasmid construct, and the 7-Luc plasmid construct, respectively.
[00456] Клетки HEK293 культивировали и трансфицировали 100 нг, 200 нг или 400 нг плазмидных конструктов 1, 3, 5 и 7, с применением FUGENE® (Promega Corp.) в качестве агента для трансфекции. Экспрессию люциферазы из каждой из плазмид определяли на основе активности люциферазы в каждой культуре клеток, и результаты представлены на Фиг. 6А. Люциферазная активность не была обнаружена в необработанных контрольных клетках («Необработанные») или в клетках, обработанных одним фугеном («Fugene»), что подтверждает, что люциферазная активность является результатом экспрессии генов из плазмид. Как показано на Фиг. 6A и Фиг. 6B, устойчивая экспрессия люциферазы была обнаружена в конструктах 1 и 7. Экспрессия из конструкта-7 экспрессировала люциферазу с обнаружением дозозависимого увеличения активности люциферазы. [00456] HEK293 cells were cultured and transfected with 100 ng, 200 ng or 400 ng of plasmid constructs 1, 3, 5 and 7 using FUGENE® (Promega Corp.) as the transfection agent. Luciferase expression from each of the plasmids was determined based on the luciferase activity in each cell culture, and the results are presented in FIG. 6A. No luciferase activity was detected in untreated control cells (“Untreated”) or in cells treated with Fugene alone (“Fugene”), confirming that luciferase activity results from expression of genes from plasmids. As shown in FIG. 6A and FIG. 6B, robust expression of luciferase was detected in constructs 1 and 7. Expression from construct-7 expressed luciferase with a dose-dependent increase in luciferase activity detected.
[00457] Рост и жизнеспособность клеток, трансфицированных каждой из плазмид, также были определены и представлены на Фиг. 7A и Фиг. 7В. Рост клеток и жизнеспособность трансфицированных клеток существенно не различались между разными группами клеток, обработанными разными конструктами. [00457] The growth and viability of cells transfected with each of the plasmids were also determined and presented in FIG. 7A and FIG. 7B. Cell growth and viability of transfected cells did not differ significantly between different groups of cells treated with different constructs.
[00458] Соответственно, активность люциферазы, измеренная в каждой группе и нормализованная на основе роста и жизнеспособности клеток, не отличалась от активности люциферазы без нормализации. ЗкДНК-плазмида с конструктом 1-Luc показала наиболее устойчивую экспрессию люциферазы с нормализацией или без нее. [00458] Accordingly, luciferase activity measured in each group and normalized based on cell growth and viability was no different from luciferase activity without normalization. The cDNA plasmid with the 1-Luc construct showed the most robust luciferase expression with or without normalization.
[00459] Таким образом, данные, представленные на Фиг. 6A, 6B, 7A и 7B демонстрируют, что конструкт-1, содержащий от 5' до 3'- WT-ITR (SEQ ID NO: 51), промотор CAG (SEQ ID NO: 3), сайт клонирования R3/R4 (SEQ ID NO: 7), WPRE (SEQ ID NO: 8), BGHpA (SEQ ID NO: 9) и модифицированный ITR (SEQ ID NO: 2) является эффективным при получении вектора зкДНК, который может экспрессировать белок трансгена с зкДНК вектора. [00459] Thus, the data presented in FIG. 6A, 6B, 7A and 7B show that construct-1 containing 5' to 3'-WT-ITR (SEQ ID NO: 51), CAG promoter (SEQ ID NO: 3), R3/R4 cloning site (SEQ ID NO: 7), WPRE (SEQ ID NO: 8), BGHpA (SEQ ID NO: 9) and modified ITR (SEQ ID NO: 2) are effective in producing a cccDNA vector that can express a transgene protein from the ccDNA vector.
ПРИМЕР 4: Экспрессия трансгенного белка люциферазы in vivo с зкДНК-векторов.EXAMPLE 4: Expression of transgenic luciferase protein in vivo from cDNA vectors.
[00460] In vivo экспрессию белка трансгена с зкДНК-векторов, продуцированных с конструктов 1-8, описанных выше, оценивали на мышах. ЗкДНК-вектор, полученный из конструкта-1 зкДНК-плазмиды (как описано в Таблице 12), был протестирован и продемонстрировал продолжительную и устойчивую трансгенную экспрессию люциферазы в модели на мышах после гидродинамической инъекции конструкта зкДНК без липосом и повторного введения дозы (на день 28) и продолжительность (до дня 42) зкДНК экзогенной люциферазы светлячков. В различных экспериментах экспрессия люциферазы в выбранных векторах зкДНК оценивается in vivo, при этом векторы зкДНК содержат трансген люциферазы и по меньшей мере один модифицированный ITR, выбранный из любого, показанного в Таблицах 10A-10B, или ITR, содержащий по меньшей мере одну последовательность, показанную на Фиг. 26A-26B. [00460] In vivo transgene protein expression from cccDNA vectors produced from constructs 1-8 described above was assessed in mice. An cccDNA vector derived from the cccDNA plasmid construct-1 (as described in Table 12) was tested and demonstrated long-lasting and sustained transgenic luciferase expression in a mouse model following hydrodynamic injection of the cccDNA construct without liposomes and repeated dosing (at day 28). and duration (up to day 42) of exogenous firefly luciferase cDNA. In various experiments, luciferase expression in selected cccDNA vectors is assessed in vivo, wherein the cccDNA vectors contain a luciferase transgene and at least one modified ITR selected from any one shown in Tables 10A-10B, or an ITR containing at least one sequence shown in Fig. 26A-26B.
[00461] Экспрессия люциферазы in vivo: самцам мышей CD-1 IGS в возрасте 5-7 недель (Charles River Laboratories) вводят 0,35 мг/кг зкДНК-вектора, экспрессирующего люциферазу, в объеме 1,2 мл путем внутривенного (в/в) гидродинамического введения в хвостовую вену на день 0.. Экспрессию люциферазы оценивают с помощью визуализации IVIS в дни 3, 4, 7, 14, 21, 28, 31, 35 и 42. Вкратце, мышам внутрибрюшинной вводят 150 мг/кг субстрата люциферина, а затем оценивают люминесценцию всего тела с помощью визуализации IVIS®. [00461] In vivo luciferase expression: 5-7 week old male CD-1 IGS mice (Charles River Laboratories) are administered 0.35 mg/kg of cccDNA vector expressing luciferase in a volume of 1.2 ml by intravenous (i.v.) c) hydrodynamic tail vein injection on day 0. Luciferase expression was assessed by IVIS imaging on days 3, 4, 7, 14, 21, 28, 31, 35 and 42. Briefly, mice were injected intraperitoneally with 150 mg/kg luciferin substrate , and then assess whole-body luminescence using IVIS® imaging.
[00462] Визуализацию IVIS проводят на день 3, день 4, день 7, день 14, день 21, день 28, день 31, день 35 и день 42, и визуализируют отобранные органы ex vivo после умерщвления на день 42. [00462] IVIS imaging is performed on day 3, day 4, day 7, day 14, day 21, day 28, day 31, day 35 and day 42, and the selected organs are imaged ex vivo after sacrifice on day 42.
[00463] На протяжении исследования животных ежедневно взвешивают и проводят мониторинг общего состояния здоровья и самочувствия. При умерщвлении кровь каждого животного собирают путем терминальной пункции сердца, разделяют на две части и обрабатывают для получения 1) плазмы и 2) сыворотки, причем плазму мгновенно замораживают, а сыворотку используют для панели анализов на ферменты печени, после чего мгновенно замораживают. Кроме того, отбирают печень, селезенки, почки и паховые лимфатические узлы (LN) и визуализируют ex vivo с применением IVIS.[00463] Animals are weighed daily throughout the study and their general health and well-being are monitored. At sacrifice, the blood of each animal is collected by terminal cardiac puncture, divided into two parts and processed to obtain 1) plasma and 2) serum, with the plasma flash frozen and the serum used for a liver enzyme panel and then flash frozen. In addition, livers, spleens, kidneys, and inguinal lymph nodes (LNs) were collected and imaged ex vivo using IVIS.
[00464] Экспрессию люциферазы в печени оценивают с применением набора для люциферазного ИФА-анализа MAXDISCOVERY® Luciferase ELISA assay (BIOO Scientific/PerkinElmer), кПЦР на люциферазу образцов печени, гистопатологии образцов печени и/или панели анализов на ферменты печени в сыворотке (VetScanVS2; Abaxis Preventive Care Profile Plus). [00464] Liver luciferase expression is assessed using the MAXDISCOVERY® Luciferase ELISA assay kit (BIOO Scientific/PerkinElmer), liver luciferase qPCR, liver specimen histopathology, and/or serum liver enzyme panel (VetScanVS2; Abaxis Preventive Care Profile Plus).
ПРИМЕР 5: «Прогонный» скрининг мутантов ITREXAMPLE 5: Run-through screening for ITR mutants
[00465] Проводили дополнительные анализы взаимосвязи структуры ITR с образованием зкДНК. Конструировали серию мутантов для изучения влияния специфических структурных изменений на образование зкДНК и способность экспрессировать трансген кодируемый указанной зкДНК. Конструирование мутантов, анализ образования зкДНК и оценка трансгенной экспрессии зкДНК в культуре клеток человека более подробно описаны ниже.[00465] Additional analyzes were performed on the relationship of ITR structure to cccDNA production. A series of mutants were constructed to study the effect of specific structural changes on the formation of cccDNA and the ability to express the transgene encoded by the specified cccDNA. Construction of mutants, analysis of cccDNA production, and evaluation of transgene expression of cccDNA in human cell culture are described in more detail below.
A. Конструирование мутантных ITR A. Construction of mutant ITRs
[00466] Библиотеку из 31 плазмид с уникальными кассетами симметричных мутантных AAV ITR типа II разрабатывали in silico, а затем проводили оценку на клетках насекомых Sf9 и клетках эмбриональной почки человека (HEK293). Каждая кассета ITR содержала репортерный ген либо люциферазы (LUC), либо зеленого флуоресцентного белка (GFP) под управлением последовательности промотора p10 для экспрессии в клетках насекомых, и последовательности промотора CAG для экспрессии в клетках млекопитающих. Мутации в последовательности ITR были созданы либо в правом, либо в левом участке ITR. Библиотека содержала 15 правосторонних (RS) и 16 левосторонних (LS) мутантов, раскрытых в Таблицах 10A и 10B и на Фиг. 26A и 26B в данном документе. [00466] A library of 31 plasmids with unique type II symmetric mutant AAV ITR cassettes was developed in silico and then evaluated in Sf9 insect cells and human embryonic kidney (HEK293) cells. Each ITR cassette contained either a luciferase (LUC) or green fluorescent protein (GFP) reporter gene driven by a p10 promoter sequence for expression in insect cells, and a CAG promoter sequence for expression in mammalian cells. Mutations in the ITR sequence were created in either the right or left ITR region. The library contained 15 right-handed (RS) and 16 left-handed (LS) mutants, disclosed in Tables 10A and 10B and FIG. 26A and 26B herein.
[00467] Суспензионные культуры Sf9 культивировали в среде Sf900 III (Gibco) в вентилируемых флаконах объемом 200 мл для культур тканей. Культуры пересевали каждые 48 часов и перед каждым пересевом измеряли количество клеток и показатели роста с помощью счетчика ViCell Counter (Beckman Coulter). Культуры культивировали на шейкере (орбита 1 дюйм (25 мм), 130 об/мин) при 27 °C. Адгезивные культуры клеток HEK293 поддерживали в среде GlutiMax DMEM (модифицированной по Дульбекко среде Игла, Gibco) с 1% фетальной бычьей сыворотки и 0,1% пенициллина-стрептомицина (PenStrep) в культуральных флаконах объемом 250 мл при 37° C с 5% CO2. Культуры обрабатывали трипсином и пересевали каждые 96 часов. Для каждого пересева использовали разведение 1:10 из флакона с 90-100% конфлюэнтностью. [00467] Sf9 suspension cultures were grown in Sf900 III medium (Gibco) in vented 200 ml tissue culture flasks. Cultures were subcultured every 48 hours, and before each subculture, cell numbers and growth rates were measured using a ViCell Counter (Beckman Coulter). Cultures were grown on a shaker (1 inch (25 mm) orbit, 130 rpm) at 27°C. Adherent cultures of HEK293 cells were maintained in GlutiMax DMEM (Dulbecco's modified Eagle's medium, Gibco) with 1% fetal bovine serum and 0.1% penicillin-streptomycin (PenStrep) in 250 ml culture flasks at 37°C with 5% CO 2 . Cultures were treated with trypsin and subcultured every 96 hours. For each subculture, a 1:10 dilution from a 90-100% confluent vial was used.
[00468] зкДНК-векторы получали и конструировали согласно описанию в Примере 1 выше. Вкратце, как показано на Фиг. 4B, клетки Sf9, трансдуцированные плазмидными конструктами, оставляли для адгезивного роста в течение 24 часов в стационарных условиях при 27°C. Через 24 часа трансфицированные клетки Sf9 инфицировали Rep вектором через инфицированные бакуловирусом клетки насекомых (BIIC). BIIC предварительно анализировали для определения характеристик инфективности и использовали в итоговом разведении 1:2000. BIIC в разведении 1:100 в среде для клеток насекомых Sf900 добавляли в каждую лунку с предварительно инфицированными клетками. BIIC без Rep-вектора добавляли в подгруппу лунок в качестве отрицательного контроля. Содержимое в планшетах перемешивали путем аккуратного встряхивания на качалочной мешалке для планшетов в течение 2 минут. Клетки культивировали в течение дополнительных 48 часов при 27°C в стационарных условиях. Все экспериментальные и контрольные конструкты анализировали в трех повторах. [00468] cccDNA vectors were prepared and constructed as described in Example 1 above. Briefly, as shown in FIG. 4B, Sf9 cells transduced with plasmid constructs were allowed to grow adhesively for 24 hours under steady-state conditions at 27°C. After 24 h, transfected Sf9 cells were infected with Rep vector via baculovirus-infected insect cells (BIIC). BIIC was pre-assayed to determine infectivity characteristics and used at a final dilution of 1:2000. BIIC at a 1:100 dilution in Sf900 insect cell medium was added to each well of preinfected cells. BIIC without Rep vector was added to a subset of wells as a negative control. The contents of the plates were mixed by gentle shaking on a plate shaker for 2 minutes. Cells were cultured for an additional 48 hours at 27°C under steady-state conditions. All experimental and control constructs were analyzed in triplicate.
[00469] Через 48 часов 96-луночный планшет извлекали из инкубатора, оставляли на непродолжительное время для уравновешивания до комнатной температуры и анализировали экспрессию люциферазы (OneGlo Luciferase Assay (Promega Corporation)). Суммарную люминесценцию измеряли с применением микропланшетного ридера SpectraMax M Series. Данные для повторов усредняли. Результаты представлены на Фиг. 27. Как и ожидалось, три отрицательных контрольных образца (только среда, ложная трансфекция без донорской ДНК, образец, который был обработан в отсутствие клеток с содержащим Rep бакуловирусом) демонстрировали отсутствие значимой экспрессии люциферазы. Устойчивая экспрессия люциферазы наблюдалась в каждом из мутантных образцов, что указывает на то, что для каждого образца трансфекция кодируемым зкДНК трансгеном была успешной и он экспрессировался независимо от мутации. [00469] After 48 hours, the 96-well plate was removed from the incubator, allowed to equilibrate briefly to room temperature, and luciferase expression was assayed (OneGlo Luciferase Assay (Promega Corporation)). Total luminescence was measured using a SpectraMax M Series microplate reader. Data for replicates were averaged. The results are presented in Fig. 27. As expected, three negative control samples (medium only, mock transfection without donor DNA, sample that was treated in the absence of Rep-containing baculovirus cells) showed no significant luciferase expression. Robust luciferase expression was observed in each of the mutant samples, indicating that for each sample, transfection with the cDNA-encoded transgene was successful and it was expressed regardless of the mutation.
B. Анализ образования зкДНКB. Analysis of cDNA production
[00470] Чтобы убедиться, что зкДНК, полученная в предыдущем исследовании, имела ожидаемую структуру с замкнутыми концами, проводили эксперименты для получения достаточного количества каждой зкДНК, которая впоследствии могла бы быть протестирована на надлежащую структуру. Вкратце, суспензионные культуры Sf9 трансфицировали ДНК, принадлежащей одной ITR-мутантной плазмиде из библиотеки. Культуры высевали с плотностью 1,25 × 106 клеток/мл в культуральные флаконы Эрленмейера с ограниченным газообменом. Комплексы ДНК:липид для трансфекции получали с использованием реагента для трансфекции FuGene в соответствии с инструкциями производителя. Готовили смеси комплексов и инкубировали таким же образом, как описано выше для люцеферазного анализа на планшетах, с увеличением объемов пропорционально количеству трансфицируемых клеток. Как и в случае анализа с репортерным геном, использовали соотношение 4,5:1 (объем реагента/масса ДНК). Параллельно с экспериментальными культурами готовили ложнотрансфицированные (только реагенты для трансфекции) и необработанные контрольные культуры. После добавления реагентов для трансфекции культуры оставляли для восстановления в течение 10-15 минут при комнатной температуре с легким вращением, после чего переносили в инкубатор с шейкером и температурой 27°C. После 24 часов инкубации при встряхивании проводили подсчет клеток и измеряли показатели роста для всех флаконов (экспериментальных и контрольных) с помощью счетчика ViCell (Beckman Coulter). Все флаконы (за исключением контроля роста) инфицировали BIIC, содержащими Rep-вектор, в конечном разведении 1:5000. Также получали положительный контроль с использованием установленной процедуры двойного инфицирования BIIC для получения зкДНК. Для культуры с двойной инфекцией высевали количество клеток, равное среднему количеству жизнеспособных клеток во всех экспериментальных культурах. Контрольная культура с двойной инфекцией была инфицирована Rep и BIIC с репортерным геном в конечном разведении 1:5000 для каждого конструкта, соответственно. После инфицирования культуры снова помещали в инкубатор в ранее описанные условия со встряхиванием. Количество клеток, показатели роста и жизнеспособности измеряли ежедневно для всех флаконов в течение 3 дней после инфицирования. Измерения в момент времени Т=0 проводили после того, как вновь инфицированным культурам давали возможность восстановиться в течение приблизительно 2 часов в условиях инкубации со встряхиванием. Через 3 дня клетки собирали посредством центрифугирования в течение 15 минут. Супернатант утилизировали, записывали массу осадка и замораживали осадок при -80°C до экстракции ДНК. [00470] To ensure that the ccDNA obtained in the previous study had the expected closed-end structure, experiments were performed to obtain a sufficient amount of each ccDNA that could subsequently be tested for the proper structure. Briefly, Sf9 suspension cultures were transfected with DNA belonging to one ITR mutant plasmid from the library. Cultures were seeded at a density of 1.25 × 10 6 cells/ml in Erlenmeyer culture flasks with limited gas exchange. DNA:lipid transfection complexes were prepared using FuGene transfection reagent according to the manufacturer's instructions. Mixtures of complexes were prepared and incubated in the same manner as described above for the luciferase plate assay, with volumes increasing in proportion to the number of cells transfected. As in the case of the reporter gene assay, a ratio of 4.5:1 (reagent volume/DNA mass) was used. Mock-transfected (transfection reagents only) and untreated control cultures were prepared in parallel with the experimental cultures. After adding transfection reagents, cultures were allowed to recover for 10–15 minutes at room temperature with gentle rotation before being transferred to a shaker incubator at 27°C. After 24 hours of incubation with shaking, cell counts were performed and growth rates were measured for all vials (experimental and control) using a ViCell counter (Beckman Coulter). All vials (except growth control) were infected with BIIC containing Rep vector at a final dilution of 1:5000. A positive control was also obtained using the established BIIC double infection procedure to obtain cccDNA. For a dual infection culture, a number of cells equal to the average number of viable cells in all experimental cultures were seeded. The dual infection control culture was infected with Rep and reporter gene BIIC at a final dilution of 1:5000 for each construct, respectively. After infection, the cultures were placed back into the incubator under the previously described shaking conditions. Cell counts, growth rates, and viability rates were measured daily for all vials for 3 days postinfection. Measurements at time T=0 were performed after newly infected cultures had been allowed to recover for approximately 2 hours under shaking incubation conditions. After 3 days, cells were collected by centrifugation for 15 minutes. The supernatant was discarded, the weight of the pellet was recorded, and the pellet was frozen at −80°C until DNA extraction.
[00471] Предполагаемую неочищенную зкДНК экстрагировали из всех флаконов (экспериментальных и контрольных) с использованием набора для очистки Qiagen Plasmid Plus Midi Purification Kit (Qiagen) в соответствии с протоколом производителя для «высокого выхода». Количественное определение элюатов проводили с использованием данных измерения оптической плотности, полученных с помощью NanoDrop OneC (ThermoFisher). Полученные экстракты зкДНК хранили при 4°C. [00471] Putative crude cccDNA was extracted from all vials (experimental and control) using the Qiagen Plasmid Plus Midi Purification Kit (Qiagen) according to the manufacturer's protocol for “high yield.” Quantification of eluates was performed using absorbance data obtained from NanoDrop OneC (ThermoFisher). The resulting cccDNA extracts were stored at 4°C.
[00472] Вышеописанные экстракты зкДНК проганяли на нативном агарозном геле (1% агароза, 1x буфер TAE), приготовленному с использованием разведения SYBR Safe Gel Stain (ThermoFisher Scientific) 1:10000, вместе с ДНК-маркерами на 1 т.п.о. TrackIt Plus DNA. Затем гель визуализировали с помощью Gbox Mini Imager в УФ/синем свете. Согласно приведенному ранее описанию, ожидается, что в образцах зкДНК, которые прогнали на нативных гелях, будет две первичных полосы: полоса, соответствующая примерно 5500 п.о., представляющая мономерное вещество, и полоса, соответствующая примерно 11000 п.о., соответствующая димерному веществу. Все мутантные образцы были протестированы и показали ожидаемые полосы мономера и димера на нативных агарозных гелях. Результаты для репрезентативного образца указанных конструктов представлены на Фиг. 28. Предполагаемую неочищенную зкДНК с мутантным ITR и контрольные экстракты, полученные в малом масштабе, дополнительно анализировали с применением парного рестрикционного расщепления и денатурирующего агарозного геля для подтверждения двуцепочечной структуры ДНК, указывающей на зкДНК. Ожидается, что у каждого мутантного зкДНК имеется единственный сайт рестрикции EcoR1; поэтому, если она правильно сформирована, то образует два характерных фрагмента при расщеплении EcoR1. Высокоточную рестрикционную эндонуклеазу EcoRI (New England Biolabs) использовали для расщепления экстракта предполагаемой зкДНК в соответствии с инструкциями производителя. Экстракты ложнотрансфицированных и контрольных культур не анализировали, поскольку спектрофотометрическое количественное определение с применением NanoDrop (ThermoFisher), а также анализ на нативном агарозном геле показал, что в элюатах отсутствуют детектируемый зкДНК/плазмидо-подобный продукт. Расщепленный материал очищали с применением набора для ПЦР Qiagen PCR Clean-up Kit (Qiagen соответствии с инструкциями производителя, за исключением того, что очищенный расщепленный материал элюировали в воде без нуклеаз вместо буфера для элюирования от Qiagen. Щелочной агарозный гель (0,8% щелочной агарозы) уравновешивали в буфере для уравновешивания (1 мМ EDTA, 200 мМ NaOH) в течение ночи при 4°C. 10x денатурирующий раствор (50 мМ NaOH, 1 мМ EDTA) добавляли к образцам очищенных расщепленных зкДНК и соответствующих нерасщепленных зкДНК (в общем 1 мкг), и образцы нагревали при 65°C в течение 10 минут. 10x краситель для нанесения (бромфеноловый синий, 50% глицерина) добавляли к каждому денатурированному образцу и перемешивали. Маркеры Plus DNA TrackIt 1 т.п.о. (ThermoFisher Scientific) также наносили на гель в качестве референсной ДНК. Прогон на геле проводили в течение ~18 часов при 4°C и постоянном напряжении (25 В) с последующим промыванием деионизированной H2O и нейтрализацией в буфере 1xTAE (Tris-ацетат, EDTA), pH 7,6, в течение 20 минут при аккуратном помешивании. Затем гель переносили в раствор 1x TAE/1x SYBR Gold примерно на 1 час при аккуратном помешивании. Затем гель визуализировали с помощью Gbox Mini Imager (Syngene) в УФ/синем свете. Ожидалось, что неразрезанные денатурированные образцы будут мигрировать на уровне примерно 11000 пар оснований, а образцы, обработанные EcoRI - давать две полосы, одну на уровне примерно 4000 пар оснований и другую на уровне примерно 6000 пар оснований.[00472] The above cccDNA extracts were run on a native agarose gel (1% agarose, 1x TAE buffer) prepared using a 1:10,000 dilution of SYBR Safe Gel Stain (ThermoFisher Scientific) along with 1 kb DNA markers. TrackIt Plus DNA. The gel was then imaged using a Gbox Mini Imager under UV/blue light. Based on the previous description, cccDNA samples run on native gels are expected to have two primary bands: a band at approximately 5,500 bp, representing monomeric material, and a band at approximately 11,000 bp, corresponding to dimeric material. substance. All mutant samples were tested and showed the expected monomer and dimer bands on native agarose gels. Results for a representative sample of these constructs are presented in FIG. 28. Putative crude ITR mutant cccDNA and small scale control extracts were further analyzed using paired restriction digestion and denaturing agarose gel to confirm the double-stranded DNA structure indicative of cccDNA. Each cccDNA mutant is expected to have a single EcoR1 restriction site; therefore, if properly formed, it forms two characteristic fragments when cleavated by EcoR1. The high-precision restriction endonuclease EcoRI (New England Biolabs) was used to digest the putative ccDNA extract according to the manufacturer's instructions. Extracts from mock-transfected and control cultures were not analyzed because spectrophotometric quantitation using NanoDrop (ThermoFisher) as well as native agarose gel analysis indicated that there was no detectable ccDNA/plasmid-like product in the eluates. Digested material was purified using the Qiagen PCR Clean-up Kit (Qiagen according to the manufacturer's instructions, except that the purified digested material was eluted in nuclease-free water instead of Qiagen's elution buffer. Alkaline agarose gel (0.8% alkaline agarose) were equilibrated in equilibration buffer (1 mM EDTA, 200 mM NaOH) overnight at 4° C. A 10x denaturing solution (50 mM NaOH, 1 mM EDTA) was added to samples of purified digested cccDNAs and corresponding uncleaved cccDNAs (total 1 µg) and samples were heated at 65°C for 10 minutes. 10x loading dye (bromophenol blue, 50% glycerol) was added to each denatured sample and mixed. Plus DNA TrackIt 1 kb Markers (ThermoFisher Scientific) also applied to the gel as reference DNA. The gel was run for ~18 hours at 4°C and constant voltage (25 V), followed by washing with deionized H 2 O and neutralization in buffer 1xTAE (Tris-acetate, EDTA), pH 7.6, for 20 minutes with gentle stirring. The gel was then transferred to a 1x TAE/1x SYBR Gold solution for approximately 1 hour with gentle stirring. The gel was then imaged using a Gbox Mini Imager (Syngene) under UV/blue light. Uncut denatured samples were expected to migrate at approximately 11,000 bp, and EcoRI-treated samples were expected to produce two bands, one at approximately 4,000 bp and the other at approximately 6,000 bp.
[00473] Все мутантные образцы в этом эксперименте показали аналогичные результаты. Две значимых полосы были видны на каждой дорожке с обработанными EcoR1 образцами, мигрировавшими на денатурирующем геле с ожидаемыми размерами, что резко отличается от нерасщепленных образцов, которыйе мигрировали с ожидаемым размером примерно 11000 пар оснований. На Фиг. 27 показаны результаты для репрезентативного образца мутантов, где видны две полосы со значениями выше фоновых для каждого расщепленного мутантного образца, в отличие от единственной полосы, наблюдаемой в случае нерасщепленных мутантных образцов. Соответственно, в мутантных образцах, по-видимому, корректно формировалась зкДНК. [00473] All mutant samples in this experiment showed similar results. Two significant bands were visible in each lane with EcoR1-treated samples migrating at the expected size on the denaturing gel, in stark contrast to the uncleaved samples, which migrated at the expected size of approximately 11,000 bp. In FIG. Figure 27 shows the results for a representative sample of mutants, where two bands are visible above background values for each cleaved mutant sample, in contrast to the single band observed for the uncleaved mutant samples. Accordingly, cccDNA apparently formed correctly in the mutant samples.
A. Функциональная экспрессия в культуре клеток человека A. Functional expression in human cell culture
[00474] Для оценки функциональности мутантной ITR зкДНК, полученной в процессе маломасштабного производства, клетки HEK293 трансфицировали некоторыми репрезентативными образцами мутантной зкДНК. Активно делящиеся клетки HEK293 были посеяны в 96-луночные микротитрационные планшеты с плотностью 3x106 клеток на лунку (80% конфлюэнтность) и инкубируют в течение 24 часов в ранее описанных условиях для адгезивных культур HEK293. Через 24 часа проводили трансфекцию 200 нг неочищенной полученной в малом масштабе зкДНК с применением липофектамина (Invitrogen, ThermoFisher Scientific). Комплексы трансфекции получали в соответствии с инструкциями производителя, и 10 мкл общего объема комплекса трансфекции использовали для трансфекции ранее высеянных клеток HEK293. Все экспериментальные и контрольные конструкты анализировали в трех повторах. Трансфицированные клетки инкубировали в описанных ранее условиях в течение 72 часов. Через 72 часа 96-луночный планшет извлекали из инкубатора и ненадолго оставляют для уравновешивания до комнатной температуры. Был проведен OneGlo люциферазный анализ. После 10 минут на орбитальном шейкере измеряли суммарную люминесценцию с применением микропланшетного ридера SpectraMax M Series. Данные для повторов усредняли. Результаты представлены на Фиг. 30. Каждый из протестированных мутантных образцов, который экспрессировал люциферазу в культуре клеток человека, показывает, что зкДНК была корректно образована и экспрессирована для каждого образца в контексте клеток человека.[00474] To evaluate the functionality of the ITR mutant cccDNA produced in the small scale production process, HEK293 cells were transfected with some representative samples of the mutant cccDNA. Actively dividing HEK293 cells were seeded into 96-well microtiter plates at a density of 3 x 10 6 cells per well (80% confluent) and incubated for 24 hours under previously described conditions for adherent HEK293 cultures. After 24 hours, transfection was performed with 200 ng of crude, small-scale produced cccDNA using Lipofectamine (Invitrogen, ThermoFisher Scientific). Transfection complexes were prepared according to the manufacturer's instructions, and 10 μl of a total volume of transfection complex was used to transfect previously plated HEK293 cells. All experimental and control constructs were analyzed in triplicate. Transfected cells were incubated under previously described conditions for 72 hours. After 72 hours, the 96-well plate was removed from the incubator and allowed to equilibrate briefly to room temperature. OneGlo luciferase assay was performed. After 10 minutes on the orbital shaker, total luminescence was measured using a SpectraMax M Series microplate reader. Data for replicates were averaged. The results are presented in Fig. 30. Each of the mutant samples tested that expressed luciferase in human cell culture shows that the cccDNA was correctly generated and expressed for each sample in the context of human cells.
[00475] ПРИМЕР 6: Конструкты только с Rep78 или Rep68 способны продуцировать зкДНК[00475] EXAMPLE 6: Constructs with only Rep78 or Rep68 are capable of producing cccDNA
[00476] Ген репликации (Rep) AAV кодирует четыре неструктурных или репликационных (Rep) белка из одной и той же открытой рамки считывания. Rep78, Rep68, Rep52 и Rep40 названы по их предполагаемой молекулярной массе, рассчитанной по их подвижности в SDS-PAGE (Mendelson et al., 1986. J Virol. 60: 823-832). Rep78/68 транслируются с мРНК, происходящей от промотора транскрипции с элемента 5 на схеме (P5). Rep78 и Rep68 служат в качестве белков инициатора репликации вируса, которые распознают родственные сайты связывания в вирусной точки начала репликации и "разрывают" точку начала на сайте концевого разрешения. Процес никирования обеспечивает свободную 3'-гидроксильную группу, которая запускает синтез вирусной ДНК. Было показано, что в дополнение к ДНК-связывающей и сайт-специфической эндонуклеазной активности Rep78 и Rep68 обладают геликазной и АТФазной активностями. Белки Rep52/40 транслируются с мРНК, происходящей от промотора транскрипции элемента 19 на схеме (P19). Белки Rep52 и Rep40 опосредуют сборку вируса. Белки Rep68 и Rep40 отличаются от своих более длинных аналогов тем, что они транслируются со сплайсированных мРНК с промоторов P5 и P19 соответственно. Сплайсинг удаляет 92 аминокислотных остатка с карбоксильных концов белков Rep78 и Rep52 и заменяет их 9 аминокислотами, расположенными на С-концах Rep68 и Rep40.[00476] The AAV replication (Rep) gene encodes four nonstructural or replication (Rep) proteins from the same open reading frame. Rep78, Rep68, Rep52 and Rep40 are named by their predicted molecular weights calculated from their mobility on SDS-PAGE (Mendelson et al., 1986. J Virol. 60: 823-832). Rep78/68 are translated from mRNA derived from the transcription promoter from element 5 in the diagram (P5). Rep78 and Rep68 serve as viral replication initiator proteins that recognize cognate binding sites at the viral origin of replication and “break” the origin at the end resolution site. The nicking process provides a free 3'-hydroxyl group, which triggers viral DNA synthesis. In addition to DNA-binding and site-specific endonuclease activities, Rep78 and Rep68 have been shown to have helicase and ATPase activities. Rep52/40 proteins are translated from mRNA derived from transcription promoter element 19 in diagram (P19). The Rep52 and Rep40 proteins mediate virus assembly. The Rep68 and Rep40 proteins differ from their longer counterparts in that they are translated from spliced mRNAs from the P5 and P19 promoters, respectively. Splicing removes 92 amino acid residues from the carboxyl termini of the Rep78 and Rep52 proteins and replaces them with 9 amino acids located at the C termini of Rep68 and Rep40.
[00477] Были проведены эксперименты, чтобы определить, достаточно ли присутствия Rep78 или Rep68 для образования зкДНК. Добавляли точечную мутацию для устранения трансляции Rep 52 промотором p19 (M->G и M->T), чтобы исследовать влияние делеции Rep52/40 на образование зкДНК, как описано в Примере 1 выше. Таким образом, конструкты, модифицированные точечной мутацией Rep52 (например, аминокислоты 225 M->G и M->T), будут демонстрировать только продукт зкДНК из Rep78. Были созданы два дополнительных конструкта, чтобы определить, обладает ли Rep68 какой-либо активностью при образовании зкДНК. Мутанты Rep68 Met→ Gly (M225G) и Rep68 Met→Thr (M225T) были сконструированы для удаления внутреннего сайта трансляции и с-концевой интронной последовательности (92 аминокислотных остатка и замена на 9 аминокислот, как описано выше). Был получен дополнительный мутант с точечной мутацией в домене активности никазы (Y156F). На Фиг. 32A и B представляют собой неденатурирующие гели, показывающие присутствие высокостабильных ДНК-векторов и характерные полосы, подтверждающие присутствие вектора высокостабильной ДНК с замкнутыми концами (зкДНК), полученного с использованием единственного белка Rep, с использованием описанных здесь способов. Как показано на Фиг. 32A, более высокие количества вектора зкДНК продуцируются с использованием нуклеиновой кислоты модифицированного Rep78 с модификацией Rep78 из Met.→ Gly (M225G) (дорожка 1) или Rep Met→ Thr (M225T) (дорожка 2) по сравнению с продуцированием при использовании нуклеиновой кислоты, кодирующей Rep78 дикого типа (дорожка 5), при котором нуклеиновая кислота экспрессирует как белок Rep78, так и белок Rep52. Вектор зкДНК не был получен со связывающими мутантами Rep78, содержащими модификации Gly (Y156F) (дорожка 3) или Thr (Y156F) (дорожка 4). Фиг. 32B дополнительно показывает, что мутантные Rep68 Met→ Gly (M225G) и Rep68 Met→ Thr (M225T) также продуцировали вектор зкДНК до уровней, равных или превышающих количество вектора зкДНК, полученного с использованием нуклеиновой кислоты модифицированного Rep78 с модификацией Rep78 в Met→ Gly (M225G) или Rep Met→ Thr (M225T) и делецией с-концевого интрона. [00477] Experiments were conducted to determine whether the presence of Rep78 or Rep68 is sufficient for the formation of cccDNA. A point mutation was added to eliminate translation of Rep 52 by the p19 promoter (M->G and M->T) to examine the effect of Rep52/40 deletion on ccDNA production as described in Example 1 above. Thus, constructs modified by a point mutation of Rep52 (e.g., amino acids 225 M->G and M->T) will exhibit only the cccDNA product from Rep78. Two additional constructs were generated to determine whether Rep68 had any activity in cccDNA formation. The Rep68 Met→Gly (M225G) and Rep68 Met→Thr (M225T) mutants were constructed to remove the internal translation site and the C-terminal intronic sequence (92 amino acid residues and a 9 amino acid substitution as described above). An additional mutant with a point mutation in the nickase activity domain (Y156F) was generated. In FIG. 32A and B are non-denaturing gels showing the presence of highly stable DNA vectors and characteristic bands confirming the presence of a highly stable closed-end DNA (ccDNA) vector produced using a single Rep protein using the methods described herein. As shown in FIG. 32A, higher amounts of cccDNA vector are produced using the Rep78 modified nucleic acid with the Rep78 modification of Met.→Gly (M225G) (lane 1) or Rep Met→Thr (M225T) (lane 2) compared to production using the nucleic acid, encoding wild-type Rep78 (lane 5), in which the nucleic acid expresses both the Rep78 protein and the Rep52 protein. The cccDNA vector was not produced with Rep78 binding mutants containing Gly (Y156F) (lane 3) or Thr (Y156F) (lane 4) modifications. Fig. 32B further shows that the Rep68 Met→Gly (M225G) and Rep68 Met→Thr (M225T) mutants also produced cccDNA vector to levels equal to or greater than the amount of ccDNA vector produced using Rep78-modified nucleic acid with the Rep78 modification to Met→Gly ( M225G) or Rep Met→ Thr (M225T) and deletion of the C-terminal intron.
[00478] Соответственно, эти эксперименты продемонстрировали, что одного Rep78 или одного Rep68 достаточно для образования зкДНК без присутствия Rep52 или Rep40. [00478] Accordingly, these experiments demonstrated that Rep78 alone or Rep68 alone is sufficient to produce cccDNA without the presence of Rep52 or Rep40.
ИСТОЧНИКИSOURCES
[00479] Все источники, перечисленные и раскрытые в данном описании и в примерах, в том числе патенты, патентные заявки, международные патентные заявки и публикации включены в данный документ полностью посредством ссылок.[00479] All sources listed and disclosed in this description and in the examples, including patents, patent applications, international patent applications and publications are incorporated herein in their entirety by reference.
[00480] REP последовательности[00480] REP sequences
SEQ ID NO. 558 представляет собой аминокислотную последовательность Rep 40 из AAV1.SEQ ID NO. 558 is the amino acid sequence of Rep 40 from AAV1.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 558)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 558)
SEQ ID NO. 559 представляет собой аминокислотную последовательность Rep 40 из AAV2.SEQ ID NO. 559 is the amino acid sequence of Rep 40 from AAV2.
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
Arg Leu Ala Arg Gly His Ser Leu (SEQ ID NO: 559)Arg Leu Ala Arg Gly His Ser Leu (SEQ ID NO: 559)
SEQ ID NO. 560 представляет собой аминокислотную последовательность Rep 40 из AAV3A.SEQ ID NO. 560 is the amino acid sequence of Rep 40 from AAV3A.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 560)Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 560)
SEQ ID NO. 561 представляет собой аминокислотную последовательность Rep 40 из AAV3B.SEQ ID NO. 561 is the amino acid sequence of Rep 40 from AAV3B.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 561)Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 561)
SEQ ID NO. 562 представляет собой аминокислотную последовательность Rep 40 из AAV4.SEQ ID NO. 562 is the amino acid sequence of Rep 40 from AAV4.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 562)Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 562)
SEQ ID NO. 563 представляет собой аминокислотную последовательность Rep 40 из AAV5.SEQ ID NO. 563 is the amino acid sequence of Rep 40 from AAV5.
Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr
Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys
Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser
Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys
Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe
Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln
Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val
Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala
Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr
Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro
Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn
Trp Asn Ser Leu Val Gly Pro Ser Trp (SEQ ID NO: 563)Trp Asn Ser Leu Val Gly Pro Ser Trp (SEQ ID NO: 563)
SEQ ID NO. 564 представляет собой аминокислотную последовательность Rep 40 из AAV6.SEQ ID NO. 564 is the amino acid sequence of Rep 40 from AAV6.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 564)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 564)
SEQ ID NO. 565 представляет собой аминокислотную последовательность Rep 40 из AAV7.SEQ ID NO. 565 is the amino acid sequence of Rep 40 from AAV7.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 565)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 565)
SEQ ID NO. 566 представляет собой аминокислотную последовательность Rep 40 из AAV8.SEQ ID NO. 566 is the amino acid sequence of Rep 40 from AAV8.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 566)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 566)
SEQ ID NO. 567 представляет собой консенсусную аминокислотную последовательность SEQ ID NO: 558-566.SEQ ID NO. 567 is the consensus amino acid sequence of SEQ ID NO: 558-566.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser
Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Xaa Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp Ala Xaa Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp
Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 567)Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 567)
SEQ ID NO. 568 представляет собой аминокислотную последовательность Rep 52 из AAV1.SEQ ID NO. 568 is the amino acid sequence of Rep 52 from AAV1.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 568)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 568)
SEQ ID NO. 569 представляет собой аминокислотную последовательность Rep 52 из AAV2.SEQ ID NO. 569 is the amino acid sequence of Rep 52 from AAV2.
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln (SEQ ID NO: 569)Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln (SEQ ID NO: 569)
SEQ ID NO. 570 представляет собой аминокислотную последовательность Rep 52 из AAV3A.SEQ ID NO. 570 is the amino acid sequence of Rep 52 from AAV3A.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 570)Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 570)
SEQ ID NO. 571 представляет собой аминокислотную последовательность Rep 52 из AAV3B.SEQ ID NO. 571 is the amino acid sequence of Rep 52 from AAV3B.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 571)Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 571)
SEQ ID NO. 572 представляет собой аминокислотную последовательность Rep 52 из AAV4.SEQ ID NO. 572 is the amino acid sequence of Rep 52 from AAV4.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys
Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu
Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys
Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala
Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln (SEQ ID NO: 572)Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln (SEQ ID NO: 572)
SEQ ID NO. 573 представляет собой аминокислотную последовательность Rep 52 из AAV5.SEQ ID NO. 573 is the amino acid sequence of Rep 52 from AAV5.
Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr
Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys
Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser
Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys
Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe
Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln
Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val
Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala
Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr
Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro
Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn
Trp Asn Ser Arg Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Trp Asn Ser Arg Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp
Asn Ile Ser Asn Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Ile Ser Asn Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys
Asn Gly Cys Ile Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Asn Gly Cys Ile Cys His Asn Val Thr His Cys Gln Ile Cys His Gly
Ile Pro Pro Trp Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Ile Pro Pro Trp Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp
Asp Ala Asn Lys Glu Gln (SEQ ID NO: 573)Asp Ala Asn Lys Glu Gln (SEQ ID NO: 573)
SEQ ID NO. 574 представляет собой аминокислотную последовательность Rep 52 из AAV6.SEQ ID NO. 574 is the amino acid sequence of Rep 52 from AAV6.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 574)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 574)
SEQ ID NO. 575 представляет собой аминокислотную последовательность Rep 52 из AAV7.SEQ ID NO. 575 is the amino acid sequence of Rep 52 from AAV7.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 575)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 575)
SEQ ID NO. 576 представляет собой аминокислотную последовательность Rep 52 из AAV8.SEQ ID NO. 576 is the amino acid sequence of Rep 52 from AAV8.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 576)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 576)
SEQ ID NO. 577 представляет собой консенсусную аминокислотную последовательность SEQ ID NOs 568-576.SEQ ID NO. 577 is the consensus amino acid sequence of SEQ ID NOs 568-576.
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser
Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys
Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser
Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa
Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys
Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 577)Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 577)
SEQ ID NO. 578 представляет собой аминокислотную последовательность Rep 68 из AAV1.SEQ ID NO. 578 is the amino acid sequence of Rep 68 from AAV1.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 578)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 578)
SEQ ID NO. 579 представляет собой аминокислотную последовательность Rep 68 из AAV2.SEQ ID NO. 579 is the amino acid sequence of Rep 68 from AAV2.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
Arg Leu Ala Arg Gly His Ser Leu (SEQ ID NO: 579)Arg Leu Ala Arg Gly His Ser Leu (SEQ ID NO: 579)
SEQ ID NO. 580 представляет собой аминокислотную последовательность Rep 68 из AAV3A.SEQ ID NO. 580 is the amino acid sequence of Rep 68 from AAV3A.
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 580)Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 580)
SEQ ID NO. 581 представляет собой аминокислотную последовательность Rep 68 из AAV3B.SEQ ID NO. 581 is the amino acid sequence of Rep 68 from AAV3B.
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 581)Leu Ala Arg Gly Gln Pro Phe (SEQ ID NO: 581)
SEQ ID NO. 582 представляет собой аминокислотную последовательность Rep 68 из AAV4.SEQ ID NO. 582 is the amino acid sequence of Rep 68 from AAV4.
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu
Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 582)Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 582)
SEQ ID NO. 583 представляет собой аминокислотную последовательность Rep 68 из AAV5.SEQ ID NO. 583 is the amino acid sequence of Rep 68 from AAV5.
Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly
Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val
Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu
Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln
Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr
Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg
Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn
Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val
Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro
Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala
Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu
Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala
Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val
Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln
Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg
Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu
Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp
Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp
Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe
Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys
Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys
Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys
Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu
Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys
Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser
Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu
His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys
Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp
Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe
Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu
Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu
Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp
Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Leu Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Leu
Val Gly Pro Ser Trp (SEQ ID NO: 583)Val Gly Pro Ser Trp (SEQ ID NO: 583)
SEQ ID NO. 584 представляет собой аминокислотную последовательность Rep 68 из AAV6.SEQ ID NO. 584 is the amino acid sequence of Rep 68 from AAV6.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 584)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 584)
SEQ ID NO. 585 представляет собой аминокислотную последовательность Rep 68 из AAV7.SEQ ID NO. 585 is the amino acid sequence of Rep 68 from AAV7.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 585)Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 585)
SEQ ID NO. 586 представляет собой аминокислотную последовательность Rep 68 из AAV8.SEQ ID NO. 586 is the amino acid sequence of Rep 68 from AAV8.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr
Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala
Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu
Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu
Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala
Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn
Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala
Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser
Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn
Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala
Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly
Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu
Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly
Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly
Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala
Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe
Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met
Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys
Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr
Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly
Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe
Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr
Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr
Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg
Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro
Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp
Phe Ala Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 586)Phe Ala Asp Leu Ala Arg Gly Gln Pro Leu (SEQ ID NO: 586)
SEQ ID NO. 587 представляет собой аминокислотную последовательность Rep 78 из AAV1.SEQ ID NO. 587 is the amino acid sequence of Rep 78 from AAV1.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 587)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 587)
SEQ ID NO. 588 представляет собой аминокислотную последовательность Rep 78 из AAV2.SEQ ID NO. 588 is the amino acid sequence of Rep 78 from AAV2.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln (SEQ ID NO: 588)Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln (SEQ ID NO: 588)
SEQ ID NO. 589 представляет собой аминокислотную последовательность Rep 78 из AAV3A.SEQ ID NO. 589 is the amino acid sequence of Rep 78 from AAV3A.
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 589)Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 589)
SEQ ID NO. 590 представляет собой аминокислотную последовательность Rep 78 из AAV3B.SEQ ID NO. 590 is the amino acid sequence of Rep 78 from AAV3B.
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 590)Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 590)
SEQ ID NO. 591 представляет собой аминокислотную последовательность Rep 78 из AAV4.SEQ ID NO. 591 is the amino acid sequence of Rep 78 from AAV4.
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu
Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys
Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu
Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys
Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala
Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln (SEQ ID NO: 591)Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln (SEQ ID NO: 591)
SEQ ID NO. 592 представляет собой аминокислотную последовательность Rep 78 из AAV5.SEQ ID NO. 592 is the amino acid sequence of Rep 78 from AAV5.
Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly
Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val
Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu
Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln
Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr
Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg
Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn
Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val
Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro
Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala
Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu
Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala
Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val
Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln
Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg
Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu
Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp
Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp
Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe
Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys
Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys
Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys
Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu
Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys
Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser
Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu
His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys
Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp
Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe
Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu
Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu
Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp
Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Arg Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Arg
Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Asn Ile Ser Asn Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Asn Ile Ser Asn
Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Gly Cys Ile Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Gly Cys Ile
Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Ile Pro Pro Trp Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Ile Pro Pro Trp
Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Asp Ala Asn Lys Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Asp Ala Asn Lys
Glu Gln (SEQ ID NO: 592)Glu Gln (SEQ ID NO: 592)
SEQ ID NO. 593 представляет собой аминокислотную последовательность Rep 78 из AAV6.SEQ ID NO. 593 is the amino acid sequence of Rep 78 from AAV6.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 593)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 593)
SEQ ID NO. 594 представляет собой аминокислотную последовательность Rep 78 из AAV7.SEQ ID NO. 594 is the amino acid sequence of Rep 78 from AAV7.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val
Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 594)Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln (SEQ ID NO: 594)
SEQ ID NO. 595 представляет собой аминокислотную последовательность Rep 78 из AAV8.SEQ ID NO. 595 is the amino acid sequence of Rep 78 from AAV8.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr
Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala
Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu
Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu
Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala
Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn
Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala
Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser
Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn
Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala
Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly
Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu
Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly
Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly
Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala
Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe
Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met
Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys
Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr
Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly
Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe
Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr
Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr
Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg
Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro
Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp
Phe Ala Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Phe Ala Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu
Gln Met Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Gln Met Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe
Asn Ile Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro Asn Ile Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro
Gly Val Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Gly Val Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys
Leu Cys Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Leu Cys Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys
Ser Ala Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Ser Ala Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu
Gln (SEQ ID NO: 595)Gln (SEQ ID NO: 595)
SEQ ID NO. 596 представляет собой консенсусную аминокислотную последовательность Rep78 из SEQ ID NO: 587-595.SEQ ID NO. 596 is the consensus amino acid sequence of Rep78 from SEQ ID NO: 587-595.
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
Arg Glu Lys Leu Val Xaa Xaa Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Glu Lys Leu Val Xaa Xaa Ile Tyr Arg Gly Ile Glu Pro Thr Leu
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser
Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp
Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys
Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser
Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa
Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys
Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu GlnAsp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ LIST OF SEQUENCES
<110> ДЖЕНЕРЕЙШЕН БИО КО.<110> GENERATION BIO CO.
<120> МОДУЛЯЦИЯ АКТИВНОСТИ REP БЕЛКА ПРИ ПОЛУЧЕНИИ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (ЗКДНК)<120> MODULATION OF REP PROTEIN ACTIVITY WHEN PRODUCING CLOSED-END DNA (CCDNA)
<130> 131698-05420<130> 131698-05420
<140><140>
<141><141>
<150> 62/806,076<150> 62/806,076
<151> 2019-02-15<151> 2019-02-15
<160> 606 <160> 606
<170> PatentIn версия 3.5<170> PatentIn version 3.5
<210> 1<210> 1
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 1<400> 1
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141gagcgcgcag ctgcctgcag g 141
<210> 2<210> 2
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 2<400> 2
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120
tgcctgcagg 130tgcctgcagg 130
<210> 3<210> 3
<211> 1923<211> 1923
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 3<400> 3
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg 540gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg 540
cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta 600cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta 600
attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg 660attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg 660
gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg 720gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg 720
cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg 780cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg 780
aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg 840aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg 840
ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc 900ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc 900
gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt 960gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt 960
ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc 1020ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc 1020
ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc 1080ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc 1080
ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg 1140ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg 1140
aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag 1200aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag 1200
gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc 1260gctgcgtgcg gggtgtgtgc gtggggggggt gagcaggggg tgtgggcgcg gcggtcgggc 1260
tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg 1320tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg 1320
gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg 1380gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg 1380
ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc 1440ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc 1440
ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg 1500ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg 1500
taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct 1560taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct 1560
gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg 1620gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg 1620
aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc 1680aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc 1680
cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg 1740cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg 1740
ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc 1800ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc 1800
ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg 1860ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg 1860
acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag 1920acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag 1920
cca 1923cca 1923
<210> 4<210> 4
<211> 1272<211> 1272
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 4<400> 4
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat 780ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1140ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1140
cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt 1200cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt 1200
tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac 1260tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac 1260
ctttggaact ga 1272ctttggaact ga 1272
<210> 5<210> 5
<211> 547<211> 547
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 5<400> 5
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag 180cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag 180
gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag 240gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag 240
gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct 300gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct 300
gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt 360gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt 360
gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca 420gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca 420
ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa 480ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa 480
gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg 540gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg 540
gaactga 547gaactga 547
<210> 6<210> 6
<211> 1179<211> 1179
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 6<400> 6
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720gcgcggccac cgagaatcgg acggggggtag tctcaagctg gccggcctgc tctggtgcct 720
ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140
gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179
<210> 7<210> 7
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 7<400> 7
gtttaaac 8gtttaaac 8
<210> 8<210> 8
<211> 581<211> 581
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 8<400> 8
gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60
ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120
actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240
aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360
ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540
ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581
<210> 9<210> 9
<211> 225<211> 225
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 9<400> 9
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225
<210> 10<210> 10
<211> 213<211> 213
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 10<400> 10
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 180ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 180
tttaaagcaa gtaaaacctc tacaaatgtg gta 213tttaaagcaa gtaaaacctc tacaaatgtg gta 213
<210> 11<210> 11
<211> 1386<211> 1386
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 11<400> 11
atgcagcgcg tgaacatgat catggccgag agccccggcc tgatcaccat ctgcctgctg 60atgcagcgcg tgaacatgat catggccgag agccccggcc tgatcaccat ctgcctgctg 60
ggctacctgc tgagcgccga gtgcaccgtg ttcctggacc acgagaacgc caacaagatc 120ggctacctgc tgagcgccga gtgcaccgtg ttcctggacc acgagaacgc caacaagatc 120
ctgaaccgcc ccaagcgcta caacagcggc aagctggagg agttcgtgca gggcaacctg 180ctgaaccgcc ccaagcgcta caacagcggc aagctggagg agttcgtgca gggcaacctg 180
gagcgcgagt gcatggagga gaagtgcagc ttcgaggagg cccgcgaggt gttcgagaac 240gagcgcgagt gcatggagga gaagtgcagc ttcgaggagg cccgcgaggt gttcgagaac 240
accgagcgca ccaccgagtt ctggaagcag tacgtggacg gcgaccagtg cgagagcaac 300accgagcgca ccaccgagtt ctggaagcag tacgtggacg gcgaccagtg cgagagcaac 300
ccctgcctga acggcggcag ctgcaaggac gacatcaaca gctacgagtg ctggtgcccc 360ccctgcctga acggcggcag ctgcaaggac gacatcaaca gctacgagtg ctggtgcccc 360
ttcggcttcg agggcaagaa ctgcgagctg gacgtgacct gcaacatcaa gaacggccgc 420ttcggcttcg agggcaagaa ctgcgagctg gacgtgacct gcaacatcaa gaacggccgc 420
tgcgagcagt tctgcaagaa cagcgccgac aacaaggtgg tgtgcagctg caccgagggc 480tgcgagcagt tctgcaagaa cagcgccgac aacaaggtgg tgtgcagctg caccgaggc 480
taccgcctgg ccgagaacca gaagagctgc gagcccgccg tgcccttccc ctgcggcagg 540taccgcctgg ccgagaacca gaagagctgc gagcccgccg tgcccttccc ctgcggcagg 540
gtgagcgtga gccagaccag caagctgacc cgcgccgagg ccgtgttccc cgacgtggac 600gtgagcgtga gccagaccag caagctgacc cgcgccgagg ccgtgttccc cgacgtggac 600
tacgtgaaca gcaccgaggc cgagaccatc ctggacaaca tcacccagag cacccagagc 660tacgtgaaca gcaccgaggc cgagaccatc ctggacaaca tcacccagag cacccagagc 660
ttcaacgact tcacccgcgt ggtgggcggc gaggacgcca agcccggcca gttcccctgg 720ttcaacgact tcacccgcgt ggtgggcggc gaggacgcca agcccggcca gttcccctgg 720
caggtggtgc tgaacggcaa ggtggacgcc ttctgcggcg gcagcatcgt gaacgagaag 780caggtggtgc tgaacggcaa ggtggacgcc ttctgcggcg gcagcatcgt gaacgagaag 780
tggatcgtga ccgccgccca ctgcgtggag accggcgtga agatcaccgt ggtggccggc 840tggatcgtga ccgccgccca ctgcgtggag accggcgtga agatcaccgt ggtggccggc 840
gagcacaaca tcgaggagac cgagcacacc gagcagaagc gcaacgtgat ccgcatcatc 900gagcacaaca tcgaggagac cgagcacacc gagcagaagc gcaacgtgat ccgcatcatc 900
ccccaccaca actacaacgc cgccatcaac aagtacaacc acgacatcgc cctgctggag 960ccccaccaca actacaacgc cgccatcaac aagtacaacc acgacatcgc cctgctggag 960
ctggacgagc ccctggtgct gaacagctac gtgaccccca tctgcatcgc cgacaaggag 1020ctggacgagc ccctggtgct gaacagctac gtgaccccca tctgcatcgc cgacaaggag 1020
tacaccaaca tcttcctgaa gttcggcagc ggctacgtga gcggctgggg ccgcgtgttc 1080tacaccaaca tcttcctgaa gttcggcagc ggctacgtga gcggctgggg ccgcgtgttc 1080
cacaagggcc gcagcgccct ggtgctgcag tacctgcgcg tgcccctggt ggaccgcgcc 1140cacaagggcc gcagcgccct ggtgctgcag tacctgcgcg tgcccctggt ggaccgcgcc 1140
acctgcctgc gcagcaccaa gttcaccatc tacaacaaca tgttctgcgc cggcttccac 1200acctgcctgc gcagcaccaa gttcaccatc tacaacaaca tgttctgcgc cggcttccac 1200
gagggcggca gggacagctg ccagggcgac agcggcggcc cccacgtgac cgaggtggag 1260gagggcggca gggacagctg ccagggcgac agcggcggcc cccacgtgac cgaggtggag 1260
ggcaccagct tcctgaccgg catcatcagc tggggcgagg agtgcgccat gaagggcaag 1320ggcaccagct tcctgaccgg catcatcagc tggggcgagg agtgcgccat gaagggcaag 1320
tacggcatct acaccaaggt gagccgctac gtgaactgga tcaaggagaa gaccaagctg 1380tacggcatct acaccaaggt gagccgctac gtgaactgga tcaaggagaa gaccaagctg 1380
acctaa 1386actaa 1386
<210> 12<210> 12
<211> 1386<211> 1386
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 12<400> 12
atgcagcgcg tgaacatgat catggccgag agccccggcc tgatcaccat ctgcctgctg 60atgcagcgcg tgaacatgat catggccgag agccccggcc tgatcaccat ctgcctgctg 60
ggctacctgc tgagcgccga gtgcaccgtg ttcctggacc acgagaacgc caacaagatc 120ggctacctgc tgagcgccga gtgcaccgtg ttcctggacc acgagaacgc caacaagatc 120
ctgaaccgcc ccaagcgcta caacagcggc aagctggagg agttcgtgca gggcaacctg 180ctgaaccgcc ccaagcgcta caacagcggc aagctggagg agttcgtgca gggcaacctg 180
gagcgcgagt gcatggagga gaagtgcagc ttcgaggagg cccgcgaggt gttcgagaac 240gagcgcgagt gcatggagga gaagtgcagc ttcgaggagg cccgcgaggt gttcgagaac 240
accgagcgca ccaccgagtt ctggaagcag tacgtggacg gcgaccagtg cgagagcaac 300accgagcgca ccaccgagtt ctggaagcag tacgtggacg gcgaccagtg cgagagcaac 300
ccctgcctga acggcggcag ctgcaaggac gacatcaaca gctacgagtg ctggtgcccc 360ccctgcctga acggcggcag ctgcaaggac gacatcaaca gctacgagtg ctggtgcccc 360
ttcggcttcg agggcaagaa ctgcgagctg gacgtgacct gcaacatcaa gaacggccgc 420ttcggcttcg agggcaagaa ctgcgagctg gacgtgacct gcaacatcaa gaacggccgc 420
tgcgagcagt tctgcaagaa cagcgccgac aacaaggtgg tgtgcagctg caccgagggc 480tgcgagcagt tctgcaagaa cagcgccgac aacaaggtgg tgtgcagctg caccgaggc 480
taccgcctgg ccgagaacca gaagagctgc gagcccgccg tgcccttccc ctgcggcagg 540taccgcctgg ccgagaacca gaagagctgc gagcccgccg tgcccttccc ctgcggcagg 540
gtgagcgtga gccagaccag caagctgacc cgcgccgagg ccgtgttccc cgacgtggac 600gtgagcgtga gccagaccag caagctgacc cgcgccgagg ccgtgttccc cgacgtggac 600
tacgtgaaca gcaccgaggc cgagaccatc ctggacaaca tcacccagag cacccagagc 660tacgtgaaca gcaccgaggc cgagaccatc ctggacaaca tcacccagag cacccagagc 660
ttcaacgact tcacccgcgt ggtgggcggc gaggacgcca agcccggcca gttcccctgg 720ttcaacgact tcacccgcgt ggtgggcggc gaggacgcca agcccggcca gttcccctgg 720
caggtggtgc tgaacggcaa ggtggacgcc ttctgcggcg gcagcatcgt gaacgagaag 780caggtggtgc tgaacggcaa ggtggacgcc ttctgcggcg gcagcatcgt gaacgagaag 780
tggatcgtga ccgccgccca ctgcgtggag accggcgtga agatcaccgt ggtggccggc 840tggatcgtga ccgccgccca ctgcgtggag accggcgtga agatcaccgt ggtggccggc 840
gagcacaaca tcgaggagac cgagcacacc gagcagaagc gcaacgtgat ccgcatcatc 900gagcacaaca tcgaggagac cgagcacacc gagcagaagc gcaacgtgat ccgcatcatc 900
ccccaccaca actacaacgc cgccatcaac aagtacaacc acgacatcgc cctgctggag 960ccccaccaca actacaacgc cgccatcaac aagtacaacc acgacatcgc cctgctggag 960
ctggacgagc ccctggtgct gaacagctac gtgaccccca tctgcatcgc cgacaaggag 1020ctggacgagc ccctggtgct gaacagctac gtgaccccca tctgcatcgc cgacaaggag 1020
tacaccaaca tcttcctgaa gttcggcagc ggctacgtga gcggctgggg ccgcgtgttc 1080tacaccaaca tcttcctgaa gttcggcagc ggctacgtga gcggctgggg ccgcgtgttc 1080
cacaagggcc gcagcgccct ggtgctgcag tacctgcgcg tgcccctggt ggaccgcgcc 1140cacaagggcc gcagcgccct ggtgctgcag tacctgcgcg tgcccctggt ggaccgcgcc 1140
acctgcctgc tgagcaccaa gttcaccatc tacaacaaca tgttctgcgc cggcttccac 1200acctgcctgc tgagcaccaa gttcaccatc tacaacaaca tgttctgcgc cggcttccac 1200
gagggcggca gggacagctg ccagggcgac agcggcggcc cccacgtgac cgaggtggag 1260gagggcggca gggacagctg ccagggcgac agcggcggcc cccacgtgac cgaggtggag 1260
ggcaccagct tcctgaccgg catcatcagc tggggcgagg agtgcgccat gaagggcaag 1320ggcaccagct tcctgaccgg catcatcagc tggggcgagg agtgcgccat gaagggcaag 1320
tacggcatct acaccaaggt gagccgctac gtgaactgga tcaaggagaa gaccaagctg 1380tacggcatct acaccaaggt gagccgctac gtgaactgga tcaaggagaa gaccaagctg 1380
acctaa 1386actaa 1386
<210> 13<210> 13
<211> 1876<211> 1876
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 13<400> 13
cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg 60cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg 60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 900taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg 900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860gggaaaggtg cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860
catctttgaa caataa 1876catctttgaa caataa 1876
<210> 14<210> 14
<211> 1191<211> 1191
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 14<400> 14
ttgttcaaag atgcagtcat ccaaatccac attgaccaga tcgcaggcag tgcaagcgtc 60ttgttcaaag atgcagtcat ccaaatccac attgaccaga tcgcaggcag tgcaagcgtc 60
tggcaccttt cccatgatat gatgaatgta gcacagtttc tgatacgcct ttttgacgac 120tggcaccttt cccatgatat gatgaatgta gcacagtttc tgatacgcct ttttgacgac 120
agaaacgggt tgagattctg acacgggaaa gcactctaaa cagtctttct gtccgtgagt 180agaaacgggt tgagattctg acacgggaaa gcactctaaa cagtctttct gtccgtgagt 180
gaagcagata tttgaattct gattcattct ctcgcattgt ctgcagggaa acagcatcag 240gaagcagata tttgaattct gattcattct ctcgcattgt ctgcagggaa acagcatcag 240
attcatgccc acgtgacgag aacatttgtt ttggtagcgg tctgcgtagt tgatcgaagc 300attcatgccc acgtgacgag aacatttgtt ttggtagcgg tctgcgtagt tgatcgaagc 300
ttccgcgtct gacgtcgatg gctgcgcaac tgactcgcgc acccgtttgg gctcacttat 360ttccgcgtct gacgtcgatg gctgcgcaac tgactcgcgc acccgtttgg gctcacttat 360
atctgcgtca ctgggggcgg gtcttttctt ggctccaccc tttttgacgt agaattcatg 420atctgcgtca ctgggggcgg gtcttttctt ggctccaccc tttttgacgt agaattcatg 420
ctccacctca accacgtgat cctttgccca ccggaaaaag tctttgactt cctgcttggt 480ctccacctca accacgtgat cctttgccca ccggaaaaag tctttgactt cctgcttggt 480
gaccttccca aagtcatgat ccagacggcg ggtgagttca aatttgaaca tccggtcttg 540gaccttccca aagtcatgat cgacggcg ggtgagttca aatttgaaca tccggtcttg 540
caacggctgc tggtgttcga aggtcgttga gttcccgtca atcacggcgc acatgttggt 600caacggctgc tggtgttcga aggtcgttga gttcccgtca atcacggcgc acatgttggt 600
gttggaggtg acgatcacgg gagtcgggtc tatctgggcc gaggacttgc atttctggtc 660gttggaggtg acgatcacgg gagtcgggtc tatctgggcc gaggacttgc atttctggtc 660
cacgcgcacc ttgcttcctc cgagaatggc tttggccgac tccacgacct tggcggtcat 720cacgcgcacc ttgcttcctc cgagaatggc tttggccgac tccacgacct tggcggtcat 720
cttcccctcc tcccaccaga tcaccatctt gtcgacacag tcgttgaagg gaaagttctc 780cttcccctcc tcccaccaga tcaccatctt gtcgacacag tcgttgaagg gaaagttctc 780
attggtccag tttacgcacc cgtagaaggg cacagtgtgg gctatggcct ccgcgatgtt 840attggtccag tttacgcacc cgtagaaggg cacagtgtgg gctatggcct ccgcgatgtt 840
ggtcttcccg gtagttgcag gcccaaacag ccagatggtg ttcctcttgc cgaacttttt 900ggtcttcccg gtagttgcag gcccaaacag ccagatggtg ttcctcttgc cgaacttttt 900
cgtggcccat cccagaaaga cggaagccgc atattgggga tcgtacccgt ttagttccaa 960cgtggcccat cccagaaaga cggaagccgc atattgggga tcgtacccgt ttagttccaa 960
aattttataa atccgattgc tggaaatgtc ctccacgggc tgctggccca ccaggtagtc 1020aattttataa atccgattgc tggaaatgtc ctccacgggc tgctggccca ccaggtagtc 1020
gggggcggtt ttagtcaggc tcataatctt tcccgcattg tccaaggcag ccttgatttg 1080gggggcggtt ttagtcaggc tcataatctt tcccgcattg tccaaggcag ccttgatttg 1080
ggaccgcgag ttggaggccg cattgaagga gatgtatgag gcctggtcct cctggatcca 1140ggaccgcgag ttggaggccg cattgaagga gatgtatgag gcctggtcct cctggatcca 1140
ctgcttctcc gaggtaatcc ccttgtccac gagccacccg accagctcca t 1191ctgcttctcc gaggtaatcc ccttgtccac gagccacccg accagctcca t 1191
<210> 15<210> 15
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 15<400> 15
aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt 60aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt 60
cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc 120cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc 120
tgcggcgcgc gcagcacctt t 141tgcggcgcgc gcagcacctt t 141
<210> 16<210> 16
<211> 556<211> 556
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 16<400> 16
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct 420ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct 420
tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa 480tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa 480
aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc 540aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc 540
caacctttgg aactga 556caacctttgg aactga 556
<210> 17<210> 17
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 17<400> 17
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 18<210> 18
<400> 18<400> 18
000000
<210> 19<210> 19
<400> 19<400> 19
000000
<210> 20<210> 20
<400> 20<400> 20
000000
<210> 21<210> 21
<400> 21<400> 21
000000
<210> 22<210> 22
<400> 22<400> 22
000000
<210> 23<210> 23
<400> 23<400> 23
000000
<210> 24<210> 24
<400> 24<400> 24
000000
<210> 25<210> 25
<400> 25<400> 25
000000
<210> 26<210> 26
<400> 26<400> 26
000000
<210> 27<210> 27
<400> 27<400> 27
000000
<210> 28<210> 28
<400> 28<400> 28
000000
<210> 29<210> 29
<400> 29<400> 29
000000
<210> 30<210> 30
<400> 30<400> 30
000000
<210> 31<210> 31
<400> 31<400> 31
000000
<210> 32<210> 32
<400> 32<400> 32
000000
<210> 33<210> 33
<400> 33<400> 33
000000
<210> 34<210> 34
<400> 34<400> 34
000000
<210> 35<210> 35
<400> 35<400> 35
000000
<210> 36<210> 36
<400> 36<400> 36
000000
<210> 37<210> 37
<400> 37<400> 37
000000
<210> 38<210> 38
<400> 38<400> 38
000000
<210> 39<210> 39
<400> 39<400> 39
000000
<210> 40<210> 40
<400> 40<400> 40
000000
<210> 41<210> 41
<400> 41<400> 41
000000
<210> 42<210> 42
<400> 42<400> 42
000000
<210> 43<210> 43
<400> 43<400> 43
000000
<210> 44<210> 44
<400> 44<400> 44
000000
<210> 45<210> 45
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 45<400> 45
ggttga 6ggttga 6
<210> 46<210> 46
<211> 4<211> 4
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 46<400> 46
agtt 4agtt 4
<210> 47<210> 47
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 47<400> 47
ggttgg 6ggttgg 6
<210> 48<210> 48
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 48<400> 48
agttgg 6agttgg 6
<210> 49<210> 49
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 49<400> 49
agttga 6agttga 6
<210> 50<210> 50
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 50<400> 50
rrttrr 6rrttrr 6
<210> 51<210> 51
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 51<400> 51
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc t 141actccatcac taggggttcc t 141
<210> 52<210> 52
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 52<400> 52
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130aggggttcct 130
<210> 53<210> 53
<211> 3123<211> 3123
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 53<400> 53
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60
cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120
gttcctgaac agagaaacag gagaatatgg gccaaacagg atatctgtgg taagcagttc 180gttcctgaac agagaaacag gagaatatgg gccaaacagg atatctgtgg taagcagttc 180
ctgccccggc tcagggccaa gaacagttgg aacagcagaa tatgggccaa acaggatatc 240ctgccccggc tcagggccaa gaacagttgg aacagcagaa tatgggccaa acaggatatc 240
tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gatggtcccc agatgcggtc 300tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gatggtcccc agatgcggtc 300
ccgccctcag cagtttctag agaaccatca gatgtttcca gggtgcccca aggacctgaa 360ccgccctcag cagtttctag agaaccatca gatgtttcca gggtgcccca aggacctgaa 360
atgaccctgt gccttatttg aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc 420atgaccctgt gccttatttg aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc 420
ttctgctccc cgagctctat ataagcagag ctcgtttagt gaaccgtcag atcgcctgga 480ttctgctccc cgagctctat ataagcagag ctcgtttagt gaaccgtcag atcgcctgga 480
gacgccatcc acgctgtttt gacttccata gaaggccgcc accatggaag acgccaaaaa 540gacgccatcc acgctgtttt gacttccata gaaggccgcc accatggaag acgccaaaaa 540
cataaagaaa ggcccggcgc cattctatcc gctggaagat ggaaccgctg gagagcaact 600cataaagaaa ggcccggcgc cattctatcc gctggaagat ggaaccgctg gagagcaact 600
gcataaggct atgaagagat acgccctggt tcctggaaca attgctttta cagatgcaca 660gcataaggct atgaagagat acgccctggt tcctggaaca attgctttta cagatgcaca 660
tatcgaggtg gacatcactt acgctgagta cttcgaaatg tccgttcggt tggcagaagc 720tatcgaggtg gacatcactt acgctgagta cttcgaaatg tccgttcggt tggcagaagc 720
tatgaaacga tatgggctga atacaaatca cagaatcgtc gtatgcagtg aaaactctct 780tatgaaacga tatgggctga atacaaatca cagaatcgtc gtatgcagtg aaaactctct 780
tcaattcttt atgccggtgt tgggcgcgtt atttatcgga gttgcagttg cgcccgcgaa 840tcaattcttt atgccggtgt tgggcgcgtt atttatcgga gttgcagttg cgcccgcgaa 840
cgacatttat aatgaacgtg aattgctcaa cagtatgggc atttcgcagc ctaccgtggt 900cgacatttat aatgaacgtg aattgctcaa cagtatgggc atttcgcagc ctaccgtggt 900
gttcgtttcc aaaaaggggt tgcaaaaaat tttgaacgtg caaaaaaagc tcccaatcat 960gttcgtttcc aaaaaggggt tgcaaaaaat tttgaacgtg caaaaaaagc tcccaatcat 960
ccaaaaaatt attatcatgg attctaaaac ggattaccag ggatttcagt cgatgtacac 1020ccaaaaaatt attatcatgg attctaaaac ggattaccag ggatttcagt cgatgtacac 1020
gttcgtcaca tctcatctac ctcccggttt taatgaatac gattttgtgc cagagtcctt 1080gttcgtcaca tctcatctac ctcccggttt taatgaatac gattttgtgc cagagtcctt 1080
cgatagggac aagacaattg cactgatcat gaactcctct ggatctactg gtctgcctaa 1140cgatagggac aagacaattg cactgatcat gaactcctct ggatctactg gtctgcctaa 1140
aggtgtcgct ctgcctcata gaactgcctg cgtgagattc tcgcatgcca gagatcctat 1200aggtgtcgct ctgcctcata gaactgcctg cgtgagattc tcgcatgcca gagatcctat 1200
ttttggcaat caaatcattc cggatactgc gattttaagt gttgttccat tccatcacgg 1260ttttggcaat caaatcattc cggatactgc gattttaagt gttgttccat tccatcacgg 1260
ttttggaatg tttactacac tcggatattt gatatgtgga tttcgagtcg tcttaatgta 1320ttttggaatg tttactacac tcggatattt gatatgtgga tttcgagtcg tcttaatgta 1320
tagatttgaa gaagagctgt ttctgaggag ccttcaggat tacaagattc aaagtgcgct 1380tagatttgaa gaagagctgt ttctgaggag ccttcaggat tacaagattc aaagtgcgct 1380
gctggtgcca accctattct ccttcttcgc caaaagcact ctgattgaca aatacgattt 1440gctggtgcca accctattct ccttcttcgc caaaagcact ctgattgaca aatacgattt 1440
atctaattta cacgaaattg cttctggtgg cgctcccctc tctaaggaag tcggggaagc 1500atctaattta cacgaaattg cttctggtgg cgctcccctc tctaaggaag tcggggaagc 1500
ggttgccaag aggttccatc tgccaggtat caggcaagga tatgggctca ctgagactac 1560ggttgccaag aggttccatc tgccaggtat caggcaagga tatgggctca ctgagactac 1560
atcagctatt ctgattacac ccgaggggga tgataaaccg ggcgcggtcg gtaaagttgt 1620atcagctatt ctgattacac ccgaggggga tgataaaccg ggcgcggtcg gtaaagttgt 1620
tccatttttt gaagcgaagg ttgtggatct ggataccggg aaaacgctgg gcgttaatca 1680tccatttttt gaagcgaagg ttgtggatct ggataccggg aaaacgctgg gcgttaatca 1680
aagaggcgaa ctgtgtgtga gaggtcctat gattatgtcc ggttatgtaa acaatccgga 1740aagaggcgaa ctgtgtgtga gaggtcctat gattatgtcc ggttatgtaa acaatccgga 1740
agcgaccaac gccttgattg acaaggatgg atggctacat tctggagaca tagcttactg 1800agcgaccaac gccttgattg acaaggatgg atggctacat tctggagaca tagcttactg 1800
ggacgaagac gaacacttct tcatcgttga ccgcctgaag tctctgatta agtacaaagg 1860ggacgaagac gaacacttct tcatcgttga ccgcctgaag tctctgatta agtacaaagg 1860
ctatcaggtg gctcccgctg aattggaatc catcttgctc caacacccca acatcttcga 1920ctatcaggtg gctcccgctg aattggaatc catcttgctc caacacccca acatcttcga 1920
cgcaggtgtc gcaggtcttc ccgacgatga cgccggtgaa cttcccgccg ccgttgttgt 1980cgcaggtgtc gcaggtcttc ccgacgatga cgccggtgaa cttcccgccg ccgttgttgt 1980
tttggagcac ggaaagacga tgacggaaaa agagatcgtg gattacgtcg ccagtcaagt 2040tttggagcac ggaaagacga tgacggaaaa agagatcgtg gattacgtcg ccagtcaagt 2040
aacaaccgcg aaaaagttgc gcggaggagt tgtgtttgtg gacgaagtac cgaaaggtct 2100aacaaccgcg aaaaagttgc gcggaggagt tgtgtttgtg gacgaagtac cgaaaggtct 2100
taccggaaaa ctcgacgcaa gaaaaatcag agagatcctc ataaaggcca agaagggcgg 2160taccggaaaa ctcgacgcaa gaaaaatcag agagatcctc ataaaggcca agaagggcgg 2160
aaagatcgcc gtgtaagagc atcttaccgc catttattcc catatttgtt ctgtttttct 2220aaagatcgcc gtgtaagagc atcttaccgc catttattcc catatttgtt ctgtttttct 2220
tgatttgggt atacatttaa atgttaataa aacaaaatgg tggggcaatc atttacattt 2280tgatttgggt atacatttaa atgttaataa aacaaaatgg tggggcaatc atttacattt 2280
ttagggatat gtaattacta gttcaggtgt attgccacaa gacaaacatg ttaagaaact 2340ttagggatat gtaattacta gttcaggtgt attgccacaa gacaaacatg ttaagaaact 2340
ttcccgttat ttacgctctg ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag 2400ttcccgttat ttacgctctg ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag 2400
attgactgat attcttaact atgttgctcc ttttacgctg tgtggatatg ctgctttata 2460attgactgat attcttaact atgttgctcc ttttacgctg tgtggatatg ctgctttata 2460
gcctctgtat ctagctattg cttcccgtac ggctttcgtt ttctcctcct tgtataaatc 2520gcctctgtat ctagctattg cttcccgtac ggctttcgtt ttctcctcct tgtataaatc 2520
ctggttgctg tctcttttag aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg 2580ctggttgctg tctcttttag aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg 2580
ctctgtgttt gctgacgcaa cccccactgg ctggggcatt gccaccacct gtcaactcct 2640ctctgtgttt gctgacgcaa cccccactgg ctggggcatt gccaccacct gtcaactcct 2640
ttctgggact ttcgctttcc ccctcccgat cgccacggca gaactcatcg ccgcctgcct 2700ttctgggact ttcgctttcc ccctcccgat cgccacggca gaactcatcg ccgcctgcct 2700
tgcccgctgc tggacagggg ctaggttgct gggcactgat aattccgtgg tgttgtctgt 2760tgcccgctgc tggacagggg ctaggttgct gggcactgat aattccgtgg tgttgtctgt 2760
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 2820gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 2820
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 2880aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 2880
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2940taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2940
agacaatagc aggcatgctg gggatgcggt gggctctatg gcaggaaccc ctagtgatgg 3000agacaatagc aggcatgctg gggatgcggt gggctctatg gcaggaaccc ctagtgatgg 3000
agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3060agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3060
cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 3120cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 3120
agg 3123agg 3123
<210> 54<210> 54
<211> 3117<211> 3117
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 54<400> 54
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgaacagaga aacaggagaa tatgggccaa acaggatatc 180actccatcac taggggttcc tgaacagaga aacaggaa tatgggccaa acaggatatc 180
tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg 240tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg 240
gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg 300gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg 300
tccccagatg cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg 360tccccagatg cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg 360
ccccaaggac ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg 420ccccaaggac ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg 420
cttctgttcg cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc 480cttctgttcg cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc 480
gtcagatcgc ctggagacgc catccacgct gttttgactt ccatagaagg ccgccaccat 540gtcagatcgc ctggagacgc catccacgct gttttgactt ccatagaagg ccgccaccat 540
ggaagacgcc aaaaacataa agaaaggccc ggcgccattc tatccgctgg aagatggaac 600ggaagacgcc aaaaacataa agaaaggccc ggcgccattc tatccgctgg aagatggaac 600
cgctggagag caactgcata aggctatgaa gagatacgcc ctggttcctg gaacaattgc 660cgctggagag caactgcata aggctatgaa gagatacgcc ctggttcctg gaacaattgc 660
ttttacagat gcacatatcg aggtggacat cacttacgct gagtacttcg aaatgtccgt 720ttttacagat gcacatatcg aggtggacat cacttacgct gagtacttcg aaatgtccgt 720
tcggttggca gaagctatga aacgatatgg gctgaataca aatcacagaa tcgtcgtatg 780tcggttggca gaagctatga aacgatatgg gctgaataca aatcacagaa tcgtcgtatg 780
cagtgaaaac tctcttcaat tctttatgcc ggtgttgggc gcgttattta tcggagttgc 840cagtgaaaac tctcttcaat tctttatgcc ggtgttgggc gcgttattta tcggagttgc 840
agttgcgccc gcgaacgaca tttataatga acgtgaattg ctcaacagta tgggcatttc 900agttgcgccc gcgaacgaca tttataatga acgtgaattg ctcaacagta tgggcatttc 900
gcagcctacc gtggtgttcg tttccaaaaa ggggttgcaa aaaattttga acgtgcaaaa 960gcagcctacc gtggtgttcg tttccaaaaa ggggttgcaa aaaattttga acgtgcaaaa 960
aaagctccca atcatccaaa aaattattat catggattct aaaacggatt accagggatt 1020aaagctccca atcatccaaa aaattattat catggattct aaaacggatt accagggatt 1020
tcagtcgatg tacacgttcg tcacatctca tctacctccc ggttttaatg aatacgattt 1080tcagtcgatg tacacgttcg tcacatctca tctacctccc ggttttaatg aatacgattt 1080
tgtgccagag tccttcgata gggacaagac aattgcactg atcatgaact cctctggatc 1140tgtgccagag tccttcgata gggacaagac aattgcactg atcatgaact cctctggatc 1140
tactggtctg cctaaaggtg tcgctctgcc tcatagaact gcctgcgtga gattctcgca 1200tactggtctg cctaaaggtg tcgctctgcc tcatagaact gcctgcgtga gattctcgca 1200
tgccagagat cctatttttg gcaatcaaat cattccggat actgcgattt taagtgttgt 1260tgccagagat cctatttttg gcaatcaaat cattccggat actgcgattt taagtgttgt 1260
tccattccat cacggttttg gaatgtttac tacactcgga tatttgatat gtggatttcg 1320tccattccat cacggttttg gaatgtttac tacactcgga tatttgatat gtggatttcg 1320
agtcgtctta atgtatagat ttgaagaaga gctgtttctg aggagccttc aggattacaa 1380agtcgtctta atgtatagat ttgaagaaga gctgtttctg aggagccttc aggattacaa 1380
gattcaaagt gcgctgctgg tgccaaccct attctccttc ttcgccaaaa gcactctgat 1440gattcaaagt gcgctgctgg tgccaaccct attctccttc ttcgccaaaa gcactctgat 1440
tgacaaatac gatttatcta atttacacga aattgcttct ggtggcgctc ccctctctaa 1500tgacaaatac gatttatcta atttacacga aattgcttct ggtggcgctc ccctctctaa 1500
ggaagtcggg gaagcggttg ccaagaggtt ccatctgcca ggtatcaggc aaggatatgg 1560ggaagtcggg gaagcggttg ccaagaggtt ccatctgcca ggtatcaggc aaggatatgg 1560
gctcactgag actacatcag ctattctgat tacacccgag ggggatgata aaccgggcgc 1620gctcactgag actacatcag ctattctgat tacacccgag ggggatgata aaccgggcgc 1620
ggtcggtaaa gttgttccat tttttgaagc gaaggttgtg gatctggata ccgggaaaac 1680ggtcggtaaa gttgttccat tttttgaagc gaaggttgtg gatctggata ccgggaaaac 1680
gctgggcgtt aatcaaagag gcgaactgtg tgtgagaggt cctatgatta tgtccggtta 1740gctgggcgtt aatcaaagag gcgaactgtg tgtgagaggt cctatgatta tgtccggtta 1740
tgtaaacaat ccggaagcga ccaacgcctt gattgacaag gatggatggc tacattctgg 1800tgtaaacaat ccggaagcga ccaacgcctt gattgacaag gatggatggc tacattctgg 1800
agacatagct tactgggacg aagacgaaca cttcttcatc gttgaccgcc tgaagtctct 1860agacatagct tactgggacg aagacgaaca cttcttcatc gttgaccgcc tgaagtctct 1860
gattaagtac aaaggctatc aggtggctcc cgctgaattg gaatccatct tgctccaaca 1920gattaagtac aaaggctatc aggtggctcc cgctgaattg gaatccatct tgctccaaca 1920
ccccaacatc ttcgacgcag gtgtcgcagg tcttcccgac gatgacgccg gtgaacttcc 1980ccccaacatc ttcgacgcag gtgtcgcagg tcttcccgac gatgacgccg gtgaacttcc 1980
cgccgccgtt gttgttttgg agcacggaaa gacgatgacg gaaaaagaga tcgtggatta 2040cgccgccgtt gttgttttgg agcacggaaa gacgatgacg gaaaaagaga tcgtggatta 2040
cgtcgccagt caagtaacaa ccgcgaaaaa gttgcgcgga ggagttgtgt ttgtggacga 2100cgtcgccagt caagtaacaa ccgcgaaaaa gttgcgcgga ggagttgtgt ttgtggacga 2100
agtaccgaaa ggtcttaccg gaaaactcga cgcaagaaaa atcagagaga tcctcataaa 2160agtaccgaaa ggtcttaccg gaaaactcga cgcaagaaaa atcagagaga tcctcataaa 2160
ggccaagaag ggcggaaaga tcgccgtgta agagcatctt accgccattt attcccatat 2220ggccaagaag ggcggaaaga tcgccgtgta agagcatctt accgccattt attcccatat 2220
ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa aatggtgggg 2280ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa aatggtgggg 2280
caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc cacaagacaa 2340caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc cacaagacaa 2340
acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac ctctggatta 2400acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac ctctggatta 2400
caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta cgctgtgtgg 2460caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta cgctgtgtgg 2460
atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt tcgttttctc 2520atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt tcgttttctc 2520
ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg ttgtccgtca 2580ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg ttgtccgtca 2580
acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg gcattgccac 2640acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg gcattgccac 2640
cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca cggcagaact 2700cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca cggcagaact 2700
catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca ctgataattc 2760catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca ctgataattc 2760
cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 2820cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 2820
ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 2880ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 2880
atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 2940atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 2940
gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcagg 3000gggggaggat tgggaagaca atagcaggca tgctggggat gcggtggggct ctatggcagg 3000
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 3060aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 3060
cccgggaaac ccgggcgtgc gcctcagtga gcgagcgagc gcgcagctgc ctgcagg 3117cccgggaaac ccgggcgtgc gcctcagtga gcgagcgagc gcgcagctgc ctgcagg 3117
<210> 55<210> 55
<211> 2841<211> 2841
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 55<400> 55
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60
cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120
gttcctgaac agagaaacag gagaatatgg gccaaacagg atatctgtgg taagcagttc 180gttcctgaac agagaaacag gagaatatgg gccaaacagg atatctgtgg taagcagttc 180
ctgccccggc tcagggccaa gaacagttgg aacagcagaa tatgggccaa acaggatatc 240ctgccccggc tcagggccaa gaacagttgg aacagcagaa tatgggccaa acaggatatc 240
tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gatggtcccc agatgcggtc 300tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gatggtcccc agatgcggtc 300
ccgccctcag cagtttctag agaaccatca gatgtttcca gggtgcccca aggacctgaa 360ccgccctcag cagtttctag agaaccatca gatgtttcca gggtgcccca aggacctgaa 360
atgaccctgt gccttatttg aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc 420atgaccctgt gccttatttg aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc 420
ttctgctccc cgagctctat ataagcagag ctcgtttagt gaaccgtcag atcgcctgga 480ttctgctccc cgagctctat ataagcagag ctcgtttagt gaaccgtcag atcgcctgga 480
gacgccatcc acgctgtttt gacttccata gaaggccgcc accatgatca tggccgagag 540gacgccatcc acgctgtttt gacttccata gaaggccgcc accatgatca tggccgagag 540
ccctggcctg atcaccatct gcctgctggg ctacctgctg agcgccgagt gcaccgtgtt 600ccctggcctg atcaccatct gcctgctggg ctacctgctg agcgccgagt gcaccgtgtt 600
cctggaccac gagaacgcca acaagatcct gaaccggccc aagagataca acagcggcaa 660cctggaccac gagaacgcca acaagatcct gaaccggccc aagagataca acagcggcaa 660
gctggaggag ttcgtgcagg gcaacctgga gagggagtgc atggaggaga agtgcagctt 720gctggaggag ttcgtgcagg gcaacctgga gagggagtgc atggaggaga agtgcagctt 720
cgaggaggcc agggaagtgt tcgagaacac cgagcggacc accgagttct ggaagcagta 780cgaggaggcc agggaagtgt tcgagaacac cgagcggacc accgagttct ggaagcagta 780
cgtggacggc gaccagtgcg agagcaaccc ttgcctgaac ggcggcagct gcaaggacga 840cgtggacggc gaccagtgcg agagcaaccc ttgcctgaac ggcggcagct gcaaggacga 840
catcaacagc tacgagtgct ggtgcccttt cggcttcgag ggcaagaact gcgagctgga 900catcaacagc tacgagtgct ggtgcccttt cggcttcgag ggcaagaact gcgagctgga 900
cgtgacctgc aacatcaaga acggccgctg cgagcagttc tgcaagaaca gcgccgacaa 960cgtgacctgc aacatcaaga acggccgctg cgagcagttc tgcaagaaca gcgccgacaa 960
caaagtggtg tgtagctgca ccgagggcta cagactggcc gagaaccaga agagctgcga 1020caaagtggtg tgtagctgca ccgagggcta cagactggcc gagaaccaga agagctgcga 1020
gcccgccgtg cccttcccct gcggcagagt gagcgtgtcc cagaccagca agctgaccag 1080gcccgccgtg cccttcccct gcggcagagt gagcgtgtcc cagaccagca agctgaccag 1080
agccgagacc gtgttccccg acgtggacta cgtgaatagc accgaggccg agaccatcct 1140agccgagacc gtgttccccg acgtggacta cgtgaatagc accgaggccg agaccatcct 1140
ggacaacatc acccagagca cccagtcctt caacgacttc accagagttg tgggcggcga 1200ggacaacatc acccagagca cccagtcctt caacgacttc accaagttg tgggcggcga 1200
ggacgccaag cccggccagt tcccctggca ggtggtgctg aacggcaaag tggatgcctt 1260ggacgccaag cccggccagt tcccctggca ggtggtgctg aacggcaaag tggatgcctt 1260
ctgcggcggc agcatcgtga acgagaagtg gatcgtgaca gccgcccact gcgtggagac 1320ctgcggcggc agcatcgtga acgagaagtg gatcgtgaca gccgcccact gcgtggagac 1320
cggcgtgaag atcaccgtgg tggccggcga acacaatatc gaggagaccg agcacaccga 1380cggcgtgaag atcaccgtgg tggccggcga acacaatatc gaggagaccg agcacaccga 1380
gcagaagcgg aacgtcatcc ggattatccc ccaccacaac tacaacgccg ccatcaacaa 1440gcagaagcgg aacgtcatcc ggattatccc ccaccacaac tacaacgccg ccatcaacaa 1440
gtacaaccac gacatcgccc tgctggagct ggacgagcct ctggtgctga atagctacgt 1500gtacaaccac gacatcgccc tgctggagct ggacgagcct ctggtgctga atagctacgt 1500
gacccccatc tgcatcgccg acaaggagta caccaacatc ttcctgaagt tcggcagcgg 1560gacccccatc tgcatcgccg acaaggagta caccaacatc ttcctgaagt tcggcagcgg 1560
ctacgtgtcc ggctggggca gagtgttcca caagggcaga agcgccctgg tgctgcagta 1620ctacgtgtcc ggctggggca gagtgttcca caagggcaga agcgccctgg tgctgcagta 1620
cctgagagtg cccctggtgg acagagccac ctgcctgttg agcaccaagt tcaccatcta 1680cctgagagtg cccctggtgg acagagccac ctgcctgttg agcaccaagt tcaccatcta 1680
caacaacatg ttctgcgccg gcttccacga gggcggcaga gacagctgcc agggcgacag 1740caacaacatg ttctgcgccg gcttccacga gggcggcaga gacagctgcc agggcgacag 1740
cggcggaccc cacgtgaccg aagtggaggg caccagcttc ctgaccggca tcatcagctg 1800cggcggaccc cacgtgaccg aagtggaggg caccagcttc ctgaccggca tcatcagctg 1800
gggcgaggag tgcgccatga agggcaagta cggcatctac accaaagtga gccggtacgt 1860gggcgaggag tgcgccatga agggcaagta cggcatctac accaaagtga gccggtacgt 1860
gaactggatc aaggagaaaa ccaagctgac ctgagagcat cttaccgcca tttattccca 1920gaactggatc aaggagaaaa ccaagctgac ctgagagcat cttaccgcca tttattccca 1920
tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa caaaatggtg 1980tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa caaaatggtg 1980
gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat tgccacaaga 2040gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat tgccacaaga 2040
caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc aacctctgga 2100caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc aacctctgga 2100
ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt ttacgctgtg 2160ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt ttacgctgtg 2160
tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg ctttcgtttt 2220tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg ctttcgtttt 2220
ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc ccgttgtccg 2280ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc ccgttgtccg 2280
tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ggggcattgc 2340tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ggggcattgc 2340
caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg ccacggcaga 2400caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg ccacggcaga 2400
actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg gcactgataa 2460actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg gcactgataa 2460
ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 2520ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 2520
gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 2580gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 2580
tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 2640tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 2640
caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc 2700caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc 2700
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 2760aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 2760
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 2820ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 2820
gagcgcgcag ctgcctgcag g 2841gagcgcgcag ctgcctgcag g 2841
<210> 56<210> 56
<211> 2835<211> 2835
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 56<400> 56
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgaacagaga aacaggagaa tatgggccaa acaggatatc 180actccatcac taggggttcc tgaacagaga aacaggaa tatgggccaa acaggatatc 180
tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg 240tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg 240
gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg 300gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg 300
tccccagatg cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg 360tccccagatg cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg 360
ccccaaggac ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg 420ccccaaggac ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg 420
cttctgttcg cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc 480cttctgttcg cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc 480
gtcagatcgc ctggagacgc catccacgct gttttgactt ccatagaagg ccgccaccat 540gtcagatcgc ctggagacgc catccacgct gttttgactt ccatagaagg ccgccaccat 540
gatcatggcc gagagccctg gcctgatcac catctgcctg ctgggctacc tgctgagcgc 600gatcatggcc gagagccctg gcctgatcac catctgcctg ctgggctacc tgctgagcgc 600
cgagtgcacc gtgttcctgg accacgagaa cgccaacaag atcctgaacc ggcccaagag 660cgagtgcacc gtgttcctgg accacgagaa cgccaacaag atcctgaacc ggcccaagag 660
atacaacagc ggcaagctgg aggagttcgt gcagggcaac ctggagaggg agtgcatgga 720atacaacagc ggcaagctgg aggagttcgt gcagggcaac ctggagaggg agtgcatgga 720
ggagaagtgc agcttcgagg aggccaggga agtgttcgag aacaccgagc ggaccaccga 780ggagaagtgc agcttcgagg aggccaggga agtgttcgag aacaccgagc ggaccaccga 780
gttctggaag cagtacgtgg acggcgacca gtgcgagagc aacccttgcc tgaacggcgg 840gttctggaag cagtacgtgg acggcgacca gtgcgagagc aacccttgcc tgaacggcgg 840
cagctgcaag gacgacatca acagctacga gtgctggtgc cctttcggct tcgagggcaa 900cagctgcaag gacgacatca acagctacga gtgctggtgc cctttcggct tcgagggcaa 900
gaactgcgag ctggacgtga cctgcaacat caagaacggc cgctgcgagc agttctgcaa 960gaactgcgag ctggacgtga cctgcaacat caagaacggc cgctgcgagc agttctgcaa 960
gaacagcgcc gacaacaaag tggtgtgtag ctgcaccgag ggctacagac tggccgagaa 1020gaacagcgcc gacaacaaag tggtgtgtag ctgcaccgag ggctacagac tggccgagaa 1020
ccagaagagc tgcgagcccg ccgtgccctt cccctgcggc agagtgagcg tgtcccagac 1080ccagaagagc tgcgagcccg ccgtgccctt cccctgcggc agagtgagcg tgtcccagac 1080
cagcaagctg accagagccg agaccgtgtt ccccgacgtg gactacgtga atagcaccga 1140cagcaagctg accagagccg agaccgtgtt ccccgacgtg gactacgtga atagcaccga 1140
ggccgagacc atcctggaca acatcaccca gagcacccag tccttcaacg acttcaccag 1200ggccgagacc atcctggaca acatcaccca gagcaccag tccttcaacg acttcaccag 1200
agttgtgggc ggcgaggacg ccaagcccgg ccagttcccc tggcaggtgg tgctgaacgg 1260agttgtgggc ggcgaggacg ccaagcccgg ccagttcccc tggcaggtgg tgctgaacgg 1260
caaagtggat gccttctgcg gcggcagcat cgtgaacgag aagtggatcg tgacagccgc 1320caaagtggat gccttctgcg gcggcagcat cgtgaacgag aagtggatcg tgacagccgc 1320
ccactgcgtg gagaccggcg tgaagatcac cgtggtggcc ggcgaacaca atatcgagga 1380ccactgcgtg gagaccggcg tgaagatcac cgtggtggcc ggcgaacaca atatcgagga 1380
gaccgagcac accgagcaga agcggaacgt catccggatt atcccccacc acaactacaa 1440gaccgagcac accgagcaga agcggaacgt catccggatt atcccccacc acaactacaa 1440
cgccgccatc aacaagtaca accacgacat cgccctgctg gagctggacg agcctctggt 1500cgccgccatc aacaagtaca accacgacat cgccctgctg gagctggacg agcctctggt 1500
gctgaatagc tacgtgaccc ccatctgcat cgccgacaag gagtacacca acatcttcct 1560gctgaatagc tacgtgaccc ccatctgcat cgccgacaag gagtacacca acatcttcct 1560
gaagttcggc agcggctacg tgtccggctg gggcagagtg ttccacaagg gcagaagcgc 1620gaagttcggc agcggctacg tgtccggctg gggcagagtg ttccacaagg gcagaagcgc 1620
cctggtgctg cagtacctga gagtgcccct ggtggacaga gccacctgcc tgttgagcac 1680cctggtgctg cagtacctga gagtgcccct ggtggacaga gccacctgcc tgttgagcac 1680
caagttcacc atctacaaca acatgttctg cgccggcttc cacgagggcg gcagagacag 1740caagttcacc atctacaaca acatgttctg cgccggcttc cacgagggcg gcagagacag 1740
ctgccagggc gacagcggcg gaccccacgt gaccgaagtg gagggcacca gcttcctgac 1800ctgccagggc gacagcggcg gaccccacgt gaccgaagtg gagggcacca gcttcctgac 1800
cggcatcatc agctggggcg aggagtgcgc catgaagggc aagtacggca tctacaccaa 1860cggcatcatc agctggggcg aggagtgcgc catgaagggc aagtacggca tctacaccaa 1860
agtgagccgg tacgtgaact ggatcaagga gaaaaccaag ctgacctgag agcatcttac 1920agtgagccgg tacgtgaact ggatcaagga gaaaaccaag ctgacctgag agcatcttac 1920
cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa 1980cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa 1980
taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg 2040taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg 2040
tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt 2100tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt 2100
taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc 2160taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc 2160
tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg 2220tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg 2220
tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt 2280tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt 2280
gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac 2340gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac 2340
tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc 2400tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc 2400
gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt 2460gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt 2460
gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt 2520gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt 2520
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 2580ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 2580
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 2640ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 2640
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 2700ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 2700
ggtgggctct atggcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 2760ggtgggctct atggcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 2760
gctcgctcac tgaggccgcc cgggaaaccc gggcgtgcgc ctcagtgagc gagcgagcgc 2820gctcgctcac tgaggccgcc cgggaaaccc gggcgtgcgc ctcagtgagc gagcgagcgc 2820
gcagctgcct gcagg 2835gcagctgcct gcagg 2835
<210> 57<210> 57
<211> 3912<211> 3912
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 57<400> 57
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60
cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120
gttcctggct cagaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc 180gttcctggct cagaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc 180
aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga 240aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga 240
acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa 300acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa 300
acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg 360acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg 360
ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag 420ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag 420
gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt 480gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt 480
ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa 540ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa 540
tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt 600tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt 600
ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg 660ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg 660
cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg 720cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg 720
attacaagca tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct 780attacaagca tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct 780
ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc 840ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc 840
cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct 900cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct 900
agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 960agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 960
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 1020gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 1020
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 1080gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 1080
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 1140aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 1140
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 1200ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 1200
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 1260ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 1260
cctgtctcct cagcttcagg caccaccact gacctgggac agtgccgcca ccatggaaga 1320cctgtctcct cagcttcagg caccaccact gacctgggac agtgccgcca ccatggaaga 1320
cgccaaaaac ataaagaaag gcccggcgcc attctatccg ctggaagatg gaaccgctgg 1380cgccaaaaac ataaagaaag gcccggcgcc attctatccg ctggaagatg gaaccgctgg 1380
agagcaactg cataaggcta tgaagagata cgccctggtt cctggaacaa ttgcttttac 1440agagcaactg cataaggcta tgaagata cgccctggtt cctggaacaa ttgcttttac 1440
agatgcacat atcgaggtgg acatcactta cgctgagtac ttcgaaatgt ccgttcggtt 1500agatgcacat atcgaggtgg acatcactta cgctgagtac ttcgaaatgt ccgttcggtt 1500
ggcagaagct atgaaacgat atgggctgaa tacaaatcac agaatcgtcg tatgcagtga 1560ggcagaagct atgaaacgat atgggctgaa tacaaatcac agaatcgtcg tatgcagtga 1560
aaactctctt caattcttta tgccggtgtt gggcgcgtta tttatcggag ttgcagttgc 1620aaactctctt caattcttta tgccggtgtt gggcgcgtta tttatcggag ttgcagttgc 1620
gcccgcgaac gacatttata atgaacgtga attgctcaac agtatgggca tttcgcagcc 1680gcccgcgaac gacatttata atgaacgtga attgctcaac agtatgggca tttcgcagcc 1680
taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt ttgaacgtgc aaaaaaagct 1740taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt ttgaacgtgc aaaaaaagct 1740
cccaatcatc caaaaaatta ttatcatgga ttctaaaacg gattaccagg gatttcagtc 1800cccaatcatc caaaaaatta ttatcatgga ttctaaaacg gattaccagg gatttcagtc 1800
gatgtacacg ttcgtcacat ctcatctacc tcccggtttt aatgaatacg attttgtgcc 1860gatgtacacg ttcgtcacat ctcatctacc tcccggtttt aatgaatacg attttgtgcc 1860
agagtccttc gatagggaca agacaattgc actgatcatg aactcctctg gatctactgg 1920agagtccttc gatagggaca agacaattgc actgatcatg aactcctctg gatctactgg 1920
tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc gtgagattct cgcatgccag 1980tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc gtgagattct cgcatgccag 1980
agatcctatt tttggcaatc aaatcattcc ggatactgcg attttaagtg ttgttccatt 2040agatcctatt tttggcaatc aaatcattcc ggatactgcg attttaagtg ttgttccatt 2040
ccatcacggt tttggaatgt ttactacact cggatatttg atatgtggat ttcgagtcgt 2100ccatcacggt tttggaatgt ttactacact cggatatttg atatgtggat ttcgagtcgt 2100
cttaatgtat agatttgaag aagagctgtt tctgaggagc cttcaggatt acaagattca 2160cttaatgtat agatttgaag aagagctgtt tctgaggagc cttcaggatt acaagattca 2160
aagtgcgctg ctggtgccaa ccctattctc cttcttcgcc aaaagcactc tgattgacaa 2220aagtgcgctg ctggtgccaa ccctattctc cttcttcgcc aaaagcactc tgattgacaa 2220
atacgattta tctaatttac acgaaattgc ttctggtggc gctcccctct ctaaggaagt 2280atacgattta tctaatttac acgaaattgc ttctggtggc gctcccctct ctaaggaagt 2280
cggggaagcg gttgccaaga ggttccatct gccaggtatc aggcaaggat atgggctcac 2340cggggaagcg gttgccaaga ggttccatct gccaggtatc aggcaaggat atgggctcac 2340
tgagactaca tcagctattc tgattacacc cgagggggat gataaaccgg gcgcggtcgg 2400tgagactaca tcagctattc tgattacacc cgagggggat gataaaccgg gcgcggtcgg 2400
taaagttgtt ccattttttg aagcgaaggt tgtggatctg gataccggga aaacgctggg 2460taaagttgtt ccattttttg aagcgaaggt tgtggatctg gataccggga aaacgctggg 2460
cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa 2520cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa 2520
caatccggaa gcgaccaacg ccttgattga caaggatgga tggctacatt ctggagacat 2580caatccggaa gcgaccaacg ccttgattga caaggatgga tggctacatt ctggagacat 2580
agcttactgg gacgaagacg aacacttctt catcgttgac cgcctgaagt ctctgattaa 2640agcttactgg gacgaagacg aacacttctt catcgttgac cgcctgaagt ctctgattaa 2640
gtacaaaggc tatcaggtgg ctcccgctga attggaatcc atcttgctcc aacaccccaa 2700gtacaaaggc tatcaggtgg ctcccgctga attggaatcc atcttgctcc aacaccccaa 2700
catcttcgac gcaggtgtcg caggtcttcc cgacgatgac gccggtgaac ttcccgccgc 2760catcttcgac gcaggtgtcg caggtcttcc cgacgatgac gccggtgaac ttcccgccgc 2760
cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc 2820cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc 2820
cagtcaagta acaaccgcga aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc 2880cagtcaagta acaaccgcga aaaagttgcg cggagggagtt gtgtttgtgg acgaagtacc 2880
gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga gagatcctca taaaggccaa 2940gaaaggtctt acggaaaac tcgacgcaag aaaaatcaga gagatcctca taaaggccaa 2940
gaagggcgga aagatcgccg tgtaagagca tcttaccgcc atttattccc atatttgttc 3000gaagggcgga aagatcgccg tgtaagagca tcttaccgcc atttattccc atatttgttc 3000
tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 3060tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 3060
tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 3120tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 3120
taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 3180taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 3180
ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 3240ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 3240
tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 3300tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 3300
gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 3360gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 3360
cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3420cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3420
tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3480tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3480
cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3540cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3540
gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3600gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3600
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3660gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3660
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3720ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3720
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg caggaacccc 3780ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg caggaacccc 3780
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3840tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3840
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3900caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3900
gctgcctgca gg 3912gctgcctgca gg 3912
<210> 58<210> 58
<211> 3906<211> 3906
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 58<400> 58
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tggctcagag gctcagaggc acacaggagt ttctgggctc 180actccatcac taggggttcc tggctcagag gctcagaggc acacaggagt ttctgggctc 180
accctgcccc cttccaaccc ctcagttccc atcctccagc agctgtttgt gtgctgcctc 240accctgcccc cttccaaccc ctcagttccc atcctccagc agctgtttgt gtgctgcctc 240
tgaagtccac actgaacaaa cttcagccta ctcatgtccc taaaatgggc aaacattgca 300tgaagtccac actgaacaaa cttcagccta ctcatgtccc taaaatgggc aaacattgca 300
agcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg 360agcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg 360
tcagagacct ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg 420tcagagacct ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg 420
tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggt ccgggttcaa 480tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggt ccgggttcaa 480
aaccacttgc tgggtgggga gtcgtcagta agtggctatg ccccgacccc gaagcctgtt 540aaccacttgc tgggtgggga gtcgtcagta agtggctatg ccccgacccc gaagcctgtt 540
tccccatctg tacaatggaa atgataaaga cgcccatctg atagggtttt tgtggcaaat 600tccccatctg tacaatggaa atgataaaga cgcccatctg atagggtttt tgtggcaaat 600
aaacatttgg tttttttgtt ttgttttgtt ttgttttttg agatggaggt ttgctctgtc 660aaacatttgg tttttttgtt ttgttttgtt ttgttttttg agatggaggt ttgctctgtc 660
gcccaggctg gagtgcagtg acacaatctc atctcaccac aaccttcccc tgcctcagcc 720gcccaggctg gagtgcagtg acacaatctc atctcaccac aaccttcccc tgcctcagcc 720
tcccaagtag ctgggattac aagcatgtgc caccacacct ggctaatttt ctatttttag 780tcccaagtag ctgggattac aagcatgtgc caccacacct ggctaatttt ctatttttag 780
tagagacggg tttctccatg ttggtcagcc tcagcctccc aagtaactgg gattacaggc 840tagagacggg tttctccatg ttggtcagcc tcagcctccc aagtaactgg gattacaggc 840
ctgtgccacc acacccggct aattttttct atttttgaca gggacggggt ttcaccatgt 900ctgtgccacc acacccggct aattttttct atttttgaca gggacggggt ttcaccatgt 900
tggtcaggct ggtctagagg taccggatct tgctaccagt ggaacagcca ctaaggattc 960tggtcaggct ggtctagagg taccggatct tgctaccagt ggaacagcca ctaaggattc 960
tgcagtgaga gcagagggcc agctaagtgg tactctccca gagactgtct gactcacgcc 1020tgcagtgaga gcagagggcc agctaagtgg tactctccca gagactgtct gactcacgcc 1020
accccctcca ccttggacac aggacgctgt ggtttctgag ccaggtacaa tgactccttt 1080accccctcca ccttggacac aggacgctgt ggtttctgag ccaggtacaa tgactccttt 1080
cggtaagtgc agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg 1140cggtaagtgc agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg 1140
cgactcagat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac 1200cgactcagat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac 1200
cttggttaat attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac 1260cttggttaat attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac 1260
ggacgaggac agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtgc 1320ggacgaggac agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtgc 1320
cgccaccatg gaagacgcca aaaacataaa gaaaggcccg gcgccattct atccgctgga 1380cgccaccatg gaagacgcca aaaacataaa gaaaggcccg gcgccattct atccgctgga 1380
agatggaacc gctggagagc aactgcataa ggctatgaag agatacgccc tggttcctgg 1440agatggaacc gctggagagc aactgcataa ggctatgaag agatacgccc tggttcctgg 1440
aacaattgct tttacagatg cacatatcga ggtggacatc acttacgctg agtacttcga 1500aacaattgct tttacagatg cacatatcga ggtggacatc acttacgctg agtacttcga 1500
aatgtccgtt cggttggcag aagctatgaa acgatatggg ctgaatacaa atcacagaat 1560aatgtccgtt cggttggcag aagctatgaa acgatatggg ctgaatacaa atcacagaat 1560
cgtcgtatgc agtgaaaact ctcttcaatt ctttatgccg gtgttgggcg cgttatttat 1620cgtcgtatgc agtgaaaact ctcttcaatt ctttatgccg gtgttgggcg cgttatttat 1620
cggagttgca gttgcgcccg cgaacgacat ttataatgaa cgtgaattgc tcaacagtat 1680cggagttgca gttgcgcccg cgaacgacat ttataatgaa cgtgaattgc tcaacagtat 1680
gggcatttcg cagcctaccg tggtgttcgt ttccaaaaag gggttgcaaa aaattttgaa 1740gggcatttcg cagcctaccg tggtgttcgt ttccaaaaag gggttgcaaa aaattttgaa 1740
cgtgcaaaaa aagctcccaa tcatccaaaa aattattatc atggattcta aaacggatta 1800cgtgcaaaaa aagctcccaa tcatccaaaa aattattatc atggattcta aaacggatta 1800
ccagggattt cagtcgatgt acacgttcgt cacatctcat ctacctcccg gttttaatga 1860ccagggattt cagtcgatgt acacgttcgt cacatctcat ctacctcccg gttttaatga 1860
atacgatttt gtgccagagt ccttcgatag ggacaagaca attgcactga tcatgaactc 1920atacgatttt gtgccagagt ccttcgatag ggacaagaca attgcactga tcatgaactc 1920
ctctggatct actggtctgc ctaaaggtgt cgctctgcct catagaactg cctgcgtgag 1980ctctggatct actggtctgc ctaaaggtgt cgctctgcct catagaactg cctgcgtgag 1980
attctcgcat gccagagatc ctatttttgg caatcaaatc attccggata ctgcgatttt 2040attctcgcat gccagagatc ctatttttgg caatcaaatc attccggata ctgcgatttt 2040
aagtgttgtt ccattccatc acggttttgg aatgtttact acactcggat atttgatatg 2100aagtgttgtt ccattccatc acggttttgg aatgtttact acactcggat atttgatatg 2100
tggatttcga gtcgtcttaa tgtatagatt tgaagaagag ctgtttctga ggagccttca 2160tggatttcga gtcgtcttaa tgtatagatt tgaagaagag ctgtttctga ggagccttca 2160
ggattacaag attcaaagtg cgctgctggt gccaacccta ttctccttct tcgccaaaag 2220ggattacaag attcaaagtg cgctgctggt gccaacccta ttctccttct tcgccaaaag 2220
cactctgatt gacaaatacg atttatctaa tttacacgaa attgcttctg gtggcgctcc 2280cactctgatt gacaaatacg atttatctaa tttacacgaa attgcttctg gtggcgctcc 2280
cctctctaag gaagtcgggg aagcggttgc caagaggttc catctgccag gtatcaggca 2340cctctctaag gaagtcgggg aagcggttgc caagaggttc catctgccag gtatcaggca 2340
aggatatggg ctcactgaga ctacatcagc tattctgatt acacccgagg gggatgataa 2400aggatatggg ctcactgaga ctacatcagc tattctgatt acacccgagg gggatgataa 2400
accgggcgcg gtcggtaaag ttgttccatt ttttgaagcg aaggttgtgg atctggatac 2460accgggcgcg gtcggtaaag ttgttccatt ttttgaagcg aaggttgtgg atctggatac 2460
cgggaaaacg ctgggcgtta atcaaagagg cgaactgtgt gtgagaggtc ctatgattat 2520cgggaaaacg ctgggcgtta atcaaagagg cgaactgtgt gtgagaggtc ctatgattat 2520
gtccggttat gtaaacaatc cggaagcgac caacgccttg attgacaagg atggatggct 2580gtccggttat gtaaacaatc cggaagcgac caacgccttg attgacaagg atggatggct 2580
acattctgga gacatagctt actgggacga agacgaacac ttcttcatcg ttgaccgcct 2640acattctgga gacatagctt actgggacga agacgaacac ttcttcatcg ttgaccgcct 2640
gaagtctctg attaagtaca aaggctatca ggtggctccc gctgaattgg aatccatctt 2700gaagtctctg attaagtaca aaggctatca ggtggctccc gctgaattgg aatccatctt 2700
gctccaacac cccaacatct tcgacgcagg tgtcgcaggt cttcccgacg atgacgccgg 2760gctccaacac cccaacatct tcgacgcagg tgtcgcaggt cttcccgacg atgacgccgg 2760
tgaacttccc gccgccgttg ttgttttgga gcacggaaag acgatgacgg aaaaagagat 2820tgaacttccc gccgccgttg ttgttttgga gcacggaaag acgatgacgg aaaaagagat 2820
cgtggattac gtcgccagtc aagtaacaac cgcgaaaaag ttgcgcggag gagttgtgtt 2880cgtggattac gtcgccagtc aagtaacaac cgcgaaaaag ttgcgcggag gagttgtgtt 2880
tgtggacgaa gtaccgaaag gtcttaccgg aaaactcgac gcaagaaaaa tcagagagat 2940tgtggacgaa gtaccgaaag gtcttaccgg aaaactcgac gcaagaaaaa tcagagagat 2940
cctcataaag gccaagaagg gcggaaagat cgccgtgtaa gagcatctta ccgccattta 3000cctcataaag gccaagaagg gcggaaagat cgccgtgtaa gagcatctta ccgccattta 3000
ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ataaaacaaa 3060ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ataaaacaaa 3060
atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag gtgtattgcc 3120atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag gtgtattgcc 3120
acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg ttaatcaacc 3180acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg ttaatcaacc 3180
tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ctccttttac 3240tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ctccttttac 3240
gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc gtacggcttt 3300gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc gtacggcttt 3300
cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt tgtggcccgt 3360cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt tgtggcccgt 3360
tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca ctggctgggg 3420tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca ctggctgggg 3420
cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc cgatcgccac 3480cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc cgatcgccac 3480
ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt tgctgggcac 3540ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt tgctgggcac 3540
tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg tttgcccctc 3600tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg tttgcccctc 3600
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 3660ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 3660
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 3720ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 3720
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 3780ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 3780
tatggcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840tatggcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840
ctgaggccgc ccgggaaacc cgggcgtgcg cctcagtgag cgagcgagcg cgcagctgcc 3900ctgaggccgc ccgggaaacc cgggcgtgcg cctcagtgag cgagcgagcg cgcagctgcc 3900
tgcagg 3906tgcagg 3906
<210> 59<210> 59
<211> 3630<211> 3630
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 59<400> 59
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60
cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120
gttcctggct cagaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc 180gttcctggct cagaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc 180
aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga 240aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga 240
acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa 300acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa 300
acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg 360acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg 360
ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag 420ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag 420
gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt 480gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt 480
ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa 540ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa 540
tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt 600tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt 600
ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg 660ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg 660
cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg 720cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg 720
attacaagca tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct 780attacaagca tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct 780
ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc 840ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc 840
cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct 900cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct 900
agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 960agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 960
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 1020gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 1020
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 1080gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 1080
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 1140aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 1140
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 1200ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 1200
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 1260ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 1260
cctgtctcct cagcttcagg caccaccact gacctgggac agtgccgcca ccatgatcat 1320cctgtctcct cagcttcagg caccaccact gacctgggac agtgccgcca ccatgatcat 1320
ggccgagagc cctggcctga tcaccatctg cctgctgggc tacctgctga gcgccgagtg 1380ggccgagagc cctggcctga tcaccatctg cctgctgggc tacctgctga gcgccgagtg 1380
caccgtgttc ctggaccacg agaacgccaa caagatcctg aaccggccca agagatacaa 1440caccgtgttc ctggaccacg agaacgccaa caagatcctg aaccggccca agagatacaa 1440
cagcggcaag ctggaggagt tcgtgcaggg caacctggag agggagtgca tggaggagaa 1500cagcggcaag ctggagagt tcgtgcaggg caacctggag agggagtgca tggaggagaa 1500
gtgcagcttc gaggaggcca gggaagtgtt cgagaacacc gagcggacca ccgagttctg 1560gtgcagcttc gaggaggcca gggaagtgtt cgagaacacc gagcggacca ccgagttctg 1560
gaagcagtac gtggacggcg accagtgcga gagcaaccct tgcctgaacg gcggcagctg 1620gaagcagtac gtggacggcg accagtgcga gagcaaccct tgcctgaacg gcggcagctg 1620
caaggacgac atcaacagct acgagtgctg gtgccctttc ggcttcgagg gcaagaactg 1680caaggacgac atcaacagct acgagtgctg gtgccctttc ggcttcgagg gcaagaactg 1680
cgagctggac gtgacctgca acatcaagaa cggccgctgc gagcagttct gcaagaacag 1740cgagctggac gtgacctgca acatcaagaa cggccgctgc gagcagttct gcaagaacag 1740
cgccgacaac aaagtggtgt gtagctgcac cgagggctac agactggccg agaaccagaa 1800cgccgacaac aaagtggtgt gtagctgcac cgagggctac agactggccg agaaccagaa 1800
gagctgcgag cccgccgtgc ccttcccctg cggcagagtg agcgtgtccc agaccagcaa 1860gagctgcgag cccgccgtgc ccttcccctg cggcagagtg agcgtgtccc agaccagcaa 1860
gctgaccaga gccgagaccg tgttccccga cgtggactac gtgaatagca ccgaggccga 1920gctgaccaga gccgagaccg tgttccccga cgtggactac gtgaatagca ccgaggccga 1920
gaccatcctg gacaacatca cccagagcac ccagtccttc aacgacttca ccagagttgt 1980gaccatcctg gacaacatca cccagagcac ccagtccttc aacgacttca cccagttgt 1980
gggcggcgag gacgccaagc ccggccagtt cccctggcag gtggtgctga acggcaaagt 2040gggcggcgag gacgccaagc ccggccagtt cccctggcag gtggtgctga acggcaaagt 2040
ggatgccttc tgcggcggca gcatcgtgaa cgagaagtgg atcgtgacag ccgcccactg 2100ggatgccttc tgcggcggca gcatcgtgaa cgagaagtgg atcgtgacag ccgcccactg 2100
cgtggagacc ggcgtgaaga tcaccgtggt ggccggcgaa cacaatatcg aggagaccga 2160cgtggagacc ggcgtgaaga tcaccgtggt ggccggcgaa cacaatatcg aggagaccga 2160
gcacaccgag cagaagcgga acgtcatccg gattatcccc caccacaact acaacgccgc 2220gcacaccgag cagaagcgga acgtcatccg gattatcccc caccacaact acaacgccgc 2220
catcaacaag tacaaccacg acatcgccct gctggagctg gacgagcctc tggtgctgaa 2280catcaacaag tacaaccacg acatcgccct gctggagctg gacgagcctc tggtgctgaa 2280
tagctacgtg acccccatct gcatcgccga caaggagtac accaacatct tcctgaagtt 2340tagctacgtg acccccatct gcatcgccga caaggagtac accaacatct tcctgaagtt 2340
cggcagcggc tacgtgtccg gctggggcag agtgttccac aagggcagaa gcgccctggt 2400cggcagcggc tacgtgtccg gctggggcag agtgttccac aagggcagaa gcgccctggt 2400
gctgcagtac ctgagagtgc ccctggtgga cagagccacc tgcctgttga gcaccaagtt 2460gctgcagtac ctgagagtgc ccctggtgga cagagccacc tgcctgttga gcaccaagtt 2460
caccatctac aacaacatgt tctgcgccgg cttccacgag ggcggcagag acagctgcca 2520caccatctac aacaacatgt tctgcgccgg cttccacgag ggcggcagag acagctgcca 2520
gggcgacagc ggcggacccc acgtgaccga agtggagggc accagcttcc tgaccggcat 2580gggcgacagc ggcggacccc acgtgaccga agtggagggc accagcttcc tgaccggcat 2580
catcagctgg ggcgaggagt gcgccatgaa gggcaagtac ggcatctaca ccaaagtgag 2640catcagctgg ggcgaggagt gcgccatgaa gggcaagtac ggcatctaca ccaaagtgag 2640
ccggtacgtg aactggatca aggagaaaac caagctgacc tgagagcatc ttaccgccat 2700ccggtacgtg aactggatca aggagaaaac caagctgacc tgagagcatc ttaccgccat 2700
ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg ttaataaaac 2760ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg ttaataaaac 2760
aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt caggtgtatt 2820aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt caggtgtatt 2820
gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc ctgttaatca 2880gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc ctgttaatca 2880
acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg ttgctccttt 2940acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg ttgctccttt 2940
tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt cccgtacggc 3000tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt cccgtacggc 3000
tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg agttgtggcc 3060tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg agttgtggcc 3060
cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg 3120cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg 3120
gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc tcccgatcgc 3180gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc tcccgatcgc 3180
cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta ggttgctggg 3240cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta ggttgctggg 3240
cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc 3300cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc 3300
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 3360ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 3360
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 3420tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 3420
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 3480gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 3480
ctctatggca ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 3540ctctatggca ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 3540
tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 3600tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 3600
tgagcgagcg agcgcgcagc tgcctgcagg 3630tgagcgagcg agcgcgcagc tgcctgcagg 3630
<210> 60<210> 60
<211> 3624<211> 3624
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 60<400> 60
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tggctcagag gctcagaggc acacaggagt ttctgggctc 180actccatcac taggggttcc tggctcagag gctcagaggc acacaggagt ttctgggctc 180
accctgcccc cttccaaccc ctcagttccc atcctccagc agctgtttgt gtgctgcctc 240accctgcccc cttccaaccc ctcagttccc atcctccagc agctgtttgt gtgctgcctc 240
tgaagtccac actgaacaaa cttcagccta ctcatgtccc taaaatgggc aaacattgca 300tgaagtccac actgaacaaa cttcagccta ctcatgtccc taaaatgggc aaacattgca 300
agcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg 360agcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg 360
tcagagacct ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg 420tcagagacct ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg 420
tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggt ccgggttcaa 480tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggt ccgggttcaa 480
aaccacttgc tgggtgggga gtcgtcagta agtggctatg ccccgacccc gaagcctgtt 540aaccacttgc tgggtgggga gtcgtcagta agtggctatg ccccgacccc gaagcctgtt 540
tccccatctg tacaatggaa atgataaaga cgcccatctg atagggtttt tgtggcaaat 600tccccatctg tacaatggaa atgataaaga cgcccatctg atagggtttt tgtggcaaat 600
aaacatttgg tttttttgtt ttgttttgtt ttgttttttg agatggaggt ttgctctgtc 660aaacatttgg tttttttgtt ttgttttgtt ttgttttttg agatggaggt ttgctctgtc 660
gcccaggctg gagtgcagtg acacaatctc atctcaccac aaccttcccc tgcctcagcc 720gcccaggctg gagtgcagtg acacaatctc atctcaccac aaccttcccc tgcctcagcc 720
tcccaagtag ctgggattac aagcatgtgc caccacacct ggctaatttt ctatttttag 780tcccaagtag ctgggattac aagcatgtgc caccacacct ggctaatttt ctatttttag 780
tagagacggg tttctccatg ttggtcagcc tcagcctccc aagtaactgg gattacaggc 840tagagacggg tttctccatg ttggtcagcc tcagcctccc aagtaactgg gattacaggc 840
ctgtgccacc acacccggct aattttttct atttttgaca gggacggggt ttcaccatgt 900ctgtgccacc acacccggct aattttttct atttttgaca gggacggggt ttcaccatgt 900
tggtcaggct ggtctagagg taccggatct tgctaccagt ggaacagcca ctaaggattc 960tggtcaggct ggtctagagg taccggatct tgctaccagt ggaacagcca ctaaggattc 960
tgcagtgaga gcagagggcc agctaagtgg tactctccca gagactgtct gactcacgcc 1020tgcagtgaga gcagagggcc agctaagtgg tactctccca gagactgtct gactcacgcc 1020
accccctcca ccttggacac aggacgctgt ggtttctgag ccaggtacaa tgactccttt 1080accccctcca ccttggacac aggacgctgt ggtttctgag ccaggtacaa tgactccttt 1080
cggtaagtgc agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg 1140cggtaagtgc agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg 1140
cgactcagat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac 1200cgactcagat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac 1200
cttggttaat attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac 1260cttggttaat attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac 1260
ggacgaggac agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtgc 1320ggacgaggac agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtgc 1320
cgccaccatg atcatggccg agagccctgg cctgatcacc atctgcctgc tgggctacct 1380cgccaccatg atcatggccg agagccctgg cctgatcacc atctgcctgc tgggctacct 1380
gctgagcgcc gagtgcaccg tgttcctgga ccacgagaac gccaacaaga tcctgaaccg 1440gctgagcgcc gagtgcaccg tgttcctgga ccacgagaac gccaacaaga tcctgaaccg 1440
gcccaagaga tacaacagcg gcaagctgga ggagttcgtg cagggcaacc tggagaggga 1500gcccaagaga tacaacagcg gcaagctgga ggagttcgtg cagggcaacc tggagaggga 1500
gtgcatggag gagaagtgca gcttcgagga ggccagggaa gtgttcgaga acaccgagcg 1560gtgcatggag gagaagtgca gcttcgagga ggccagggaa gtgttcgaga acaccgagcg 1560
gaccaccgag ttctggaagc agtacgtgga cggcgaccag tgcgagagca acccttgcct 1620gaccaccgag ttctggaagc agtacgtgga cggcgaccag tgcgagagca acccttgcct 1620
gaacggcggc agctgcaagg acgacatcaa cagctacgag tgctggtgcc ctttcggctt 1680gaacggcggc agctgcaagg acgacatcaa cagctacgag tgctggtgcc ctttcggctt 1680
cgagggcaag aactgcgagc tggacgtgac ctgcaacatc aagaacggcc gctgcgagca 1740cgagggcaag aactgcgagc tggacgtgac ctgcaacatc aagaacggcc gctgcgagca 1740
gttctgcaag aacagcgccg acaacaaagt ggtgtgtagc tgcaccgagg gctacagact 1800gttctgcaag aacagcgccg acaacaaagt ggtgtgtagc tgcaccgagg gctacagact 1800
ggccgagaac cagaagagct gcgagcccgc cgtgcccttc ccctgcggca gagtgagcgt 1860ggccgagaac cagaagagct gcgagcccgc cgtgcccttc ccctgcggca gagtgagcgt 1860
gtcccagacc agcaagctga ccagagccga gaccgtgttc cccgacgtgg actacgtgaa 1920gtcccagacc agcaagctga cgagccga gaccgtgttc cccgacgtgg actacgtgaa 1920
tagcaccgag gccgagacca tcctggacaa catcacccag agcacccagt ccttcaacga 1980tagcaccgag gccgagacca tcctggacaa catcacccag agcacccagt ccttcaacga 1980
cttcaccaga gttgtgggcg gcgaggacgc caagcccggc cagttcccct ggcaggtggt 2040cttcaccaga gttgtgggcg gcgaggacgc caagcccggc cagttcccct ggcaggtggt 2040
gctgaacggc aaagtggatg ccttctgcgg cggcagcatc gtgaacgaga agtggatcgt 2100gctgaacggc aaagtggatg ccttctgcgg cggcagcatc gtgaacgaga agtggatcgt 2100
gacagccgcc cactgcgtgg agaccggcgt gaagatcacc gtggtggccg gcgaacacaa 2160gacagccgcc cactgcgtgg agaccggcgt gaagatcacc gtggtggccg gcgaacacaa 2160
tatcgaggag accgagcaca ccgagcagaa gcggaacgtc atccggatta tcccccacca 2220tatcgaggag accgagcaca ccgagcagaa gcggaacgtc atccggatta tcccccacca 2220
caactacaac gccgccatca acaagtacaa ccacgacatc gccctgctgg agctggacga 2280caactacaac gccgccatca acaagtacaa ccacgacatc gccctgctgg agctggacga 2280
gcctctggtg ctgaatagct acgtgacccc catctgcatc gccgacaagg agtacaccaa 2340gcctctggtg ctgaatagct acgtgacccc catctgcatc gccgacaagg agtacaccaa 2340
catcttcctg aagttcggca gcggctacgt gtccggctgg ggcagagtgt tccacaaggg 2400catcttcctg aagttcggca gcggctacgt gtccggctgg ggcagagtgt tccacaaggg 2400
cagaagcgcc ctggtgctgc agtacctgag agtgcccctg gtggacagag ccacctgcct 2460cagaagcgcc ctggtgctgc agtacctgag agtgcccctg gtggacagag ccacctgcct 2460
gttgagcacc aagttcacca tctacaacaa catgttctgc gccggcttcc acgagggcgg 2520gttgagcacc aagttcacca tctacaacaa catgttctgc gccggcttcc acgagggcgg 2520
cagagacagc tgccagggcg acagcggcgg accccacgtg accgaagtgg agggcaccag 2580cagagacagc tgccagggcg acagcggcgg accccacgtg accgaagtgg agggcaccag 2580
cttcctgacc ggcatcatca gctggggcga ggagtgcgcc atgaagggca agtacggcat 2640cttcctgacc ggcatcatca gctggggcga ggagtgcgcc atgaagggca agtacggcat 2640
ctacaccaaa gtgagccggt acgtgaactg gatcaaggag aaaaccaagc tgacctgaga 2700ctacaccaaa gtgagccggt acgtgaactg gatcaaggag aaaaccaagc tgacctgaga 2700
gcatcttacc gccatttatt cccatatttg ttctgttttt cttgatttgg gtatacattt 2760gcatcttacc gccatttatt cccatatttg ttctgttttt cttgatttgg gtatacattt 2760
aaatgttaat aaaacaaaat ggtggggcaa tcatttacat ttttagggat atgtaattac 2820aaatgttaat aaaacaaaat ggtggggcaa tcatttacat ttttagggat atgtaattac 2820
tagttcaggt gtattgccac aagacaaaca tgttaagaaa ctttcccgtt atttacgctc 2880tagttcaggt gtattgccac aagacaaaca tgttaagaaa ctttcccgtt atttacgctc 2880
tgttcctgtt aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa 2940tgttcctgtt aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa 2940
ctatgttgct ccttttacgc tgtgtggata tgctgcttta tagcctctgt atctagctat 3000ctatgttgct ccttttacgc tgtgtggata tgctgcttta tagcctctgt atctagctat 3000
tgcttcccgt acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctctttt 3060tgcttcccgt acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctctttt 3060
agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc 3120agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc 3120
aacccccact ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt 3180aacccccact ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt 3180
ccccctcccg atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg 3240ccccctcccg atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg 3240
ggctaggttg ctgggcactg ataattccgt ggtgttgtct gtgccttcta gttgccagcc 3300ggctaggttg ctgggcactg ataattccgt ggtgttgtct gtgccttcta gttgccagcc 3300
atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt 3360atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt 3360
cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct 3420cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct 3420
ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc 3480ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc 3480
tggggatgcg gtgggctcta tggcaggaac ccctagtgat ggagttggcc actccctctc 3540tggggatgcg gtgggctcta tggcaggaac ccctagtgat ggagttggcc actccctctc 3540
tgcgcgctcg ctcgctcact gaggccgccc gggaaacccg ggcgtgcgcc tcagtgagcg 3600tgcgcgctcg ctcgctcact gaggccgccc gggaaacccg ggcgtgcgcc tcagtgagcg 3600
agcgagcgcg cagctgcctg cagg 3624agcgagcgcg cagctgcctg cagg 3624
<210> 61<210> 61
<211> 4257<211> 4257
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 61<400> 61
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 180actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 180
agccatgctc tagagcggcc gcacgcgtag atcttcaata ttggccatta gccatattat 240agccatgctc tagagcggcc gcacgcgtag atcttcaata ttggccatta gccatattat 240
tcattggtta tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat 300tcattggtta tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat 300
atcataatat gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat 360atcataatat gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat 360
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600
atatgccaag tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660atatgccaag tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660
cccagtacat gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg 720cccagtacat gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg 720
ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 780ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 780
ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 840ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 840
gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga 900gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga 900
ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg 960ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg 960
cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg 1020cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg 1020
cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc 1080cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc 1080
tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt 1140tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt 1140
aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag 1200aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag 1200
gggctccggg agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt 1260gggctccggg agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt 1260
gtgcgtgggg agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc 1320gtgcgtgggg agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc 1320
ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc 1380ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc 1380
ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg 1440ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg 1440
gggtgagcag ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc 1500gggtgagcag ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc 1500
ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg 1560ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg 1560
gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc 1620gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc 1620
tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg 1680tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg 1680
aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact 1740aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact 1740
tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag 1800tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag 1800
cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg 1860cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg 1860
tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga 1920tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga 1920
cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg tgaccggcgg 1980cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg tgaccggcgg 1980
ctctagagcc tctgctaacc atgttttagc cttcttcttt ttcctacagc tcctgggcaa 2040ctctagagcc tctgctaacc atgttttagc cttcttcttt ttcctacagc tcctgggcaa 2040
cgtgctggtt attgtgctgt ctcatcattt gtcgacagaa ttcctcgaag atccgaaggg 2100cgtgctggtt attgtgctgt ctcatcattt gtcgacagaa ttcctcgaag atccgaaggg 2100
gttcaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 2160gttcaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 2160
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 2220aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 2220
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 2280aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 2280
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 2340gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 2340
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 2400aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 2400
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 2460ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 2460
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 2520atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 2520
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 2580gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 2580
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 2640aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 2640
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 2700gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 2700
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 2760agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 2760
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 2820gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 2820
ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 2880ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 2880
ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 2940ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 2940
tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 3000tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 3000
gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 3060gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 3060
aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 3120aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 3120
gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 3180gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 3180
gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 3240gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 3240
ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga 3300ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga 3300
ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg 3360ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg 3360
accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac 3420accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac 3420
gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat 3480gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat 3480
caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca 3540caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca 3540
ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg 3600ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg 3600
gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca 3660gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca 3660
accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc 3720accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc 3720
ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag 3780ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag 3780
atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac 3840atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac 3840
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 3900attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 3900
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 3960atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 3960
aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 4020aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 4020
aagtaaaacc tctacaaatg tggtaaaatc gataagtgcg gaccgagcgg ccgctctaga 4080aagtaaaacc tctacaaatg tggtaaaatc gataagtgcg gaccgagcgg ccgctctaga 4080
gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggcagct 4140gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggcagct 4140
gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 4200gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 4200
cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg ggttcct 4257cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg ggttcct 4257
<210> 62<210> 62
<211> 2510<211> 2510
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 62<400> 62
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 180actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 180
agccatgctc tagagcggcc gcgctagccc ctaaaatggg caaacattgc aagcagcaaa 240agccatgctc tagagcggcc gcgctagccc ctaaaatggg caaacattgc aagcagcaaa 240
cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag gtcagagacc 300cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag gtcagagacc 300
tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg gtggagagga 360tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg gtggagagga 360
gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gaatgactcc tttcggtaag 420gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gaatgactcc tttcggtaag 420
tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 480tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 480
gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 540gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 540
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 600aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 600
gacactcgag ggccctgtct cctcagcttc aggcaccacc actgacctgg gacagtgaat 660gacactcgag ggccctgtct cctcagcttc aggcaccacc actgacctgg gacagtgaat 660
ccggacatcg attctaaggt aaatataaaa tttttaagtg tataatttgt taaactactg 720ccggacatcg attctaaggt aaatataaaa tttttaagtg tataatttgt taaactactg 720
attctaattg tttctctctt ttagattcca acctttggaa ctgaattcta gaccaccatg 780attctaattg tttctctctt ttagattcca acctttggaa ctgaattcta gaccaccatg 780
cagagggtga acatgatcat ggctgagagc cctggcctga tcaccatctg cctgctgggc 840cagagggtga acatgatcat ggctgagagc cctggcctga tcaccatctg cctgctgggc 840
tacctgctgt ctgctgagtg cactgtgttc ctggaccatg agaatgccaa caagatcctg 900tacctgctgt ctgctgagtg cactgtgttc ctggaccatg agaatgccaa caagatcctg 900
aacaggccca agagatacaa ctctggcaag ctggaggagt ttgtgcaggg caacctggag 960aacaggccca agagatacaa ctctggcaag ctggagggagt ttgtgcaggg caacctggag 960
agggagtgca tggaggagaa gtgcagcttt gaggaggcca gggaggtgtt tgagaacact 1020agggagtgca tggaggagaa gtgcagcttt gaggaggcca gggaggtgtt tgagaacact 1020
gagaggacca ctgagttctg gaagcagtat gtggatgggg accagtgtga gagcaacccc 1080gagaggacca ctgagttctg gaagcagtat gtggatgggg accagtgtga gagcaacccc 1080
tgcctgaatg ggggcagctg caaggatgac atcaacagct atgagtgctg gtgccccttt 1140tgcctgaatg ggggcagctg caaggatgac atcaacagct atgagtgctg gtgccccttt 1140
ggctttgagg gcaagaactg tgagctggat gtgacctgca acatcaagaa tggcagatgt 1200ggctttgagg gcaagaactg tgagctggat gtgacctgca acatcaagaa tggcagatgt 1200
gagcagttct gcaagaactc tgctgacaac aaggtggtgt gcagctgcac tgagggctac 1260gagcagttct gcaagaactc tgctgacaac aaggtggtgt gcagctgcac tgaggctac 1260
aggctggctg agaaccagaa gagctgtgag cctgctgtgc cattcccatg tggcagagtg 1320aggctggctg agaaccagaa gagctgtgag cctgctgtgc cattcccatg tggcagagtg 1320
tctgtgagcc agaccagcaa gctgaccagg gctgaggctg tgttccctga tgtggactat 1380tctgtgagcc agaccagcaa gctgaccagg gctgaggctg tgttccctga tgtggactat 1380
gtgaacagca ctgaggctga aaccatcctg gacaacatca cccagagcac ccagagcttc 1440gtgaacagca ctgaggctga aaccatcctg gacaacatca cccagagcac cccagcttc 1440
aatgacttca ccagggtggt ggggggggag gatgccaagc ctggccagtt cccctggcaa 1500aatgacttca cccaggtggt ggggggggag gatgccaagc ctggccagtt cccctggcaa 1500
gtggtgctga atggcaaggt ggatgccttc tgtgggggca gcattgtgaa tgagaagtgg 1560gtggtgctga atggcaaggt ggatgccttc tgtggggggca gcattgtgaa tgagaagtgg 1560
attgtgactg ctgcccactg tgtggagact ggggtgaaga tcactgtggt ggctggggag 1620attgtgactg ctgcccactg tgtggagact ggggtgaaga tcactgtggt ggctggggag 1620
cacaacattg aggagactga gcacactgag cagaagagga atgtgatcag gatcatcccc 1680cacaacattg aggagactga gcacactgag cagaagagga atgtgatcag gatcatcccc 1680
caccacaact acaatgctgc catcaacaag tacaaccatg acattgccct gctggagctg 1740caccacaact acaatgctgc catcaacaag tacaaccatg acattgccct gctggagctg 1740
gatgagcccc tggtgctgaa cagctatgtg acccccatct gcattgctga caaggagtac 1800gatgagcccc tggtgctgaa cagctatgtg acccccatct gcattgctga caaggagtac 1800
accaacatct tcctgaagtt tggctctggc tatgtgtctg gctggggcag ggtgttccac 1860accaacatct tcctgaagtt tggctctggc tatgtgtctg gctggggcag ggtgttccac 1860
aagggcaggt ctgccctggt gctgcagtac ctgagggtgc ccctggtgga cagggccacc 1920aagggcaggt ctgccctggt gctgcagtac ctgagggtgc ccctggtgga cagggccacc 1920
tgcctgagga gcaccaagtt caccatctac aacaacatgt tctgtgctgg cttccatgag 1980tgcctgagga gcaccaagtt caccatctac aacaacatgt tctgtgctgg cttccatgag 1980
gggggcaggg acagctgcca gggggactct gggggccccc atgtgactga ggtggagggc 2040gggggcaggg acagctgcca gggggactct gggggccccc atgtgactga ggtggagggc 2040
accagcttcc tgactggcat catcagctgg ggggaggagt gtgccatgaa gggcaagtat 2100accagcttcc tgactggcat catcagctgg ggggaggagt gtgccatgaa gggcaagtat 2100
ggcatctaca ccaaagtctc cagatatgtg aactggatca aggagaagac caagctgacc 2160ggcatctaca ccaaagtctc cagatatgtg aactggatca aggagaagac caagctgacc 2160
taatgactcc atggttcgaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 2220taatgactcc atggttcgaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 2220
taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 2280taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 2280
aggttcaggg ggaggtgtgg gaggtttttt aaaactagtg cggccgctct agagcatggc 2340aggttcaggg ggaggtgtgg gaggtttttt aaaactagtg cggccgctct agagcatggc 2340
tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag 2400tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag 2400
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 2460ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 2460
cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 2510cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 2510
<210> 63<210> 63
<211> 126<211> 126
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 63<400> 63
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcc 60
cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120cgggcgcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc atcactaggg 120
gttcct 126gttcct 126
<210> 64<210> 64
<211> 120<211> 120
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 64<400> 64
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccggga aacccgggcg tgcgcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120ccgcccggga aacccgggcg tgcgcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120
<210> 65<210> 65
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 65<400> 65
gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 66<210> 66
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 66<400> 66
aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt 60aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt 60
cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc 120cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc 120
tgcggcgcgc gcagcacctt t 141tgcggcgcgc gcagcacctt t 141
<210> 67<210> 67
<211> 1876<211> 1876
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 67<400> 67
cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacga 60cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacga 60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 900taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg 900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860gggaaaggtg cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860
catctttgaa caataa 1876catctttgaa caataa 1876
<210> 68<210> 68
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 68<400> 68
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120
tcgggcgcg 129tcgggcgcg 129
<210> 69<210> 69
<211> 1203<211> 1203
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 69<400> 69
gccgccacca tggagttggt gggctggctc gtggacaaag gcattacttc ggaaaagcag 60gccgccacca tggagttggt gggctggctc gtggacaaag gcattacttc ggaaaagcag 60
tggattcagg aggatcaggc atcttacatc tcattcaacg ctgccagtaa ctcgaggtcc 120tggattcagg aggatcaggc atcttacatc tcattcaacg ctgccagtaa ctcgaggtcc 120
cagatcaagg cagcgctgga caacgcggga aagattatga gtctgaccaa aactgctcca 180cagatcaagg cagcgctgga caacgcggga aagattatga gtctgaccaa aactgctcca 180
gactacctcg ttggtcagca accggtggaa gatatctcca gcaacaggat ctacaagatt 240gactacctcg ttggtcagca accggtggaa gatatctcca gcaacaggat ctacaagatt 240
ctggagctca acggctacga ccctcaatac gctgcctcag tgttcttggg ttgggccacc 300ctggagctca acggctacga ccctcaatac gctgcctcag tgttcttggg ttgggccacc 300
aagaaattcg gcaagagaaa cactatctgg ctgttcggcc ccgctaccac tggaaagaca 360aagaaattcg gcaagagaaa cactatctgg ctgttcggcc ccgctaccac tggaaagaca 360
aacatcgcag aagcgattgc tcacacggtg ccattctacg gctgcgtcaa ctggacaaac 420aacatcgcag aagcgattgc tcacacggtg ccattctacg gctgcgtcaa ctggacaaac 420
gagaacttcc cgttcaacga ctgtgtcgat aagatggtta tctggtggga ggaaggaaag 480gagaacttcc cgttcaacga ctgtgtcgat aagatggtta tctggtggga ggaaggaaag 480
atgacggcca aagtggtcga aagcgccaag gcaattctgg gtggctctaa agtgcgcgtc 540atgacggcca aagtggtcga aagcgccaag gcaattctgg gtggctctaa agtgcgcgtc 540
gaccagaagt gcaaatcttc agctcaaatc gatcctaccc ccgttattgt gacatcaaac 600gaccagaagt gcaaatcttc agctcaaatc gatcctaccc ccgttattgt gacatcaaac 600
acgaacatgt gtgccgtgat cgacggaaac agtacaacgt tcgaacacca gcaacctctc 660acgaacatgt gtgccgtgat cgacggaaac agtacaacgt tcgaacacca gcaacctctc 660
caggatcgta tgttcaagtt cgagctcacc cgccgtttgg accatgattt cggcaaggtc 720caggatcgta tgttcaagtt cgagctcacc cgccgtttgg accatgattt cggcaaggtc 720
actaaacaag aggttaagga cttcttccgc tgggctaaag atcacgttgt ggaggttgaa 780actaaacaag aggttaagga cttcttccgc tgggctaaag atcacgttgt ggaggttgaa 780
catgagttct acgtcaagaa aggaggtgct aagaaacgtc cagccccgtc ggacgcagat 840catgagttct acgtcaagaa aggaggtgct aagaaacgtc cagccccgtc ggacgcagat 840
atctccgaac ctaagagggt gagagagtcg gtcgcacagc caagcacttc tgacgcagaa 900atctccgaac ctaagagggt gagagagtcg gtcgcacagc caagcacttc tgacgcagaa 900
gcttccatta actacgcaga taggtaccaa aacaagtgca gcagacacgt gggtatgaac 960gcttccatta actacgcaga taggtaccaa aacaagtgca gcagacacgt gggtatgaac 960
ttgatgctgt tcccatgccg ccagtgtgag cgtatgaacc aaaactctaa catctgtttc 1020ttgatgctgt tcccatgccg ccagtgtgag cgtatgaacc aaaactctaa catctgtttc 1020
acacatggcc agaaggactg cctcgaatgt ttccctgtgt cagagagtca gcccgtctca 1080acacatggcc agaaggactg cctcgaatgt ttccctgtgt cagagagtca gcccgtctca 1080
gtcgttaaga aagcttacca aaagttgtgc tacatccacc atattatggg taaagtccct 1140gtcgttaaga aagcttacca aaagttgtgc tacatccacc atattatggg taaagtccct 1140
gatgcctgta ccgcttgtga tctggtcaac gtggatttgg acgactgtat tttcgagcaa 1200gatgcctgta ccgcttgtga tctggtcaac gtggatttgg acgactgtat tttcgagcaa 1200
taa 1203taa 1203
<210> 70<210> 70
<211> 388<211> 388
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 70<400> 70
gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca gttcctgccc 60gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca gttcctgccc 60
cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga tatctgtggt 120cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga tatctgtggt 120
aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc ggtcccgccc 180aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc ggtcccgccc 180
tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc tgaaatgacc 240tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc tgaaatgacc 240
ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc gcgcttctgc 300ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc gcgcttctgc 300
tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagacgcc 360tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagacgcc 360
atccacgctg ttttgacttc catagaag 388atccacgctg ttttgacttc catagaag 388
<210> 71<210> 71
<211> 1662<211> 1662
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 71<400> 71
gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg 60gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg 60
gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct 120gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct 120
ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc 180ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc 180
gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga 240gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga 240
atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt 300atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt 300
atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt 360atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt 360
atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg 420atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg 420
aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat 480aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat 480
taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat 540taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat 540
gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac 600gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac 600
tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg 660tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg 660
agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt 720agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt 720
ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata 780ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata 780
tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt 840tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt 840
caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa 900caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa 900
agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct 960agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct 960
cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg 1020cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg 1020
caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat 1080caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat 1080
aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat 1140aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat 1140
accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt 1200accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt 1200
atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg 1260atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg 1260
ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc 1320ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc 1320
ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc 1380ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc 1380
ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc 1440ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc 1440
ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag 1500ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag 1500
atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg 1560atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg 1560
tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag 1620tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag 1620
atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa 1662atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa 1662
<210> 72<210> 72
<211> 581<211> 581
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 72<400> 72
gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60
ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120
actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240
aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360
ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540
ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581
<210> 73<210> 73
<211> 225<211> 225
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 73<400> 73
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225
<210> 74<210> 74
<211> 1177<211> 1177
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 74<400> 74
ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc 60ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc 60
tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac 120tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac 120
ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac 180ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac 180
agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca 240agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca 240
tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc 300tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc 300
ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag 360ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag 360
tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa 420tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa 420
tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt 480tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt 480
tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga 540tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga 540
cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca 600cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca 600
agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt 660agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt 660
tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta 720tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta 720
attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt 780attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt 780
accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 840accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagaggcca 840
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 900gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 900
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 960ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 960
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 1020tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 1020
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 1080gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 1080
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 1140gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 1140
tcctcagctt caggcaccac cactgacctg ggacagt 1177tcctcagctt caggcaccac cactgacctg ggacagt 1177
<210> 75<210> 75
<400> 75<400> 75
000000
<210> 76<210> 76
<400> 76<400> 76
000000
<210> 77<210> 77
<400> 77<400> 77
000000
<210> 78<210> 78
<400> 78<400> 78
000000
<210> 79<210> 79
<400> 79<400> 79
000000
<210> 80<210> 80
<400> 80<400> 80
000000
<210> 81<210> 81
<400> 81<400> 81
000000
<210> 82<210> 82
<400> 82<400> 82
000000
<210> 83<210> 83
<400> 83<400> 83
000000
<210> 84<210> 84
<400> 84<400> 84
000000
<210> 85<210> 85
<400> 85<400> 85
000000
<210> 86<210> 86
<400> 86<400> 86
000000
<210> 87<210> 87
<400> 87<400> 87
000000
<210> 88<210> 88
<400> 88<400> 88
000000
<210> 89<210> 89
<400> 89<400> 89
000000
<210> 90<210> 90
<400> 90<400> 90
000000
<210> 91<210> 91
<400> 91<400> 91
000000
<210> 92<210> 92
<400> 92<400> 92
000000
<210> 93<210> 93
<400> 93<400> 93
000000
<210> 94<210> 94
<400> 94<400> 94
000000
<210> 95<210> 95
<400> 95<400> 95
000000
<210> 96<210> 96
<400> 96<400> 96
000000
<210> 97<210> 97
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 97<400> 97
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 98<210> 98
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 98<400> 98
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60
aagcgagcgc gc 72aagcgagcgc gc 72
<210> 99<210> 99
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 99<400> 99
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120
gg 122gg 122
<210> 100<210> 100
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 100<400> 100
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120
tgcctgcagg 130tgcctgcagg 130
<210> 101<210> 101
<211> 70<211> 70
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 101<400> 101
gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga 60gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga 60
gcgagcgcgc 70gcgagcgcgc 70
<210> 102<210> 102
<211> 70<211> 70
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 102<400> 102
gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga 60gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga 60
gcgagcgcgc 70gcgagcgcgc 70
<210> 103<210> 103
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 103<400> 103
gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc 60gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc 60
gagcgagcgc gc 72gagcgagcgc gc 72
<210> 104<210> 104
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 104<400> 104
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60
gagcgagcgc gc 72gagcgagcgc gc 72
<210> 105<210> 105
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 105<400> 105
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc 60gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc 60
gagcgagcgc gc 72gagcgagcgc gc 72
<210> 106<210> 106
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 106<400> 106
gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc 60gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc 60
gagcgagcgc gc 72gagcgagcgc gc 72
<210> 107<210> 107
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 107<400> 107
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg 60gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg 60
cctcagtgag cgagcgagcg cgc 83cctcagtgag cgagcgagcg cgc 83
<210> 108<210> 108
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 108<400> 108
gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg 60gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg 60
cctcagtgag cgagcgagcg cgc 83cctcagtgag cgagcgagcg cgc 83
<210> 109<210> 109
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 109<400> 109
gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag 60gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag 60
tgagcgagcg agcgcgc 77tgagcgagcg agcgcgc 77
<210> 110<210> 110
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 110<400> 110
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag 60
tgagcgagcg agcgcgc 77tgagcgagcg agcgcgc 77
<210> 111<210> 111
<211> 51<211> 51
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 111<400> 111
gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c 51gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c 51
<210> 112<210> 112
<211> 51<211> 51
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 112<400> 112
gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c 51gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c 51
<210> 113<210> 113
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 113<400> 113
gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 114<210> 114
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 114<400> 114
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 115<210> 115
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 115<400> 115
gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc 60gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc 60
agtgagcgag cgagcgcgc 79agtgagcgag cgagcgcgc 79
<210> 116<210> 116
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 116<400> 116
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc 60
agtgagcgag cgagcgcgc 79agtgagcgag cgagcgcgc 79
<210> 117<210> 117
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 117<400> 117
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc 60gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc 60
gcccggcctc agtgagcgag cgagcgcgc 89gcccggcctc agtgagcgag cgagcgcgc 89
<210> 118<210> 118
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 118<400> 118
gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc 60gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc 60
gggcggcctc agtgagcgag cgagcgcgc 89gggcggcctc agtgagcgag cgagcgcgc 89
<210> 119<210> 119
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 119<400> 119
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc 60gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc 60
ccggcctcag tgagcgagcg agcgcgc 87ccggcctcag tgagcgagcg agcgcgc 87
<210> 120<210> 120
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 120<400> 120
gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg 60gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg 60
gcggcctcag tgagcgagcg agcgcgc 87gcggcctcag tgagcgagcg agcgcgc 87
<210> 121<210> 121
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 121<400> 121
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc 60gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc 60
ggcctcagtg agcgagcgag cgcgc 85ggcctcagtg agcgagcgag cgcgc 85
<210> 122<210> 122
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 122<400> 122
gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc 60gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc 60
ggcctcagtg agcgagcgag cgcgc 85ggcctcagtg agcgagcgag cgcgc 85
<210> 123<210> 123
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 123<400> 123
gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc 60gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc 60
gcccggcctc agtgagcgag cgagcgcgc 89gcccggcctc agtgagcgag cgagcgcgc 89
<210> 124<210> 124
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 124<400> 124
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc 60
gggcggcctc agtgagcgag cgagcgcgc 89gggcggcctc agtgagcgag cgagcgcgc 89
<210> 125<210> 125
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 125<400> 125
gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc 60gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc 60
ccggcctcag tgagcgagcg agcgcgc 87ccggcctcag tgagcgagcg agcgcgc 87
<210> 126<210> 126
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 126<400> 126
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg 60
gcggcctcag tgagcgagcg agcgcgc 87gcggcctcag tgagcgagcg agcgcgc 87
<210> 127<210> 127
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 127<400> 127
gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc 60gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgc 85ggcctcagtg agcgagcgag cgcgc 85
<210> 128<210> 128
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 128<400> 128
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc 60gcgcgctcgc tcgctcactg aggccggggcg accaaaggtc gcccgacgcc cgtttcgggc 60
ggcctcagtg agcgagcgag cgcgc 85ggcctcagtg agcgagcgag cgcgc 85
<210> 129<210> 129
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 129<400> 129
gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg 60gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg 60
cctcagtgag cgagcgagcg cgc 83cctcagtgag cgagcgagcg cgc 83
<210> 130<210> 130
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 130<400> 130
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg 60
cctcagtgag cgagcgagcg cgc 83cctcagtgag cgagcgagcg cgc 83
<210> 131<210> 131
<211> 81<211> 81
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 131<400> 131
gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc 60gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc 60
tcagtgagcg agcgagcgcg c 81tcagtgagcg agcgagcgcg c 81
<210> 132<210> 132
<211> 81<211> 81
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 132<400> 132
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc 60gcgcgctcgc tcgctcactg aggccggggcg accaaaggtc gcccgacgcc tttggcggcc 60
tcagtgagcg agcgagcgcg c 81tcagtgagcg agcgagcgcg c 81
<210> 133<210> 133
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 133<400> 133
gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc 60gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc 60
agtgagcgag cgagcgcgc 79agtgagcgag cgagcgcgc 79
<210> 134<210> 134
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 134<400> 134
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc 60
agtgagcgag cgagcgcgc 79agtgagcgag cgagcgcgc 79
<210> 135<210> 135
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 135<400> 135
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagcc cgggctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagcc cgggctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 136<210> 136
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 136<400> 136
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 137<210> 137
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 137<400> 137
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgac cggtcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgac cggtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 138<210> 138
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 138<400> 138
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgca cgtgcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgca cgtgcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 139<210> 139
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 139<400> 139
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 140<210> 140
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 140<400> 140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagac cggtctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagac cggtctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 141<210> 141
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 141<400> 141
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaca cgtgtggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaca cgtgtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 142<210> 142
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 142<400> 142
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 143<210> 143
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 143<400> 143
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagca cgtgctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagca cgtgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 144<210> 144
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 144<400> 144
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaacc cgggttgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaacc cgggttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 145<210> 145
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 145<400> 145
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagcc atggctgcct 60gcgcgctcgc tcgctcactg aggccggggcg accaaaggtc gcccgaagcc atggctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 146<210> 146
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 146<400> 146
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaac cggttggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaac cggttggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 147<210> 147
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 147<400> 147
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacacc atggtggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacacc atggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 148<210> 148
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 148<400> 148
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 149<210> 149
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 149<400> 149
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgca attgcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgca attgcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 150<210> 150
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 150<400> 150
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaac cggtttgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaac cggtttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 151<210> 151
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 151<400> 151
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagaa cgttctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagaa cgttctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 152<210> 152
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 152<400> 152
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 153<210> 153
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 153<400> 153
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaaa cgtttggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaaa cgtttggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 154<210> 154
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 154<400> 154
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgaa atttcggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgaa atttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 155<210> 155
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 155<400> 155
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 156<210> 156
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 156<400> 156
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaacc atggttgcct 60gcgcgctcgc tcgctcactg aggccggggcg accaaaggtc gcccgaaacc atggttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 157<210> 157
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 157<400> 157
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaac atgttggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaac atgttggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 158<210> 158
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 158<400> 158
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagac atgtctgcct 60gcgcgctcgc tcgctcactg aggccggggcg accaaaggtc gcccgaagac atgtctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 159<210> 159
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 159<400> 159
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaca attgtggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaca attgtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 160<210> 160
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 160<400> 160
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaaa cgttttgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaaa cgttttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 161<210> 161
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 161<400> 161
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaac atgtttgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaac atgtttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 162<210> 162
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 162<400> 162
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaca attgttgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaca attgttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 163<210> 163
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 163<400> 163
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagaa atttctgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaagaa atttctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 164<210> 164
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 164<400> 164
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaaa attttggcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacaaa attttggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 165<210> 165
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 165<400> 165
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaaa atttttgcct 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgaaaaa atttttgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 166<210> 166
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 166<400> 166
gcgcgctcgc tcgctcgctg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgctg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cagcgagcga gcgagcgcgc 80cagcgagcga gcgagcgcgc 80
<210> 167<210> 167
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 167<400> 167
gcgcgctcgc tcgctcaatg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcaatg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cattgagcga gcgagcgcgc 80cattgagcga gcgagcgcgc 80
<210> 168<210> 168
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 168<400> 168
gcgcgctcgc tcgctcaccg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcaccg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cggtgagcga gcgagcgcgc 80cggtgagcga gcgagcgcgc 80
<210> 169<210> 169
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 169<400> 169
gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 170<210> 170
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 170<400> 170
gcgcgctcgc tcgctcactg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcactg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 171<210> 171
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 171<400> 171
gcgcgctcgc tcgctcactg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60gcgcgctcgc tcgctcactg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 172<210> 172
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 172<400> 172
gcgcgctcgc tcgctcactg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60gcgcgctcgc tcgctcactg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 173<210> 173
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 173<400> 173
gcgcgctcgc tcgctcgatg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 174<210> 174
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 174<400> 174
gcgcgctcgc tcgctcgcgg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgcgg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 175<210> 175
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 175<400> 175
gcgcgctcgc tcgctcgcta aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgcta aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 176<210> 176
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 176<400> 176
gcgcgctcgc tcgctcgctg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgctg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60
cagcgagcga gcgagcgcgc 80cagcgagcga gcgagcgcgc 80
<210> 177<210> 177
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 177<400> 177
gcgcgctcgc tcgctcgctg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60gcgcgctcgc tcgctcgctg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60
cagcgagcga gcgagcgcgc 80cagcgagcga gcgagcgcgc 80
<210> 178<210> 178
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 178<400> 178
gcgcgctcgc tcgctcgctg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60gcgcgctcgc tcgctcgctg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60
cagcgagcga gcgagcgcgc 80cagcgagcga gcgagcgcgc 80
<210> 179<210> 179
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 179<400> 179
gcgcgctcgc tcgctcgagg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgagg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cctcgagcga gcgagcgcgc 80cctcgagcga gcgagcgcgc 80
<210> 180<210> 180
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 180<400> 180
gcgcgctcgc tcgctcgata aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgata aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
tatcgagcga gcgagcgcgc 80tatcgagcga gcgagcgcgc 80
<210> 181<210> 181
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 181<400> 181
gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 182<210> 182
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 182<400> 182
gcgcgctcgc tcgctcgatg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60gcgcgctcgc tcgctcgatg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 183<210> 183
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 183<400> 183
gcgcgctcgc tcgctcgatg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60gcgcgctcgc tcgctcgatg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 184<210> 184
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 184<400> 184
gcgcgctcgc tcgctcgaga aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgaga aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 185<210> 185
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 185<400> 185
gcgcgctcgc tcgctcgagg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgagg gggccggggcg accaaaggtc gcccgacgcc cgggcggccc 60
cctcgagcga gcgagcgcgc 80cctcgagcga gcgagcgcgc 80
<210> 186<210> 186
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 186<400> 186
gcgcgctcgc tcgctcgagg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60gcgcgctcgc tcgctcgagg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60
cctcgagcga gcgagcgcgc 80cctcgagcga gcgagcgcgc 80
<210> 187<210> 187
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 187<400> 187
gcgcgctcgc tcgctcgagg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgagg gggccggggcg accaaaggtc gcccgacgcc cgggcggccc 60
cctcgagcga gcgagcgcgc 80cctcgagcga gcgagcgcgc 80
<210> 188<210> 188
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 188<400> 188
gcgcgctcgc tcgctcgagg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60gcgcgctcgc tcgctcgagg aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60
cctcgagcga gcgagcgcgc 80cctcgagcga gcgagcgcgc 80
<210> 189<210> 189
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 189<400> 189
gcgcgctcgc tcgctcgagg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60gcgcgctcgc tcgctcgagg agaccgggcg accaaaggtc gcccgacgcc cgggcggtct 60
cctcgagcga gcgagcgcgc 80cctcgagcga gcgagcgcgc 80
<210> 190<210> 190
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 190<400> 190
gcgcgctcgc tcgctcgaga gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgaga gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 191<210> 191
<400> 191<400> 191
000000
<210> 192<210> 192
<400> 192<400> 192
000000
<210> 193<210> 193
<400> 193<400> 193
000000
<210> 194<210> 194
<400> 194<400> 194
000000
<210> 195<210> 195
<400> 195<400> 195
000000
<210> 196<210> 196
<400> 196<400> 196
000000
<210> 197<210> 197
<400> 197<400> 197
000000
<210> 198<210> 198
<400> 198<400> 198
000000
<210> 199<210> 199
<400> 199<400> 199
000000
<210> 200<210> 200
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 200<400> 200
gcgcgctcgc tcgctcgaga aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60gcgcgctcgc tcgctcgaga aagccgggcg accaaaggtc gcccgacgcc cgggcggctt 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 201<210> 201
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 201<400> 201
gcgcgctcgc tcgctcgaga agaccgggcg accaaaggtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgaga agaccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 202<210> 202
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 202<400> 202
gcgcgctcgc tcgctcgaga gagccgggcg accaaaggtc gcccgacgcc cgggcggctc 60gcgcgctcgc tcgctcgaga gagccgggcg accaaaggtc gcccgacgcc cgggcggctc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 203<210> 203
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 203<400> 203
gcgcgctcgc tcgctcgaga ggaccgggcg accaaaggtc gcccgacgcc cgggcggtcc 60gcgcgctcgc tcgctcgaga ggaccgggcg accaaaggtc gcccgacgcc cgggcggtcc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 204<210> 204
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 204<400> 204
gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 205<210> 205
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 205<400> 205
gcgcgctcgc tcgctcaaga gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcaaga gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60
tcttgagcga gcgagcgcgc 80tcttgagcga gcgagcgcgc 80
<210> 206<210> 206
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 206<400> 206
gcgcgctcgc tcgctcacga gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcacga gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60
tcgtgagcga gcgagcgcgc 80tcgtgagcga gcgagcgcgc 80
<210> 207<210> 207
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 207<400> 207
gcgcgctcgc tcgctcacta gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcacta gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 208<210> 208
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 208<400> 208
gcgcgctcgc tcgctcactg gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcactg gaaccgggcg accaaaggtc gcccgacgcc cgggcggttc 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 209<210> 209
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 209<400> 209
gcgcgctcgc tcgctcactg aaaccgggcg accaaaggtc gcccgacgcc cgggcggttt 60gcgcgctcgc tcgctcactg aaaccgggcg accaaaggtc gcccgacgcc cgggcggttt 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 210<210> 210
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 210<400> 210
gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 211<210> 211
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 211<400> 211
gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 212<210> 212
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 212<400> 212
gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 213<210> 213
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 213<400> 213
gcgcgctcgc tcgctcactg aggccgagcg accaaaggtc gctcgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgagcg accaaaggtc gctcgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 214<210> 214
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 214<400> 214
gcgcgctcgc tcgctcactg aggccggacg accaaaggtc gtccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccggacg accaaaggtc gtccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 215<210> 215
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 215<400> 215
gcgcgctcgc tcgctcactg aggccgggag accaaaggtc tcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggag accaaaggtc tcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 216<210> 216
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 216<400> 216
gcgcgctcgc tcgctcactg aggccgggca accaaaggtt gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggca accaaaggtt gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 217<210> 217
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 217<400> 217
gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 218<210> 218
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 218<400> 218
gcgcgctcgc tcgctcactg aggccgggcg aacaaagttc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg aacaaagttc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 219<210> 219
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 219<400> 219
gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 220<210> 220
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 220<400> 220
gcgcgctcgc tcgctcactg aggccaagcg accaaaggtc gcttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaagcg accaaaggtc gcttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 221<210> 221
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 221<400> 221
gcgcgctcgc tcgctcactg aggccaaacg accaaaggtc gtttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaacg accaaaggtc gtttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 222<210> 222
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 222<400> 222
gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 223<210> 223
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 223<400> 223
gcgcgctcgc tcgctcactg aggccaaaaa accaaaggtt ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa accaaaggtt ttttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 224<210> 224
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 224<400> 224
gcgcgctcgc tcgctcactg aggccaaaaa gccaaaggct ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa gccaaaggct ttttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 225<210> 225
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 225<400> 225
gcgcgctcgc tcgctcactg aggccaaaaa gacaaagtct ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa gacaaagtct ttttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 226<210> 226
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 226<400> 226
gcgcgctcgc tcgctcactg aggccaaaaa gaaaaattct ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa gaaaaattct ttttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 227<210> 227
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 227<400> 227
gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 228<210> 228
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 228<400> 228
gcgcgctcgc tcgctcactg aggccgaaaa aaaaaatttt tttcgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgaaaa aaaaaatttt tttcgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 229<210> 229
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 229<400> 229
gcgcgctcgc tcgctcactg aggccggaaa gaaaaattct ttccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccggaaa gaaaaattct ttccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 230<210> 230
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 230<400> 230
gcgcgctcgc tcgctcactg aggccgggaa gaaaaattct tcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggaa gaaaaattct tcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 231<210> 231
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 231<400> 231
gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccggggca gaaaaattct gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 232<210> 232
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 232<400> 232
gcgcgctcgc tcgctcactg aggccgggcg gaaaaattcc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg gaaaaattcc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 233<210> 233
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 233<400> 233
gcgcgctcgc tcgctcactg aggccgggcg aaaaaatttc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg aaaaaatttc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 234<210> 234
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 234<400> 234
gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 235<210> 235
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 235<400> 235
gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 236<210> 236
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 236<400> 236
gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 237<210> 237
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 237<400> 237
gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 238<210> 238
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 238<400> 238
gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccaggcg accaaaggtc gcctgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 239<210> 239
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 239<400> 239
gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 240<210> 240
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 240<400> 240
gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 241<210> 241
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 241<400> 241
gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 242<210> 242
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 242<400> 242
gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 243<210> 243
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 243<400> 243
gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccgggcg gccaaaggcc gcccgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 244<210> 244
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 244<400> 244
gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 245<210> 245
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 245<400> 245
gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 246<210> 246
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 246<400> 246
gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 247<210> 247
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 247<400> 247
gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 248<210> 248
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 248<400> 248
gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccgggcg acaaaatgtc gcccgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 249<210> 249
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 249<400> 249
gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 250<210> 250
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 250<400> 250
gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 251<210> 251
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 251<400> 251
gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 252<210> 252
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 252<400> 252
gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 253<210> 253
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 253<400> 253
gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccaaaag accaaaggtc ttttgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 254<210> 254
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 254<400> 254
gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 255<210> 255
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 255<400> 255
gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 256<210> 256
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 256<400> 256
gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 257<210> 257
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 257<400> 257
gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 258<210> 258
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 258<400> 258
gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccaaaaa aaaaaatttt ttttgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 259<210> 259
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 259<400> 259
gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcactg aggccggggca gaaaaattct gcccgacacc cgggtggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 260<210> 260
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 260<400> 260
gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcactg aggccggggca gaaaaattct gcccgacgcc atggcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 261<210> 261
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 261<400> 261
gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcactg aggccggggca gaaaaattct gcccgacgac atgtcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 262<210> 262
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 262<400> 262
gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcactg aggccggggca gaaaaattct gcccgacgaa cgttcggcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 263<210> 263
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 263<400> 263
gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgaagca attgctgcct 60gcgcgctcgc tcgctcactg aggccgggca gaaaaattct gcccgaagca attgctgcct 60
cagtgagcga gcgagcgcgc 80cagtgagcga gcgagcgcgc 80
<210> 264<210> 264
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 264<400> 264
gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 265<210> 265
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 265<400> 265
gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 266<210> 266
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 266<400> 266
gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 267<210> 267
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 267<400> 267
gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 268<210> 268
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 268<400> 268
gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 269<210> 269
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 269<400> 269
gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgcc cgggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 270<210> 270
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 270<400> 270
gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 271<210> 271
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 271<400> 271
gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccggggcg gccaaaggcc gcccgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 272<210> 272
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 272<400> 272
gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccggggcg acaaaatgtc gcccgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 273<210> 273
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 273<400> 273
gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 274<210> 274
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 274<400> 274
gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 275<210> 275
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 275<400> 275
gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacgcc cgggcggcct 60gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacgcc cgggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 276<210> 276
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 276<400> 276
gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 277<210> 277
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 277<400> 277
gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 278<210> 278
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 278<400> 278
gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 279<210> 279
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 279<400> 279
gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 280<210> 280
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 280<400> 280
gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 281<210> 281
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 281<400> 281
gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgcc cgggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgcc cgggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 282<210> 282
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 282<400> 282
gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 283<210> 283
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 283<400> 283
gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 284<210> 284
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 284<400> 284
gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 285<210> 285
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 285<400> 285
gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 286<210> 286
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 286<400> 286
gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 287<210> 287
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 287<400> 287
gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgcc cgggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgcc cgggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 288<210> 288
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 288<400> 288
gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 289<210> 289
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 289<400> 289
gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 290<210> 290
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 290<400> 290
gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 291<210> 291
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 291<400> 291
gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 292<210> 292
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 292<400> 292
gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 293<210> 293
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 293<400> 293
gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgcc cgggcggttt 60gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgcc cgggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 294<210> 294
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 294<400> 294
gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 295<210> 295
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 295<400> 295
gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 296<210> 296
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 296<400> 296
gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 297<210> 297
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 297<400> 297
gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 298<210> 298
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 298<400> 298
gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccgggcg accaaaggtc gcccgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 299<210> 299
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 299<400> 299
gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 300<210> 300
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 300<400> 300
gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 301<210> 301
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 301<400> 301
gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 302<210> 302
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 302<400> 302
gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccggggcg accaaaggtc gcccgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 303<210> 303
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 303<400> 303
gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccgggcg accaaaggtc gcccgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 304<210> 304
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 304<400> 304
gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 305<210> 305
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 305<400> 305
gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 306<210> 306
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 306<400> 306
gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 307<210> 307
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 307<400> 307
gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 308<210> 308
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 308<400> 308
gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccgggcg accaaaggtc gcccgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 309<210> 309
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 309<400> 309
gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 310<210> 310
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 310<400> 310
gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 311<210> 311
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 311<400> 311
gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 312<210> 312
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 312<400> 312
gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 313<210> 313
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 313<400> 313
gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccgggcg accaaaggtc gcccgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 314<210> 314
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 314<400> 314
gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 315<210> 315
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 315<400> 315
gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 316<210> 316
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 316<400> 316
gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 317<210> 317
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 317<400> 317
gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 318<210> 318
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 318<400> 318
gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccgggcg accaaaggtc gcccgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 319<210> 319
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 319<400> 319
gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 320<210> 320
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 320<400> 320
gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 321<210> 321
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 321<400> 321
gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 322<210> 322
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 322<400> 322
gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 323<210> 323
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 323<400> 323
gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccaggcg accaaaggtc gcctgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 324<210> 324
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 324<400> 324
gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 325<210> 325
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 325<400> 325
gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 326<210> 326
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 326<400> 326
gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccggggcg gccaaaggcc gcccgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 327<210> 327
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 327<400> 327
gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 328<210> 328
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 328<400> 328
gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccgggcg gccaaaggcc gcccgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 329<210> 329
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 329<400> 329
gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 330<210> 330
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 330<400> 330
gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 331<210> 331
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 331<400> 331
gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccggggcg acaaaatgtc gcccgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 332<210> 332
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 332<400> 332
gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 333<210> 333
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 333<400> 333
gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccgggcg acaaaatgtc gcccgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 334<210> 334
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 334<400> 334
gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 335<210> 335
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 335<400> 335
gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 336<210> 336
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 336<400> 336
gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 337<210> 337
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 337<400> 337
gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 338<210> 338
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 338<400> 338
gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccaaaag accaaaggtc ttttgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 339<210> 339
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 339<400> 339
gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 340<210> 340
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 340<400> 340
gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 341<210> 341
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 341<400> 341
gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 342<210> 342
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 342<400> 342
gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 343<210> 343
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 343<400> 343
gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccaaaaa aaaaaatttt ttttgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 344<210> 344
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 344<400> 344
gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcacta aggccggggca gaaaaattct gcccgacacc cgggtggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 345<210> 345
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 345<400> 345
gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcacta aggccggggca gaaaaattct gcccgacgcc atggcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 346<210> 346
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 346<400> 346
gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgac atgtcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 347<210> 347
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 347<400> 347
gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgacgaa cgttcggcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 348<210> 348
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 348<400> 348
gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgaagca attgctgcct 60gcgcgctcgc tcgctcacta aggccgggca gaaaaattct gcccgaagca attgctgcct 60
tagtgagcga gcgagcgcgc 80tagtgagcga gcgagcgcgc 80
<210> 349<210> 349
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 349<400> 349
gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 350<210> 350
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 350<400> 350
gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 351<210> 351
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 351<400> 351
gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 352<210> 352
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 352<400> 352
gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 353<210> 353
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 353<400> 353
gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccaggcg accaaaggtc gcctgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 354<210> 354
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 354<400> 354
gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 355<210> 355
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 355<400> 355
gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 356<210> 356
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 356<400> 356
gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 357<210> 357
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 357<400> 357
gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 358<210> 358
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 358<400> 358
gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccgggcg gccaaaggcc gcccgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 359<210> 359
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 359<400> 359
gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 360<210> 360
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 360<400> 360
gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccggggcg acaaaatgtc gcccgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 361<210> 361
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 361<400> 361
gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccggggcg acaaaatgtc gcccgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 362<210> 362
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 362<400> 362
gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 363<210> 363
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 363<400> 363
gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccgggcg acaaaatgtc gcccgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 364<210> 364
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 364<400> 364
gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 365<210> 365
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 365<400> 365
gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 366<210> 366
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 366<400> 366
gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 367<210> 367
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 367<400> 367
gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 368<210> 368
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 368<400> 368
gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccaaaag accaaaggtc ttttgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 369<210> 369
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 369<400> 369
gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 370<210> 370
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 370<400> 370
gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 371<210> 371
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 371<400> 371
gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 372<210> 372
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 372<400> 372
gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 373<210> 373
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 373<400> 373
gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccaaaaa aaaaaatttt ttttgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 374<210> 374
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 374<400> 374
gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacacc cgggtggcct 60gcgcgctcgc tcgctcgatg gggccggggca gaaaaattct gcccgacacc cgggtggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 375<210> 375
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 375<400> 375
gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacgcc atggcggcct 60gcgcgctcgc tcgctcgatg gggccggggca gaaaaattct gcccgacgcc atggcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 376<210> 376
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 376<400> 376
gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacgac atgtcggcct 60gcgcgctcgc tcgctcgatg gggccggggca gaaaaattct gcccgacgac atgtcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 377<210> 377
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 377<400> 377
gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacgaa cgttcggcct 60gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgacgaa cgttcggcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 378<210> 378
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 378<400> 378
gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgaagca attgctgcct 60gcgcgctcgc tcgctcgatg gggccgggca gaaaaattct gcccgaagca attgctgcct 60
catcgagcga gcgagcgcgc 80catcgagcga gcgagcgcgc 80
<210> 379<210> 379
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 379<400> 379
gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 380<210> 380
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 380<400> 380
gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 381<210> 381
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 381<400> 381
gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 382<210> 382
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 382<400> 382
gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 383<210> 383
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 383<400> 383
gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccaggcg accaaaggtc gcctgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 384<210> 384
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 384<400> 384
gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 385<210> 385
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 385<400> 385
gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 386<210> 386
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 386<400> 386
gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 387<210> 387
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 387<400> 387
gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 388<210> 388
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 388<400> 388
gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccgggcg gccaaaggcc gcccgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 389<210> 389
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 389<400> 389
gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 390<210> 390
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 390<400> 390
gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 391<210> 391
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 391<400> 391
gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 392<210> 392
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 392<400> 392
gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 393<210> 393
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 393<400> 393
gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccgggcg acaaaatgtc gcccgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 394<210> 394
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 394<400> 394
gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 395<210> 395
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 395<400> 395
gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 396<210> 396
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 396<400> 396
gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 397<210> 397
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 397<400> 397
gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 398<210> 398
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 398<400> 398
gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccaaaag accaaaggtc ttttgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 399<210> 399
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 399<400> 399
gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 400<210> 400
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 400<400> 400
gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 401<210> 401
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 401<400> 401
gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 402<210> 402
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 402<400> 402
gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 403<210> 403
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 403<400> 403
gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccaaaaa aaaaaatttt ttttgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 404<210> 404
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 404<400> 404
gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacacc cgggtggttc 60gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacacc cgggtggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 405<210> 405
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 405<400> 405
gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgcc atggcggttc 60gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgcc atggcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 406<210> 406
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 406<400> 406
gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgac atgtcggttc 60gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgac atgtcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 407<210> 407
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 407<400> 407
gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgaa cgttcggttc 60gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgacgaa cgttcggttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 408<210> 408
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 408<400> 408
gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgaagca attgctgttc 60gcgcgctcgc tcgctcgaga gaaccgggca gaaaaattct gcccgaagca attgctgttc 60
tctcgagcga gcgagcgcgc 80tctcgagcga gcgagcgcgc 80
<210> 409<210> 409
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 409<400> 409
gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 410<210> 410
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 410<400> 410
gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 411<210> 411
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 411<400> 411
gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 412<210> 412
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 412<400> 412
gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 413<210> 413
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 413<400> 413
gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccaggcg accaaaggtc gcctgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 414<210> 414
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 414<400> 414
gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 415<210> 415
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 415<400> 415
gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 416<210> 416
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 416<400> 416
gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccggggcg gccaaaggcc gcccgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 417<210> 417
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 417<400> 417
gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccggggcg gccaaaggcc gcccgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 418<210> 418
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 418<400> 418
gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccgggcg gccaaaggcc gcccgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 419<210> 419
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 419<400> 419
gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 420<210> 420
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 420<400> 420
gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 421<210> 421
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 421<400> 421
gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 422<210> 422
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 422<400> 422
gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 423<210> 423
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 423<400> 423
gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccgggcg acaaaatgtc gcccgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 424<210> 424
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 424<400> 424
gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 425<210> 425
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 425<400> 425
gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 426<210> 426
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 426<400> 426
gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 427<210> 427
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 427<400> 427
gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 428<210> 428
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 428<400> 428
gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccaaaag accaaaggtc ttttgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 429<210> 429
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 429<400> 429
gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 430<210> 430
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 430<400> 430
gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 431<210> 431
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 431<400> 431
gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 432<210> 432
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 432<400> 432
gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 433<210> 433
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 433<400> 433
gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccaaaaa aaaaaatttt ttttgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 434<210> 434
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 434<400> 434
gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacacc cgggtggccc 60gcgcgctcgc tcgctcgcgg gggccggggca gaaaaattct gcccgacacc cgggtggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 435<210> 435
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 435<400> 435
gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgcc atggcggccc 60gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgcc atggcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 436<210> 436
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 436<400> 436
gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgac atgtcggccc 60gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgac atgtcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 437<210> 437
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 437<400> 437
gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgaa cgttcggccc 60gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgacgaa cgttcggccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 438<210> 438
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 438<400> 438
gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgaagca attgctgccc 60gcgcgctcgc tcgctcgcgg gggccgggca gaaaaattct gcccgaagca attgctgccc 60
ccgcgagcga gcgagcgcgc 80ccgcgagcga gcgagcgcgc 80
<210> 439<210> 439
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 439<400> 439
gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 440<210> 440
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 440<400> 440
gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 441<210> 441
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 441<400> 441
gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 442<210> 442
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 442<400> 442
gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 443<210> 443
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 443<400> 443
gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccaggcg accaaaggtc gcctgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 444<210> 444
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 444<400> 444
gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 445<210> 445
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 445<400> 445
gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 446<210> 446
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 446<400> 446
gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 447<210> 447
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 447<400> 447
gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 448<210> 448
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 448<400> 448
gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccgggcg gccaaaggcc gcccgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 449<210> 449
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 449<400> 449
gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 450<210> 450
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 450<400> 450
gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 451<210> 451
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 451<400> 451
gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 452<210> 452
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 452<400> 452
gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 453<210> 453
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 453<400> 453
gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccgggcg acaaaatgtc gcccgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 454<210> 454
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 454<400> 454
gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 455<210> 455
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 455<400> 455
gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 456<210> 456
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 456<400> 456
gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 457<210> 457
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 457<400> 457
gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 458<210> 458
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 458<400> 458
gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccaaaag accaaaggtc ttttgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 459<210> 459
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 459<400> 459
gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 460<210> 460
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 460<400> 460
gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 461<210> 461
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 461<400> 461
gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 462<210> 462
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 462<400> 462
gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 463<210> 463
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 463<400> 463
gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccaaaaa aaaaaatttt ttttgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 464<210> 464
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 464<400> 464
gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacacc cgggtggttt 60gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacacc cgggtggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 465<210> 465
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 465<400> 465
gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgcc atggcggttt 60gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgcc atggcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 466<210> 466
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 466<400> 466
gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgac atgtcggttt 60gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgac atgtcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 467<210> 467
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 467<400> 467
gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgaa cgttcggttt 60gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgacgaa cgttcggttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 468<210> 468
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 468<400> 468
gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgaagca attgctgttt 60gcgcgctcgc tcgctcaata aaaccgggca gaaaaattct gcccgaagca attgctgttt 60
tattgagcga gcgagcgcgc 80tattgagcga gcgagcgcgc 80
<210> 469<210> 469
<211> 120<211> 120
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 469<400> 469
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120
<210> 470<210> 470
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 470<400> 470
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 120ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 120
gg 122gg 122
<210> 471<210> 471
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 471<400> 471
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct 120ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct 120
gcctgcagg 129gcctgcagg 129
<210> 472<210> 472
<211> 101<211> 101
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 472<400> 472
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g 101ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g 101
<210> 473<210> 473
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 473<400> 473
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 120ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 120
gcgcgcagct gcctgcagg 139gcgcgcagct gcctgcagg 139
<210> 474<210> 474
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 474<400> 474
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 120ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 120
gcgcagctgc ctgcagg 137gcgcagctgc ctgcagg 137
<210> 475<210> 475
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 475<400> 475
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120
gcagctgcct gcagg 135gcagctgcct gcagg 135
<210> 476<210> 476
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 476<400> 476
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 120ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 120
agctgcctgc agg 133agctgcctgc agg 133
<210> 477<210> 477
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 477<400> 477
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga 120ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga 120
gcgcgcagct gcctgcagg 139gcgcgcagct gcctgcagg 139
<210> 478<210> 478
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 478<400> 478
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc 120ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc 120
gcgcagctgc ctgcagg 137gcgcagctgc ctgcagg 137
<210> 479<210> 479
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 479<400> 479
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc 120ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc 120
gcagctgcct gcagg 135gcagctgcct gcagg 135
<210> 480<210> 480
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 480<400> 480
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc 120ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc 120
agctgcctgc agg 133agctgcctgc agg 133
<210> 481<210> 481
<211> 131<211> 131
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 481<400> 481
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag 120ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag 120
ctgcctgcag g 131ctgcctgcag g 131
<210> 482<210> 482
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 482<400> 482
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct 120ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct 120
gcctgcagg 129gcctgcagg 129
<210> 483<210> 483
<211> 127<211> 127
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 483<400> 483
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc 120ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc 120
ctgcagg 127ctgcagg 127
<210> 484<210> 484
<211> 120<211> 120
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 484<400> 484
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg 60
cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 120cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 120
<210> 485<210> 485
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 485<400> 485
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ct 122ct 122
<210> 486<210> 486
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 486<400> 486
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ct 122ct 122
<210> 487<210> 487
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 487<400> 487
cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg 60cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg 60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120
ggggttcct 129ggggttcct 129
<210> 488<210> 488
<211> 101<211> 101
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 488<400> 488
cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc 60
gcgcagagag ggagtggcca actccatcac taggggttcc t 101gcgcagagag ggagtggcca actccatcac taggggttcc t 101
<210> 489<210> 489
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 489<400> 489
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120
tccatcacta ggggttcct 139tccatcacta ggggttcct 139
<210> 490<210> 490
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 490<400> 490
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120
catcactagg ggttcct 137catcactagg ggttcct 137
<210> 491<210> 491
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 491<400> 491
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactagggg ttcct 135tcactagggg ttcct 135
<210> 492<210> 492
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 492<400> 492
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cct 133actaggggtt cct 133
<210> 493<210> 493
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 493<400> 493
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg 60
gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120
tccatcacta ggggttcct 139tccatcacta ggggttcct 139
<210> 494<210> 494
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 494<400> 494
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc 60
gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120
catcactagg ggttcct 137catcactagg ggttcct 137
<210> 495<210> 495
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 495<400> 495
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga 60
cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactagggg ttcct 135tcactagggg ttcct 135
<210> 496<210> 496
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 496<400> 496
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cct 133actaggggtt cct 133
<210> 497<210> 497
<211> 131<211> 131
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 497<400> 497
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt 60
tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120
taggggttcc t 131taggggttcct 131
<210> 498<210> 498
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 498<400> 498
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg 60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120
ggggttcct 129ggggttcct 129
<210> 499<210> 499
<211> 127<211> 127
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 499<400> 499
cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt 60cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt 60
cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg 120cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg 120
ggttcct 127ggttcct 127
<210> 500<210> 500
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 500<400> 500
gcccgctggt ttccagcggg ctgcgggccc gaaacgggcc cgc 43gcccgctggt ttccagcggg ctgcgggccc gaaacggggcc cgc 43
<210> 501<210> 501
<211> 28<211> 28
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 501<400> 501
cgggcccgtg cgggcccaaa gggcccgc 28cgggcccgtg cgggcccaaa gggcccgc 28
<210> 502<210> 502
<211> 28<211> 28
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 502<400> 502
gcccgggcac gcccgggttt cccgggcg 28gcccgggcac gcccgggttt cccgggcg 28
<210> 503<210> 503
<211> 22<211> 22
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 503<400> 503
cgtgcgggcc caaagggccc gc 22cgtgcgggcc caaagggccc gc 22
<210> 504<210> 504
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 504<400> 504
cgggcgacca aaggtcgccc g 21cgggcgacca aaggtcgccc g 21
<210> 505<210> 505
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 505<400> 505
cgcccgggct ttgcccgggc 20cgcccgggct ttgcccggggc 20
<210> 506<210> 506
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 506<400> 506
cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gc 42cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gc 42
<210> 507<210> 507
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 507<400> 507
cgggcgacca aaggtcgccc g 21cgggcgacca aaggtcgccc g 21
<210> 508<210> 508
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 508<400> 508
cgcccgggct ttgcccgggc 20cgcccgggct ttgcccggggc 20
<210> 509<210> 509
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 509<400> 509
cgggcgacca aaggtcgccc gacgcccggg cggc 34cgggcgacca aaggtcgccc gacgcccggg cggc 34
<210> 510<210> 510
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 510<400> 510
cgggcgacca aaggtcgccc g 21cgggcgacca aaggtcgccc g 21
<210> 511<210> 511
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 511<400> 511
cgcccgggct ttgcccgggc 20cgcccgggct ttgcccggggc 20
<210> 512<210> 512
<211> 30<211> 30
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 512<400> 512
cggggcccga cgcccgggct ttgcccgggc 30cggggcccga cgcccgggct ttgcccggggc 30
<210> 513<210> 513
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 513<400> 513
cgggcgacca aaggtcgccc g 21cgggcgacca aaggtcgccc g 21
<210> 514<210> 514
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 514<400> 514
cgcccgggct ttgcccgggc 20cgcccgggct ttgcccggggc 20
<210> 515<210> 515
<211> 29<211> 29
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 515<400> 515
cgggcccgac gcccgggctt tgcccgggc 29cgggcccgac gcccggggctt tgcccggggc 29
<210> 516<210> 516
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 516<400> 516
cgggcgacca aaggtcgccc g 21cgggcgacca aaggtcgccc g 21
<210> 517<210> 517
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 517<400> 517
cgcccgggct ttgcccgggc 20cgcccgggct ttgcccggggc 20
<210> 518<210> 518
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 518<400> 518
gcccgggcaa agcccgggcg 20gcccgggcaa agcccgggcg 20
<210> 519<210> 519
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 519<400> 519
cgggcgacct ttggtcgccc g 21cgggcgacct ttggtcgccc g 21
<210> 520<210> 520
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 520<400> 520
gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cg 42gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cg 42
<210> 521<210> 521
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 521<400> 521
gcccgggcaa agcccgggcg 20gcccgggcaa agcccgggcg 20
<210> 522<210> 522
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 522<400> 522
cgggcgacct ttggtcgccc g 21cgggcgacct ttggtcgccc g 21
<210> 523<210> 523
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 523<400> 523
gcccgggcaa agcccgggcg 20gcccgggcaa agcccgggcg 20
<210> 524<210> 524
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 524<400> 524
cgggcgacct ttggtcgccc g 21cgggcgacct ttggtcgccc g 21
<210> 525<210> 525
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 525<400> 525
gccgcccggg cgacgggcga cctttggtcg cccg 34gccgcccggg cgacgggcga cctttggtcg cccg 34
<210> 526<210> 526
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 526<400> 526
gcccgggcaa agcccgggcg 20gcccgggcaa agcccgggcg 20
<210> 527<210> 527
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 527<400> 527
cgggcgacct ttggtcgccc g 21cgggcgacct ttggtcgccc g 21
<210> 528<210> 528
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 528<400> 528
gcccgggcgt cgggcgacct ttggtcgccc g 31gcccgggcgt cgggcgacct ttggtcgccc g 31
<210> 529<210> 529
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 529<400> 529
cgggcgacct ttggtcgccc g 21cgggcgacct ttggtcgccc g 21
<210> 530<210> 530
<400> 530<400> 530
000000
<210> 531<210> 531
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 531<400> 531
gcgcgctcgc tcgctc 16gcgcgctcgc tcgctc 16
<210> 532<210> 532
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 532<400> 532
actgaggc 8actgaggc 8
<210> 533<210> 533
<400> 533<400> 533
000000
<210> 534<210> 534
<400> 534<400> 534
000000
<210> 535<210> 535
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 535<400> 535
gcctcagt 8gcctcagt 8
<210> 536<210> 536
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 536<400> 536
gagcgagcga gcgcgc 16gagcgagcga gcgcgc 16
<210> 537<210> 537
<400> 537<400> 537
000000
<210> 538<210> 538
<211> 165<211> 165
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 538<400> 538
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct 165gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct 165
<210> 539<210> 539
<211> 140<211> 140
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 539<400> 539
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc 60cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc 60
cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 120cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 120
cgcagagaga tcactagggg 140cgcagagaga tcactagggg 140
<210> 540<210> 540
<211> 91<211> 91
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 540<400> 540
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg c 91tcgcccggcc tcagtgagcg agcgagcgcg c 91
<210> 541<210> 541
<211> 91<211> 91
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 541<400> 541
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 60
ccgggcggcc tcagtgagcg agcgagcgcg c 91ccgggcggcc tcagtgagcg agcgagcgcg c 91
<210> 542<210> 542
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 542<400> 542
ttaattaa 8ttaattaa 8
<210> 543<210> 543
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 543<400> 543
cgcgcgagcg agcgagtgac tccggcccgc tggtttccag cgggctgcgg gcccgccgga 60cgcgcgagcg agcgagtgac tccggcccgc tggtttccag cgggctgcgg gcccgccgga 60
gtcactcgct cgctcgcgcg 80gtcactcgct cgctcgcgcg 80
<210> 544<210> 544
<211> 52<211> 52
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 544<400> 544
gcgcgctcgc tcgctcactg aggcctttgc ctcagtgagc gagcgagcgc gc 52gcgcgctcgc tcgctcactg aggcctttgc ctcagtgagc gagcgagcgc gc 52
<210> 545<210> 545
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 545<400> 545
gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc 60gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc 60
agtgagcgag cgagcgcgc 79agtgagcgag cgagcgcgc 79
<210> 546<210> 546
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 546<400> 546
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag 60gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag 60
tgagcgagcg agcgcgc 77tgagcgagcg agcgcgc 77
<210> 547<210> 547
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 547<400> 547
gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag 60gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag 60
tgagcgagcg agcgcgc 77tgagcgagcg agcgcgc 77
<210> 548<210> 548
<400> 548<400> 548
000000
<210> 549<210> 549
<400> 549<400> 549
000000
<210> 550<210> 550
<400> 550<400> 550
000000
<210> 551<210> 551
<400> 551<400> 551
000000
<210> 552<210> 552
<400> 552<400> 552
000000
<210> 553<210> 553
<400> 553<400> 553
000000
<210> 554<210> 554
<400> 554<400> 554
000000
<210> 555<210> 555
<400> 555<400> 555
000000
<210> 556<210> 556
<400> 556<400> 556
000000
<210> 557<210> 557
<400> 557<400> 557
000000
<210> 558<210> 558
<211> 312<211> 312
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 558<400> 558
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
50 55 60 50 55 60
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
305 310 305 310
<210> 559<210> 559
<211> 312<211> 312
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 559<400> 559
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60 50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255 245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285 275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300 290 295 300
Arg Leu Ala Arg Gly His Ser Leu Arg Leu Ala Arg Gly His Ser Leu
305 310 305 310
<210> 560<210> 560
<211> 311<211> 311
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 560<400> 560
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
50 55 60 50 55 60
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
275 280 285 275 280 285
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
290 295 300 290 295 300
Leu Ala Arg Gly Gln Pro Phe Leu Ala Arg Gly Gln Pro Phe
305 310 305 310
<210> 561<210> 561
<211> 311<211> 311
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 561<400> 561
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
50 55 60 50 55 60
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
275 280 285 275 280 285
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
290 295 300 290 295 300
Leu Ala Arg Gly Gln Pro Phe Leu Ala Arg Gly Gln Pro Phe
305 310 305 310
<210> 562<210> 562
<211> 311<211> 311
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 562<400> 562
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
50 55 60 50 55 60
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
290 295 300 290 295 300
Leu Ala Arg Gly Gln Pro Leu Leu Ala Arg Gly Gln Pro Leu
305 310 305 310
<210> 563<210> 563
<211> 329<211> 329
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 563<400> 563
Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr
20 25 30 20 25 30
Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser
50 55 60 50 55 60
Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys
85 90 95 85 90 95
Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val
245 250 255 245 250 255
Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala
260 265 270 260 265 270
Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr
275 280 285 275 280 285
Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro
290 295 300 290 295 300
Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn
305 310 315 320 305 310 315 320
Trp Asn Ser Leu Val Gly Pro Ser Trp Trp Asn Ser Leu Val Gly Pro Ser Trp
325 325
<210> 564<210> 564
<211> 312<211> 312
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 564<400> 564
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
50 55 60 50 55 60
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
305 310 305 310
<210> 565<210> 565
<211> 312<211> 312
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 565<400> 565
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
50 55 60 50 55 60
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
305 310 305 310
<210> 566<210> 566
<211> 312<211> 312
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 566<400> 566
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
50 55 60 50 55 60
Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
305 310 305 310
<210> 567<210> 567
<211> 311<211> 311
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (63)..(63)<222> (63)..(63)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (290)..(290)<222> (290)..(290)
<223> Любая аминокислота<223> Any amino acid
<400> 567<400> 567
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser
50 55 60 50 55 60
Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Xaa Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp Ala Xaa Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp
290 295 300 290 295 300
Leu Ala Arg Gly Gln Pro Leu Leu Ala Arg Gly Gln Pro Leu
305 310 305 310
<210> 568<210> 568
<211> 399<211> 399
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 568<400> 568
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
50 55 60 50 55 60
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
305 310 315 320 305 310 315 320
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
325 330 335 325 330 335
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
340 345 350 340 345 350
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
355 360 365 355 360 365
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
370 375 380 370 375 380
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 385 390 395
<210> 569<210> 569
<211> 397<211> 397
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 569<400> 569
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60 50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255 245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285 275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300 290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320 305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335 325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350 340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365 355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380 370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395 385 390 395
<210> 570<210> 570
<211> 400<211> 400
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 570<400> 570
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
50 55 60 50 55 60
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
275 280 285 275 280 285
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
290 295 300 290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320 305 310 315 320
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
325 330 335 325 330 335
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
340 345 350 340 345 350
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
355 360 365 355 360 365
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
370 375 380 370 375 380
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 400 385 390 395 400
<210> 571<210> 571
<211> 400<211> 400
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 571<400> 571
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
50 55 60 50 55 60
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
275 280 285 275 280 285
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
290 295 300 290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320 305 310 315 320
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
325 330 335 325 330 335
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
340 345 350 340 345 350
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
355 360 365 355 360 365
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
370 375 380 370 375 380
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 400 385 390 395 400
<210> 572<210> 572
<211> 399<211> 399
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 572<400> 572
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
50 55 60 50 55 60
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
290 295 300 290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320 305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys
325 330 335 325 330 335
Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu
340 345 350 340 345 350
Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys
355 360 365 355 360 365
Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala
370 375 380 370 375 380
Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln
385 390 395 385 390 395
<210> 573<210> 573
<211> 390<211> 390
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 573<400> 573
Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr
20 25 30 20 25 30
Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys
35 40 45 35 40 45
Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser
50 55 60 50 55 60
Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys
85 90 95 85 90 95
Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val
245 250 255 245 250 255
Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala
260 265 270 260 265 270
Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr
275 280 285 275 280 285
Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro
290 295 300 290 295 300
Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn
305 310 315 320 305 310 315 320
Trp Asn Ser Arg Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Trp Asn Ser Arg Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp
325 330 335 325 330 335
Asn Ile Ser Asn Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Ile Ser Asn Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys
340 345 350 340 345 350
Asn Gly Cys Ile Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Asn Gly Cys Ile Cys His Asn Val Thr His Cys Gln Ile Cys His Gly
355 360 365 355 360 365
Ile Pro Pro Trp Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Ile Pro Pro Trp Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp
370 375 380 370 375 380
Asp Ala Asn Lys Glu Gln Asp Ala Asn Lys Glu Gln
385 390 385 390
<210> 574<210> 574
<211> 399<211> 399
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 574<400> 574
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
50 55 60 50 55 60
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
305 310 315 320 305 310 315 320
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
325 330 335 325 330 335
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
340 345 350 340 345 350
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
355 360 365 355 360 365
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
370 375 380 370 375 380
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 385 390 395
<210> 575<210> 575
<211> 399<211> 399
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 575<400> 575
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
50 55 60 50 55 60
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met
305 310 315 320 305 310 315 320
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
325 330 335 325 330 335
Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val
340 345 350 340 345 350
Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys
355 360 365 355 360 365
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
370 375 380 370 375 380
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 385 390 395
<210> 576<210> 576
<211> 399<211> 399
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 576<400> 576
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
50 55 60 50 55 60
Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Ala Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
290 295 300 290 295 300
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
305 310 315 320 305 310 315 320
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
325 330 335 325 330 335
Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
340 345 350 340 345 350
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
355 360 365 355 360 365
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
370 375 380 370 375 380
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 385 390 395
<210> 577<210> 577
<211> 398<211> 398
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (63)..(63)<222> (63)..(63)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (317)..(317)<222> (317)..(317)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (333)..(333)<222> (333)..(333)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (341)..(341)<222> (341)..(341)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (345)..(345)<222> (345)..(345)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (356)..(356)<222> (356)..(356)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (364)..(364)<222> (364)..(364)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (368)..(368)<222> (368)..(368)
<223> Любая аминокислота<223> Any amino acid
<400> 577<400> 577
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15 1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30 20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45 35 40 45
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser
50 55 60 50 55 60
Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu
65 70 75 80 65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
85 90 95 85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110 100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125 115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140 130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160 145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175 165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190 180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205 195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220 210 215 220
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240 225 230 235 240
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
245 250 255 245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270 260 265 270
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
275 280 285 275 280 285
Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp
290 295 300 290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu
305 310 315 320 305 310 315 320
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys
325 330 335 325 330 335
Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser
340 345 350 340 345 350
Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa
355 360 365 355 360 365
Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys
370 375 380 370 375 380
Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 385 390 395
<210> 578<210> 578
<211> 536<211> 536
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 578<400> 578
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
275 280 285 275 280 285
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
515 520 525 515 520 525
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
530 535 530 535
<210> 579<210> 579
<211> 536<211> 536
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 579<400> 579
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285 275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480 465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510 500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525 515 520 525
Arg Leu Ala Arg Gly His Ser Leu Arg Leu Ala Arg Gly His Ser Leu
530 535 530 535
<210> 580<210> 580
<211> 535<211> 535
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 580<400> 580
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60 50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
85 90 95 85 90 95
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110 100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
275 280 285 275 280 285
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
500 505 510 500 505 510
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
515 520 525 515 520 525
Leu Ala Arg Gly Gln Pro Phe Leu Ala Arg Gly Gln Pro Phe
530 535 530 535
<210> 581<210> 581
<211> 535<211> 535
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 581<400> 581
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60 50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
85 90 95 85 90 95
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110 100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
275 280 285 275 280 285
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
500 505 510 500 505 510
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
515 520 525 515 520 525
Leu Ala Arg Gly Gln Pro Phe Leu Ala Arg Gly Gln Pro Phe
530 535 530 535
<210> 582<210> 582
<211> 535<211> 535
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 582<400> 582
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60 50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu
85 90 95 85 90 95
Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110 100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
275 280 285 275 280 285
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
515 520 525 515 520 525
Leu Ala Arg Gly Gln Pro Leu Leu Ala Arg Gly Gln Pro Leu
530 535 530 535
<210> 583<210> 583
<211> 549<211> 549
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 583<400> 583
Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly
20 25 30 20 25 30
Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val
35 40 45 35 40 45
Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu
50 55 60 50 55 60
Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln
65 70 75 80 65 70 75 80
Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr
85 90 95 85 90 95
Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg
100 105 110 100 105 110
Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn
115 120 125 115 120 125
Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val
130 135 140 130 135 140
Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro
145 150 155 160 145 150 155 160
Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala
165 170 175 165 170 175
Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu
180 185 190 180 185 190
Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala
195 200 205 195 200 205
Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val
210 215 220 210 215 220
Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln
225 230 235 240 225 230 235 240
Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg
245 250 255 245 250 255
Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu
260 265 270 260 265 270
Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp
275 280 285 275 280 285
Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp
290 295 300 290 295 300
Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe
305 310 315 320 305 310 315 320
Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys
325 330 335 325 330 335
Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys
340 345 350 340 345 350
Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys
355 360 365 355 360 365
Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu
370 375 380 370 375 380
Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys
385 390 395 400 385 390 395 400
Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser
405 410 415 405 410 415
Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu
420 425 430 420 425 430
His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys
435 440 445 435 440 445
Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp
450 455 460 450 455 460
Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe
465 470 475 480 465 470 475 480
Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu
485 490 495 485 490 495
Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu
500 505 510 500 505 510
Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp
515 520 525 515 520 525
Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Leu Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Leu
530 535 540 530 535 540
Val Gly Pro Ser Trp Val Gly Pro Ser Trp
545 545
<210> 584<210> 584
<211> 536<211> 536
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 584<400> 584
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
275 280 285 275 280 285
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
515 520 525 515 520 525
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
530 535 530 535
<210> 585<210> 585
<211> 536<211> 536
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 585<400> 585
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
275 280 285 275 280 285
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
515 520 525 515 520 525
Asp Leu Ala Arg Gly Gln Pro Leu Asp Leu Ala Arg Gly Gln Pro Leu
530 535 530 535
<210> 586<210> 586
<211> 538<211> 538
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 586<400> 586
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr
115 120 125 115 120 125
Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala
130 135 140 130 135 140
Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu
145 150 155 160 145 150 155 160
Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu
165 170 175 165 170 175
Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala
180 185 190 180 185 190
Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn
195 200 205 195 200 205
Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala
210 215 220 210 215 220
Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser
225 230 235 240 225 230 235 240
Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn
245 250 255 245 250 255
Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala
260 265 270 260 265 270
Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly
275 280 285 275 280 285
Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu
290 295 300 290 295 300
Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly
305 310 315 320 305 310 315 320
Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly
325 330 335 325 330 335
Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala
340 345 350 340 345 350
Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe
355 360 365 355 360 365
Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met
370 375 380 370 375 380
Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys
385 390 395 400 385 390 395 400
Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr
405 410 415 405 410 415
Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly
420 425 430 420 425 430
Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe
435 440 445 435 440 445
Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr
450 455 460 450 455 460
Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr
465 470 475 480 465 470 475 480
Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg
485 490 495 485 490 495
Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro
500 505 510 500 505 510
Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp
515 520 525 515 520 525
Phe Ala Asp Leu Ala Arg Gly Gln Pro Leu Phe Ala Asp Leu Ala Arg Gly Gln Pro Leu
530 535 530 535
<210> 587<210> 587
<211> 623<211> 623
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 587<400> 587
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
275 280 285 275 280 285
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Glu Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
515 520 525 515 520 525
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
530 535 540 530 535 540
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
545 550 555 560 545 550 555 560
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
565 570 575 565 570 575
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
580 585 590 580 585 590
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
595 600 605 595 600 605
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620 610 615 620
<210> 588<210> 588
<211> 621<211> 621
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 588<400> 588
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285 275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480 465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510 500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525 515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540 530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560 545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575 565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590 580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605 595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620 610 615 620
<210> 589<210> 589
<211> 624<211> 624
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 589<400> 589
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60 50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
85 90 95 85 90 95
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110 100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
275 280 285 275 280 285
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
500 505 510 500 505 510
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
515 520 525 515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540 530 535 540
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
545 550 555 560 545 550 555 560
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
565 570 575 565 570 575
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
580 585 590 580 585 590
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
595 600 605 595 600 605
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620 610 615 620
<210> 590<210> 590
<211> 624<211> 624
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 590<400> 590
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60 50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
85 90 95 85 90 95
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110 100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
275 280 285 275 280 285
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Gln Cys Thr Ser Leu
500 505 510 500 505 510
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
515 520 525 515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540 530 535 540
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
545 550 555 560 545 550 555 560
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
565 570 575 565 570 575
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
580 585 590 580 585 590
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
595 600 605 595 600 605
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620 610 615 620
<210> 591<210> 591
<211> 623<211> 623
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 591<400> 591
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Ser Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60 50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Asp Ser Tyr Phe His Leu His Ile Leu Val Glu
85 90 95 85 90 95
Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile Thr Val Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110 100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270 260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Asn
275 280 285 275 280 285
Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met Pro Pro Glu Asp Ile Ser Ser Asn Arg Ile Tyr Arg Ile Leu Glu Met
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Lys Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala Thr His Glu Phe Tyr Val Arg Lys Gly Gly Ala Arg Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asn Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Tyr Ala Asp
515 520 525 515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540 530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Val Asp Ile Cys
545 550 555 560 545 550 555 560
Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu Phe Thr His Gly Val Met Asp Cys Ala Glu Cys Phe Pro Val Ser Glu
565 570 575 565 570 575
Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys Ser Gln Pro Val Ser Val Val Arg Lys Arg Thr Tyr Gln Lys Leu Cys
580 585 590 580 585 590
Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala Pro Ile His His Ile Met Gly Arg Ala Pro Glu Val Ala Cys Ser Ala
595 600 605 595 600 605
Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln Cys Glu Leu Ala Asn Val Asp Leu Asp Asp Cys Asp Met Glu Gln
610 615 620 610 615 620
<210> 592<210> 592
<211> 610<211> 610
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 592<400> 592
Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly
20 25 30 20 25 30
Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val
35 40 45 35 40 45
Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu
50 55 60 50 55 60
Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln
65 70 75 80 65 70 75 80
Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr
85 90 95 85 90 95
Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg
100 105 110 100 105 110
Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn
115 120 125 115 120 125
Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val
130 135 140 130 135 140
Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro
145 150 155 160 145 150 155 160
Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala
165 170 175 165 170 175
Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu
180 185 190 180 185 190
Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala
195 200 205 195 200 205
Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val
210 215 220 210 215 220
Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln
225 230 235 240 225 230 235 240
Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg
245 250 255 245 250 255
Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu
260 265 270 260 265 270
Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp
275 280 285 275 280 285
Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp
290 295 300 290 295 300
Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe
305 310 315 320 305 310 315 320
Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys
325 330 335 325 330 335
Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys
340 345 350 340 345 350
Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys
355 360 365 355 360 365
Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu
370 375 380 370 375 380
Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys
385 390 395 400 385 390 395 400
Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser
405 410 415 405 410 415
Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu
420 425 430 420 425 430
His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys
435 440 445 435 440 445
Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp
450 455 460 450 455 460
Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe
465 470 475 480 465 470 475 480
Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu
485 490 495 485 490 495
Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu
500 505 510 500 505 510
Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp
515 520 525 515 520 525
Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Arg Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Arg
530 535 540 530 535 540
Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Asn Ile Ser Asn Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Asn Ile Ser Asn
545 550 555 560 545 550 555 560
Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Gly Cys Ile Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Gly Cys Ile
565 570 575 565 570 575
Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Ile Pro Pro Trp Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Ile Pro Pro Trp
580 585 590 580 585 590
Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Asp Ala Asn Lys Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Asp Ala Asn Lys
595 600 605 595 600 605
Glu Gln Glu Gln
610 610
<210> 593<210> 593
<211> 623<211> 623
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 593<400> 593
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Ile Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Asp Lys Leu Val Gln Thr Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala His Asp
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ala
275 280 285 275 280 285
Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Pro Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Arg Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Gln Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Asn Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
515 520 525 515 520 525
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Gln Met
530 535 540 530 535 540
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
545 550 555 560 545 550 555 560
Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Thr Arg Asp Cys Ser Glu Cys Phe Pro Gly Val
565 570 575 565 570 575
Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Leu Cys
580 585 590 580 585 590
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
595 600 605 595 600 605
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620 610 615 620
<210> 594<210> 594
<211> 623<211> 623
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 594<400> 594
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu Arg Glu Lys Leu Val Gln Thr Ile Tyr Arg Gly Val Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Pro Ser
275 280 285 275 280 285
Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu Leu Pro Ala Asp Ile Lys Thr Asn Arg Ile Tyr Arg Ile Leu Glu Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Ile Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Phe Ala
515 520 525 515 520 525
Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Ile Gln Met
530 535 540 530 535 540
Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Asn Ile
545 550 555 560 545 550 555 560
Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val Cys Phe Thr His Gly Val Arg Asp Cys Leu Glu Cys Phe Pro Gly Val
565 570 575 565 570 575
Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys Ser Glu Ser Gln Pro Val Val Arg Lys Lys Thr Tyr Arg Lys Leu Cys
580 585 590 580 585 590
Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala
595 600 605 595 600 605
Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620 610 615 620
<210> 595<210> 595
<211> 625<211> 625
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<400> 595<400> 595
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr Arg Glu Lys Leu Gly Pro Asp His Leu Pro Ala Gly Ser Ser Pro Thr
115 120 125 115 120 125
Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala Leu Pro Asn Trp Phe Ala Val Thr Lys Asp Ala Val Met Ala Pro Ala
130 135 140 130 135 140
Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Gly Gly Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu
145 150 155 160 145 150 155 160
Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Pro Lys Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu
165 170 175 165 170 175
Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Tyr Ile Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala
180 185 190 180 185 190
Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln His Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn
195 200 205 195 200 205
Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Leu Asn Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala
210 215 220 210 215 220
Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Arg Tyr Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser
225 230 235 240 225 230 235 240
Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Glu Lys Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn
245 250 255 245 250 255
Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ala Ala Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala
260 265 270 260 265 270
Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Gly Lys Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly
275 280 285 275 280 285
Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu Pro Ser Leu Pro Ala Asp Ile Thr Gln Asn Arg Ile Tyr Arg Ile Leu
290 295 300 290 295 300
Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Ala Leu Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly
305 310 315 320 305 310 315 320
Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Trp Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly
325 330 335 325 330 335
Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Pro Ala Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala
340 345 350 340 345 350
Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Val Pro Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe
355 360 365 355 360 365
Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Asn Asp Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met
370 375 380 370 375 380
Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Thr Ala Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys
385 390 395 400 385 390 395 400
Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Val Arg Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr
405 410 415 405 410 415
Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Pro Val Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly
420 425 430 420 425 430
Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Asn Ser Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe
435 440 445 435 440 445
Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Phe Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr
450 455 460 450 455 460
Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Lys Gln Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr
465 470 475 480 465 470 475 480
Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg Glu Val Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Ser Lys Arg
485 490 495 485 490 495
Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Pro Ala Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro
500 505 510 500 505 510
Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp Ser Val Ala Asp Pro Ser Thr Ser Asp Ala Glu Gly Ala Pro Val Asp
515 520 525 515 520 525
Phe Ala Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu Phe Ala Asp Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Leu
530 535 540 530 535 540
Gln Met Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe Gln Met Leu Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Phe
545 550 555 560 545 550 555 560
Asn Ile Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro Asn Ile Cys Phe Thr His Gly Val Arg Asp Cys Ser Glu Cys Phe Pro
565 570 575 565 570 575
Gly Val Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys Gly Val Ser Glu Ser Gln Pro Val Val Arg Lys Arg Thr Tyr Arg Lys
580 585 590 580 585 590
Leu Cys Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Leu Cys Ala Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys
595 600 605 595 600 605
Ser Ala Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Ser Ala Cys Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu
610 615 620 610 615 620
Gln Gln
625 625
<210> 596<210> 596
<211> 622<211> 622
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полипептид polypeptide
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (118)..(119)<222> (118)..(119)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (287)..(287)<222> (287)..(287)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (541)..(541)<222> (541)..(541)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (557)..(557)<222> (557)..(557)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (565)..(565)<222> (565)..(565)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (569)..(569)<222> (569)..(569)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (580)..(580)<222> (580)..(580)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (588)..(588)<222> (588)..(588)
<223> Любая аминокислота<223> Any amino acid
<220><220>
<221> Модифицированная аминокислота<221> Modified amino acid
<222> (592)..(592)<222> (592)..(592)
<223> Любая аминокислота<223> Any amino acid
<400> 596<400> 596
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15 1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30 20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Arg Asn Leu Ile
35 40 45 35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60 50 55 60
Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Val Gln Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80 65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
85 90 95 85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110 100 105 110
Arg Glu Lys Leu Val Xaa Xaa Ile Tyr Arg Gly Ile Glu Pro Thr Leu Arg Glu Lys Leu Val Xaa Xaa Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125 115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140 130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160 145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Glu Tyr Ile
165 170 175 165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190 180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Leu Asn
195 200 205 195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220 210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240 225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255 245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270 260 265 270
Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser Ile Met Ala Leu Thr Lys Ser Ala Pro Asp Tyr Leu Val Gly Xaa Ser
275 280 285 275 280 285
Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu Pro Pro Glu Asp Ile Ser Thr Asn Arg Ile Tyr Arg Ile Leu Ala Leu
290 295 300 290 295 300
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Val Phe Leu Gly Trp Ala
305 310 315 320 305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335 325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350 340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365 355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380 370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400 385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415 405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430 420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445 435 440 445
Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln Glu Leu Thr Arg Arg Leu Glu His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460 450 455 460
Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val Glu Val Lys Glu Phe Phe Arg Trp Ala Ser Asp His Val Thr Glu Val
465 470 475 480 465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495 485 490 495
Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val Pro Asp Asp Ala Asp Lys Ser Glu Pro Lys Arg Ala Cys Pro Ser Val
500 505 510 500 505 510
Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp Ala Asp Pro Ser Thr Ser Asp Ala Glu Ala Pro Val Asp Phe Ala Asp
515 520 525 515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu Arg Tyr Gln Asn Lys Cys Ser Arg His Ala Gly Met Xaa Gln Met Leu
530 535 540 530 535 540
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Asn Xaa Asn Ile Cys
545 550 555 560 545 550 555 560
Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser Phe Thr His Gly Xaa Arg Asp Cys Xaa Glu Cys Phe Pro Gly Val Ser
565 570 575 565 570 575
Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa Glu Ser Gln Xaa Val Val Arg Lys Arg Thr Tyr Xaa Lys Leu Cys Xaa
580 585 590 580 585 590
Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys Ile His His Leu Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser Ala Cys
595 600 605 595 600 605
Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln Asp Leu Val Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620 610 615 620
<210> 597<210> 597
<211> 1530<211> 1530
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 597<400> 597
atgtccatgg gggcaccgcg gtccctcctc ctggccctgg ctgctggcct ggccgttgcc 60atgtccatgg gggcaccgcg gtccctcctc ctggccctgg ctgctggcct ggccgttgcc 60
cgtccgccca acatcgtgct gatctttgcc gacgacctcg gctatgggga cctgggctgc 120cgtccgccca acatcgtgct gatctttgcc gacgacctcg gctatgggga cctgggctgc 120
tatgggcacc ccagctctac cactcccaac ctggaccagc tggcggcggg agggctgcgg 180tatgggcacc ccagctctac cactcccaac ctggaccagc tggcggcggg agggctgcgg 180
ttcacagact tctacgtgcc tgtgtctctg tgcacaccct ctagggccgc cctcctgacc 240ttcacagact tctacgtgcc tgtgtctctg tgcacaccct ctagggccgc cctcctgacc 240
ggccggctcc cggttcggat gggcatgtac cctggcgtcc tggtgcccag ctcccggggg 300ggccggctcc cggttcggat gggcatgtac cctggcgtcc tggtgcccag ctcccggggg 300
ggcctgcccc tggaggaggt gaccgtggcc gaagtcctgg ctgcccgagg ctacctcaca 360ggcctgcccc tggaggaggt gaccgtggcc gaagtcctgg ctgcccgagg ctacctcaca 360
ggaatggccg gcaagtggca ccttggggtg gggcctgagg gggccttcct gcccccccat 420ggaatggccg gcaagtggca ccttggggtg gggcctgagg gggccttcct gcccccccat 420
cagggcttcc atcgatttct aggcatcccg tactcccacg accagggccc ctgccagaac 480cagggcttcc atcgatttct aggcatcccg tactcccacg accagggccc ctgccagaac 480
ctgacctgct tcccgccggc cactccttgc gacggtggct gtgaccaggg cctggtcccc 540ctgacctgct tcccgccggc cactccttgc gacggtggct gtgaccaggg cctggtcccc 540
atcccactgt tggccaacct gtccgtggag gcgcagcccc cctggctgcc cggactagag 600atcccactgt tggccaacct gtccgtggag gcgcagcccc cctggctgcc cggactagag 600
gcccgctaca tggctttcgc ccatgacctc atggccgacg cccagcgcca ggatcgcccc 660gcccgctaca tggctttcgc ccatgacctc atggccgacg cccagcgcca ggatcgcccc 660
ttcttcctgt actatgcctc tcaccacacc cactaccctc agttcagtgg gcagagcttt 720ttcttcctgt actatgcctc tcaccacacc cactaccctc agttcagtgg gcagagcttt 720
gcagagcgtt caggccgcgg gccatttggg gactccctga tggagctgga tgcagctgtg 780gcagagcgtt caggccgcgg gccatttggg gactccctga tggagctgga tgcagctgtg 780
gggaccctga tgacagccat aggggacctg gggctgcttg aagagacgct ggtcatcttc 840gggaccctga tgacagccat aggggacctg gggctgcttg aagagacgct ggtcatcttc 840
actgcagaca atggacctga gaccatgcgt atgtcccgag gcggctgctc cggtctcttg 900actgcagaca atggacctga gaccatgcgt atgtcccgag gcggctgctc cggtctcttg 900
cggtgtggaa agggaacgac ctacgagggc ggtgtccgag agcctgcctt ggccttctgg 960cggtgtggaa agggaacgac ctacgagggc ggtgtccgag agcctgcctt ggccttctgg 960
ccaggtcata tcgctcccgg cgtgacccac gagctggcca gctccctgga cctgctgcct 1020ccaggtcata tcgctcccgg cgtgacccac gagctggcca gctccctgga cctgctgcct 1020
accctggcag ccctggctgg ggccccactg cccaatgtca ccttggatgg ctttgacctc 1080accctggcag ccctggctgg ggccccactg cccaatgtca ccttggatgg ctttgacctc 1080
agccccctgc tgctgggcac aggcaagagc cctcggcagt ctctcttctt ctacccgtcc 1140agccccctgc tgctgggcac aggcaagagc cctcggcagt ctctcttctt ctacccgtcc 1140
tacccagacg aggtccgtgg ggtttttgct gtgcggactg gaaagtacaa ggctcacttc 1200tacccagacg aggtccgtgg ggtttttgct gtgcggactg gaaagtacaa ggctcacttc 1200
ttcacccagg gctctgccca cagtgatacc actgcagacc ctgcctgcca cgcctccagc 1260ttcacccagg gctctgccca cagtgatacc actgcagacc ctgcctgcca cgcctccagc 1260
tctctgactg ctcatgagcc cccgctgctc tatgacctgt ccaaggaccc tggtgagaac 1320tctctgactg ctcatgagcc cccgctgctc tatgacctgt ccaaggaccc tggtgagaac 1320
tacaacctgc tggggggtgt ggccggggcc accccagagg tgctgcaagc cctgaaacag 1380tacaacctgc tggggggtgt ggccggggcc accccagagg tgctgcaagc cctgaaacag 1380
cttcagctgc tcaaggccca gttagacgca gctgtgacct tcggccccag ccaggtggcc 1440cttcagctgc tcaaggccca gttagacgca gctgtgacct tcggccccag ccaggtggcc 1440
cggggcgagg accccgccct gcagatctgc tgtcatcctg gctgcacccc ccgcccagct 1500cggggcgagg accccgccct gcagatctgc tgtcatcctg gctgcacccc ccgcccagct 1500
tgctgccatt gcccagatcc ccatgcctga 1530tgctgccatt gccgatcc ccatgcctga 1530
<210> 598<210> 598
<211> 1653<211> 1653
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
полинуклеотид polynucleotide
<400> 598<400> 598
atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60
tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120
ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180
tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240
caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300
cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360
cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420
atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480
tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540
aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600
agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660
ctggccgttg ggtatcataa gccacacatc cccttcagat accccaagga atttcagaag 720ctggccgttg ggtatcataa gccacacatc cccttcagat accccaagga atttcagaag 720
ttgtatccct tggagaacat caccctggcc cccgatcccg aggtccctga tggcctaccc 780ttgtatccct tggagaacat caccctggcc cccgatcccg aggtccctga tggcctaccc 780
cctgtggcct acaacccctg gatggacatc aggcaacggg aagacgtcca agccttaaac 840cctgtggcct acaacccctg gatggacatc aggcaacggg aagacgtcca agccttaaac 840
atcagtgtgc cgtatggtcc aattcctgtg gactttcagc ggaaaatccg ccagagctac 900atcagtgtgc cgtatggtcc aattcctgtg gactttcagc ggaaaatccg ccagagctac 900
tttgcctctg tgtcatattt ggatacacag gtcggccgcc tcttgagtgc tttggacgat 960tttgcctctg tgtcatattt ggatacacag gtcggccgcc tcttgagtgc tttggacgat 960
cttcagctgg ccaacagcac catcattgca tttacctcgg atcatgggtg ggctctaggt 1020cttcagctgg ccaacagcac catcattgca tttacctcgg atcatgggtg ggctctaggt 1020
gaacatggag aatgggccaa atacagcaat tttgatgttg ctacccatgt tcccctgata 1080gaacatggag aatgggccaa atacagcaat tttgatgttg ctacccatgt tcccctgata 1080
ttctatgttc ctggaaggac ggcttcactt ccggaggcag gcgagaagct tttcccttac 1140ttctatgttc ctggaaggac ggcttcactt ccggaggcag gcgagaagct tttcccttac 1140
ctcgaccctt ttgattccgc ctcacagttg atggagccag gcaggcaatc catggacctt 1200ctcgaccctt ttgattccgc ctcacagttg atggagccag gcaggcaatc catggacctt 1200
gtggaacttg tgtctctttt tcccacgctg gctggacttg caggactgca ggttccacct 1260gtggaacttg tgtctctttt tcccacgctg gctggacttg caggactgca ggttccacct 1260
cgctgccccg ttccttcatt tcacgttgag ctgtgcagag aaggcaagaa ccttctgaag 1320cgctgccccg ttccttcatt tcacgttgag ctgtgcagag aaggcaagaa ccttctgaag 1320
cattttcgat tccgtgactt ggaagaggat ccgtacctcc ctggtaatcc ccgtgaactg 1380cattttcgat tccgtgactt ggaagaggat ccgtacctcc ctggtaatcc ccgtgaactg 1380
attgcctata gccagtatcc ccggccttca gacatccctc agtggaattc tgacaagccg 1440attgcctata gccagtatcc ccggccttca gacatccctc agtggaattc tgacaagccg 1440
agtttaaaag atataaagat catgggctat tccatacgca ccatagacta taggtatact 1500agtttaaaag atataaagat catgggctat tccatacgca ccatagacta taggtatact 1500
gtgtgggttg gcttcaatcc tgatgaattt ctagctaact tttctgacat ccatgcaggg 1560gtgtgggttg gcttcaatcc tgatgaattt ctagctaact tttctgacat ccatgcaggg 1560
gaactgtatt ttgtggattc tgacccattg caggatcaca atatgtataa tgattcccaa 1620gaactgtatt ttgtggattc tgacccattg caggatcaca atatgtataa tgattcccaa 1620
ggtggagatc ttttccagtt gttgatgcct tga 1653ggtggagatc ttttccagtt gttgatgcct tga 1653
<210> 599<210> 599
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 599<400> 599
gcgcgctcgc tcgctc 16gcgcgctcgc tcgctc 16
<210> 600<210> 600
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 600<400> 600
actgaggc 8actgaggc 8
<210> 601<210> 601
<211> 22<211> 22
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 601<400> 601
cgggcgacca aaggtcgccc ga 22cgggcgacca aaggtcgccc ga 22
<210> 602<210> 602
<211> 10<211> 10
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 602<400> 602
cgcccgggcg 10cgcccgggcg 10
<210> 603<210> 603
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 603<400> 603
gcctcagt 8gcctcagt 8
<210> 604<210> 604
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 604<400> 604
gagcgagcga gcgcgc 16gagcgagcga gcgcgc 16
<210> 605<210> 605
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 605<400> 605
gcccgggcgt cgggcgacct ttggtcgccc g 31gcccgggcgt cgggcgacct ttggtcgccc g 31
<210> 606<210> 606
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический<223> Description of artificial sequence: synthetic
олигонуклеотид oligonucleotide
<400> 606<400> 606
gcccgggcaa agcccgggcg 20gcccgggcaa agcccgggcg 20
<---<---
Claims (101)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/806,076 | 2019-02-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2021126774A RU2021126774A (en) | 2023-03-15 |
RU2812850C2 true RU2812850C2 (en) | 2024-02-02 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008016391A2 (en) * | 2006-01-31 | 2008-02-07 | The Board Of Trustees Of The Leland Stanford Junior University | Self-complementary parvoviral vectors, and methods for making and using the same |
RU2457252C2 (en) * | 2006-06-21 | 2012-07-27 | Амстердам Молекьюла Терапьютикс (Амт) Ип Б.В. | AVV VECTORS WITH IMPROVED Rep-CODING SEQUENCES USED IN INSECT CELL PRODUCTION SYSTEMS |
WO2012123430A1 (en) * | 2011-03-11 | 2012-09-20 | Association Institut De Myologie | Capsid-free aav vectors, compositions, and methods for vector production and gene delivery |
WO2017152149A1 (en) * | 2016-03-03 | 2017-09-08 | University Of Massachusetts | Closed-ended linear duplex dna for non-viral gene transfer |
WO2019032898A1 (en) * | 2017-08-09 | 2019-02-14 | Bioverativ Therapeutics Inc. | Nucleic acid molecules and uses thereof |
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008016391A2 (en) * | 2006-01-31 | 2008-02-07 | The Board Of Trustees Of The Leland Stanford Junior University | Self-complementary parvoviral vectors, and methods for making and using the same |
RU2457252C2 (en) * | 2006-06-21 | 2012-07-27 | Амстердам Молекьюла Терапьютикс (Амт) Ип Б.В. | AVV VECTORS WITH IMPROVED Rep-CODING SEQUENCES USED IN INSECT CELL PRODUCTION SYSTEMS |
WO2012123430A1 (en) * | 2011-03-11 | 2012-09-20 | Association Institut De Myologie | Capsid-free aav vectors, compositions, and methods for vector production and gene delivery |
WO2017152149A1 (en) * | 2016-03-03 | 2017-09-08 | University Of Massachusetts | Closed-ended linear duplex dna for non-viral gene transfer |
US20190032083A1 (en) * | 2016-03-03 | 2019-01-31 | University Of Massachusetts | Closed-ended linear duplex dna for non-viral gene transfer |
WO2019032898A1 (en) * | 2017-08-09 | 2019-02-14 | Bioverativ Therapeutics Inc. | Nucleic acid molecules and uses thereof |
Non-Patent Citations (1)
Title |
---|
Lamartina S. et al. Lipofection of purified adeno-associated virus Rep68 protein: toward a chromosome-targeting nonviral particle //Journal of virology. 1998, 72(9), p. 7653-7658. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200283794A1 (en) | Modified closed-ended dna (cedna) | |
JP2023126487A (en) | CLOSED-ENDED DNA VECTORS OBTAINABLE FROM CELL-FREE SYNTHESIS AND PROCESS FOR OBTAINING ceDNA VECTORS | |
CN113454232B (en) | Modulation of REP protein Activity in Closed End DNA (CEDNA) production | |
US20210388379A1 (en) | Modified closed-ended dna (cedna) comprising symmetrical modified inverted terminal repeats | |
US20220220488A1 (en) | Synthetic production of single-stranded adeno associated viral dna vectors | |
KR20200124250A (en) | Controlled expression of transgenes using closed-ended DNA (CEDNA) vectors | |
US20220228171A1 (en) | Compositions and production of nicked closed-ended dna vectors | |
EP3938515A2 (en) | Non-viral dna vectors and uses thereof for expressing phenylalanine hydroxylase (pah) therapeutics | |
KR20230003478A (en) | Non-viral DNA vectors and their use for expressing Gaucher therapeutics | |
CA3172572A1 (en) | Non-viral dna vectors and uses thereof for expressing factor ix therapeutics | |
CN113874513A (en) | Non-viral DNA vectors and their use for expressing FVIII therapeutics | |
RU2812850C2 (en) | MODULATION OF REP PROTEIN ACTIVITY WHEN PRODUCING CLOSED-END DNA (ceDNA) | |
RU2816963C2 (en) | Modified closed circular dna (ccdna) containing symmetric modified inverted end repeated sequences | |
RU2829367C2 (en) | Closed-circular dna (ccdna) and use in methods for reducing immune response associated with gene therapy or nucleic acid therapy | |
JP7583732B2 (en) | Non-viral DNA vectors for expressing phenylalanine hydroxylase (PAH) therapeutics and uses thereof | |
RU2800026C2 (en) | MODIFIED CLOSED-ENDED DNA (scDNA) | |
RU2820586C2 (en) | Closed-ended dna vectors obtained by cell-free synthesis, and method of producing cedna vectors | |
JP2023542131A (en) | Closed-ended DNA vector and use thereof for expressing phenylalanine hydroxylase (PAH) | |
CN118489008A (en) | Scalable and high purity cell-free synthesis of closed-end DNA vectors |