KR102240180B1 - 다중 벡터 시스템 및 이의 용도 - Google Patents
다중 벡터 시스템 및 이의 용도 Download PDFInfo
- Publication number
- KR102240180B1 KR102240180B1 KR1020177027977A KR20177027977A KR102240180B1 KR 102240180 B1 KR102240180 B1 KR 102240180B1 KR 1020177027977 A KR1020177027977 A KR 1020177027977A KR 20177027977 A KR20177027977 A KR 20177027977A KR 102240180 B1 KR102240180 B1 KR 102240180B1
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- vector
- aav
- seq
- nucleotide sequence
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
- A61P21/04—Drugs for disorders of the muscular or neuromuscular system for myasthenia gravis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/44—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/44—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
- C12N2840/445—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor for trans-splicing, e.g. polypyrimidine tract, branch point splicing
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Physical Education & Sports Medicine (AREA)
- Neurology (AREA)
- Hematology (AREA)
- Epidemiology (AREA)
- Diabetes (AREA)
- Urology & Nephrology (AREA)
Abstract
본 발명은 효과적인 유전자 치료법을 가능하게 하는, 상세하게는 5 Kb 초과의 유전자로 된 구축물, 벡터, 관련 숙주 세포 및 약제학적 조성물에 관한 것이다.
Description
본 발명은 효과적인 유전자 치료법을 가능하게 하는, 상세하게는 5 Kb 초과의 유전자로 된 구축물, 벡터, 관련 숙주 세포 및 약제학적 조성물에 관한 것이다.
많은 유전성 망막 변성(IRD; inherited retinal degeneration)에 대한 시력-회복 치료법(sight-restoring therapy)은 여전히, 충족되지 못한 주요 의료 요구이다. 아데노-연관 바이러스(AAV; adeno-associated viral) 벡터를 이용한 유전자 치료법은 현재까지, 많은 IRD의 치료를 위한 가장 유망한 접근법을 나타낸다. 사실상, 상이한 IRD들에 대한 수년간의 예비-임상 연구 및 다수의 임상 시험들은, 치료 유전자를 질병에 걸린 망막 층[광수용기(PR; photoreceptor) 및 망막 색소 상피(RPE; retinal pigment epithelium)]에 효율적으로 전달하는 AAV의 능력을 확인하였고1, 2, 인간에서 이들의 우수한 안전성 및 효능 프로파일을 분명히 보여주었다3 -7. 이러한 상항에도 불구하고, 이러한 성공을 다른 시력 상실 질환(blinding condition)까지 확장시키는 데 있어서 주요 장애들 중 하나는 AAV 벡터(~5 kb)의 패키징 용량(packaging capacity)이다. 이는 5 kb보다 더 큰 코딩 서열을 가진 유전자(본원에서는 큰 유전자로도 지칭됨)에서의 돌연변이로 인해, 보편적인 IRD에 대한 유전자 대체 치료법의 개발에 있어서 제한 인자가 되었다.
따라서, 최근 수년간 AAV의 운반 용량을 증가시키기 위한 전략의 규명에 상당한 관심이 있어 왔다. 분자간 재조합을 통해 콘카테머화(concatemerization)하는 AAV 게놈의 능력을 기반으로 한 이중 AAV 벡터는 이러한 문제를 해결하기 위해 성공적으로 이용되어 왔다14-16. 이중 AAV 벡터는 큰 이식유전자(transgene) 발현 카세트를 2개의 개별 절반들로 분할함으로써 생성되며, 이러한 절반은 각각 단일 정상 크기(NS; < 5 kb) AAV 벡터에 패키징된다. 전장(full-length) 발현 카세트의 재구축은, 동일한 세포를 이중 AAV 벡터 둘 다에 의해 공동-감염 시, i) 2개의 벡터 게놈의 반전 말단 반복부(ITR; inverted terminal repeat)-매개 꼬리-대-머리(tail-to-head) 콘카테머화, 및 후속해서 스플라이싱(이중 AAV 트랜스-스플라이싱, TS)15, ii) 2개의 벡터 게놈에 함유된 오버래핑 영역들 사이에서의 상동성 재조합(이중 AAV 오버래핑, OV)15, iii) 둘 다의 조합(이중 AAV 하이브리드)16에 의해 달성된다. 그 외 및 발명자들은 최근, 망막에서 이중 AAv 벡터의 잠재성을 보여주었다14 , 17-19. 이중 AAV 하이브리드 벡터의 맥락에서 사용되는 가장 많이 사용되는 재조합유전성(recombinogenic) 영역은, 높은 수준의 이중 AAV 하이브리드 벡터 재구축을 부여하는 것으로 나타난 인간 알칼리 포스파타제 cDNA의 중간 1/3의 872 bp 서열로부터 유래한다16. 발명자들은, AK 서열을 포함하는 이중 AAV 하이브리드 벡터가, 발명자들이 Ghosh 등22에서 제공된 설명을 기반으로 생성한 센스 알칼리 포스파타제 머리 영역 서열14을 포함하는 벡터를 능가함을 보여주었다. 부가적인 연구는, 이러한 알칼리 포스파타제 영역의 머리 또는 꼬리가, 알칼리 포스파타제 cDNA22의 전장 중간 1/3을 이용하여 달성된 것과 유사한 이식유전자 재구축 수준을 부여함을 보여주었다. 발명자들은, 이중 AAV 트랜스-스플라이싱 및 하이브리드 AK 벡터(F1 파지 유래의 짧은 AK 재조합유전성 서열을 함유함)가 마우스 및 돼지 망막에 효율적으로 형질도입되고, 스타르가르트 질병(STGD; Stargardt disease) 및 어셔 1B(USH1B; Usher 1B)의 마우스 모델을 구제함을 발견하였다14 ,19. 이중 AAV TS 및 하이브리드 AK 벡터를 이용하여 달성된 PR 형질도입의 수준은 IRD의 마우스 모델의 망막 표현형의 유의미한 개선을 가져왔고, 유전성 시력 상실 질환을 치료하는 데 효과적일 수 있다. 더욱이, 고도로 분기하는(divergent)(상동성 23의 58%) 혈청형 2 및 5 유래의 이종성 ITR(각각 ITR2 및 ITR5)을 가진 벡터는 상동성 ITR24을 가진 벡터보다 감소된 환형 단량체 형성 능력 및 증가된 방향성 꼬리-대-머리 콘카테머화를 보여준다. 이를 기반으로, Yan 등은, 이종성 ITR2 및 ITR5를 가진 이중 AAV 벡터가 상동성 ITR을 가진 이중 AAV 벡터보다 이식유전자 발현을 보다 효율적으로 재구축함을 보여주었다24, 25.
이들 연구가 망막과 같은 관심 조직에서의 큰 유전자 재구축을 위한 이중 AAV 벡터의 잠재성을 강조하긴 하였지만, 이들 연구는 또한, 이러한 전략의 추가적인 임상적 번역을 고려하기 전에 해결될 필요가 있는 중요한 문제점을 강조하고 있다.
프로모터 서열을 함유하는 5'-하프(half) 벡터로부터의 및/또는 3'-하프 벡터로부터의 절단된(truncated) 단백질 생성물의 생성은 ITR14 , 17, 20, 21의 낮은 프로모터 활성으로 인해, 이중 벡터의 사용과 연관된 주요 문제점이 여전히 남아 있다. 이들 절단된 생성물의 잠재적인 유해 효과를 생체내에서 평가하기 위한 형식적인 독성 연구가 지금까지도 수행된 적이 없으며, 따라서, 안전성 염려가 증가하고 있다. 따라서, 이들 절단된 생성물의 생성의 감소 또는 제거가 매우 바람직하다. 따라서, 본 발명은 이중 벡터 시스템의 사용과 연관된 이러한 주요 문제점을 해결하는 것을 목표로 한다.
Trapani, I, et al (2014). Progress in retinal and eye research 43: 108-128.
Boye, SE, Boye, SL, Lewin, AS, and Hauswirth, WW (2013). Molecular therapy : the journal of the American Society of Gene Therapy 21: 509-519.
Bainbridge, JW, et al. (2008). The New England journal of medicine 358: 2231-2239.
Maguire, AM, et al. (2009). Lancet 374: 1597-1605.
Maguire, AM, et al. (2008). The New England journal of medicine 358: 2240-2248.
Cideciyan, AV, et al. (2009). Human gene therapy 20: 999-1004.
Simonelli, F, et al. (2010). Molecular therapy : the journal of the American Society of Gene Therapy 18: 643-650.
Allikmets, R, et al. (1997). Nature genetics 15: 236-246.
Molday, RS, and Zhang, K (2010). Progress in lipid research 49: 476-492.
Millan, JM, et al. (2011). Journal of ophthalmology 2011: 417217.
Hasson, T, et al. (1995). PNAS 92: 9815-9819.
Liu, X, Ondek, B, and Williams, DS (1998). Nature genetics 19: 117-118.
Gibbs, D, et al. (2010). Investigative ophthalmology & visual science 51: 1130-1135.
Trapani, I, Colella, P, Sommella, A, Iodice, C, Cesi, G, de Simone, S, et al.(2014). Effective delivery of large genes to the retina by dual AAV vectors. EMBO molecular medicine 6: 194-211.
Duan, D, Yue, Y, and Engelhardt, JF (2001). Molecular therapy : the journal of the American Society of Gene Therapy 4: 383-391.
Ghosh, A, Yue, Y, Lai, Y, and Duan, D (2008). Molecular therapy : the journal of the American Society of Gene Therapy 16: 124-130.
Dyka, FM, et al., (2014). Human gene therapy methods 25: 166-177.
Lopes, VS, et al. (2013). Gene Ther.
Colella, P, et al. (2014). Gene Ther 21: 450-456.
Lostal, W, Kodippili, K, Yue, Y, and Duan, D (2014). Human gene therapy 25: 552-562.
Flotte, TR, et al. (1993). The Journal of biological chemistry 268: 3781-3790.
Ghosh, A, Yue, Y, and Duan, D (2011). Human gene therapy 22: 77-83.
Chiorini, JA, et al., (1999). Journal of virology 73: 1309-1319.
Yan, Z, Zak, R, Zhang, Y, and Engelhardt, JF (2005). Journal of virology 79: 364-379.
Yan, Z, et al. (2007). Human gene therapy 18: 81-87.
Karali, et al. (2010). BMC genomics 11: 715.
Kutty, RK, et al. (2010). Molecular vision 16: 1475-1486.
Ragusa, M, et al.(2013). Molecular vision 19: 430-440.
Sundermeier, TR, and Palczewski, K (2012). Cellular and molecular life sciences : CMLS 69: 2739-2750.
Karali, M, et al. (2011). PloS one 6: e22166.
Gilon, T, Chomsky, O, and Kulka, RG (1998). The EMBO journal 17: 2759-2766.
Bence, NF, Sampat, RM, and Kopito, RR (2001). Science 292: 1552-1555.
Bachmair, A, Finley, D, and Varshavsky, A (1986). Science 234: 179-186.
Johnson, ES, et al., (1992). The EMBO journal 11: 497-505.
Sadis, S, et al., (1995). Molecular and cellular biology 15: 4086-4094.
Chiorini, JA, Afione, S, and Kotin, RM (1999). Journal of virology 73: 4293-4298.
Tian, W, et al. (2012). PloS one 7: e29551.
Wang, Z (2011). Methods in molecular biology 676: 211-223.
Mussolino, C, et al. (2011). Gene Ther 18: 637-645.
Hendrickson, A, and Hicks, D (2002). Experimental eye research 74: 435-444.
Reich, SJ, et al. (2003). Human gene therapy 14: 37-44.
Koo, T, et al., (2014). Human gene therapy 25: 98-108.
Walters, RW, Bradrick, SS, and Gromeier, M (2010). Rna 16: 239-250.
Ricci, EP, et al.(2011). Nucleic acids research 39: 5215-5231.
Auricchio, et al. (2001). Human molecular genetics 10: 3075-3081.
Gao, G, et al. (2000). Human gene therapy 11: 2079-2091.
Young, JE, et al., (2003). Investigative ophthalmology & visual science 44: 4076-4085.
Doria, M, et al., (2013). Human gene therapy methods 24: 392-398.
Zhang, Y, et al., (2000). Journal of virology 74: 8003-8010.
Drittanti, L, et al., (2000). Gene Ther 7: 924-929.
Gargiulo, S, et al.(2012). ILAR journal / National Research Council, Institute of Laboratory Animal Resources 53: E70-81.
Liang, FQ, et al., (2001). Methods in molecular medicine 47: 125-139.
Beltran, et al. (2012) Proc. Natl. Acad. Sci. U. S. A., 109, 2132-2137.
Boye, S.E., et al.(2012) Hum. Gene Ther., 23, 1101-1115.
Khani, S.C., et al., (2007) Invest. Ophthalmol. Vis. Sci., 48, 3954-3961.
Chandler, M.J., et al., (1999) Vet. Ophthalmol., 2, 179-184.
Li, A., Zhu, X. and Craft, C.M. (2002) Invest. Ophthalmol. Vis. Sci., 43, 1375-1383.
Allocca, M., et al. (2008) J. Clin. Invest., 118, 1955-1964.
Parish, C.A., et al., (1998) Proc. Natl. Acad. Sci. U. S. A., 95, 14609-14613.
Ben-Shabat, S., et al., (2002) J. Biol. Chem., 277, 7183-7190.
Gargiulo, S., et al., (2012) ILAR J, 53, E70-81.
Liang, F.Q., et al., (2001) Methods Mol. Med., 47, 125-139.
Gargiulo, A., et al. (2009) Mol. Ther., 17, 1347-1354.
Manfredi, A., et al.(2013) Hum. Gene Ther., 24, 982-992.
Venables VN and Ripley BD. (2002) Modern Applied Statistics with S. Springer Science+Business Media, New York, USA.
Li, A., Zhu, X., Brown, B. and Craft, C.M. (2003) Adv. Exp. Med. Biol., 533, 361-368.
Li, A., et al. (2003) Invest. Ophthalmol. Vis. Sci., 44, 996-1007.
Allocca, M., et al. (2011) Invest. Ophthalmol. Vis. Sci., 52, 5713-5719.
Testa, F., et al.(2011) Invest. Ophthalmol. Vis. Sci., 52, 5618-5624.
Molday, L.L., Rabin, A.R. and Molday, R.S. (2000) Nat. Genet., 25, 257-258.
Sparrow, J.R., Wu, Y., Nagasaki, T., Yoon, K.D., Yamamoto, K. and Zhou, J. (2010) Photochem Photobiol Sci, 9, 1480-1489.
Sparrow, J.R. and Duncker, T. (2014) J Clin Med, 3, 1302-1321.
Finnemann, S.C., Leung, L.W. and Rodriguez-Boulan, E. (2002) Proc. Natl. Acad. Sci. U. S. A., 99, 3842-3847.
Secondi, R., Kong, J., Blonska, A.M., Staurenghi, G. and Sparrow, J.R. (2012) Invest. Ophthalmol. Vis. Sci., 53, 5190-5197.
Delori, F.C., Dorey, C.K., Staurenghi, G., Arend, O., Goger, D.G. and Weiter, J.J. (1995) Invest. Ophthalmol. Vis. Sci., 36, 718-729.
본 발명은 효과적인 유전자 치료법을 가능하게 하는, 상세하게는 5 Kb 초과의 유전자로 된 구축물, 벡터, 관련 숙주 세포 및 약제학적 조성물에 관한 것이다.
큰 유전자들은 특히 하기의 유전자들을 포함한다:
스타르가르트 질병(STGD1; MIM#248200)은 광수용기-특이적인 모든-트랜스 망막 전달체를 인코딩하는 ABCA4(CDS: 6822 bp)에서의 돌연변이에 의해 유발되는 유전성 황반 변성의 가장 흔한 형태이다8, 9. 추상체-간상체 이영양증(cone-rod dystrophy) 타입 3, 노란점 안저(fundus flavimaculatus), 연령-관련 황반 변성 타입 2, 조기 발병 중증 망막 이영양증(early-onset severe retinal dystrophy) 및 색소성 망막염(retinitis pigmentosa) 타입 19 또한, ABCA4 돌연변이(ABCA4-연관 질병)와 연관이 있다. 어셔 증후군 타입 IB(USH1B; MIM#276900)는 MYO7A(CDS: 6648 bp)에서의 돌연변이에 의해 유발되는 색소성 망막염과 난청의 가장 중증의 조합된 형태이며10, 이 MYO7A는 망막 내의 PR 및 RPE 둘 다에서 발현되는 액틴-기반 모터(actin-based motor)를 인코딩한다11-13.
더욱이, 망막 증상을 필연적으로 유발하지 않는 많은 다른 유전성 질병들은 큰 유전자에서의 돌연변이로 인한 것이다. 이들은 특히, DMD에서의 돌연변이로 인한 뒤시엔느 근이영양증(Duchenne muscular dystrophy), CFTR에서의 돌연변이로 인한 낭포성 섬유증, F8에서의 돌연변이로 인한 혈우병 A, 및 DYSF 유전자에서의 돌연변이로 인한 디스페린병증(dysferlinopathy)을 포함한다.
특히, 본 발명은 다중 벡터 시스템, 바람직하게는 다중 바이러스 벡터 시스템과 연관된 절단된 단백질 생성물의 발현을, 상기 단백질의 분해를 매개하거나 이의 번역을 방지하는 신호(이하, 분해 신호)를 사용함으로써 감소시키는 것을 목적으로 한다. 분해 신호는 다중 바이러스 벡터의 맥락에서는 전혀 사용된 적이 없다. 본 발명에서 놀랍게도, 분해 신호가 다중 벡터 시스템의 적어도 하나의 벡터에 존재하는 경우, 절단된 형태의 단백질의 발현이 상당히 감소하여, 전장 단백질의 수율이 더 높아짐을 발견하였다.
따라서, 제1 양태에서, 본 발명은 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템을 제공하며,
상기 코딩 서열은 제1 부분 및 제2 부분을 포함하고,
상기 벡터 시스템은
a) - 상기 코딩 서열의 상기 제1 부분(CDS1), 및
- 제1 재구축 서열(reconstitution sequence)
을 포함하는 제1 벡터; 및
b) - 상기 코딩 서열의 상기 제2 부분(CDS2), 및
- 제2 재구축 서열
을 포함하는 제2 벡터
를 포함하며,
상기 제1 재구축 서열 및 상기 제2 재구축 서열은
i] 제1 재구축 서열은 코딩 서열의 상기 제1 부분의 3' 말단으로 구성되고, 제2 재구축 서열은 코딩 서열의 상기 제2 부분의 5' 말단으로 구성되며, 상기 제1 재구축 서열 및 상기 제2 재구축 서열은 오버래핑 서열임; 또는
ii] 제1 재구축 서열은 스플라이싱 공여자 신호(SD; donor signal)를 포함하고, 제2 재구축 서열은 스플라이싱 수여자 신호(SA; acceptor signal)를 포함하며, 선택적으로 제1 재구축 서열 및 제2 재구축 서열 중 각각의 하나는 재조합유전성(recombinogenic) 서열을 더 포함함
으로 이루어진 군으로부터 선택되고,
제1 벡터 및 제2 벡터 중 하나 또는 둘 다는 분해 신호의 뉴클레오타이드 서열을 더 포함하며, 상기 서열은 i)의 경우, CDS1의 3' 말단 및/또는 CDS2의 5' 말단에 위치하고, ii)의 경우, SD에 대하여 3' 위치 및/또는 SA에 대하여 5' 위치에 위치한다는 사실을 특징으로 한다.
바람직하게는, 제1 벡터 및 제2 벡터는 둘 다 분해 신호의 상기 뉴클레오타이드 서열을 더 포함하며, 여기서, 제1 벡터 내 분해 신호의 뉴클레오타이드 서열은 제2 벡터 내 분해 신호의 뉴클레오타이드 서열과 동일하거나 상이하다.
바람직하게는, 제1 재구축 서열은 스플라이싱 공여자 신호(SD) 및 상기 SD에 대하여 3' 위치에 재조합유전성 영역을 포함하며, 제2 재구축 서열은 스플라이싱 수여자 신호(SA), 및 상기 SA에 대하여 5' 위치에 재조합유전성 서열을 포함하고; 분해 신호의 상기 뉴클레오타이드 서열은 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 및/또는 3' 말단에 위치한다.
바람직하게는, 분해 신호의 뉴클레오타이드 서열은 하나 이상의 단백질 유비퀴틴화 신호, 하나 이상의 마이크로RNA 표적 서열 및/또는 하나 이상의 인공 정지 코돈으로부터 선택된다.
바람직하게는, 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1, CL2 서열 번호 2, CL6 서열 번호 3, CL9 서열 번호 4, CL10 서열 번호 5, CL11 서열 번호 6, CL12 서열 번호 7, CL15 서열 번호 8, CL16 서열 번호 9, SL17 서열 번호 10 또는 PB29(서열 번호 14 또는 서열 번호 15)로부터 선택되는 서열을 인코딩하는 서열을 포함하거나 이로 구성되거나; 또는 여기서, 분해 신호의 뉴클레오타이드 서열은 miR-204 서열 번호 11, miR-124 서열 번호 12 또는 miR-26a 서열 번호 13으로부터 선택되는 서열을 포함하거나 이로 구성된다.
바람직하게는, 제1 벡터의 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 이로 구성되거나, 또는 miR-204 서열 번호 11 및 miR-124 서열 번호 12를 포함하거나 이로 구성되며, 바람직하게는 miR 204 서열 번호 11의 3개 복사체 및 miR 124 서열 번호 12의 3개 복사체를 포함하거나, 또는 miR-26a 서열 번호 13을 포함하거나 이로 구성되며, 바람직하게는 miR-26a 서열 번호 13의 4개 복사체를 포함한다.
바람직하게는, 제2 벡터의 분해 신호의 뉴클레오타이드 서열은 PB29를 인코딩하는 서열(서열 번호 14 또는 서열 번호 15)을 포함하거나 이로 구성되거나, 또는 서열 번호 19 또는 서열 번호 20을 포함하거나 이로 구성되며, 바람직하게는, 제2 벡터의 분해 신호는 서열 번호 14 또는 서열 번호 15의 PB29의 3개 복사체를 인코딩하는 서열을 포함하거나 이로 구성된다.
바람직하게는, 제1 벡터는 코딩 서열의 상기 제1 부분(CDS1)의 5' 말단 부분에 작동적으로 연결된 프로모터 서열을 더 포함한다.
바람직하게는 제1 벡터 및 제2 벡터는 둘 다 5'-말단 반복부(5'-TR) 뉴클레오타이드 서열 및 3'-말단 반복부(3'-TR) 뉴클레오타이드 서열을 더 포함하며, 바람직하게는 5'-TR은 5'-반전 말단 반복부(5'-ITR) 뉴클레오타이드 서열이고 3'-TR은 3'-반전 말단 반복부(3'-ITR) 뉴클레오타이드 서열이며, 바람직하게는 ITR은 동일한 바이러스 혈청형 또는 상이한 바이러스 혈청형으로부터 유래되며, 바람직하게는 바이러스는 AAV이다.
바람직하게는, 재조합유전성 서열은: AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택된다.
바람직하게는, 코딩 서열은 천연 엑손-엑손 연접(junction)에서 제1 부분 및 제2 부분으로 분할된다.
바람직하게는, 스플라이싱 공여자 신호는 GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAGAAGACTCTTGCGTTTCT(서열 번호 27)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 본질적으로 구성된다.
바람직하게는, 스플라이싱 수여자 신호는 GATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(서열 번호 28)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 본질적으로 구성된다.
바람직하게는, 제1 벡터는 코딩 서열에 작동적으로 연결된 적어도 하나의 인핸서 뉴클레오타이드 서열을 더 포함한다.
바람직하게는, 코딩 서열은 망막 변성을 교정(correct)할 수 있는 단백질을 인코딩한다.
바람직하게는, 코딩 서열은 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증을 교정할 수 있는 단백질을 인코딩한다.
망막 분해의 경우, 바람직하게는, 코딩 서열은 ABCA4, MYO7A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1로 이루어진 군으로부터 선택되는 유전자의 코딩 서열이다.
뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 경우, 바람직하게는, 코딩 서열은 DMD, CFTR, F8 및 DYSF로 이루어진 군으로부터 선택되는 유전자의 코딩 서열이다.
바람직하게는, 제1 벡터는 폴리아데닐화 신호 뉴클레오타이드 서열을 포함하지 않는다.
바람직하게는, 벡터 시스템은
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 5' 말단 부분(CDS1)으로서, 상기 5' 말단 부분은 상기 프로모터에 작동적으로 연결되어 있고 이의 조절 하에 있음;
- 스플라이싱 공여자 신호의 뉴클레오타이드 서열;
- 재조합유전성 영역의 뉴클레오타이드 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터; 및
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 뉴클레오타이드 서열;
- 스플라이싱 수여자 신호의 뉴클레오타이드 서열;
- 코딩 서열의 3' 말단(CDS2);
- 폴리아데닐화 신호 뉴클레오타이드 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터
를 포함하고,
분해 신호의 뉴클레오타이드 서열을 더 포함하며, 상기 서열은 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 또는 3' 말단에 위치하는 것을 특징으로 한다.
바람직하게는 본 발명의 벡터에서, 상기 제1 벡터 및 제2 벡터는 독립적으로 바이러스 벡터, 바람직하게는 아데노 바이러스 벡터 또는 아데노-연관 바이러스(AAV) 벡터이며, 바람직하게는 상기 제1 및 제2 아데노-연관 바이러스(AAV) 벡터는 동일하거나 상이한 AAV 혈청형으로부터 선택되고, 바람직하게는 아데노-연관 바이러스는 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9로부터 선택된다.
바람직하게는, 본 발명의 벡터 시스템은 상기 코딩 서열의 제3 부분(CDS3) 및 재구축 서열을 포함하는 제3 벡터를 더 포함하며, 여기서, 제2 벡터는 2개의 재구축 서열을 포함하고, 각각의 재구축 서열은 CDS2의 각각의 말단에 위치한다.
바람직하게는, 제1 벡터의 재구축 서열은 CDS1의 3' 말단으로 구성되며, 제2 벡터의 2개의 재구축 서열은 각각 CDS2의 5' 말단 및 3' 말단으로 제각기 구성되고, 제3 벡터의 재구축 서열은 CDS3의 5' 말단으로 구성되며;
제1 벡터의 상기 재구축 서열, 및 CDS2의 5' 말단으로 구성된 제2 벡터의 상기 재구축 서열은 오버래핑 서열이며;,
CDS2의 3' 말단으로 구성된 제2 벡터의 상기 재구축 서열 및 상기 제3 벡터의 상기 재구축 서열은 오버래핑 서열이고;
상기 제2 벡터는 분해 신호를 더 포함하며, 상기 분해 신호는 CDS2의 5' 말단 및/또는 CDS2의 3' 말단에 위치한다.
바람직하게는, 제3 벡터는 분해 신호의 적어도 하나의 뉴클레오타이드 서열을 더 포함한다.
바람직하게는, 제2 벡터는 상기 코딩 서열(CDS2)의 3' 말단 부분에 연결된 폴리아데닐화 신호 뉴클레오타이드 서열을 더 포함한다.
본 발명은 상기 정의된 바와 같은 벡터 시스템에 의해 형질변환된 숙주 세포를 제공한다.
바람직하게는, 본 발명의 벡터 시스템 또는 숙주 세포는 의료용이다. 바람직하게는 유전자 치료법에 사용하기 위한 것이다. 바람직하게는, 망막 변성을 특징으로 하는 병태 또는 질병의 치료 및/또는 예방에 사용하거나, 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 예방 및/또는 치료에 사용하기 위한 것이다.
바람직하게는, 망막 변성은 유전성이다.
바람직하게는, 병태 또는 질병은 색소성 망막염(RP), 레베르 선천성 흑암시(LCA; Leber congenital amaurosis), 스타르가르트 질병(STGD), 어셔 질병(USH), 알스트롬 증후군(Alstrom syndrome), 선천성 비진행 야맹증(CSNB; congenital stationary night blindness), 황반 이영양증(macular dystrophy), 잠복 황반 이영양증(occult macular dystrophy), ABCA4 유전자에서의 돌연변이에 의해 유발된 질병으로 이루어진 군으로부터 선택된다.
본 발명은 상기 정의된 바와 같은 벡터 시스템 또는 숙주 세포 및 약제학적으로 허용가능한 비히클을 포함하는 약제학적 조성물을 제공한다.
본 발명은 유효량의 상기 정의된 바와 같은 벡터 시스템, 숙주 세포 또는 약제학적 조성물을 이를 필요로 하는 대상에게 투여하는 단계를 포함하는, 망막 변성을 특징으로 하는 병태 또는 질병의 치료 및/또는 예방 방법을 제공한다.
본 발명은 유효량의 상기 정의된 바와 같은 벡터 시스템, 숙주 세포 또는 약제학적 조성물을 이를 필요로 하는 대상에게 투여하는 단계를 포함하는, 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 또는 디스페린병증의 치료 및/또는 예방 방법을 제공한다.
본 발명은 절단된 형태의 단백질의 발현을 감소시키기 위한, 벡터 시스템에서의 분해 신호의 뉴클레오타이드 서열의 용도를 제공한다.
본 발명은 벡터 시스템의 하나 이상의 벡터에 분해 신호의 뉴클레오타이드 서열을 삽입하는 단계를 포함하는, 절단된 형태의 단백질의 발현을 감소시키는 방법을 제공한다.
본 발명의 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 2개의 벡터를 포함하고, 각각의 벡터는 상기 코딩 서열의 상이한 부분 및 재구축 서열을 포함하며; 바람직하게는, 제1 벡터의 재구축 서열은 스플라이싱 공여자를 포함하는 서열이며, 한편 제2 벡터의 재구축 서열은 스플라이싱 수여자를 포함하는 서열이다.
본 발명의 다른 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 3개의 벡터를 포함하고, 각각의 벡터는 상기 코딩 서열의 상이한 부분 및 적어도 하나의 재구축 서열을 포함하며; 바람직하게는, 제1 벡터는 코딩 서열의 제1 부분에 대하여 3' 위치에 스플라이싱 공여자를 포함하는 재구축 서열을 포함하며, 제2 벡터는 제2 부분 코딩 서열에 대하여 5' 위치에 스플라이싱 수여자를 포함하는 재구축 서열 및 코딩 서열의 제2 부분에 대하여 3' 위치에 스플라이싱 수여자를 포함하는 재구축 서열을 포함하고, 제3 벡터는 제3 부분 코딩 서열에 대하여 5' 위치에 스플라이싱 수여자를 포함하는 재구축 서열을 포함한다.
바람직하게는, 제1 벡터 및 제2 벡터의 재구축 서열 또는 제1 벡터, 제2 벡터 및 제3 벡터의 재구축 서열은 재조합유전성 영역, 바람직하게는 스플라이싱 공여자에 대하여 3' 위치 및 스플라이싱 수여자에 대하여 5' 위치에 위치한 재조합유전성 영역을 더 포함한다.
본 발명의 벡터 시스템 중 어느 하나의 벡터, 2개의 벡터 또는 모든 벡터는 분해 신호의 뉴클레오타이드 서열을 더 포함한다.
바람직하게는, 제1 벡터는 분해 신호를 포함한다. 바람직하게는, 제2 벡터는 분해 신호를 포함한다.
벡터가 재조합유전성 영역을 포함하는 재구축 서열을 포함하는 본 발명의 바람직한 실시형태에 따르면, 분해 신호는 상기 재조합유전성 영역의 서열의 5' 말단 또는 3' 말단에 위치한다.
본 발명의 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 2개의 벡터를 포함하고; 벡터 시스템의 제1 벡터는 5'-3' 방향으로:
- 관심 유전자의 코딩 서열의 5' 말단 부분,
- 스플라이싱 공여자 신호의 핵산 서열,
- 재조합유전성 영역의 핵산 서열, 및
- 분해 신호의 핵산 서열
을 포함한다.
본 발명의 바람직한 실시형태에 따르면, 세포 내에서 관심 유전자의 코딩 서열을 발현하는 벡터 시스템은 2개의 벡터를 포함하고; 벡터 시스템의 제2 벡터는 5'-3' 방향으로:
- 재조합유전성 영역의 핵산 서열,
- 분해 신호의 핵산 서열,
- 스플라이싱 수여자 신호의 핵산 서열, 및
- 관심 유전자의 코딩 서열의 3' 말단 부분
을 포함한다.
바람직하게는, 본 발명에 따른 벡터 시스템의 제1 벡터는 프로모터 서열을 더 포함하며, 보다 바람직하게는 상기 프로모터 서열은 관심 유전자의 코딩 서열의 제1 부분의 5' 말단에 작동적으로 연결된다.
바람직하게는, 2개의 벡터로 구성된 벡터 시스템의 제2 벡터는 폴리아데닐화 신호 핵산 서열을 더 포함하며, 보다 바람직하게는 상기 폴리아데닐화 신호 핵산 서열은 관심 유전자의 코딩 서열의 제2 부분의 3' 말단에 연결된다. 바람직하게는 본 발명에 따른 벡터 시스템의 제1 벡터는 폴리아데닐화 신호 핵산 서열을 포함하지 않는다.
바람직하게는, 3개의 벡터로 구성된 벡터 시스템의 제3 벡터는 폴리아데닐화 신호 핵산 서열을 더 포함하며, 보다 바람직하게는 상기 폴리아데닐화 신호 핵산 서열은 관심 유전자의 코딩 서열의 제3 부분의 3' 말단에 연결된다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제1 벡터는 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성된 서열의 분해 신호를 포함하며; 바람직하게는, CL1 서열 번호 1을 인코딩하는 상기 서열은 서열 번호 16을 포함하거나 이로 구성된다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제1 벡터는 miR-204 서열 번호 11 및 miR-124 서열 번호 12, 보다 바람직하게는 miR 204 서열 번호 11의 3개의 복사체 및 miR 124 서열 번호 12의 3개의 복사체를 포함하는 서열의 분해 신호를 포함하며; 바람직하게는 miR 204 서열 및 miR 124 서열 및/또는 miR 204 서열의 복사체 및 miR 124 서열의 복사체 각각은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개의 뉴클레오타이드로 된 링커 서열에 의해 연결된다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제1 벡터는 miR-26a 서열 번호 13을 포함하거나 이로 구성된 서열, 보다 바람직하게는 miR-26a 서열 번호 13의 4개의 복사체를 포함하는 서열의 분해 신호를 포함한다.
바람직하게는, 본 발명의 벡터 시스템의 벡터 중 적어도 하나, 보다 바람직하게는 본 발명의 벡터 시스템의 제2 벡터는 PB29를 인코딩하는 서열(서열 번호 14 또는 서열 번호 15)을 포함하거나 이로 구성된 서열의 분해 신호를 포함하며; 바람직하게는 PB29를 인코딩하는 상기 서열은 서열 번호 19 또는 서열 번호 20을 포함하거나 이로 구성되고; 보다 바람직하게는, 서열의 상기 분해 신호는 서열 번호 14 또는 서열 번호 15의 PB29의 3개의 복사체를 인코딩하는 서열을 포함하거나 이로 구성된다.
본 발명의 바람직한 실시형태에 따르면, 벡터 시스템은
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 제1 부분으로서, 바람직하게는 상기 코딩 서열의 5' 말단 부분인 제1 부분이며, 바람직하게는 상기 제1 부분은 상기 프로모터에 작동적으로 연결되고 이의 조절 하에 있는, 제1 부분;
- 스플라이싱 공여자 신호의 핵산 서열;
- 재조합유전성 영역의 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터; 및
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 핵산 서열;
- 스플라이싱 수여자 신호의 핵산 서열;
- 관심 유전자의 코딩 서열의 제2 부분으로서, 바람직하게는 상기 코딩 서열의 3' 말단 부분인, 제2 부분;
- 폴리아데닐화 신호 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터
를 포함하고,
상기 제1 벡터 및/또는 제2 벡터는 분해 신호의 핵산 서열을 더 포함하며, 상기 서열은 재조합유전성 영역의 핵산 서열의 5' 말단 또는 3' 말단에 위치한다.
본 발명의 다른 바람직한 실시형태에 따르면, 벡터 시스템은
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 제1 부분으로서, 바람직하게는 상기 프로모터에 작동적으로 연결되고 이의 조절 하에 있는 제1 부분;
- 스플라이싱 공여자 신호의 핵산 서열;
- 재조합유전성 영역의 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터;
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 핵산 서열;
- 스플라이싱 수여자 신호의 핵산 서열;
- 관심 유전자의 코딩 서열의 제2 부분;
- 스플라이싱 공여자 신호의 핵산 서열;
- 재조합유전성 영역의 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터; 및
c) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 핵산 서열;
- 스플라이싱 수여자 신호의 핵산 서열;
- 관심 유전자의 코딩 서열의 제3 부분;
- 폴리아데닐화 신호 핵산 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제3 벡터
를 포함하고,
상기 제1 벡터 및/또는 제2 벡터 및/또는 제3 벡터는 분해 신호의 핵산 서열을 더 포함하며, 상기 서열은 재조합유전성 영역(들)의 핵산 서열의 5' 말단 또는 3' 말단에 위치한다.
바람직하게는, 병태 또는 질병은 어셔 타입 1F(USH1F), 선천성 비진행 야맹증(CSNB2), 상염색체 우성(ad; autosomal dominant) 및/또는 상염색체 열성(ar; autosomal recessive) 색소성 망막염(RP), USH1B, STGD1, 레베르 선천성 흑암시 타입 10(LCA10), RP, 어셔 타입 1D(USH1D), 어셔 타입 2A(USH2A), 상염색체 우성 황반 이영양증, 어셔 타입 2C(USH2C), 잠복 황반 이영양증, 알스트롬 증후군으로부터 선택된다.
본 발명에서, 벡터 시스템은 구축물 시스템, 플라스미드 시스템 및 또한 바이러스 입자를 의미한다.
본 발명에서, 구축물 또는 벡터 시스템은 2개 초과의 벡터를 포함할 수 있다.
특히, 구축물 시스템은 관심 서열의 제3 부분을 포함하는 제3 벡터를 포함할 수 있다.
본 발명에서, 다양한(2개, 3개 또는 그 이상의) 벡터가 세포에 도입될 때, 전장 코딩 서열이 재구축되거나 수득된다.
코딩 서열은 2개로 분할될 수 있다. 부분들은 길이가 동일하거나 상이할 수 있다. 전장 코딩 서열은 벡터 시스템의 벡터가 세포 내에 도입될 때 수득된다. 제1 부분은 코딩 서열의 5' 말단 부분일 수 있다. 제2 부분은 코딩 서열의 3' 말단일 수 있다. 나아가, 코딩 서열은 3개의 부분으로 분할될 수 있다. 부분들은 길이가 동일하거나 상이할 수 있다. 전장 코딩 서열은 벡터 시스템의 벡터가 세포 내에 도입될 때 수득된다. 제1 부분은 코딩 서열의 5' 부분이며, 제2 부분은 코딩 서열의 중간 부분이고, 제3 부분은 코딩 서열의 3' 부분이다.
본 발명에서, 세포는 바람직하게는 포유류 세포, 바람직하게는 인간 세포이다.
본 발명에서, 벡터들 중 임의의 벡터에 하나의 분해 신호가 존재하는 것으로도, 절단된 형태의 단백질의 생성을 감소시키기에 충분하다.
용어 분해 신호는 (뉴클레오타이드(nucleotidic) 또는 아미노산(amminoacidic)) 서열을 의미하며, 이러한 서열은 그것이 포함된 mRNA/단백질의 분해를 매개할 수 있다.
용어 "절단된 형태의 단백질" 또는 "절단된 단백질"은, 단일 아미노산 내지 많은 아미노산(예를 들어 1개 내지 10개, 1개 내지 20개, 1개 내지 50개, 100개, 200개 등) 범위의 결실을 제시하기 때문에, 이의 전장 형태에서는 생성되지 않는 단백질이다.
본 발명에서, "재구축 서열"은 교정 프레임(correct frame)을 이용한 전장 코딩 서열의 재구축을 가능하게 하여, 따라서 기능성 단백질의 발현을 가능하게 하는 서열이다.
용어 "스플라이싱 공여자/수여자 신호"는 mRNA의 스플라이싱에 관여하는 뉴클레오타이드 서열을 의미한다.
본 발명에서, 임의의 인트론으로부터의 임의의 스플라이싱 공여자 또는 수여자 신호 서열이 사용될 수 있다. 당업자는, 일상적인 실험에 의해 적절한 스플라이싱 공여자 또는 수여자 신호 서열을 인지하고 선택하는 방법을 알고 있다.
본 발명에서, 2개의 서열들은 상기 각각의 서열의 적어도 일부가 서로 상동성인 경우 오버래핑되고 있다. 서열은 적어도 1개, 적어도 2개, 적어도 5개, 적어도 10개, 적어도 20개, 적어도 50개, 적어도 100개, 적어도 200개 뉴클레오타이드에 대해 오버래핑될 수 있다.
용어 "재조합유전성 영역 또는 서열"은 2개의 상이한 서열들 사이에서 재조합을 매개하는 서열을 의미한다. "재조합유전성 영역 또는 서열" 및 "상동성 영역"은 본원에서 상호호환적으로 사용된다.
용어 "말단 반복부"는 뉴클레오타이드 서열의 양쪽 말단에서 반복되는 서열을 의미한다.
용어 "반전 말단 반복부"는 반대되는 배향에서(역 상보적인) 뉴클레오타이드 서열의 양쪽 말단에서 반복되는 서열을 의미한다.
단백질 유비퀴틴화 신호는 프로테아좀에 의한 단백질 분해를 매개하는 신호이다.
본 발명에서, 분해 신호가 반복된 서열을 포함하며 이러한 반복된 서열이 동일한 서열 또는 상이한 서열인 경우, 상기 반복된 서열들은 바람직하게는 적어도 1개의 뉴클레오타이드로 된 링커에 의해 연결된다.
인공 정지 코돈은 단백질 번역의 조기 종료를 유도하기 위해 전사체에 의도적으로 포함되는 뉴클레오타이드 서열이다.
인핸서 서열은 유전자 전사를 증가시키는 서열이다.
본 발명에 따르면, 적합한 분해 신호는: (i) 짧은 데그론(degron) CL1로서, 잘못 접혀진(misfolded) 단백질과 구조적 유사성을 공유하며 따라서 유비퀴틴화 시스템에 의해 인지되는 C-말단 불안정화 펩타이드인, 짧은 데그론 CL131, 32, (ii) 유비퀴틴으로서, 공여자 단백질의 N-말단에서의 이의 융합이 직접 단백질 분해 또는 N-말단 규칙 경로를 통한 분해를 둘 다 매개하는, 유비퀴틴33 , 34 및 (iii) N-말단 PB29 데그론으로서, 9개 아미노산 길이의 펩타이드이며, CL1 데그론과 유사하게 유비퀴틴화 경로의 효소에 의해 인지되는 구조로 접히는 것으로 예측되는, N-말단 PB29 데그론35을 포함한다. 본 발명자들은, 다중 벡터 시스템에 분해 서열 또는 신호를 포함시키면 절단된 단백질의 발현을 경감시킴을 발견하였다. 일 경우에서, 본 발명자들은, CL1 분해 신호의 포함이, 시험관내 및 큰 돼지 망막 둘 다에서 전장 단백질 생성에 영향을 미치지 않으면서도 절단된 단백질을 5'-하프로부터 선택적으로 분해시킴을 발견하였다.
부가적으로는, 인공 정지 코돈이 삽입되어, mRNA의 조기 종료를 유발할 수 있다.
마이크로RNA(miR) 표적 서열, 인공 정지 코돈 또는 단백질 유비퀴틴화 신호는 절단된 단백질 생성물의 분해를 매개하기 위해 이용될 수 있다. 본 발명에서, 분해 신호 서열은 반복된 서열, 예컨대 1개 초과의 마이크로RNA(miR) 표적 서열, 인공 정지 코돈 또는 단백질 유비퀴틴화 신호를 포함할 수 있으며, 상기 반복된 서열은 동일한 서열 또는 상이한 서열로서 적어도 2회 반복되고; 바람직하게는, 반복된 서열들은 적어도 1개의 뉴클레오타이드로 된 링커에 의해 연결된다.
망막에서 발현되는 miR 중에서, miR-let7b 또는 miR-26a는 높은 수준으로 발현되는 한편26 -29, miR-204 및 miR-124는 AAV-매개 이식유전자 발현을 RPE 또는 광수용기로 제한하는 것으로 나타났다30. Karali 등30은, 특정 세포 타입에서 단일 AAV 벡터에 포함된 유전자의 발현을 조정하는 데 있어서 miR 표적 부위의 효능을 시험하였다. Karali 등에서, miR 표적 부위를 표준(canonical) 발현 카세트(전체 리포터 유전자를 코딩함)에서, 코딩 서열의 다운스트림 및 폴리아데닐화 신호(polyA) 앞에 포함시켰다. Karali 등은 miR-204 또는 miR-124에 대한 miR 표적 부위를 사용하였고, 각각의 miR의 4개의 탠덤(tandem) 복사체를 사용하였다.
본 발명에서, miR은 또한 miR 모방체일 수 있다(문헌[Xiao, et al. J Cell Physiol 212:285-292, 2007]; [Wang Z Methods Mol Biol 676:211-223, 2011]). 처음에, 발명자들은 이들 전략을 다중 벡터 구축물에 적용하였고, 이러한 벡터로부터 생성된 절단된 단백질의 발현을 침묵시킬 수 있었다.
지난 10년 동안, 유전자 치료법은 수백 가지의 임상 시험에서 질병의 치료에 적용되어 왔다. 유전자를 인간 세포 내에 전달하기 위해 다양한 툴들이 개발되어 왔다. 본 발명에서, 전달 비히클이 환자에게 투여될 수 있다. 당업자는 적절한 투여 범위를 결정할 수 있을 것이다. 용어 "투여되는"은 바이러스 또는 비-바이러스 기술에 의한 전달을 포함한다. 비-바이러스 전달 메커니즘으로는, 지질 매개 형질감염, 리포좀, 면역리포좀, 리포펙신, 양이온성 면상 양친매성 물질(CFA; cationic facial amphiphile) 및 이들의 조합 등이 있으나, 이들로 한정되는 것은 아니다. 바이러스 전달 중에서, 아데노-연관 바이러스를 포함한 유전자 조작된 바이러스가 현재 유전자 전달에 있어서 가장 인기있는 툴 중의 하나이다. 바이러스-기반 유전자 전달의 개념은, 바이러스가 관심 유전자(들) 또는 프로모터 및 인트론과 같은 조절 서열을 발현시킬 수 있도록 이러한 바이러스를 조작하는 것이다. 바이러스의 특정 적용 및 타입에 따라, 대부분의 바이러스 벡터들은, 숙주에서 야생형 바이러스로서 자유롭게 복제하는 이들의 능력을 방해하는 돌연변이를 함유한다. 몇몇 상이한 과(family) 유래의 바이러스들은 유전자 전달용 바이러스 벡터를 생성하기 위해 변형되어 왔다. 이들 바이러스로는, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 헤르페스 바이러스, 바큘로바이러스, 피코르나바이러스 및 알파바이러스 등이 있다. 본 발명은 바람직하게는 아데노-연관 바이러스를 이용한다. 대부분의 시스템은, 관심 유전자를 수용할 수 있는 벡터, 및 벡터-함유 감염성 바이러스 입자의 생성을 허용하기 위해 바이러스 구조 단백질 및 효소를 제공할 수 있는 헬퍼 세포를 함유한다. 아데노-연관 바이러스는, 뉴클레오타이드 및 아미노산 서열, 게놈 구조, 병원성(pathogenicity) 및 숙주 범위가 상이한 바이러스 과이다. 이러한 다양성은 상이한 치료적 적용을 개발하기 위해, 상이한 생물학적 특징을 가진 바이러스를 사용하는 기회를 제공한다. 임의의 전달 툴을 이용하는 데 있어서, 효율, 소정의 조직 또는 세포 타입을 표적화하는 능력, 관심 유전자의 발현, 및 아데노-연관 바이러스-기반 시스템의 안전성이 유전자 치료법의 성공적인 적용에 중요하다. 최근 수년간 이들 연구 영역에 상당한 노력이 쏟아져 왔다. 유전자 발현을 변경하며, 전달을 표적화하며, 바이러스 역가를 향상시키고, 안전성을 높이기 위해 아데노-연관 바이러스-기반 벡터 및 헬퍼 세포에 다양한 변형들이 이루어져 왔다. 본 발명은 관심 유전자를 이러한 바이러스 벡터 내에 효율적으로 전달하는 작용을 한다는 점에서 이러한 디자인 공정의 향상을 나타낸다.
유전자 전달에 이상적인 아데노-연관 바이러스-기반 벡터는 효율적이며, 세포-특이적이며, 조절되고, 안전해야 한다. 전달 효율은 치료법의 효능을 결정할 수 있기 때문에 중요하다. 현재의 노력은 아데노-연관 바이러스 벡터를 이용하여 세포-타입-특이적인 감염 및 유전자 발현을 달성하는 것을 목적으로 한다. 또한, 아데노-연관 바이러스 벡터는, 이러한 치료법이 장기-지속적인 발현 또는 조절된 발현을 필요로 할 수 있기 때문에, 관심 유전자의 발현을 조절하도록 개발되고 있다. 안전성은, 대부분의 바이러스가 병원체이거나 병원성 잠재성을 가지기 때문에, 바이러스 유전자 전달을 위한 주요 쟁점이다. 유전자 전달 동안, 완전한 복제 잠재성을 가진 병원성 바이러스가 또한 환자에게 부주의하게 수여되지 않도록 하는 것이 중요하다.
아데노 -연관 바이러스( AAV )는 인간 및 일부 다른 영장류 종을 감염시키는 작은 바이러스이다. 현재로서는 AAV는 질병을 유발하는 것으로 알려져 있지 않고, 결과적으로 상기 바이러스는 매우 약한 면역 반응을 야기한다. AAV를 사용한 유전자 치료 벡터는 분열중인 세포 및 휴지기 세포를 둘 다 감염시키고, 숙주 세포의 게놈 내에 통합되지 않은 채 염색체외 상태로 지속될 수 있다. 이러한 특징 덕분에, AAV는 유전자 치료용 바이러스 벡터의 제작 및 동종동계(isogenic) 인간 질병 모델의 제작을 위한 매우 매력적인 후보물질이 된다.
야생형 AAV는 다수의 특징들로 인해 유전자 치료법 연구자들로부터 상당한 관심을 끌었다. 이들 중 주된 특징은 상기 바이러스가 명백하게 병원성을 갖지 않는다는 점이다. 상기 바이러스는 또한, 비-분열중인 세포를 감염시킬 수 있고, 인간 염색체 19 내의 특정 부위(AAVS1로 지정됨)에서 숙주 세포 게놈 내로 안정하게 통합되는 능력을 가진다. 이러한 특징은 상기 바이러스를 레트로바이러스보다 다소 더 예측 가능하게 만들며, 상기 레트로바이러스는 무작위 삽입 및 돌연변이생성 위험을 나타내며 이로 인해 가끔은 암 발병이 후속된다. AAV 게놈은 언급된 부위 내로 가장 빈번하게 통합되며, 한편 게놈 내로의 무작위 혼입은 무시할 만한 빈도로 발생한다. 그러나, 유전자 치료 벡터로서의 AAV의 개발은 이 벡터의 DNA로부터 rep 및 cap를 제거함으로써 이러한 통합 능력을 없앴다. 단일-가닥 벡터 DNA를 숙주 세포 DNA 폴리머라제 복합체에 의해 이중-가닥 DNA로 전환한 후, 요망되는 유전자와 이러한 유전자의 전사를 유도하기 위한 프로모터가 함께, 핵에서 콘카타머(concatamer) 형성에 일조하는 ITR들 사이에 삽입된다. AAV-기반 유전자 치료 벡터는 숙주 세포 핵에서 에피솜(episomal) 콘카타머를 형성한다. 비-분열중인 세포에서, 이들 콘카타머는 숙주 세포의 일생 동안 온전한 채 유지된다. 분열중인 세포에서, AAV DNA는, 에피솜 DNA가 숙주 세포 DNA를 따라 복제되지 않기 때문에 세포 분열 동안 상실된다. 숙주 게놈 내로의 AAV DNA의 무작위 통합은 검출 가능하지만, 매우 낮은 빈도로 발생한다. AAV는 또한, 외견상 중화 항체의 생성으로 제한된 매우 낮은 면역원성을 나타내는 한편, 이들 AAV는 명확하게 정의된 세포독성 반응을 유도하지 않는다. 휴지기 세포를 감염시키는 능력과 함께 이러한 특징은 인간 유전자 치료용 벡터로서 아데노바이러스를 능가하는 우세를 보여준다.
AAV
게놈,
전사체
및 프로테옴(
proteome
)
AAV 게놈은 포지티브-센스 또는 네거티브-센스인 단일-가닥 데옥시리보핵산(ssDNA)으로 제작되며, 길이가 약 4.7 킬로베이스이다. 상기 게놈은 DNA 가닥의 양쪽 말단에 반전 말단 반복부(ITR) 및 2개의 개방형 해독틀(ORF; open reading frame): rep 및 cap를 포함한다. rep는 AAV 생활 주기에 필요한 Rep 단백질을 인코딩하는 4개의 오버래핑 유전자로 구성되고, cap는 캡시드 단백질: VP1, VP2 및 VP3의 오버래핑 뉴클레오타이드 서열을 함유하고, 이러한 캡시드 단백질들은 함께 상호작용하여 정20면체 대칭의 캡시드를 형성한다.
ITR 서열
반전 말단 반복부(ITR) 서열들은 이들의 대칭성 때문에 이러한 명칭이 부여되었으며, 상기 서열은 AAV 게놈의 효율적인 증식에 필요한 것으로 나타났다. 이들 서열의 또 다른 특성은 헤어핀(hairpin)을 형성하는 능력으로서, 이러한 헤어핀은 제2 DNA 가닥의 프리마제(primase)-독립적인 합성을 허용하는 소위 자가-프라이밍에 기여한다. ITR은 또한, 숙주 세포 게놈(인간에서는 19번째 염색체) 내로의 AAV DNA의 통합 및 이로부터의 구출, 뿐만 아니라 완전히 어셈블리된 데옥시리보뉴클레아제-내성 AAV 입자의 생성과 조합된 AAV DNA의 효율적인 캡시드화(encapsidation) 둘 다에 필요한 것으로 나타났다.
유전자 치료법과 관련하여, ITR은 치료 유전자의 옆에서 인 시스(in cis)로 필요한 유일한 서열인 것으로 보이며: 구조 유전자(cap) 및 패키징 유전자(rep)는 인 트랜스(in trans)로 전달될 수 있다. 이러한 가정 하에, 리포터 또는 치료 유전자를 함유하는 재조합 AAV(rAAV) 벡터의 효율적인 생성을 위해 많은 방법들이 구축되었다. 그러나, ITR이 효과적인 복제 및 캡시드화를 위해 인 시스로 필요한 유일한 요소가 아니라는 것 또한 공개되었다. 몇몇 연구 그룹들은, rep 유전자의 코딩 서열 내에서 시스-작용 Rep-의존적 요소(CARE; cis-acting Rep-dependent element)로 지정된 서열을 동정하였다. CARE는 인 시스로 존재 시, 복제 및 캡시드화를 증가시키는 것으로 나타났다.
2006년에, 11개의 AAV 혈청형이 보고된 바 있으며, 11번째는 2004년에 보고되었다. 공지된 혈청형들은 모두 다수의 다양한 조직 타입들 유래의 세포를 감염시킬 수 있다. 조직 특이성은 캡시드 혈청형에 의해 결정되고, 향성(tropism) 범위를 변경하기 위한 AAV 벡터의 슈도타이핑(pseudotyping)은 치료법에서 이러한 벡터를 사용하는 데 있어서 중요할 것으로 예상된다.
본 발명의 AAV 벡터 시스템에 사용되는 반전 말단 반복부(ITR) 서열은 임의의 AAV ITR일 수 있다. AAV 벡터에 사용되는 ITR은 동일하거나 상이할 수 있다. 예를 들어, 벡터는 AAV 혈청형 2의 ITR 및 AAV 혈청형 5의 ITR을 포함할 수 있다. 본 발명의 벡터의 일 실시형태에서, ITR은 AAV 혈청형 2, 4, 5 또는 8로부터 유래한다. 본 발명에서, AVV 혈청형 2 및 AVV 혈청형 5의 ITR이 바람직하다. AAV ITR 서열은 당업계에 잘 알려져 있다(예를 들어, ITR2에 대해서는, GenBank 수탁 번호 AF043303.1; NC_001401.2; J01901.1; JN898962.1을 참조하고; ITR5에 대해서는, GenBank 수탁 번호 NC_006152.1을 참조함).
혈청형
2
혈청형 2(AAV2)는 현재까지 가장 광범위하게 연구되어 왔다. AAV2는 골격근, 뉴런, 혈관의 평활근 세포 및 간세포에 대한 자연적인 향성을 제시한다.
AAV2에 대해 3개의 세포 수용체: 헤파란 설페이트 프로테오글리칸(HSPG), aVβ5 인테그린 및 섬유아세포 성장 인자 수용체 1(FGFR-1)이 보고되어 있다. HSPG는 1차 수용체로서 작용을 하는 한편, 후자의 2개는 공동-수용체 활성을 가지고 수용체-매개 엔도사이토시스(endocytosis)에 의해 AAV가 세포 안으로 들어가게 할 수 있다. 이들 연구 결과에 대해 Qiu, Handa 등이 반박을 하였다. HSPG가 1차 수용체로서 작용을 하지만, 세포외 기질에서의 이의 풍부도(abundance)는 AAV 입자를 스캐빈지(scavenge)하고 감염 효율을 약화시킬 수 있다.
혈청형
2 및 암
연구들에서, 혈청형 2 바이러스(AAV-2)가 건강한 세포에 해를 주지 않으면서 암세포를 명백하게 살해한다고 나타났다. 펜실베니아 펜 스테이트(Penn State) 의과 대학의 면역학 및 미생물학 교수인 크레이그 마이어(Craig Meyers)는 "우리의 연구 결과는, 대부분의 집단을 감염시키지만 공지된 유해 효과(ill effect)는 없는 아데노-연관 바이러스 타입 2가 다수의 타입의 암세포를 살해하지만 건강한 세포에는 아무런 영향이 없음을 제시한다"고 언급하였다.
다른 혈청형들
AAV2가 다양한 AAV-기반 연구에서 가장 인기있는 혈청형이긴 하지만, 다른 혈청형이 유전자 전달 벡터로서 더 효과적일 수 있는 것으로 나타났다. 예를 들어, AAV6은 기도 상피 세포를 감염시키는 데 있어 훨씬 더 양호한 것으로 보이며, AAV7은 (AAV1 및 AAV5와 유사하게) 뮤린 골격근 세포의 매우 높은 형질도입 속도를 제시하며, AAV8은 간세포 및 광수용기에 형질도입하는 데 우수하고, AAV1 및 AAV5는 혈관 내피 세포로의 유전자 전달에 매우 효율적인 것으로 나타났다. 뇌에서, 대부분의 AAV 혈청형이 뉴런 향성을 보이는 한편, AAV5는 성상세포에도 형질도입된다. AAV1과 AAV2의 하이브리드인 AAV6은 또한, AAV2보다 더 낮은 면역원성을 나타낸다.
혈청형은 이들이 결합하는 수용체에 따라 상이할 수 있다. 예를 들어 AAV4 및 AAV5 형질도입은 (이들 각각의 혈청형에 대한 상이한 형태의) 용해성 시알산에 의해 저해될 수 있고, AAV5는 혈소판-유래 성장 인자 수용체를 통해 세포 안으로 들어가는 것으로 나타났다.
본 발명은 또한, 본 발명의 폴리뉴클레오타이드, 발현 구축물 또는 벡터 구축물을 포함하는 바이러스 벡터 시스템에 관한 것이다. 일 실시형태에서, 바이러스 벡터 시스템은 AAV 시스템이다. 이종성 폴리뉴클레오타이드 또는 구축물을 포함하는 바이러스 및 비리온의 제조 방법은 당업계에 알려져 있다. AAV의 경우, 세포는 AAV 헬퍼 기능에 적합한 아데노바이러스, 또는 아데노바이러스 유전자를 포함하는 폴리뉴클레오타이드 구축물을 이용하여 공동감염되거나 형질감염될 수 있다. 물질 및 방법의 예는 예를 들어, 미국 특허 8,137,962 및 6,967,018에 기재되어 있다. 본 발명의 AAV 바이러스 또는 AAV 벡터는 비제한적으로 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11을 포함한 임의의 AAV 혈청형일 수 있다. 구체적인 실시형태에서, AAV2, AAV5, AAV7, AAV8 또는 AAV9 혈청형이 이용된다. 일 실시형태에서, AAV 혈청형은 캡시드 표면 상에서 하나 이상의 티로신에서 페닐알라닌(Y-F) 돌연변이를 제공한다. 구체적인 실시형태에서, AAV는 위치 733에서 티로신에서 페닐알라닌 돌연변이(Y733F)를 가진 AAV8 혈청형이다.
본 발명에 따른 벡터 시스템에 의한 하나 이상의 치료 유전자 또는 조절 서열, 예컨대 프로모터 또는 인트론의 전달은 단독으로 사용되거나, 다른 치료 또는 치료의 구성성분과 조합하여 사용될 수 있다.
본 발명은 또한, 본 발명의 구축물 시스템 또는 바이러스 벡터 시스템을 포함하는 숙주 세포에 관한 것이다. 숙주 세포는 배양된 세포 또는 원발성 세포, 즉 유기체, 예를 들어 인간으로부터 직접 단리된 세포일 수 있다. 숙주 세포는 부착성 세포 또는 현탁성 세포, 즉 현탁액 내에서 성장하는 세포일 수 있다. 적합한 숙주 세포는 당업계에 알려져 있으며, 그 예로는 DH5α, 이. 콜라이(E. coli) 세포, 차이니즈 햄스터 난소 세포, 원숭이 VERO 세포, COS 세포, HEK293 세포 등이 있다. 세포는 인간 세포 또는 또 다른 동물 유래일 수 있다. 일 실시형태에서, 세포는 광수용기 세포 또는 RPE 세포이다. 구체적인 실시형태에서, 세포는 추상 세포이다. 세포는 또한, 근육 세포, 특히 골격근 세포, 폐 세포, 췌장 세포, 간 세포, 신장 세포, 장 세포, 혈액 세포일 수 있다. 구체적인 실시형태에서, 세포는 인간 추상 세포 또는 간상 세포이다. 적절한 숙주의 선택은 본원 교시로부터 당업자의 재량 내에 있는 것으로 생각된다. 바람직하게는, 상기 숙주 세포는 동물 세포, 가장 바람직하게는 인간 세포이다. 세포는 본 발명의 바이러스 벡터 시스템에 제공된 뉴클레오타이드 서열을 발현할 수 있다.
당업자는 폴리뉴클레오타이드 또는 벡터를 숙주 세포 내에 혼입시키는 표준 방법, 예를 들어 형질감염, 리포펙션, 전기천공, 현미주사, 바이러스 감염, 열 충격, 막의 화학적 투과 후 형질변환, 또는 세포 융합에 대해 잘 알고 있다. 본 발명의 구축물 또는 벡터 시스템은 또한, 생체내에서 당업계에 알려진 방법, 예컨대 형질감염, 현미주사, 전기천공, 칼슘 포스페이트 석출의 사용 및 볼리스틱 방법(biolistic method)에 의해 네이키드(naked) DNA로서 도입될 수 있다.
본원에 사용된 바와 같이, 용어 "숙주 세포 또는 유전자 조작된 숙주 세포"는, 본 발명의 구축물 시스템 또는 바이러스 벡터 시스템을 이용하여 형질도입, 형질변환 또는 형질감염된 숙주 세포를 지칭한다.
본원에 사용된 바와 같이, 용어 "핵산", "폴리뉴클레오타이드 서열" 및 "구축물"은 단일-가닥 또는 이중-가닥 형태의 데옥시리보뉴클레오타이드 중합체 또는 리보뉴클레오타이드 중합체를 지칭하고, 다르게 제한되지 않는 한, 천연-발생 뉴클레오타이드와 유사한 방식으로 작용할 수 있는 공지된 천연 뉴클레오타이드 유사체를 포함할 것이다. 폴리뉴클레오타이드 서열은 전장 서열뿐만 아니라 해당 전장 서열 유래의 더 짧은 서열을 둘 다 포함한다. 특정 폴리뉴클레오타이드 서열은 본래의 서열, 또는 특정 숙주 세포에서 코돈 선호도(codon preference)를 제공하기 위해 도입될 수 있는 서열의 축퇴 코돈(degenerate codon)을 포함하는 것으로 이해된다. 본 발명의 범위 내에 속하는 폴리뉴클레오타이드 서열은, 본 발명의 펩타이드를 코딩하는 서열과 특이적으로 혼성화하는 서열을 더 포함한다. 폴리뉴클레오타이드는 개별 가닥으로서 또는 듀플렉스 내에서 센스 가닥 및 안티센스 가닥을 둘 다 포함한다.
본 발명은 또한, 표준의 엄격한 조건 및 표준 방법 하에 본 발명의 폴리뉴클레오타이드 서열과의 혼성화를 허용하기 위해 해당 폴리뉴클레오타이드 서열과 충분히 상동성인 서열을 가진 폴리뉴클레오타이드 분자를 고려한다(문헌[Maniatis, T. et al, 1982]).
본 발명은 또한, 구축물이 발현되는 것으로 의도된 숙주 세포 내에서 기능성 조절 요소를 포함할 수 있는 구축물 시스템에 관한 것이다. 당해 기술분야의 당업자는 적절한 숙주 세포, 예를 들어 포유류 또는 인간 숙주 세포에 사용하기 위한 조절 요소를 선택할 수 있다. 조절 요소로는 예를 들어, 프로모터, 전사 종결 서열, 번역 종결 서열, 인핸서, 신호 펩타이드, 분해 신호 및 폴리아데닐화 요소 등이 있다. 본 발명의 구축물은 요망되는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열에 작동적으로 연결된 프로모터 서열을 포함할 수 있다.
본 발명에 사용하는 것으로 고려되는 프로모터로는, 본래의(native) 유전자 프로모터, 사이토메갈로바이러스(CMV) 프로모터(KF853603.1, bp 149-735), 키메라 CMV/닭 베타-액틴 프로모터(CBA) 및 절단된 형태의 CBA(smCBA) 프로모터(US8298818, 및 AAVGC1로 처리된 생후 구아닐레이트 사이클라제-1 녹아웃 마우스 망막의 추상체에서 광-구동 추상체 어레스틴 전좌(Light-Driven Cone Arrestin Translocation in Cones of Postnatal Guanylate Cyclase-1 Knockout Mouse Retina Treated with AAVGC1)), 로돕신 프로모터(NG_009115, bp 4205-5010), 광수용기간 레티노이드 결합 단백질 프로모터(interphotorecetpor retinoid binding protein promoter; NG_029718.1, bp 4777-5011), 난황상(vitelliform) 황반 이영양증 2 프로모터(NG_009033.1, bp 4870-5470), PR-특이적인 인간 G 단백질-커플링된 수용체 키나제 1(hGRK1; PR-specific human G protein-coupled receptor kinase 1; AY327580.1 bp1793-2087 또는 bp 1793-1991)(문헌[Haire et al. 2006]; 미국 특허 8,298,818) 등이 있으나, 이들로 한정되는 것은 아니다. 그렇지만, 당업계에 알려진 임의의 적합한 프로모터가 사용될 수 있다. 구체적인 실시형태에서, 프로모터는 CMV 프로모터 또는 hGRK1 프로모터이다. 일 실시형태에서 프로모터는, 하나의 조직 또는 한 그룹의 조직에서는 선택적인 활성을 보이지만 다른 조직에서는 활성이 더 낮거나 활성이지 않은, 조직-특이적인 프로모터이다. 일 실시형태에서, 프로모터는 수용기-특이적인 프로모터이다. 다른 실시형태에서, 프로모터는 추상 세포-특이적인 및/또는 간상 세포-특이적인 프로모터이다.
바람직한 프로모터는 CMV, GRK1, CBA 및 IRBP 프로모터이다. 보다 바람직한 프로모터는 하이브리드 프로모터로서, 이는 다양한 프로모터들 유래의 조절 요소들을 조합한 것이다(예로서, CMV 프로모터 유래의 인핸서, CBA 프로모터 및 Sv40 키메라 인트론을 조합한 키메라 CBA 프로모터로서, 본원에서 CBA 하이브리드 프로모터로 지칭됨).
프로모터는 당업계에 알려진 표준 기술을 사용하여 구축물 내에 혼입될 수 있다. 프로모터의 다중 복사체 또는 다중 프로모터가 본 발명의 벡터에 사용될 수 있다. 일 실시형태에서, 프로모터는, 이의 천연 유전적 환경에서 전사 시작 부위로부터 유래한 것이므로, 전사 시작 부위로부터 대략 동일한 거리에 위치할 수 있다. 이러한 거리에 대한 약간의 변화는 프로모터 활성의 실질적인 감소가 없을 시 허용된다. 본 발명의 시스템에서, 전사 시작 부위는 전형적으로, 3' 구축물이 아닌 5' 구축물에 포함된다. 다른 실시형태에서, 전사 시작 부위는 분해 신호의 업스트림에 있는 3' 구축물에 포함될 수 있다.
본 발명의 구축물은 선택적으로, 전사 종결 서열, 번역 종결 서열, 신호 펩타이드 서열, 내부 리보솜 도입 부위(IRES; internal ribosome entry site), 인핸서 요소 및/또는 전사-후 조절 요소, 예컨대 마멋 간염 바이러스(WHV; Woodchuck hepatitis virus) 전사후 조절 요소(WPRE)를 함유할 수 있다. 전사 종결 영역은 전형적으로, 진핵 또는 바이러스 유전자 서열의 3' 비번역된 영역으로부터 수득될 수 있다. 전사 종결 서열은 효율적인 종결을 제공하기 위해 코딩 서열의 다운스트림에 위치할 수 있다. 본 발명의 시스템에서, 전사 종결 부위는 전형적으로, 5' 구축물이 아닌 3' 구축물에 포함된다.
신호 펩타이드 서열은, 작동적으로 연결된 폴리펩타이드를 특정 세포소기관 구획으로부터 단백질 작용 부위 및 세포외 환경에 이르기까지 광범위한 번역-후 세포 도착지로 재배치시키는 책임이 있는 정보를 인코딩하는 아미노 말단 서열이다. 인핸서는 유전자 전사를 증가시키는 시스-작용 요소로서, 이 또한 벡터 내에 포함될 수 있다. 인핸서 요소는 당업계에 알려져 있으며, 이러한 요소로는 CaMV 35S 인핸서 요소, 사이토메갈로바이러스(CMV) 조기 프로모터 인핸서 요소 및 SV40 인핸서 요소 등이 있으나, 이들로 한정되는 것은 아니다. 구조 유전자에 의해 인코딩되는 mRNA의 폴리아데닐화를 지시하는(direct) DNA 서열 또한, 벡터에 포함될 수 있다.
바람직하게는 본 발명에서, 코딩 서열은 천연 엑손-엑손 연접에서 제1 및 제2 단편 또는 부분(5' 말단 부분 및 3' 말단 부분)으로 분할된다. 바람직하게는 코딩 서열의 각각의 단편 또는 부분은 그 크기가 60 kb를 초과하지 않아야 하며, 바람직하게는 코딩 서열의 각각의 단편 또는 부분은 그 크기가 50 Kb, 40 Kb, 30 Kb, 20 Kb, 10 Kb를 초과하지 않아야 한다. 바람직하게는, 코딩 서열의 각각의 단편 또는 부분은 그 크기가 약 2 Kb, 2.5 Kb, 3 Kb, 3.5 Kb, 4 Kb, 4.5 Kb, 5 Kb, 5.5 Kb, 6 Kb, 6.5 Kb, 7 kb, 7.5 Kb, 8 Kb, 8.5 Kb, 9 Kb, 9.5 Kb일 수 있거나 그보다 더 작은 크기일 수 있다.
스플라이스오솜(spliceosomal) 인트론은 종종 진핵 단백질-코딩 유전자의 서열 내에 체류한다. 상기 인트론 내에서, 공여자 부위(인트론의 5' 말단), 분지(branch) 부위(인트론의 3' 말단 부근) 및 수여자 부위(인트론의 3' 말단)가 스플라이싱에 필요하다. 스플라이스 공여자 부위는, 크기가 더 크며 더 적게 고도로 보존된 영역 내에서 인트론의 5' 말단에 대체로 변하지 않는(invariant) 서열 GU를 포함한다. 인트론의 3' 말단에서 스플라이스 수여자 부위는 대체로 변하지 않는 AG 서열을 가진 인트론으로 종결된다. AG로부터 업스트림(5'-방향)에, 피리미딘(C 및 U)이 풍부한 영역, 또는 폴리피리미딘 트랙이 존재한다. 폴리피리미딘 트랙으로부터 업스트림에 분지점이 존재하고, 이러한 분지점은 아데닌 뉴클레오타이드를 포함한다. 스플라이싱 수여자 신호 및 스플라이싱 공여자 신호는 또한 당업자에 의해, 당업계에 알려진 서열들 중에서 선택될 수 있다.
단백질의 분해를 매개하며, 다중 바이러스 시스템의 맥락에서 이전에는 전혀 사용된 적이 없는 신호로는, 잘못 접혀진 단백질과 구조적 유사성을 공유하며 따라서 유비퀴틴화 시스템에 의해 인지되는 C-말단 불안정화 펩타이드인 CL1, CL2, CL6, CL9, CL10, CL11, CL12, CL15, CL16, SL17과 같은 짧은 데그론, 공여자 단백질의 N-말단에서의 융합이 직접 단백질 분해 또는 N-말단 규칙 경로를 통한 분해를 둘 다 매개하는 유비퀴틴, 9개 아미노산 길이의 펩타이드이며 CL1 데그론과 유사하게 유비퀴틴화 경로의 효소에 의해 인지되는 구조로 접히는 것으로 예측되는 N-말단 PB29 데그론, mRNA의 조기 종결을 유발하는 인공 정지 코돈, 마이크로RNA(miR) 표적 서열 등이 있으나, 이들로 한정되는 것은 아니다.
당업자가 쉽게 이해할 수 있는 바와 같이, 실험실에서 당업자에 의해 인공적으로 제작될 수 있는 변이체 서열들 외에도 자연적으로 발견되는 단백질의 다수의 변이체 서열들이 존재할 수 있다. 본 발명의 폴리뉴클레오타이드 및 폴리펩타이드는 본원에서 구체적으로 예시된 것들, 뿐만 아니라 변이체들이 요망되는 기능적 활성을 보유하는 한 이들의 임의의 천연 변이체뿐만 아니라 인공적으로 제작될 수 있는 임의의 변이체를 포함한다. 또한, 폴리펩타이드 서열 내에서의 아미노산 치환, 첨가 또는 결실을 제외하고는 본원에 예시된 폴리펩타이드와 동일한 아미노산 서열을 가진 폴리펩타이드는, 이들 변이체 폴리펩타이드가 본원에서 구체적으로 예시된 폴리펩타이드와 실질적으로 동일한 관련된 기능적 활성을 보유하는 한 본 발명의 범위 내에 포함된다. 예를 들어, 폴리펩타이드의 기능에 영향을 미치지 않는, 폴리펩타이드 내에서의 보존적 아미노산 치환이 본 발명의 범위 내에 포함될 것이다. 따라서, 본원에 개시된 폴리펩타이드는 상기 고찰된 바와 같이 구체적으로 예시된 서열의 변이체 및 단편을 포함하는 것으로 이해되어야 한다. 본 발명은 본원에 개시된 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 더 포함한다. 이들 뉴클레오타이드 서열은 본원에 제시된 단백질 및 아미노산 서열에 대한 지식을 갖고 있는 당업자에 의해 쉽게 구축될 수 있다. 당업자가 이해하게 될 바와 같이, 유전자 코드의 축퇴성은 당업자로 하여금, 특정 폴리펩타이드 또는 단백질을 인코딩하는 여러 가지 뉴클레오타이드 서열들을 구축할 수 있게 한다. 특정 뉴클레오타이드 서열에 대한 선택은 예를 들어, 특정 발현 시스템 또는 숙주 세포의 코돈 사용빈도(codon usage)에 따라 다를 수 있었다. 구체적으로 예시된 것 이외의 아미노산 치환을 본 발명의 폴리펩타이드에 가진 폴리펩타이드 또한, 본 발명의 범위 내에 포함되는 것으로 고려된다. 예를 들어, 본 발명의 폴리펩타이드의 아미노산은, 치환된 아미노산을 가진 폴리펩타이드가 아미노산이 치환되지 않은 폴리펩타이드와 실질적으로 동일한 활성을 보유하는 한, 비-천연 아미노산으로 치환될 수 있다. 비-천연 아미노산의 예로는, 오르니틴, 시트룰린, 하이드록시프롤린, 호모세린, 페닐글리신, 타우린, 요오도티로신, 2,4-다이아미노부티르산, a-아미노 이소부티르산, 4-아미노부티르산, 2-아미노 부티르산, γ-아미노 부티르산, ε-아미노 헥산산, 6-아미노 헥산산, 2-아미노 이소부티르산(isobutyiic acid), 3-아미노 프로피온산, 노르류신(norleucine), 노르발린(norvaline), 사르코신(sarcosine), 호모시트룰린, 시스테산(cysteic acid), τ-부틸글리신, τ-부틸알라닌, 페닐글리신, 사이클로헥실알라닌, β-알라닌, 플루오로-아미노산, 디자이너 아미노산, 예컨대 β-메틸 아미노산, C-메틸 아미노산, N-메틸 아미노산, 및 일반적인 아미노산 유사체 등이 있으나, 이들로 한정되는 것은 아니다. 비-천연 아미노산은 또한, 유도체화된 측기(derivatized side group)를 가진 아미노산을 포함한다. 더욱이, 단백질 내 임의의 아미노산은 D(우선성(dextrorotary)) 형태 또는 L(좌선성(levorotary)) 형태일 수 있다. 아미노산은 일반적으로 하기 부류들: 비극성, 비전하성 극성, 염기성 및 산성으로 분류될 수 있다. 하나의 부류의 아미노산을 가진 폴리펩타이드가 동일한 부류의 또 다른 아미노산으로 대체되는 보존적 치환은, 상기 치환을 가진 폴리펩타이드가 상기 치환을 갖지 않은 폴리펩타이드와 동일한 생물학적 활성을 여전히 실질적으로 보유하는 한, 본 발명의 범위 내에 포함된다. 표 1은 각각의 부류에 속하는 아미노산의 예들의 목록을 제공한다.
또한, 폴리뉴클레오타이드 서열 내에서의 뉴클레오타이드 치환, 첨가 또는 결실을 제외하고는 본원에 예시된 폴리뉴클레오타이드와 동일한 뉴클레오타이드 서열을 가진 폴리뉴클레오타이드는, 이들 변이체 폴리뉴클레오타이드가 본원에 구체적으로 예시된 폴리뉴클레오타이드와 실질적으로 동일한 관련된 기능적 활성을 보유하는 한, 본 발명의 범위 내에 포함된다(예를 들어, 이들은 예시된 폴리뉴클레오타이드에 의해 인코딩되는 것과 동일한 아미노산 서열 또는 동일한 기능적 활성을 가진 단백질을 인코딩함). 따라서, 본원에 개시된 폴리뉴클레오타이드는 상기 고찰된 바와 같이 구체적으로 예시된 서열의 변이체 및 단편을 포함하는 것으로 이해되어야 한다.
본 발명은 또한, 표준의 엄격한 조건 및 표준 방법 하에 본 발명의 폴리뉴클레오타이드 서열과의 혼성화를 허용하기 위해 해당 서열과 충분히 상동성인 서열을 가진 폴리뉴클레오타이드 분자를 고려한다(문헌[Maniatis, T. et al, 1982]). 본원에 기재된 폴리뉴클레오타이드는 또한, 본원에 예시된 폴리뉴클레오타이드와 보다 특정한 동일성 및/또는 유사성 범위 측면에서 정의될 수 있다. 서열 동일성은 전형적으로 60% 초과, 바람직하게는 75% 초과, 보다 바람직하게는 80% 초과, 보다 더 바람직하게는 90% 초과일 수 있고, 95% 초과일 수 있다. 서열의 동일성 및/또는 유사성은 본원에 예시된 서열과 비교하여 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그보다 클 수 있다. 다르게 명시되지 않는 한 본원에 사용된 바와 같이, 2개의 서열들의 서열 동일성% 및/또는 유사성%는 Karlin 및 Altschul(1993)에서 변형된 Karlin 및 Altschul(1990)의 알고리즘을 사용하여 확인될 수 있다. 이러한 알고리즘은 Altschul 등(1990)의 NBLAST 및 XBLAST 프로그램 내로 통합된다. 요망되는 서열 동일성%를 가진 서열을 수득하기 위해 BLAST 검색은 NBLAST 프로그램을 이용하여 수행될 수 있으며, 여기서 점수 = 100, 단어길이 = 12이다. 비교용의 갭핑된 정렬(gapped alignment)을 수득하기 위해, 갭핑된 BLAST가 Altschul 등(1997)에 기재된 바와 같이 사용될 수 있다. BLAST 및 갭핑된 BLAST 프로그램을 이용할 때, 각각의 프로그램(NBLAST 및 XBLAST)의 디폴트 파라미터가 사용될 수 있다. NCBI/NIH 웹사이트를 참조한다.
본 발명은 또한, 본 발명의 벡터 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 약제학적으로 허용가능한 담체, 희석제, 부형제 또는 보조제와 선택적으로 조합하여 포함하는 약제학적 조성물에 관한 것이다. 약제학적 담체, 부형제 또는 희석제의 선택은 의도된 투여 경로 및 표준 약제학적 실시의 측면에서 선택될 수 있다. 약제학적 조성물은 담체, 부형제 또는 희석제로서 - 또는 이것들 외에도 - 임의의 적합한 결합제(들), 윤활제(들), 현탁제(들), 코팅제(들), 가용화제(들), 및 표적 부위 내로의 바이러스 도입을 돕거나 증가시킬 수 있는 다른 담체 제제(예를 들어, 지질 전달 시스템)를 포함할 수 있다. 구축물 또는 벡터는 생체내 또는 생체외로 투여될 수 있다.
소정량의 화합물을 포함하며 국소 또는 비경구 투여용으로 맞춰진 약제학적 조성물은 본 발명의 바람직한 실시형태를 구성한다. 비경구 투여에 있어서, 조성물은 멸균 수용액 형태에서 최상으로 사용될 수 있으며, 이러한 수용액은 다른 성분들, 예를 들어 용액을 혈액과 등장성으로 만들기에 충분한 염 또는 단당류를 함유할 수 있다. 본 발명의 약제학적 조성물은 선호할만하게는 망막하 주사를 통해 망막에 전달될 수 있거나, 또는 상기 조성물은 또한, 비-침습적인 절차를 통해 망막에 전달될 수 있는 주사용 현탁액, 안약(eye lotion) 또는 안 연고 형태로 제조될 수 있다.
본 발명의 맥락에서 환자, 특히 인간에게 투여되는 용량은 치사 독성 없이, 바람직하게는 부작용 또는 사망률(morbidity)을 허용 가능한 수준 이하로 유발하면서, 환자에서 합리적인 시간 프레임에 걸쳐 치료 반응을 달성하기에 충분해야 한다. 당업자는, 투여량이 대상의 (건강) 상태, 대상의 체중, 동시 수행되는(concurrent) 치료가 있다면 그 종류, 치료 빈도, 치료비(therapeutic ratio), 뿐만 아니라 병리학적 질환의 중증도 및 단계를 포함한 여러 가지 인자들에 따라 다를 것임을 인지할 것이다.
본 발명의 방법은 인간 및 다른 동물에게 사용될 수 있다. 본원에 사용된 바와 같이, 용어 "환자" 및 "대상"는 상호호환적으로 사용되고, 이러한 인간 및 비-인간 종을 포함하고자 한다. 마찬가지로, 본 발명의 시험관내 방법은 이러한 인간 및 비-인간 종의 세포 상에서 수행될 수 있다.
본 발명은 또한, 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 하나 이상의 용기에 포함하는 키트에 관한 것이다. 본 발명의 키트는 약제학적으로 허용가능한 담체 및/또는 희석제를 선택적으로 포함할 수 있다. 일 실시형태에서, 본 발명의 키트는 본원에 기재된 바와 같은 하나 이상의 다른 구성성분, 부가물 또는 보조제를 포함한다. 일 실시형태에서, 본 발명의 키트는 상기 키트의 벡터 시스템을 투여하는 방법을 기재하고 있는 지침서 또는 패키징 물질을 포함한다. 키트의 용기는 임의의 적합한 물질, 예를 들어 유리, 플라스틱, 금속 등으로 제작된 것이며 임의의 적합한 크기, 모양 또는 배치로 제작된 것일 수 있다. 일 실시형태에서, 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포는 키트에서 고형으로서 제공된다. 또 다른 실시형태에서, 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포는 키트에서 액체 또는 용액으로서 제공된다. 일 실시형태에서, 키트는 본 발명의 구축물 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 액체 또는 용액 형태로 함유하는 앰플 또는 주사기를 포함한다.
본 발명은 또한, 유전자 치료법에 의해 개체를 치료하기 위한 약제학적 조성물을 제공하며, 여기서, 본 조성물은 본 발명의 벡터 시스템, 바이러스 벡터 시스템 또는 숙주 세포에 의해 생성되거나 이로부터 수득되는 하나 이상의 전달 가능한 치료적 및/또는 진단적 이식유전자(들) 또는 바이러스 입자를 포함하는 상기 벡터 시스템, 바이러스 벡터 시스템 또는 숙주 세포를 치료적 유효량으로 포함한다. 약제학적 조성물은 인간 또는 동물에게 사용하기 위한 것일 수 있다. 전형적으로, 일반적으로 숙련된 임상의는, 개별 대상에게 가장 적합할 뿐만 아니라 특정 개체의 연령, 체중 및 반응성 및 투여 경로에 따라 달라질 실제 투여량을 결정할 것이다. 투약 범위는 각각의 벡터의 1x10e10개 내지 1x10e15개 게놈 복사체/kg이며, 선호할만하게는 각각의 벡터의 1x10e11개 내지 1x10e13개 게놈 복사체/kg가 인간에서 효과적인 것으로 예상된다. 투약 범위는 각각의 벡터의 1x10e10개 내지 1x10e15개 게놈 복사체/눈(eye)이며, 선호할만하게는 1x10e10개 내지 1x10e13개가 안내(ocular) 투여에 효과적인 것으로 예상된다.
투여량 섭생 및 투여되어야 하는 유효량은 일반적으로 숙련된 임상의에 의해 결정될 수 있다. 투여는 단일 투약 또는 다중 투약 형태일 수 있다. 폴리뉴클레오타이드, 발현 구축물 및 벡터를 사용하여 유전자 치료법을 수행하는 일반적인 방법은 당업계에 알려져 있다(예를 들어 문헌[Gene Therapy: Principles and Applications, Springer Verlag 1999]; 및 미국 특허 6,461,606, 6,204,251 및 6,106,826 참조). 본 발명은 또한, 선택된 폴리펩타이드를 세포에서 발현시키는 방법에 관한 것이다. 일 실시형태에서, 본 방법은 선택된 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드 서열을 포함하는 본 발명의 벡터 시스템을 세포에 혼입시키는 단계, 및 상기 폴리뉴클레오타이드 서열을 상기 세포에서 발현시키는 단계를 포함한다. 선택된 폴리펩타이드는 세포에 대해 이종성인 폴리펩타이드일 수 있다. 일 실시형태에서, 세포는 포유류 세포이다. 일 실시형태에서, 세포는 인간 세포이다. 일 실시형태에서, 세포는 광수용기 세포 또는 RPE 세포이다. 세포는 또한, 근육 세포, 특히 골격근 세포, 폐 세포, 췌장 세포, 간 세포, 신장 세포, 장(intestine) 세포, 혈액 세포일 수 있다. 구체적인 실시형태에서, 세포는 추상 세포 또는 간상 세포이다. 구체적인 실시형태에서, 세포는 인간 추상 세포 또는 간상 세포이다.
서열
AP1 (서열 번호 24)
AP2 (서열 번호 25)
AK seqA (서열 번호 22)
AK seqB (서열 번호 23)
AP(서열 번호 26)
좌측 ITR2 (서열 번호 29)
우측 ITR2 (서열 번호 30)
좌측 ITR5 (서열 번호 31)
우측 ITR5 (서열 번호 32)
CMV
CMV 인핸서 (서열 번호 33)
CMV 프로모터 (서열 번호 34)
키메라 인트론 (SV40 인트론 ) (서열 번호 35)
hGRK1 프로모터 (서열 번호 36)
CBA 하이브리드 프로모터
CMV 인핸서 (서열 번호 37)
CBA 프로모터 (서열 번호 38)
IRBP (서열 번호 39)
스플라이싱 공여자 신호 (서열 번호 27)
miR-let 7b 분해 신호 (서열 번호 40)
4xmiR-let 7b 분해 신호 (서열 번호 41)
miR-26a 분해 신호 (서열 번호 13)
4xmiR-26a 분해 신호 (서열 번호 18)
miR-204 분해 신호 (서열 번호 11)
miR-124 분해 신호 (서열 번호 12)
3xmiR-204+3xmiR-124 분해 신호 (서열 번호 17)
CL1 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 16)
아미노산 서열: (서열 번호 1)
CL2 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 42)
아미노산 서열: (서열 번호 2)
CL6 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 43)
아미노산 서열: (서열 번호 3)
CL9 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 44)
아미노산 서열: (서열 번호 4)
CL10 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 45)
아미노산 서열: (서열 번호 5)
CL11 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 46)
아미노산 서열: (서열 번호 6)
CL12 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 47)
아미노산 서열: (서열 번호 7)
CL15 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 48)
아미노산 서열: (서열 번호 8)
CL16 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 49)
아미노산 서열: (서열 번호 9)
SL17 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 50)
아미노산 서열: (서열 번호 10)
PB29 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 19)
아미노산 서열: (서열 번호 15)
짧은 PB29 분해 신호 (데그론)
뉴클레오타이드 서열: (서열 번호 20)
아미노산 서열: (서열 번호 14)
3x PB29 분해 신호 (데그론) (서열 번호 21)
인공 정지 코돈 (서열 번호 51)
스플라이싱 수여자 신호 (서열 번호 28)
SV40 폴리 A (서열 번호 52)
ABCA4 5' (서열 번호 53)
hGRK1-5' ABCA4+AK+CL1 전장 서열 (서열 번호 54)
범례:
ITR: 대문자 볼드체
hGRK 프로모터: 소문자 볼드 이탤릭체
ABCA4 5': 소문자 밑줄
SDS: 소문자 볼드체
AK: 대문자
CL1: 소문자 이탤릭체 밑줄
범례:
ITR: 대문자 볼드체 밑줄
AK: 대문자
SAS: 소문자 볼드체
ABCA4 3': 소문자 밑줄
SV40 polyA: 소문자 볼드 이탤릭체
CMV 5' ABCA4 -SD-AK 전장 서열 (서열 번호 57)
AK-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 58).
CMV 5' ABCA4-SD-AP1 전장 서열 (서열 번호 59)
AP1-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 60)
CMV 5' ABCA4-SD-AP2 전장 서열 (서열 번호 61)
AP2-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 62)
CMV 5' ABCA4-SD-AP 전장 서열 (서열 번호 63)
AP-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 64)
hGRK1 5' ABCA4-SD-AP1 전장 서열 (서열 번호 65)
GRK1 5' ABCA4-SD-AP2 전장 서열 (서열 번호 66)
ITR5-CMV 5' ABCA4-SD-AK-ITR2 전장 서열 (서열 번호 67)
ITR2-AK-SA-3' ABCA4-SV40-ITR5 전장 서열 (서열 번호 68)
ITR5-CBA 5' MYO7A-SD-AK-ITR2 전장 서열 (서열 번호 69)
ITR2-AK-SA-3' MYO7A-HA-BGH-ITR5 전장 서열 (서열 번호 70)
CMV 5' ABCA4-3XFLAG-SD-AK-4xmiR26a 전장 서열 (서열 번호 71)
CMV 5' ABCA4-3XFLAG-SD-AK-3xmiR204+3xmir124 전장 서열 (서열 번호72)
CMV 5' ABCA4-3XFLAG-SD-AK-CL1 전장 서열 (서열 번호 73)
AK-STOP-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 74)
AK-PB29-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 75)
AK-3XPB29-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 76)
AK-유비퀴틴-SA-3' ABCA4-3XFLAG-SV40 전장 서열 (서열 번호 77).
본 발명은 이제 하기 도면을 참조로 하여 비제한적인 실시예에 의해 예시될 것이다.
도 1. 본 발명의 실시예의 다중-벡터 전략의 모식도이다. ITR: 반전 말단 반복부; Prom: 프로모터; CDS, 코딩 서열; SD, 스플라이싱 공여자 신호; RR: 재조합유전성 영역, AK 또는 알칼리 포스파타제(AP1, AP2 및 AP); Deg Sig; 분해 신호(표 2 참조); SA, 스플라이싱 수여자 신호; pA, 폴리아데닐화 신호. 도 1A 및 도 1C: 트랜스스플라이싱 및 재조합유전성 영역을 포함하는 (이중 또는 삼중) 하이브리드 벡터 전략이며, 본 발명의 바람직한 실시형태에 따르면 도 1B 및 도 1D: (이중 또는 삼중) 벡터 오버래핑 벡터 전략이다. 부가적인 예들에 대해서는, 도 12 내지 도 14를 참조한다.
도 2. 상동성의 AK, AP1 및 AP2 영역을 사용한 효율적인 ABCA4 단백질 발현
(도 2a, 도 2c)는 ABCA4를 인코딩하는 (도 2a) 이중 AAV2/2(AAV 혈청형 2로서, AAV2 유래의 상동성 ITR을 가짐) 벡터로 감염된 HEK293 세포(50 ㎍/레인), 또는 (도 2c) 이중 AAV2/8(AAV 혈청형 8로서, AAV2 유래의 상동성 ITR을 가짐) 벡터로 주사된 C57BL/6 망막(전체 망막 용해물)의 대표적인 웨스턴 블롯 분석이다. 화살표는 전장 단백질을 가리키며, 분자량 사다리는 좌측에 도시되어 있다. (도 2b)는 (도 2a)의 웨스턴 블롯 분석으로부터의 ABCA4 단백질 밴드의 정량화이다. (도 2a)에서의 ABCA4 밴드의 강도를 필라민(Filamin) A 밴드의 강도로 나누었다. 막대 그래프는 단백질의 발현을 이중 AAV 하이브리드 AK 벡터에 대한 퍼센트로서 보여주며, 평균값은 상응하는 막대의 상부에 표시되어 있다. 값은 평균 ± s.e.m.(평균의 표준 오차)으로 나타낸다. *pANOVA < 0.05; 별표는 AK, AP1 및 AP2의 유의한 차이를 가리킨다. (도 2a 내지 도 2c) AK: 이중 AAV 하이브리드 AK 벡터에 의해 감염된 세포 또는 주사된 눈; AP1: 이중 AAV 하이브리드 AP1 벡터에 의해 감염된 세포 또는 주사된 눈; AP2: 이중 AAV 하이브리드 AP2 벡터에 의해 감염된 세포 또는 주사된 눈; AP: 이중 AAV 하이브리드 AP 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, 3'-하프 벡터 또는 EGFP 발현 벡터에 의해 감염된 세포 또는 주사된 눈. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯; α-필라민 A, 로딩 대조군으로서 사용되는 항-필라민 A 항체를 이용한 웨스턴 블롯; α-디스페린(α-Dysferlin), 로딩 대조군으로서 사용되는 항-디스페린 항체를 이용한 웨스턴 블롯.
도 3. 이종성 ITR2 및 ITR5를 가진 벡터의 게놈 및 형질도입 효율
(도 3a)는 상동성(2:2) 또는 이종성(5:2 또는 2:5) ITR을 가진 3 x 1010 GC의 5'-ABCA4-하프 벡터 및 3'-ABCA4-하프 벡터 둘 다로부터 추출한 DNA, 및 상동성 ITR2를 가진 대조군 AAV 조제물(CTRL)의 알칼리 서던 블롯 분석이다. 각각의 게놈의 예상된 크기는 각각의 레인 아래에 표시되어 있다. 분자량 마커(kb)는 좌측 5': 5'-하프 벡터; 3': 3'-하프 벡터 상에 표시되어 있다. (도 3b 내지 도 3d)는 ITR2 역가(도 3b 및 도 3c) 또는 이식유전자 역가(도 3b 및 도 3d)를 기반으로 한 m.o.i.에서 이종성 ITR2 및 ITR5, 또는 상동성 ITR2를 가진 이중 AAV2/2 하이브리드 ABCA4 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석 및 정량화이다. 웨스턴 블롯 이미지(도 3b)는 n = 3개의 독립적인 실험을 대표하며; 정량화(도 3c 및 도 3d)는 n = 3개의 독립적인 실험으로부터 유래된 것이다. (도 3b)에서, 상부 화살표는 전장 ABCA4 단백질을 가리키고, 하부 화살표는 절단된 단백질을 가리키며; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지 아래에 표시되어 있다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 사용된 항-필라민 A 항체를 이용한 웨스턴 블롯이다. (도 3c 및 도 3d)는 ITR2 역가(도 3c) 또는 이식유전자 역가(도 3d)를 기반으로 한 용량의 벡터에 의해 감염된 세포의 웨스턴 블롯으로부터, 전장 ABCA4 단백질 및 절단된 ABCA4 단백질의 밴드를 정량화한 것이다. 막대 그래프는, 필라민 A 밴드의 강도로 나눈 전장 단백질 및 절단된 단백질 밴드의 강도, 또는 절단된 단백질 밴드의 강도로 나눈 전장 단백질 밴드의 강도를 상응하는 레인에 보여준다. MYO7A를 인코딩하는 이종성 ITR2 및 ITR5, 또는 상동성 ITR2를 가진 이중 AAV2(AAV 혈청형 2) 하이브리드 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석 및 정량화가 도시되어 있다(도 3e, 도 3f). 웨스턴 블롯 이미지(도 3e)는 대표적인 것이고, 정량화(도 3f)는 n = 3개의 독립적인 실험으로부터 유래된 것이다. (도 3e)에서, 상부 화살표는 전장 단백질을 가리키며, 하부 화살표는 절단된 단백질을 가리키고, 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지의 아래에 표시되어 있다. (도 3f)는 웨스턴 블롯 분석으로부터의 MYO7A 단백질 밴드의 정량화이다.
평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. *p 스튜던츠 t 테스트 ≤ 0.05.
2:2 2:2: AAV2 유래의 상동성 ITR을 가진 이중 AAV 하이브리드 벡터에 의해 감염된 세포; 5:2 2:5: AAV2 및 AAV5 유래의 이종성 ITR을 가진 이중 AAV 하이브리드 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, EGFP-발현 벡터에 의해 감염된 세포이다.
도 4. 5'-하프 벡터에 miR 표적 부위를 포함시키는 것은 절단된 단백질 생성물을 유의하게 감소시키지 않는다
miR-let7b(좌측 패널), miR-204+124(중앙 패널) 또는 miR-26a(우측 패널)에 대한 miR 표적 부위를 함유하는, ABCA4를 인코딩하는 이중 AAV2/2(AAV 혈청형 2) 하이브리드 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 절단된 단백질을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지의 아래에 표시되어 있다. 5'+3': miR 표적 부위가 없는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'+3'+스크램블: 스크램블(scramble) miR 모방체의 존재 하에, miR 표적 부위가 없는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3': miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3'+스크램블: 스크램블 miR 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3'+모방체 let7b: mir-let7b 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5': miR 표적 부위가 없는 5'-하프 벡터에 의해 감염된 세포; 5'mir: 스크램블 miR 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; 5'mir+모방체 let7b: mir-let7b 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; neg: 3'-하프 벡터 또는 EGFP-발현 벡터에 의해 감염된 대조군 세포; 5'mir+3'+모방체 204+124: mir-204 및 124 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+모방체 204+124: mir-204 및 124 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; 5'mir+3'+모방체 26a: mir-26a 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+모방체 26a: mir-26a 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포이다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A는 로딩 대조군으로서 항-필라민 A 항체를 이용한 웨스턴 블롯이다.
스크램블 서열은 상이한 miRNA의 서열에 상응하며, 예를 들어 mir-let7b 모방체를 이용한 실험에서 스크램블 서열은 miR26a의 서열이었다.
도 5. 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것은 절단된 단백질 생성물을 유의하게 감소시킨다
ABCA4를 인코딩하고 CL1 분해 신호를 함유하거나 또는 함유하지 않는 (도 5a) 이중 AAV2/2(AAV 혈청형 2로서, AAV2 유래의 상동성 ITR을 가짐) 하이브리드 벡터에 의해 감염된 HEK293 세포, 또는 (도 5b) 이중 AAV2/8(AAV 혈청형 8로서, AAV2 유래의 상동성 ITR을 가짐) 하이브리드 벡터를 주사한 후 1개월째의 돼지 눈(RPE+망막)에 대한 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 5'-하프 벡터로부터 절단된 단백질을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 각각의 이미지 아래에 표시되어 있다. 5'+3': CL1이 없는 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포 또는 공동-주사된 눈; 5'-CL1+3': CL1을 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포 또는 공동-주사된 눈; 5': CL1이 없는 5'-하프 벡터에 의해 감염된 세포; 5'-CL1: CL1을 함유하는 5'-하프 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, 3'-하프 벡터 또는 EGFP-발현 벡터에 의해 감염된 대조군 세포 또는 주사된 대조군 눈; α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 사용된 항-필라민 A 항체를 이용한 웨스턴 블롯이고; α-디스페린: 로딩 대조군으로서 사용된 항-디스페린 항체를 이용한 웨스턴 블롯이다. (도 5a)에서, 웨스턴 블롯 이미지는 n = 3개의 독립적인 실험을 대표한다. (도 5b)에서, 웨스턴 블롯 이미지는 5'+3' 벡터가 주사된 n = 5개의 눈, 5'-CL1+3' 벡터가 주사된 n = 2개의 눈, 및 음성 대조군으로서 3'-하프 벡터 또는 EGFP-발현 벡터가 주사된 n = 5개의 눈을 대표한다.
도 6. 3'-하프 벡터에 분해 신호를 포함시키는 것은 절단된 단백질 생성물을 약간 감소시킨다
ABCA4를 인코딩하고 상이한 분해 신호를 함유하는 이중 AAV2/2 하이브리드 벡터에 의해 감염된 HEK293 세포에 대한 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 절단된 단백질 생성물을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 각각의 이미지 아래에 표시되어 있다. 5'+3': 분해 신호 없이, 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포; 5': 5'-하프 벡터에 의해 감염된 세포; 3'(표지 없음): 분해 신호 없이 3'-하프 벡터에 의해 감염된 세포; 정지(STOP): 정지 코돈을 함유하는 3'-하프 벡터에 의해 감염된 세포; PB29: PB29 분해 신호를 함유하는 3'-하프 벡터에 의해 감염된 세포; 3xPB29: PB29 분해 신호의 3개의 탠덤 복사체를 함유하는 3'-하프 벡터에 의해 감염된 세포; 유비퀴틴: 유비퀴틴 분해 신호를 함유하는 3'-하프 벡터에 의해 감염된 세포이다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 항-필라민 A 항체를 이용한 웨스턴 블롯이다.
도 7: 본 발명의 바람직한 실시형태에 사용된 ALPP(태반 알칼리 포스파타제) 유래의 상동성의 AP, AP1 및 AP2 영역의 모식도이다. CDS: 코딩 서열이다.
도 8: 개선된 이중 AAV 벡터의 망막하 전달은 마우스 광수용기에서 ABCA4 발현, 및 Abca4 -/- 마우스 망막에서 리포푸신 ( lipofuscin ) 축적의 유의한 감소를 초래한다. (도a)는 이중 AAV2/8 하이브리드 ABCA4 벡터(5' + 3') 또는 음성 대조군(neg)이 주사된 C57BL/6 망막(전체 망막 용해물)의 대표적인 웨스턴 블롯 분석이다. 화살표는 전장 단백질을 가리키고, 분자량 사다리는 좌측 상에 표시되어 있다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-디스페린: 로딩 대조군으로서 사용된 항-디스페린 항체를 이용한 웨스턴 블롯이다. (도 8b 및 도 8c)는, 대조군으로서 주사되지 않거나 또는 AAV가 주사된 유색(pigmented) Abca4+/- 마우스(Abca4+/-), 또는 주사되지 않거나(Abca4-/-) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 유색 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 망막(RPE 또는 RPE + OS)에서 리포푸신 자가형광(적색 신호)에 대한 대표적인 도면(도 8b) 및 정량화(도 8c)이다. (도 8b)에서, 축척 막대(75 ㎛)가 도면에 표시되어 있다. RPE: 망막 색소 상피; ONL: 외과립층(outer nuclear layer); INL: 내과립층(inner nuclear layer); GCL: 신경절 세포층. 화살표는 리포푸신 신호를 가리킨다. (도 8c)는 각각의 시료에 대한 3개의 박편들의 측두측(temporal side)에서의 평균 리포푸신 자가형광이다. 각각의 박편에서의 평균 자가형광을 기저 RPE의 길이에 대하여 정규화하였다. 평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. ***p ANOVA < 0.0001. 각각의 그룹에 대해 n = 4개의 눈. (도 8d)는, 주사되지 않거나(Abca4+/+ not inj) 또는 PBS가 주사된 알비노 Abca4+/+ 마우스(Abca4+/+ PBS), 및 PBS가 주사되거나(Abca4-/- PBS) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 알비노 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 1개 망막 당 적어도 40개의 필드(25 ㎛2)에서 계수된 RPE 리포푸신 과립의 평균 수이다. 평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. *pANOVA ≤ 0.05; **pANOVA ≤0.01. Abca4+/+ not inj로부터 n = 4개의 눈; Abca4+/+ PBS로부터 n = 4개의 눈; Abca4-/- PBS로부터 n = 3개의 눈; Abca4-/- AAV5'+ 3'로부터 n = 3개의 눈.
도 9: 마우스 및 돼지의 음성 대조군 또는 개선된 이중 AAV -처리된 눈 사이의 유사한 전기적 활성이다. (도 9a)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 음성 대조군(즉, 음성 대조군 AAV 벡터 또는 PBS; neg)을 주사한 후 1개월째에, C57BL/6 마우스의 평균 a-파(좌측 패널) 및 b-파(우측 패널)의 진폭이다. 데이터는 평균 ± s.e.m.으로 제시되어 있으며; n은 분석된 눈의 갯수를 가리킨다.
(도 9b)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 PBS를 주사한 후 1개월째에, 돼지에서 암순응(scotopic), 최대 반응, 명순응(photopic) 및 깜박거림 ERG 시험에서의 평균 b-파 진폭(μV)이다. 이중 AAV 하이브리드 ABCA4 벡터가 주사된 n = 5개의 눈; PBS가 주사된 n = 4개의 눈; *: n = 2.
도 10: 돼지의 간상체 광수용기 및 추상체 광수용기에서 IRBP 프로모터 및 GRK1 프로모터로부터의 EGFP 단백질 발현이다. 3월령의 라지 화이트종(Large White) 돼지 마우스에, AAV2/8-IRBP-EGFP 벡터 또는 AAV2/8-GRK1-EGFP 벡터를 각각 1x1011 GC/눈(eye)으로 망막하 주사하였다. 주사 후 4주째에 망막 냉동박편(cryosection)을 수득하고, 형광 현미경을 사용하여 EGFP를 분석하였다. (도 10a 내지 도 10b)는 PR 층에서의 형광 강도의 대표적인 이미지(도 10a) 및 정량화(도 10b)이다. 각각의 동물 그룹에 대해, 냉동박편 상에서의 형광 강도를 정량화하였다(6개의 상이한 필드/눈; 20x 배율). (도 10c 내지 도 10d)는 추상체 형질도입 효율에 대한 대표적인 이미지(도 10c) 및 정량화(도 10d)이다. 추상체 형질도입 효율을, 항-LUMIf-hCAR 항체를 이용하여 면역염색한 냉동박편(6개의 상이한 필드/눈; 63x 배율) 상에서 평가하였으며, 각각의 필드에서 추상체(CAR+)의 총 수를 기준으로 하여 EGFP를 발현하는 추상체(EGFP+/CAR+)의 수로서 표현한다. (도 10a, 도 10c)에서, 축척 막대가 도면에 표시되어 있다. (도 10b 내지 도 10d)에서, AAV2/8-IRBP-EGFP 벡터가 주사된 n = 3개의 눈; AAV2/8-GRK1-EGFP 벡터가 주사된 n = 3개의 눈이 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. 스튜던츠 t-테스트를 사용하여 확인 시, 유의한 차이가 발견되지 않았다. OS: 외부 분절(outer segment); ONL: 외과립층; EGFP: 본래의(native) EGFP 형광; CAR: 항-추상체 어레스틴 염색(anti-cone arrestin staining); DAPI: 4',6'-다이아미디노-2-페닐인돌 염색. 화살표는 형질도입된 추상체를 가리킨다.
도 11: 개선된 이중 AAV 벡터의 망막하 전달은 Abca4 -/- 마우스 망막에서 리포푸신 축적을 유의하게 감소시킨다. 대조군으로서 주사되지 않거나 또는 AAV가 주사된 유색 Abca4+/- 마우스(Abca4+/-), 또는 주사되지 않거나(Abca4-/-) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 유색 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 망막(RPE 또는 RPE+OS)에서 리포푸신 자가형광(적색 신호)을 보여주는 망막 단면의 측두측(주사된 면)의 이미지에 대한 몽타주가 도시되어 있다. 각각의 그룹에 대해 n = 4개의 눈. T: 측두측; N: 비측(nasal side)이다.
도 12: 마우스 및 돼지의 음성 대조군 또는 개선된 이중 AAV -처리된 눈 사이의 유사한 전기적 활성이다. (도 12a)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 음성 대조군(즉, 음성 대조군 AAV 벡터 또는 PBS; neg)을 주사한 후 1개월째에, C57BL/6 마우스로부터의 대표적인 EFG 트레이스(trace)이다. (도 12b)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 PBS를 주사한 후 1개월째에, 돼지에서의 암순응, 최대 반응, 명순응 및 깜박거림 ERG 시험 시, 대표적인 트레이스이다.
도 13. 본 발명의 실시예에 따른 벡터 시스템 전략의 모식도이다. (도 13a)는 본 발명의 바람직한 실시형태에 따라 2개의 벡터로 구성된 벡터 시스템의 모식도이다: 제1 벡터는 코딩 서열의 제1 부분(CDS1 부분)을 포함하며, 제2 벡터는 코딩 서열의 제2 부분(CDS2 부분)을 포함한다. (도 13A1)에서, 벡터 시스템의 재구축 서열은 코딩 서열 부분의 오버래핑 말단으로 구성된다. (도 13A2)에서, 제1 벡터 및 제2 벡터의 재구축 서열들은 각각 스플라이싱 공여자 및 스플라이싱 수여자 서열로 구성된다. (도 13A3)에서, 각각의 재구축 서열은 도 13A2에서와 같이 배열된 스플라이싱 공여자/수여자를 포함하고, 이는 재조합유전성 영역을 더 포함한다. 분해 신호가 적어도 하나의 벡터에 포함된다. 도면은 본 발명의 바람직한 비제한적인 실시형태에 따라 벡터 시스템의 하나 이상의 분해 신호의 모든 잠재적인 위치를 각각의 벡터에 대해 나타낸다.
(도 13b)는 본 발명의 바람직한 실시형태에 따라 3개의 벡터로 구성된 벡터 시스템의 모식도이다: 제1 벡터는 코딩 서열의 제1 부분(CDS1 부분)을 포함하며, 제2 벡터는 코딩 서열의 제2 부분(CDS2 부분)을 포함하고, 제3 벡터는 코딩 서열의 제3 부분(CDS3 부분)을 포함한다. (도 13B1)에서, 벡터 시스템의 재구축 서열은 코딩 서열 부분의 오버래핑 말단(CDS1의 3' 말단은 CDS2의 5' 말단과 오버래핑되고; CDS2의 3' 말단 오버래핑은 CDS3의 5' 말단과 오버래핑됨)으로 구성된다. (도 13B2)에서, 제1 벡터의 재구축 서열은 스플라이싱 공여자로 구성되며, 제1 벡터의 재구축 서열은 스플라이싱 공여자로 구성되며; 제2 벡터는 CDS2의 5' 말단에 제1 재구축 서열 및 CDS2의 3' 말단에 제2 재구축 서열을 포함하고, 제1 재구축 서열은 스플라이싱 수여자이고 제2 재구축 서열은 스플라이싱 공여자이며; 제3 벡터의 재구축 서열은 스플라이싱 수여자로 구성된다. (도 13B3)에서, 각각의 재구축 서열은 도 13B2에서와 같이 배열된 스플라이싱 공여자/수여자를 포함하고, 재조합유전성 영역을 더 포함한다. 분해 신호가 적어도 하나의 벡터에 포함된다. 도면은 본 발명의 바람직한 비제한적인 실시형태에 따라 벡터 시스템의 하나 이상의 분해 신호의 모든 잠재적인 위치를 각각의 벡터에 대해 나타낸다.
CDS, 코딩 서열; SD, 스플라이싱 공여자 신호; RR: 재조합유전성 영역; Deg Sig; 분해 신호 (표 2 참조); SA, 스플라이싱 수여자 신호.
도 14. 큰 유전자 형질도입을 위한 선행 기술의 다중 벡터-기반 전략의 모식도이다. CDS: 코딩 서열; pA: 폴리아데닐화 신호; SD: 스플라이싱 공여자 신호; SA: 스플라이싱 수여자 신호; AP: 알칼리 포스파타제 재조합유전성 영역; AK: F1 파지 재조합유전성 영역이다. 점선은 SD와 SA 사이에서 발생하는 스플라이싱을 보여주며, 포인트선(pointed line)은 상동성 재조합에 이용 가능한 오버래핑 영역들을 보여준다. 정상 크기 및 오버사이즈 AAV 벡터 플라스미드는 프로모터, 전장 이식유전자 CDS 및 폴리아데닐화 신호(pA)를 포함하는 전장 발현 카세트를 함유하였다. 이중 AAV 벡터를 생성하는 데 필요한 2개의 개별 AAV 벡터 플라스미드(5' 및 3')는 이식유전자 CDS의 N-말단 부분 앞에 프로모터(5' 플라스미드), 또는 이식유전자 CDS의 C-말단 부분 다음에 pA 신호(3' 플라스미드)를 함유하였다.
도 1. 본 발명의 실시예의 다중-벡터 전략의 모식도이다. ITR: 반전 말단 반복부; Prom: 프로모터; CDS, 코딩 서열; SD, 스플라이싱 공여자 신호; RR: 재조합유전성 영역, AK 또는 알칼리 포스파타제(AP1, AP2 및 AP); Deg Sig; 분해 신호(표 2 참조); SA, 스플라이싱 수여자 신호; pA, 폴리아데닐화 신호. 도 1A 및 도 1C: 트랜스스플라이싱 및 재조합유전성 영역을 포함하는 (이중 또는 삼중) 하이브리드 벡터 전략이며, 본 발명의 바람직한 실시형태에 따르면 도 1B 및 도 1D: (이중 또는 삼중) 벡터 오버래핑 벡터 전략이다. 부가적인 예들에 대해서는, 도 12 내지 도 14를 참조한다.
도 2. 상동성의 AK, AP1 및 AP2 영역을 사용한 효율적인 ABCA4 단백질 발현
(도 2a, 도 2c)는 ABCA4를 인코딩하는 (도 2a) 이중 AAV2/2(AAV 혈청형 2로서, AAV2 유래의 상동성 ITR을 가짐) 벡터로 감염된 HEK293 세포(50 ㎍/레인), 또는 (도 2c) 이중 AAV2/8(AAV 혈청형 8로서, AAV2 유래의 상동성 ITR을 가짐) 벡터로 주사된 C57BL/6 망막(전체 망막 용해물)의 대표적인 웨스턴 블롯 분석이다. 화살표는 전장 단백질을 가리키며, 분자량 사다리는 좌측에 도시되어 있다. (도 2b)는 (도 2a)의 웨스턴 블롯 분석으로부터의 ABCA4 단백질 밴드의 정량화이다. (도 2a)에서의 ABCA4 밴드의 강도를 필라민(Filamin) A 밴드의 강도로 나누었다. 막대 그래프는 단백질의 발현을 이중 AAV 하이브리드 AK 벡터에 대한 퍼센트로서 보여주며, 평균값은 상응하는 막대의 상부에 표시되어 있다. 값은 평균 ± s.e.m.(평균의 표준 오차)으로 나타낸다. *pANOVA < 0.05; 별표는 AK, AP1 및 AP2의 유의한 차이를 가리킨다. (도 2a 내지 도 2c) AK: 이중 AAV 하이브리드 AK 벡터에 의해 감염된 세포 또는 주사된 눈; AP1: 이중 AAV 하이브리드 AP1 벡터에 의해 감염된 세포 또는 주사된 눈; AP2: 이중 AAV 하이브리드 AP2 벡터에 의해 감염된 세포 또는 주사된 눈; AP: 이중 AAV 하이브리드 AP 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, 3'-하프 벡터 또는 EGFP 발현 벡터에 의해 감염된 세포 또는 주사된 눈. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯; α-필라민 A, 로딩 대조군으로서 사용되는 항-필라민 A 항체를 이용한 웨스턴 블롯; α-디스페린(α-Dysferlin), 로딩 대조군으로서 사용되는 항-디스페린 항체를 이용한 웨스턴 블롯.
도 3. 이종성 ITR2 및 ITR5를 가진 벡터의 게놈 및 형질도입 효율
(도 3a)는 상동성(2:2) 또는 이종성(5:2 또는 2:5) ITR을 가진 3 x 1010 GC의 5'-ABCA4-하프 벡터 및 3'-ABCA4-하프 벡터 둘 다로부터 추출한 DNA, 및 상동성 ITR2를 가진 대조군 AAV 조제물(CTRL)의 알칼리 서던 블롯 분석이다. 각각의 게놈의 예상된 크기는 각각의 레인 아래에 표시되어 있다. 분자량 마커(kb)는 좌측 5': 5'-하프 벡터; 3': 3'-하프 벡터 상에 표시되어 있다. (도 3b 내지 도 3d)는 ITR2 역가(도 3b 및 도 3c) 또는 이식유전자 역가(도 3b 및 도 3d)를 기반으로 한 m.o.i.에서 이종성 ITR2 및 ITR5, 또는 상동성 ITR2를 가진 이중 AAV2/2 하이브리드 ABCA4 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석 및 정량화이다. 웨스턴 블롯 이미지(도 3b)는 n = 3개의 독립적인 실험을 대표하며; 정량화(도 3c 및 도 3d)는 n = 3개의 독립적인 실험으로부터 유래된 것이다. (도 3b)에서, 상부 화살표는 전장 ABCA4 단백질을 가리키고, 하부 화살표는 절단된 단백질을 가리키며; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지 아래에 표시되어 있다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 사용된 항-필라민 A 항체를 이용한 웨스턴 블롯이다. (도 3c 및 도 3d)는 ITR2 역가(도 3c) 또는 이식유전자 역가(도 3d)를 기반으로 한 용량의 벡터에 의해 감염된 세포의 웨스턴 블롯으로부터, 전장 ABCA4 단백질 및 절단된 ABCA4 단백질의 밴드를 정량화한 것이다. 막대 그래프는, 필라민 A 밴드의 강도로 나눈 전장 단백질 및 절단된 단백질 밴드의 강도, 또는 절단된 단백질 밴드의 강도로 나눈 전장 단백질 밴드의 강도를 상응하는 레인에 보여준다. MYO7A를 인코딩하는 이종성 ITR2 및 ITR5, 또는 상동성 ITR2를 가진 이중 AAV2(AAV 혈청형 2) 하이브리드 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석 및 정량화가 도시되어 있다(도 3e, 도 3f). 웨스턴 블롯 이미지(도 3e)는 대표적인 것이고, 정량화(도 3f)는 n = 3개의 독립적인 실험으로부터 유래된 것이다. (도 3e)에서, 상부 화살표는 전장 단백질을 가리키며, 하부 화살표는 절단된 단백질을 가리키고, 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지의 아래에 표시되어 있다. (도 3f)는 웨스턴 블롯 분석으로부터의 MYO7A 단백질 밴드의 정량화이다.
평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. *p 스튜던츠 t 테스트 ≤ 0.05.
2:2 2:2: AAV2 유래의 상동성 ITR을 가진 이중 AAV 하이브리드 벡터에 의해 감염된 세포; 5:2 2:5: AAV2 및 AAV5 유래의 이종성 ITR을 가진 이중 AAV 하이브리드 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, EGFP-발현 벡터에 의해 감염된 세포이다.
도 4. 5'-하프 벡터에 miR 표적 부위를 포함시키는 것은 절단된 단백질 생성물을 유의하게 감소시키지 않는다
miR-let7b(좌측 패널), miR-204+124(중앙 패널) 또는 miR-26a(우측 패널)에 대한 miR 표적 부위를 함유하는, ABCA4를 인코딩하는 이중 AAV2/2(AAV 혈청형 2) 하이브리드 벡터에 의해 감염된 HEK293 세포의 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 절단된 단백질을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 이미지의 아래에 표시되어 있다. 5'+3': miR 표적 부위가 없는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'+3'+스크램블: 스크램블(scramble) miR 모방체의 존재 하에, miR 표적 부위가 없는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3': miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3'+스크램블: 스크램블 miR 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+3'+모방체 let7b: mir-let7b 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5': miR 표적 부위가 없는 5'-하프 벡터에 의해 감염된 세포; 5'mir: 스크램블 miR 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; 5'mir+모방체 let7b: mir-let7b 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; neg: 3'-하프 벡터 또는 EGFP-발현 벡터에 의해 감염된 대조군 세포; 5'mir+3'+모방체 204+124: mir-204 및 124 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+모방체 204+124: mir-204 및 124 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포; 5'mir+3'+모방체 26a: mir-26a 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포; 5'mir+모방체 26a: mir-26a 모방체의 존재 하에, miR 표적 부위를 함유하는 5'-하프 벡터에 의해 감염된 세포이다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A는 로딩 대조군으로서 항-필라민 A 항체를 이용한 웨스턴 블롯이다.
스크램블 서열은 상이한 miRNA의 서열에 상응하며, 예를 들어 mir-let7b 모방체를 이용한 실험에서 스크램블 서열은 miR26a의 서열이었다.
도 5. 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것은 절단된 단백질 생성물을 유의하게 감소시킨다
ABCA4를 인코딩하고 CL1 분해 신호를 함유하거나 또는 함유하지 않는 (도 5a) 이중 AAV2/2(AAV 혈청형 2로서, AAV2 유래의 상동성 ITR을 가짐) 하이브리드 벡터에 의해 감염된 HEK293 세포, 또는 (도 5b) 이중 AAV2/8(AAV 혈청형 8로서, AAV2 유래의 상동성 ITR을 가짐) 하이브리드 벡터를 주사한 후 1개월째의 돼지 눈(RPE+망막)에 대한 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 5'-하프 벡터로부터 절단된 단백질을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 각각의 이미지 아래에 표시되어 있다. 5'+3': CL1이 없는 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포 또는 공동-주사된 눈; 5'-CL1+3': CL1을 함유하는 5'-하프 벡터, 및 3'-하프 벡터에 의해 공동-감염된 세포 또는 공동-주사된 눈; 5': CL1이 없는 5'-하프 벡터에 의해 감염된 세포; 5'-CL1: CL1을 함유하는 5'-하프 벡터에 의해 감염된 세포; neg: 음성 대조군으로서, 3'-하프 벡터 또는 EGFP-발현 벡터에 의해 감염된 대조군 세포 또는 주사된 대조군 눈; α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 사용된 항-필라민 A 항체를 이용한 웨스턴 블롯이고; α-디스페린: 로딩 대조군으로서 사용된 항-디스페린 항체를 이용한 웨스턴 블롯이다. (도 5a)에서, 웨스턴 블롯 이미지는 n = 3개의 독립적인 실험을 대표한다. (도 5b)에서, 웨스턴 블롯 이미지는 5'+3' 벡터가 주사된 n = 5개의 눈, 5'-CL1+3' 벡터가 주사된 n = 2개의 눈, 및 음성 대조군으로서 3'-하프 벡터 또는 EGFP-발현 벡터가 주사된 n = 5개의 눈을 대표한다.
도 6. 3'-하프 벡터에 분해 신호를 포함시키는 것은 절단된 단백질 생성물을 약간 감소시킨다
ABCA4를 인코딩하고 상이한 분해 신호를 함유하는 이중 AAV2/2 하이브리드 벡터에 의해 감염된 HEK293 세포에 대한 대표적인 웨스턴 블롯 분석이 도시되어 있다. 상부 화살표는 전장 ABCA4 단백질을 가리키며, 하부 화살표는 절단된 단백질 생성물을 가리키고; 분자량 사다리는 좌측 상에 표시되어 있다. 로딩된 단백질의 ㎍은 각각의 이미지 아래에 표시되어 있다. 5'+3': 분해 신호 없이, 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포; 5': 5'-하프 벡터에 의해 감염된 세포; 3'(표지 없음): 분해 신호 없이 3'-하프 벡터에 의해 감염된 세포; 정지(STOP): 정지 코돈을 함유하는 3'-하프 벡터에 의해 감염된 세포; PB29: PB29 분해 신호를 함유하는 3'-하프 벡터에 의해 감염된 세포; 3xPB29: PB29 분해 신호의 3개의 탠덤 복사체를 함유하는 3'-하프 벡터에 의해 감염된 세포; 유비퀴틴: 유비퀴틴 분해 신호를 함유하는 3'-하프 벡터에 의해 감염된 세포이다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-필라민 A: 로딩 대조군으로서 항-필라민 A 항체를 이용한 웨스턴 블롯이다.
도 7: 본 발명의 바람직한 실시형태에 사용된 ALPP(태반 알칼리 포스파타제) 유래의 상동성의 AP, AP1 및 AP2 영역의 모식도이다. CDS: 코딩 서열이다.
도 8: 개선된 이중 AAV 벡터의 망막하 전달은 마우스 광수용기에서 ABCA4 발현, 및 Abca4 -/- 마우스 망막에서 리포푸신 ( lipofuscin ) 축적의 유의한 감소를 초래한다. (도a)는 이중 AAV2/8 하이브리드 ABCA4 벡터(5' + 3') 또는 음성 대조군(neg)이 주사된 C57BL/6 망막(전체 망막 용해물)의 대표적인 웨스턴 블롯 분석이다. 화살표는 전장 단백질을 가리키고, 분자량 사다리는 좌측 상에 표시되어 있다. α-3xflag: 항-3xflag 항체를 이용한 웨스턴 블롯이며; α-디스페린: 로딩 대조군으로서 사용된 항-디스페린 항체를 이용한 웨스턴 블롯이다. (도 8b 및 도 8c)는, 대조군으로서 주사되지 않거나 또는 AAV가 주사된 유색(pigmented) Abca4+/- 마우스(Abca4+/-), 또는 주사되지 않거나(Abca4-/-) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 유색 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 망막(RPE 또는 RPE + OS)에서 리포푸신 자가형광(적색 신호)에 대한 대표적인 도면(도 8b) 및 정량화(도 8c)이다. (도 8b)에서, 축척 막대(75 ㎛)가 도면에 표시되어 있다. RPE: 망막 색소 상피; ONL: 외과립층(outer nuclear layer); INL: 내과립층(inner nuclear layer); GCL: 신경절 세포층. 화살표는 리포푸신 신호를 가리킨다. (도 8c)는 각각의 시료에 대한 3개의 박편들의 측두측(temporal side)에서의 평균 리포푸신 자가형광이다. 각각의 박편에서의 평균 자가형광을 기저 RPE의 길이에 대하여 정규화하였다. 평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. ***p ANOVA < 0.0001. 각각의 그룹에 대해 n = 4개의 눈. (도 8d)는, 주사되지 않거나(Abca4+/+ not inj) 또는 PBS가 주사된 알비노 Abca4+/+ 마우스(Abca4+/+ PBS), 및 PBS가 주사되거나(Abca4-/- PBS) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 알비노 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 1개 망막 당 적어도 40개의 필드(25 ㎛2)에서 계수된 RPE 리포푸신 과립의 평균 수이다. 평균값은 상응하는 막대 위에 표시되어 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. *pANOVA ≤ 0.05; **pANOVA ≤0.01. Abca4+/+ not inj로부터 n = 4개의 눈; Abca4+/+ PBS로부터 n = 4개의 눈; Abca4-/- PBS로부터 n = 3개의 눈; Abca4-/- AAV5'+ 3'로부터 n = 3개의 눈.
도 9: 마우스 및 돼지의 음성 대조군 또는 개선된 이중 AAV -처리된 눈 사이의 유사한 전기적 활성이다. (도 9a)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 음성 대조군(즉, 음성 대조군 AAV 벡터 또는 PBS; neg)을 주사한 후 1개월째에, C57BL/6 마우스의 평균 a-파(좌측 패널) 및 b-파(우측 패널)의 진폭이다. 데이터는 평균 ± s.e.m.으로 제시되어 있으며; n은 분석된 눈의 갯수를 가리킨다.
(도 9b)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 PBS를 주사한 후 1개월째에, 돼지에서 암순응(scotopic), 최대 반응, 명순응(photopic) 및 깜박거림 ERG 시험에서의 평균 b-파 진폭(μV)이다. 이중 AAV 하이브리드 ABCA4 벡터가 주사된 n = 5개의 눈; PBS가 주사된 n = 4개의 눈; *: n = 2.
도 10: 돼지의 간상체 광수용기 및 추상체 광수용기에서 IRBP 프로모터 및 GRK1 프로모터로부터의 EGFP 단백질 발현이다. 3월령의 라지 화이트종(Large White) 돼지 마우스에, AAV2/8-IRBP-EGFP 벡터 또는 AAV2/8-GRK1-EGFP 벡터를 각각 1x1011 GC/눈(eye)으로 망막하 주사하였다. 주사 후 4주째에 망막 냉동박편(cryosection)을 수득하고, 형광 현미경을 사용하여 EGFP를 분석하였다. (도 10a 내지 도 10b)는 PR 층에서의 형광 강도의 대표적인 이미지(도 10a) 및 정량화(도 10b)이다. 각각의 동물 그룹에 대해, 냉동박편 상에서의 형광 강도를 정량화하였다(6개의 상이한 필드/눈; 20x 배율). (도 10c 내지 도 10d)는 추상체 형질도입 효율에 대한 대표적인 이미지(도 10c) 및 정량화(도 10d)이다. 추상체 형질도입 효율을, 항-LUMIf-hCAR 항체를 이용하여 면역염색한 냉동박편(6개의 상이한 필드/눈; 63x 배율) 상에서 평가하였으며, 각각의 필드에서 추상체(CAR+)의 총 수를 기준으로 하여 EGFP를 발현하는 추상체(EGFP+/CAR+)의 수로서 표현한다. (도 10a, 도 10c)에서, 축척 막대가 도면에 표시되어 있다. (도 10b 내지 도 10d)에서, AAV2/8-IRBP-EGFP 벡터가 주사된 n = 3개의 눈; AAV2/8-GRK1-EGFP 벡터가 주사된 n = 3개의 눈이 있다. 값은 평균 ± s.e.m.으로서 나타나 있다. 스튜던츠 t-테스트를 사용하여 확인 시, 유의한 차이가 발견되지 않았다. OS: 외부 분절(outer segment); ONL: 외과립층; EGFP: 본래의(native) EGFP 형광; CAR: 항-추상체 어레스틴 염색(anti-cone arrestin staining); DAPI: 4',6'-다이아미디노-2-페닐인돌 염색. 화살표는 형질도입된 추상체를 가리킨다.
도 11: 개선된 이중 AAV 벡터의 망막하 전달은 Abca4 -/- 마우스 망막에서 리포푸신 축적을 유의하게 감소시킨다. 대조군으로서 주사되지 않거나 또는 AAV가 주사된 유색 Abca4+/- 마우스(Abca4+/-), 또는 주사되지 않거나(Abca4-/-) 또는 이중 AAV 하이브리드 ABCA4 벡터가 주사된 유색 Abca4-/- 마우스(Abca4-/- AAV5'+3')의 망막(RPE 또는 RPE+OS)에서 리포푸신 자가형광(적색 신호)을 보여주는 망막 단면의 측두측(주사된 면)의 이미지에 대한 몽타주가 도시되어 있다. 각각의 그룹에 대해 n = 4개의 눈. T: 측두측; N: 비측(nasal side)이다.
도 12: 마우스 및 돼지의 음성 대조군 또는 개선된 이중 AAV -처리된 눈 사이의 유사한 전기적 활성이다. (도 12a)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 음성 대조군(즉, 음성 대조군 AAV 벡터 또는 PBS; neg)을 주사한 후 1개월째에, C57BL/6 마우스로부터의 대표적인 EFG 트레이스(trace)이다. (도 12b)는 이중 AAV 하이브리드 ABCA4 벡터(AAV5'+ 3') 또는 PBS를 주사한 후 1개월째에, 돼지에서의 암순응, 최대 반응, 명순응 및 깜박거림 ERG 시험 시, 대표적인 트레이스이다.
도 13. 본 발명의 실시예에 따른 벡터 시스템 전략의 모식도이다. (도 13a)는 본 발명의 바람직한 실시형태에 따라 2개의 벡터로 구성된 벡터 시스템의 모식도이다: 제1 벡터는 코딩 서열의 제1 부분(CDS1 부분)을 포함하며, 제2 벡터는 코딩 서열의 제2 부분(CDS2 부분)을 포함한다. (도 13A1)에서, 벡터 시스템의 재구축 서열은 코딩 서열 부분의 오버래핑 말단으로 구성된다. (도 13A2)에서, 제1 벡터 및 제2 벡터의 재구축 서열들은 각각 스플라이싱 공여자 및 스플라이싱 수여자 서열로 구성된다. (도 13A3)에서, 각각의 재구축 서열은 도 13A2에서와 같이 배열된 스플라이싱 공여자/수여자를 포함하고, 이는 재조합유전성 영역을 더 포함한다. 분해 신호가 적어도 하나의 벡터에 포함된다. 도면은 본 발명의 바람직한 비제한적인 실시형태에 따라 벡터 시스템의 하나 이상의 분해 신호의 모든 잠재적인 위치를 각각의 벡터에 대해 나타낸다.
(도 13b)는 본 발명의 바람직한 실시형태에 따라 3개의 벡터로 구성된 벡터 시스템의 모식도이다: 제1 벡터는 코딩 서열의 제1 부분(CDS1 부분)을 포함하며, 제2 벡터는 코딩 서열의 제2 부분(CDS2 부분)을 포함하고, 제3 벡터는 코딩 서열의 제3 부분(CDS3 부분)을 포함한다. (도 13B1)에서, 벡터 시스템의 재구축 서열은 코딩 서열 부분의 오버래핑 말단(CDS1의 3' 말단은 CDS2의 5' 말단과 오버래핑되고; CDS2의 3' 말단 오버래핑은 CDS3의 5' 말단과 오버래핑됨)으로 구성된다. (도 13B2)에서, 제1 벡터의 재구축 서열은 스플라이싱 공여자로 구성되며, 제1 벡터의 재구축 서열은 스플라이싱 공여자로 구성되며; 제2 벡터는 CDS2의 5' 말단에 제1 재구축 서열 및 CDS2의 3' 말단에 제2 재구축 서열을 포함하고, 제1 재구축 서열은 스플라이싱 수여자이고 제2 재구축 서열은 스플라이싱 공여자이며; 제3 벡터의 재구축 서열은 스플라이싱 수여자로 구성된다. (도 13B3)에서, 각각의 재구축 서열은 도 13B2에서와 같이 배열된 스플라이싱 공여자/수여자를 포함하고, 재조합유전성 영역을 더 포함한다. 분해 신호가 적어도 하나의 벡터에 포함된다. 도면은 본 발명의 바람직한 비제한적인 실시형태에 따라 벡터 시스템의 하나 이상의 분해 신호의 모든 잠재적인 위치를 각각의 벡터에 대해 나타낸다.
CDS, 코딩 서열; SD, 스플라이싱 공여자 신호; RR: 재조합유전성 영역; Deg Sig; 분해 신호 (표 2 참조); SA, 스플라이싱 수여자 신호.
도 14. 큰 유전자 형질도입을 위한 선행 기술의 다중 벡터-기반 전략의 모식도이다. CDS: 코딩 서열; pA: 폴리아데닐화 신호; SD: 스플라이싱 공여자 신호; SA: 스플라이싱 수여자 신호; AP: 알칼리 포스파타제 재조합유전성 영역; AK: F1 파지 재조합유전성 영역이다. 점선은 SD와 SA 사이에서 발생하는 스플라이싱을 보여주며, 포인트선(pointed line)은 상동성 재조합에 이용 가능한 오버래핑 영역들을 보여준다. 정상 크기 및 오버사이즈 AAV 벡터 플라스미드는 프로모터, 전장 이식유전자 CDS 및 폴리아데닐화 신호(pA)를 포함하는 전장 발현 카세트를 함유하였다. 이중 AAV 벡터를 생성하는 데 필요한 2개의 개별 AAV 벡터 플라스미드(5' 및 3')는 이식유전자 CDS의 N-말단 부분 앞에 프로모터(5' 플라스미드), 또는 이식유전자 CDS의 C-말단 부분 다음에 pA 신호(3' 플라스미드)를 함유하였다.
재료 및 방법
플라스미드의 생성
AAV 벡터 생성에 사용된 플라스미드는 모두, AAV 혈청형 214의 반전 말단 반복부(ITR)를 함유하는 인간 ABCA4 , 인간 MYO7A 또는 EGFP 리포터 단백질을 인코딩하는 이중 하이브리드 AK 벡터 플라스미드로부터 유래되었다.
ABCA4를 인코딩하는 벡터 플라스미드에 함유된 AK 재조합유전성 서열14을 알칼리 포스파타제 유전자로부터 유래된 3개의 상이한 재조합유전성 서열: AP(NM_001632, bp 823-110014); AP1(XM_005246439.2, bp1802-151620); AP2(XM_005246439.2, bp 1225-93820)로 대체하였다.
AAV 혈청형 2 유래의 이종성 ITR(ITR2) 및 AAV 혈청형 5 유래의 ITR(ITR5)을 5:2-2:5 배치로 갖는 이중 AAV 벡터 플라스미드는, 5'-하프 벡터 플라스미드 내의 좌측 ITR2 및 3'-하프 벡터 플라스미드 내의 우측 ITR2를 각각 ITR5(NC_006152.1, bp 1-175)로 대체함으로써 생성하였다. 이종성 ITR2 및 ITR5를 2:5 또는 5:2 배치로 갖는 이중 AAV 벡터 플라스미드는, 우측 또는 좌측 ITR2를 각각 ITR5로 대체함으로써 생성하였다. Rep5(NC_006152.1, bp 171-2206) 및 AAV2 Cap(AF043303 bp2203-2208) 유전자를 함유하는 pAAV5/2 패키징 플라스미드(Rep5Cap2)는, AAV2 유래의 Rep(AF043303 bp321-1993) 및 Cap(AF043303 bp2203-2208) 유전자를 함유하는 pAAV2/2 패키징 플라스미드(Rep2Cap2)로부터 상기 Rep2 유전자를 AAV5 유래의 Rep5 개방형 해독틀(NC_006152.1, bp 171-2206)로 대체함으로써 수득하였다.
ITR5를 가진 EGFP 발현 카세트를 함유하는 pZac5:5-CMV-EGFP 플라스미드는, EGFP 발현 카세트45 측면에 ITR2를 함유하는 pAAV2.1-CMV-EGFP 플라스미드로부터 생성하였다.
분해 신호를, ABCA4를 인코딩하는 이중 AAV 하이브리드 AK 벡터에서 하기와 같이 클로닝하였다: AK 서열과 우측 ITR2 사이에 5'-하프 벡터 플라스미드; AK 서열과 스플라이스 수여자 신호 사이에 3'-하프 벡터 플라스미드. 분해 신호 서열에 대한 상세한 사항은 표 2에서 확인할 수 있다.
표 2. 본 연구에서 사용된 분해 신호
밑줄 표시된 서열은 분해 신호에 상응하며; 반복된 서열을 포함하는 분해 신호의 경우, 클로닝을 목적으로 반복된 서열들 사이에 포함된 뉴클레오타이드는 밑줄 표시가 되어 있지 않다.
이중 AAV 벡터로부터 발현된 ABCA4 단백질에, 도 3, 도 4 및 도 6에 나타낸 실험의 경우 N-말단(아미노산 위치 590) 및 C-말단 모두에서 3xflag를 태깅(tagging)하고, 도 2 및 도 8a의 실험의 경우 C-말단에서만 태깅한다.
본 연구에서 사용된 ABCA4를 인코딩하는 이중 AAV 하이브리드 벡터 세트는 유비쿼터스(ubiquitous) CMV46 프로모터 또는 PR-특이적인 인간 G 단백질-커플링된 수용체 키나제 1(GRK1)47 프로모터를 포함하였으며, 한편 MYO7A를 인코딩하는 이중 AAV 하이브리드 벡터는 유비쿼터스 CBA 프로모터39를 포함하였다.
AAV
벡터 생성 및 특성 확인
AAV 벡터 대용량 조제물을, HEK293 세포의 삼중 형질감염 및 후속해서 2회의 CsCl2 정제에 의해 TIGEM AAV 벡터 코어에 의해 제조하였다. 상동성 ITR2를 갖는 AAV 벡터를 이전에 보고된 바와 같이 수득하였다48.
이종성 ITR2 및 ITR5를 갖는 AAV 벡터를 수득하기 위해, 1.1x109개의 저-계대배양(low-passage) HEK293 세포의 현탁액을, Ad 헬퍼 유전자49를 함유하는 500 ㎍의 pDeltaF6 헬퍼 플라스미드, 260 ㎍의 pAAV cis-플라스미드 및 상이한 양의 Rep2Cap2 및 Rep5 패키징 구축물을 이용하여 칼슘 포스페이트에 의해 사중-형질감염시켰다. Rep2Cap2 및 Rep5 패키징 구축물의 양은 하기와 같았다:
(i) 프로토콜 A: 130 ㎍의 Rep5 및 130 ㎍의 Rep2Cap2 (비율 1:1)
(ii) 프로토콜 B: 90 ㎍의 Rep5 및 260 ㎍의 Rep2Cap2 (비율 1:3)
(iii) 프로토콜 C: 26 ㎍의 Rep5 및 260 ㎍의 Rep2Cap2 (비율 1:10)
그런 다음, 각각의 AAV 조제물을 공개된 프로토콜48에 따라 정제하였다.
하기 기재된 프로토콜을 Rep 경쟁 실험에 사용하였다:
1- ITR2를 가진 AAV 벡터의 제조에 있어서 Rep2와의 Rep5의 경쟁을 평가하기 위해, HEK293 세포를, pDeltaF6, pAAV2.1-CMV-EGFP cis, Rep2Cap2 및 Rep5Cap2 구축물을 2:1:1.5:1.5의 중량비로 이용하여 칼슘 포스페이트에 의해 사중-형질감염시키거나, 또는 대조군으로서 pDeltaF6, pAAV2.1-CMV-EGFP, Rep2Cap2 패키징 구축물 및 대조군 무관련(irrelevant) 플라스미드를 2:1:1.5:1.5의 중량비로 이용하여 사중-형질감염시켰으며;
2- ITR5를 가진 AAV 벡터의 제조에 있어서 Rep5와의 Rep2의 경쟁을 평가하기 위해, HEK293 세포를, pDeltaF6, pZac5:5-CMV-EGFP, Rep5Cap2 및 Rep2Cap2 구축물을 2:1:1.5:1.5의 중량비로 이용하여 칼슘 포스페이트에 의해 사중-형질감염시키거나, 또는 대조군으로서 pDeltaF6, pZac5:5-CMV-EGFP, Rep5 구축물 및 대조군 무관련 플라스미드를 2:1:1.5:1.5의 중량비로 이용하여 사중-형질감염시켰다.
대규모 AAV 벡터 조제물에 있어서, ITR2 상에 어닐링하고 있는 프로브와 함께 TaqMan(Applied Biosystem, Carlsbad, CA, USA)48을 사용한 PCR 정량화에 의해 달성된 역가, 및 ITR2로부터 1 kb 내에서 어닐링하고 있는 프로브를 이용한 도트-블롯 분석50에 의해 수득된 역가의 평균을 냄으로써, 물리적 역가[게놈 복사체(GC)/mL]를 확인하였다. 상이한 Rep5:Rep2Cap2 중량비로 제조된 대규모 AAV 벡터 조제물에 있어서, ITR2 상에 어닐링하고 있는 프로브와 함께 TaqMan을 사용한 PCR 정량화에 의해 물리적 역가[게놈 복사체(GC)/mL]를 확인하였다. 경쟁 실험에 사용된 AAV 벡터 조제물에 있어서, AAV 벡터에 패키징된 EGFP-발현 카세트에 포함된 소 성장 호르몬(BGH) 폴리아데닐화 신호 상에 어닐링하고 있는 프로브와 함께 TaqMan을 사용한 PCR 정량화에 의해 물리적 역가[게놈 복사체(GC)/mL]를 확인하였다.
HEK293
세포의
AAV
감염
HEK293 세포의 AAV 감염을 이전에 보고된 바와 같이 수행하였다14. 이종성 ITR2 및 ITR5를 가지며 프로토콜 C에 따라 제조된 AAV2 벡터를 사용하여 HEK293 세포를 감염시키되, 각각의 바이러스 조제물에 대해 달성된 최저 역가를 고려하여 계산된, 각각의 벡터 당 1x104 GC/세포의 감염 다중도(m.o.i; multiplicity of infection)(발명자들이 1:1 비율의 이중 AAV 벡터를 사용한 경우, 총 2x104 GC/세포)로 상기 세포를 감염시켰다. 재조합유전성 영역 및 분해 신호를 갖는 AAV2/2에 의한 감염을, TaqMan과 도트-블롯 사이의 평균 역가를 고려하여 계산된, 각각의 벡터 당 5x104 GC/세포의 m.o.i(1:1 비율의 이중 AAV 벡터의 경우 총 1x105 GC/세포)로 수행하였다.
miR 표적 부위를 함유하는 5'-하프 벡터를 사용한 실험의 경우, 세포를 칼슘 포스페이트를 사용하여 4시간 동안 형질감염시킨 후, 상응하는 miR 모방체(50 nM; miRIDIAN 마이크로RNA 모방체 hsa-let-7b-5p, hsa-miR-204-5p, hsa-miR-124-3p 및 hsa-miR-26a-5p; Dharmacon, Lafayette, CO, USA)를 사용하여 감염시켰다.
마우스 및 돼지에서
AAV
벡터의
망막하
주사
마우스를, 유전학 및 생물리학 동물 하우스 기관(Naples, Italy)에서 12시간 명/암 사이클(광기(light phase) 동안 10 lux 내지 50 lux에 노출됨) 하에 유지시키면서 사육하였다. C57BL/6 마우스를 Harlan Italy SRL(Udine, Italy)사로부터 구입하였다. 유색 Abca4 -/- 마우스를 알비노 Abca4-/- 마우스14와 Sv129 마우스의 연속 이종 교배를 통해 발생시키고, 동종 번식시켜 유지시켰으며; 이종성 마우스와 동종성 마우스를 이종 교배시켜 번식시켰다. 알비노 Abca4 -/- 마우스를 BALB/c 마우스(Rpe65 Leu450에 대해 동종성임)와 연속적인 이종 교배 및 역교배를 통해 발생시켰으며, 동종 번식시켜 유지시켰고; 이종성 마우스와 동종성 마우스를 이종 교배시켜 번식시켰다. C57BL/6(5주령), 유색 Abca4 -/-(5.5월령) 및 알비노 Abca4 -/-(2.5월령 내지 3월령) 마우스를 이전에 보고된 바와 같이 마취시킨 다음61, 1 ㎕의 PBS 또는 AAV2/8 벡터를 Liang 등62에 의해 보고된 바와 같이 경공막 경맥락막(trans-scleral trans-choroidal) 접근법을 통해 망막의 측두측에 망막하로 전달하였다. AAV2/5-VMD2-인간 티로시나제63(용량: 2x108 GC/눈)를, 알비노 Abca4 -/- 마우스에 망막하로 전달되는 AAV2/8 벡터 용액에 첨가하였다(도 8d). 이로써, 본 발명자들은 아이컵(eyecup)의 형질도입된 부분 내에서 RPE를 마킹할 수 있었으며, 후속해서 상기 아이컵을 해부 및 분석하였다.
이 연구에 사용된 라지 화이트종 암컷 돼지를 이탈리아 돼지 사육 협회의 LW 허드 북(LW Herd Book)에 순혈종으로서 등록시켰다. 돼지를 카르다렐리(Cardarelli) 병원 동물 하우스(Naples, Italy)에서 12시간 명/암 사이클(광기 동안 10 lux 내지 50 lux에 노출됨) 하에 유지시키면서 사육하였다. 이 연구를 안과 및 시력 연구에서의 동물의 사용에 대한 시력 및 안과학 성명에서의 연구 협회(Association for Research in Vision and Ophthalmology Statement for the Use of Animals in Ophthalmic and Vision Research), 및 동물 시술에 대한 이탈리아 보건성(Italian Ministry of Health) 법규에 따라 수행하였다. 모든 시술들을 이탈리아 보건성; 공공보건국, 동물 건강, 영양 및 식품 안전성(Italian Ministry of Health; Department of Public Health, Animal Health, Nutrition and Food Safety)에 제출하였다. 수술은 마취 하에 수행하였고, 고통을 최소화하기 위해 모든 노력을 다하였다. 동물을 이전에 보고된 바와 같이 안락사시켰다39. 3월령 돼지에 대한 AAV 벡터의 망막하 전달을 이전에 보고된 바와 같이 수행하였다39. 모든 눈에 100 ㎕의 PBS 또는 AAV2/8 벡터 용액을 처리하였다. AAV2/8 용량은 각각의 벡터 당 1x1011 GC/눈이었으며, 따라서 1:1 비율의 이중 AAV 벡터의 공동-주사에는 총 2x1011 GC/눈의 용량이 필요하였다.
도 2c, 도 5b, 도 8, 도 9, 도 10, 도 11 및 도 12에 포함된 동물 연구의 경우, 우측 눈 및 좌측 눈을 다양한 실험군들에 무작위로 할당하였으며, 이 실험을 수행하고 정량화하는 연구원들은 동물이 받는 치료에 대해 맹검이었다.
웨스턴
블롯
분석
웨스턴 블롯 분석을 위해, HEK293 세포, 마우스 및 돼지 망막을 RIPA 완충제(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP40, 0.5% Na-데옥시콜레이트, 1 mM EDTA pH 8.0, 0.1% SDS)에서 용해시켰다. 용해 완충제에 프로테아제 저해제(완전 프로테아제 저해제 칵테일 정제; Roche) 및 1 mM 페닐메틸설포닐을 보충하였다. 용해 후, MYO7A를 함유하는 세포의 시료를 1X Laemli 시료 완충제 내에서 99℃에서 5분 동안 변성시켰으며; ABCA4를 함유하는 시료를 4 M 우레아가 보충된 1X Laemli 시료 완충제 내에서 37℃에서 15분 동안 변성시켰다. 용해물을 6% 내지 7%(각각 ABCA4 시료 및 MYO7A 시료) 또는 8%(도 5b에서 WB) SDS-폴리아크릴아마이드 겔 전기영동에 의해 분리하였으며, 면역-블로팅에 사용한 항체는 하기와 같다: 항-3xflag(1:1000, A8592; Sigma-Aldrich); 인간 MYO7A 단백질의 아미노산 941-1070에 상응하는 펩타이드를 사용하여 생성된 항-MYO7A(1:500, 폴리클로날; Primm Srl, Milan, Italy); 항-필라민 A(1:1000, 카탈로그 #4762; Cell Signaling Technology, Danvers, MA, USA); 항-디스페린(1:500, 디스페린, 클론 Ham1/7B6, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). 웨스턴 블롯에 의해 검출된 ABCA4 밴드 및 MYO7A 밴드의 정량화를 ImageJ 소프트웨어(http://rsbweb.nih.gov/ij/에서 이용 가능한 프리 다운로드)를 사용하여 수행하였다. 이종성 ITR2 및 ITR5를 가진 AAV를 이용하여 수행된 시험관내 실험의 경우, 전장 ABCA4 및 MYO7A 밴드의 강도를, 상응하는 레인의 절단된 단백질 생성물의 강도 또는 필라민 A 밴드의 강도에 대해 정규화하였으며, 한편 더 짧은 ABCA4 및 MYO7A 단백질 밴드의 강도를 필라민 A 밴드의 강도에 대해 정규화하였다. 분해 신호 또는 상동성 영역을 갖는 AAV 벡터를 이용하여 달성된 ABCA4 밴드의 강도를 시험관내 실험의 경우 필라민 A 밴드의 강도 또는 생체내 실험의 경우 디스페린 밴드의 강도에 대해 정규화하였다.
웨스턴 블롯 실험의 정량화를 하기와 같이 수행하였다:
- 도 2a 내지 도 2b: ABCA4 밴드의 강도를 상응하는 레인에서 필라민 A 밴드의 강도에 대해 정규화하였다. 그런 다음, 정규화된 ABCA4 발현을 이중 AAV 하이브리드 AK 벡터에 대한 퍼센트로서 표현하였다;
- 도 2c: ABCA4 밴드의 강도(a.u.)를 각각의 겔의 음성 대조군 레인에서 동일한 수준에서 측정된 평균 강도에 대한 증가의 배수로서 계산하였다(하부 좌측 패널의 레인 7에서의 음성 대조군 시료의 측정은 이례적으로 높은 백그라운드 신호로 인해 분석으로부터 배제하였음). 각각의 그룹에 대한 값을 평균 ± 평균의 표준 오차(s.e.m.)로서 나타낸다;
- 도 3b 내지 도 3d: 전장 ABCA4 및 절단된 단백질 밴드 강도를 필라민 A 밴드의 강도로 나누거나, 또는 전장 ABCA4 단백질 밴드의 강도를 상응하는 레인에서의 절단된 단백질 밴드의 강도로 나누었다. 값은 평균 ± s.e.m.으로서 나타나 있다;
- 표 5: 전장 ABCA4 및 절단된 단백질 밴드 강도를 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포에서 측정하였다. 전장 ABCA4 및 절단된 단백질 밴드의 강도들 사이의 비율을 상응하는 모방체 또는 스크램블 모방체의 존재 하에 계산하였다. 값은 3개의 독립적인 실험들로부터의 비율의 평균 ± s.e.m.을 나타낸다;
- 표 6: 전장 ABCA4 및 절단된 단백질 밴드 강도를 5'-하프 벡터 및 3'-하프 벡터에 의해 공동-감염된 세포에서 측정하였다. 분해 신호를 갖거나 또는 갖지 않는 벡터로부터의 전장 ABCA4 및 절단된 밴드의 강도들 사이의 비율을 계산하였다. 값은 3개의 독립적인 실험들로부터의 비율의 평균 ± s.e.m.을 나타낸다.
- 도 8a: ABCA4 밴드의 강도(a.u.)를 상응하는 겔의 음성 대조군 레인에서 측정된 평균 백그라운드 강도에 대한 증가 배수로서 계산하였다. 값은 평균 ± s.e.m.으로서 표현된다.
서던
블롯
분석
3 x 1010 GC의 바이러스 DNA를 AAV 입자로부터 추출하였다. 패키징되지 않은 게놈을 분해하기 위해, 벡터 용액을 240 ㎕의 PBS pH 7.4 19(GIBCO; Invitrogen S.R.L., Milan, Italy)에 재현탁시킨 다음, 40 mM TRIS-HCl, 10 mM NaCl, 6 mM MgCl2, 1 mM CaCl2 pH 7.9를 함유하는 총 300 ㎕ 부피 중 1 U/㎕의 DNase I (Roche)와 함께 37℃에서 2시간 동안 인큐베이션하였다. 그런 다음, DNase I을 50 mM EDTA를 이용하여 불활성화시키고, 후속해서 프로테이나제 K 및 2.5% N-라우로일-사르코실 용액과 함께 50℃에서 45분 동안 인큐베이션하여, 캡시드를 용해시켰다. DNA를 페놀-클로로포름을 이용하여 2회 추출하고, 2 부피의 에탄올 100 및 10% 소듐 아세테이트(3 M, pH 7)를 이용하여 침전시켰다. 알칼리 아가로스 겔 전기영동 및 블로팅을 이전에 보고된 바와 같이 수행하였다(문헌[Sambrook & Russell, 2001 Molecular Cloning]). 10 ㎕의 1 kb DNA 사다리(N3232L; New England Biolabs, Ipswich, MA, USA)를 분자량 마커로서 로딩하였다. 2개의 상이한 이중 가닥 DNA 단편을 DIG 하이 프라임 DNA 표지화 및 검출 스타터 키트(Roche)를 사용하여 다이곡시게닌-dUTP를 이용하여 표지하였으며, 프로브로서 사용하였다. 5' 프로브(768 bp)는, pZac2.1-CMV-ABCA4_5' 플라스미드를 SpeI 및 NotI를 이용하여 이중 분해시켜 제조하였으며; 3' 프로브(974 bp)는, pZac2.1-ABCA4_3'_3xflag_SV40 플라스미드를 ClaI 및 MfeI를 이용하여 이중 분해시켜 제조하였다. 예비혼성화 및 혼성화를 65℃에서 Church 완충제(문헌[Sambrook & Russel, 2001 Molecular cloning])에서 각각 1시간 및 밤새 수행하였다. 그런 다음, 막(Whatman Nytran N, 하전된 나일론 막; Sigma-Aldrich, Milan, Italy)을 우선 SSC 29-0.1% SDS에서 30분 동안 세척하고, 그런 다음 65℃에서 SSC 0.59-0.1% SDS에서 30분 동안 세척한 다음, 37℃에서 SSC 0.19-0.1% SDS에서 30분 동안 세척하였다. 그런 다음, 상기 막을 DIG DNA 표지화 및 검출 키트(Roche)를 사용한 효소 면역검정법에 의한 화학발광 검출에 의해 분석하였다.
조직학적 분석
마우스를 안락사시키고, 이의 안구를 수집한 다음, 4% 파라포름알데하이드(PFA)에 침지시켜 밤새 고정시켰다. 안구를 수집하기 전에, 공막의 측두측(temporal aspect)을 소작술에 의해 마킹하여, 포함시키는 순간, 주사 부위에 대하여 눈을 배향시켰다. 아이컵을 온전하게 유지시키면서 수정체 및 유리체를 제거할 수 있도록 안구를 절단하였다. 냉동보존을 위해 마우스 아이컵에 30% 수크로스를 침윤시키고, 조직-동결 배지(O.C.T. 매트릭스; Kaltek, Padua, Italy)에서 포매시켰다. 각각의 눈에 대해, 150개 내지 200개의 연속 박편(10 ㎛ 두께)들을 수평면을 따라 절단하였고, 상기 박편들을 10개의 슬라이드 상에 점진적으로 분포시킴으로써, 각각의 슬라이드는, 상이한 수준에서 전체 눈을 각각 대표하는 15개 내지 20개의 박편들을 함유하게 되었다. 박편을 4',6'-다이아미디노-2-페닐인돌(Vectashield; Vector Lab, Peterborough, United Kingdom)을 사용하여 염색시키고, 상이한 배율에서 Zeiss Axiocam(Carl Zeiss, Oberkochen, Germany)를 이용하여 모니터링하였다.
돼지를 안락사시키고, 이의 안구를 수집한 다음, 4% PFA에 침지시켜 밤새 고정시켰다. 아이컵을 온전하게 유지시키면서 수정체 및 유리체를 제거할 수 있도록 안구를 절단하였다. 아이컵에 10%, 20% 및 30% 수크로스를 점진적으로 침윤시킴으로써 상기 아이컵을 점차 탈수시켰다. 조직-동결 배지(O.C.T. 매트릭스; Kaltek) 포매를 수행하였다. 포매 전에, 돼지의 아이컵을 형광 입체현미경(Leica Microsystem GmbH, Wetzlar, Germany)을 이용하여 분석하여, EGFP-인코딩 벡터를 투여할 때마다 형질도입된 영역을 위치화시켰다. 각각의 눈에 대해, 200개 내지 300개의 연속 박편(12 ㎛ 두께)들을 수평선을 따라 절단하였고, 상기 박편들을 유리 슬라이드 상에 점진적으로 분포시킴으로써, 각각의 슬라이드는 6개 내지 10개의 박편들을 함유하게 되었다. 박편 염색 및 이미지 획득을 마우스에 대해 보고된 바와 같이 수행하였다.
추상체
면역형광
염색
동결된 망막 박편을 PBS로 1회 세척한 다음, 0.1% Triton X-100을 함유하는 PBS에서 1시간 동안 침투시켰다. 10% 정상 염소 혈청(Sigma-Aldrich)을 함유하는 블록킹 용액을 1시간 동안 적용시켰다. 1차 항체[항-인간 CAR66 ,67로서, 돼지 CAR을 인지하기도 함("Luminaire founders"―hCAR, 1:10,000; Dr. Cheryl M. Craft가 친절하게 제공함, Doheny Eye Institute, Los Angeles, CA)]를 PBS로 희석하고, 4℃에서 밤새 인큐베이션하였다. 2차 항체(Alexa Fluor 594, 항-토끼, 1:1,000; 분자 프로브, Invitrogen, Carlsbad, CA)를 45분 동안 인큐베이션하였다. 항-CAR 항체를 이용하여 염색된 박편을 이전에 보고된 바와 같이64 레이카 레이저 공촛점 현미경 시스템(Leica Microsystem GmbH)을 사용하여 63x 배율에서 분석하였다. 간략하게는, 각각의 눈에 대해, 6개의 상이한 형질도입된 영역으로부터의 6개의 상이한 z-스택을 취하였다. 각각의 z-스택에 대해, 단일 플랜으로부터의 이미지를 사용하여, CAR+ /EGFP+ 세포를 계수하였다. 이를 수행할 때, 발명자들은 하나의 세포를 또 다른 세포와 구별하고 따라서 동일한 세포를 중복 계수하는 것을 피하기 위해, Z-축을 따라 조심스럽게 이동시켰다. 각각의 망막에 대해, 발명자들은 총 CAR+ 세포를 기준으로 CAR-양성(CAR+)/EGFP-양성(EGFP+) 세포를 계수하였다. 그런 다음, 발명자들은 각각의 실험군의 3개의 눈의 CAR+/EGFP+ 세포의 평균 수를 계산하였다.
EGFP
정량화
PR에서 형광 강도를 이전에 보고된 바와 같이64 비편향된 방식으로 철저하고 재현 가능하게 정량화하였다. 개별 색상 채널 이미지를 레이카 현미경(Leica Microsystem GmbH)을 사용하여 취하였다. TIFF 이미지를 이미지 분석 소프트웨어(LAS AF lite; Leica Microsystem GmbH)에 의해 그레이-스케일링(gray-scale)하였다. 각각의 눈의 6개 이미지를 맹검 관찰자에 의해 20x 배율에서 분석하였다. PR(외과립층 + OS)을 모든 이미지에서 선택적으로 도시하였으며, 밀폐된 영역에 대한 총 형광을 이미지 분석 소프트웨어를 사용하여 비편향된 방식으로 계산하였다. 그런 다음, PR에서의 형광을, 각각의 눈 유래의 개별 망막 박편으로부터 수집된 6개의 이미지로부터 평균을 내었다. 그런 다음, 발명자들은 각각의 실험군 당 3개의 눈에서의 평균 형광을 계산하였다.
리포푸신
자가형광의
정량화
리포푸신 형광 분석을 위해, AAV 주사 후 3개월째에 유색 Abca4 +/- 및 Abca4-/- 마우스로부터 눈을 수집하였다. 마우스를 밤새 암순응시켰으며, 희미한 적색광 하에 안락사시켰다. 각각의 눈에 대해, 눈의 상이한 영역으로부터 유래한 3개의 박편의 측두측으로부터 4개의 오버래핑 사진을, TX2 필터(여기: 560±40 nm; 방출: 645±75)71 -75가 장착된 레이카 DM5000B 현미경을 사용하여 20X 대물렌즈 하에 촬영하였다. 그런 다음, 각각의 박편에 대한 4개의 이미지를 추가의 형광 분석에 사용된 단일 몽타주에서 조합하였다. 각각의 박편에서의 리포푸신 형광(적색 신호)의 강도를 ImageJ 소프트웨어를 사용하여 자동적으로 계산하였으며, 그런 다음 형광 영역의 기저를 이루는 RPE의 길이에 대해 정규화하였다.
투과 전자 현미경
전자 현미경 분석을 위해, AAV 주사 후 3개월째에 알비노 Abca4 -/- 및 Abca4+/+ 마우스로부터 눈을 수집하였다. 눈을 0.1 M PHEM 완충제 pH 6.9(240 mM PIPES, 100 mM HEPES, 8 mM MgCl2, 40 mM EGTA) 중 0.2% 글루타르알데하이드-2% 파라포름알데하이드에서 밤새 고정한 다음, 0.1 M PHEM 완충제에서 헹구었다. 그런 다음, 눈을 광학 현미경 하에 해부하여, 아이컵의 티로시나제-양성 부분을 선택하였다. 후속해서, 아이컵의 형질도입된 부분을 12% 젤라틴에 포매시키고, 2.3 M 수크로스를 주입한 다음, 액체 질소에서 동결시켰다. 냉동박편(50 nm)을 레이카 울트라마이크로톰 EM FC7(Leica Microsystem)을 사용하여 절단하고, 섬모(cilia)를 연결하는 PR을 세로방향으로 정렬하는 데 있어서 극도의 주의를 기울였다. 형태학적 데이터를 다양한 실험군들에 귀속시키는 것과 관련하여 편견을 피하기 위해, 리포푸신 과립의 계수를 맹검 작업자(Dr. Roman Polishchuk)가 iTEM 소프트웨어(Olympus SYS, Hamburg, Germany)를 사용하여 수행하였다. iTEM 소프트웨어의 '터치 카운트' 모듈을 사용하여, RPE 층을 가로질러 무작위로 분포된 25 ㎛2 영역 내 리포푸신 과립의 수(적어도 40)를 계수하였다. 과립 밀도를 25 ㎛2 당 과립의 수로서 표현하였다.
망막 전위도 기록
마우스 및 돼지에서 전기생리학적 기록을 각각 (68) 및 (69)에서 보고된 바와 같이 수행하였다.
통계학적 분석
0.05 이하의 p-값은 통계학적으로 유의한 것으로 간주하였다. 사후 다중 비교 절차를 이용하는 원-웨이 ANOVA(R 통계학적 소프트웨어)를 사용하여, 도 2b(pANOVA= 1.2 x 10-6), 도 2c(pANOVA= 0.326), 도 8c(pANOVA= 1.5 x 10-10), 도 8d(pANOVA= 0.034) 및 도 9a(pANOVA a-파: 0.5; pANOVA b-파: 0.8) 및 표 6(pANOVA= 0.0135)에 도시된 데이터를 비교하였다. 리포푸신 과립(도 8d)의 계수가 이산형 수(discrete number)로서 표현되기 때문에, 이들을 음수 이항 일반화된 선형 모델(Negative Binomial generalized linear model)65로부터의 편차값에 의해 분석하였다. 사후 다중 비교 절차(post-hoc Multiple Comparison Procedure)를 이용하여 확인된 그룹들 사이에서의 통계학적으로 유의한 차이는 하기와 같다: 도 2b: AP vs AK: 1.08 x 10-5; AP1 vs AK: 0.05; AP2 vs AK: 0.17; AP1 vs AP: 1.8 x 10-6; AP2 vs AP: 2.8 x 10-6; AP2 vs AP1: 0.82. 도 8c: Abca4 +/- not inj vs Abca4 -/- not inj: 0.00; Abca4 -/- not inj vs Abca4 -/- AAV5'+3': 9.3 x 10-5; Abca4 +/- not inj vs Abca4 -/- AAV5'+3': 4 x 10-6. 도 8d: Abca4-/- PBS vs Abca4 -/- AAV5'+3': 0.01; Abca4 +/+ PBS vs Abca4 -/- AAV5'+3': 0.37; Abca4 +/+ not inj vs Abca4 -/- AAV5'+3': 0.53; Abca4 +/+ PBS vs Abca4 -/- PBS: 0.05; Abca4 +/+ not inj vs Abca4 -/- PBS: 0.03; Abca4 +/+ not inj vs Abca4+/+ PBS: 0.76. 표 6: 3xSTOP vs 분해 신호 없음: 0.97; 3xSTOP vs PB29: 1.0; 3xSTOP vs 3xPB29: 0.15; 3xSTOP vs 유비퀴틴: 0.10; PB29 vs 분해 신호 없음: 1.0; PB29 vs 3xPB29: 0.1; PB29 vs 유비퀴틴: 0.07; 3xPB29 vs 분해 신호 없음: 0.06; 3xPB29 vs 유비퀴틴: 1.0; 유비퀴틴 vs 분해 신호 없음: 0.04.
스튜던츠 t-테스트를 사용하여, 도 3c, 도 3d 및 도 3f에 도시된 데이터를 비교하였다.
결과
AP1, AP2 또는 AK 재조합유전성 영역을 포함하는 이중
AAV
하이브리드
벡터는 효율적인 형질도입을 보여준다
본 발명자들은 몇몇 다중 벡터 전략들을 도 1 및 도 13에 도시된 바와 같이 평가하였다.
특히, 발명자들은 상이한 상동성 영역들을 가진 이중 AAV 하이브리드 벡터의 형질도입 효능을 동시에 평가하였다. 이를 위해, 본 발명자들은, 유비쿼터스 CMV 프로모터 및 상동성의 AK14, AP14, AP1 또는 AP220 영역의 조절 하에 ABCA4-3xflag 코딩 서열을 포함하는 이중 AAV2/2 하이브리드 벡터를 생성하였다(도 7). 본 발명자들은 HEK293 세포를 감염시키는 데 이들 벡터를 사용하였다[감염 다중도, m.o.i.: 각각의 벡터 당 5x104 게놈 복사체(GC)/세포]. 세포 용해물을 항-3xflag 항체를 이용한 웨스턴 블롯에 의해 분석하여, ABCA4-3xflag를 검출하였다(도 2). 각각의 이중 AAV 하이브리드 벡터 세트는 음성 대조군이 로딩된 레인에서는 검출되지 않은 예상된 크기의 전장 단백질을 발현시켰다(도 2a). ABCA4 발현의 정량화(도 2b)는, 이중 AAV 하이브리드 AP1 및 AP2 벡터에 의한 감염이 이중 AAV 하이브리드 AK 벡터를 이용할 때보다 이식유전자 발현의 수준을 약간 더 높였으며, 모두 이중 AAV 하이브리드 AP 벡터14를 상당히 능가하였음을 보여주었다. 본 발명자들은 이전에, 상동성 재조합에 의존하는 이중 AAV 벡터의 효율이 세포 배양물에서보다 PR로서 종결-분화된 세포에서 더 낮음을 발견하였다14. 따라서, 본 발명자들은, PR-특이적인 인간 G 단백질-커플링된 수용체 키나제 1(GRK1) 프로모터를 포함하는 이중 AAV AK, AP1 및 AP2 벡터(각각의 벡터의 용량/눈: 1.9x109 GC; 도 2c)의 망막하 투여 후, C57BL/6 마우스에서 PR-특이적인 형질도입 수준을 평가하였다. 벡터 투여 후 1개월째에, 본 발명자들은 AP1 또는 AP2 벡터보다 이중 AAV 하이브리드 AK로 처리한 망막에서 ABCA4 단백질 발현을 보다 일관되게 검출하였다(도 2c).
AAV
벡터에
이종성
ITR을
포함시키는
것은 이의 생성 수율에 영향을 미치고, 절단된 단백질 생성물의 수준을 감소시키지 않는다.
이종성 ITR의 사용이 이중 AAV 벡터의 생산성 방향성 콘카테머화를 향상시키는지 시험하기 위해, 본 발명자들은 이종성 ITR2 및 ITR5를 5:2(AAV5로부터 좌측 ITR 및 AAV2로부터 우측 ITR) 또는 2:5(AAV2로부터 좌측 ITR 및 AAV5로부터 우측 ITR) 배치로 갖는 ABCA4-3xflag 또는 MYO7A-HA 코딩 서열을 포함하는 이중 AAV2/2 하이브리드 AK 벡터를 생성하였다(도 1). 이종성 ITR2 및 ITR5를 갖는 이중 AAV 벡터의 생성은, 바이러스 복제23를 교차-보완(cross-complement)할 수 없는 AAV 혈청형 2 및 AAV 혈청형 5로부터의 Rep 단백질의 동시적인 발현을 필요로 한다. 사실상, Rep2 및 Rep5는 상동성 ITR에 결합하는 것보다는 덜 효율적이긴 하지만 ITR2 또는 ITR5에 상호호환적으로 결합할 수 있으며, 그러나 이들은 다른 혈청형36 유래의 ITR의 말단 분해 부위(resolution site)를 절단할 수 없는 것으로 나타났다. 따라서, 이종성 ITR2 및 ITR5를 가진 이중 AAV 하이브리드 AK 벡터를 생성하기 전에, 본 발명자들은 (i) AAV2/2-CMV-EGFP 벡터(즉 상동성 ITR2를 가진 벡터)의 생성에 있어서 Rep2와의 Rep5의 잠재적인 경쟁, 및 (ii) AAV5/2-CMV-EGFP 벡터(즉 상동성 ITR5를 가진 벡터)의 생성에 있어서 Rep5와의 Rep2의 잠재적인 경쟁을, 동일한 양의 Rep5Cap2 및 Rep2Cap2 패키징 구축물(비율 1:1)을 사용하여 평가하였다. 사실상, Rep2Cap2 외에도 Rep5Cap2 패키징 구축물이 제공되는 경우, AAV2/2-CMV-EGFP 벡터의 총 수율은, Rep2Cap2만이 패키징 구축물로서 제공되는 경우 수득되는 대조군 조제물의 총 수율의 42%까지 감소된다(각각의 타입의 4개의 독립적인 조제물의 평균, p 스튜던츠 t-테스트 < 0.05). 역으로, Rep2Cap2가 Rep5Cap2에 첨가되었을 때 수득된 AAV5/2-CMV-EGFP 조제물의 총 수율에 있어서는 유의한 차이가 발견되지 않았으며, 이때의 수율은 Rep5Cap2가 형질감염된 유일한 패키징 구축물이었을 때 수득된 수율의 83%이었다(각각의 타입의 4개의 독립적인 조제물의 평균, 스튜던츠 t-테스트를 사용하여 확인 시 유의한 차이가 발견되지 않았음). ITR2를 가진 벡터의 생성에 있어서 Rep5가 Rep2와 경쟁한다면, 본 발명자들은 이종성 ITR2 및 ITR5를 가진 AAV의 생성에 있어서 Rep5 및 Rep2Cap2 패키징 구축물 사이에서 3개의 상이한 비율(프로토콜 A에서는 1:1, 프로토콜 B에서는 1:3 및 프로토콜 C에서는 1:10의 Rep5/Rep2Cap2 비율)을 시험하였다. 표 3에 나타낸 바와 같이, ITR2에 어닐링하는 프로브를 사용한 PCR 정량화에 의해 확인된 바이러스 역가는 Rep5의 양이 감소되었을 때 점진적으로 증가하였으며, 프로토콜 C에서 최상의 역가가 수득되었다.
표 3. 다양한 비율의
Rep5
및
Rep2
패키징 구축물의 존재 시
AAV5:2/2
벡터의 수율
ID: AAV5:2/2 벡터의 식별 번호; GC: 게놈 복사체.
이들 결과는, ITR2를 가진 벡터의 생성 동안 Rep2와의 Rep5의 경쟁을 확인시켜 주었으며, 본 발명자들이 이종성 ITR2 및 ITR5를 가진 AAV 벡터의 생성을 위해 프로토콜 C를 따르도록 하였다. 그러나, 이 전략으로 수득된 몇몇 AAV 조제물은: (i) ITR들 사이에서의 이식유전자 서열 상에서 확인된 역가보다 ITR2 상에서 확인된 역가가 최대 6배 더 낮으며(표 4), 이는 ITR2의 온전성이 손상됨(compromise)을 제시할 수 있었다는 점, 및 (ii) 상동성 ITR2를 함유하는 것과 비교하여 이종성 ITR2 및 ITR5를 갖는 AAV 벡터의 총 수율이 평균 약 6배 감소한다는 점(표 4)을 드러내었다.
표 4.
ITR2와
이종성
ITR2
및
ITR5를
가진
AAV2의
이식유전자
역가의
낮은 수율 및 차이
ID: AAV 벡터의 식별 번호; GC: 게놈 복사체. a 값은 평균±SEM을 나타낸다.
그러나, 이종성 ITR을 가진 AAV 조제물의 서던 블롯 분석은 게놈 온전성의 명백한 변경을 드러내지 않았다(도 3a).
이중 AAV 하이브리드 AK 벡터에 이종성 ITR을 포함시키는 것이, 절단된 단백질의 생성을 감소시키면서도 꼬리-대-머리 생산성 콘카테머의 형성 및 전장 단백질 형질도입을 증강시켰는지 시험하기 위해, 본 발명자들은 이종성 ITR2 및 ITR5 (in the 5:2/2:5 배치) 또는 상동성 ITR2를 가진, ABCA4 또는 MYO7A를 인코딩하는 이중 AAV 하이브리드 벡터를 이용하여 HEK293 세포를 감염시켰다(도 3b, 3e).
상동성 ITR에서가 아니라 이종성 ITR을 가진 벡터에 대해 ITR2와 이식유전자 역가 사이에 차이가 있으면(표 4), 본 발명자들은 ITR2 또는 이식유전자 역가를 기반으로 하여 각각의 벡터 당 104 게놈 복사체 (GC)/세포로 세포를 감염시켰다. ITR2 역가를 기반으로 이중 AAV 벡터에 의해 감염된 HEK293 세포의, 항-3xflag(ABCA4-3xflag를 검출하기 위함, 도 3b) 또는 항-Myo7a(도 3e) 항체를 사용한 웨스턴 블롯 분석은, 이종성 ITR2 및 ITR5를 포함시키는 것이 상동성 ITR2보다 전장 및 절단된 단백질 둘 다의 수준을 더 높였음을 보여주었다(도 3b, 도 3c, 도 3d, 도 3f). 그러나, 이는 HEK293 세포를, 이식유전자 역가를 기반으로 한 동일한 이중 AAV 벡터 조제물에 의해 감염시켰을 때는 관찰되지 않았다(도 3b, 도 3d). 결론적으로, 전장 및 절단된 단백질 발현 사이의 비율은 벡터에 포함된 ITR(도 3 c, 도 3d, 도 3f) 및 세포의 투약에 사용된 벡터 역가(도 3b, 도 3c, 도 3d)와는 상관없이 유사하였다.
5'-하프 벡터 내의 CL1
데그론은
절단된 단백질 생성물의 생성을
감소시킨다
이중 AAV 하이브리드 벡터14의 각각의 5'-하프 및 3'-하프에 의해 제조된 절단된 단백질 생성물의 수준을 선택적으로 감소시키기 위해, 본 발명자들은 추정상 분해 서열을, 5'-하프 벡터에서 AK와 우측 ITR 사이에서 스플라이싱 공여자 신호 다음에 두고, 3'-하프 벡터에서는 AK와 스플라이싱 수여자 신호 사이에 두었다(도 1). 따라서, 분해 신호는 스플라이싱된 mRNA로부터 비롯되는 전장 단백질에서가 아니라 절단된 단백질에 포함될 것이다. 5'-하프 벡터에 분해 신호로서, 본 발명자들은: (i) CL1 데그론(CL1), (ii) miR-let7b 표적 부위의 4개의 복사체(4xLet7b), (iii) miR-26a 표적 부위의 4개의 복사체(4x26a) 또는 (iv) miR-204 표적 부위와 miR-124 표적 부위 각각의 3개의 복사체들의 조합(3x204+3x124)(표 2)을 포함시켰다. 3'-하프 벡터에 분해 신호로서, 본 발명자들은: (i) 3 정지 코돈(정지), (ii) 단일(PB29) 또는 3개의 탠덤 복사체(3xPB29)에 PB29, 또는 (iii) 유비퀴틴(표 2)을 포함시켰다. 본 발명자들은 다양한 분해 신호를 포함하는 ABCA4를 인코딩하는 이중 AAV2/2 하이브리드 AK 벡터를 생성하였으며, HEK293 세포를 감염시킨 후[m.o.i.: 각각의 벡터 당 5 x 104 게놈 복사체(GC)/세포] 이들 벡터의 효능을 평가하였다. miR-let7b, miR-26a, miR-204 및 miR-124가 HEK293 세포(Ambion miRNA Research Guide37)에서 불량하게 발현되거나 완전히 부재하기 때문에, 이들 miR의 표적 부위를 함유하는 구축물의 침묵화를 시험하기 위해, 본 발명자들은 상기 세포를 miR 모방체(즉, 내인성 miR38을 모방하는 작고 화학적으로 변형된 이중 가닥 RNA)로 형질감염시킨 후, 상응하는 표적 부위를 함유하는 AAV2/2 벡터로 감염시켰다. 상응하는 miR 표적 부위를 함유하는 유전자의 침묵화를 달성하는 데 필요한 miR 모방체의 농도를 확인하기 위해, 본 발명자들은 리포터 EGFP 단백질을 인코딩하고 폴리아데닐화 신호 앞에 miR 표적 부위를 함유하는 플라스미드를 사용하였다(데이터는 도시되지 않음). 동일한 실험 설정을 이중 AAV 하이브리드 AK 벡터의 맥락에서의 miR 표적 부위에 대한 추가적인 평가에 사용하였다. 본 발명자들은, 이중 AAV 하이브리드 AK 벡터의 5'-하프에 miR-204+124 및 26a 표적 서열을 포함시키는 것이 전장 단백질 발현에 영향을 미치지 않으면서도 절단된 단백질 생성물의 발현을 완전히 없애지는 못하더라도 감소시켰음을 발견하였다(도 4). 상이하게는, miR-let7b 표적 부위를 포함시키는 것은 절단된 단백질 발현을 감소시키는 데 효과적이지 않았다(도 4).
주목할만하게는, 도 5a에 나타낸 바와 같이, 본 발명자들은, 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것이 전장 단백질 발현에 영향을 미치지 않으면서도 검출할 수 없는 수준으로 절단된 단백질 생성물의 발현을 감소시켰음을 발견하였다(도 5a). CL1 분해31를 매개하는 유비퀴틴화 경로의 효소의 조직-특이적인 발현에서의 차이가 CL1 효능의 변화를 설명할 수 있기 때문에, 본 발명자들은 돼지 망막에서 CL1 데그론의 효능을 평가하였으며, 돼지는 인간19 , 30, 39, 40과 유사한 크기 및 구조를 갖고 있어서 벡터의 안전성 및 효율을 평가하기 위한 우수한 예비-임상 대형 동물 모델이다. 이를 위해, 본 발명자들은 라지 화이트종 돼지에서, ABCA4를 인코딩하는 AAV2/8 이중 AAV 하이브리드 AK 벡터(이 중에서 5'-하프 벡터는 CL1 서열을 포함하거나 포함하지 않았음)를 망막하로 주사하였다(각각의 벡터의 용량/눈: 1 x 1011 GC). 주목할만하게는, 본 발명자들은, 5'-하프 벡터에 CL1 분해 신호를 포함시키는 것이 전장 단백질 발현에 영향을 미치지 않으면서도 절단된 단백질의 발현을 웨스턴 블롯 분석의 검출 한계 미만까지 상당히 감소시켰음을 발견하였다(도 5b). 3'-하프 벡터에서 시험된 분해 신호 중에서, 본 발명자들은 정지 코돈이 절단된 단백질 생성에 영향을 미치지 않았음을 발견하였다. 상이하게는, PB29(단일 또는 3개의 탠덤 복사체에서) 및 유비퀴틴 모두, 절단된 단백질 발현을 감소시키는 데 효과적이었다. 그러나, 유비퀴틴은 전장 단백질의 발현도 없앤 반면, PB29는 전장 단백질 생성에 대해 더 적은 범위로 영향을 미쳤다(도 6).
3'-하프 벡터에서 시험된 분해 신호 중에서, 본 발명자들은 절단된 단백질 생성물 및 전장 단백질의 수준을 둘 다 감소시킨 3가지(PB29, 3xPB29 및 유비퀴틴)를 동정하였다(도 6 및 표 5 및 표 6).
표 5. 5'-하프 벡터에
miR
표적 부위를 포함하는 이중
AAV
하이브리드
벡터에 의해 감염된
HEK293
세포의
웨스턴
블롯
분석으로부터의, 절단된 단백질 발현에 대한 전장
ABCA4의
정량화
값은 상응하는 모방체 또는 스크램블 모방체의 존재 하에 전장 ABCA4 및 절단된 단백질 밴드의 강도 사이의 비율의 (3개의 독립적인 실험으로부터) 평균 ± s.e.m.을 나타낸다. 스크램블 또는 상응하는 모방체의 존재 하에 각각의 쌍의 벡터에 대한 비율을 스튜던츠 t-테스트를 사용하여 비교하였으며, 유의한 차이가 발견되지 않았다.
표
6: 3
'-하프 벡터에 분해 신호를 포함하는 이중
AAV
하이브리드
벡터에 의해 감염된
HEK293
세포의
웨스턴
블롯
분석으로부터의, 절단된 단백질 발현에 대한 전장 ABCA4의 정량화.
값은 분해 신호를 가진 벡터 또는 갖지 않은 벡터로부터 전장 ABCA4 및 절단된 단백질 밴드의 강도 사이의 비율의 (3개의 독립적인 실험으로부터) 평균 ± s.e.m.을 나타낸다. 특정 통계학적 값을 포함한 통계학적 분석에 대한 보다 상세한 사항은 재료 및 방법 섹션의 통계학적 분석 단락에서 확인할 수 있다.
개선된 이중
AAV
벡터의
망막하
투여는
Abca4
-/-
망막에서의
리포푸신
축적을
감소시킨다
본 발명자들의 발견을 기반으로, 개선된 이중 AAV 하이브리드-ABCA4 벡터는 상동성 ITR2, 상동성 AK 영역 및 CL1을 포함해야 한다. ABCA4가 인간에서 간상체 및 추상체 광수용기 둘 다에서 발현되기 때문에70, 본 발명자들은 인간 GRK1(G 단백질-커플링된 수용체 키나제 1) 프로모터 또는 IRBP(광수용기간 레티노이드 결합 단백질) 프로모터 유래의 EGFP를 인코딩하는 단일 AAV2/8 벡터의 PR 형질도입 특성을 비교함으로써 ABCA4 전달에 적합한 프로모터를 동정하였으며, 상기 프로모터들은 둘 다 다양한 종들에서 조합된 간상체 및 추상체 PR 형질도입을 높은 수준으로 유도하는 것으로 보고되어 있다53 -55. 인간의 망막 황반(macula)과 유사한 추상체:간상체 = 1:356을 가진 스트리크(streak)-유사 영역을 포함하는 돼지 망막 구조물을 이용하여, 본 발명자들은 3월령 라지 화이트종 돼지에서 AAV2/8-GRK1- 또는 IRBP-EGFP 벡터를 1x1011 GC/눈으로 망막하로 주사하였다. 주사 후 4주째에, 본 발명자들은 형광 현미경 하에 상응하는 망막 냉동박편을 분석하였다. PR 세포 층에서의 EGFP 형광 정량화(도 10a 내지 도 10b)는, 2개 프로모터 모두 유사한 수준의 PR 형질도입(이 영역에서는 주로 간상체)을 제공함을 보여주었다. 그러나, 본 발명자들이 마찬가지로 EGFP 양성인 추상체 어레스틴(CAR)57에 대한 항체로 표지된 추상체의 수를 계수하였을 때, 이들은 GRK1 프로모터를 이용한 추상체 PR 형질도입을 통계학적으로 유의한 수준은 아니지만 더 높은 것을 발견하였다(물질, 도 10c 내지 도 10d). 이를 기반으로, 본 발명자들은 이들의 개선된 이중 AAV 하이브리드 ABCA4 벡터에 GRK1 프로모터를 포함시켰으며, ABCA4를 발현하고, Abca4 -/- 마우스의 RPE에서 A2E-함유 자가형광 리포푸신 물질의 비정상적인 함량을 감소시키는 능력에 대해 조사하였다. 본 발명자들은 처음에, 1월령의 C57/BL6 마우스에게 개선된 이중 AAV 벡터(각각의 벡터의 용량/눈: 2x109 GC)를 망막하 주사하였으며, 주사한 24개의 눈 중 12개(50%)가 웨스턴 블롯에 의해 확인 시 전장 ABCA4 단백질을 다양한 수준이긴 하지만 검출 가능한 수준으로 가졌음을 발견하였다[도 8a; ABCA4-양성 눈에서 ABCA4 단백질 수준: 2.8 ± 0.7 a.u.(평균 ± 평균의 표준 오차)]. 이는, 상이한 버전의 이중 AAV 플랫폼이 50% ABCA4-발현 눈14에서 초래되었다는 본 발명자들의 이전의 발견과 유사하다. 그런 다음, 본 발명자들은 5.5월령 유색 Abca4 -/- 마우스에게, 개선된 이중 AAV 벡터를 눈의 측두측 영역에 망막하 주사하였다(각각의 벡터의 용량/눈: 1.8x109 GC). 3개월 후, 본 발명자들은 눈을 수집하고, 상기 눈의 측두측 영역에서 망막 냉동박편[RPE 단독 또는 RPE +외부 분절(OS)] 상에서의 리포푸신 형광 (여기: 560±40 nm; 방출: 645±75)의 수준을 측정하였다(도 8b 내지 도 8c 및 도 11). 본 발명자들은, 눈의 이 영역에서의 리포푸신 형광 강도가 치료용 이중 AAV 하이브리드 ABCA4 벡터를 주사한 Abca4 +/- 마우스 및 Abca4 -/- 마우스 둘 다에서보다 비처리된 Abca4-/- 마우스에서 상당히 더 높았음을 발견하였다(도 8b, 도 8c 및 도 11). 그런 다음, 투과 전자 현미경을 사용하여, 본 발명자들은 RPE 리포푸신 과립의 수를 계수하였다. 이들은 연령-매칭된 Abca4 +/+ 대조군과 비교하여 PBS를 주사한 5.5월령 내지 6-월령의 알비노 Abca4 -/- 마우스에서 증가하였으며(도 8d), 이와 유사한 수준에서 본 발명자들은 주사하지 않거나 또는 대조군 AAV 벡터를 주사한 Abca4-/- 마우스에서 독립적으로 측정하였다(데이터는 도시되지 않음). Abca4-/- RPE에서의 리포푸신 과립의 수를, 개선된 이중 AAV 하이브리드 ABCA4 벡터의 망막하 주사 후 3개월째에 정규화하였다(각각의 벡터의 용량/눈: 1x109 GC, 도 8d).
개선된 이중
AAV
벡터는 마우스 및 돼지 망막에의
망막하
투여 시
안전하다
개선된 이중 AAV2/8 하이브리드 ABCA4 벡터의 안전성을 조사하기 위해, 본 발명자들은 상기 벡터를 야생형 C57BL/6 마우스 및 라지 화이트종 돼지 둘 다에게 망막하 주사하였다(각각의 벡터의 용량/눈: 각각 3x109 및 1x1011 GC). 주사 후 1개월째에, 본 발명자들은 망막 전기적 활성을 간츠펠트(Ganzfeld) 망막 전위도(ERG)에 의해 측정하였으며, 이중 AAV 하이브리드 ABCA4 벡터를 주사한 마우스 눈과, 음성 대조군 AAV 벡터 또는 PBS를 주사한 눈 사이에서 a-파 및 b-파 진폭이 둘 다 유의하게 상이하지 않았음을 발견하였다(도 9a 및 재료, 도 12a). 유사하게는, 암순응, 명순응, 최대 반응 및 깜박거림 ERG 시험 둘 다에서 b-파 진폭은, PBS를 주사한 대조군 눈에 이중 AAV 하이브리드 ABCA4 벡터를 주사한 돼지 눈에서와 유사하였다(도 9b 및 재료, 도 12b).
고찰
AAV 제한된 패키징 용량은 IRD의 유전자 치료법에 대한 AAV의 광범위한 적용에 있어 주요 걸림돌들 중 하나를 나타낸다. 그러나, 최근 몇몇 그룹들이 독립적으로, 이중 AAV 벡터가 마우스 및 돼지 망막 둘 다에서 AAV 카고 용량(cargo capacity)을 효과적으로 확장시키며14 , 17, 19, 41, 따라서 단일 표준(canonical) AAV 벡터에서는 맞춰지지 않을 유전자에서의 돌연변이로 인해 IRD에의 AAV 이용 가능성을 확장시킨다고 보고하였다. 따라서, 본 발명자들은 이중 AAV 벡터의 사용과 연관된 일부 한계들, 즉 단일 벡터와 비교 시 상기 이중 AAV 벡터의 상대적으로 낮은 효율, 및 안전성 문제를 유발할 수 있는 절단된 단백질의 생성을 극복하기 위해 설정한다.
이중 AAV 게놈 꼬리-대-머리 콘카테머화를 증가시키기 위한 전략은 이론적으로, 자유 단일 하프-벡터로부터 전장 단백질의 수준을 증가시키고 절단된 단백질의 수준을 감소시켜야 한다. 본 발명자들은 상동성 또는 이종성 ITR의 최적 영역을 포함시킴으로써 꼬리-대-머리 이중 AAV 하이브리드 게놈 콘카테머화를 향상시키려고 설정한다. 이전에 보고된 상동성 영역에 대한 나란한(side-by-side) 평가에서, 본 발명자들은, Lostal 등20에 의해 최근 공개된 AP1 및 AP2 서열 및 F1 파지 14 유래의 AK 서열이 마우스 망막에서 보다 일관적인 ABCA4 발현을 유도하는 이중 AAV 하이브리드 AK 벡터를 이용하여 시험관내에서 단백질 발현을 전반적으로 유사한 수준으로 유도함을 발견하였다. 독립적으로, 상이한 상동성 영역의 이용 가능성은 AAV 카고 용량20, 42을 더 확장시키기 위해 삼중 AAV 벡터의 적절한 콘카테머화를 지시하는 데 유용하다. 이종성 ITR2 및 ITR5는 이중24 , 25 및 삼중42 AAV 벡터에 성공적으로 포함되었다. 본 발명자들은, 이종성 ITR2 및 ITR5를 가진 AAV 벡터의 수율이 상동성 ITR2를 가진 벡터의 수율보다 더 낮음을 발견하였다. 본 발명자들은 또한, 본 발명자들이 이들의 게놈의 상이한 영역들을 프로브할 때보다 본 발명자들이 이들의 ITR2를 프로브할 때, 이종성 ITR을 가진 벡터 게놈을 더 적게 검출하였다. 본 발명자들이, Rep5가 ITR2를 갖는 벡터의 생성을 방해한다고 보여주기 때문에, 이는 Rep2의 존재 시에만 생성되는 상동성 ITR2를 가진 AAV 벡터에서가 아니라 Rep5의 존재 시 생성되는 이종성 ITR을 가진 AAV 벡터에 포함된 ITR2의 수준의 비정상을 제시하고, 본 발명자들이 게놈의 ITR2 또는 상이한 영역을 프로브하는지 여부에 관계없이 유사한 역가를 보였다. 이들 결과는 부분적으로는, 이종성 ITR2 및 ITR5를 가진 이중 AAV 벡터가 상동성 ITR을 가진 벡터보다 더 높은 형질도입 효율을 가졌으며 생성 문제를 명확하게 갖지 않았다는 이전의 보고들과는 상이하다24 , 25. 상이한 패키징 구축물 및 생성 프로토콜 외에도, 이 연구에서 본 발명자들은, 콘카테머화24 , 25를 위해 단순히 ITR에 의존하는 이전의 보고들에서 사용된 트랜스-스플라이싱 시스템과는 대조적으로, 2개의 하프-벡터들 사이에 상동성 영역을 포함시킨 이중 AAV 하이브리드 벡터를 사용하였다. 이중 AAV 하이브리드 벡터에서는 전장 유전자의 재구축이 콘카테머 형성을 지시하는 상기 벡터16에 포함된 상동성 영역에 의해 주로 매개되므로, 이는 트랜스-스플라이싱 벡터24 , 25를 사용한 이전의 연구들과 비교하여 이종성 ITR을 가진 벡터를 이용하여 본 발명자들이 관찰한 이식유전자 발현에서의 더 작은 감소를 설명할 수 있다. 또한, 본 발명자들이 각각 MYO7A-발현 벡터 및 ABCA4-발현 벡터에 대한 이식유전자 서열을 기반으로 계산된 것보다 3배 내지 6배 더 낮은 ITR을 기반으로 계산된 역가를 기준으로 사용하였기 때문에, 본 발명자들은 이종성 ITR을 가진 벡터의 효율을 과대평가했을 수 있다. ITR2 및 이식유전자 서열을 기반으로 계산된 역가들 둘 다 상동성 ITR2를 가진 상응하는 이중 AAV 벡터들 사이에서 유사하기 때문에, 본 발명자들은 상기 벡터들을 이종성 ITR2 및 ITR5를 가진 벡터들보다 3배 내지 6배 더 낮은 부피로 사용하였다. 이는, 상동성 ITR을 가진 이중 AAV 벡터보다 이종성 ITR을 가진 이중 AAV 벡터로부터의 전장 및 절단된 단백질 생성물의 명확하게 더 높은 수준을 설명할 수 있다.
본 발명자들의 이전의 연구에서, 본 발명자들은 이중 AAV 벡터14의 망막하 투여 후 8개월째까지 국소 독성의 징후를 관찰하지 않았으나, 이중 AAV의 단일 하프-벡터로부터의 절단된 단백질 생성물의 생성은 안전성 문제를 유발할 것이다. 유전자 전사체에 miR 표적 부위를 포함시키는 것은 망막30을 포함한 다양한 조직에서 이식유전자 발현을 제한하기 위한 효과적인 전략인 것으로 나타났다. 그러나, 시험관내에서, 본 발명자들이 miR-204+124 및 26a에 대한 표적 부위를 포함시켰을 때에만 본 발명자들은 절단된 단백질 생성의 부분적인 감소를 달성하였다. 사실상, miR 표적 부위에 대해 외부에 놓인 mRNA의 특징은 침묵화의 효율에 영향을 미칠 수 있다43, 44. 이와 더불어, 5'-하프로부터 유래되는 절단된 단백질 생성물이 표준 폴리아데닐화 신호가 부여되지 않은 벡터로부터 생성되기 때문에, 생성되는 mRNA가 효율적인 miR-매개 침묵화를 수행할 수 없는 것이 가능할 수 있다. 중요하게는, 본 발명자들은 CL1 데그론을 포함시킴으로써, 5'-하프 벡터로부터 절단된 단백질 생성물을 완전히 분해시켰다. 본 발명자들은, 이러한 신호가 시험관내 및 돼지 망막 둘 다에서 효과적임을 보여주었으며, 이는 CL1 활성에 필요한 분해 경로의 효소가 다양한 세포 타입들에서 발현됨을 가리킨다. 3'-하프 벡터로부터의 절단된 단백질 생성물의 풍부도가 5'-하프 벡터에 의해 생성된 것보다 더 낮기 때문에(도 6), 이의 존재는 안전성 문제를 더 적게 유발해야 한다. 본원에서 마우스 및 돼지 망막에서 제시된 데이터는 개선된 이중 AAV 벡터의 안전성을 뒷받침한다.
주목할만하게는, 본 발명자들은, 조합된 간상체 및 추상체 형질도입을 높은 수준으로 제공하는 GRK1 프로모터의 조절 하에 개선된 이중 AAV 벡터를 망막하 투여하면, 마우스에서 변동적인 수준이긴 하지만 효과적인 ABCA4 전달을 초래함을 발견하였다. 이는, 작은 뮤린 눈에서 망막하 주사의 타고난 가변성, 및 단일 AAV 벡터14와 비교하여 이중 AAV 시스템의 전반적으로 더 낮은 효능 때문일 수 있었다. 이러한 가변성에도 불구하고, 본 발명자들은, 이중 AAV에 의해 매개된 ABCA4 전달이 Abca4-/- 망막에서 상당한 리포푸신 감소를 초래하며, 이는 광범위한 이식유전자 발현 수준이 치료 효능에 유사하게 기여할 수 있음을 발견하였다. 이는 2개의 독립적인 기술을 사용하여 관찰되었으나, 본 발명자들이, 사실상 리포푸신 과립의 수의 정규화를 보여준 망막의 AAV 형질도입된 영역을 해부하고 분석하였을 때 표현형의 보다 두드러진 향상이 관찰되었다. 결론적으로, 본 발명은 임상 적용, 특히 망막 질병의 치료에 적합한 개선된 특징을 가진 다중 벡터를 제공한다. 또한, 본 발명은 다중 벡터의 안전성 및 효능을 개선하며 이는 카고 용량20 , 42을 더 확장시킨다.
SEQUENCE LISTING
<110> Fondazione Telethon
<120> Multiple vector system and uses thereof
<130> PCT 129062
<150> US62/127,463
<151> 2015-03-03
<160> 78
<170> PatentIn version 3.5
<210> 1
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 1
Ala Cys Lys Asn Trp Phe Ser Ser Leu Ser His Phe Val Ile His Leu
1 5 10 15
<210> 2
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 2
Ser Leu Ile Ser Leu Pro Leu Pro Thr Arg Val Lys Phe Ser Ser Leu
1 5 10 15
Leu Leu Ile Arg Ile Met Lys Ile Ile Thr Met Thr Phe Pro Lys Lys
20 25 30
Leu Arg Ser
35
<210> 3
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 3
Phe Tyr Tyr Pro Ile Trp Phe Ala Arg Val Leu Leu Val His Tyr Gln
1 5 10 15
<210> 4
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 4
Ser Asn Pro Phe Ser Ser Leu Phe Gly Ala Ser Leu Leu Ile Asp Ser
1 5 10 15
Val Ser Leu Lys Ser Asn Trp Asp Thr Ser Ser Ser Ser Cys Leu Ile
20 25 30
Ser Phe Phe Ser Ser Val Met Phe Ser Ser Thr Thr Arg Ser
35 40 45
<210> 5
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 5
Cys Arg Gln Arg Phe Ser Cys His Leu Thr Ala Ser Tyr Pro Gln Ser
1 5 10 15
Thr Val Thr Pro Phe Leu Ala Phe Leu Arg Arg Asp Phe Phe Phe Leu
20 25 30
Arg His Asn Ser Ser Ala Asp
35
<210> 6
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 6
Gly Ala Pro His Val Val Leu Phe Asp Phe Glu Leu Arg Ile Thr Asn
1 5 10 15
Pro Leu Ser His Ile Gln Ser Val Ser Leu Gln Ile Thr Leu Ile Phe
20 25 30
Cys Ser Leu Pro Ser Leu Ile Leu Ser Lys Phe Leu Gln Val
35 40 45
<210> 7
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 7
Asn Thr Pro Leu Phe Ser Lys Ser Phe Ser Thr Thr Cys Gly Val Ala
1 5 10 15
Lys Lys Thr Leu Leu Leu Ala Gln Ile Ser Ser Leu Phe Phe Leu Leu
20 25 30
Leu Ser Ser Asn Ile Ala Val
35
<210> 8
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 8
Pro Thr Val Lys Asn Ser Pro Lys Ile Phe Cys Leu Ser Ser Ser Pro
1 5 10 15
Tyr Leu Ala Phe Asn Leu Glu Tyr Leu Ser Leu Arg Ile Phe Ser Thr
20 25 30
Leu Ser Lys Cys Ser Asn Thr Leu Leu Thr Ser Leu Ser
35 40 45
<210> 9
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 9
Ser Asn Gln Leu Lys Arg Leu Trp Leu Trp Leu Leu Glu Val Arg Ser
1 5 10 15
Phe Asp Arg Thr Leu Arg Arg Pro Trp Ile His Leu Pro Ser
20 25 30
<210> 10
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 10
Ser Ile Ser Phe Val Ile Arg Ser His Ala Ser Ile Arg Met Gly Ala
1 5 10 15
Ser Asn Asp Phe Phe His Lys Leu Tyr Phe Thr Lys Cys Leu Thr Ser
20 25 30
Val Ile Leu Ser Lys Phe Leu Ile His Leu Leu Leu Arg Ser Thr Pro
35 40 45
Arg Val
50
<210> 11
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 11
aggcatagga tgacaaaggg aa 22
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 12
ggcattcacc gcgtgcctta 20
<210> 13
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 13
agcctatcct ggattacttg aa 22
<210> 14
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 14
Ser Trp Asn Phe Lys Leu Tyr Val Met
1 5
<210> 15
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 15
Met His Ser Trp Asn Phe Lys Leu Tyr Val Met Gly Ser Gly
1 5 10
<210> 16
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 16
gcctgcaaga actggttcag cagcctgagc cacttcgtga tccacctg 48
<210> 17
<211> 158
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 17
aggcatagga tgacaaaggg aacgataggc ataggatgac aaagggaaaa gcttaggcat 60
aggatgacaa agggaaggta ccagatctgg cattcaccgc gtgccttacg atggcattca 120
ccgcgtgcct taaagcttgg cattcaccgc gtgcctta 158
<210> 18
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 18
agcctatcct ggattacttg aacgatagcc tatcctggat tacttgaaaa gcttagccta 60
tcctggatta cttgaatcac agcctatcct ggattacttg aa 102
<210> 19
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 19
atgcacagct ggaacttcaa gctgtacgtc atgggcagcg gc 42
<210> 20
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 20
agctggaact tcaagctgta cgtcatg 27
<210> 21
<211> 136
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 21
atgcacagct ggaacttcaa gctgtacgtc atgggcagcg gcggggtacc atgcacagct 60
ggaacttcaa gctgtacgtc atgggcagcg gcggatgcac agctggaact tcaagctgta 120
cgtcatgggc agcggc 136
<210> 22
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 22
gggatttttc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60
gcgaatttta acaaaat 77
<210> 23
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 23
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60
gcgaatttta acaaaat 77
<210> 24
<211> 287
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 24
ccccgggtgc gcggcgtcgg tggtgccggc ggggggcgcc aggtcgcagg cggtgtaggg 60
ctccaggcag gcggcgaagg ccatgacgtg cgctatgaag gtctgctcct gcacgccgtg 120
aaccaggtgc gcctgcgggc cgcgcgcgaa caccgccacg tcctcgcctg cgtgggtctc 180
ttcgtccagg ggcactgctg actgctgccg atactcgggg ctcccgctct cgctctcggt 240
aacatccggc cgggcgccgt ccttgagcac atagcctgga ccgtttc 287
<210> 25
<211> 288
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 25
cgcagggcag cctctgtcat ctccatcagg gaggggtcca gtgtggagtc tcggtggatc 60
tcgtatttca tgtctccagg ctcaaagaga cccatgagat gggtcacaga cgggtccagg 120
gaagcctgca tgagctcagt gcggttccac acataccggg caccctggcg cttcgccagc 180
cattcctgca ccagattctt cccgtccagc ctggtcccac cttggctgta gtcatctggg 240
tactcagggt ctggggttcc catgcgaaac atgtactttc ggcctcca 288
<210> 26
<211> 278
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 26
gtgatcctag gtggaggccg aaagtacatg tttcgcatgg gaaccccaga ccctgagtac 60
ccagatgact acagccaagg tgggaccagg ctggacggga agaatctggt gcaggaatgg 120
ctggcgaagc gccagggtgc ccggtacgtg tggaaccgca ctgagctcat gcaggcttcc 180
ctggacccgt ctgtgaccca tctcatgggt ctctttgagc ctggagacat gaaatacgag 240
atccaccgag actccacact ggacccctcc ctgatgga 278
<210> 27
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 27
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ct 82
<210> 28
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 28
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51
<210> 29
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 29
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 30
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 30
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 31
<211> 175
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 31
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgtaagc agtga 175
<210> 32
<211> 175
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 32
tcactgctta caaaaccccc ttgcttgaga gtgtggcact ctcccccctg tcgcgttcgc 60
tcgctcgctg gctcgtttgg gggggcgacg gccagagggc cgtcgtctgg cagctctttg 120
agctgccacc cccccaaacg agccagcgag cgagcgaacg cgacaggggg gagag 175
<210> 33
<211> 153
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 33
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gac 153
<210> 34
<211> 583
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 34
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctcg tttagtgaac cgt 583
<210> 35
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 35
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120
tttctctcca cag 133
<210> 36
<211> 299
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 36
ctagtgggcc ccagaagcct ggtggttgtt tgtccttctc aggggaaaag tgaggcggcc 60
ccttggagga aggggccggg cagaatgatc taatcggatt ccaagcagct caggggattg 120
tctttttcta gcaccttctt gccactccta agcgtcctcc gtgaccccgg ctgggattta 180
gcctggtgct gtgtcagccc cgggctccca ggggcttccc agtggtcccc aggaaccctc 240
gacagggcca gggcgtctct ctcgtccagc aagggcaggg acgggccaca ggcaagggc 299
<210> 37
<211> 365
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 37
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360
ccatg 365
<210> 38
<211> 229
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 38
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg cggggcgagg 120
cggagaggtg cggcggcagc caatcggagc ggcgcgctcc gaaagtttcc ttttatggcg 180
aggcggcggc ggcggcggct ctataaaaag cgaagcgcgc ggcgggcgg 229
<210> 39
<211> 235
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 39
agcacagtgt ctggcatgta gcaggaacta aaataatggc agtgattaat gttatgatat 60
gcagacacaa cacagcaaga taagatgcaa tgtaccttct gggtcaaacc accctggcca 120
ctcctccccg atacccaggg ttgatgtgct tgaattagac aggattaaag gcttactgga 180
gctggaagcc ttgccccaac tcaggagttt agccccagac cttctgtcca ccagc 235
<210> 40
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 40
aaccacacaa cctactacct ca 22
<210> 41
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 41
aaccacacaa cctactacct cacgataacc acacaaccta ctacctcaaa gcttaaccac 60
acaacctact acctcatcac aaccacacaa cctactacct ca 102
<210> 42
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 42
agcctgatca gcctgcccct gcccacccgg gtgaagttca gcagcctgct gctgatccgg 60
atcatgaaga tcatcaccat gaccttcccc aagaagctgc ggagc 105
<210> 43
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 43
ttctactacc ccatctggtt cgcccgggtg ctgctggtgc actaccag 48
<210> 44
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 44
agcaacccct tcagcagcct gttcggcgcc agcctgctga tcgacagcgt gagcctgaag 60
agcaactggg acaccagcag cagcagctgc ctgatcagct tcttcagcag cgtgatgttc 120
agcagcacca cccggagc 138
<210> 45
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 45
tgccggcagc ggttcagctg ccacctgacc gccagctacc cccagagcac cgtgaccccc 60
ttcctggcct tcctgcggcg ggacttcttc ttcctgcggc acaacagcag cgccgac 117
<210> 46
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 46
ggcgcccccc acgtggtgct gttcgacttc gagctgcgga tcaccaaccc cctgagccac 60
atccagagcg tgagcctgca gatcaccctg atcttctgca gcctgcccag cctgatcctg 120
agcaagttcc tgcaggtg 138
<210> 47
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 47
aacacccccc tgttcagcaa gagcttcagc accacctgcg gcgtggccaa gaagaccctg 60
ctgctggccc agatcagcag cctgttcttc ctgctgctga gcagcaacat cgccgtg 117
<210> 48
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 48
cccaccgtga agaacagccc caagatcttc tgcctgagca gcagccccta cctggccttc 60
aacctggagt acctgagcct gcggatcttc agcaccctga gcaagtgcag caacaccctg 120
ctgaccagcc tgagc 135
<210> 49
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 49
agcaaccagc tgaagcggct gtggctgtgg ctgctggagg tgcggagctt cgaccggacc 60
ctgcggcggc cctggatcca cctgcccagc 90
<210> 50
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 50
agcatcagct tcgtgatccg gagccacgcc agcatccgga tgggcgccag caacgacttc 60
ttccacaagc tgtacttcac caagtgcctg accagcgtga tcctgagcaa gttcctgatc 120
cacctgctgc tgcggagcac cccccgggtg 150
<210> 51
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 51
tgaatgaatg a 11
<210> 52
<211> 243
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 52
ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 60
gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 120
gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 180
agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa atcgataagg 240
atc 243
<210> 53
<211> 2918
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 53
atgggcttcg tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg 60
caaaagattc gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc 120
tggttaagga atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg 180
atgccctcag caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc 240
tgttttcaaa gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc 300
atcttggcaa gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag 360
caccttggcc gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg 420
actcacccgg agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa 480
gaaacactga cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt 540
ctgatcaact ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg 600
aaggacatcg cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc 660
ggggcaaaga cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata 720
gaagacactc tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc 780
ctagacagcc gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg 840
tcaccaagaa ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc 900
aggcccctca tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct 960
gacctcctgt gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat 1020
gaagacaata actataaggc ctttctgggg attgactcca caaggaagga tcctatctat 1080
tcttatgaca gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat 1140
cctttaacca aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac 1200
actcctgatt cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa 1260
ctggaacacg ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac 1320
ttctttgaca acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta 1380
aaagactttt tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac 1440
ttcctctaca agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg 1500
gacatattta acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg 1560
gtcctggata agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct 1620
ctactggagg aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc 1680
agctctctac caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa 1740
accaataaga ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat 1800
ttccggtaca tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca 1860
aggagccagg tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc 1920
tgcttcgtgg acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg 1980
ctggcatgga tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg 2040
cgactgaagg agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg 2100
ttcctggaca gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg 2160
catggaagaa tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc 2220
tccactgcca ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg 2280
gcagcagcct gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc 2340
gcctggcagg accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg 2400
gcatttggat ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag 2460
tggagcaaca tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg 2520
cagatgatgc tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg 2580
tttccaggag actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg 2640
cttggcggtg aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta 2700
acagaggaaa cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt 2760
gagcatccag ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc 2820
tgtggccggc cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca 2880
ttcctgggcc acaatggagc tgggaaaacc accacctt 2918
<210> 54
<211> 3945
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 54
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360
ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420
ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480
ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540
cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600
ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660
tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720
gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780
atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840
caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900
gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960
gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020
gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080
agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140
cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200
ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260
cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320
cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380
tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440
gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500
ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560
tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620
gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680
actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740
gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800
aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860
cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920
ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980
acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040
tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100
agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160
acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220
agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280
aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340
caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400
ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460
tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520
tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580
acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640
tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700
agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760
gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820
tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880
ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940
gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000
accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060
ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120
tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180
tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240
actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300
aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360
cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420
ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480
cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540
acaatggagc tgggaaaacc accaccttgt aagtatcaag gttacaagac aggtttaagg 3600
agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct gggatttttc 3660
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 3720
acaaaatatt aacgtttata atttcaggtg gcatctttcc cgcctgcaag aactggttca 3780
gcagcctgag ccacttcgtg atccacctgc aattgaggaa cccctagtga tggagttggc 3840
cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg 3900
cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcag 3945
<210> 55
<211> 3904
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 55
gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 60
cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 120
cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 180
gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 240
caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 300
cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 360
cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 420
catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 480
tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gctttggcac 540
aggcttgtac ttaaccttgg tgcgcaagat gaaaaacatc cagagccaaa ggaaaggcag 600
tgaggggacc tgcagctgct cgtctaaggg tttctccacc acgtgtccag cccacgtcga 660
tgacctaact ccagaacaag tcctggatgg ggatgtaaat gagctgatgg atgtagttct 720
ccaccatgtt ccagaggcaa agctggtgga gtgcattggt caagaactta tcttccttct 780
tccaaataag aacttcaagc acagagcata tgccagcctt ttcagagagc tggaggagac 840
gctggctgac cttggtctca gcagttttgg aatttctgac actcccctgg aagagatttt 900
tctgaaggtc acggaggatt ctgattcagg acctctgttt gcgggtggcg ctcagcagaa 960
aagagaaaac gtcaaccccc gacacccctg cttgggtccc agagagaagg ctggacagac 1020
accccaggac tccaatgtct gctccccagg ggcgccggct gctcacccag agggccagcc 1080
tcccccagag ccagagtgcc caggcccgca gctcaacacg gggacacagc tggtcctcca 1140
gcatgtgcag gcgctgctgg tcaagagatt ccaacacacc atccgcagcc acaaggactt 1200
cctggcgcag atcgtgctcc cggctacctt tgtgtttttg gctctgatgc tttctattgt 1260
tatccctcct tttggcgaat accccgcttt gacccttcac ccctggatat atgggcagca 1320
gtacaccttc ttcagcatgg atgaaccagg cagtgagcag ttcacggtac ttgcagacgt 1380
cctcctgaat aagccaggct ttggcaaccg ctgcctgaag gaagggtggc ttccggagta 1440
cccctgtggc aactcaacac cctggaagac tccttctgtg tccccaaaca tcacccagct 1500
gttccagaag cagaaatgga cacaggtcaa cccttcacca tcctgcaggt gcagcaccag 1560
ggagaagctc accatgctgc cagagtgccc cgagggtgcc gggggcctcc cgccccccca 1620
gagaacacag cgcagcacgg aaattctaca agacctgacg gacaggaaca tctccgactt 1680
cttggtaaaa acgtatcctg ctcttataag aagcagctta aagagcaaat tctgggtcaa 1740
tgaacagagg tatggaggaa tttccattgg aggaaagctc ccagtcgtcc ccatcacggg 1800
ggaagcactt gttgggtttt taagcgacct tggccggatc atgaatgtga gcgggggccc 1860
tatcactaga gaggcctcta aagaaatacc tgatttcctt aaacatctag aaactgaaga 1920
caacattaag gtgtggttta ataacaaagg ctggcatgcc ctggtcagct ttctcaatgt 1980
ggcccacaac gccatcttac gggccagcct gcctaaggac agaagccccg aggagtatgg 2040
aatcaccgtc attagccaac ccctgaacct gaccaaggag cagctctcag agattacagt 2100
gctgaccact tcagtggatg ctgtggttgc catctgcgtg attttctcca tgtccttcgt 2160
cccagccagc tttgtccttt atttgatcca ggagcgggtg aacaaatcca agcacctcca 2220
gtttatcagt ggagtgagcc ccaccaccta ctgggtaacc aacttcctct gggacatcat 2280
gaattattcc gtgagtgctg ggctggtggt gggcatcttc atcgggtttc agaagaaagc 2340
ctacacttct ccagaaaacc ttcctgccct tgtggcactg ctcctgctgt atggatgggc 2400
ggtcattccc atgatgtacc cagcatcctt cctgtttgat gtccccagca cagcctatgt 2460
ggctttatct tgtgctaatc tgttcatcgg catcaacagc agtgctatta ccttcatctt 2520
ggaattattt gagaataacc ggacgctgct caggttcaac gccgtgctga ggaagctgct 2580
cattgtcttc ccccacttct gcctgggccg gggcctcatt gaccttgcac tgagccaggc 2640
tgtgacagat gtctatgccc ggtttggtga ggagcactct gcaaatccgt tccactggga 2700
cctgattggg aagaacctgt ttgccatggt ggtggaaggg gtggtgtact tcctcctgac 2760
cctgctggtc cagcgccact tcttcctctc ccaatggatt gccgagccca ctaaggagcc 2820
cattgttgat gaagatgatg atgtggctga agaaagacaa agaattatta ctggtggaaa 2880
taaaactgac atcttaaggc tacatgaact aaccaagatt tatccaggca cctccagccc 2940
agcagtggac aggctgtgtg tcggagttcg ccctggagag tgctttggcc tcctgggagt 3000
gaatggtgcc ggcaaaacaa ccacattcaa gatgctcact ggggacacca cagtgacctc 3060
aggggatgcc accgtagcag gcaagagtat tttaaccaat atttctgaag tccatcaaaa 3120
tatgggctac tgtcctcagt ttgatgcaat cgatgagctg ctcacaggac gagaacatct 3180
ttacctttat gcccggcttc gaggtgtacc agcagaagaa atcgaaaagg ttgcaaactg 3240
gagtattaag agcctgggcc tgactgtcta cgccgactgc ctggctggca cgtacagtgg 3300
gggcaacaag cggaaactct ccacagccat cgcactcatt ggctgcccac cgctggtgct 3360
gctggatgag cccaccacag ggatggaccc ccaggcacgc cgcatgctgt ggaacgtcat 3420
cgtgagcatc atcagagaag ggagggctgt ggtcctcaca tcccacagca tggaagaatg 3480
tgaggcactg tgtacccggc tggccatcat ggtaaagggc gcctttcgat gtatgggcac 3540
cattcagcat ctcaagtcca aatttggaga tggctatatc gtcacaatga agatcaaatc 3600
cccgaaggac gacctgcttc ctgacctgaa ccctgtggag cagttcttcc aggggaactt 3660
cccaggcagt gtgcagaggg agaggcacta caacatgctc cagttccagg tctcctcctc 3720
ctccctggcg aggatcttcc agctcctcct ctcccacaag gacagcctgc tcatcgagga 3780
gtactcagtc acacagacca cactggacca ggtgtttgta aattttgcta aacagcagac 3840
tgaaagtcat gacctccctc tgcaccctcg agctgctgga gccagtcgac aagcccagga 3900
ctga 3904
<210> 56
<211> 4636
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 56
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtcc 300
atcctgacgg gtctgttgcc accaacctct gggactgtgc tcgttggggg aagggacatt 360
gaaaccagcc tggatgcagt ccggcagagc cttggcatgt gtccacagca caacatcctg 420
ttccaccacc tcacggtggc tgagcacatg ctgttctatg cccagctgaa aggaaagtcc 480
caggaggagg cccagctgga gatggaagcc atgttggagg acacaggcct ccaccacaag 540
cggaatgaag aggctcagga cctatcaggt ggcatgcaga gaaagctgtc ggttgccatt 600
gcctttgtgg gagatgccaa ggtggtgatt ctggacgaac ccacctctgg ggtggaccct 660
tactcgagac gctcaatctg ggatctgctc ctgaagtatc gctcaggcag aaccatcatc 720
atgtccactc accacatgga cgaggccgac ctccttgggg accgcattgc catcattgcc 780
cagggaaggc tctactgctc aggcacccca ctcttcctga agaactgctt tggcacaggc 840
ttgtacttaa ccttggtgcg caagatgaaa aacatccaga gccaaaggaa aggcagtgag 900
gggacctgca gctgctcgtc taagggtttc tccaccacgt gtccagccca cgtcgatgac 960
ctaactccag aacaagtcct ggatggggat gtaaatgagc tgatggatgt agttctccac 1020
catgttccag aggcaaagct ggtggagtgc attggtcaag aacttatctt ccttcttcca 1080
aataagaact tcaagcacag agcatatgcc agccttttca gagagctgga ggagacgctg 1140
gctgaccttg gtctcagcag ttttggaatt tctgacactc ccctggaaga gatttttctg 1200
aaggtcacgg aggattctga ttcaggacct ctgtttgcgg gtggcgctca gcagaaaaga 1260
gaaaacgtca acccccgaca cccctgcttg ggtcccagag agaaggctgg acagacaccc 1320
caggactcca atgtctgctc cccaggggcg ccggctgctc acccagaggg ccagcctccc 1380
ccagagccag agtgcccagg cccgcagctc aacacgggga cacagctggt cctccagcat 1440
gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc gcagccacaa ggacttcctg 1500
gcgcagatcg tgctcccggc tacctttgtg tttttggctc tgatgctttc tattgttatc 1560
cctccttttg gcgaataccc cgctttgacc cttcacccct ggatatatgg gcagcagtac 1620
accttcttca gcatggatga accaggcagt gagcagttca cggtacttgc agacgtcctc 1680
ctgaataagc caggctttgg caaccgctgc ctgaaggaag ggtggcttcc ggagtacccc 1740
tgtggcaact caacaccctg gaagactcct tctgtgtccc caaacatcac ccagctgttc 1800
cagaagcaga aatggacaca ggtcaaccct tcaccatcct gcaggtgcag caccagggag 1860
aagctcacca tgctgccaga gtgccccgag ggtgccgggg gcctcccgcc cccccagaga 1920
acacagcgca gcacggaaat tctacaagac ctgacggaca ggaacatctc cgacttcttg 1980
gtaaaaacgt atcctgctct tataagaagc agcttaaaga gcaaattctg ggtcaatgaa 2040
cagaggtatg gaggaatttc cattggagga aagctcccag tcgtccccat cacgggggaa 2100
gcacttgttg ggtttttaag cgaccttggc cggatcatga atgtgagcgg gggccctatc 2160
actagagagg cctctaaaga aatacctgat ttccttaaac atctagaaac tgaagacaac 2220
attaaggtgt ggtttaataa caaaggctgg catgccctgg tcagctttct caatgtggcc 2280
cacaacgcca tcttacgggc cagcctgcct aaggacagaa gccccgagga gtatggaatc 2340
accgtcatta gccaacccct gaacctgacc aaggagcagc tctcagagat tacagtgctg 2400
accacttcag tggatgctgt ggttgccatc tgcgtgattt tctccatgtc cttcgtccca 2460
gccagctttg tcctttattt gatccaggag cgggtgaaca aatccaagca cctccagttt 2520
atcagtggag tgagccccac cacctactgg gtaaccaact tcctctggga catcatgaat 2580
tattccgtga gtgctgggct ggtggtgggc atcttcatcg ggtttcagaa gaaagcctac 2640
acttctccag aaaaccttcc tgcccttgtg gcactgctcc tgctgtatgg atgggcggtc 2700
attcccatga tgtacccagc atccttcctg tttgatgtcc ccagcacagc ctatgtggct 2760
ttatcttgtg ctaatctgtt catcggcatc aacagcagtg ctattacctt catcttggaa 2820
ttatttgaga ataaccggac gctgctcagg ttcaacgccg tgctgaggaa gctgctcatt 2880
gtcttccccc acttctgcct gggccggggc ctcattgacc ttgcactgag ccaggctgtg 2940
acagatgtct atgcccggtt tggtgaggag cactctgcaa atccgttcca ctgggacctg 3000
attgggaaga acctgtttgc catggtggtg gaaggggtgg tgtacttcct cctgaccctg 3060
ctggtccagc gccacttctt cctctcccaa tggattgccg agcccactaa ggagcccatt 3120
gttgatgaag atgatgatgt ggctgaagaa agacaaagaa ttattactgg tggaaataaa 3180
actgacatct taaggctaca tgaactaacc aagatttatc caggcacctc cagcccagca 3240
gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct ttggcctcct gggagtgaat 3300
ggtgccggca aaacaaccac attcaagatg ctcactgggg acaccacagt gacctcaggg 3360
gatgccaccg tagcaggcaa gagtatttta accaatattt ctgaagtcca tcaaaatatg 3420
ggctactgtc ctcagtttga tgcaatcgat gagctgctca caggacgaga acatctttac 3480
ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg aaaaggttgc aaactggagt 3540
attaagagcc tgggcctgac tgtctacgcc gactgcctgg ctggcacgta cagtgggggc 3600
aacaagcgga aactctccac agccatcgca ctcattggct gcccaccgct ggtgctgctg 3660
gatgagccca ccacagggat ggacccccag gcacgccgca tgctgtggaa cgtcatcgtg 3720
agcatcatca gagaagggag ggctgtggtc ctcacatccc acagcatgga agaatgtgag 3780
gcactgtgta cccggctggc catcatggta aagggcgcct ttcgatgtat gggcaccatt 3840
cagcatctca agtccaaatt tggagatggc tatatcgtca caatgaagat caaatccccg 3900
aaggacgacc tgcttcctga cctgaaccct gtggagcagt tcttccaggg gaacttccca 3960
ggcagtgtgc agagggagag gcactacaac atgctccagt tccaggtctc ctcctcctcc 4020
ctggcgagga tcttccagct cctcctctcc cacaaggaca gcctgctcat cgaggagtac 4080
tcagtcacac agaccacact ggaccaggtg tttgtaaatt ttgctaaaca gcagactgaa 4140
agtcatgacc tccctctgca ccctcgagct gctggagcca gtcgacaagc ccaggactga 4200
gcggccgctt cgagcagaca tgataagata cattgatgag tttggacaaa ccacaactag 4260
aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 4320
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 4380
tcagggggag atgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtaaaat 4440
cgataaggat cttcctagag catggctacg tagataagta gcatggcggg ttaatcatta 4500
actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4560
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4620
gcgagcgagc gcgcag 4636
<210> 57
<211> 4540
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 57
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120
cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180
cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240
tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300
tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360
agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420
cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480
acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540
ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600
atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660
agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720
tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780
cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840
tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900
ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960
gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020
acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080
tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140
tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200
aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260
gggcttgtcg agacagagaa gactcttgcg tttctgggat ttttccgatt tcggcctatt 4320
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4380
ttataatttc aggtggcatc tttccaattg aggaacccct agtgatggag ttggccactc 4440
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4500
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4540
<210> 58
<211> 4702
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 58
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtcc 300
atcctgacgg gtctgttgcc accaacctct gggactgtgc tcgttggggg aagggacatt 360
gaaaccagcc tggatgcagt ccggcagagc cttggcatgt gtccacagca caacatcctg 420
ttccaccacc tcacggtggc tgagcacatg ctgttctatg cccagctgaa aggaaagtcc 480
caggaggagg cccagctgga gatggaagcc atgttggagg acacaggcct ccaccacaag 540
cggaatgaag aggctcagga cctatcaggt ggcatgcaga gaaagctgtc ggttgccatt 600
gcctttgtgg gagatgccaa ggtggtgatt ctggacgaac ccacctctgg ggtggaccct 660
tactcgagac gctcaatctg ggatctgctc ctgaagtatc gctcaggcag aaccatcatc 720
atgtccactc accacatgga cgaggccgac ctccttgggg accgcattgc catcattgcc 780
cagggaaggc tctactgctc aggcacccca ctcttcctga agaactgctt tggcacaggc 840
ttgtacttaa ccttggtgcg caagatgaaa aacatccaga gccaaaggaa aggcagtgag 900
gggacctgca gctgctcgtc taagggtttc tccaccacgt gtccagccca cgtcgatgac 960
ctaactccag aacaagtcct ggatggggat gtaaatgagc tgatggatgt agttctccac 1020
catgttccag aggcaaagct ggtggagtgc attggtcaag aacttatctt ccttcttcca 1080
aataagaact tcaagcacag agcatatgcc agccttttca gagagctgga ggagacgctg 1140
gctgaccttg gtctcagcag ttttggaatt tctgacactc ccctggaaga gatttttctg 1200
aaggtcacgg aggattctga ttcaggacct ctgtttgcgg gtggcgctca gcagaaaaga 1260
gaaaacgtca acccccgaca cccctgcttg ggtcccagag agaaggctgg acagacaccc 1320
caggactcca atgtctgctc cccaggggcg ccggctgctc acccagaggg ccagcctccc 1380
ccagagccag agtgcccagg cccgcagctc aacacgggga cacagctggt cctccagcat 1440
gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc gcagccacaa ggacttcctg 1500
gcgcagatcg tgctcccggc tacctttgtg tttttggctc tgatgctttc tattgttatc 1560
cctccttttg gcgaataccc cgctttgacc cttcacccct ggatatatgg gcagcagtac 1620
accttcttca gcatggatga accaggcagt gagcagttca cggtacttgc agacgtcctc 1680
ctgaataagc caggctttgg caaccgctgc ctgaaggaag ggtggcttcc ggagtacccc 1740
tgtggcaact caacaccctg gaagactcct tctgtgtccc caaacatcac ccagctgttc 1800
cagaagcaga aatggacaca ggtcaaccct tcaccatcct gcaggtgcag caccagggag 1860
aagctcacca tgctgccaga gtgccccgag ggtgccgggg gcctcccgcc cccccagaga 1920
acacagcgca gcacggaaat tctacaagac ctgacggaca ggaacatctc cgacttcttg 1980
gtaaaaacgt atcctgctct tataagaagc agcttaaaga gcaaattctg ggtcaatgaa 2040
cagaggtatg gaggaatttc cattggagga aagctcccag tcgtccccat cacgggggaa 2100
gcacttgttg ggtttttaag cgaccttggc cggatcatga atgtgagcgg gggccctatc 2160
actagagagg cctctaaaga aatacctgat ttccttaaac atctagaaac tgaagacaac 2220
attaaggtgt ggtttaataa caaaggctgg catgccctgg tcagctttct caatgtggcc 2280
cacaacgcca tcttacgggc cagcctgcct aaggacagaa gccccgagga gtatggaatc 2340
accgtcatta gccaacccct gaacctgacc aaggagcagc tctcagagat tacagtgctg 2400
accacttcag tggatgctgt ggttgccatc tgcgtgattt tctccatgtc cttcgtccca 2460
gccagctttg tcctttattt gatccaggag cgggtgaaca aatccaagca cctccagttt 2520
atcagtggag tgagccccac cacctactgg gtaaccaact tcctctggga catcatgaat 2580
tattccgtga gtgctgggct ggtggtgggc atcttcatcg ggtttcagaa gaaagcctac 2640
acttctccag aaaaccttcc tgcccttgtg gcactgctcc tgctgtatgg atgggcggtc 2700
attcccatga tgtacccagc atccttcctg tttgatgtcc ccagcacagc ctatgtggct 2760
ttatcttgtg ctaatctgtt catcggcatc aacagcagtg ctattacctt catcttggaa 2820
ttatttgaga ataaccggac gctgctcagg ttcaacgccg tgctgaggaa gctgctcatt 2880
gtcttccccc acttctgcct gggccggggc ctcattgacc ttgcactgag ccaggctgtg 2940
acagatgtct atgcccggtt tggtgaggag cactctgcaa atccgttcca ctgggacctg 3000
attgggaaga acctgtttgc catggtggtg gaaggggtgg tgtacttcct cctgaccctg 3060
ctggtccagc gccacttctt cctctcccaa tggattgccg agcccactaa ggagcccatt 3120
gttgatgaag atgatgatgt ggctgaagaa agacaaagaa ttattactgg tggaaataaa 3180
actgacatct taaggctaca tgaactaacc aagatttatc caggcacctc cagcccagca 3240
gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct ttggcctcct gggagtgaat 3300
ggtgccggca aaacaaccac attcaagatg ctcactgggg acaccacagt gacctcaggg 3360
gatgccaccg tagcaggcaa gagtatttta accaatattt ctgaagtcca tcaaaatatg 3420
ggctactgtc ctcagtttga tgcaatcgat gagctgctca caggacgaga acatctttac 3480
ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg aaaaggttgc aaactggagt 3540
attaagagcc tgggcctgac tgtctacgcc gactgcctgg ctggcacgta cagtgggggc 3600
aacaagcgga aactctccac agccatcgca ctcattggct gcccaccgct ggtgctgctg 3660
gatgagccca ccacagggat ggacccccag gcacgccgca tgctgtggaa cgtcatcgtg 3720
agcatcatca gagaagggag ggctgtggtc ctcacatccc acagcatgga agaatgtgag 3780
gcactgtgta cccggctggc catcatggta aagggcgcct ttcgatgtat gggcaccatt 3840
cagcatctca agtccaaatt tggagatggc tatatcgtca caatgaagat caaatccccg 3900
aaggacgacc tgcttcctga cctgaaccct gtggagcagt tcttccaggg gaacttccca 3960
ggcagtgtgc agagggagag gcactacaac atgctccagt tccaggtctc ctcctcctcc 4020
ctggcgagga tcttccagct cctcctctcc cacaaggaca gcctgctcat cgaggagtac 4080
tcagtcacac agaccacact ggaccaggtg tttgtaaatt ttgctaaaca gcagactgaa 4140
agtcatgacc tccctctgca ccctcgagct gctggagcca gtcgacaagc ccaggacgac 4200
tacaaagacc atgacggtga ttataaagat catgacatcg actacaagga tgacgatgac 4260
aagtgagcgg ccgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac 4320
aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 4380
tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 4440
tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg 4500
taaaatcgat aaggatcttc ctagagcatg gctacgtaga taagtagcat ggcgggttaa 4560
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4620
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4680
cagtgagcga gcgagcgcgc ag 4702
<210> 59
<211> 4718
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 59
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120
cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180
cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240
tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300
tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360
agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420
cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480
acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540
ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600
atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660
agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720
tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780
cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840
tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900
ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960
gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020
acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080
tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140
tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200
aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260
gggcttgtcg agacagagaa gactcttgcg tttctccccg ggtgcgcggc gtcggtggtg 4320
ccggcggggg gcgccaggtc gcaggcggtg tagggctcca ggcaggcggc gaaggccatg 4380
acgtgcgcta tgaaggtctg ctcctgcacg ccgtgaacca ggtgcgcctg cgggccgcgc 4440
gcgaacaccg ccacgtcctc gcctgcgtgg gtctcttcgt ccaggggcac tgctgactgc 4500
tgccgatact cggggctccc gctctcgctc tcggtaacat ccggccgggc gccgtccttg 4560
agcacatagc ctggaccgtt tccaattgag gaacccctag tgatggagtt ggccactccc 4620
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4680
tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4718
<210> 60
<211> 4880
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 60
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatcccccc gggtgcgcgg cgtcggtggt gccggcgggg ggcgccaggt 180
cgcaggcggt gtagggctcc aggcaggcgg cgaaggccat gacgtgcgct atgaaggtct 240
gctcctgcac gccgtgaacc aggtgcgcct gcgggccgcg cgcgaacacc gccacgtcct 300
cgcctgcgtg ggtctcttcg tccaggggca ctgctgactg ctgccgatac tcggggctcc 360
cgctctcgct ctcggtaaca tccggccggg cgccgtcctt gagcacatag cctggaccgt 420
ttcgataggc acctattggt cttactgaca tccactttgc ctttctctcc acaggtccat 480
cctgacgggt ctgttgccac caacctctgg gactgtgctc gttgggggaa gggacattga 540
aaccagcctg gatgcagtcc ggcagagcct tggcatgtgt ccacagcaca acatcctgtt 600
ccaccacctc acggtggctg agcacatgct gttctatgcc cagctgaaag gaaagtccca 660
ggaggaggcc cagctggaga tggaagccat gttggaggac acaggcctcc accacaagcg 720
gaatgaagag gctcaggacc tatcaggtgg catgcagaga aagctgtcgg ttgccattgc 780
ctttgtggga gatgccaagg tggtgattct ggacgaaccc acctctgggg tggaccctta 840
ctcgagacgc tcaatctggg atctgctcct gaagtatcgc tcaggcagaa ccatcatcat 900
gtccactcac cacatggacg aggccgacct ccttggggac cgcattgcca tcattgccca 960
gggaaggctc tactgctcag gcaccccact cttcctgaag aactgctttg gcacaggctt 1020
gtacttaacc ttggtgcgca agatgaaaaa catccagagc caaaggaaag gcagtgaggg 1080
gacctgcagc tgctcgtcta agggtttctc caccacgtgt ccagcccacg tcgatgacct 1140
aactccagaa caagtcctgg atggggatgt aaatgagctg atggatgtag ttctccacca 1200
tgttccagag gcaaagctgg tggagtgcat tggtcaagaa cttatcttcc ttcttccaaa 1260
taagaacttc aagcacagag catatgccag ccttttcaga gagctggagg agacgctggc 1320
tgaccttggt ctcagcagtt ttggaatttc tgacactccc ctggaagaga tttttctgaa 1380
ggtcacggag gattctgatt caggacctct gtttgcgggt ggcgctcagc agaaaagaga 1440
aaacgtcaac ccccgacacc cctgcttggg tcccagagag aaggctggac agacacccca 1500
ggactccaat gtctgctccc caggggcgcc ggctgctcac ccagagggcc agcctccccc 1560
agagccagag tgcccaggcc cgcagctcaa cacggggaca cagctggtcc tccagcatgt 1620
gcaggcgctg ctggtcaaga gattccaaca caccatccgc agccacaagg acttcctggc 1680
gcagatcgtg ctcccggcta cctttgtgtt tttggctctg atgctttcta ttgttatccc 1740
tccttttggc gaataccccg ctttgaccct tcacccctgg atatatgggc agcagtacac 1800
cttcttcagc atggatgaac caggcagtga gcagttcacg gtacttgcag acgtcctcct 1860
gaataagcca ggctttggca accgctgcct gaaggaaggg tggcttccgg agtacccctg 1920
tggcaactca acaccctgga agactccttc tgtgtcccca aacatcaccc agctgttcca 1980
gaagcagaaa tggacacagg tcaacccttc accatcctgc aggtgcagca ccagggagaa 2040
gctcaccatg ctgccagagt gccccgaggg tgccgggggc ctcccgcccc cccagagaac 2100
acagcgcagc acggaaattc tacaagacct gacggacagg aacatctccg acttcttggt 2160
aaaaacgtat cctgctctta taagaagcag cttaaagagc aaattctggg tcaatgaaca 2220
gaggtatgga ggaatttcca ttggaggaaa gctcccagtc gtccccatca cgggggaagc 2280
acttgttggg tttttaagcg accttggccg gatcatgaat gtgagcgggg gccctatcac 2340
tagagaggcc tctaaagaaa tacctgattt ccttaaacat ctagaaactg aagacaacat 2400
taaggtgtgg tttaataaca aaggctggca tgccctggtc agctttctca atgtggccca 2460
caacgccatc ttacgggcca gcctgcctaa ggacagaagc cccgaggagt atggaatcac 2520
cgtcattagc caacccctga acctgaccaa ggagcagctc tcagagatta cagtgctgac 2580
cacttcagtg gatgctgtgg ttgccatctg cgtgattttc tccatgtcct tcgtcccagc 2640
cagctttgtc ctttatttga tccaggagcg ggtgaacaaa tccaagcacc tccagtttat 2700
cagtggagtg agccccacca cctactgggt aaccaacttc ctctgggaca tcatgaatta 2760
ttccgtgagt gctgggctgg tggtgggcat cttcatcggg tttcagaaga aagcctacac 2820
ttctccagaa aaccttcctg cccttgtggc actgctcctg ctgtatggat gggcggtcat 2880
tcccatgatg tacccagcat ccttcctgtt tgatgtcccc agcacagcct atgtggcttt 2940
atcttgtgct aatctgttca tcggcatcaa cagcagtgct attaccttca tcttggaatt 3000
atttgagaat aaccggacgc tgctcaggtt caacgccgtg ctgaggaagc tgctcattgt 3060
cttcccccac ttctgcctgg gccggggcct cattgacctt gcactgagcc aggctgtgac 3120
agatgtctat gcccggtttg gtgaggagca ctctgcaaat ccgttccact gggacctgat 3180
tgggaagaac ctgtttgcca tggtggtgga aggggtggtg tacttcctcc tgaccctgct 3240
ggtccagcgc cacttcttcc tctcccaatg gattgccgag cccactaagg agcccattgt 3300
tgatgaagat gatgatgtgg ctgaagaaag acaaagaatt attactggtg gaaataaaac 3360
tgacatctta aggctacatg aactaaccaa gatttatcca ggcacctcca gcccagcagt 3420
ggacaggctg tgtgtcggag ttcgccctgg agagtgcttt ggcctcctgg gagtgaatgg 3480
tgccggcaaa acaaccacat tcaagatgct cactggggac accacagtga cctcagggga 3540
tgccaccgta gcaggcaaga gtattttaac caatatttct gaagtccatc aaaatatggg 3600
ctactgtcct cagtttgatg caatcgatga gctgctcaca ggacgagaac atctttacct 3660
ttatgcccgg cttcgaggtg taccagcaga agaaatcgaa aaggttgcaa actggagtat 3720
taagagcctg ggcctgactg tctacgccga ctgcctggct ggcacgtaca gtgggggcaa 3780
caagcggaaa ctctccacag ccatcgcact cattggctgc ccaccgctgg tgctgctgga 3840
tgagcccacc acagggatgg acccccaggc acgccgcatg ctgtggaacg tcatcgtgag 3900
catcatcaga gaagggaggg ctgtggtcct cacatcccac agcatggaag aatgtgaggc 3960
actgtgtacc cggctggcca tcatggtaaa gggcgccttt cgatgtatgg gcaccattca 4020
gcatctcaag tccaaatttg gagatggcta tatcgtcaca atgaagatca aatccccgaa 4080
ggacgacctg cttcctgacc tgaaccctgt ggagcagttc ttccagggga acttcccagg 4140
cagtgtgcag agggagaggc actacaacat gctccagttc caggtctcct cctcctccct 4200
ggcgaggatc ttccagctcc tcctctccca caaggacagc ctgctcatcg aggagtactc 4260
agtcacacag accacactgg accaggtgtt tgtaaatttt gctaaacagc agactgaaag 4320
tcatgacctc cctctgcacc ctcgagctgc tggagccagt cgacaagccc aggacgacta 4380
caaagaccat gacggtgatt ataaagatca tgacatcgac tacaaggatg acgatgacaa 4440
gtgagcggcc gcttcgagca gacatgataa gatacattga tgagtttgga caaaccacaa 4500
ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 4560
taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 4620
aggttcaggg ggagatgtgg gaggtttttt aaagcaagta aaacctctac aaatgtggta 4680
aaatcgataa ggatcttcct agagcatggc tacgtagata agtagcatgg cgggttaatc 4740
attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 4800
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 4860
gtgagcgagc gagcgcgcag 4880
<210> 61
<211> 4719
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 61
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120
cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180
cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240
tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300
tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360
agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420
cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480
acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540
ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600
atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660
agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720
tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780
cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840
tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900
ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960
gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020
acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080
tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140
tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200
aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260
gggcttgtcg agacagagaa gactcttgcg tttctcgcag ggcagcctct gtcatctcca 4320
tcagggaggg gtccagtgtg gagtctcggt ggatctcgta tttcatgtct ccaggctcaa 4380
agagacccat gagatgggtc acagacgggt ccagggaagc ctgcatgagc tcagtgcggt 4440
tccacacata ccgggcaccc tggcgcttcg ccagccattc ctgcaccaga ttcttcccgt 4500
ccagcctggt cccaccttgg ctgtagtcat ctgggtactc agggtctggg gttcccatgc 4560
gaaacatgta ctttcggcct ccacaattga ggaaccccta gtgatggagt tggccactcc 4620
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4680
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4719
<210> 62
<211> 4881
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 62
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatcccgca gggcagcctc tgtcatctcc atcagggagg ggtccagtgt 180
ggagtctcgg tggatctcgt atttcatgtc tccaggctca aagagaccca tgagatgggt 240
cacagacggg tccagggaag cctgcatgag ctcagtgcgg ttccacacat accgggcacc 300
ctggcgcttc gccagccatt cctgcaccag attcttcccg tccagcctgg tcccaccttg 360
gctgtagtca tctgggtact cagggtctgg ggttcccatg cgaaacatgt actttcggcc 420
tccagatagg cacctattgg tcttactgac atccactttg cctttctctc cacaggtcca 480
tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 540
aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 600
tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 660
aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 720
ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 780
cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt 840
actcgagacg ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca 900
tgtccactca ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc 960
agggaaggct ctactgctca ggcaccccac tcttcctgaa gaactgcttt ggcacaggct 1020
tgtacttaac cttggtgcgc aagatgaaaa acatccagag ccaaaggaaa ggcagtgagg 1080
ggacctgcag ctgctcgtct aagggtttct ccaccacgtg tccagcccac gtcgatgacc 1140
taactccaga acaagtcctg gatggggatg taaatgagct gatggatgta gttctccacc 1200
atgttccaga ggcaaagctg gtggagtgca ttggtcaaga acttatcttc cttcttccaa 1260
ataagaactt caagcacaga gcatatgcca gccttttcag agagctggag gagacgctgg 1320
ctgaccttgg tctcagcagt tttggaattt ctgacactcc cctggaagag atttttctga 1380
aggtcacgga ggattctgat tcaggacctc tgtttgcggg tggcgctcag cagaaaagag 1440
aaaacgtcaa cccccgacac ccctgcttgg gtcccagaga gaaggctgga cagacacccc 1500
aggactccaa tgtctgctcc ccaggggcgc cggctgctca cccagagggc cagcctcccc 1560
cagagccaga gtgcccaggc ccgcagctca acacggggac acagctggtc ctccagcatg 1620
tgcaggcgct gctggtcaag agattccaac acaccatccg cagccacaag gacttcctgg 1680
cgcagatcgt gctcccggct acctttgtgt ttttggctct gatgctttct attgttatcc 1740
ctccttttgg cgaatacccc gctttgaccc ttcacccctg gatatatggg cagcagtaca 1800
ccttcttcag catggatgaa ccaggcagtg agcagttcac ggtacttgca gacgtcctcc 1860
tgaataagcc aggctttggc aaccgctgcc tgaaggaagg gtggcttccg gagtacccct 1920
gtggcaactc aacaccctgg aagactcctt ctgtgtcccc aaacatcacc cagctgttcc 1980
agaagcagaa atggacacag gtcaaccctt caccatcctg caggtgcagc accagggaga 2040
agctcaccat gctgccagag tgccccgagg gtgccggggg cctcccgccc ccccagagaa 2100
cacagcgcag cacggaaatt ctacaagacc tgacggacag gaacatctcc gacttcttgg 2160
taaaaacgta tcctgctctt ataagaagca gcttaaagag caaattctgg gtcaatgaac 2220
agaggtatgg aggaatttcc attggaggaa agctcccagt cgtccccatc acgggggaag 2280
cacttgttgg gtttttaagc gaccttggcc ggatcatgaa tgtgagcggg ggccctatca 2340
ctagagaggc ctctaaagaa atacctgatt tccttaaaca tctagaaact gaagacaaca 2400
ttaaggtgtg gtttaataac aaaggctggc atgccctggt cagctttctc aatgtggccc 2460
acaacgccat cttacgggcc agcctgccta aggacagaag ccccgaggag tatggaatca 2520
ccgtcattag ccaacccctg aacctgacca aggagcagct ctcagagatt acagtgctga 2580
ccacttcagt ggatgctgtg gttgccatct gcgtgatttt ctccatgtcc ttcgtcccag 2640
ccagctttgt cctttatttg atccaggagc gggtgaacaa atccaagcac ctccagttta 2700
tcagtggagt gagccccacc acctactggg taaccaactt cctctgggac atcatgaatt 2760
attccgtgag tgctgggctg gtggtgggca tcttcatcgg gtttcagaag aaagcctaca 2820
cttctccaga aaaccttcct gcccttgtgg cactgctcct gctgtatgga tgggcggtca 2880
ttcccatgat gtacccagca tccttcctgt ttgatgtccc cagcacagcc tatgtggctt 2940
tatcttgtgc taatctgttc atcggcatca acagcagtgc tattaccttc atcttggaat 3000
tatttgagaa taaccggacg ctgctcaggt tcaacgccgt gctgaggaag ctgctcattg 3060
tcttccccca cttctgcctg ggccggggcc tcattgacct tgcactgagc caggctgtga 3120
cagatgtcta tgcccggttt ggtgaggagc actctgcaaa tccgttccac tgggacctga 3180
ttgggaagaa cctgtttgcc atggtggtgg aaggggtggt gtacttcctc ctgaccctgc 3240
tggtccagcg ccacttcttc ctctcccaat ggattgccga gcccactaag gagcccattg 3300
ttgatgaaga tgatgatgtg gctgaagaaa gacaaagaat tattactggt ggaaataaaa 3360
ctgacatctt aaggctacat gaactaacca agatttatcc aggcacctcc agcccagcag 3420
tggacaggct gtgtgtcgga gttcgccctg gagagtgctt tggcctcctg ggagtgaatg 3480
gtgccggcaa aacaaccaca ttcaagatgc tcactgggga caccacagtg acctcagggg 3540
atgccaccgt agcaggcaag agtattttaa ccaatatttc tgaagtccat caaaatatgg 3600
gctactgtcc tcagtttgat gcaatcgatg agctgctcac aggacgagaa catctttacc 3660
tttatgcccg gcttcgaggt gtaccagcag aagaaatcga aaaggttgca aactggagta 3720
ttaagagcct gggcctgact gtctacgccg actgcctggc tggcacgtac agtgggggca 3780
acaagcggaa actctccaca gccatcgcac tcattggctg cccaccgctg gtgctgctgg 3840
atgagcccac cacagggatg gacccccagg cacgccgcat gctgtggaac gtcatcgtga 3900
gcatcatcag agaagggagg gctgtggtcc tcacatccca cagcatggaa gaatgtgagg 3960
cactgtgtac ccggctggcc atcatggtaa agggcgcctt tcgatgtatg ggcaccattc 4020
agcatctcaa gtccaaattt ggagatggct atatcgtcac aatgaagatc aaatccccga 4080
aggacgacct gcttcctgac ctgaaccctg tggagcagtt cttccagggg aacttcccag 4140
gcagtgtgca gagggagagg cactacaaca tgctccagtt ccaggtctcc tcctcctccc 4200
tggcgaggat cttccagctc ctcctctccc acaaggacag cctgctcatc gaggagtact 4260
cagtcacaca gaccacactg gaccaggtgt ttgtaaattt tgctaaacag cagactgaaa 4320
gtcatgacct ccctctgcac cctcgagctg ctggagccag tcgacaagcc caggacgact 4380
acaaagacca tgacggtgat tataaagatc atgacatcga ctacaaggat gacgatgaca 4440
agtgagcggc cgcttcgagc agacatgata agatacattg atgagtttgg acaaaccaca 4500
actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 4560
gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 4620
caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 4680
aaaatcgata aggatcttcc tagagcatgg ctacgtagat aagtagcatg gcgggttaat 4740
cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4800
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4860
agtgagcgag cgagcgcgca g 4881
<210> 63
<211> 4709
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 63
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120
cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180
cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240
tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300
tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360
agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420
cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480
acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540
ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600
atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660
agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720
tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780
cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840
tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900
ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960
gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020
acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080
tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140
tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200
aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260
gggcttgtcg agacagagaa gactcttgcg tttctgtgat cctaggtgga ggccgaaagt 4320
acatgtttcg catgggaacc ccagaccctg agtacccaga tgactacagc caaggtggga 4380
ccaggctgga cgggaagaat ctggtgcagg aatggctggc gaagcgccag ggtgcccggt 4440
acgtgtggaa ccgcactgag ctcatgcagg cttccctgga cccgtctgtg acccatctca 4500
tgggtctctt tgagcctgga gacatgaaat acgagatcca ccgagactcc acactggacc 4560
cctccctgat ggacaattga ggaaccccta gtgatggagt tggccactcc ctctctgcgc 4620
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 4680
gcggcctcag tgagcgagcg agcgcgcag 4709
<210> 64
<211> 4871
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 64
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccgtga tcctaggtgg aggccgaaag tacatgtttc gcatgggaac 180
cccagaccct gagtacccag atgactacag ccaaggtggg accaggctgg acgggaagaa 240
tctggtgcag gaatggctgg cgaagcgcca gggtgcccgg tacgtgtgga accgcactga 300
gctcatgcag gcttccctgg acccgtctgt gacccatctc atgggtctct ttgagcctgg 360
agacatgaaa tacgagatcc accgagactc cacactggac ccctccctga tggagatagg 420
cacctattgg tcttactgac atccactttg cctttctctc cacaggtcca tcctgacggg 480
tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg aaaccagcct 540
ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt tccaccacct 600
cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc aggaggaggc 660
ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc ggaatgaaga 720
ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg cctttgtggg 780
agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt actcgagacg 840
ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca tgtccactca 900
ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc agggaaggct 960
ctactgctca ggcaccccac tcttcctgaa gaactgcttt ggcacaggct tgtacttaac 1020
cttggtgcgc aagatgaaaa acatccagag ccaaaggaaa ggcagtgagg ggacctgcag 1080
ctgctcgtct aagggtttct ccaccacgtg tccagcccac gtcgatgacc taactccaga 1140
acaagtcctg gatggggatg taaatgagct gatggatgta gttctccacc atgttccaga 1200
ggcaaagctg gtggagtgca ttggtcaaga acttatcttc cttcttccaa ataagaactt 1260
caagcacaga gcatatgcca gccttttcag agagctggag gagacgctgg ctgaccttgg 1320
tctcagcagt tttggaattt ctgacactcc cctggaagag atttttctga aggtcacgga 1380
ggattctgat tcaggacctc tgtttgcggg tggcgctcag cagaaaagag aaaacgtcaa 1440
cccccgacac ccctgcttgg gtcccagaga gaaggctgga cagacacccc aggactccaa 1500
tgtctgctcc ccaggggcgc cggctgctca cccagagggc cagcctcccc cagagccaga 1560
gtgcccaggc ccgcagctca acacggggac acagctggtc ctccagcatg tgcaggcgct 1620
gctggtcaag agattccaac acaccatccg cagccacaag gacttcctgg cgcagatcgt 1680
gctcccggct acctttgtgt ttttggctct gatgctttct attgttatcc ctccttttgg 1740
cgaatacccc gctttgaccc ttcacccctg gatatatggg cagcagtaca ccttcttcag 1800
catggatgaa ccaggcagtg agcagttcac ggtacttgca gacgtcctcc tgaataagcc 1860
aggctttggc aaccgctgcc tgaaggaagg gtggcttccg gagtacccct gtggcaactc 1920
aacaccctgg aagactcctt ctgtgtcccc aaacatcacc cagctgttcc agaagcagaa 1980
atggacacag gtcaaccctt caccatcctg caggtgcagc accagggaga agctcaccat 2040
gctgccagag tgccccgagg gtgccggggg cctcccgccc ccccagagaa cacagcgcag 2100
cacggaaatt ctacaagacc tgacggacag gaacatctcc gacttcttgg taaaaacgta 2160
tcctgctctt ataagaagca gcttaaagag caaattctgg gtcaatgaac agaggtatgg 2220
aggaatttcc attggaggaa agctcccagt cgtccccatc acgggggaag cacttgttgg 2280
gtttttaagc gaccttggcc ggatcatgaa tgtgagcggg ggccctatca ctagagaggc 2340
ctctaaagaa atacctgatt tccttaaaca tctagaaact gaagacaaca ttaaggtgtg 2400
gtttaataac aaaggctggc atgccctggt cagctttctc aatgtggccc acaacgccat 2460
cttacgggcc agcctgccta aggacagaag ccccgaggag tatggaatca ccgtcattag 2520
ccaacccctg aacctgacca aggagcagct ctcagagatt acagtgctga ccacttcagt 2580
ggatgctgtg gttgccatct gcgtgatttt ctccatgtcc ttcgtcccag ccagctttgt 2640
cctttatttg atccaggagc gggtgaacaa atccaagcac ctccagttta tcagtggagt 2700
gagccccacc acctactggg taaccaactt cctctgggac atcatgaatt attccgtgag 2760
tgctgggctg gtggtgggca tcttcatcgg gtttcagaag aaagcctaca cttctccaga 2820
aaaccttcct gcccttgtgg cactgctcct gctgtatgga tgggcggtca ttcccatgat 2880
gtacccagca tccttcctgt ttgatgtccc cagcacagcc tatgtggctt tatcttgtgc 2940
taatctgttc atcggcatca acagcagtgc tattaccttc atcttggaat tatttgagaa 3000
taaccggacg ctgctcaggt tcaacgccgt gctgaggaag ctgctcattg tcttccccca 3060
cttctgcctg ggccggggcc tcattgacct tgcactgagc caggctgtga cagatgtcta 3120
tgcccggttt ggtgaggagc actctgcaaa tccgttccac tgggacctga ttgggaagaa 3180
cctgtttgcc atggtggtgg aaggggtggt gtacttcctc ctgaccctgc tggtccagcg 3240
ccacttcttc ctctcccaat ggattgccga gcccactaag gagcccattg ttgatgaaga 3300
tgatgatgtg gctgaagaaa gacaaagaat tattactggt ggaaataaaa ctgacatctt 3360
aaggctacat gaactaacca agatttatcc aggcacctcc agcccagcag tggacaggct 3420
gtgtgtcgga gttcgccctg gagagtgctt tggcctcctg ggagtgaatg gtgccggcaa 3480
aacaaccaca ttcaagatgc tcactgggga caccacagtg acctcagggg atgccaccgt 3540
agcaggcaag agtattttaa ccaatatttc tgaagtccat caaaatatgg gctactgtcc 3600
tcagtttgat gcaatcgatg agctgctcac aggacgagaa catctttacc tttatgcccg 3660
gcttcgaggt gtaccagcag aagaaatcga aaaggttgca aactggagta ttaagagcct 3720
gggcctgact gtctacgccg actgcctggc tggcacgtac agtgggggca acaagcggaa 3780
actctccaca gccatcgcac tcattggctg cccaccgctg gtgctgctgg atgagcccac 3840
cacagggatg gacccccagg cacgccgcat gctgtggaac gtcatcgtga gcatcatcag 3900
agaagggagg gctgtggtcc tcacatccca cagcatggaa gaatgtgagg cactgtgtac 3960
ccggctggcc atcatggtaa agggcgcctt tcgatgtatg ggcaccattc agcatctcaa 4020
gtccaaattt ggagatggct atatcgtcac aatgaagatc aaatccccga aggacgacct 4080
gcttcctgac ctgaaccctg tggagcagtt cttccagggg aacttcccag gcagtgtgca 4140
gagggagagg cactacaaca tgctccagtt ccaggtctcc tcctcctccc tggcgaggat 4200
cttccagctc ctcctctccc acaaggacag cctgctcatc gaggagtact cagtcacaca 4260
gaccacactg gaccaggtgt ttgtaaattt tgctaaacag cagactgaaa gtcatgacct 4320
ccctctgcac cctcgagctg ctggagccag tcgacaagcc caggacgact acaaagacca 4380
tgacggtgat tataaagatc atgacatcga ctacaaggat gacgatgaca agtgagcggc 4440
cgcttcgagc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 4500
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 4560
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 4620
gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaatcgata 4680
aggatcttcc tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 4740
aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4800
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4860
cgagcgcgca g 4871
<210> 65
<211> 4073
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 65
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360
ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420
ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480
ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540
cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600
ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660
tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720
gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780
atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840
caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900
gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960
gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020
gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080
agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140
cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200
ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260
cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320
cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380
tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440
gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500
ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560
tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620
gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680
actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740
gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800
aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860
cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920
ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980
acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040
tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100
agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160
acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220
agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280
aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340
caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400
ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460
tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520
tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580
acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640
tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700
agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760
gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820
tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880
ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940
gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000
accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060
ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120
tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180
tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240
actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300
aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360
cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420
ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480
cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540
acaatggagc tgggaaaacc accaccttgt aagtatcaag gttacaagac aggtttaagg 3600
agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct ccccgggtgc 3660
gcggcgtcgg tggtgccggc ggggggcgcc aggtcgcagg cggtgtaggg ctccaggcag 3720
gcggcgaagg ccatgacgtg cgctatgaag gtctgctcct gcacgccgtg aaccaggtgc 3780
gcctgcgggc cgcgcgcgaa caccgccacg tcctcgcctg cgtgggtctc ttcgtccagg 3840
ggcactgctg actgctgccg atactcgggg ctcccgctct cgctctcggt aacatccggc 3900
cgggcgccgt ccttgagcac atagcctgga ccgtttccaa ttgaggaacc cctagtgatg 3960
gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4020
gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 4073
<210> 66
<211> 4074
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 66
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360
ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420
ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480
ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540
cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600
ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660
tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720
gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780
atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840
caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900
gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960
gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020
gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080
agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140
cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200
ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260
cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320
cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380
tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440
gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500
ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560
tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620
gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680
actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740
gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800
aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860
cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920
ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980
acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040
tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100
agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160
acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220
agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280
aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340
caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400
ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460
tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520
tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580
acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640
tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700
agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760
gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820
tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880
ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940
gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000
accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060
ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120
tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180
tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240
actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300
aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360
cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420
ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480
cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540
acaatggagc tgggaaaacc accaccttgt aagtatcaag gttacaagac aggtttaagg 3600
agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct cgcagggcag 3660
cctctgtcat ctccatcagg gaggggtcca gtgtggagtc tcggtggatc tcgtatttca 3720
tgtctccagg ctcaaagaga cccatgagat gggtcacaga cgggtccagg gaagcctgca 3780
tgagctcagt gcggttccac acataccggg caccctggcg cttcgccagc cattcctgca 3840
ccagattctt cccgtccagc ctggtcccac cttggctgta gtcatctggg tactcagggt 3900
ctggggttcc catgcgaaac atgtactttc ggcctccaca attgaggaac ccctagtgat 3960
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 4020
cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 4074
<210> 67
<211> 4636
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 67
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgtaagc agtgagctag 180
cctgaattcc agcacactgg cggccgttac tagtggatct tcaatattgg ccattagcca 240
tattattcat tggttatata gcataaatca atattggcta ttggccattg catacgttgt 300
atctatatca taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc 360
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 420
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 480
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 540
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 600
tgtatcatat gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 660
attatgccca gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag 720
tcatcgctat taccatggtg atgcggtttt ggcagtacac caatgggcgt ggatagcggt 780
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 840
accaaaatca acgggacttt ccaaaatgtc gtaataaccc cgccccgttg acgcaaatgg 900
gcggtaggcg tgtacggtgg gaggtctata taagcagagc tcgtttagtg aaccgtcaga 960
tcactagaag ctttattgcg gtagtttatc acagttaaat tgctaacgca gtcagtgctt 1020
ctgacacaac agtctcgaac ttaagctgca gaagttggtc gtgaggcact gggcaggtaa 1080
gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg tcgagacaga 1140
gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac tttgcctttc 1200
tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt acttaatacg 1260
actcactata ggctagcctc gagaattcac gcgtggtacc tctagagtcg acccgggcgg 1320
ccgccatggg cttcgtgaga cagatacagc ttttgctctg gaagaactgg accctgcgga 1380
aaaggcaaaa gattcgcttt gtggtggaac tcgtgtggcc tttatcttta tttctggtct 1440
tgatctggtt aaggaatgcc aacccgctct acagccatca tgaatgccat ttccccaaca 1500
aggcgatgcc ctcagcagga atgctgccgt ggctccaggg gatcttctgc aatgtgaaca 1560
atccctgttt tcaaagcccc accccaggag aatctcctgg aattgtgtca aactataaca 1620
actccatctt ggcaagggta tatcgagatt ttcaagaact cctcatgaat gcaccagaga 1680
gccagcacct tggccgtatt tggacagagc tacacatctt gtcccaattc atggacaccc 1740
tccggactca cccggagaga attgcaggaa gaggaattcg aataagggat atcttgaaag 1800
atgaagaaac actgacacta tttctcatta aaaacatcgg cctgtctgac tcagtggtct 1860
accttctgat caactctcaa gtccgtccag agcagttcgc tcatggagtc ccggacctgg 1920
cgctgaagga catcgcctgc agcgaggccc tcctggagcg cttcatcatc ttcagccaga 1980
gacgcggggc aaagacggtg cgctatgccc tgtgctccct ctcccagggc accctacagt 2040
ggatagaaga cactctgtat gccaacgtgg acttcttcaa gctcttccgt gtgcttccca 2100
cactcctaga cagccgttct caaggtatca atctgagatc ttggggagga atattatctg 2160
atatgtcacc aagaattcaa gagtttatcc atcggccgag tatgcaggac ttgctgtggg 2220
tgaccaggcc cctcatgcag aatggtggtc cagagacctt tacaaagctg atgggcatcc 2280
tgtctgacct cctgtgtggc taccccgagg gaggtggctc tcgggtgctc tccttcaact 2340
ggtatgaaga caataactat aaggcctttc tggggattga ctccacaagg aaggatccta 2400
tctattctta tgacagaaga acaacatcct tttgtaatgc attgatccag agcctggagt 2460
caaatccttt aaccaaaatc gcttggaggg cggcaaagcc tttgctgatg ggaaaaatcc 2520
tgtacactcc tgattcacct gcagcacgaa ggatactgaa gaatgccaac tcaacttttg 2580
aagaactgga acacgttagg aagttggtca aagcctggga agaagtaggg ccccagatct 2640
ggtacttctt tgacaacagc acacagatga acatgatcag agataccctg gggaacccaa 2700
cagtaaaaga ctttttgaat aggcagcttg gtgaagaagg tattactgct gaagccatcc 2760
taaacttcct ctacaagggc cctcgggaaa gccaggctga cgacatggcc aacttcgact 2820
ggagggacat atttaacatc actgatcgca ccctccgcct tgtcaatcaa tacctggagt 2880
gcttggtcct ggataagttt gaaagctaca atgatgaaac tcagctcacc caacgtgccc 2940
tctctctact ggaggaaaac atgttctggg ccggagtggt attccctgac atgtatccct 3000
ggaccagctc tctaccaccc cacgtgaagt ataagatccg aatggacata gacgtggtgg 3060
agaaaaccaa taagattaaa gacaggtatt gggactacaa agaccatgac ggtgattata 3120
aagatcatga catcgactac aaggatgacg atgacaagga ttctggtccc agagctgatc 3180
ccgtggaaga tttccggtac atctggggcg ggtttgccta tctgcaggac atggttgaac 3240
aggggatcac aaggagccag gtgcaggcgg aggctccagt tggaatctac ctccagcaga 3300
tgccctaccc ctgcttcgtg gacgattctt tcatgatcat cctgaaccgc tgtttcccta 3360
tcttcatggt gctggcatgg atctactctg tctccatgac tgtgaagagc atcgtcttgg 3420
agaaggagtt gcgactgaag gagaccttga aaaatcaggg tgtctccaat gcagtgattt 3480
ggtgtacctg gttcctggac agcttctcca tcatgtcgat gagcatcttc ctcctgacga 3540
tattcatcat gcatggaaga atcctacatt acagcgaccc attcatcctc ttcctgttct 3600
tgttggcttt ctccactgcc accatcatgc tgtgctttct gctcagcacc ttcttctcca 3660
aggccagtct ggcagcagcc tgtagtggtg tcatctattt caccctctac ctgccacaca 3720
tcctgtgctt cgcctggcag gaccgcatga ccgctgagct gaagaaggct gtgagcttac 3780
tgtctccggt ggcatttgga tttggcactg agtacctggt tcgctttgaa gagcaaggcc 3840
tggggctgca gtggagcaac atcgggaaca gtcccacgga aggggacgaa ttcagcttcc 3900
tgctgtccat gcagatgatg ctccttgatg ctgctgtcta tggcttactc gcttggtacc 3960
ttgatcaggt gtttccagga gactatggaa ccccacttcc ttggtacttt cttctacaag 4020
agtcgtattg gcttggcggt gaagggtgtt caaccagaga agaaagagcc ctggaaaaga 4080
ccgagcccct aacagaggaa acggaggatc cagagcaccc agaaggaata cacgactcct 4140
tctttgaacg tgagcatcca gggtgggttc ctggggtatg cgtgaagaat ctggtaaaga 4200
tttttgagcc ctgtggccgg ccagctgtgg accgtctgaa catcaccttc tacgagaacc 4260
agatcaccgc attcctgggc cacaatggag ctgggaaaac caccaccttg taagtatcaa 4320
ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 4380
cttgcgtttc tgggattttt ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 4440
aaaaatttaa cgcgaatttt aacaaaatat taacgtttat aatttcaggt ggcatctttc 4500
caattgagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4560
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4620
gcgagcgagc gcgcag 4636
<210> 68
<211> 4731
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 68
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtcc 300
atcctgacgg gtctgttgcc accaacctct gggactgtgc tcgttggggg aagggacatt 360
gaaaccagcc tggatgcagt ccggcagagc cttggcatgt gtccacagca caacatcctg 420
ttccaccacc tcacggtggc tgagcacatg ctgttctatg cccagctgaa aggaaagtcc 480
caggaggagg cccagctgga gatggaagcc atgttggagg acacaggcct ccaccacaag 540
cggaatgaag aggctcagga cctatcaggt ggcatgcaga gaaagctgtc ggttgccatt 600
gcctttgtgg gagatgccaa ggtggtgatt ctggacgaac ccacctctgg ggtggaccct 660
tactcgagac gctcaatctg ggatctgctc ctgaagtatc gctcaggcag aaccatcatc 720
atgtccactc accacatgga cgaggccgac ctccttgggg accgcattgc catcattgcc 780
cagggaaggc tctactgctc aggcacccca ctcttcctga agaactgctt tggcacaggc 840
ttgtacttaa ccttggtgcg caagatgaaa aacatccaga gccaaaggaa aggcagtgag 900
gggacctgca gctgctcgtc taagggtttc tccaccacgt gtccagccca cgtcgatgac 960
ctaactccag aacaagtcct ggatggggat gtaaatgagc tgatggatgt agttctccac 1020
catgttccag aggcaaagct ggtggagtgc attggtcaag aacttatctt ccttcttcca 1080
aataagaact tcaagcacag agcatatgcc agccttttca gagagctgga ggagacgctg 1140
gctgaccttg gtctcagcag ttttggaatt tctgacactc ccctggaaga gatttttctg 1200
aaggtcacgg aggattctga ttcaggacct ctgtttgcgg gtggcgctca gcagaaaaga 1260
gaaaacgtca acccccgaca cccctgcttg ggtcccagag agaaggctgg acagacaccc 1320
caggactcca atgtctgctc cccaggggcg ccggctgctc acccagaggg ccagcctccc 1380
ccagagccag agtgcccagg cccgcagctc aacacgggga cacagctggt cctccagcat 1440
gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc gcagccacaa ggacttcctg 1500
gcgcagatcg tgctcccggc tacctttgtg tttttggctc tgatgctttc tattgttatc 1560
cctccttttg gcgaataccc cgctttgacc cttcacccct ggatatatgg gcagcagtac 1620
accttcttca gcatggatga accaggcagt gagcagttca cggtacttgc agacgtcctc 1680
ctgaataagc caggctttgg caaccgctgc ctgaaggaag ggtggcttcc ggagtacccc 1740
tgtggcaact caacaccctg gaagactcct tctgtgtccc caaacatcac ccagctgttc 1800
cagaagcaga aatggacaca ggtcaaccct tcaccatcct gcaggtgcag caccagggag 1860
aagctcacca tgctgccaga gtgccccgag ggtgccgggg gcctcccgcc cccccagaga 1920
acacagcgca gcacggaaat tctacaagac ctgacggaca ggaacatctc cgacttcttg 1980
gtaaaaacgt atcctgctct tataagaagc agcttaaaga gcaaattctg ggtcaatgaa 2040
cagaggtatg gaggaatttc cattggagga aagctcccag tcgtccccat cacgggggaa 2100
gcacttgttg ggtttttaag cgaccttggc cggatcatga atgtgagcgg gggccctatc 2160
actagagagg cctctaaaga aatacctgat ttccttaaac atctagaaac tgaagacaac 2220
attaaggtgt ggtttaataa caaaggctgg catgccctgg tcagctttct caatgtggcc 2280
cacaacgcca tcttacgggc cagcctgcct aaggacagaa gccccgagga gtatggaatc 2340
accgtcatta gccaacccct gaacctgacc aaggagcagc tctcagagat tacagtgctg 2400
accacttcag tggatgctgt ggttgccatc tgcgtgattt tctccatgtc cttcgtccca 2460
gccagctttg tcctttattt gatccaggag cgggtgaaca aatccaagca cctccagttt 2520
atcagtggag tgagccccac cacctactgg gtaaccaact tcctctggga catcatgaat 2580
tattccgtga gtgctgggct ggtggtgggc atcttcatcg ggtttcagaa gaaagcctac 2640
acttctccag aaaaccttcc tgcccttgtg gcactgctcc tgctgtatgg atgggcggtc 2700
attcccatga tgtacccagc atccttcctg tttgatgtcc ccagcacagc ctatgtggct 2760
ttatcttgtg ctaatctgtt catcggcatc aacagcagtg ctattacctt catcttggaa 2820
ttatttgaga ataaccggac gctgctcagg ttcaacgccg tgctgaggaa gctgctcatt 2880
gtcttccccc acttctgcct gggccggggc ctcattgacc ttgcactgag ccaggctgtg 2940
acagatgtct atgcccggtt tggtgaggag cactctgcaa atccgttcca ctgggacctg 3000
attgggaaga acctgtttgc catggtggtg gaaggggtgg tgtacttcct cctgaccctg 3060
ctggtccagc gccacttctt cctctcccaa tggattgccg agcccactaa ggagcccatt 3120
gttgatgaag atgatgatgt ggctgaagaa agacaaagaa ttattactgg tggaaataaa 3180
actgacatct taaggctaca tgaactaacc aagatttatc caggcacctc cagcccagca 3240
gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct ttggcctcct gggagtgaat 3300
ggtgccggca aaacaaccac attcaagatg ctcactgggg acaccacagt gacctcaggg 3360
gatgccaccg tagcaggcaa gagtatttta accaatattt ctgaagtcca tcaaaatatg 3420
ggctactgtc ctcagtttga tgcaatcgat gagctgctca caggacgaga acatctttac 3480
ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg aaaaggttgc aaactggagt 3540
attaagagcc tgggcctgac tgtctacgcc gactgcctgg ctggcacgta cagtgggggc 3600
aacaagcgga aactctccac agccatcgca ctcattggct gcccaccgct ggtgctgctg 3660
gatgagccca ccacagggat ggacccccag gcacgccgca tgctgtggaa cgtcatcgtg 3720
agcatcatca gagaagggag ggctgtggtc ctcacatccc acagcatgga agaatgtgag 3780
gcactgtgta cccggctggc catcatggta aagggcgcct ttcgatgtat gggcaccatt 3840
cagcatctca agtccaaatt tggagatggc tatatcgtca caatgaagat caaatccccg 3900
aaggacgacc tgcttcctga cctgaaccct gtggagcagt tcttccaggg gaacttccca 3960
ggcagtgtgc agagggagag gcactacaac atgctccagt tccaggtctc ctcctcctcc 4020
ctggcgagga tcttccagct cctcctctcc cacaaggaca gcctgctcat cgaggagtac 4080
tcagtcacac agaccacact ggaccaggtg tttgtaaatt ttgctaaaca gcagactgaa 4140
agtcatgacc tccctctgca ccctcgagct gctggagcca gtcgacaagc ccaggacgac 4200
tacaaagacc atgacggtga ttataaagat catgacatcg actacaagga tgacgatgac 4260
aagtgagcgg ccgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac 4320
aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 4380
tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 4440
tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg 4500
taaaatcgat aaggatcttc ctagagcatg gctacatctg cagaattcag gctagctcac 4560
tgcttacaaa acccccttgc ttgagagtgt ggcactctcc cccctgtcgc gttcgctcgc 4620
tcgctggctc gtttgggggg gcgacggcca gagggccgtc gtctggcagc tctttgagct 4680
gccacccccc caaacgagcc agcgagcgag cgaacgcgac aggggggaga g 4731
<210> 69
<211> 4420
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 69
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgtaagc agtgagctag 180
cgtgccacct ggtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 240
attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 300
tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 360
aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 420
cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 480
taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 540
gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt 600
cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt 660
attttgtgca gcgatggggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 720
ggagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggctctata 780
aaaagcgaag cgcgcggcgg gcggctgcag aagttggtcg tgaggcactg ggcaggtaag 840
tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcttgt cgagacagag 900
aagactcttg cgtttctgat aggcacctat tggtcttact gacatccact ttgcctttct 960
ctccacaggt gtccaggcgg ccgccatggt gattcttcag cagggggacc atgtgtggat 1020
ggacctgaga ttggggcagg agttcgacgt gcccatcggg gcggtggtga agctctgcga 1080
ctctgggcag gtccaggtgg tggatgatga agacaatgaa cactggatct ctccgcagaa 1140
cgcaacgcac atcaagccta tgcaccccac gtcggtccac ggcgtggagg acatgatccg 1200
cctgggggac ctcaacgagg cgggcatctt gcgcaacctg cttatccgct accgggacca 1260
cctcatctac acgtatacgg gctccatcct ggtggctgtg aacccctacc agctgctctc 1320
catctactcg ccagagcaca tccgccagta taccaacaag aagattgggg agatgccccc 1380
ccacatcttt gccattgctg acaactgcta cttcaacatg aaacgcaaca gccgagacca 1440
gtgctgcatc atcagtgggg aatctggggc cgggaagacg gagagcacaa agctgatcct 1500
gcagttcctg gcagccatca gtgggcagca ctcgtggatt gagcagcagg tcttggaggc 1560
cacccccatt ctggaagcat ttgggaatgc caagaccatc cgcaatgaca actcaagccg 1620
tttcggaaag tacatcgaca tccacttcaa caagcggggc gccatcgagg gcgcgaagat 1680
tgagcagtac ctgctggaaa agtcacgtgt ctgtcgccag gccctggatg aaaggaacta 1740
ccacgtgttc tactgcatgc tggagggcat gagtgaggat cagaagaaga agctgggctt 1800
gggccaggcc tctgactaca actacttggc catgggtaac tgcataacct gtgagggccg 1860
ggtggacagc caggagtacg ccaacatccg ctccgccatg aaggtgctca tgttcactga 1920
caccgagaac tgggagatct cgaagctcct ggctgccatc ctgcacctgg gcaacctgca 1980
gtatgaggca cgcacatttg aaaacctgga tgcctgtgag gttctcttct ccccatcgct 2040
ggccacagct gcatccctgc ttgaggtgaa ccccccagac ctgatgagct gcctgactag 2100
ccgcaccctc atcacccgcg gggagacggt gtccacccca ctgagcaggg aacaggcact 2160
ggacgtgcgc gacgccttcg taaaggggat ctacgggcgg ctgttcgtgt ggattgtgga 2220
caagatcaac gcagcaattt acaagcctcc ctcccaggat gtgaagaact ctcgcaggtc 2280
catcggcctc ctggacatct ttgggtttga gaactttgct gtgaacagct ttgagcagct 2340
ctgcatcaac ttcgccaatg agcacctgca gcagttcttt gtgcggcacg tgttcaagct 2400
ggagcaggag gaatatgacc tggagagcat tgactggctg cacatcgagt tcactgacaa 2460
ccaggatgcc ctggacatga ttgccaacaa gcccatgaac atcatctccc tcatcgatga 2520
ggagagcaag ttccccaagg gcacagacac caccatgtta cacaagctga actcccagca 2580
caagctcaac gccaactaca tcccccccaa gaacaaccat gagacccagt ttggcatcaa 2640
ccattttgca ggcatcgtct actatgagac ccaaggcttc ctggagaaga accgagacac 2700
cctgcatggg gacattatcc agctggtcca ctcctccagg aacaagttca tcaagcagat 2760
cttccaggcc gatgtcgcca tgggcgccga gaccaggaag cgctcgccca cacttagcag 2820
ccagttcaag cggtcactgg agctgctgat gcgcacgctg ggtgcctgcc agcccttctt 2880
tgtgcgatgc atcaagccca atgagttcaa gaagcccatg ctgttcgacc ggcacctgtg 2940
cgtgcgccag ctgcggtact caggaatgat ggagaccatc cgaatccgcc gagctggcta 3000
ccccatccgc tacagcttcg tagagtttgt ggagcggtac cgtgtgctgc tgccaggtgt 3060
gaagccggcc tacaagcagg gcgacctccg cgggacttgc cagcgcatgg ctgaggctgt 3120
gctgggcacc cacgatgact ggcagatagg caaaaccaag atctttctga aggaccacca 3180
tgacatgctg ctggaagtgg agcgggacaa agccatcacc gacagagtca tcctccttca 3240
gaaagtcatc cggggattca aagacaggtc taactttctg aagctgaaga acgctgccac 3300
actgatccag aggcactggc ggggtcacaa ctgtaggaag aactacgggc tgatgcgtct 3360
gggcttcctg cggctgcagg ccctgcaccg ctcccggaag ctgcaccagc agtaccgcct 3420
ggcccgccag cgcatcatcc agttccaggc ccgctgccgc gcctatctgg tgcgcaaggc 3480
cttccgccac cgcctctggg ctgtgctcac cgtgcaggcc tatgcccggg gcatgatcgc 3540
ccgcaggctg caccaacgcc tcagggctga gtatctgtgg cgcctcgagg ctgagaaaat 3600
gcggctggcg gaggaagaga agcttcggaa ggagatgagc gccaagaagg ccaaggagga 3660
ggccgagcgc aagcatcagg agcgcctggc ccagctggct cgtgaggacg ctgagcggga 3720
gctgaaggag aaggaggccg ctcggcggaa gaaggagctc ctggagcaga tggaaagggc 3780
ccgccatgag cctgtcaatc actcagacat ggtggacaag atgtttggct tcctggggac 3840
ttcaggtggc ctgccaggcc aggagggcca ggcacctagt ggctttgagg acctggagcg 3900
agggcggagg gagatggtgg aggaggacct ggatgcagcc ctgcccctgc ctgacgagga 3960
tgaggaggac ctctctgagt ataaatttgc caagttcgcg gccacctact tccaggggac 4020
aactacgcac tcctacaccc ggcggccact caaacagcca ctgctctacc atgacgacga 4080
gggtgaccag ctggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4140
gggcttgtcg agacagagaa gactcttgcg tttctgggat ttttccgatt tcggcctatt 4200
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4260
ttataatttc aggtggcatc tttccaattg aggaacccct agtgatggag ttggccactc 4320
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4380
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4420
<210> 70
<211> 4367
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 70
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggcag 300
ccctggcggt ctggatcacc atcctccgct tcatggggga cctccctgag cccaagtacc 360
acacagccat gagtgatggc agtgagaaga tccctgtgat gaccaagatt tatgagaccc 420
tgggcaagaa gacgtacaag agggagctgc aggccctgca gggcgagggc gaggcccagc 480
tccccgaggg ccagaagaag agcagtgtga ggcacaagct ggtgcatttg actctgaaaa 540
agaagtccaa gctcacagag gaggtgacca agaggctgca tgacggggag tccacagtgc 600
agggcaacag catgctggag gaccggccca cctccaacct ggagaagctg cacttcatca 660
tcggcaatgg catcctgcgg ccagcactcc gggacgagat ctactgccag atcagcaagc 720
agctgaccca caacccctcc aagagcagct atgcccgggg ctggattctc gtgtctctct 780
gcgtgggctg tttcgccccc tccgagaagt ttgtcaagta cctgcggaac ttcatccacg 840
ggggcccgcc cggctacgcc ccgtactgtg aggagcgcct gagaaggacc tttgtcaatg 900
ggacacggac acagccgccc agctggctgg agctgcaggc caccaagtcc aagaagccaa 960
tcatgttgcc cgtgacattc atggatggga ccaccaagac cctgctgacg gactcggcaa 1020
ccacggccaa ggagctctgc aacgcgctgg ccgacaagat ctctctcaag gaccggttcg 1080
ggttctccct ctacattgcc ctgtttgaca aggtgtcctc cctgggcagc ggcagtgacc 1140
acgtcatgga cgccatctcc cagtgcgagc agtacgccaa ggagcagggc gcccaggagc 1200
gcaacgcccc ctggaggctc ttcttccgca aagaggtctt cacgccctgg cacagcccct 1260
ccgaggacaa cgtggccacc aacctcatct accagcaggt ggtgcgagga gtcaagtttg 1320
gggagtacag gtgtgagaag gaggacgacc tggctgagct ggcctcccag cagtactttg 1380
tagactatgg ctctgagatg atcctggagc gcctcctgaa cctcgtgccc acctacatcc 1440
ccgaccgcga gatcacgccc ctgaagacgc tggagaagtg ggcccagctg gccatcgccg 1500
cccacaagaa ggggatttat gcccagagga gaactgatgc ccagaaggtc aaagaggatg 1560
tggtcagtta tgcccgcttc aagtggccct tgctcttctc caggttttat gaagcctaca 1620
aattctcagg ccccagtctc cccaagaacg acgtcatcgt ggccgtcaac tggacgggtg 1680
tgtactttgt ggatgagcag gagcaggtac ttctggagct gtccttccca gagatcatgg 1740
ccgtgtccag cagcagggag tgccgtgtct ggctctcact gggctgctct gatcttggct 1800
gtgctgcgcc tcactcaggc tgggcaggac tgaccccggc ggggccctgt tctccgtgtt 1860
ggtcctgcag gggagcgaaa acgacggccc ccagcttcac gctggccacc atcaaggggg 1920
acgaatacac cttcacctcc agtaatgctg aggacattcg tgacctggtg gtcaccttcc 1980
tagaggggct ccggaagaga tctaagtatg ttgtggccct gcaggataac cccaaccccg 2040
caggcgagga gtcaggcttc ctcagctttg ccaagggaga cctcatcatc ctggaccatg 2100
acacgggcga gcaggtcatg aactcgggct gggccaacgg catcaatgag aggaccaagc 2160
agcgtgggga cttccccacc gactgtgtgt acgtcatgcc cactgtcacc atgccacctc 2220
gtgagattgt ggccctggtc accatgactc ccgatcagag gcaggacgtt gtccggctct 2280
tgcagctgcg aacggcggag cccgaggtgc gtgccaagcc ctacacgctg gaggagtttt 2340
cctatgacta cttcaggccc ccacccaagc acacgctgag ccgtgtcatg gtgtccaagg 2400
cccgaggcaa ggaccggctg tggagccaca cgcgggaacc gctcaagcag gcgctgctca 2460
agaagctcct gggcagtgag gagctctcgc aggaggcctg cctggccttc attgctgtgc 2520
tcaagtacat gggcgactac ccgtccaaga ggacacgctc cgtcaatgag ctcaccgacc 2580
agatctttga gggtcccctg aaagccgagc ccctgaagga cgaggcatat gtgcagatcc 2640
tgaagcagct gaccgacaac cacatcaggt acagcgagga gcggggttgg gagctgctct 2700
ggctgtgcac gggccttttc ccacccagca acatcctcct gccccacgtg cagcgcttcc 2760
tgcagtcccg aaagcactgc ccactcgcca tcgactgcct gcaacggctc cagaaagccc 2820
tgagaaacgg gtcccggaag taccctccgc acctggtgga ggtggaggcc atccagcaca 2880
agaccaccca gattttccac aaggtctact tccctgatga cactgacgag gccttcgaag 2940
tggagtccag caccaaggcc aaggacttct gccagaacat cgccaccagg ctgctcctca 3000
agtcctcaga gggattcagc ctctttgtca aaattgcaga caaggtcatc agcgttcctg 3060
agaatgactt cttctttgac tttgttcgac acttgacaga ctggataaag aaagctcggc 3120
ccatcaagga cggaattgtg ccctcactca cctaccaggt gttcttcatg aagaagctgt 3180
ggaccaccac ggtgccaggg aaggatccca tggccgattc catcttccac tattaccagg 3240
agttgcccaa gtatctccga ggctaccaca agtgcacgcg ggaggaggtg ctgcagctgg 3300
gggcgctgat ctacagggtc aagttcgagg aggacaagtc ctacttcccc agcatcccca 3360
agctgctgcg ggagctggtg ccccaggacc ttatccggca ggtctcacct gatgactgga 3420
agcggtccat cgtcgcctac ttcaacaagc acgcagggaa gtccaaggag gaggccaagc 3480
tggccttcct gaagctcatc ttcaagtggc ccacctttgg ctcagccttc ttcgaggtga 3540
agcaaactac ggagccaaac ttccctgaga tcctcctaat tgccatcaac aagtatgggg 3600
tcagcctcat cgatcccaaa acgaaggata tcctcaccac tcatcccttc accaagatct 3660
ccaactggag cagcggcaac acctacttcc acatcaccat tgggaacttg gtgcgcggga 3720
gcaaactgct ctgcgagacg tcactgggct acaagatgga tgacctcctg acttcctaca 3780
ttagccagat gctcacagcc atgagcaaac agcggggctc caggagcggc aagatgtatg 3840
atgttcctga ttatgctagc ctctgaccgc ggcctgctgc cggctctgcg gcctcttccg 3900
cgtcttcgag atctgcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 3960
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 4020
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 4080
aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggac tcgagcaatt 4140
cccgataagg atcttcctag agcatggcta catctgcaga attcaggcta gctcactgct 4200
tacaaaaccc ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 4260
tggctcgttt gggggggcga cggccagagg gccgtcgtct ggcagctctt tgagctgcca 4320
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 4367
<210> 71
<211> 4738
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 71
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggactacaa agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg 3120
atgacaagga ttctggtccc agagctgatc ccgtggaaga tttccggtac atctggggcg 3180
ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag gtgcaggcgg 3240
aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg gacgattctt 3300
tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg atctactctg 3360
tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag gagaccttga 3420
aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac agcttctcca 3480
tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga atcctacatt 3540
acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc accatcatgc 3600
tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc tgtagtggtg 3660
tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag gaccgcatga 3720
ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga tttggcactg 3780
agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac atcgggaaca 3840
gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg ctccttgatg 3900
ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga gactatggaa 3960
ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt gaagggtgtt 4020
caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa acggaggatc 4080
cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca gggtgggttc 4140
ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg ccagctgtgg 4200
accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc cacaatggag 4260
ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag gagaccaata 4320
gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg 4380
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440
taacgtttat aatttcaggt ggcatctttc caattcgccc ttagatctag cctatcctgg 4500
attacttgaa cgatagccta tcctggatta cttgaaaagc ttagcctatc ctggattact 4560
tgaatcacag cctatcctgg attacttgaa agatctaagg gcgaattgag gaacccctag 4620
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 4680
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4738
<210> 72
<211> 4770
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 72
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggactacaa agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg 3120
atgacaagga ttctggtccc agagctgatc ccgtggaaga tttccggtac atctggggcg 3180
ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag gtgcaggcgg 3240
aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg gacgattctt 3300
tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg atctactctg 3360
tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag gagaccttga 3420
aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac agcttctcca 3480
tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga atcctacatt 3540
acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc accatcatgc 3600
tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc tgtagtggtg 3660
tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag gaccgcatga 3720
ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga tttggcactg 3780
agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac atcgggaaca 3840
gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg ctccttgatg 3900
ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga gactatggaa 3960
ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt gaagggtgtt 4020
caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa acggaggatc 4080
cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca gggtgggttc 4140
ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg ccagctgtgg 4200
accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc cacaatggag 4260
ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag gagaccaata 4320
gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg 4380
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440
taacgtttat aatttcaggt ggcatctttc caattgaggc ataggatgac aaagggaacg 4500
ataggcatag gatgacaaag ggaaaagctt aggcatagga tgacaaaggg aaggtaccag 4560
atctggcatt caccgcgtgc cttacgatgg cattcaccgc gtgccttaaa gcttggcatt 4620
caccgcgtgc cttacaattg aggaacccct agtgatggag ttggccactc cctctctgcg 4680
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4740
ggcggcctca gtgagcgagc gagcgcgcag 4770
<210> 73
<211> 4656
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 73
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggactacaa agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg 3120
atgacaagga ttctggtccc agagctgatc ccgtggaaga tttccggtac atctggggcg 3180
ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag gtgcaggcgg 3240
aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg gacgattctt 3300
tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg atctactctg 3360
tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag gagaccttga 3420
aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac agcttctcca 3480
tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga atcctacatt 3540
acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc accatcatgc 3600
tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc tgtagtggtg 3660
tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag gaccgcatga 3720
ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga tttggcactg 3780
agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac atcgggaaca 3840
gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg ctccttgatg 3900
ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga gactatggaa 3960
ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt gaagggtgtt 4020
caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa acggaggatc 4080
cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca gggtgggttc 4140
ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg ccagctgtgg 4200
accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc cacaatggag 4260
ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag gagaccaata 4320
gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg 4380
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 4440
taacgtttat aatttcaggt ggcatctttc ccgcctgcaa gaactggttc agcagcctga 4500
gccacttcgt gatccacctg caattgagga acccctagtg atggagttgg ccactccctc 4560
tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 4620
tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4656
<210> 74
<211> 4719
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 74
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcaagct ttgaatgaat gagataggca cctattggtc ttactgacat ccactttgcc 300
tttctctcca caggtccatc ctgacgggtc tgttgccacc aacctctggg actgtgctcg 360
ttgggggaag ggacattgaa accagcctgg atgcagtccg gcagagcctt ggcatgtgtc 420
cacagcacaa catcctgttc caccacctca cggtggctga gcacatgctg ttctatgccc 480
agctgaaagg aaagtcccag gaggaggccc agctggagat ggaagccatg ttggaggaca 540
caggcctcca ccacaagcgg aatgaagagg ctcaggacct atcaggtggc atgcagagaa 600
agctgtcggt tgccattgcc tttgtgggag atgccaaggt ggtgattctg gacgaaccca 660
cctctggggt ggacccttac tcgagacgct caatctggga tctgctcctg aagtatcgct 720
caggcagaac catcatcatg tccactcacc acatggacga ggccgacctc cttggggacc 780
gcattgccat cattgcccag ggaaggctct actgctcagg caccccactc ttcctgaaga 840
actgctttgg cacaggcttg tacttaacct tggtgcgcaa gatgaaaaac atccagagcc 900
aaaggaaagg cagtgagggg acctgcagct gctcgtctaa gggtttctcc accacgtgtc 960
cagcccacgt cgatgaccta actccagaac aagtcctgga tggggatgta aatgagctga 1020
tggatgtagt tctccaccat gttccagagg caaagctggt ggagtgcatt ggtcaagaac 1080
ttatcttcct tcttccaaat aagaacttca agcacagagc atatgccagc cttttcagag 1140
agctggagga gacgctggct gaccttggtc tcagcagttt tggaatttct gacactcccc 1200
tggaagagat ttttctgaag gtcacggagg attctgattc aggacctctg tttgcgggtg 1260
gcgctcagca gaaaagagaa aacgtcaacc cccgacaccc ctgcttgggt cccagagaga 1320
aggctggaca gacaccccag gactccaatg tctgctcccc aggggcgccg gctgctcacc 1380
cagagggcca gcctccccca gagccagagt gcccaggccc gcagctcaac acggggacac 1440
agctggtcct ccagcatgtg caggcgctgc tggtcaagag attccaacac accatccgca 1500
gccacaagga cttcctggcg cagatcgtgc tcccggctac ctttgtgttt ttggctctga 1560
tgctttctat tgttatccct ccttttggcg aataccccgc tttgaccctt cacccctgga 1620
tatatgggca gcagtacacc ttcttcagca tggatgaacc aggcagtgag cagttcacgg 1680
tacttgcaga cgtcctcctg aataagccag gctttggcaa ccgctgcctg aaggaagggt 1740
ggcttccgga gtacccctgt ggcaactcaa caccctggaa gactccttct gtgtccccaa 1800
acatcaccca gctgttccag aagcagaaat ggacacaggt caacccttca ccatcctgca 1860
ggtgcagcac cagggagaag ctcaccatgc tgccagagtg ccccgagggt gccgggggcc 1920
tcccgccccc ccagagaaca cagcgcagca cggaaattct acaagacctg acggacagga 1980
acatctccga cttcttggta aaaacgtatc ctgctcttat aagaagcagc ttaaagagca 2040
aattctgggt caatgaacag aggtatggag gaatttccat tggaggaaag ctcccagtcg 2100
tccccatcac gggggaagca cttgttgggt ttttaagcga ccttggccgg atcatgaatg 2160
tgagcggggg ccctatcact agagaggcct ctaaagaaat acctgatttc cttaaacatc 2220
tagaaactga agacaacatt aaggtgtggt ttaataacaa aggctggcat gccctggtca 2280
gctttctcaa tgtggcccac aacgccatct tacgggccag cctgcctaag gacagaagcc 2340
ccgaggagta tggaatcacc gtcattagcc aacccctgaa cctgaccaag gagcagctct 2400
cagagattac agtgctgacc acttcagtgg atgctgtggt tgccatctgc gtgattttct 2460
ccatgtcctt cgtcccagcc agctttgtcc tttatttgat ccaggagcgg gtgaacaaat 2520
ccaagcacct ccagtttatc agtggagtga gccccaccac ctactgggta accaacttcc 2580
tctgggacat catgaattat tccgtgagtg ctgggctggt ggtgggcatc ttcatcgggt 2640
ttcagaagaa agcctacact tctccagaaa accttcctgc ccttgtggca ctgctcctgc 2700
tgtatggatg ggcggtcatt cccatgatgt acccagcatc cttcctgttt gatgtcccca 2760
gcacagccta tgtggcttta tcttgtgcta atctgttcat cggcatcaac agcagtgcta 2820
ttaccttcat cttggaatta tttgagaata accggacgct gctcaggttc aacgccgtgc 2880
tgaggaagct gctcattgtc ttcccccact tctgcctggg ccggggcctc attgaccttg 2940
cactgagcca ggctgtgaca gatgtctatg cccggtttgg tgaggagcac tctgcaaatc 3000
cgttccactg ggacctgatt gggaagaacc tgtttgccat ggtggtggaa ggggtggtgt 3060
acttcctcct gaccctgctg gtccagcgcc acttcttcct ctcccaatgg attgccgagc 3120
ccactaagga gcccattgtt gatgaagatg atgatgtggc tgaagaaaga caaagaatta 3180
ttactggtgg aaataaaact gacatcttaa ggctacatga actaaccaag atttatccag 3240
gcacctccag cccagcagtg gacaggctgt gtgtcggagt tcgccctgga gagtgctttg 3300
gcctcctggg agtgaatggt gccggcaaaa caaccacatt caagatgctc actggggaca 3360
ccacagtgac ctcaggggat gccaccgtag caggcaagag tattttaacc aatatttctg 3420
aagtccatca aaatatgggc tactgtcctc agtttgatgc aatcgatgag ctgctcacag 3480
gacgagaaca tctttacctt tatgcccggc ttcgaggtgt accagcagaa gaaatcgaaa 3540
aggttgcaaa ctggagtatt aagagcctgg gcctgactgt ctacgccgac tgcctggctg 3600
gcacgtacag tgggggcaac aagcggaaac tctccacagc catcgcactc attggctgcc 3660
caccgctggt gctgctggat gagcccacca cagggatgga cccccaggca cgccgcatgc 3720
tgtggaacgt catcgtgagc atcatcagag aagggagggc tgtggtcctc acatcccaca 3780
gcatggaaga atgtgaggca ctgtgtaccc ggctggccat catggtaaag ggcgcctttc 3840
gatgtatggg caccattcag catctcaagt ccaaatttgg agatggctat atcgtcacaa 3900
tgaagatcaa atccccgaag gacgacctgc ttcctgacct gaaccctgtg gagcagttct 3960
tccaggggaa cttcccaggc agtgtgcaga gggagaggca ctacaacatg ctccagttcc 4020
aggtctcctc ctcctccctg gcgaggatct tccagctcct cctctcccac aaggacagcc 4080
tgctcatcga ggagtactca gtcacacaga ccacactgga ccaggtgttt gtaaattttg 4140
ctaaacagca gactgaaagt catgacctcc ctctgcaccc tcgagctgct ggagccagtc 4200
gacaagccca ggacgactac aaagaccatg acggtgatta taaagatcat gacatcgact 4260
acaaggatga cgatgacaag tgagcggccg cttcgagcag acatgataag atacattgat 4320
gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 4380
gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 4440
tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa 4500
aacctctaca aatgtggtaa aatcgataag gatcttccta gagcatggct acgtagataa 4560
gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 4620
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4680
ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4719
<210> 75
<211> 4758
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 75
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcaagct tatgcacagc tggaacttca agctgtacgt catgggcagc ggcggggtac 300
cgataggcac ctattggtct tactgacatc cactttgcct ttctctccac aggtccatcc 360
tgacgggtct gttgccacca acctctggga ctgtgctcgt tgggggaagg gacattgaaa 420
ccagcctgga tgcagtccgg cagagccttg gcatgtgtcc acagcacaac atcctgttcc 480
accacctcac ggtggctgag cacatgctgt tctatgccca gctgaaagga aagtcccagg 540
aggaggccca gctggagatg gaagccatgt tggaggacac aggcctccac cacaagcgga 600
atgaagaggc tcaggaccta tcaggtggca tgcagagaaa gctgtcggtt gccattgcct 660
ttgtgggaga tgccaaggtg gtgattctgg acgaacccac ctctggggtg gacccttact 720
cgagacgctc aatctgggat ctgctcctga agtatcgctc aggcagaacc atcatcatgt 780
ccactcacca catggacgag gccgacctcc ttggggaccg cattgccatc attgcccagg 840
gaaggctcta ctgctcaggc accccactct tcctgaagaa ctgctttggc acaggcttgt 900
acttaacctt ggtgcgcaag atgaaaaaca tccagagcca aaggaaaggc agtgagggga 960
cctgcagctg ctcgtctaag ggtttctcca ccacgtgtcc agcccacgtc gatgacctaa 1020
ctccagaaca agtcctggat ggggatgtaa atgagctgat ggatgtagtt ctccaccatg 1080
ttccagaggc aaagctggtg gagtgcattg gtcaagaact tatcttcctt cttccaaata 1140
agaacttcaa gcacagagca tatgccagcc ttttcagaga gctggaggag acgctggctg 1200
accttggtct cagcagtttt ggaatttctg acactcccct ggaagagatt tttctgaagg 1260
tcacggagga ttctgattca ggacctctgt ttgcgggtgg cgctcagcag aaaagagaaa 1320
acgtcaaccc ccgacacccc tgcttgggtc ccagagagaa ggctggacag acaccccagg 1380
actccaatgt ctgctcccca ggggcgccgg ctgctcaccc agagggccag cctcccccag 1440
agccagagtg cccaggcccg cagctcaaca cggggacaca gctggtcctc cagcatgtgc 1500
aggcgctgct ggtcaagaga ttccaacaca ccatccgcag ccacaaggac ttcctggcgc 1560
agatcgtgct cccggctacc tttgtgtttt tggctctgat gctttctatt gttatccctc 1620
cttttggcga ataccccgct ttgacccttc acccctggat atatgggcag cagtacacct 1680
tcttcagcat ggatgaacca ggcagtgagc agttcacggt acttgcagac gtcctcctga 1740
ataagccagg ctttggcaac cgctgcctga aggaagggtg gcttccggag tacccctgtg 1800
gcaactcaac accctggaag actccttctg tgtccccaaa catcacccag ctgttccaga 1860
agcagaaatg gacacaggtc aacccttcac catcctgcag gtgcagcacc agggagaagc 1920
tcaccatgct gccagagtgc cccgagggtg ccgggggcct cccgcccccc cagagaacac 1980
agcgcagcac ggaaattcta caagacctga cggacaggaa catctccgac ttcttggtaa 2040
aaacgtatcc tgctcttata agaagcagct taaagagcaa attctgggtc aatgaacaga 2100
ggtatggagg aatttccatt ggaggaaagc tcccagtcgt ccccatcacg ggggaagcac 2160
ttgttgggtt tttaagcgac cttggccgga tcatgaatgt gagcgggggc cctatcacta 2220
gagaggcctc taaagaaata cctgatttcc ttaaacatct agaaactgaa gacaacatta 2280
aggtgtggtt taataacaaa ggctggcatg ccctggtcag ctttctcaat gtggcccaca 2340
acgccatctt acgggccagc ctgcctaagg acagaagccc cgaggagtat ggaatcaccg 2400
tcattagcca acccctgaac ctgaccaagg agcagctctc agagattaca gtgctgacca 2460
cttcagtgga tgctgtggtt gccatctgcg tgattttctc catgtccttc gtcccagcca 2520
gctttgtcct ttatttgatc caggagcggg tgaacaaatc caagcacctc cagtttatca 2580
gtggagtgag ccccaccacc tactgggtaa ccaacttcct ctgggacatc atgaattatt 2640
ccgtgagtgc tgggctggtg gtgggcatct tcatcgggtt tcagaagaaa gcctacactt 2700
ctccagaaaa ccttcctgcc cttgtggcac tgctcctgct gtatggatgg gcggtcattc 2760
ccatgatgta cccagcatcc ttcctgtttg atgtccccag cacagcctat gtggctttat 2820
cttgtgctaa tctgttcatc ggcatcaaca gcagtgctat taccttcatc ttggaattat 2880
ttgagaataa ccggacgctg ctcaggttca acgccgtgct gaggaagctg ctcattgtct 2940
tcccccactt ctgcctgggc cggggcctca ttgaccttgc actgagccag gctgtgacag 3000
atgtctatgc ccggtttggt gaggagcact ctgcaaatcc gttccactgg gacctgattg 3060
ggaagaacct gtttgccatg gtggtggaag gggtggtgta cttcctcctg accctgctgg 3120
tccagcgcca cttcttcctc tcccaatgga ttgccgagcc cactaaggag cccattgttg 3180
atgaagatga tgatgtggct gaagaaagac aaagaattat tactggtgga aataaaactg 3240
acatcttaag gctacatgaa ctaaccaaga tttatccagg cacctccagc ccagcagtgg 3300
acaggctgtg tgtcggagtt cgccctggag agtgctttgg cctcctggga gtgaatggtg 3360
ccggcaaaac aaccacattc aagatgctca ctggggacac cacagtgacc tcaggggatg 3420
ccaccgtagc aggcaagagt attttaacca atatttctga agtccatcaa aatatgggct 3480
actgtcctca gtttgatgca atcgatgagc tgctcacagg acgagaacat ctttaccttt 3540
atgcccggct tcgaggtgta ccagcagaag aaatcgaaaa ggttgcaaac tggagtatta 3600
agagcctggg cctgactgtc tacgccgact gcctggctgg cacgtacagt gggggcaaca 3660
agcggaaact ctccacagcc atcgcactca ttggctgccc accgctggtg ctgctggatg 3720
agcccaccac agggatggac ccccaggcac gccgcatgct gtggaacgtc atcgtgagca 3780
tcatcagaga agggagggct gtggtcctca catcccacag catggaagaa tgtgaggcac 3840
tgtgtacccg gctggccatc atggtaaagg gcgcctttcg atgtatgggc accattcagc 3900
atctcaagtc caaatttgga gatggctata tcgtcacaat gaagatcaaa tccccgaagg 3960
acgacctgct tcctgacctg aaccctgtgg agcagttctt ccaggggaac ttcccaggca 4020
gtgtgcagag ggagaggcac tacaacatgc tccagttcca ggtctcctcc tcctccctgg 4080
cgaggatctt ccagctcctc ctctcccaca aggacagcct gctcatcgag gagtactcag 4140
tcacacagac cacactggac caggtgtttg taaattttgc taaacagcag actgaaagtc 4200
atgacctccc tctgcaccct cgagctgctg gagccagtcg acaagcccag gacgactaca 4260
aagaccatga cggtgattat aaagatcatg acatcgacta caaggatgac gatgacaagt 4320
gagcggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 4380
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 4440
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 4500
gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 4560
atcgataagg atcttcctag agcatggcta cgtagataag tagcatggcg ggttaatcat 4620
taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 4680
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 4740
gagcgagcga gcgcgcag 4758
<210> 76
<211> 4844
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 76
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcaagct tatgcacagc tggaacttca agctgtacgt catgggcagc ggcggggtac 300
catgcacagc tggaacttca agctgtacgt catgggcagc ggcggatgca cagctggaac 360
ttcaagctgt acgtcatggg cagcggcgat aggcacctat tggtcttact gacatccact 420
ttgcctttct ctccacaggt ccatcctgac gggtctgttg ccaccaacct ctgggactgt 480
gctcgttggg ggaagggaca ttgaaaccag cctggatgca gtccggcaga gccttggcat 540
gtgtccacag cacaacatcc tgttccacca cctcacggtg gctgagcaca tgctgttcta 600
tgcccagctg aaaggaaagt cccaggagga ggcccagctg gagatggaag ccatgttgga 660
ggacacaggc ctccaccaca agcggaatga agaggctcag gacctatcag gtggcatgca 720
gagaaagctg tcggttgcca ttgcctttgt gggagatgcc aaggtggtga ttctggacga 780
acccacctct ggggtggacc cttactcgag acgctcaatc tgggatctgc tcctgaagta 840
tcgctcaggc agaaccatca tcatgtccac tcaccacatg gacgaggccg acctccttgg 900
ggaccgcatt gccatcattg cccagggaag gctctactgc tcaggcaccc cactcttcct 960
gaagaactgc tttggcacag gcttgtactt aaccttggtg cgcaagatga aaaacatcca 1020
gagccaaagg aaaggcagtg aggggacctg cagctgctcg tctaagggtt tctccaccac 1080
gtgtccagcc cacgtcgatg acctaactcc agaacaagtc ctggatgggg atgtaaatga 1140
gctgatggat gtagttctcc accatgttcc agaggcaaag ctggtggagt gcattggtca 1200
agaacttatc ttccttcttc caaataagaa cttcaagcac agagcatatg ccagcctttt 1260
cagagagctg gaggagacgc tggctgacct tggtctcagc agttttggaa tttctgacac 1320
tcccctggaa gagatttttc tgaaggtcac ggaggattct gattcaggac ctctgtttgc 1380
gggtggcgct cagcagaaaa gagaaaacgt caacccccga cacccctgct tgggtcccag 1440
agagaaggct ggacagacac cccaggactc caatgtctgc tccccagggg cgccggctgc 1500
tcacccagag ggccagcctc ccccagagcc agagtgccca ggcccgcagc tcaacacggg 1560
gacacagctg gtcctccagc atgtgcaggc gctgctggtc aagagattcc aacacaccat 1620
ccgcagccac aaggacttcc tggcgcagat cgtgctcccg gctacctttg tgtttttggc 1680
tctgatgctt tctattgtta tccctccttt tggcgaatac cccgctttga cccttcaccc 1740
ctggatatat gggcagcagt acaccttctt cagcatggat gaaccaggca gtgagcagtt 1800
cacggtactt gcagacgtcc tcctgaataa gccaggcttt ggcaaccgct gcctgaagga 1860
agggtggctt ccggagtacc cctgtggcaa ctcaacaccc tggaagactc cttctgtgtc 1920
cccaaacatc acccagctgt tccagaagca gaaatggaca caggtcaacc cttcaccatc 1980
ctgcaggtgc agcaccaggg agaagctcac catgctgcca gagtgccccg agggtgccgg 2040
gggcctcccg cccccccaga gaacacagcg cagcacggaa attctacaag acctgacgga 2100
caggaacatc tccgacttct tggtaaaaac gtatcctgct cttataagaa gcagcttaaa 2160
gagcaaattc tgggtcaatg aacagaggta tggaggaatt tccattggag gaaagctccc 2220
agtcgtcccc atcacggggg aagcacttgt tgggttttta agcgaccttg gccggatcat 2280
gaatgtgagc gggggcccta tcactagaga ggcctctaaa gaaatacctg atttccttaa 2340
acatctagaa actgaagaca acattaaggt gtggtttaat aacaaaggct ggcatgccct 2400
ggtcagcttt ctcaatgtgg cccacaacgc catcttacgg gccagcctgc ctaaggacag 2460
aagccccgag gagtatggaa tcaccgtcat tagccaaccc ctgaacctga ccaaggagca 2520
gctctcagag attacagtgc tgaccacttc agtggatgct gtggttgcca tctgcgtgat 2580
tttctccatg tccttcgtcc cagccagctt tgtcctttat ttgatccagg agcgggtgaa 2640
caaatccaag cacctccagt ttatcagtgg agtgagcccc accacctact gggtaaccaa 2700
cttcctctgg gacatcatga attattccgt gagtgctggg ctggtggtgg gcatcttcat 2760
cgggtttcag aagaaagcct acacttctcc agaaaacctt cctgcccttg tggcactgct 2820
cctgctgtat ggatgggcgg tcattcccat gatgtaccca gcatccttcc tgtttgatgt 2880
ccccagcaca gcctatgtgg ctttatcttg tgctaatctg ttcatcggca tcaacagcag 2940
tgctattacc ttcatcttgg aattatttga gaataaccgg acgctgctca ggttcaacgc 3000
cgtgctgagg aagctgctca ttgtcttccc ccacttctgc ctgggccggg gcctcattga 3060
ccttgcactg agccaggctg tgacagatgt ctatgcccgg tttggtgagg agcactctgc 3120
aaatccgttc cactgggacc tgattgggaa gaacctgttt gccatggtgg tggaaggggt 3180
ggtgtacttc ctcctgaccc tgctggtcca gcgccacttc ttcctctccc aatggattgc 3240
cgagcccact aaggagccca ttgttgatga agatgatgat gtggctgaag aaagacaaag 3300
aattattact ggtggaaata aaactgacat cttaaggcta catgaactaa ccaagattta 3360
tccaggcacc tccagcccag cagtggacag gctgtgtgtc ggagttcgcc ctggagagtg 3420
ctttggcctc ctgggagtga atggtgccgg caaaacaacc acattcaaga tgctcactgg 3480
ggacaccaca gtgacctcag gggatgccac cgtagcaggc aagagtattt taaccaatat 3540
ttctgaagtc catcaaaata tgggctactg tcctcagttt gatgcaatcg atgagctgct 3600
cacaggacga gaacatcttt acctttatgc ccggcttcga ggtgtaccag cagaagaaat 3660
cgaaaaggtt gcaaactgga gtattaagag cctgggcctg actgtctacg ccgactgcct 3720
ggctggcacg tacagtgggg gcaacaagcg gaaactctcc acagccatcg cactcattgg 3780
ctgcccaccg ctggtgctgc tggatgagcc caccacaggg atggaccccc aggcacgccg 3840
catgctgtgg aacgtcatcg tgagcatcat cagagaaggg agggctgtgg tcctcacatc 3900
ccacagcatg gaagaatgtg aggcactgtg tacccggctg gccatcatgg taaagggcgc 3960
ctttcgatgt atgggcacca ttcagcatct caagtccaaa tttggagatg gctatatcgt 4020
cacaatgaag atcaaatccc cgaaggacga cctgcttcct gacctgaacc ctgtggagca 4080
gttcttccag gggaacttcc caggcagtgt gcagagggag aggcactaca acatgctcca 4140
gttccaggtc tcctcctcct ccctggcgag gatcttccag ctcctcctct cccacaagga 4200
cagcctgctc atcgaggagt actcagtcac acagaccaca ctggaccagg tgtttgtaaa 4260
ttttgctaaa cagcagactg aaagtcatga cctccctctg caccctcgag ctgctggagc 4320
cagtcgacaa gcccaggacg actacaaaga ccatgacggt gattataaag atcatgacat 4380
cgactacaag gatgacgatg acaagtgagc ggccgcttcg agcagacatg ataagataca 4440
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 4500
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 4560
acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 4620
agtaaaacct ctacaaatgt ggtaaaatcg ataaggatct tcctagagca tggctacgta 4680
gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 4740
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4800
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 4844
<210> 77
<211> 4944
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 77
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ggatccggga tttttccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttataattt caggtggcat 240
ctttcaagct tatgcagatc ttcgtgaaga ctctgactgg taagaccatc accctcgagg 300
tggagcccag tgacaccatc gagaatgtca aggcaaagat ccaagataag gaaggcattc 360
ctcctgatca gcagaggttg atctttgccg gaaaacagct ggaagatggt cgtaccctgt 420
ctgactacaa catccagaaa gagtccacct tgcacctggt actccgtctc agaggtgggc 480
gaagcttgat aggcacctat tggtcttact gacatccact ttgcctttct ctccacaggt 540
ccatcctgac gggtctgttg ccaccaacct ctgggactgt gctcgttggg ggaagggaca 600
ttgaaaccag cctggatgca gtccggcaga gccttggcat gtgtccacag cacaacatcc 660
tgttccacca cctcacggtg gctgagcaca tgctgttcta tgcccagctg aaaggaaagt 720
cccaggagga ggcccagctg gagatggaag ccatgttgga ggacacaggc ctccaccaca 780
agcggaatga agaggctcag gacctatcag gtggcatgca gagaaagctg tcggttgcca 840
ttgcctttgt gggagatgcc aaggtggtga ttctggacga acccacctct ggggtggacc 900
cttactcgag acgctcaatc tgggatctgc tcctgaagta tcgctcaggc agaaccatca 960
tcatgtccac tcaccacatg gacgaggccg acctccttgg ggaccgcatt gccatcattg 1020
cccagggaag gctctactgc tcaggcaccc cactcttcct gaagaactgc tttggcacag 1080
gcttgtactt aaccttggtg cgcaagatga aaaacatcca gagccaaagg aaaggcagtg 1140
aggggacctg cagctgctcg tctaagggtt tctccaccac gtgtccagcc cacgtcgatg 1200
acctaactcc agaacaagtc ctggatgggg atgtaaatga gctgatggat gtagttctcc 1260
accatgttcc agaggcaaag ctggtggagt gcattggtca agaacttatc ttccttcttc 1320
caaataagaa cttcaagcac agagcatatg ccagcctttt cagagagctg gaggagacgc 1380
tggctgacct tggtctcagc agttttggaa tttctgacac tcccctggaa gagatttttc 1440
tgaaggtcac ggaggattct gattcaggac ctctgtttgc gggtggcgct cagcagaaaa 1500
gagaaaacgt caacccccga cacccctgct tgggtcccag agagaaggct ggacagacac 1560
cccaggactc caatgtctgc tccccagggg cgccggctgc tcacccagag ggccagcctc 1620
ccccagagcc agagtgccca ggcccgcagc tcaacacggg gacacagctg gtcctccagc 1680
atgtgcaggc gctgctggtc aagagattcc aacacaccat ccgcagccac aaggacttcc 1740
tggcgcagat cgtgctcccg gctacctttg tgtttttggc tctgatgctt tctattgtta 1800
tccctccttt tggcgaatac cccgctttga cccttcaccc ctggatatat gggcagcagt 1860
acaccttctt cagcatggat gaaccaggca gtgagcagtt cacggtactt gcagacgtcc 1920
tcctgaataa gccaggcttt ggcaaccgct gcctgaagga agggtggctt ccggagtacc 1980
cctgtggcaa ctcaacaccc tggaagactc cttctgtgtc cccaaacatc acccagctgt 2040
tccagaagca gaaatggaca caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg 2100
agaagctcac catgctgcca gagtgccccg agggtgccgg gggcctcccg cccccccaga 2160
gaacacagcg cagcacggaa attctacaag acctgacgga caggaacatc tccgacttct 2220
tggtaaaaac gtatcctgct cttataagaa gcagcttaaa gagcaaattc tgggtcaatg 2280
aacagaggta tggaggaatt tccattggag gaaagctccc agtcgtcccc atcacggggg 2340
aagcacttgt tgggttttta agcgaccttg gccggatcat gaatgtgagc gggggcccta 2400
tcactagaga ggcctctaaa gaaatacctg atttccttaa acatctagaa actgaagaca 2460
acattaaggt gtggtttaat aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg 2520
cccacaacgc catcttacgg gccagcctgc ctaaggacag aagccccgag gagtatggaa 2580
tcaccgtcat tagccaaccc ctgaacctga ccaaggagca gctctcagag attacagtgc 2640
tgaccacttc agtggatgct gtggttgcca tctgcgtgat tttctccatg tccttcgtcc 2700
cagccagctt tgtcctttat ttgatccagg agcgggtgaa caaatccaag cacctccagt 2760
ttatcagtgg agtgagcccc accacctact gggtaaccaa cttcctctgg gacatcatga 2820
attattccgt gagtgctggg ctggtggtgg gcatcttcat cgggtttcag aagaaagcct 2880
acacttctcc agaaaacctt cctgcccttg tggcactgct cctgctgtat ggatgggcgg 2940
tcattcccat gatgtaccca gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg 3000
ctttatcttg tgctaatctg ttcatcggca tcaacagcag tgctattacc ttcatcttgg 3060
aattatttga gaataaccgg acgctgctca ggttcaacgc cgtgctgagg aagctgctca 3120
ttgtcttccc ccacttctgc ctgggccggg gcctcattga ccttgcactg agccaggctg 3180
tgacagatgt ctatgcccgg tttggtgagg agcactctgc aaatccgttc cactgggacc 3240
tgattgggaa gaacctgttt gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc 3300
tgctggtcca gcgccacttc ttcctctccc aatggattgc cgagcccact aaggagccca 3360
ttgttgatga agatgatgat gtggctgaag aaagacaaag aattattact ggtggaaata 3420
aaactgacat cttaaggcta catgaactaa ccaagattta tccaggcacc tccagcccag 3480
cagtggacag gctgtgtgtc ggagttcgcc ctggagagtg ctttggcctc ctgggagtga 3540
atggtgccgg caaaacaacc acattcaaga tgctcactgg ggacaccaca gtgacctcag 3600
gggatgccac cgtagcaggc aagagtattt taaccaatat ttctgaagtc catcaaaata 3660
tgggctactg tcctcagttt gatgcaatcg atgagctgct cacaggacga gaacatcttt 3720
acctttatgc ccggcttcga ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga 3780
gtattaagag cctgggcctg actgtctacg ccgactgcct ggctggcacg tacagtgggg 3840
gcaacaagcg gaaactctcc acagccatcg cactcattgg ctgcccaccg ctggtgctgc 3900
tggatgagcc caccacaggg atggaccccc aggcacgccg catgctgtgg aacgtcatcg 3960
tgagcatcat cagagaaggg agggctgtgg tcctcacatc ccacagcatg gaagaatgtg 4020
aggcactgtg tacccggctg gccatcatgg taaagggcgc ctttcgatgt atgggcacca 4080
ttcagcatct caagtccaaa tttggagatg gctatatcgt cacaatgaag atcaaatccc 4140
cgaaggacga cctgcttcct gacctgaacc ctgtggagca gttcttccag gggaacttcc 4200
caggcagtgt gcagagggag aggcactaca acatgctcca gttccaggtc tcctcctcct 4260
ccctggcgag gatcttccag ctcctcctct cccacaagga cagcctgctc atcgaggagt 4320
actcagtcac acagaccaca ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg 4380
aaagtcatga cctccctctg caccctcgag ctgctggagc cagtcgacaa gcccaggacg 4440
actacaaaga ccatgacggt gattataaag atcatgacat cgactacaag gatgacgatg 4500
acaagtgagc ggccgcttcg agcagacatg ataagataca ttgatgagtt tggacaaacc 4560
acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 4620
tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 4680
tttcaggttc agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt 4740
ggtaaaatcg ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt 4800
aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4860
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4920
ctcagtgagc gagcgagcgc gcag 4944
<210> 78
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 78
atgcagatct tcgtgaagac tctgactggt aagaccatca ccctcgaggt ggagcccagt 60
gacaccatcg agaatgtcaa ggcaaagatc caagataagg aaggcattcc tcctgatcag 120
cagaggttga tctttgccgg aaaacagctg gaagatggtc gtaccctgtc tgactacaac 180
atccagaaag agtccacctt gcacctggta ctccgtctca gaggtggg 228
Claims (39)
- 세포 내에서 관심 유전자의 코딩 서열을 발현하는 AAV 다중 벡터 시스템으로서,
상기 코딩 서열은 제1 부분 및 제2 부분을 포함하고,
상기 벡터 시스템은
a) - 상기 코딩 서열의 상기 제1 부분(CDS1),
- 제1 재구축 서열(reconstitution sequence)
을 포함하는 제1 벡터; 및
b) - 상기 코딩 서열의 상기 제2 부분(CDS2),
- 제2 재구축 서열
을 포함하는 제2 벡터
를 포함하며,
상기 제1 재구축 서열 및 상기 제2 재구축 서열은
i] 상기 제1 재구축 서열은 코딩 서열의 상기 제1 부분의 3' 말단으로 구성되고, 상기 제2 재구축 서열은 코딩 서열의 상기 제2 부분의 5' 말단으로 구성되며, 상기 제1 재구축 서열 및 상기 제2 재구축 서열은 오버래핑 서열임; 또는
ii] 상기 제1 재구축 서열은 스플라이싱 공여자 신호(SD; donor signal)를 포함하고, 상기 제2 재구축 서열은 스플라이싱 수여자 신호(SA; acceptor signal)를 포함하는 서열임
으로 이루어진 군으로부터 선택되고,
상기 제1 벡터 및 제2 벡터 중 하나 또는 둘 다는 분해 신호의 뉴클레오타이드 서열을 더 포함하며, 상기 분해 신호의 뉴클레오타이드 서열은 i)의 경우, CDS1의 3' 말단 및/또는 CDS2의 5' 말단에 위치하고, ii)의 경우, SD에 대하여 3' 위치 및/또는 SA에 대하여 5' 위치에 위치한다는 사실을 특징으로 하며,
상기 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 이로 구성되는, AAV 다중 벡터 시스템. - 제1항에 있어서,
상기 제1 벡터 및 제2 벡터가 둘 다 분해 신호의 상기 뉴클레오타이드 서열을 더 포함하고,
상기 제1 벡터 내 분해 신호의 뉴클레오타이드 서열이 상기 제2 벡터 내 분해 신호의 뉴클레오타이드 서열과 동일하거나 상이한, AAV 다중 벡터 시스템. - 제1항에 있어서,
상기 제1 재구축 서열 및 제2 재구축 서열은 각각 재조합유전성(recombinogenic) 서열을 더 포함하며,
상기 재조합유전성 서열은 AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택되는, AAV 다중 벡터 시스템. - 제1항에 있어서,
상기 제1 재구축 서열이 스플라이싱 공여자 신호(SD), 및 상기 SD에 대하여 3' 위치에 재조합유전성 서열을 포함하며,
상기 제2 재구축 서열이 스플라이싱 수여자 신호(SA), 및 상기 SA에 대하여 5' 위치에 재조합유전성 서열을 포함하고,
상기 분해 신호의 상기 뉴클레오타이드 서열이 상기 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 및/또는 3' 말단에 위치하고,
상기 재조합유전성 서열은 AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택되는, AAV 다중 벡터 시스템. - 삭제
- 삭제
- 삭제
- 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 제1 벡터가 코딩 서열의 상기 제1 부분(CDS1)의 5' 말단 부분에 작동적으로 연결된 프로모터 서열을 더 포함하는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 제1 벡터 및 제2 벡터가 둘 다 5'-말단 반복부(5'-TR) 뉴클레오타이드 서열 및 3'-말단 반복부(3'-TR) 뉴클레오타이드 서열을 더 포함하는, AAV 다중 벡터 시스템. - 제9항에 있어서,
상기 5'-TR이 5'-반전 말단 반복부(5'-ITR; 5'-inverted terminal repeat) 뉴클레오타이드 서열이고, 상기 3'-TR이 3'-반전 말단 반복부(3'-ITR) 뉴클레오타이드 서열이며,
상기 ITR이 동일한 바이러스 혈청형 또는 상이한 바이러스 혈청형으로부터 유래되는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 코딩 서열이 천연 엑손-엑손 연접(junction)에서 상기 제1 부분 및 제2 부분으로 분할되는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 스플라이싱 공여자 신호가 GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAGAAGACTCTTGCGTTTCT(서열 번호 27)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 이로 구성된, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 스플라이싱 수여자 신호가 GATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(서열 번호 28)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 동일한 서열을 포함하거나 이로 구성된, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 제1 벡터가, 상기 코딩 서열에 작동적으로 연결된 적어도 하나의 인핸서 뉴클레오타이드 서열을 더 포함하는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 코딩 서열이 ABCA4, MYO7A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98 및 HMCN1로 이루어진 군으로부터 선택되는 유전자의 코딩 서열인, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 코딩 서열이 DMD, CFTR, F8 및 DYSF로 이루어진 군으로부터 선택되는 유전자의 코딩 서열인, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 제1 벡터가 폴리아데닐화 신호 뉴클레오타이드 서열을 포함하지 않는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
a) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 프로모터 서열;
- 관심 유전자의 코딩 서열의 5' 말단 부분(CDS1)으로서, 상기 5' 말단 부분이 상기 프로모터에 작동적으로 연결되고 이의 조절하에 있는 부분;
- 스플라이싱 공여자 신호의 뉴클레오타이드 서열;
- 재조합유전성 영역의 뉴클레오타이드 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제1 벡터; 및
b) 5'-3' 방향으로:
- 5'-반전 말단 반복부(5'-ITR) 서열;
- 재조합유전성 영역의 뉴클레오타이드 서열;
- 스플라이싱 수여자 신호의 뉴클레오타이드 서열;
- 코딩 서열의 3' 말단(CDS2);
- 폴리아데닐화 신호 뉴클레오타이드 서열; 및
- 3'-반전 말단 반복부(3'-ITR) 서열
을 포함하는 제2 벡터
를 포함하고,
분해 신호의 뉴클레오타이드 서열을 더 포함하고, 상기 서열이 상기 제1 벡터 및 제2 벡터 중 하나 또는 둘 다의 재조합유전성 영역의 뉴클레오타이드 서열의 5' 말단 또는 3' 말단에 위치하며,
상기 분해 신호의 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 이로 구성되고,
상기 재조합유전성 영역의 뉴클레오타이드 서열은 AK GGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 22) 또는 GGGATTTTTCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAAT(서열 번호 23), AP1(서열 번호 24), AP2(서열 번호 25) 및 AP(서열 번호 26)로 이루어진 군으로부터 선택되는 것을 특징으로 하는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 아데노-연관 바이러스(AAV)가 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9로부터 선택되는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 코딩 서열의 제3 부분(CDS3) 및 재구축 서열을 포함하는 제3 벡터를 더 포함하고,
상기 제2 벡터가 2개의 재구축 서열을 포함하며, 각각의 재구축 서열이 CDS2의 각각의 말단에 위치하는, AAV 다중 벡터 시스템. - 제20항에 있어서,
상기 제3 벡터가 분해 신호의 적어도 하나의 뉴클레오타이드 서열을 더 포함하고,
상기 뉴클레오타이드 서열은 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 이로 구성되거나, 또는 서열 번호 16을 포함하거나 또는 이로 구성되는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 제2 벡터가 상기 코딩 서열의 3' 말단 부분(CDS2)에 연결된 폴리아데닐화 신호 뉴클레오타이드 서열을 더 포함하는, AAV 다중 벡터 시스템. - 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템을 이용하여 형질변환된 숙주 세포.
- 의료용의 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
- 의료용의 제23항에 따른 숙주 세포.
- 유전자 치료법에 사용하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
- 유전자 치료법에 사용하기 위한, 제23항에 따른 숙주 세포.
- 망막 변성을 특징으로 하는 병태 또는 질병의 치료 또는 예방에 사용하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
- 망막 변성을 특징으로 하는 병태 또는 질병의 치료 또는 예방에 사용하기 위한, 제23항에 따른 숙주 세포.
- 제28항에 있어서,
상기 망막 변성이 유전성인, AAV 다중 벡터 시스템. - 제29항에 있어서,
상기 망막 변성이 유전성인, 숙주 세포. - 제28항에 있어서,
상기 병태 또는 질병이 색소성 망막염(RP; retinitis pigmentosa), 레베르 선천성 흑암시(LCA; Leber congenital amaurosis), 스타르가르트 질병(STGD; Stargardt disease), 어셔 질병(USH; Usher disease), 알스트롬 증후군(Alstrom syndrome), 선천성 비진행 야맹증(CSNB; congenital stationary night blindness), 황반 이영양증(macular dystrophy), 잠복 황반 이영양증(occult macular dystrophy), ABCA4 유전자에서의 돌연변이에 의해 유발된 질병으로 이루어진 군으로부터 선택되는, AAV 다중 벡터 시스템. - 제29항에 있어서,
상기 병태 또는 질병이 색소성 망막염(RP; retinitis pigmentosa), 레베르 선천성 흑암시(LCA; Leber congenital amaurosis), 스타르가르트 질병(STGD; Stargardt disease), 어셔 질병(USH; Usher disease), 알스트롬 증후군(Alstrom syndrome), 선천성 비진행 야맹증(CSNB; congenital stationary night blindness), 황반 이영양증(macular dystrophy), 잠복 황반 이영양증(occult macular dystrophy), ABCA4 유전자에서의 돌연변이에 의해 유발된 질병으로 이루어진 군으로부터 선택되는, 숙주 세포. - 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 예방 및/또는 치료에 사용하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템.
- 뒤시엔느 근이영양증, 낭포성 섬유증, 혈우병 A 및 디스페린병증의 예방 또는 치료에 사용하기 위한, 제23항에 따른 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템 또는 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템을 이용하여 형질변환된 숙주 세포; 및 약제학적으로 허용가능한 비히클;을 포함하는 망막 변성을 특징으로 하는 병태 또는 질병의 치료 또는 예방에 사용하기 위한 약제학적 조성물.
- 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템 또는 제1항 내지 제4항 중 어느 한 항에 따른 AAV 다중 벡터 시스템을 이용하여 형질변환된 숙주 세포; 및 약제학적으로 허용가능한 비히클;을 포함하는 뒤시엔느 근이영양증, 낭포 성 섬유증, 혈우병 A 및 디스페린병증의 예방 또는 치료에 사용하기 위한 약제학적 조성물.
- 제1항의 AAV 다중 벡터 시스템의 하나 이상의 벡터에 분해 신호의 뉴클레오타이드 서열을 삽입하는 단계를 포함하고,
상기 분해 신호의 뉴클레오타이드 서열이 CL1 서열 번호 1을 인코딩하는 서열을 포함하거나 또는 이로 구성되거나, 또는 서열 번호 16을 포함하거나 또는 이로 구성되는, 절단된 형태의 단백질의 발현을 감소시키는 방법. - 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562127463P | 2015-03-03 | 2015-03-03 | |
US62/127,463 | 2015-03-03 | ||
PCT/EP2016/054602 WO2016139321A1 (en) | 2015-03-03 | 2016-03-03 | Multiple vector system and uses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170140185A KR20170140185A (ko) | 2017-12-20 |
KR102240180B1 true KR102240180B1 (ko) | 2021-04-14 |
Family
ID=56849204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177027977A KR102240180B1 (ko) | 2015-03-03 | 2016-03-03 | 다중 벡터 시스템 및 이의 용도 |
Country Status (17)
Country | Link |
---|---|
US (2) | US20180327779A1 (ko) |
EP (2) | EP4089172A3 (ko) |
JP (2) | JP7182873B2 (ko) |
KR (1) | KR102240180B1 (ko) |
CN (1) | CN107466325A (ko) |
AU (1) | AU2016227668B2 (ko) |
BR (1) | BR112017018728A2 (ko) |
CA (1) | CA2979120A1 (ko) |
DK (1) | DK3265571T3 (ko) |
ES (1) | ES2919880T3 (ko) |
HR (1) | HRP20220776T1 (ko) |
MX (2) | MX2017011255A (ko) |
PL (1) | PL3265571T3 (ko) |
PT (1) | PT3265571T (ko) |
RS (1) | RS63416B1 (ko) |
SI (1) | SI3265571T1 (ko) |
WO (1) | WO2016139321A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7182873B2 (ja) * | 2015-03-03 | 2022-12-05 | フォンダッツィオーネ・テレソン | 多重ベクターシステム及びその使用 |
WO2016145345A1 (en) * | 2015-03-11 | 2016-09-15 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Rp2 and rpgr vectors for treating x-linked retinitis pigmentosa |
US11072803B2 (en) | 2015-12-22 | 2021-07-27 | Inserm (Institut National De La Sante Et De La Recherche Medicale) | Hybrid dual recombinant AAV vector systems for gene therapy |
US20190185864A1 (en) | 2016-08-23 | 2019-06-20 | Akouos, Inc. | Compositions and methods for treating non-age-associated hearing impairment in a human subject |
CN110892062A (zh) * | 2017-05-05 | 2020-03-17 | 佛罗里达大学研究基金会 | 表达耳畸蛋白的组合物和方法 |
WO2019195727A1 (en) * | 2018-04-05 | 2019-10-10 | Oxford University Innovation Limited | Compositions and methods for treating macular dystrophy |
JP7561624B2 (ja) * | 2018-04-17 | 2024-10-04 | ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア | トランススプライシング分子 |
US11660353B2 (en) | 2018-04-27 | 2023-05-30 | Decibel Therapeutics, Inc. | Compositions and methods for treating sensorineural hearing loss using otoferlin dual vector systems |
AU2019360372A1 (en) * | 2018-10-15 | 2021-06-03 | Fondazione Telethon | Intein proteins and uses thereof |
CN112888426A (zh) * | 2018-10-25 | 2021-06-01 | 百特奥尔塔公司 | Aav三质粒系统 |
US20220175967A1 (en) * | 2019-04-19 | 2022-06-09 | University Of Massachusetts | Gene therapies for usher syndrome (ush1b) |
WO2020219990A1 (en) * | 2019-04-26 | 2020-10-29 | President And Fellows Of Harvard College | Aav vectors encoding mini-pcdh15 and uses thereof |
WO2021116138A1 (en) * | 2019-12-09 | 2021-06-17 | Ucl Business Ltd | Gene therapy composition and treatment for myh7-linked cardiomyopathy |
JP2023512824A (ja) * | 2020-02-07 | 2023-03-29 | ザ チルドレンズ メディカル センター コーポレーション | 大型遺伝子ベクターならびにその送達および使用の方法 |
MX2022010050A (es) | 2020-02-21 | 2022-09-05 | Akouos Inc | Composiciones y metodos para tratar deficiencia auditiva no asociada con la edad en un sujeto humano. |
CN112501209B (zh) * | 2020-12-07 | 2024-02-13 | 和元生物技术(上海)股份有限公司 | 外源基因可控表达的腺相关病毒包装方法 |
CA3218195A1 (en) * | 2021-05-07 | 2022-11-10 | Robin Ali | Abca4 genome editing |
WO2024098035A2 (en) * | 2022-11-04 | 2024-05-10 | National Resilience, Inc. | Methods and compositions for preparing recombinant adeno associated viruses and uses thereof |
CN116925239B (zh) * | 2023-07-17 | 2024-10-18 | 苏州星奥拓维生物技术有限公司 | 双载体系统表达Otof基因的组合物和方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5827702A (en) | 1994-10-31 | 1998-10-27 | Genentech, Inc. | Ocular gene therapy |
GB9720465D0 (en) * | 1997-09-25 | 1997-11-26 | Oxford Biomedica Ltd | Dual-virus vectors |
US6106826A (en) | 1997-12-17 | 2000-08-22 | Wisconsin Alumni Research Foundation | Replication competent, avirulent Herpes simplex virus as a vector for neural and ocular gene therapy |
NZ507308A (en) | 1998-04-24 | 2003-01-31 | Univ Florida | Materials and methods for gene therapy |
US6967018B2 (en) | 2002-01-11 | 2005-11-22 | Applied Genetic Technologies Corporation | Adiponectin gene therapy |
US7250406B2 (en) * | 2002-04-19 | 2007-07-31 | Georgia Tech Research Corporation | Compositions and methods for the acceleration of protein secretion dynamics |
WO2006036465A2 (en) | 2004-09-03 | 2006-04-06 | University Of Florida | Compositions and methods for treating cystic fibrosis |
JP4948845B2 (ja) | 2006-02-08 | 2012-06-06 | 財団法人 東京都医学総合研究所 | 神経変性疾患治療用物質のスクリーニング方法 |
EP1998792B1 (en) * | 2006-03-01 | 2015-02-18 | The University of Utah Research Foundation | Methods and compositions related to cyclic peptide synthesis |
WO2007127428A2 (en) | 2006-04-28 | 2007-11-08 | University Of Florida Research Foundation, Inc. | Double-stranded/self-complementary vectors with a truncated cba promoter and methods of gene delivery |
US8236557B2 (en) * | 2008-05-28 | 2012-08-07 | University Of Missouri-Columbia | Hybrid-AAV vectors to deliver large gene expression cassette |
CN102282255B (zh) * | 2008-11-19 | 2014-05-07 | 阿迈瑞斯公司 | 多核苷酸装配的组合物和方法 |
CN102471765B9 (zh) | 2009-07-02 | 2016-07-27 | 莫茨制药有限及两合公司 | 显示出缩短的生物学活性的神经毒素 |
WO2013075008A1 (en) * | 2011-11-16 | 2013-05-23 | University Of Florida Research Foundation Inc. | Aav dual vector systems for gene therapy |
AU2014255665B2 (en) * | 2013-04-18 | 2018-08-02 | Fondazione Telethon | Effective delivery of large genes by dual AAV vectors |
JP7182873B2 (ja) * | 2015-03-03 | 2022-12-05 | フォンダッツィオーネ・テレソン | 多重ベクターシステム及びその使用 |
-
2016
- 2016-03-03 JP JP2017546224A patent/JP7182873B2/ja active Active
- 2016-03-03 US US15/555,479 patent/US20180327779A1/en not_active Abandoned
- 2016-03-03 DK DK16710113.8T patent/DK3265571T3/da active
- 2016-03-03 MX MX2017011255A patent/MX2017011255A/es unknown
- 2016-03-03 PT PT167101138T patent/PT3265571T/pt unknown
- 2016-03-03 HR HRP20220776TT patent/HRP20220776T1/hr unknown
- 2016-03-03 CA CA2979120A patent/CA2979120A1/en active Pending
- 2016-03-03 PL PL16710113.8T patent/PL3265571T3/pl unknown
- 2016-03-03 WO PCT/EP2016/054602 patent/WO2016139321A1/en active Application Filing
- 2016-03-03 EP EP22160356.6A patent/EP4089172A3/en active Pending
- 2016-03-03 AU AU2016227668A patent/AU2016227668B2/en active Active
- 2016-03-03 BR BR112017018728A patent/BR112017018728A2/pt not_active Application Discontinuation
- 2016-03-03 CN CN201680013732.1A patent/CN107466325A/zh active Pending
- 2016-03-03 SI SI201631554T patent/SI3265571T1/sl unknown
- 2016-03-03 KR KR1020177027977A patent/KR102240180B1/ko active IP Right Grant
- 2016-03-03 EP EP16710113.8A patent/EP3265571B1/en active Active
- 2016-03-03 RS RS20220591A patent/RS63416B1/sr unknown
- 2016-03-03 ES ES16710113T patent/ES2919880T3/es active Active
-
2017
- 2017-08-31 MX MX2023004479A patent/MX2023004479A/es unknown
-
2021
- 2021-03-15 US US17/202,098 patent/US20220002749A1/en active Pending
-
2022
- 2022-09-07 JP JP2022142232A patent/JP2022174192A/ja active Pending
Non-Patent Citations (1)
Title |
---|
CHO, S. et al., Genes Dev., 2010, vol.24, pp.438-442* |
Also Published As
Publication number | Publication date |
---|---|
EP4089172A3 (en) | 2023-03-01 |
RS63416B1 (sr) | 2022-08-31 |
HRP20220776T1 (hr) | 2022-09-16 |
EP3265571B1 (en) | 2022-04-13 |
AU2016227668B2 (en) | 2019-06-27 |
BR112017018728A2 (pt) | 2018-04-17 |
JP2018512125A (ja) | 2018-05-17 |
DK3265571T3 (da) | 2022-06-27 |
WO2016139321A1 (en) | 2016-09-09 |
CN107466325A (zh) | 2017-12-12 |
US20220002749A1 (en) | 2022-01-06 |
US20180327779A1 (en) | 2018-11-15 |
PL3265571T3 (pl) | 2022-09-05 |
SI3265571T1 (sl) | 2022-10-28 |
ES2919880T3 (es) | 2022-07-28 |
MX2017011255A (es) | 2018-08-01 |
JP2022174192A (ja) | 2022-11-22 |
JP7182873B2 (ja) | 2022-12-05 |
AU2016227668A1 (en) | 2017-08-31 |
KR20170140185A (ko) | 2017-12-20 |
CA2979120A1 (en) | 2016-09-09 |
MX2023004479A (es) | 2023-05-04 |
PT3265571T (pt) | 2022-06-29 |
EP4089172A2 (en) | 2022-11-16 |
EP3265571A1 (en) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102240180B1 (ko) | 다중 벡터 시스템 및 이의 용도 | |
CN110546257B (zh) | 用于增强基因表达的组合物和方法 | |
AU2014255665B2 (en) | Effective delivery of large genes by dual AAV vectors | |
AU2022203494B2 (en) | Adeno-Associated Virus Variant Capsids And Use For Inhibiting Angiogenesis | |
KR20200051011A (ko) | 변형된 폐쇄-종결된 dna(cedna) | |
JP7303816B2 (ja) | Aavベクター | |
CN116194154A (zh) | 使用aav载体的plakophilin-2(pkp2)基因疗法 | |
CN116234916A (zh) | Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法 | |
CN116685329A (zh) | 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途 | |
KR102545070B1 (ko) | 안구 장애에 대한 유전자 치료 | |
AU2005287393A1 (en) | AAV mediated gene delivery to cochlear cells | |
WO2022217110A1 (en) | Compositions and methods for ocular transgene expression | |
KR20230039669A (ko) | eEF1A2용 유전자 요법 벡터 및 이의 용도 | |
CN112601454B (zh) | 用于治疗杜兴肌营养不良的组合物和方法 | |
KR20210057720A (ko) | Clrn1 관련된 청력 손실 및/또는 시력 손실의 치료 방법 | |
RU2800026C2 (ru) | МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК) | |
RU2816963C2 (ru) | МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК), СОДЕРЖАЩАЯ СИММЕТРИЧНЫЕ МОДИФИЦИРОВАННЫЕ ИНВЕРТИРОВАННЫЕ КОНЦЕВЫЕ ПОВТОРЫ | |
KR20240023127A (ko) | 망막 장애 | |
CN117813321A (zh) | 视网膜病症 | |
KR20240005950A (ko) | 벡터 시스템 | |
RU2773756C2 (ru) | Варианты капсидов аденоассоциированного вируса и их применение для ингибирования ангиогенеза | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 | |
WO2023150743A2 (en) | Codon-optimized smad7 gene therapy to treat and prevent muscle wasting and to enhance muscle mass | |
WO2023178171A2 (en) | Cassettes of anti-complement component 3 antibody, vectorization and theraputic application | |
KR20240023126A (ko) | 망막 장애 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
E90F | Notification of reason for final refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |