[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR20210150486A - 리소좀 장애에 대한 유전자 요법 - Google Patents

리소좀 장애에 대한 유전자 요법 Download PDF

Info

Publication number
KR20210150486A
KR20210150486A KR1020217036234A KR20217036234A KR20210150486A KR 20210150486 A KR20210150486 A KR 20210150486A KR 1020217036234 A KR1020217036234 A KR 1020217036234A KR 20217036234 A KR20217036234 A KR 20217036234A KR 20210150486 A KR20210150486 A KR 20210150486A
Authority
KR
South Korea
Prior art keywords
nucleic acid
raav
protein
grn
sequence
Prior art date
Application number
KR1020217036234A
Other languages
English (en)
Inventor
아사 아벨리오비치
로라 헤크만
리 친 웡
슈엔-니 린
프란츠 헤프티
에르베 린
Original Assignee
프리베일 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프리베일 테라퓨틱스, 인크. filed Critical 프리베일 테라퓨틱스, 인크.
Publication of KR20210150486A publication Critical patent/KR20210150486A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0083Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the administration regime
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/18Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with another compound as one donor, and incorporation of one atom of oxygen (1.14.18)
    • C12Y114/18001Tyrosinase (1.14.18.1)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14132Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14133Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Psychiatry (AREA)
  • Pathology (AREA)

Abstract

본 개시내용은 비정상적인 리소좀 기능과 연관된 질환, 예컨대, 전두측두엽 치매(FTD)의 치료를 위한 조성물 및 방법에 관한 것이다. 본 개시내용은 또한 프로그래뉼린 또는 이의 일부를 인코딩하는 이식유전자를 포함하는 발현 작제물을 제공한다. 본 개시내용은 이와 같은 발현 작제물을 이를 필요로 하는 대상체에게 투여함으로써 FTD를 치료하는 방법을 제공한다.

Description

리소좀 장애에 대한 유전자 요법
관련 출원에 대한 상호-참조
본 출원은 2020년 3월 12일자로 출원된 미국 특허 가출원 제62/988,665호, 2020년 1월 13일자로 출원된 미국 특허 가출원 제62/960,471호, 2019년 12월 27일자로 출원된 미국 특허 가출원 제62/954,089호, 2019년 11월 12일자로 출원된 미국 특허 가출원 제62/934,450호 및 2019년 4월 10일자로 출원된 미국 특허 가출원 제62/831,846호에 대한 우선권을 주장한다. 이들 출원 각각의 개시내용은 본 명세서에 전문이 참조에 의해 원용된다.
전자적으로 제출된 텍스트 파일의 설명
본 명세서와 함께 전자적으로 제출된 텍스트 파일의 내용은 본 명세서에 전문이 참조에 의해 원용된다: 서열목록의 컴퓨터로 판독 가능한 포맷 사본(파일명: PRVL_010_05WO_SeqList.txt, 기록일: 2020년 4월 10일, 파일 크기: 약 612,902 바이트).
분야
본 개시내용은 유전자 요법 및 이를 사용하는 방법의 분야에 관한 것이다.
고셔병은 리소좀 산 β-글루코세레브로시다제(Gcase, "GBA")의 결핍으로 인한 글리코스핑고지질 대사의 희귀한 선천성 이상이다. 환자는 간비종대, 범혈구감소증으로 이어지는 골수 부전, 폐 장애 및 섬유증, 및 골 결손을 포함하여 비-CNS 증상 및 소견을 겪는다. 추가적으로, 상당수의 환자는 결함이 있는 도약 안구 운동 및 응시, 발작, 인지적 결함, 발달 지연, 및 파킨슨병을 포함한 운동 장애를 포함한 신경학적 징후를 겪는다. 하기 기재된 바와 같은 효소 대체 요법, 결함이 있는 Gcase에 결합하여 안정성을 개선시키는 샤페론-유사 소분자 약물, 및 증상 및 소견으로 이어지는 고셔병에서 축적하는 기질의 생성을 차단하는 기질 감소 요법을 포함하여, 말초 질환 및 조혈 골수 및 내장에서 주요 임상 징후를 해결하는 여러 치료법이 존재한다. 그러나, 고셔병의 다른 양상(특히 골격과 뇌에 영향을 미치는 것)은 치료에 불응성인 것으로 보인다.
프로그래뉼린(PGRN)은 리소좀 기능과 관련된 추가적인 단백질이다. PGRN은 GRN 유전자에 의해 인코딩된다. 인간에서 GRN 반가불충분성은, 전두측두엽의 위축을 동본한 실행 기능 손상, 행동 변화, 및 언어 곤란을 특징으로 하는 신경퇴행성 질환인 FTD-GRN(GRN 돌연변이가 있는 전두측두엽 치매) 발병 위험이 대략 90%로 이어진다. FTD 환자에게 이용 가능한 질병 경과변형 요법은 없다.
GRN 돌연변이가 있는 전두측두엽 치매를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법이 본 명세서에서 제공되며, 상기 방법은 (i) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, rAAV 벡터; 및 (ii) AAV9 캡시드 단백질을 포함하는 재조합 아데노-연관 바이러스(rAAV)를 대상체에게 투여하는 단계를 포함한다. 일부 실시형태에서, rAAV는 약 1×1013개 벡터 게놈(vg) 내지 약 7×1014개 vg 범위의 용량으로 대상체에게 투여된다. 일부 실시형태에서, rAAV는 주사를 통해 대조(cisterna magna) 내로 투여된다.
일부 실시형태에서, PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터는 닭 베타 액틴(CBA) 프로모터이다. 일부 실시형태에서, rAAV 벡터는 거대세포바이러스(CMV) 인핸서를 추가로 포함한다. 일부 실시형태에서, rAAV 벡터는 우드척 간염 바이러스 전사후 조절 요소(WPRE)를 추가로 포함한다. 일부 실시형태에서, rAAV 벡터는 소 성장 호르몬 폴리A 신호 꼬리를 추가로 포함한다. 일부 실시형태에서, 핵산은 발현 작제물에 측접하는 2개의 아데노-연관 바이러스 반전 말단 반복부(ITR) 서열을 포함한다. 일부 실시형태에서, 각각의 ITR 서열은 야생형 AAV2 ITR 서열이다. 일부 실시형태에서, rAAV 벡터는 5' ITR과 발현 작제물 사이에 TRY 영역을 추가로 포함하며, 여기서 TRY 영역은 서열번호 28을 포함한다.
GRN 돌연변이가 있는 전두측두엽 치매를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법이 본 명세서에서 제공되며, 상기 방법은 (i) 5'에서 3' 순서로 (a) AAV2 ITR; (b) CMV 인핸서; (c) CBA 프로모터; (d) PGRN 단백질을 인코딩하는 이식유전자 삽입체로서, 서열번호 68의 뉴클레오타이드 서열을 포함하는, 이식유전자 삽입체; (e) WPRE; (f) 소 성장 호르몬 폴리A 신호 꼬리; 및 (g) AAV2 ITR을 포함하는 핵산을 포함하는 rAAV 벡터; 및 (ii) AAV9 캡시드 단백질을 포함하는 rAAV를 대상체에게 투여하는 단계를 포함한다. 일부 실시형태에서, rAAV는 약 1×1013개 vg 내지 약 7×1014개 vg 범위의 용량으로 대상체에게 투여된다. 일부 실시형태에서, rAAV는 주사를 통해 대조 내로 투여된다.
일부 실시형태에서, rAAV는 약 20mM Tris(pH 8.0), 약 1mM MgCl2, 약 200mM NaCl, 및 약 0.001% w/v 폴록사머(poloxamer) 188을 포함하는 제형으로 투여된다.
(i) (a) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, rAAV 벡터; 및 (b) AAV9 캡시드 단백질을 포함하는 rAAV; 및 (ii) 약 20mM Tris(pH 8.0), (iii) 약 1mM MgCl2, (iv) 약 200mM NaCl, 및 (v) 약 0.001% w/v 폴록사머 188을 포함하는 약제학적 조성물이 본 명세서에서 제공된다.
대상체에서 GRN 돌연변이가 있는 전두측두엽 치매를 치료하는 방법에서 사용하기 위한, (a) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, rAAV 벡터; 및 (b) AAV9 캡시드 단백질을 포함하는 rAAV가 본 명세서에서 제공된다.
뇌척수액(CSF) 샘플에서 PGRN 단백질 수준을 정량화하는 방법이 본 명세서에서 제공되며, 상기 방법은 (1) 다이티오트레이톨(DTT) 및 샘플 완충액을 포함하는 마스터 믹스에서 CSF 샘플을 희석시키는 단계; (2) 희석된 CSF 샘플, 항-프로그래뉼린 항체, 항-프로그래뉼린 항체를 검출하는 2차 항체, 루미놀 및 퍼옥사이드를 모세관 카트리지의 웰에 로딩하는 단계; (3) 모세관 카트리지를 자동화된 웨스턴 블롯 면역분석 기기에 로딩하는 단계; (4) 자동화된 웨스턴 블롯 면역분석 기기를 사용하여 신호 강도, 피크 면적 및 신호 대 잡음 비를 계산하는 단계; 및 (5) 항-그래뉼린 항체에 대한 면역반응성의 피크 면적으로서 CSF 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 단계를 포함한다.
도 1은 Gcase(예컨대, GBA1 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 2는 Gcase(예컨대, GBA1 또는 이의 일부) 및 LIMP2(SCARB2) 또는 이의 일부를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 LIMP2의 코딩 서열은 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
도 3은 Gcase(예컨대, GBA1 또는 이의 일부) 및 LIMP2(SCARB2) 또는 이의 일부를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 LIMP2의 코딩 서열의 발현은 각각 별도의 프로모터에 의해 구동된다.
도 4는 Gcase(예컨대, GBA1 또는 이의 일부), LIMP2(SCARB2) 또는 이의 일부, 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 5는 Gcase(예컨대, GBA1 또는 이의 일부), 프로사포신(Prosaposin)(예컨대, PSAP 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 6은 Gcase(예컨대, GBA1 또는 이의 일부) 및 프로사포신(예컨대, PSAP 또는 이의 일부)을 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 프로사포신의 코딩 서열은 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
도 7은 Gcase(예컨대, GBA1 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. 이 실시형태에서, 벡터는 CMV 인핸서(CMVe), CBA 프로모터(CBAp), 엑손 1, 및 인트론(int)의 4개 부분으로 이루어진 CBA 프로모터 요소(CBA)를 포함하여 인간 GBA1의 코돈 최적화된 코딩 서열을 구성적으로 발현한다. 3' 영역은 또한 WPRE 조절 요소, 그 다음에 bGH 폴리A 꼬리를 포함한다. 3개의 전사 조절 활성화 부위, 즉, TATA, RBS, 및 YY1이 프로모터 영역의 5' 말단에 포함된다. 측접 ITR은 개재 서열의 올바른 패키징을 가능하게 한다. 5' ITR 서열의 2가지 변이체(삽입 상자)를 평가하였으며; 이들은 야생형 AAV2 ITR의 20개 뉴클레오타이드 "D" 영역 내에서 몇 가지 뉴클레오타이드 차이를 가진다. 일부 실시형태에서, rAAV 벡터는 상단 라인에 나타낸 "D" 도메인 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, rAAV 벡터는 돌연변이 "D" 도메인(예컨대, 하단 라인에 나타낸 뉴클레오타이드 변화가 있는 "S" 도메인)을 포함한다.
도 8은 도 6에 기재한 벡터의 일 실시형태를 도시하는 개략도이다.
도 9는 파킨슨병의 CBE 마우스 모델에서 Gcase(예컨대, GBA1 또는 이의 일부)를 인코딩하는 이식유전자를 포함하는 rAAV의 전달을 위한 대표적인 데이터를 나타낸다. PBS 비히클, 25 ㎎/㎏ CBE, 37.5 ㎎/㎏ CBE, 또는 50 ㎎/㎏ CBE(좌측에서 우측으로)의 매일 IP 전달은 P8에 개시하였다. 하루에 2번 생존(상단 좌측)을 확인하고, 매일 체중(상단 우측)을 확인하였다. 모든 그룹은 n = 8로 시작하였다. P23에 개방 필드에서 이동한 총 거리 및 P24에 로타로드(Rotarod)에서 떨어지기까지의 대기시간(하단 중간)으로 행동을 평가하였다. PBS 및 25 ㎎/㎏ CBE 처리군의 마우스 피질에서 CBE 회수가 있는 경우(제3일) 및 없는 경우(제1일) 둘 다 GCase 기질의 수준을 분석하였다. GluSph 및 GalSph 수준 합계(하단 우측)는 조직의 습윤 중량 ㎎당 p㏖로 표시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; **p<0.01; ***p<0.001, 선형 회귀에 의한 처리군에 대한 공칭 p-값.
도 10은 CBE 마우스 모델에서 최대 rAAV 용량에 대한 연구 설계의 일 실시형태를 도시하는 개략도이다. 간략하게, P3에 ICV 주사에 의해 rAAV를 전달하고, P8에 매일 CBE 치료를 개시하였다. P24 내지 25에 개방 필드 및 로타로드 분석으로 행동을 평가하였고, P36 및 P38에 기질 수준을 측정하였다.
도 11은 CBE 마우스 모델에서 최대 rAAV 용량의 생전(in-life) 평가를 위한 대표적인 데이터를 나타낸다. P3에서, ICV 전달을 통해 부형제 또는 8.8e9 vg rAAV-GBA1으로 마우스를 처리하였다. PBS 또는 25 ㎎/㎏ CBE의 매일 IP 전달을 P8에 개시하였다. 연구 종료시, P36(제1일)에 마지막 CBE 투약 1일 후 마우스의 절반을 희생시킨 반면, 나머지 절반은 P38(제3일)에 희생 전 3일 동안 CBE 중단을 거쳤다. 모든 처리군(부형제 + PBS n = 8, rAAV-GBA1+ PBS n = 7, 부형제 + CBE n = 8, 및 변이체 + CBE n = 9)의 체중을 매일 측정하고(상단 좌측), P36에 체중을 분석하였다(상단 우측). P23에 개방 필드에서 이동한 총 거리(하단 좌측) 및 P24에 로타로드에서 떨어지기까지의 대기시간(하단 중간)으로 행동을 평가하고, 각각의 동물에 대해 3번의 시험에 걸쳐 중앙값으로 평가하였다. 치사율로 인해, 행동 분석에 대해 부형제 + CBE 군의 경우 n = 7인 한편, 다른 모든 군의 경우 n=8이다. 동물에 걸친 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; ***p<0.001, CBE-처리 동물에서 선형 회귀에 의한 처리군에 대한 공칭 p-값.
도 12는 CBE 마우스 모델에서 최대 rAAV 용량의 생화학적 평가에 대한 대표적인 데이터를 나타낸다. 모든 처리군(부형제 + PBS n = 8, 변이체 + PBS n = 7, 부형제 + CBE n = 7, 및 변이체 + CBE n = 9)의 피질을 사용하여 CBE 중단 전(제1일) 또는 후(제3일)에 그룹의 GCase 활성(상단 좌측), GluSph 수준(상단 우측), GluCer 수준(하단 좌측) 및 벡터 게놈(하단 우측)을 측정하였다. 생체분포는 게놈 DNA 1㎍당 벡터 게놈으로 표시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다. (*)p<0.1; **p<0.01; ***p<0.001, CBE-처리 동물에서 선형 회귀에 의한 처리군에 대한 공칭 p-값, 공변량으로서 수집일과 성별을 보정하였다.
도 13은 부형제 + PBS, 부형제 + CBE, 및 변이체 + CBE 처리군의 투여 후 CBE 마우스 모델에서 행동 및 생화학적 상관관계에 대한 대표적인 데이터를 나타낸다. 처리군에 걸쳐, 로타로드에 대한 성능은 GluCer 축적과 음의 상관관계가 있었고(A, 선형 회귀에 의한 p=0.0012), GluSph 축적은 증가된 GCase 활성과 음의 상관관계가 있었다(B, 선형 회귀에 의한 p=0.0086).
도 14는 CBE 마우스 모델에서 변이체의 생체분포에 대한 대표적인 데이터를 나타낸다. 모든 처리군(부형제 + PBS n = 8, 변이체 + PBS n = 7, 부형제 + CBE n = 7, 및 변이체 + CBE n = 9)에 대해 간, 비장, 신장, 및 생식선에서 벡터 게놈의 존재를 평가하였다. 생체분포는 게놈 DNA 1㎍당 벡터 게놈으로 표시되어 있다. 벡터 참조 표준 곡선을 사용하여 정량적 PCR에 의해 벡터 게놈 존재를 정량화하고; A260 광학 밀도 측정에 의해 게놈 DNA 농도를 평가하였다. 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; **p<0.01; ***p<0.001, CBE-처리 동물에서 선형 회귀에 의한 처리군에 대한 공칭 p-값, 공변량으로서 수집일과 성별을 보정하였다.
도 15는 CBE 마우스 모델에서 rAAV 투약 범위의 생전 평가를 위한 대표적인 데이터를 나타낸다. 마우스는 ICV 전달에 의해 P3에 3.2e9 vg, 1.0e10 vg, 또는 3.2e10 vg 3가지 상이한 용량 중 하나의 rAAV-GBA1 또는 부형제를 받았다. P8에 25 ㎎/㎏ CBE의 매일의 IP 치료를 개시하였다. 부형제 및 CBE 또는 부형제 및 PBS를 받은 마우스를 대조군으로 사용하였다. 모든 치료 그룹은 그룹당 n = 10(5M/5F)으로 시작하였다. 최종 CBE 투약 1일 후에(P38 내지 P40) 모든 마우스를 희생시켰다. 모든 처리 그룹의 체중을 매일 측정하고, P36에 체중을 분석하였다. P24에 로타로드에서 떨어지기까지의 대기시간 및 P30에 테이퍼 빔(Tapered Beam)을 이동하는 대기시간에 의해 운동 성능을 평가하였다. 초기 치사율로 인해, 행동 분석에 참여하는 마우스의 수는 다음과 같았다: 부형제 + PBS n = 10, 부형제 + CBE n = 9, 및 3.2e9 vg rAAV-GBA1+ CBE n = 6, 1.0e10 vg rAAV-GBA1+ CBE n = 10, 3.2e10 vg rAAV-GBA1+ CBE n = 7. 평균이 제시되어 있다. 오차 막대는 SEM이고; CBE-처리 동물에서 선형 회귀에 의한 공칭 p-값에 대해 * p<0.05; **p<0.01이고, 공변량으로서 성별을 보정하였다.
도 16은 CBE 마우스 모델에서 rAAV 용량 범위의 생화학적 평가를 위한 대표적인 데이터를 나타낸다. 모든 처리군의 피질(부형제 + PBS n = 10, 부형제 + CBE n = 9, 및 3.2e9 vg rAAV-GBA1+ CBE n = 6, 1.0e10 vg rAAV-GBA1+ CBE n = 10, 3.2e10 vg rAAV-GBA1+ CBE n = 7)을 사용하여 GCase 활성, GluSph 수준, GluCer 수준, 및 벡터 게놈을 측정하였다. GCase 활성은 총 단백질의 ㎎당 GCase의 ng으로 표시되어 있다. GluSph 및 GluCer 수준은 조직의 습윤 중량 ㎎당 p㏖로 표시되어 있다. 생체분포는 게놈 DNA 1㎍당 벡터 게놈으로 표시되어 있다. 벡터 참조 표준 곡선을 사용하여 정량적 PCR에 의해 벡터 게놈 존재를 정량화하였고; A260 광학 밀도 측정에 의해 게놈 DNA 농도를 평가하였다. 벡터 게놈 존재를 또한 간에서 측정하였다(E). 평균이 제시되어 있다. 오차 막대는 SEM이다. CBE-처리군에서 선형 회귀에 의한 공칭 p-값에 대해 **p<0.01; ***p<0.001이고, 공변량으로서 성별을 보정하였다.
도 17은 유전자 마우스 모델에서 최대 용량 rAAV-GBA1에서 테이퍼 빔 분석에 대한 대표적인 데이터를 나타낸다. 처리군(WT + 부형제, n = 5), 4L/PS-NA + 부형제(n = 6), 및 4L/PS-NA + rAAV-GBA1(n = 5))의 운동 성능을 rAAV-GBA1 투여 4주 후 빔 워크(Beam Walk)에 의해 평가하였다. 총 미끄러짐 및 활성 시간은 상이한 빔에 대한 총 5회 시도로 표시되어 있다. 속도 및 속도당 미끄러짐은 상이한 빔에 대한 5회 시도의 평균으로 표시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다.
도 18은 프로그래뉼린(PGRN) 단백질을 인코딩하는 rAAV 작제물의 시험관내 발현에 대한 대표적인 데이터를 나타낸다. 좌측 패널은 프로그래뉼린(PGRN) ELISA 분석의 표준 곡선을 나타낸다. 하단 패널은 rAAV로 형질도입된 HEK293T 세포의 세포 용해물에서 ELISA 분석에 의해 측정된 PGRN 발현의 용량-반응을 나타낸다. MOI = 감염다중도(세포당 벡터 게놈).
도 19는 프로사포신(PSAP), SCARB2, 및/또는 하나 이상의 저해성 핵산과 조합된 GBA1을 인코딩하는 rAAV 작제물의 시험관내 발현에 대한 대표적인 데이터를 나타낸다. 데이터는 각각의 작제물을 이용한 HEK293 세포의 형질감염이 모의 형질감염된 세포에 비해 관심이 있는 이식유전자의 과발현을 초래하였음을 나타낸다.
도 20은 ITR의 "외부"(예컨대, 이식유전자 삽입체 또는 발현 작제물에 비해 ITR의 말단에 근접)에 위치한 "D" 영역을 포함하는 rAAV 벡터(상단) 및 벡터의 "내부"(예컨대, 벡터의 이식유전자 삽입체에 근접)에 ITR을 갖는 야생형 rAAV 벡터를 도시하는 개략도이다.
도 21은 GBA2 또는 이의 일부, 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 22는 Gcase(예컨대, GBA1 또는 이의 일부) 및 갈락토실세라미다제(예컨대, GALC 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 갈락토실세라미다제의 코딩 서열의 발현은 T2A 자가-절단 펩타이드 서열에 의해 분리된다.
도 23은 Gcase(예컨대, GBA1 또는 이의 일부) 및 갈락토실세라미다제(예컨대, GALC 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 갈락토실세라미다제의 코딩 서열의 발현은 T2A 자가-절단 펩타이드 서열에 의해 분리된다.
도 24는 Gcase(예컨대, GBA1 또는 이의 일부), 카텝신 B(예컨대, CTSB 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 카텝신 B의 코딩 서열의 발현은 T2A 자가-절단 펩타이드 서열에 의해 분리된다.
도 25는 Gcase(예컨대, GBA1 또는 이의 일부), 스핑고미엘린 포스포다이에스터라제 1(예컨대, SMPD1 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 26은 Gcase(예컨대, GBA1 또는 이의 일부) 및 갈락토실세라미다제(예컨대, GALC 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 갈락토실세라미다제의 코딩 서열은 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
도 27은 Gcase(예컨대, GBA1 또는 이의 일부) 및 카텝신 B(예컨대, CTSB 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 카텝신 B의 코딩 서열의 발현은 각각 별도의 프로모터에 의해 구동된다.
도 28은 Gcase(예컨대, GBA1 또는 이의 일부), GCH1(예컨대, GCH1 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 GCH1의 코딩 서열은 T2A 자가-절단 펩타이드 서열에 의해 분리된다.
도 29는 Gcase(예컨대, GBA1 또는 이의 일부), RAB7L1(예컨대, RAB7L1 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 RAB7L1의 코딩 서열은 T2A 자가-절단 펩타이드 서열에 의해 분리된다.
도 30은 Gcase(예컨대, GBA1 또는 이의 일부), GCH1(예컨대, GCH1 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 GCH1의 코딩 서열의 발현은 내부 리보솜 유입 부위(IRES)이다.
도 31은 VPS35(예컨대, VPS35 또는 이의 일부) 및 α-Syn 및 TMEM106B에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 32는 Gcase(예컨대, GBA1 또는 이의 일부), IL-34(예컨대, IL34 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 IL-34의 코딩 서열은 T2A 자가-절단 펩타이드 서열에 의해 분리된다.
도 33은 Gcase(예컨대, GBA1 또는 이의 일부) 및 IL-34(예컨대, IL34 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 IL-34의 코딩 서열은 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
도 34는 Gcase(예컨대, GBA1 또는 이의 일부) 및 TREM2(예컨대, TREM2 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 TREM2의 코딩 서열의 발현은 각각 별도의 프로모터에 의해 구동된다.
도 35는 Gcase(예컨대, GBA1 또는 이의 일부) 및 IL-34(예컨대, IL34 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. Gcase 및 IL-34의 코딩 서열의 발현은 각각 별도의 프로모터에 의해 구동된다.
도 36A 내지 도 36B는 qPCR 및 ELISA에 의해 측정된, 대조군 형질도입 세포에 비해 HEK293 세포에서 TREM2 및 GBA1의 과발현에 대한 대표적인 데이터를 나타낸다. 도 36A는 TREM2의 과발현에 대한 데이터를 나타낸다. 도 36B는 동일한 작제물 유래의 GBA1의 과발현에 대한 데이터를 나타낸다.
도 37은 GFP 리포터 분석(상단) 및 α-Syn 분석(하단)에 의한 시험관내 SNCA의 성공적인 침묵을 나타내는 대표적인 데이터를 나타낸다.
도 38은 GFP 리포터 분석(상단) 및 α-Syn 분석(하단)에 의한 시험관내 TMEM106B의 성공적인 침묵을 나타내는 대표적인 데이터를 나타낸다.
도 39는 PGRN을 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 40은 "D" 서열의 야생형(원) 또는 대안적(예컨대, "외부"; 사각형) 배치가 있는 ITR을 갖는 rAAV를 사용한 HEK293 세포의 형질도입에 대한 데이터를 나타낸다. "외부"에 배치된 ITR을 갖는 rAAV는 야생형 ITR을 갖는 rAAV만큼 효율적으로 세포를 형질도입할 수 있었다.
도 41은 Gcase(예컨대, GBA1 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 42는 Gcase(예컨대, GBA1 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 43은 Gcase(예컨대, GBA1 또는 이의 일부) 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 44는 PGRN을 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 45는 PGRN을 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 46은 PGRN 및 미세소관-연관 단백질 타우(MAPT)에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 47은 Gcase(예컨대, GBA1 또는 이의 일부) 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 48은 PSAP를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 49는 Gcase(예컨대, GBA1 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 50은 Gcase(예컨대, GBA1 또는 이의 일부) 및 갈락토실세라미다제(예컨대, GALC 또는 이의 일부)를 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다.
도 51은 Gcase(예컨대, GBA1 또는 이의 일부), 프로사포신(예컨대, PSAP 또는 이의 일부), 및 α-Syn에 대한 간섭 RNA를 인코딩하는 발현 작제물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 일 실시형태를 도시하는 개략도이다.
도 52A는 FTD-GRN 돌연변이가 있는 환자 유래의 iPSC-유래 신경 줄기 세포(NSC) 계통이 건강한 대조군 대상체로부터 유래한 NSC 계통보다 더 적은 프로그래뉼린을 분비함을 도시한다.쌍을 이루지 않는 t-검정(unpaired t-test)을 사용하여 통계를 결정하였다; * = p < 0.05, ** = p < 0.01, *** = p < 0.001. 데이터는 평균±SEM으로 제시되어 있다.
도 52B는 FTD-GRN 돌연변이 보인자 뉴런 배양물에서 용량-범위 PR006A 형질도입으로부터의 결과를 나타낸다. NSC를 동일한 밀도로 시딩하고 뉴런으로 분화시켰다. 제7일에, 뉴런을 부형제 또는 표시된 양의 PR006A로 72시간 동안 형질도입하였다. 분비된 프로그래뉼린 발현을 ELISA에 의해 세포 배지로부터 측정하고 부피에 대해 정규화하였다(n=3 내지 4; 평균±SEM). 검정 점선은 대조군 뉴런(부형제-처리)으로부터 분비된 프로그래뉼린의 내인성 수준을 나타낸다. 분비된 프로그래뉼린은 부형제-처리 FTD-GRN 뉴런에서 검출 가능하지 않았다. ANOVA, 그 다음 터키 HSD를 사용하여 통계를 결정하였고, 부형제-처리 대조군 뉴런에 대한 각각의 조건의 통계적 비교는 그래프에 표시되어 있다, * = p < 0.05, *** = p < 0.001. LLOQ = 정량화 하한; MOI = 감염다중도.
도 52C는 뉴런 배양물의 PR006 처리가 FTD-GRN 뉴런 배양물에서 주요 리소좀 프로테아제인 카텝신 D의 결함이 있는 성숙을 구제하였음을 나타낸다. NSC를 동일한 농도로 시딩하고 뉴런으로 분화시켰다. 제7일에, 뉴런을 부형제 또는 5.3×105 MOI의 PR006A로 72시간 동안 형질도입하였다. 뉴런을 용해시키고 항-카텝신 D(CTSD) 1차 항체를 이용하여 Protein Simple Western Jess 시스템에서 용해물을 분석하였다. 성숙한 카텝신 D(matCTSD) 및 프로-카텝신 D(proCTSD) 둘 다에 해당하는 밴드가 검출되었고, 곡선하 면적을 각각의 밴드에 대해 정량화하고 내부 총 단백질 정규화 신호에 대해 정규화하였다. 부형제 또는 PR006A 처리 FTD-GRN 뉴런에서 matCTSD/proCTSD 비율을 결정하였으며; y-축은 matCTSD/proCTSD 비율을 부형제-처리 대조군 뉴런 비율의 백분율로 도시한다(n=3; 평균±SEM). 대응표본 t-검정(paired t-test)을 사용하여 통계를 결정하였다, * = p < 0.05.
도 52D 및 도 52F는 PR006A가 FTD-GRN 뉴런 배양물에서 TDP-43 병리를 감소시킨다는 것을 나타낸다. NSC를 동일한 농도로 시딩하고 뉴런으로 분화시켰다. 제7일에, 뉴런을 부형제 또는 5.3×105 MOI의 PR006A로 형질도입하고 형질도입 21일 후에 수집하였다. 도 52D: 뉴런을 용해시키고, Triton-X 불용성 단백질 분획을 단리하고 항-TDP-43 항체(#12892-AP-1)를 이용하여 Protein Simple Western Jess 시스템에서 분석하였다. TDP-43에 해당하는 밴드를 검출하고, 곡선하 면적을 각각의 밴드에 대해 정량화하고 불용성 분획의 총 단백질 농도에 대해 정규화하였다. y-축은 불용성 TDP-43의 양을 각각의 FTD-GRN 세포주에 대해 개별적으로 정규화된 부형제 처리 수준의 백분율로 도시한다(n=3; 평균±SEM). 도 52D는 PR006 처리가 FTD-GRN 뉴런 배양물에서 FTD-GRN 병리의 특징인 불용성 TDP-43을 감소시켰음을 나타낸다. 도 52F: PR006A로 처리된 iPSC-유래 뉴런의 면역형광 이미지로부터 핵 TDP-43의 정량화. 부형제 또는 PR006A 처리 FTD-GRN 뉴런에서 핵당 TDP-43 신호 강도를 결정하였고; y-축은 핵당 TDP-43 신호 강도를 부형제 처리 대조군 뉴런의 핵당 TDP-43 신호 강도의 백분율로서 도시한다(n = 145 내지 306개 세포; 평균±SEM). 항-TDP-43 항체(#12892-AP-1)를 사용하여 TDP-43을 측정하고 DAPI 염색에 의해 핵 면적을 결정하였다. 도 52F는 PR006 처리가 FTD-GRN 뉴런 배양물에서 핵 TDP-43 발현 수준을 거의 야생형 대조군 수준으로 증가시켰음을 나타낸다. 쌍을 이루지 않는 t-검정을 사용하여 통계를 결정하였다, ** = p < 0.01, *** = p < 0.001.
도 52E는 FTD-GRN 돌연변이가 있는 환자로부터의 iPSC-유래 NSC 계통이 건강한 대조군 대상체로부터 유래한 NSC 계통보다 프로그래뉼린을 덜 발현함을 나타내는 도면. 쌍을 이루지 않는 t-검정을 사용하여 통계를 결정하였다, * = p < 0.05, ** = p < 0.01, *** = p < 0.001. 데이터는 평균±SEM으로 제시되어 있다.
도 52G는 인간 FTD-GRN 유래의 신경 줄기 세포(NSC) 계통 및 인간 대조군 세포주가 뉴런 배양물로 성공적으로 분화되었음을 나타내는 일련의 이미지이다. 대조군 및 FTD-GRN NSC 계통(FTD-GRN #1 및 FTD-GRN #2)은, 뉴런 마커(NeuN[적색]; 좌측에 표지된 바와 같은 MAP2 또는 Tau[녹색])에 대한 세포 형태 및 면역형광 염색에 의해 표시된 바와 같이, 7일의 기간 후에 뉴런으로 분화되었다. DAPI(청색)를 사용하여 핵을 염색하였다.
도 53A 내지 도 53C는 성체 용량-범위 PR006A FTD-GRN 마우스 모델 연구에서 CNS에서 생체분포 및 프로그래뉼린 발현을 분석하는 실험 결과를 도시하는 일련의 막대 그래프이다. 4개월령 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여에 의해 제공하였다. 이들을 CNS에서 생화학적 종점에 대해 부형제(적색) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g)(청색)의 용량으로 PR006A를 이용하여 처리하고 3개월 후에 희생시켰다. 도 53A: 벡터 게놈의 존재를 대뇌 피질 및 척수에서 평가하였고, 생체분포는 로그 척도로 gDNA의 ㎍당 벡터 게놈으로 표시되어 있다(n=8 내지 10/그룹, 평균±SEM). 벡터 참조 표준 곡선을 사용하여 qPCR에 의해 벡터 게놈 존재를 정량화하였다. 점선(50개 벡터 게놈/gDNA ㎍)은 양성 벡터 존재에 대한 임계값을 표시한다. 도 53B: 대뇌 피질에서 정량적 RT-PCR(qRT-PCR)에 의해 PR006A-인코딩된 GRN RNA 발현을 평가하였다(n=8 내지 10/그룹; 평균±SEM). (본 발명자들의 코돈 최적화된 PR006A 서열에 특이적인) GRN 복제물의 수를 1㎍의 총 RNA에 대해 정규화하고 로그 척도로 나타내었다. 도 53C: 뇌 및 척수에서 인간-특이적 프로그래뉼린 ELISA를 사용하여 프로그래뉼린 단백질 수준을 측정하였다(n=8 내지 10/그룹; 평균±SEM). 조직 프로그래뉼린 수준을 총 단백질 농도에 대해 정규화하였다. 정량화 하한(LLOQ)은 회색 점선으로 표시되어 있다. 조직 ELISA 분석의 경우, 분석 LLOQ(ng/㎖)를 모든 샘플로부터의 총 단백질 농도 평균으로 나눔으로써 LLOQ(ng/㎎) 값을 결정한다. 오차 막대가 없는 x-축 상의 처리군 범례 색상에 해당하는 간결한 선은 해당 그룹의 모든 동물이 0임을 나타낸다. ANOVA, 그 다음 던넷 검정(Dunnett's test)을 사용하여 통계 분석을 수행하여 부형제 처리 Grn KO 마우스 그룹과 비교하였다; * = p < 0.05, ** = p < 0.01, *** = p < 0.001. vg = 벡터 게놈; LLOQ = 정량화 하한; SC = 척수.
도 53D 내지 도 53E는 성체 용량-범위 PR006A FTD-GRN 마우스 모델 연구에서 말초 조직 생체분포 및 프로그래뉼린 발현을 분석하는 실험 결과를 도시하는 일련의 막대 그래프이다. 4개월령 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여에 의해 제공하였다. 이들을 간, 심장, 폐, 신장, 비장, 및 생식선에서 생화학적 종점에 대해 부형제(적색) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g)(청색)의 용량으로 PR006A를 이용하여 처리하고 3개월 후에 희생시켰다. 도 53D: 벡터 게놈의 존재를 평가하였고, 생체분포는 로그 척도로 gDNA의 ㎍당 벡터 게놈으로 표시되어 있다(n=8 내지 10/그룹, 평균±SEM). 벡터 참조 표준 곡선을 사용하여 qPCR에 의해 벡터 게놈 존재를 정량화하였다. 점선(50개 벡터 게놈/gDNA ㎍)은 양성 벡터 존재에 대한 임계값을 표시한다. 도 53E: ELISA를 사용하여 프로그래뉼린 단백질 수준을 측정하였다(n=8 내지 10/그룹; 평균±SEM). 조직 프로그래뉼린 수준을 총 단백질 농도에 대해 정규화하였다. 오차 막대가 없는 x-축 상의 처리군 범례 색상에 해당하는 간결한 선은 해당 그룹의 모든 동물이 0임을 나타낸다. ANOVA, 그 다음 던넷 검정을 사용하여 통계 분석을 수행하여 부형제 처리 Grn KO 마우스 그룹과 비교하였다; * = p < 0.05, *** = p < 0.001. vg = 벡터 게놈.
도 53F는 성체 용량-범위 PR006A FTD-GRN 마우스 모델 연구에서 혈장에서 프로그래뉼린 수준을 분석하는 실험 결과를 도시하는 막대 그래프이다. 4개월령 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여에 의해 제공하였다. 이들을 혈장에서 생화학적 종점에 대해 부형제(적색) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g)(청색)의 용량으로 PR006A를 이용하여 처리하고 3개월 후에 분석을 위해 희생시켰다. 혈장에서 인간-특이적 프로그래뉼린 ELISA를 사용하여 프로그래뉼린 단백질 수준을 측정하였다(n=8 내지 10/그룹; 평균±SEM). 혈장 수준이 로그 척도로 표시되어 있다. 정량화 하한(LLOQ)은 회색 점선으로 표시되어 있다. ANOVA, 그 다음 던넷 검정을 사용하여 통계 분석을 수행하여 부형제 처리 Grn KO 마우스 그룹과 비교하였다; * = p < 0.05, ** = p < 0.01, *** = p < 0.001. LLOQ = 정량화 하한. vg = 벡터 게놈.
도 53G 내지 도 53H는 성체 용량-범위 PR006A FTD-GRN 성체 마우스 모델 연구에서 감소된 리소좀 및 신경병리학적 결함을 나타내는 실험 결과를 도시하는 일련의 막대 그래프이다. 4개월령 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여에 의해 제공하였다. 이들을 부형제(적색) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g)(청색)의 용량으로 PR006A를 이용하여 처리하고 3개월 후에 분석을 위해 희생시켰다. 리포푸신증을, (1) 병리학자에 의한 H&E-염색 뇌 절편의 채점, 및 (2) IHC 절편으로부터 리포푸신 자가형광의 정량화의 2가지 독립적인 방법에 의해 분석하였다. 도 53G: 리포푸신 축적(자가형광 리포푸신 과립)을 다음 등급 체계에 따라 맹검 공인 병리학자에 의해 상이한 뇌 영역의 H&E-염색 절편에서 반-정량적으로 채점하였다: 0 = 관찰된 리포푸신이 없음; 1 = 매우 소량의 리포푸신 과립(2㎛ 미만)이 영역 전반에 걸쳐 산재되어 있음; 2 = 작은 과립 축적의 밀도 증가, 및/또는 더 큰 과립의 발달(2 내지 3㎛ 초과); 3 = 저출력 대물렌즈에서 볼 수 있는 고밀도 리포푸신 과립이 있는 다초점 영역; 4 = 광범위한 리포푸신 축적. 대뇌 피질, 해마, 및 시상/시상하부 뇌 영역에서 리포푸신 중증도 점수가 표시되어 있다(n=8 내지 10/그룹). 도 53H: 대뇌 피질, 해마, 및 시상에서 유비퀴틴의 IHC 분석을 수행하고 정량화하였다. 역치 이상의 면역반응 개체의 크기(면역반응 개체 크기[㎛2])가 유비퀴틴에 대해 표시되어 있다(n=8 내지 10/그룹; 평균±SEM). ANOVA, 그 다음 던넷 검정에 의해 통계를 결정하여 부형제 처리 Grn KO 마우스 그룹과 비교하였다; * = p < 0.05, ** = p < 0.01, *** = p < 0.001. vg = 벡터 게놈; WT = 야생형.
도 53I 내지 도 53K는 성체 용량-범위 PR006A FTD-GRN 마우스 모델 연구에서 감소된 신경염증 마커를 나타내는 실험 결과를 도시하는 일련의 막대 그래프이다. 4개월령 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여에 의해 제공하였다. 이들을 부형제(적색) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g)(청색)의 용량으로 PR006A를 이용하여 처리하고 3개월 후에 분석을 위해 희생시켰다. 도 53I: Tnf Cd68의 유전자 발현(mRNA 수준)을 체성감각 피질에서 qRT-PCR에 의해 측정하였다(평균±SEM; n=8 내지 10/그룹). 유전자 발현을 하우스키핑 유전자인 Ppib에 대해 정규화하였다. 도 53J 내지 도 53K: Iba1(도 53J) 및 GFAP(도 53K)의 IHC 분석을 수행하고 대뇌 피질, 해마, 및 시상의 고정된 뇌 절편에서 정량화하였다. 역치 이상의 개체에 의해 덮인 관심이 있는 영역의 백분율(면역반응 영역[%])이 표시되어 있다(평균±SEM; n=8 내지 10/그룹). ANOVA를 던넷 조정과 함께 사용하여 통계를 결정하여 각각의 그룹을 부형제 처리 Grn KO 마우스 그룹과 비교하였다; * = p < 0.05, *** = p < 0.001. vg = 벡터 게놈; WT = 야생형.
도 53L 내지 도 53N은 성체 용량-범위 PR006A FTD-GRN 마우스 모델 연구에서 리소좀 및 면역 경로의 감소된 유전자 발현을 나타내는 실험 결과를 도시하는 일련의 막대 그래프이다. 4개월령 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여에 의해 제공하였다. 이들을 부형제(적색) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g)(청색)의 용량으로 PR006A를 이용하여 처리하고 3개월 후에 분석을 위해 희생시켰다. ICV-처리 Grn KO 마우스 유래 및 연령을 일치시킨 WT C57BL/6J 마우스(회색)의 대뇌 피질 샘플에서 RNA 서열결정을 수행하였다. 유전자 세트 변이 분석(Gene Set Variation Analysis; GSVA) 방법론을 사용하여 부형제 처리 Grn KO 마우스에서 조절되지 않는 이전에 공개된 유전자 특징의 mRNA 발현 수준을 WT 마우스와 비교하였다. 나타낸 데이터는 2개의 공개된 연구 및 1개의 홀마크(HALLMARK) 경로 유래로부터 선별된 유전자 세트에 대한 GSVA 활성 점수이다. 도 53L: 세포 구성성분: 액포(GO:0005773), 도 53M: 리소좀, 및 도 53N: 보체 시스템(홀마크 경로)(중앙값±범위; n=8 내지 10/그룹). ANOVA, 그 다음 던넷 검정을 사용하여 통계 분석을 수행하여 집단별 오류율 I형(family-wise Type I error rate)에 대해 제어하면서 부형제 처리 Grn KO 마우스 그룹과 비교하였다, *** = p < 0.001. GSVA= 유전자 세트 변이 분석; vg = 벡터 게놈; WT = 야생형.
도 54A는 qPCR에 의해 정량화된 PR006A 이식유전자의 생체분포를 분석하는 실험 결과를 도시하는 일련의 막대 그래프이다. 부형제, 저용량의 PR006A(6.5×109개 vg/뇌 g), 또는 고용량의 PR006A(6.5×1010 vg/뇌 g)를 ICM 주사하고 182일 후에 NHP에서 qPCR 방법론을 사용하여 이식유전자 수준을 분석하였다. 각각의 막대는 그룹당 3마리 동물의 평균±SEM을 나타내고; 황색 선은 50개 vg/㎍ DNA에서 정량화 하한을 나타낸다.
도 54B는 인간 프로그래뉼린에 대한 항-약물 항체의 수준을 분석하는 실험 결과를 도시하는 일련의 막대 그래프이다. 부형제, 저용량의 PR006A(6.5×109개 vg/뇌 g), 또는 고용량의 PR006A(6.5×1010 vg/뇌 g)로 처리한 후 제29일 및 제182일에 NHP 혈청 및 CSF 샘플에서 프로그래뉼린에 대한 항체. 데이터는 평균±SEM을 나타낸다.
도 54C는 PR006A 이식유전자(GRN)의 발현을 분석하는 실험 결과를 도시하는 일련의 막대 그래프이다. RT-qPCR을 사용하여 제183일에 수집한 NHP 피질, 해마 및 복부 중뇌(ventral mesencephalon)에서 GRN 발현 수준을 결정하였다. 데이터는 평균±SEM으로 제시되어 있다.
도 54D는 Simple Western™(Jess) 플랫폼에 의해 정량화된 CSF의 프로그래뉼린을 분석한 실험 결과를 도시하는 막대 그래프이다. 제183일에 수집한 NHP CSF 샘플에서 프로그래뉼린 수준을 결정하였으며, Simple Western™(Jess) 분석에 의해 결정하였다. NHP 유래의 CSF 샘플을 부형제, 저용량의 PR006A(6.5×109개 vg/뇌 중량 g) 또는 고용량의 PR006A(6.5×1010개 vg/뇌 중량 gt)로 처리하였다. 제시된 데이터는 평균±SEM이다; P-값: *p<0.05, 윌리엄 경향 검정(William's trend test)을 사용하는 일원 용량 의존 반응 분석(one-way dose dependence response analysis)에 의함.
도 55는 자동화된 Western Jess 분석에 대한 선택성 및 특이성 결과를 나타내는 그래프이다. FTD 환자 CSF 샘플의 프로그래뉼린 단백질 수준을 Jess에 의해 58 kDa에서 검출하였다. 그룹 (A): 이형접합 FTD 환자, 그룹 (B) 및 (C): 가족성 비-보인자 또는 정상 개체. 데이터는 평균±평균의 표준오차(SEM)로 제시되어 있다. SEM 값은 수직 오차 막대로 표시되어 있다.
도 56은 ELISA에 의해 검출된 FTD 환자 CSF 샘플에서 프로그래뉼린 수준을 나타내는 그래프이다. 그룹 (A): 이형접합 FTD 환자, 그룹 (B) 및 (C): 가족성 비-보인자 또는 정상 개체. 데이터는 평균±평균의 표준오차(SEM)로 제시되어 있다. SEM 값은 수직 오차 막대로 표시되어 있다.
도 57은 Jess의 자동화된 Western 플랫폼에서 이중으로 실행된 각각의 CSF 샘플의 겔 이미지. 1차 항체인 Adipogen PG-359-7을 사용하여 4배 희석으로 샘플을 분석하였다. 첫 번째 레인은 분자량 표준물이고, 오른쪽에는 실시예 14에 기록된 면역반응성을 계산하는 데 사용된 밴드 식별이 있다.
도 58A 내지 도 58B는 인간 PGRN 발현 수준의 측정을 나타내는 일련의 플롯. Simple Western™(Jess) 분석을 사용하여, 제180일에 수집한 비-인간 영장류(NHP) CSF 샘플에서 인간 PGRN 발현 수준을 결정하였다. 부형제("부형제"), 저용량의 PR006A(6.5×109개 vg/뇌 중량 g; "저") 또는 고용량의 PR006(6.5×1010개 vg/뇌 중량 g; "고")로 처리한 NHP 유래의 CSF를 분석하였다. 데이터는 평균 면역반응성 피크 면적(도 58A), 또는 부형제-처리 동물에 대한 배수 변화(도 58B)로 표현되어 있다. 각각의 점은 하나의 NHP 유래의 단일 CSF 샘플(기술적 복제물의 평균)을 나타내고 상자는 3개의 개별적인 NHP의 평균 값 +/- 표준 오차를 나타낸다.
도 59A 내지 도 59C는 PR006A 처리 후 노화된 FTD-GRN 마우스 모델의 CNS에서 생체분포 및 프로그래뉼린 발현을 분석하는 실험 결과를 도시하는 일련의 막대 그래프이다. 부형제(적색) 또는 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 PR006A(청색)를 ICV로 받고 2개월 후 18개월령 Grn KO 마우스로부터 조직 샘플을 수집하였다. 도 59A: 대뇌 피질 및 척수에서 벡터 게놈의 존재를 평가하였다(평균±SEM; n=4/그룹). 생체분포는 로그 척도로 gDNA 1㎍당 벡터 게놈으로 표시되어 있다. 벡터 참조 표준 곡선을 사용하여 qPCR에 의해 벡터 게놈 존재를 정량화하였다. 점선(50개 벡터 게놈/gDNA ㎍)은 양성 벡터 존재에 대한 임계값을 표시한다. 도 59B 내지 도 59C: CNS 조직(뇌 및 척수(도 59B)), 및 CSF(도 59C)에서 ELISA를 사용하여 프로그래뉼린 단백질 수준을 측정하였다(평균±SEM; n=4/그룹). 조직 프로그래뉼린 수준을 총 단백질 농도에 대해 정규화하고, 프로그래뉼린의 CSF 수준을 유체 부피에 대해 정규화하였다. 정량화 하한(LLOQ)은 회색 점선으로 표시되어 있다. 조직 ELISA 분석의 경우, 분석 LLOQ(ng/㎖)를 모든 샘플로부터의 총 단백질 농도 평균으로 나눔으로써 LLOQ(ng/㎎) 값을 결정하였다. 오차 막대가 없는 x-축 상의 간결한 적색 선은 해당 그룹의 모든 동물이 0임을 나타낸다. Kruskal-Wallis를 사용하여 통계 분석을 수행하였다; * = p < 0.05, ** = p < 0.01, *** = p < 0.001. vg = 벡터 게놈; LLOQ = 정량화 하한; SC = 척수.
도 59D 내지 도 59E는 PR006A 처리 후 노화된 FTD-GRN 마우스 모델에서 감소된 리소좀 및 신경병리학적 결함을 나타내는 실험 결과를 도시하는 일련의 막대 그래프 및 이미지. 부형제(적색) 또는 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 PR006A(청색)를 ICV로 받고 2개월 후 18개월령 Grn KO 마우스로부터 조직 샘플을 수집하였다. 리포푸신증을 병리학자에 의한 H&E-염색 뇌 절편의 채점에 의해 분석하였다. 도 59D: 뇌 절편의 시상/시상하부로부터의 대표적인 리포푸신 이미지. 백색 화살촉은 리포푸신 축적의 예를 나타낸다. 자가형광 리포포신 과립에 대해 평가한 뇌 절편으로부터의 H&E-염색 슬라이드의 대뇌 피질, 해마, 및 시상/시상하부의 리포푸신 중증도 점수의 요약이 제공되어 있다. 리포푸신 축적을 다음 등급 체계에 따라 맹검 공인 병리학자에 의해 반-정량적으로 채점하였다: 0 = 관찰된 리포푸신이 없음; 1 = 매우 소량의 리포푸신 과립(2㎛ 미만)이 영역 전반에 걸쳐 산재되어 있음; 2 = 작은 과립 축적의 밀도 증가, 및/또는 더 큰 과립의 발달(2 내지 3㎛ 초과); 3 = 저출력 대물렌즈에서 볼 수 있는 고밀도 리포푸신 과립이 있는 다초점 영역; 4 = 광범위한 리포푸신 축적. 도 59E: 대뇌 피질, 해마, 및 시상에서 유비퀴틴의 IHC 분석(n=4/그룹)을 수행하고 정량화하였다. 각각의 영역에 대한 양성 세포 밀도(세포/㎟)가 표시되어 있다(평균±SEM). t-검정을 사용하여 통계를 결정하였다. * = p < 0.05, ** = p < 0.01. vg = 벡터 게놈.
도 59F 내지 도 59I는 PR006A 처리 후 노화된 FTD-GRN 마우스 모델에서 감소된 신경염증 마커를 나타내는 실험 결과를 도시하는 일련의 막대 그래프이다. 부형제(적색) 또는 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 PR006A(청색)를 ICV로 받고 2개월 후 18개월령 Grn KO 마우스로부터 조직 샘플을 수집하였다. 도 59F: Tnf Cd68의 유전자 발현을 체성감각 피질에서 qRT-PCR에 의해 측정하였다(평균±SEM; n=4/그룹). 유전자 발현을 하우스키핑 유전자인 Ppib에 대해 정규화하였다. (도 59G) 전염증성 사이토카인 TNFα의 단백질 발현을 Mesoscale Discovery 마우스 전염증성 사이토카인 분석을 사용하여 대뇌 피질에서 측정하였다(평균±SEM; n=4/그룹). 대뇌 피질을 균질화하고, 조직 용해물의 총 단백질 농도에 대해 단백질 발현 수준을 정규화하였다. 도 59H 내지 도 59I: 고정된 뇌 절편에서 Iba1(도 59H) 및 GFAP(도 59I)의 IHC 분석을 수행하고 정량화하였다. 분석된 3개의 뇌 영역(대뇌 피질, 해마, 및 시상)으로부터 양성 세포 밀도(세포수/㎟)의 편집이 표시되어 있다(평균±SEM; n=3 내지 4/그룹). t-검정을 사용하여 통계 분석을 수행하였다. * = p < 0.05. vg = 벡터 게놈.
도 60은 PR006A로 형질도입된 HEK293T 세포의 용량-반응 곡선을 도시하는 그래프(n=2; 평균±SEM). 동일한 수의 세포를 다양한 양의 PR006A로 형질도입하였다. 72시간 후, ELISA 분석을 사용하여 세포 배지에서 프로그래뉼린 단백질 수준을 측정하였다.
도 61은 노화된 FTD-GRN 마우스 모델에서 최대 용량 PR006A에 대한 연구 설계의 다이어그램. 10㎕ 부형제(대조군) 또는 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 용량의 PR006A를 Grn KO 마우스의 2개 코호트에 ICV 주사에 의해 전달하였다: (1) 주사 시점에서 16개월령(n=4 내지 5/그룹; PRV-2018-027) 및 (2) 주사 시점에서 14개월령(n=1/부형제-처리 그룹; n=3/PR006A-처리 그룹; PRV-2019-002). 주사하고 2개월 후에 동물을 희생시켰다. CNS 및 말초 조직을 수집하여 PR006A 생체분포(qPCR), 프로그래뉼린 단백질 발현(ELISA), 및 조직병리학(H&E)을 분석하였다. 전염증성 마커의 발현, 리포푸신 축적, 및 유비퀴틴 축적을 뇌에서 평가하였다.
도 62A 내지 도 62B는 PR006A 처리 후 노화된 FTD-GRN 마우스 모델에서 말초 조직 생체분포 및 프로그래뉼린 발현에 대한 결과를 나타내는 막대 그래프이다. 부형제(적색) 또는 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 PR006A(청색)를 ICV로 받고 2개월 후 18개월령 Grn KO 마우스로부터 조직 샘플을 수집하였다. 도 62A: 간, 심장, 폐, 신장, 비장, 및 생식선에서 벡터 게놈의 존재를 평가하였다(평균±SEM; n=4/그룹). 생체분포는 로그 척도로 gDNA ㎍당 벡터 게놈으로 표시되어 있다. 벡터 참조 표준물을 사용하여 qPCR에 의해 벡터 게놈 존재를 정량화하였다. 도 62B: ELISA를 사용하여 프로그래뉼린 단백질 수준을 측정하였다(평균±SEM; n=4/그룹). 조직 프로그래뉼린 수준을 총 단백질 농도에 대해 정규화하였다. 오차 막대가 없는 x-축 상의 간결한 적색 선은 해당 그룹의 모든 동물이 0임을 나타낸다. Kruskal-Wallis를 사용하여 통계 분석을 수행하였다; * = p < 0.05, ** = p < 0.01, *** = p < 0.001. vg = 벡터 게놈.
도 63은 성체 FTD-GRN 마우스 모델에서 PR006A의 용량 범위에 대한 연구 설계의 다이어그램. 10㎕ 부형제(대조군) 또는 1.1×109개 vg(2.7×109개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g), 또는 1.1×1011개 vg(2.7×1011개 vg/뇌 g) PR006A의 용량의 PR006A를 4개월령 Grn KO 마우스에 ICV 주사에 의해 전달하였다(n=10/그룹). 주사하고 3개월 후에 마우스가 7개월령이 되었을 때 동물을 희생시켰다. CNS 및 말초 조직을 수집하여 PR006A 생체분포(qPCR), 프로그래뉼린 단백질 발현(ELISA), 및 조직병리학(H&E)을 분석하였다. 전염증성 마커의 발현, 리포푸신 축적, 유비퀴틴 축적, 및 전반적인 유전자 발현 변화 발현을 뇌에서 평가하였다.
도 64는 인간 프로그래뉼린을 인코딩하는 발현 작제물을 포함하는 재조합 아데노-연관 바이러스 벡터(PR006A)의 일 실시형태를 도시하는 개략도이다. "bp"는 "염기상"을 지칭한다. "kan"은 카나마이신에 대한 내성을 부여하는 유전자를 지칭한다. "GRN"은 "프로그래뉼린"을 지칭한다. "ITR"은 아데노-연관 바이러스 반전 말단 반복부 서열을 지칭한다. "TRY"는 3개의 전사 조절 활성화 부위, 즉, TATA, RBS, 및 YY1을 포함하는 서열을 지칭한다. "CBAp"는 닭 β-액틴 프로모터를 지칭한다. "CMVe"는 거대세포바이러스 인핸서를 지칭한다. "WPRE"는 우드척 간염 바이러스 전사후 조절 요소를 지칭한다. "bGH"는 소 성장 호르몬 폴리A 신호 꼬리를 지칭한다. "int"는 인트론을 지칭한다. PR006A의 2개 가닥의 뉴클레오타이드 서열은 서열번호 90 및 91에 제공되어 있다.
본 개시내용은 부분적으로 대상체에서 특정 유전자 산물(예컨대, CNS 질환과 연관된 유전자 산물)의 조합물의 발현을 위한 조성물 및 방법을 기반으로 한다. 유전자 산물은 단백질, 단백질의 단편(예컨대, 일부), CNS 질환-연관 유전자를 저해하는 간섭 핵산 등일 수 있다. 일부 실시형태에서, 유전자 산물은 CNS 질환-연관 유전자에 의해 인코딩되는 단백질 또는 단백질 단편이다. 일부 실시형태에서, 유전자 산물은 CNS 질환-연관 유전자를 저해하는 간섭 핵산(예컨대, shRNA, siRNA, miRNA, amiRNA 등)이다.
CNS 질환-연관 유전자는 CNS 질환, 예컨대, FTD(전두측두엽 치매) 또는 PD(파킨슨병)와 유전적으로, 생화학적으로 또는 기능적으로 연관된 유전자 산물을 인코딩하는 유전자를 지칭한다. 예를 들어, GRN 유전자(PGRN 단백질을 인코딩함)에 병원성 돌연변이를 가진 개체는 GRN에 돌연변이를 가지지 않는 개체와 비교하여 FTD가 발병할 위험이 증가한다. 유사하게, GBA1 유전자(Gcase 단백질을 인코딩함)에 돌연변이를 가진 개체는 GBA1에 돌연변이를 가지지 않는 개체와 비교하여 PD가 발병할 위험이 증가된 것으로 관찰되었다. 또 다른 예에서, PD는 α-시누클레인(α-Syn) 단백질을 포함하는 단백질 응집체의 축적과 연관되며; 따라서, SNCA(α-Syn을 인코딩함)는 PD-연관 유전자이다. 일부 실시형태에서, 본 명세서에 기재된 발현 카세트는 CNS 질환-연관 유전자(또는 이의 코딩 서열)의 야생형 또는 비-돌연변이 형태를 인코딩한다. CNS 질환-연관 유전자의 예는 표 1에 열거되어 있다.
Figure pct00001
Figure pct00002
고셔병 환자(GBA1 유전자의 염색체 대립유전자 둘 다에 돌연변이를 가짐)에 추가적으로, GBA1의 대립유전자 하나에만 돌연변이가 있는 환자는 파킨슨병(PD)의 위험이 매우 증가한다. 보행 곤란, 휴식 중 떨림, 경직, 및 종종 우울증, 수면 곤란, 및 인지 저하를 포함하는 PD 증상의 중증도는 효소 활성 감소의 정도와 상관관계가 있다. 따라서, 고셔병 환자는 가장 심각한 경과를 가지는 반면, GBA1에 경미한 단일 돌연변이가 있는 환자는 전형적으로 더 양성인 경과를 가진다. 돌연변이 보인자는 또한, 실행 기능 장애, 정신증, 및 PD-유사 운동 장애를 특징으로 하는 루이소체 치매를 포함한 다른 PD-관련 장애, 및 특징적인 운동 및 인지 장애를 동반하는 다계통 위축의 위험이 높다. 이러한 장애의 냉혹한 경과를 변경하는 치료법은 존재하지 않는다.
Gcase(예컨대, GBA1 유전자의 유전자 산물)와 같은 효소의 결핍뿐만 아니라, 리소좀 기능 또는 리소좀으로의 거대분자의 수송과 관련된 많은 유전자(예컨대, 리소좀 막 단백질 1(LIMP), 또한 SCARB2로 지칭됨)의 공통적인 변이체는 PD 위험 및/또는 고셔병(예컨대, 신경병증 고셔병, 예컨대, 2형 고셔병 또는 3형 고셔병) 위험의 증가와 연관이 있었다. 본 개시내용은 부분적으로 중추신경계(CNS) 질환, 예를 들어 고셔병, PD 등과 연관된 하나 이상의 유전자, 예를 들어 Gcase, GBA2, 프로사포신, 프로그래뉼린(PGRN), LIMP2, GALC, CTSB, SMPD1, GCH1, RAB7, VPS35, IL-34, TREM2, TMEM106B, 또는 상기한 것 중 임의의 것의 조합물(또는 이들의 일부)을 인코딩하는 발현 작제물(예컨대, 벡터)을 기반으로 한다. 일부 실시형태에서, 본 명세서에 기재된 유전자 산물의 조합물은 함께(예컨대, 상승적으로) 작용하여 대상체에서 발현될 때 CNS 질환의 하나 이상의 징후 및 증상을 감소시킨다.
따라서, 일부 양상에서, 본 개시내용은 Gcase(예컨대, GBA1 유전자의 산물)를 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) Gcase-인코딩 서열을 포함한다. 일부 실시형태에서, Gcase를 인코딩하는 핵산 서열은 서열번호 14에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_000148.2에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 15에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 Gcase 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 프로사포신(예컨대, PSAP 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) 프로사포신-인코딩 서열을 포함한다. 일부 실시형태에서, 프로사포신을 인코딩하는 핵산 서열은 서열번호 16에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_002769.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 17에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 프로사포신 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 LIMP2/SCARB2(예컨대, SCARB2 유전자의 유전자 산물)를 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) SCARB2-인코딩 서열을 포함한다. 일부 실시형태에서, LIMP2/SCARB2를 인코딩하는 핵산 서열은 서열번호 18에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_005497.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 29에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 SCARB2 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 GBA2 단백질(예컨대, GBA2 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) GBA2-인코딩 서열을 포함한다. 일부 실시형태에서, GBA2를 인코딩하는 핵산 서열은 서열번호 30에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_065995.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 31에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 GBA2 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 GALC 단백질(예컨대, GALC 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) GALC-인코딩 서열을 포함한다. 일부 실시형태에서, GALC를 인코딩하는 핵산 서열은 서열번호 33에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_000144.2에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 34에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 GALC 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 CTSB 단백질(예컨대, CTSB 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) CTSB-인코딩 서열을 포함한다. 일부 실시형태에서, CTSB를 인코딩하는 핵산 서열은 서열번호 35에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_001899.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 36에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 CTSB 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 SMPD1 단백질(예컨대, SMPD1 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) SMPD1-인코딩 서열을 포함한다. 일부 실시형태에서, SMPD1을 인코딩하는 핵산 서열은 서열번호 37에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_000534.3에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 38에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 SMPD1 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 GCH1 단백질(예컨대, GCH1 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) GCH1-인코딩 서열을 포함한다. 일부 실시형태에서, GCH1을 인코딩하는 핵산 서열은 서열번호 45에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_000534.3에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 46에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 GCH1 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 RAB7L 단백질(예컨대, RAB7L 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) RAB7L-인코딩 서열을 포함한다. 일부 실시형태에서, RAB7L을 인코딩하는 핵산 서열은 서열번호 47에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_003920.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 48에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 RAB7L 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 VPS35 단백질(예컨대, VPS35 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) VPS35-인코딩 서열을 포함한다. 일부 실시형태에서, VPS35를 인코딩하는 핵산 서열은 서열번호 49에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_060676.2에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 50에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 VPS35 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 IL-34 단백질(예컨대, IL34 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) IL-34-인코딩 서열을 포함한다. 일부 실시형태에서, IL-34를 인코딩하는 핵산 서열은 서열번호 55에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_689669.2에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 56에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 IL-34 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 TREM2 단백질(예컨대, TREM 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) TREM2-인코딩 서열을 포함한다. 일부 실시형태에서, TREM2를 인코딩하는 핵산 서열은 서열번호 57에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_061838.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 58에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 TREM2 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 TMEM106B 단백질(예컨대, TMEM106B 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) TMEM106B-인코딩 서열을 포함한다. 일부 실시형태에서, TMEM106B를 인코딩하는 핵산 서열은 서열번호 63에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_060844.2에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 64에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 TMEM106B 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 프로그래뉼린(예컨대, PGRN 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) 프로사포신-인코딩 서열을 포함한다. 일부 실시형태에서, 프로그래뉼린(PGRN)을 인코딩하는 핵산 서열은 서열번호 67에 제시된 바와 같은(예컨대, NCBI 참조 서열 NP_002078.1에 제시된 바와 같은) 아미노산 서열을 포함하는 단백질을 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 68에 제시된 서열을 포함한다. 일부 실시형태에서, 발현 작제물은 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR), 예를 들어 프로사포신 단백질을 인코딩하는 핵산 서열에 측접하는 AAV ITR을 포함한다.
일부 양상에서, 본 개시내용은 제1 유전자 산물 및 제2 유전자 산물을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공하며, 여기서 각각의 유전자 산물은 독립적으로 표 1에 제시된 유전자 산물, 또는 이들의 일부로부터 선택된다.
일부 실시형태에서, 제1 유전자 산물 또는 제2 유전자 산물은 Gcase 단백질, 또는 이의 일부이다. 일부 실시형태에서, 제1 유전자 산물은 Gcase 단백질이고 제2 유전자 산물은 GBA2, 프로사포신, 프로그래뉼린, LIMP2, GALC, CTSB, SMPD1, GCH1, RAB7, VPS35, IL-34, TREM2, 및 TMEM106B로부터 선택된다.
일부 실시형태에서, 발현 작제물은 (예컨대, 단독으로 또는 또 다른 유전자 산물에 추가적으로) 간섭 핵산(예컨대, shRNA, miRNA, dsRNA 등)을 인코딩한다. 일부 실시형태에서, 간섭 핵산은 α-시누클레인(α-Synuclein)의 발현을 저해한다. 일부 실시형태에서, α-시누클레인을 표적화하는 간섭 핵산은 서열번호 20 내지 25 중 어느 하나에 제시된 서열을 포함한다. 일부 실시형태에서, α-시누클레인을 표적화하는 간섭 핵산은 서열번호 20 내지 25 중 어느 하나에 제시된 서열에 결합한다(예컨대, 상기 서열과 혼성화함).
일부 실시형태에서, 간섭 핵산은 TMEM106B의 발현을 저해한다. 일부 실시형태에서, TMEM106B를 표적화하는 간섭 핵산은 서열번호 64 또는 65에 제시된 서열을 포함한다. 일부 실시형태에서, TMEM106B를 표적화하는 간섭 핵산은 서열번호 64 또는 65에 제시된 서열에 결합한다(예컨대, 상기 서열과 혼성화함).
일부 실시형태에서, 발현 작제물은 하나 이상의 프로모터를 추가로 포함한다. 일부 실시형태에서, 프로모터는 닭-베타 액틴(CBA) 프로모터, CAG 프로모터, CD68 프로모터, 또는 JeT 프로모터이다. 일부 실시형태에서, 프로모터는 RNA pol II 프로모터(예컨대, 또는 RNA pol III 프로모터(예컨대, U6 등)이다.
일부 실시형태에서, 발현 작제물은 내부 리보솜 유입 부위(IRES)를 추가로 포함한다. 일부 실시형태에서, IRES는 제1 유전자 산물과 제2 유전자 산물 사이에 위치한다.
일부 실시형태에서, 발현 작제물은 자가-절단 펩타이드 코딩 서열을 추가로 포함한다. 일부 실시형태에서, 자가-절단 펩타이드는 T2A 펩타이드이다.
일부 실시형태에서, 발현 작제물은 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR) 서열을 포함한다. 일부 실시형태에서, ITR 서열은 제1 유전자 산물 및 제2 유전자 산물에 측접한다(예컨대, 5'-말단에서 3'-말단으로, ITR-제1 유전자 산물-제2 유전자 산물-ITR과 같이 배열됨). 일부 실시형태에서, 단리된 핵산의 ITR 서열 중 하나는 기능성 말단 분해 부위(terminal resolution site; trs)가 결여되어 있다. 예를 들어, 일부 실시형태에서, ITR 중 하나는 ΔITR이다.
일부 양상에서, 본 개시내용은 변형된 "D" 영역(예컨대, 야생형 AAV2 ITR에 대해 변형된 D 서열, 서열번호 29)을 갖는 ITR을 포함하는 rAAV 벡터에 관한 것이다. 일부 실시형태에서, 변형된 D 영역을 갖는 ITR은 rAAV 벡터의 5' ITR이다. 일부 실시형태에서, 변형된 "D" 영역은, 예를 들어 서열번호 26에 제시된 바와 같은 "S" 서열을 포함한다. 일부 실시형태에서, 변형된 "D" 영역을 갖는 ITR은 rAAV 벡터의 3' ITR이다. 일부 실시형태에서, 변형된 "D" 영역은 "D" 영역이 ITR의 3' 말단(예컨대, 벡터의 이식유전자 삽입체에 대해 ITR의 외부 또는 말단)에 위치한 3' ITR을 포함한다. 일부 실시형태에서, 변형된 "D" 영역은 서열번호 26 또는 27에 제시된 바와 같은 서열을 포함한다.
일부 실시형태에서, 단리된 핵산(예컨대, rAAV 벡터)은 TRY 영역을 포함한다. 일부 실시형태에서, TRY 영역은 서열번호 28에 제시된 서열을 포함한다.
일부 실시형태에서, 본 개시내용에 의해 기재된 단리된 핵산은 서열번호 1 내지 91 중 어느 하나에 제시된 서열을 포함하거나 이로 이루어지거나, 상기 서열을 갖는 펩타이드를 인코딩한다.
일부 양상에서, 본 개시내용은 본 개시내용에 의해 기재된 바와 같은 단리된 핵산을 포함하는 벡터를 제공한다. 일부 실시형태에서, 벡터는 플라스미드, 또는 바이러스 벡터이다. 일부 실시형태에서, 바이러스 벡터는 재조합 AAV(rAAV) 벡터 또는 바큘로바이러스 벡터이다. 일부 실시형태에서, rAAV 벡터는 단일-가닥(예컨대, 단일-가닥 DNA)이다.
일부 실시형태에서, 본 개시내용은 본 개시내용에 의해 기재된 바와 같은 단리된 핵산 또는 본 개시내용에 의해 기재된 바와 같은 벡터를 포함하는 숙주 세포를 제공한다.
일부 실시형태에서, 본 개시내용은 본 개시내용에 의해 기재된 바와 같은 캡시드 단백질 및 단리된 핵산 또는 벡터를 포함하는 재조합 아데노-연관 바이러스(rAAV)를 제공한다.
일부 실시형태에서, 캡시드 단백질, 예를 들어 AAV9 캡시드 단백질 또는 AAVrh.10 캡시드 단백질은 혈액-뇌 장벽을 통과할 수 있다. 일부 실시형태에서, rAAV는 중추신경계(CNS)의 뉴런 세포 및 비-뉴런 세포를 형질도입한다.
일부 양상에서, 본 개시내용은 중추신경계(CNS) 질환을 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 대상체에게 투여하는 단계를 포함한다. 일부 실시형태에서, CNS 질환은 신경퇴행성 질환, 예컨대, 표 12에 열거된 신경퇴행성 질환이다. 일부 실시형태에서, CNS 질환은 시누클레인병증, 예컨대, 표 13에 열거된 시누클레인병증이다. 일부 실시형태에서, CNS 질환은 타우병증, 예컨대, 표 14에 열거된 타우병증이다. 일부 실시형태에서, CNS 질환은 리소좀 축적 질환, 예컨대, 표 15에 열거된 리소좀 축적 질환이다. 일부 실시형태에서, 리소좀 축적 질환은 신경병증 고셔병, 예컨대, 2형 고셔병 또는 3형 고셔병이다.
일부 실시형태에서, 본 개시내용은 파킨슨병을 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 대상체에게 투여하는 단계를 포함한다.
일부 실시형태에서, 본 개시내용은 전두측두엽 치매(FTD), GRN 돌연변이가 있는 FTD, tau 돌연변이가 있는 FTD, C9orf72 돌연변이가 있는 FTD, 세로이드 리포푸신증, 파킨슨병, 알츠하이머병, 피질기저핵변성, 운동신경 질환, 또는 고셔병을 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 대상체에게 투여하는 단계를 포함하고, PGRN은 서열번호 68의 핵산 서열에 의해 인코딩되며, rAAV는 AAV9 혈청형을 갖는 캡시드 단백질을 포함한다.
일부 실시형태에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 대상체에게 투여하는 단계를 포함하고, PGRN은 서열번호 68의 핵산 서열에 의해 인코딩되며, rAAV는 AAV9 혈청형을 갖는 캡시드 단백질을 포함한다. 일부 실시형태에서, rAAV는 약 3.5×1013개 벡터 게놈(vg), 약 7.0×1013개 vg, 또는 약 1.4×1014개 vg의 용량으로 대상체에게 투여된다. 일부 실시형태에서, rAAV는 주사를 통해 대조 내로 투여된다.
일부 실시형태에서, 조성물은 2개 이상의 유전자 산물(예컨대, CNS 질환-연관 유전자 산물), 예를 들어 본 출원에 기재된 2, 3, 4, 5, 또는 그 이상의 유전자 산물을 인코딩하는 핵산(예컨대, rAAV 게놈, 예를 들어 AAV 캡시드 단백질에 의해 캡슐화됨)을 포함한다. 일부 실시형태에서, 조성물은 2개 이상(예컨대, 2, 3, 4, 5, 또는 그 이상)의 상이한 핵산(예컨대, 2개 이상의 rAAV 게놈, 예를 들어 AAV 캡시드 단백질에 의해 별도로 캡슐화됨)을 포함하며, 각각은 하나 이상의 상이한 유전자 산물을 인코딩한다. 일부 실시형태에서, 2개 이상의 상이한 조성물이 대상체에게 투여되고, 각각의 조성물은 상이한 유전자 산물을 인코딩하는 하나 이상의 핵산을 포함한다. 일부 실시형태에서, 상이한 유전자 산물은 동일한 프로모터 유형(예컨대, 동일한 프로모터)에 작동 가능하게 연결된다. 일부 실시형태에서, 상이한 유전자 산물은 상이한 프로모터에 작동 가능하게 연결된다.
단리된 핵산 및 벡터
단리된 핵산은 DNA 또는 RNA일 수 있다. 일부 양상에서, 본 개시내용은 하나 이상의 PD-연관 유전자, 예를 들어 Gcase(예컨대, GBA1 유전자의 유전자 산물) 또는 이의 일부를 인코딩하는 발현 작제물을 포함하는 단리된 핵산(예컨대, rAAV 벡터)을 제공한다. 또한 β-글루코세레브로시다제 또는 GBA로도 지칭되는 Gcase는 당지질 대사의 중간체인 화학적 글루코세레브로사이드의 베타-글루코사이드 연결을 절단하는 리소좀 단백질을 지칭한다. 인간에서, Gcase는 1번 염색체에 위치한 GBA1 유전자에 의해 인코딩된다. 일부 실시형태에서, GBA1은 NCBI 참조 서열 NCBI 참조 서열 NP_000148.2(서열번호 14)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) Gcase-인코딩 서열, 예컨대, 서열번호 15에 제시된 서열을 포함한다.
일부 양상에서, 본 개시내용은 프로사포신(예컨대, PSAP 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공한다. 프로사포신은 짧은 올리고당 기가 있는 글리코스핑고지질의 이화작용을 촉진시키는 스핑고지질 활성화 단백질(사포신) A, B, C, 및 D에 대한 전구체 당단백질이다. 인간에서, PSAP 유전자는 10번 염색체에 위치한다. 일부 실시형태에서, PSAP는 NCBI 참조 서열 NP_002769.1(예컨대, 서열번호 16)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된(예컨대, 포유동물 세포, 예를 들어 인간 세포에서의 발현을 위해 코돈 최적화된) 프로사포신-인코딩 서열, 예컨대, 서열번호 17에 제시된 서열을 포함한다.
본 개시내용의 양상은 LIMP2/SCARB2(예컨대, SCARB2 유전자의 유전자 산물)를 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. SCARB2는 세포 내에서 리소좀 및 엔도좀 수송을 조절하는 막 단백질을 지칭한다. 인간에서, SCARB2 유전자는 4번 염색체에 위치한다. 일부 실시형태에서, SCARB2 유전자는 NCBI 참조 서열 NP_005497.1(서열번호 18)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 19에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 SCARB2-인코딩 서열을 포함한다.
본 개시내용의 양상은 GBA2 단백질(예컨대, GBA2 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. GBA2 단백질은 비-리소좀 글루코실세라미다제를 지칭한다. 인간에서, GBA2 유전자는 9번 염색체에 위치한다. 일부 실시형태에서, GBA2 유전자는 NCBI 참조 서열 NP_065995.1(서열번호 30)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 31에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 GBA2-인코딩 서열을 포함한다.
본 개시내용의 양상은 GALC 단백질(예컨대, GALC 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. GALC 단백질은 갈록토세레브로사이드, 갈락토실스핑고신, 락토실세라마이드, 및 모노갈락토실다이글리세라이드의 갈락토스 에스터 결합을 가수분해하는 효소인 갈락토실세라미다제(또는 갈락토세레브로시다제)를 지칭한다. 인간에서, GALC 유전자는 14번 염색체에 위치한다. 일부 실시형태에서, GALC 유전자는 NCBI 참조 서열 NP_000144.2(서열번호 33)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 34에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 GALC-인코딩 서열을 포함한다.
본 개시내용의 양상은 CTSB 단백질(예컨대, CTSB 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. CTSB 단백질은 세포 내 단백질 분해에 중요한 역할을 하는 리소좀 시스테인 프로테아제인 카텝신 B를 지칭한다. 인간에서, CTSB 유전자는 8번 염색체에 위치한다. 일부 실시형태에서, CTSB 유전자는 NCBI 참조 서열 NP_001899.1(서열번호 35)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 36에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 CTSB-인코딩 서열을 포함한다.
본 개시내용의 양상은 SMPD1 단백질(예컨대, SMPD1 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. SMPD1 단백질은 스핑고지질 대사에 관여하는 가수분해 효소인 스핑고미엘린 포스포다이에스터라제 1을 지칭한다. 인간에서, SMPD1 유전자는 11번 염색체에 위치한다. 일부 실시형태에서, SMPD1 유전자는 NCBI 참조 서열 NP_000534.3(서열번호 37)으로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 38에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 SMPD1-인코딩 서열을 포함한다.
본 개시내용의 양상은 GCH1 단백질(예컨대, GCH1 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. GCH1 단백질은 엽산 및 바이오프테린 생합성 경로의 일부인 가수분해 효소인 GTP 사이클로하이드롤라제 I을 지칭한다. 인간에서, GCH1 유전자는 14번 염색체에 위치한다. 일부 실시형태에서, GCH1 유전자는 NCBI 참조 서열 NP_000152.1(서열번호 45)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 46에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 GCH1-인코딩 서열을 포함한다.
본 개시내용의 양상은 RAB7L 단백질(예컨대, RAB7L 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. RAB7L 단백질은 GTP 결합 단백질인 RAS 종양유전자 패밀리-유사 1 구성원인 RAB7을 지칭한다. 인간에서, RAB7L 유전자는 1번 염색체에 위치한다. 일부 실시형태에서, RAB7L 유전자는 NCBI 참조 서열 NP_003920.1(서열번호 47)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 48에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 RAB7L-인코딩 서열을 포함한다.
본 개시내용의 양상은 VPS35 단백질(예컨대, VPS35 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. VPS35 단백질은 엔도솜에서 트랜스-골지 네트워크로 단백질의 역행 수송에 관여하는 단백질 복합체의 일부인 액포성 단백질 분류-연관 단백질 35를 지칭한다. 인간에서, VPS35 유전자는 16번 염색체에 위치한다. 일부 실시형태에서, VPS35 유전자는 NCBI 참조 서열 NP_060676.2(서열번호 49)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 50에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 VPS35-인코딩 서열을 포함한다.
본 개시내용의 양상은 IL-34 단백질(예컨대, IL34 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. IL-34 단백질은 단핵구의 성장 및 생존을 증가시키는 사이토카인인 인터류킨 34를 지칭한다. 인간에서, IL34 유전자는 16번 염색체에 위치한다. 일부 실시형태에서, IL34 유전자는 NCBI 참조 서열 NP_689669.2(서열번호 55)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 56에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 IL-34-인코딩 서열을 포함한다.
본 개시내용의 양상은 TREM2 단백질(예컨대, TREM2 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. TREM2 단백질은 골수성 세포에서 발견되는 면역글로불린 슈퍼패밀리 수용체인 골수성 세포 2에서 발현되는 촉발 수용체를 지칭한다. 인간에서, TREM2 유전자는 6번 염색체에 위치한다. 일부 실시형태에서, TREM2 유전자는 NCBI 참조 서열 NP_061838.1(서열번호 57)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 58에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 TREM2-인코딩 서열을 포함한다.
본 개시내용의 양상은 TMEM106B 단백질(예컨대, TMEM106B 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. TMEM106B 단백질은 수상돌기 형태 형성 및 리소좀 수송의 조절에 관여하는 단백질인 막관통 단백질 106B를 지칭한다. 인간에서, TMEM106B 유전자는 7번 염색체에 위치한다. 일부 실시형태에서, TMEM106B 유전자는 NCBI 참조 서열 NP_060844.2(서열번호 62)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 63에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 TMEM106B-인코딩 서열을 포함한다.
본 개시내용의 양상은 프로그래뉼린 단백질(예컨대, PGRN 유전자의 유전자 산물)을 인코딩하는 발현 작제물을 포함하는 단리된 핵산에 관한 것이다. PGRN 단백질은 발달, 염증, 세포 증식 및 단백질 항상성에 관여하는 단백질인 프로그래뉼린을 지칭한다. 인간에서, PGRN 유전자는 17번 염색체에 위치한다. 일부 실시형태에서, PGRN 유전자는 NCBI 참조 서열 NP_002078.1(서열번호 67)로 표시되는 펩타이드를 인코딩한다. 일부 실시형태에서, 단리된 핵산은 서열번호 68에 제시된 서열을 포함한다. 일부 실시형태에서, 단리된 핵산은 코돈 최적화된 PGRN-인코딩 서열을 포함한다. 일부 실시형태에서, 핵산은 닭 β-액틴(CBA) 프로모터 및 거대세포바이러스 인핸서(CMVe)를 추가로 포함한다.
일부 양상에서, 본 개시내용은 뇌척수액(CSF) 샘플에서 PGRN 단백질 수준을 정량화하기 위한 자동화된 웨스턴 블롯 면역분석을 제공한다. 일부 실시형태에서, 면역분석은 모세관-기반의 자동화된 웨스턴 블롯 면역분석 플랫폼으로, 여기서 단백질 분리, 면역프로빙(immunoprobing), 세척, 및 화학발광에 의한 검출과 같은 모든 단계가 모세관 카트리지에서 일어난다. 일부 실시형태에서, CSF 샘플은 인간 또는 비-인간 영장류 유래이다. 일부 양상에서, 면역분석은 순환 항체의 존재 하에 PGRN 단백질 수준의 차이의 검출을 가능하게 한다. 일부 양상에서, 본 개시내용은 CSF 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 방법을 제공하며, 상기 방법은 (1) CSF 샘플을 희석(예컨대, 4배 희석)시키는 단계; (2) CSF 샘플; 항-프로그래뉼린 항체; 항-프로그래뉼린 항체를 검출하는 2차 항체, 루미놀 및 퍼옥사이드를 모세관 카트리지의 웰에 로딩하는 단계; (3) 모세관 카트리지를 자동화된 웨스턴 블롯 면역분석 기기에 로딩하는 단계; (4) 자동화된 웨스턴 블롯 면역분석 기기를 사용하여 신호 강도, 피크 면적, 신호 대 잡음 비 및 총 단백질 정규화 매개변수 중 하나 이상을 계산하는 단계; 및 (5) 항-그래뉼린 항체에 대한 면역반응성의 피크 면적으로서 CSF 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 단계를 포함한다. 일부 실시형태에서, CSF 샘플은 다이티오트레이톨(DTT) 및 샘플 완충액을 포함하는 마스터 믹스에서 희석된다. 마스터 믹스는 다른 독점 구성성분을 추가로 포함할 수 있다. 일부 양상에서, 항-프로그래뉼린 항체는 인간 프로그래뉼린을 검출한다. 일부 실시형태에서, 프로그래뉼린 단백질 수준은 자동화된 웨스턴 블롯 면역분석 기기를 제어하는 소프트웨어를 사용하여 계산된 매개변수로부터 정량화된다. 일부 실시형태에서, 소프트웨어는 Simple Western™(ProteinSimple, 미국 캘리포니아주 새너제이 소재)용 Compass 소프트웨어이다.
일부 실시형태에서, 본 개시내용은 뇌척수액(CSF) 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 방법을 제공하며, 상기 방법은 (1) 다이티오트레이톨(DTT) 및 샘플 완충액을 포함하는 마스터 믹스에서 CSF 샘플을 희석(예컨대, 4배 희석)시키는 단계; (2) 희석된 CSF 샘플, 항-프로그래뉼린 항체; 항-프로그래뉼린 항체를 검출하는 2차 항체, 루미놀, 및 퍼옥사이드를 모세관 카트리지의 웰에 로딩하는 단계; (3) 모세관 카트리지를 자동화된 웨스턴 블롯 면역분석 기기에 로딩하는 단계; (4) 자동화된 웨스턴 블롯 면역분석 기기를 사용하여 신호 강도, 피크 면적, 및 신호 대 잡음 비를 계산하는 단계; 및 (5) 항-그래뉼린 항체에 대한 면역반응성의 피크 면적으로서 CSF 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 단계를 포함한다.
일부 양상에서, 본 개시내용은 제1 유전자 산물 및 제2 유전자 산물을 인코딩하는 발현 작제물을 포함하는 단리된 핵산을 제공하며, 여기서 각각의 유전자 산물은 독립적으로 표 1에 제시된 유전자 산물, 또는 이들의 일부로부터 선택된다.
일부 실시형태에서, 본 개시내용에 의해 기재된 단리된 핵산 또는 벡터(예컨대, rAAV 벡터)는 서열번호 1 내지 91 중 어느 하나에 제시된 서열을 포함하거나 이로 이루어진다. 일부 실시형태에서, 본 개시내용에 의해 기재된 단리된 핵산 또는 벡터(예컨대, rAAV 벡터)는 서열번호 1 내지 91 중 어느 하나에 제시된 서열에 상보적인(예컨대, 상기 서열의 보체인) 서열을 포함하거나 이로 이루어진다. 일부 실시형태에서, 본 개시내용에 의해 기재된 단리된 핵산 또는 벡터(예컨대, rAAV 벡터)는 서열번호 1 내지 91 중 어느 하나에 제시된 서열의 역보체인 서열을 포함하거나 이로 이루어진다. 일부 실시형태에서, 본 개시내용에 의해 기재된 단리된 핵산 또는 벡터(예컨대, rAAV 벡터)는 서열번호 1 내지 91 중 어느 하나에 제시된 서열의 일부를 포함하거나 이로 이루어진다. 일부는 서열번호 1 내지 91 중 어느 하나에 제시된 서열의 적어도 25%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99%를 포함할 수 있다. 일부 실시형태에서, 본 개시내용에 의해 기재된 핵산 서열은 핵산 센스 가닥(예컨대, 5'에서 3' 가닥), 또는 바이러스 서열의 맥락에서 플러스(+) 가닥이다. 일부 실시형태에서, 본 개시내용에 의해 기재된 핵산 서열은 핵산 안티센스 가닥(예컨대, 3'에서 5' 가닥), 또는 바이러스 서열의 맥락에서 마이너스(-) 가닥이다.
일부 실시형태에서, 유전자 산물은 자연적으로 발생하는 유전자의 코딩 부분(예컨대, cDNA)에 의해 인코딩된다. 일부 실시형태에서, 제1 유전자 산물은 GBA1 유전자에 의해 인코딩되는 단백질(또는 이의 단편)이다. 일부 실시형태에서, 유전자 산물은 표 1에 열거된 또 다른 유전자, 예를 들어 SCARB2/LIMP2 유전자 또는 PSAP 유전자에 의해 인코딩되는 단백질(또는 이의 단편)이다. 그러나, 당업자는 제1 유전자 산물(예컨대, Gcase) 및 제2 유전자 산물(예컨대, LIMP2 등)의 발현 순서가 일반적으로 역전될 수 있음(예컨대, LIMP2가 제1 유전자 산물이고 Gcase가 제2 유전자 산물임)을 인식한다. 일부 실시형태에서, 유전자 산물은 표 1에 열거된 유전자의 단편(예컨대, 일부)이다. 단백질 단편은 표 1에 열거된 유전자에 의해 인코딩되는 단백질의 약 50%, 약 60%, 약 70%, 약 80% 약 90% 또는 약 99%를 포함할 수 있다. 일부 실시형태에서, 단백질 단편은 표 1에 열거된 유전자에 의해 인코딩되는 단백질의 50% 내지 99.9%(예컨대, 50% 내지 99.9% 사이의 임의의 값)를 포함한다.
일부 실시형태에서, 발현 작제물은 모노시스트론성이다(예컨대, 발현 작제물은 제1 유전자 산물 및 제2 유전자 산물을 포함하는 단일 융합 단백질을 인코딩함). 일부 실시형태에서, 발현 작제물은 폴리시스트론성이다(예컨대, 발현 작제물은 2개의 별개의 유전자 산물, 예를 들어 2개의 상이한 단백질 또는 단백질 단편을 인코딩함).
폴리시스트론성 발현 벡터는 하나 이상(예컨대, 1, 2, 3, 4, 5개, 또는 그 이상)의 프로모터를 포함할 수 있다. 임의의 적합한 프로모터, 예를 들어 구성적 프로모터, 유도성 프로모터, 내인성 프로모터, 조직-특이적 프로모터(예컨대, CNS-특이적 프로모터) 등이 사용될 수 있다. 일부 실시형태에서, 프로모터는 닭 베타-액틴 프로모터(CBA 프로모터), CAG 프로모터(예컨대, 문헌[Alexopoulou et al. (2008) BMC Cell Biol. 9:2; doi: 10.1186/1471-2121-9-2]에 의해 기재된 바와 같음), CD68 프로모터, 또는 JeT 프로모터(예컨대, 문헌[Tornøe et al. (2002) Gene 297(1-2):21-32]에 기재된 바와 같음)이다. 일부 실시형태에서, 프로모터는 제1 유전자 산물, 제2 유전자 산물, 또는 제1 유전자 산물 및 제2 유전자 산물을 인코딩하는 핵산 서열에 작동 가능하게 연결되어 있다. 일부 실시형태에서, 발현 카세트는 전사 인자 결합 서열, 인트론 스플라이스 부위, 폴리(A) 첨가 부위, 인핸서 서열, 억제인자 결합 부위, 또는 상기한 것의 임의의 조합을 포함하지만, 이들로 제한되지 않는 하나 이상의 추가적인 조절 서열을 포함한다.
일부 실시형태에서, 제1 유전자 산물을 인코딩하는 핵산 서열 및 제2 유전자 산물을 인코딩하는 핵산 서열은 내부 리보솜 유입 부위(IRES)를 인코딩하는 핵산 서열에 의해 분리된다. IRES의 예는, 예를 들어 문헌[Mokrejs et al. (2006) Nucleic Acids Res. 34(데이터베이스 발행):D125-30]에 의해 기재되어 있다. 일부 실시형태에서, 제1 유전자 산물을 인코딩하는 핵산 서열 및 제2 유전자 산물을 인코딩하는 핵산 서열은 자가-절단 펩타이드를 인코딩하는 핵산 서열에 의해 분리된다. 자가-절단 펩타이드의 예는 T2A, P2A, E2A, F2A, BmCPV 2A, 및 BmIFV 2A, 및 문헌[Liu et al. (2017) Sci Rep. 7: 2193]에 기재된 것을 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 자가-절단 펩타이드는 T2A 펩타이드이다.
병리학적으로, PD 및 고셔병과 같은 장애는 주로 α-시누클레인(α-Syn) 단백질로 구성된 단백질 응집체의 축적과 연관되어 있다. 따라서, 일부 실시형태에서, 본 명세서에 기재된 단리된 핵산은 α-Syn 단백질의 발현을 감소시키거나 방지하는 저해성 핵산을 포함한다. 저해성 핵산을 인코딩하는 서열은 발현 벡터의 비번역 영역(예컨대, 인트론, 5'UTR, 3'UTR 등)에 위치할 수 있다.
일부 실시형태에서, 저해성 핵산은 발현 작제물의 인트론, 예를 들어 제1 유전자 산물을 인코딩하는 서열의 상류에 있는 인트론에 위치한다. 저해성 핵산은 이중 가닥 RNA(dsRNA), siRNA, shRNA, 마이크로 RNA(miRNA), 인공 miRNA(amiRNA), 또는 RNA 앱타머일 수 있다. 일반적으로, 저해성 핵산은 표적 RNA(예컨대, mRNA)의 약 6 내지 약 30개(예컨대, 6 및 30을 포함하는 이 사이의 임의의 정수) 인접 뉴클레오타이드에 결합한다(예컨대, 상기 뉴클레오타이드와 혼성화함). 일부 실시형태에서, 저해성 핵산 분자는 miRNA 또는 amiRNA, 예를 들어 SNCA(α-Syn 단백질을 인코딩하는 유전자) 또는 TMEM106B(예컨대, TMEM106B 단백질을 인코딩하는 유전자)를 표적화하는 miRNA이다. 일부 실시형태에서, miRNA는 이것이 혼성화하는 SNCA mRNA의 영역과 어떠한 미스매치도 포함하지 않는다(예컨대, miRNA는 "완벽"함). 일부 실시형태에서, 저해성 핵산은 shRNA(예컨대, SNCA 또는 TMEM106B를 표적화하는 shRNA)이다. 일부 실시형태에서, 저해성 핵산은 miR-155 스캐폴드 및 SNCA 또는 TMEM106B 표적화 서열을 포함하는 인공 miRNA(amiRNA)이다.
당업자는 저해성 핵산(예컨대, dsRNA, siRNA, miRNA, amiRNA 등)을 포함하거나 인코딩하는 핵산 서열을 지칭할 때, 본 명세서에서 제공되는 서열에서 임의의 하나 이상의 티미딘(T) 뉴클레오타이드 또는 우리딘(U) 뉴클레오타이드는 아데노신 뉴클레오타이드와의 염기쌍 형성(예컨대, Watson-Crick 염기쌍을 통함)에 적합한 임의의 다른 뉴클레오타이드로 대체될 수 있음을 인식한다. 예를 들어, T는 U로 대체될 수 있고, U는 T로 대체될 수 있다.
본 명세서에 기재된 바와 같은 단리된 핵산은 그 자체로, 또는 벡터의 일부로서 존재할 수 있다. 일반적으로, 벡터는 플라스미드, 코스미드, 파지미드, 박테리아 인공 염색체(BAC), 또는 바이러스 벡터(예컨대, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 레트로바이러스 벡터, 바큘로바이러스 벡터 등)일 수 있다. 일부 실시형태에서, 벡터는 플라스미드(예컨대, 본 명세서에 기재된 바와 같은 단리된 핵산을 포함하는 플라스미드)이다. 일부 실시형태에서, rAAV 벡터는 단일-가닥(예컨대, 단일-가닥 DNA)이다. 일부 실시형태에서, 벡터는 재조합 AAV(rAAV) 벡터이다. 일부 실시형태에서, 벡터는 바큘로바이러스 벡터(예컨대, 아우토그라파 칼리포니카(Autographa californica) 핵 다면체형성(AcNPV) 벡터)이다.
전형적으로 rAAV 벡터(예컨대, rAAV 게놈)는 2개의 AAV 반전 말단 반복부(ITR) 서열이 측접하는 이식유전자(예컨대, 프로모터, 인트론, 인핸서 서열, 단백질 코딩 서열, 저해성 RNA 코딩 서열, 폴리A 꼬리 서열 등 각각 중 하나 이상을 포함하는 발현 작제물)를 포함한다. 일부 실시형태에서, rAAV 벡터의 이식유전자는 본 개시내용에 의해 기재된 바와 같은 단리된 핵산을 포함한다. 일부 실시형태에서, rAAV 벡터의 2개의 ITR 서열 각각은 전장 ITR(예컨대, 길이가 대략 145 bp이고, 기능성 Rep 결합 부위(RBS) 및 말단 분해 부위(trs)를 포함함)이다. 일부 실시형태에서, rAAV 벡터의 ITR 중 하나는 절단된다(예컨대, 단축되거나 전장이 아님). 일부 실시형태에서, 절단된 ITR은 기능성 말단 분해 부위(trs)가 결여되어 있고 자가-상보성 AAV 벡터(scAAV 벡터)의 생성에 사용된다. 일부 실시형태에서, 절단된 ITR은, 예를 들어 문헌[McCarty et al. (2003) Gene Ther. 10(26):2112-8]에 기재된 바와 같은 ΔITR이다.
본 개시내용의 양상은 야생형 AAV ITR에 대하여, 예를 들어 야생형 AAV2 ITR(예컨대, 서열번호 29)에 대하여 하나 이상의 변형(예컨대, 핵산 첨가, 결실, 치환 등)을 갖는 ITR을 포함하는 단리된 핵산(예컨대, rAAV 벡터)에 관한 것이다. 야생형 AAV2 ITR의 구조는 도 20에 표시되어 있다. 일반적으로, 야생형 ITR은 자가-어닐링되어 2개의 교차 팔(각각 B/B' 및 C/C'로 지칭되는 서열에 의해 형성됨), 더 긴 줄기 영역(A/A' 서열에 의해 형성됨), 및 "D" 영역으로 지칭되는 단일-가닥 말단 영역으로 이루어진 회문 이중-가닥 T-형의 헤어핀 구조를 형성하는 125개 뉴클레오타이드 영역을 포함한다(도 20). 일반적으로 ITR의 "D" 영역은 A/A' 서열에 의해 형성되는 줄기 영역과 rAAV 벡터의 이식유전자를 포함하는 삽입체 사이에 위치한다(예컨대, ITR의 말단에 대해 ITR의 "내부" 또는 이식유전자 삽입체 또는 rAAV 벡터의 발현 작제물에 근접하여 위치함). 일부 실시형태에서, "D" 영역은 서열번호 27에 제시된 서열을 포함한다. "D" 영역은, 예를 들어 문헌[Ling et al. (2015) J Mol Genet Med 9(3)]에 의해 개시된 바와 같이, 캡시드 단백질에 의한 rAAV 벡터의 캡슐화에 중요한 역할을 하는 것으로 관찰되었다.
본 개시내용은 부분적으로 ITR의 "외부"(이식유전자 삽입체 또는 발현 작제물에 대해 ITR의 말단에 근접)에 위치한 "D" 영역을 포함하는 rAAV 벡터가 비변형(예컨대, 야생형) ITR이 있는 ITR을 갖는 rAAV 벡터보다 AAV 캡시드 단백질에 의해 효율적으로 캡슐화된다는 놀라운 발견을 기반으로 한다. 일부 실시형태에서, 변형된 "D" 서열(예컨대, "외부" 위치의 "D" 서열)을 갖는 rAAV 벡터는 야생형 ITR 서열을 갖는 rAAV 벡터에 비해 감소된 독성을 가진다.
일부 실시형태에서, 변형된 "D" 서열은 야생형 "D" 서열(예컨대, 서열번호 27)에 비해 적어도 하나의 뉴클레오타이드 치환을 포함한다. 변형된 "D" 서열은 야생형 "D" 서열(예컨대, 서열번호 27)에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 10개 초과의 뉴클레오타이드 치환을 가질 수 있다. 일부 실시형태에서, 변형된 "D" 서열은 야생형 "D" 서열(예컨대, 서열번호 27)에 비해 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 핵산 치환을 포함한다. 일부 실시형태에서, 변형된 "D" 서열은 야생형 "D" 서열(예컨대, 서열번호 27)과 약 10% 내지 약 99%(예컨대, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99%) 동일하다. 일부 실시형태에서, 변형된 "D" 서열은 문헌[Wang et al. (1995) J Mol Biol 250(5):573-80]에서 "S" 서열로도 지칭되는, 서열번호 26에 제시된 서열을 포함한다.
본 개시내용에 의해 기재된 바와 같은 단리된 핵산 또는 rAAV 벡터는, 예를 들어 서열번호 28 또는 문헌[Francois et al., (2005) J. Virol . 79(17):11082-11094]에 기재된 바와 같은 "TRY" 서열을 추가로 포함할 수 있다. 일부 실시형태에서, TRY 서열은 단리된 핵산 또는 rAAV 벡터의 ITR(예컨대, 5' ITR)과 발현 작제물(예컨대, 이식유전자-인코딩 삽입체) 사이에 위치한다.
일부 양상에서, 본 개시내용은 본 개시내용에 의해 기재된 바와 같은 단리된 핵산 또는 rAAV 벡터를 포함하는 바큘로바이러스 벡터에 관한 것이다. 일부 실시형태에서, 바큘로바이러스 벡터는, 예를 들어 문헌[Urabe et al. (2002) Hum Gene Ther 13(16):1935-43 및 Smith et al. (2009) Mol Ther 17(11):1888-1896]에 기재된 바와 같은 아우토그라파 칼리포니카 핵 다면체형성(AcNPV) 벡터이다.
일부 양상에서, 본 개시내용은 본 명세서에 기재된 바와 같은 단리된 핵산 또는 벡터를 포함하는 숙주 세포를 제공한다. 숙주 세포는 원핵 세포 또는 진핵 세포일 수 있다. 예를 들어, 숙주 세포는 포유동물 세포, 박테리아 세포, 효모 세포, 곤충 세포 등일 수 있다. 일부 실시형태에서, 숙주 세포는 포유동물 세포, 예를 들어 HEK293T 세포이다. 일부 실시형태에서, 숙주 세포는 박테리아 세포, 예를 들어 대장균(E. coli) 세포이다.
rAAV
일부 양상에서, 본 개시내용은 본 명세서에 기재된 바와 같은 핵산을 인코딩하는 이식유전자를 포함하는 재조합 AAV(rAAV)(예컨대, 본 명세서에 기재된 바와 같은 rAAV 벡터)에 관한 것이다. 용어 "rAAV"는 일반적으로 하나 이상의 AAV 캡시드 단백질에 의해 캡슐화된 rAAV 벡터를 포함하는 바이러스 입자를 지칭한다. 본 개시내용에 의해 기재된 rAAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 및 AAV10으로부터 선택되는 혈청형을 갖는 캡시드 단백질을 포함할 수 있다. 일부 실시형태에서, rAAV는 비-인간 숙주 유래의 캡시드 단백질, 예를 들어 붉은털 원숭이(rhesus) AAV 캡시드 단백질, 예컨대, AAVrh.10, AAVrh.39 등을 포함한다. 일부 실시형태에서, 본 개시내용에 의해 기재된 rAAV는 야생형 캡시드 단백질의 변이체, 예컨대, 캡시드 단백질이 유래한 야생형 AAV 캡시드 단백질에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 10개 초과(예컨대, 15, 20 25, 50, 100개 등)의 아미노산 치환(예컨대, 돌연변이)을 포함하는 캡시드 단백질 변이체인 캡시드 단백질을 포함한다. 일부 실시형태에서, AAV 캡시드 단백질 변이체는, 예를 들어 문헌[Albright et al. Mol Ther . 2018 Feb 7;26(2):510-523]에 기재된 바와 같은 AAV1RX 캡시드 단백질이다. 일부 실시형태에서, 캡시드 단백질 변이체는, 예를 들어 문헌[Rosario et al. Mol Ther Methods Clin Dev. 2016; 3: 16026]에 기재된 바와 같은 AAV TM6 캡시드 단백질이다.
일부 실시형태에서, 본 개시내용에 의해 기재된 rAAV는, 특히 CSF 공간 또는 뇌 실질 내로 직접 도입될 때, CNS를 통해 용이하게 확산된다. 따라서, 일부 실시형태에서, 본 개시내용에 의해 기재된 rAAV는 혈액-뇌 장벽(BBB)을 통과할 수 있는 캡시드 단백질을 포함한다. 예를 들어, 일부 실시형태에서, rAAV는 AAV9 또는 AAVrh.10 혈청형을 갖는 캡시드 단백질을 포함한다. rAAV의 생성은, 예를 들어 문헌[Samulski et al. (1989) J Virol . 63(9):3822-8 및 Wright (2009) Hum Gene Ther. 20(7): 698-706]에 기재되어 있다. 일부 실시형태에서, rAAV는 골수 세포, 예를 들어 미세교세포를 특이적으로 또는 우선적으로 표적화하는 캡시드 단백질을 포함한다.
일부 실시형태에서, 본 개시내용은 "PR006A"로 지칭되는 rAAV를 제공한다. PR006A는 기능성 인간 GRN 유전자를 전달하여 기능성 인간 PGRN의 발현 증가를 야기하는 rAAV이다. PR006A 벡터 삽입체는, 거대세포바이러스(CMV) 인핸서, CBA 프로모터, 엑손 1, 및 인트론(int)의 4개 부분을 포함하여 인간 GRN(서열번호 68)의 코돈-최적화된 코딩 서열을 구성적으로 발현시키는 닭 β-액틴(CBA) 프로모터 요소를 포함한다. 3' 영역은 또한 우드척 간염 바이러스 전사후 조절 요소(WPRE), 그 다음에 소 성장 호르몬 폴리아데닐화 신호 꼬리를 포함한다. 3개의 잘 설명된 전사 조절 활성화 부위, 즉, TATA, RBS, 및 YY1이 프로모터 영역의 5' 말단에 포함된다(예컨대, 문헌[Francois et al., (2005) J. Virol . 79(17):11082-11094] 참조). 측접 반전 말단 반복부(ITR)는 개재 서열의 올바른 패키징을 가능하게 한다. 백본은 카나마이신에 대한 내성을 부여하는 유전자뿐만 아니라, 역패키징을 방지하는 스터퍼(stuffer) 서열을 포함한다. rAAV 벡터를 도시하는 개략도가 도 64에 표시되어 있다. 서열번호 90은 도 64에 나타낸 PR006A 벡터의 제1 가닥의 뉴클레오타이드 서열을 (5'에서 3' 순서로) 제공한다. 서열번호 91은 도 64에 나타낸 PR006A 벡터의 제2 가닥의 뉴클레오타이드 서열을 (5'에서 3' 순서로) 제공한다. PR006A는 AAV9 캡시드 단백질을 포함한다.
일부 실시형태에서, 본 개시내용에 의해 기재된 바와 같은 rAAV(예컨대, rAAV 캡시드 입자를 형성하기 위해 AAV 캡시드 단백질에 의해 캡슐화된 재조합 rAAV 게놈을 포함함)는 바큘로바이러스 벡터 발현 시스템(BEVS)에서 생성된다. BEVS를 사용하는 rAAV의 생성은, 예를 들어 문헌[Urabe et al. (2002) Hum Gene Ther 13(16):1935-43, Smith et al. (2009) Mol Ther 17(11):1888-1896], 미국 특허 제8,945,918호, 미국 특허 제9,879,282호, 및 국제 PCT 공개 WO 제2017/184879호에 기재되어 있다. 그러나, rAAV는 임의의 적합한 방법을 사용하여(예컨대, 재조합 rep 및 cap 유전자를 사용하여) 생성될 수 있다. 일부 실시형태에서, 본 명세서에 개시된 바와 같은 rAAV는 HEK293(인간 배아 신장) 세포에서 생성된다.
약제학적 조성물
일부 양상에서, 본 개시내용은 본 명세서에 기재된 바와 같은 단리된 핵산 또는 rAAV 및 약제학적으로 허용 가능한 담체를 포함하는 약제학적 조성물을 제공한다. 본 명세서에서 사용되는 바와 같이, 용어 "약제학적으로 허용 가능한"은 화합물의 생물학적 활성 또는 특성을 무효화시키지 않고, 상대적으로 무독성인 물질, 예컨대, 담체 또는 희석제를 지칭하며, 예를 들어 물질은 바람직하지 않은 생물학적 효과를 유발하거나 이것이 포함된 조성물의 구성성분 중 임의의 것과 유해한 방식으로 상호작용하지 않으면서 개체에게 투여될 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "약제학적으로 허용 가능한 담체"는, 본 발명 내에서 유용한 화합물이 의도된 기능을 수행할 수 있도록 상기 화합물을 환자 내에서 또는 환자에게 운반하거나 수송하는 데 관여하는, 약제학적으로 허용 가능한 물질, 조성물 또는 담체, 예컨대, 액체 또는 고체 충전제, 안정화제, 분산제, 현탁화제, 희석제, 부형제, 증점제, 용매 또는 캡슐화 물질을 의미한다. 본 발명의 실시에 사용되는 약제학적 조성물에 포함될 수 있는 추가적인 성분은 당업계에 알려져 있고, 예를 들어 문헌[Remington's Pharmaceutical Sciences (Genaro, Ed., Mack Publishing Co., 1985, Easton, PA)]에 기재되어 있으며, 이는 본 명세서에 참조에 의해 원용된다.
본 명세서에서 제공되는 조성물(예컨대, 약제학적 조성물)은 장관(예컨대, 경구), 비경구, 정맥내, 근육내, 동맥내, 골수내, 척추강내, 피하, 뇌실내, 경피, 피내, 직장, 질내, 복강내, 국소(분말, 연고, 크림, 및/또는 점적액에 의함), 점막, 비강, 협측, 설하; 기관내 점적주입, 기관지 점적주입, 및/또는 흡입; 및/또는 구강 스프레이, 비강 스프레이, 및/또는 에어로졸에 의한 것을 포함하여 임의의 경로에 의해 투여될 수 있다. 구체적으로 고려되는 경고는 경구 투여, 정맥내 투여(예컨대, 전신 정맥내 주사), 혈액 및/또는 림프 공급을 통한 국부 투여, 및/또는 이환된 부위로의 직접 투여이다. 일반적으로, 가장 적절한 투여 경로는 작용제의 특성(예컨대, 위장관 환경에서의 안정성), 및/또는 대상체의 상태(예컨대, 대상체가 경구 투여를 견딜 수 있는지 여부)를 포함하여 다양한 인자에 따라 달라질 것이다. 특정 실시형태에서, 본 명세서에 기재된 화합물 또는 약제학적 조성물은 대상체의 눈에 국소 투여하기에 적합하다.
일부 실시형태에서, 본 개시내용은 수용액으로 제시된 상기 기재된 PR006A rAAV를 포함하는 PR006A 완제 의약품을 제공한다. 일부 실시형태에서, 최종 제형 완충액은 약 20mM Tris[pH 8.0], 약 1mM MgCl2, 약 200mM NaCl, 및 약 0.001%[w/v] 폴록사머 188을 포함한다. 일부 실시형태에서, 완제 의약품 및 최종 제형 완충액은 대조내(ICM) 주사에 적합하다.
방법
본 개시내용의 양상은 CNS-연관 질환을 치료하기 위하여 대상체에서 하나 이상의 CNS 질환-연관 유전자 산물의 발현을 위한 조성물에 관한 것이다. 하나 이상의 CNS 질환-연관 유전자 산물은 하나 이상의 단리된 핵산 또는 rAAV 벡터에 의해 인코딩될 수 있다. 일부 실시형태에서, 대상체는 하나 이상(1, 2, 3, 4, 5개, 또는 그 이상)의 유전자 산물을 인코딩하는 단일 벡터(예컨대, 단리된 핵산, rAAV 등)를 투여받는다. 일부 실시형태에서, 대상체는 복수(예컨대, 2, 3, 4, 5개, 또는 그 이상)의 벡터(예컨대, 단리된 핵산, rAAV 등)를 투여받으며, 여기서 각각의 벡터는 상이한 CNS 질환-연관 유전자 산물을 인코딩한다.
CNS-연관 질환은 신경퇴행성 질환, 시누클레인병증, 타우병증, 또는 리소좀 축적 질환일 수 있다. 신경퇴행성 질환 및 이의 연관된 유전자의 예는 표 12에 열거되어 있다.
"시누클레인병증"은 대상체(예컨대, 건강한 대상체, 예를 들어 시누클레인병증을 가지지 않는 대상체에 비함)에서 알파-시누클레인(SNCA의 유전자 산물)의 축적을 특징으로 하는 질환 또는 장애를 지칭한다. 시누클레인병증 및 이의 연관된 유전자의 예는 표 13에 열거되어 있다.
"타우병증"은 대상체(예컨대, 타우병증을 가지지 않는 건강한 대상체에 비함)에서 비정상적인 Tau 단백질의 축적을 특징으로 하는 질환 또는 장애를 지칭한다. 타우병증 및 이의 연관된 유전자의 예는 표 14에 열거되어 있다.
"리소좀 축적 질환"은 대상체의 리소좀에서 독성 세포 생성물의 비정상적인 증가를 특징으로 하는 질환을 지칭한다. 리소좀 축적 질환 및 이의 연관된 유전자의 예는 표 15에 열거되어 있다.
본 명세서에서 사용되는 바와 같이, "치료하다" 또는 "치료하는"은 (a) CNS 질환의 발병을 예방하거나 지연시키는 것; (b) CNS 질환의 중증도를 감소시키는 것; (c) CNS 질환의 특징적인 증상의 발달을 감소시키거나 예방하는 것; 및/또는 (d) CNS 질환의 특징적인 증상의 악화를 예방하는 것을 지칭한다. CNS 질환의 증상은, 예를 들어 운동 기능 장애(예컨대, 떨림, 강직, 운동 느림, 보행 곤란, 마비), 인지 기능 장애(예컨대, 치매, 우울증, 불안, 정신병), 기억 곤란, 정서적 및 행동 기능 장애를 포함할 수 있다.
본 개시내용은 부분적으로 파킨슨병을 치료하기 위해 함께(예컨대, 상승적으로) 작용하는 대상체에서 PD-연관 유전자 산물의 조합물의 발현을 위한 조성물을 기반으로 한다.
따라서, 일부 양상에서, 본 개시내용은 파킨슨병을 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 대상체에게 투여하는 단계를 포함한다.
본 개시내용은 부분적으로 고셔병을 치료하기 위해 대상체에서 하나 이상의 CNS-질환 연관 유전자 산물의 발현을 위한 조성물을 기반으로 한다. 일부 실시형태에서, 고셔병은 신경병증 고셔병, 예를 들어 2형 고셔병 또는 3형 고셔병이다. 일부 실시형태에서, 고셔병을 지니는 대상체는 PD 또는 PD 증상을 가지지 않는다.
따라서, 일부 양상에서, 본 개시내용은 신경병증 고셔병을 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 대상체에게 투여하는 단계를 포함한다.
본 개시내용은 부분적으로 알츠하이머병 또는 전두측두엽 치매(FTD)를 치료하기 위해 대상체에서 하나 이상의 CNS-질환 연관 유전자 산물의 발현을 위한 조성물을 기반으로 한다. 일부 실시형태에서, 대상체는 알츠하이머병을 지니지 않는다. 일부 실시형태에서, 대상체는 FTD를 지니고 알츠하이머병을 지니지 않는다. 일부 실시형태에서, 대상체는 GRN(프로그래뉼린) 돌연변이가 있는 FTD를 가진다. 일부 실시형태에서, 대상체는 GRN 돌연변이가 있는 FTD를 지니고, 대상체는 GRN 돌연변이(예컨대, 병원성 GRN 돌연변이)에 대해 이형접합성이다. 일부 실시형태에서, GRN 돌연변이는 삭제 돌연변이(null mutation)(예컨대, 넌센스, 프레임시프트, 또는 스플라이스 부위 돌연변이, 또는 완전한 또는 부분적 (엑손) 유전자 결실)이다. 일부 실시형태에서, GRN 돌연변이는 입증된 기능성 유해 효과가 있는 병원성 돌연변이이다. 일부 실시형태에서, GRN 돌연변이는 미스센스 병원성 돌연변이이다. 일부 실시형태에서, GRN 돌연변이는 Molgen FTD 데이터베이스(molgen.ua.ac.be)에 열거되어 있다. 일부 실시형태에서, GRN 돌연변이는 대상체에서 낮은 혈장 PGRN 수준(70 ng/㎖ 미만)을 생성한다.
일부 실시형태에서, 대상체는 FTD, GRN 돌연변이가 있는 FTD, tau 돌연변이가 있는 FTD, C9orf72 돌연변이가 있는 FTD, 신경세포 세로이드 리포푸신증, 파킨슨병, 알츠하이머병, 피질기저핵변성, 운동신경 질환, 또는 고셔병을 가진다.
일부 실시형태에서, 대상체는 증상이 있는 FTD(예컨대, 행동변이형 FTD(bvFTD), 원발 진행성 실어증(PPA)-FTD, 피질기저핵 증후군이 있는 FTD, 또는 중후군의 조합을 가진다.
따라서, 일부 양상에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 대상체에게 투여하는 단계를 포함한다.
일부 실시형태에서, 알츠하이머병 또는 FTD(예컨대, GRN 돌연변이가 있는 FTD)를 지니는 대상체는 프로그래뉼린(PGRN) 또는 이의 일부를 인코딩하는 rAAV를 투여받는다. 일부 실시형태에서, 알츠하이머병 또는 FTD(예컨대, GRN 돌연변이가 있는 FTD)를 지니는 대상체는 PGRN 또는 이의 일부를 인코딩하는 rAAV를 투여받으며, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 실시형태에서, PGRN 단백질은 서열번호 67의 아미노산 서열 또는 이의 일부를 포함한다. 일부 실시형태에서, PGRN을 인코딩하는 rAAV는 AAV9 혈청형을 갖는 캡시드 단백질을 포함한다.
일부 실시형태에서, FTD(예컨대, GRN 돌연변이가 있는 FTD)를 치료하기 위한 PGRN을 인코딩하는 rAAV를 포함하는 조성물은 약 1×1012개 벡터 게놈(vg) 내지 약 1×1015개 vg, 또는 약 1×1013개 vg 내지 약 7×1014개 vg, 또는 약 1×1013개 vg 내지 약 5×1014개 vg, 또는 약 2×1013개 vg 내지 약 2×1014개 vg, 또는 약 3×1013개 vg 내지 약 2×1014개 vg, 또는 약 3.5×1013 vg개 내지 약 1.4×1014개 vg 범위의 용량으로 대상체에게 투여된다. 일부 실시형태에서, FTD(예컨대, GRN 돌연변이가 있는 FTD)를 치료하기 위한 PGRN을 인코딩하는 rAAV를 포함하는 조성물은 약 2×1013개 vg, 약 3×1013개 vg, 약 4×1013개 vg, 약 5×1013개 vg, 약 6×1013개 vg, 약 7×1013개 vg, 약 8×1013개 vg, 약 9×1013개 vg, 약 1×1014개 vg, 또는 약 2×1014개 vg의 용량으로 대상체에게 투여된다.
일부 양상에서, 본 개시내용은 FTD(예를 들어 GRN 돌연변이가 있는 FTD)를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 PGRN을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 조성물은 약 3.5×1013개 벡터 게놈(vg), 약 7.0×1013개 vg, 또는 약 1.4×1014개 vg의 용량으로 투여된다.
일부 양상에서, 본 개시내용은 FTD(예를 들어 GRN 돌연변이가 있는 FTD)를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법을 제공하며, 상기 방법은 PGRN을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 조성물은 약 1×1014개 벡터 게놈(vg), 약 2.0×1014개 vg, 또는 약 4.0×1014개 vg의 용량으로 투여된다.
일부 실시형태에서, 대상체에 대하여 FTD(예컨대, GRN 돌연변이가 있는 FTD)를 치료하기 위해 PGRN을 인코딩하는 rAAV를 포함하는 조성물은 단일 용량으로 투여되고, 상기 조성물은 이후에 대상체에게 투여되지 않는다.
일부 실시형태에서, rAAV를 포함하는 조성물은 단일 후두하 주사를 통해 대조 내로 전달된다. 일부 실시형태에서, 대조 내로의 주사는 방사선 촬영 안내 하에 수행된다.
일부 실시형태에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 증상을 치료하는 방법을 제공하며, 상기 방법은 기능성 프로그래뉼린(PGRN) 단백질에 대한 서열을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 실시형태에서, GRN 돌연변이가 있는 FTD의 증상은 성격 변화, 실행 기능 장애, 탈억제, 감정둔마, 느린 언어 산출, 문법 오용, 다중모드 실인증, 어의성 실어증, 또는 단어 이해 장애일 수 있다. 일부 실시형태에서, PGRN을 인코딩하는 rAAV는 AAV9 혈청형을 갖는 캡시드 단백질을 포함한다.
일부 실시형태에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 뇌에서 리포푸신 축적을 감소시키는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 실시형태에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 뇌에서 유비퀴틴 축적을 감소시키는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 양상에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 뇌에서 TNFα 및/또는 CD68의 유전자 발현 및/또는 단백질 발현을 감소시키는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 양상에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 뇌에서 카텝신 D의 성숙을 증가시키는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 양상에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 뇌에서 핵 TDP-43(트랜스액티프 반응 DNA 결합 단백질 43 kDa)의 수준을 증가시키는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 실시형태에서, 본 개시내용은 GRN 돌연변이가 있는 FTD를 지니거나 지니는 것으로 의심되는 대상체의 혈액 또는 CSF에서 신경미세섬유 경쇄(NFL)의 수준을 감소시키는 방법을 제공하며, 상기 방법은 프로그래뉼린(PGRN)을 인코딩하는 rAAV를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하고, 여기서 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68의 핵산 서열에 의해 인코딩된다. 일부 실시형태에서, PGRN을 인코딩하는 rAAV는 AAV9 혈청형을 갖는 캡시드 단백질을 포함한다.
대상체는 전형적으로 포유동물, 바람직하게는 인간이다. 일부 실시형태에서, 대상체는 연령이 1개월 내지 10세(예컨대, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 12개월, 13개월, 14개월, 15개월, 16개월, 17개월, 18개월, 19개월, 20개월, 21개월, 22개월, 23개월, 24개월, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 또는 이 사이의 임의의 연령)이다. 일부 실시형태에서, 대상체는 2세 내지 20세이다. 일부 실시형태에서, 대상체는 30세 내지 100세이다. 일부 실시형태에서, 대상체는 55세 초과이다.
일부 실시형태에서, 조성물은, 예를 들어 대상체의 뇌 및/또는 척수 내로의 직접 주사에 의해, 대상체의 CNS에 직접 투여된다. CNS-직접 투여 방식의 예는 뇌내 주사, 뇌실내 주사, 수조내 주사, 뇌실질내 주사, 척수강내 주사, 및 상기한 것 중 임의의 조합을 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 조성물은 대조내(ICM) 주사에 의해 대상체에게 투여된다. 일부 실시형태에서, 대상체의 CNS 내로의 직접 주사는 대상체의 중뇌, 선조체 및/또는 대뇌 피질에서 이식유전자 발현(예컨대, 제1 유전자 산물, 제2 유전자 산물, 및 적용 가능한 경우 제3 유전자 산물의 발현)을 초래한다. 일부 실시형태에서, CNS 내로의 직접 주사는 대상체의 척수 및/또는 CSF에서 이식유전자 발현(예컨대, 제1 유전자 산물, 제2 유전자 산물, 및 적용 가능한 경우 제3 유전자 산물의 발현)을 초래한다.
일부 실시형태에서, 대상체의 CNS에 대한 직접 주사는 전도 촉진 투여(convection enhanced delivery; CED)를 포함한다. 전도 촉진 투여는 뇌를 외과적으로 노출시키고 뇌의 표적 영역 내로 소구경 카테터의 직접 배치한 다음 대상체의 뇌에 치료제(예컨대, 본 명세서에 기재된 바와 같은 조성물 또는 rAAV)를 직접 주입하는 것을 포함하는 치료 전략이다. CED는, 예를 들어 문헌[Debinski et al. (2009) Expert Rev Neurother . 9(10):1519-27]에 기재되어 있다.
일부 실시형태에서, 조성물은, 예를 들어 말초 주사에 의해 대상체에게 말초로 투여된다. 말초 주사의 예는 피하 주사, 정맥내 주사, 동맥내 주사, 복강내 주사, 또는 상기한 것 중 임의의 조합을 포함한다. 일부 실시형태에서, 말초 주사는 동맥내 주사, 예를 들어 대상체의 경동맥으로의 주사이다.
일부 실시형태에서, 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)은 대상체의 말초 및 CNS로 직접 투여된다. 예를 들어, 일부 실시형태에서, 대상체는 동맥내 주사(예컨대, 경동맥 내로의 주사)에 의해 그리고 뇌실질내 주사(예컨대, CED에 의한 뇌실질내 주사)에 의해 투여된다. 일부 실시형태에서, CNS로의 직접 주사 및 말초 주사는 동시적이다(예컨대, 동시에 발생함). 일부 실시형태에서, 직접 주사는 말초 주사 이전(예컨대, 1분 내지 1주, 또는 그 이상 전)에 일어난다. 일부 실시형태에서, 직접 주사는 말초 주사 후(예컨대, 1분 내지 1주, 또는 그 이상 후)에 일어난다.
일부 실시형태에서, 대상체는 본 명세서에 기재된 바와 같은 조성물 이전에(예컨대, 1개월 내지 1분 이전에) 또는 동시에 면역억제제를 투여받는다. 일부 실시형태에서, 면역억제제는 코르티코스테로이드(예컨대, 프레드니손, 부데소나이드 등), mTOR 저해제(예컨대, 시롤리무스, 에베로리무스 등), 항체(예컨대, 아달리무맙, 에타너셉트, 나탈리주맙 등), 또는 메토트렉세이트이다.
대상체에게 투여되는 본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)의 양은 투여 방법에 따라 달라질 것이다. 예를 들어, 일부 실시형태에서, 본 명세서에 기재된 바와 같은 rAAV는 약 109개 게놈 복제물(GC)/㎏ 내지 약 1014개 GC/㎏(예컨대, 약 109개 GC/㎏, 약 1010개 GC/㎏, 약 1011개 GC/㎏, 약 1012개 GC/㎏, 약 1012개 GC/㎏, 또는 약 1014개 GC/㎏)의 역가로 대상체에게 투여된다. 일부 실시형태에서, 대상체는 CSF 공간으로의 주입에 의해, 또는 뇌실질내 주사에 의해 높은 역가(예컨대, 1012개 게놈 복제물(GC)/rAAV의 ㎏ 초과)로 투여받는다. 일부 실시형태에서, 본 명세서에 기재된 바와 같은 rAAV는 정맥내 주사에 의해 약 1×1010개 벡터 게놈(vg) 내지 약 1×1017개 vg 범위의 용량으로 대상체에게 투여된다. 일부 실시형태에서, 본 명세서에 기재된 바와 같은 rAAV는 대조 내로의 주사에 의해 약 1×1010개 vg 내지 약 1×1016개 vg 범위의 용량으로 대상체에게 투여된다.
본 개시내용에 의해 기재된 바와 같은 조성물(예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)은 1회 또는 다수회(예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20회, 또는 그 이상) 대상체에게 투여될 수 있다. 일부 실시형태에서, 조성물은, 예를 들어 주입 펌프를 통해 지속적으로(예컨대, 만성적으로) 대상체에게 투여된다.
실시예
실시예 1: rAAV 벡터
AAV 벡터는 삼중-플라스미드 형질감염을 위해 HEK293 세포와 같은 세포를 사용하여 생성된다. ITR 서열은 관심이 있는 각각의 이식유전자에 대한 프로모터/인핸서 요소, 3' 폴리A 신호, 및 WPRE 요소와 같은 번역후 신호를 포함하는 발현 작제물에 측접한다. 단백질 서열의 융합에 의해; 또는 펩타이드 결합의 생성 방지로 인해 아미노산이 첨가된 2개의 펩타이드 단편을 유도하는 2A 펩타이드 링커, 예컨대, T2A 또는 P2A를 사용하여; 또는 IRES 요소를 사용하여; 또는 2개의 개별 발현 카세트를 이용하는 발현에 의해, GBA1LIMP2 및/또는 프로사포신과 같은 다중 유전자 산물이 동시에 발현될 수 있다. 발현된 유전자의 상류에서 효율적으로 스플라이싱되는 짧은 인트론 서열의 존재는 발현 수준을 개선시킬 수 있다. shRNA 및 다른 조절 RNA는 이들 서열 내에 잠재적으로 포함될 수 있다. 본 개시내용에 의해 기재되는 발현 작제물의 예는 도 1 내지 8, 21 내지 35, 39, 41 내지 51 및 64 및 하기 표 2에 표시되어 있다.
Figure pct00003
Figure pct00004
실시예 2: GBA -결핍 세포 내로의 바이러스 형질도입의 세포 기반 분석
GBA1이 결핍된 세포는, 예를 들어 GD 환자 유래의 섬유아세포, 단핵구, 또는 hES 세포, 또는 환자-유래의 유도 만능 줄기 세포(iPSC)로서 수득된다. 이들 세포는 글루코실세라마이드 및 글루코실스핑고신(GlcCer 및 GlcSph)과 같은 기질을 축적한다. CBE와 같은 Gcase 저해제로 야생형 또는 돌연변이 배양 세포주를 처리하는 것도 또한 GBA 결핍 세포를 수득하는 데 사용된다.
이와 같은 세포 모델을 사용하여, 리소좀 결함은 이러한 단백질 또는 포스포-αSyn에 대한 항체를 갖는 α-시누클레인과 같은 단백질 응집체의 축적에 대해 정량화된 다음, 형광 현미경을 사용하여 영상화된다. LAMP1, LAMP2, LIMP1, LIMP2와 같은 단백질 마커에 대한 ICC에 의해, 또는 Lysotracker와 같은 염료를 사용하여, 또는 형광 덱스트란 또는 다른 마커의 세포내 구획을 통한 흡수에 의한 리소좀 이상에 대한 영상화도 또한 수행된다. LC3과 같은 리소좀과의 결함이 있는 융합으로 인한 자가포식 마커 축적에 대한 영상화도 또한 수행될 수 있다. 웨스턴 블롯팅 및/또는 ELISA는 이들 마커의 비정상적인 축적을 정량화하는 데 사용된다. 또한, 당지질 기질 및 GBA1의 산물의 축적은 표준 접근법을 사용하여 측정된다.
처리 종점(예컨대, PD-연관 병리의 감소)은 AAV 벡터의 형질도입의 발현의 맥락에서 측정되어 활성 및 기능을 확인하고 정량화한다. Gcase는 또한 단백질 ELISA 측정을 사용하여, 또는 표준 Gcase 활성 분석에 의해 정량화될 수 있다.
실시예 3: 돌연변이 마우스를 사용한 생체내 분석
이 실시예는 돌연변이 마우스를 사용한 AAV 벡터의 생체내 분석을 기재한다. 예를 들어 문헌[Liou et al. (2006) J. Biol . Chem . 281(7): 4242-4253, Sun et al. (2005) J. Lipid Res. 46:2102-2113, 및 Farfel-Becker et al. (2011) Dis . Model Mech . 4(6):746-752]에 의해 기재된 분석을 사용하여, 돌연변이 마우스에서 상기와 같은 AAV 벡터의 생체내 연구를 수행한다.
비히클 대조군 및 AAV 벡터의 (예컨대, 2×1011개 vg/마우스의 용량으로) 척추강내 또는 뇌실내 전달을, 예를 들어 5 내지 10㎕의 주사 부피로, 농축된 AAV 스톡을 사용하여 수행한다. 전도 촉진 투여에 의한 뇌실질내 전달을 수행한다.
증상의 발병 전, 또는 발병 후에 처리를 개시한다. 측정된 종점은 CNS 및 CSF의 기질 축적, ELISA에 의한 Gcase 효소 및 효소 활성의 축적, 운동 및 인지 종점, 리소좀 기능 장애, 및 α-시누클레인 단량체, 프로토피브릴 또는 피브릴의 축적이다.
실시예 4: 질환의 화학적 모델
이 실시예는 고셔병의 화학적으로 유도된 마우스 모델(예컨대, CBE 마우스 모델)을 사용하여 AAV 벡터의 생체내 분석을 기재한다. 이러한 AAV 벡터의 생체내 연구를, 예를 들어 문헌[Vardi et al. (2016) J Pathol . 239(4):496-509]에 의해 기재된 바와 같은 고셔병의 화학적으로 유도된 마우스 모델에서 수행한다.
비히클 대조군 및 AAV 벡터의 (예컨대, 2×1011개 vg/마우스의 용량으로) 척추강내 또는 뇌실내 전달을, 예를 들어 5 내지 10㎕의 주사 부피로, 농축된 AAV 스톡을 사용하여 수행한다. 전도 촉진 투여에 의한 뇌실질내 전달을 수행한다. 꼬리 정맥 주사에 의해 말초 전달을 달성한다.
증상의 발병 전, 또는 발병 후에 처리를 개시한다. 측정된 종점은 CNS 및 CSF의 기질 축적, ELISA에 의한 Gcase 효소 및 효소 활성의 축적, 운동 및 인지 종점, 리소좀 기능 장애, 및 α-시누클레인 단량체, 프로토피브릴 또는 피브릴의 축적이다.
실시예 5: PD, LBD , 고셔병 환자에서의 임상 시험
일부 실시형태에서, 고셔병의 특정 형태(예컨대, GD1)를 지니는 환자는 파킨슨병(PD) 또는 루이소체 치매(LBD)가 발병할 위험이 증가한다. 이 실시예는 고셔병, PD 및/또는 LBD를 갖는 환자에서 본 개시내용에 의해 기재된 바와 같은 rAAV의 안전성 및 효율성을 평가하는 임상 시험을 기재한다.
문헌[Grabowski et al. (1995) Ann. Intern. Med . 122(1):33-39]에 기재된 것과 유사한 연구 설계를 사용하여 고셔병, PD 및/또는 LBD의 치료를 위한 이와 같은 벡터의 임상 시험을 수행한다.
실시예 6: 말초 질환의 치료
일부 실시형태에서, 고셔병의 특정 형태를 지니는 환자는, 예를 들어 문헌[Biegstraaten et al. (2010) Brain 133(10):2909-2919]에 기재된 바와 같은 말초 신경병증의 증상을 나타낸다.
이 실시예는 고셔병(예컨대, 1형 고셔병)과 연관된 말초 신경병증의 치료를 위한 본 명세서에 기재된 바와 같은 AAV 벡터의 생체내 분석을 기재한다. 간략하게, 말초 신경병증의 징후 또는 증상을 지니는 것으로 확인된 1형 고셔병 환자에게 본 개시내용에 의해 기재된 바와 같은 rAAV를 투여한다. 일부 실시형태에서, 대상체의 말초 신경병증 징후 및 증상을, 예를 들어 rAAV의 투여 후 문헌[Biegstraaten et al.]에 기재된 방법을 사용하여 모니터링한다.
예를 들어 웨스턴 블롯 분석, 효소 기능 분석, 또는 영상화 연구에 의해, 환자(예컨대, 환자의 혈청, 환자의 말초 조직(예컨대, 간 조직, 비장 조직 등))에 존재하는 본 개시내용에 의해 기재된 바와 같은 형질도입된 유전자 산물의 수준을 분석한다.
실시예 7: CNS 형태의 치료
이 실시예는 고셔병의 CNS 형태의 치료를 위해 본 명세서에 기재된 바와 같은 rAAV의 생체내 분석을 기재한다. 간략하게, 고셔병의 CNS 형태(예컨대, 2형 또는 3형 고셔병)를 지니는 것으로 확인된 고셔병 환자에게 본 개시내용에 의해 기재된 바와 같은 rAAV를 투여한다. 예를 들어 웨스턴 블롯 분석, 효소 기능 분석, 또는 영상화 연구에 의해, 환자의 CNS(예컨대, 환자의 CNS의 혈청, 환자의 뇌척수액(CSF), 또는 환자의 CNS 조직)에 존재하는 본 개시내용에 의해 기재된 바와 같은 형질도입된 유전자 산물의 수준을 분석한다.
실시예 8: GBA1에 돌연변이를 가진 대상체에서 파킨슨병의 요전자 요법
이 실시예는 GBA1 유전자의 돌연변이를 특징으로 하는 파킨슨병을 가지는 대상체에게 GBA1을 인코딩하는 재조합 아데노-연관 바이러스(rAAV)의 투여를 기재한다.
rAAV-GBA1 벡터 삽입체는 CMV 인핸서(CMVe), CBA 프로모터(CBAp), 엑손 1, 및 인트론(int)의 4개 부분으로 이루어진 CBA 프로모터 요소(CBA)를 포함하여 인간 GBA1(적갈색)의 코돈 최적화된 코딩 서열(CDS)을 구성적으로 발현한다. 3' 영역은 또한 우드척 간염 바이러스 전사후 조절 요소(WPRE) 전사후 조절 요소, 그 다음에 소 성장 호르몬 폴리A 신호(bGH 폴리A) 꼬리를 포함한다. 측접 ITR은 개재 서열의 올바른 패키징을 가능하게 한다. 5' ITR 서열의 2가지 변이체(도 7, 삽입 상자, 하단 서열)를 평가하였으며; 이들 변이체는 ITR의 20개 뉴클레오타이드 "D" 영역 내에서 몇 가지 뉴클레오타이드 차이를 가지고, 이는 패키징 및 발현의 효율에 영향을 미치는 것으로 여겨진다. rAAV-GBA1 벡터 산물은 도 7(삽입 상자, 상단 서열)에 나타낸 "D" 도메인 뉴클레오타이드 서열을 포함한다. 변이체 벡터는 전임상 연구에서 유사하게 수행된, 돌연변이 "D" 도메인(본 명세서에서 "S" 도메인으로 지칭되며, 음영으로 나타낸 뉴클레오타이드 변화가 있음)을 보유한다. 백본은 카나마이신에 대한 내성을 부여하는 유전자뿐만 아니라, 역패키징을 방지하는 스터퍼 서열을 포함한다. rAAV-GBA1 벡터를 도시하는 개략도는 도 8에 표시되어 있다. rAAV-GBA1 벡터는 AAV9 혈청형 캡시드 단백질을 사용하여 rAAV 내로 패키징된다.
rAAV-GBA1은 형광투시법 안내 후두하 주사를 통해 대조 내(대조내; ICM)로 대상체에게 투여된다. rAAV-GBA1 투약 요법 연구의 일 실시형태는 다음과 같다:
비임상 약리학 및 독성학 연구의 결과를 기반으로 하여 결정된 두 가지 용량 수준(3e13 vg(저용량); 1e14 vg(고용량) 등) 중 한 가지로 환자(N=12)에게 단일 용량의 rAAV-GBA1를 투여한다.
GCase의 저해제인 콘두리톨-b-에폭사이드(CBE)의 매일 전달을 포함하는 화학적 마우스 모델에서 초기 연구를 수행하여 rAAV-GBA1 벡터 및 rAAV-GBA1 S-변이체 작제물(하기에 추가로 기재함)의 효능 및 안전성을 평가하였다. 추가적으로, 동형접합 GBA1 돌연변이를 보유하고 사포신(4L/PS-NA)이 부분적으로 결핍된 유전자 마우스 모델에서 초기 연구를 수행하였다. 마우스 및 비인간 영장류(NHP)에서 추가적인 용량-범위 연구를 수행하여 벡터 안전성 및 효능을 추가로 평가한다.
AAV 백본에서 5' 반전 말단 반복부(ITR)의 2가지 약간 상이한 버전을 테스트하여 제조 가능성 및 이식유전자 발현을 평가하였다(도 7). 145 bp 5' ITR 내의 20 bp "D" 도메인은 최적의 바이러스 벡터 생성에 필요한 것으로 여겨지지만, "D" 도메인 내의 돌연변이도 또한 일부 경우에 이식유전자 발현을 증가시키는 것으로 보고되었다. 따라서, 온전한 "D" 도메인을 보유하는 바이러스 벡터 rAAV-GBA1에 추가적으로, 돌연변이 D 도메인(본 명세서에서 "S" 도메인으로 지칭됨)이 있는 제2 벡터 형태를 또한 평가하였다. rAAV-GBA1 및 변이체는 둘 다 동일한 이식유전자를 발현한다. 하기 상세히 기재된 바와 같이 두 벡터 모두 생체내에서 효과적인 바이러스를 생성하였지만, 야생형 "D" 도메인을 포함하는 rAAV-GBA1을 추가 개발을 위해 선택하였다.
GCase 결핍의 CBE 모델을 확립하기 위해, 새끼 마우스에 GCase의 특이적 저해제인 CBE를 투약하였다. 생후 제8일(P8)에 시작하여, 매일 IP 주사로 마우스에게 CBE를 제공하였다. 3가지 상이한 CBE 용량(25 ㎎/㎏, 37.5 ㎎/㎏, 50 ㎎/㎏) 및 PBS를 테스트하여 행동 표현형을 나타내는 모델을 확립하였다(도 9). 더 높은 용량의 CBE는 용량-의존적 방식으로 치사성을 야기하였다. 50 ㎎/㎏ CBE로 처리된 모든 마우스는 P23까지 사망하였고, 37.5 ㎎/㎏ CBE로 처리한 8마리 마우스 중 5마리는 P27까지 사망하였다. 25 ㎎/㎏ CBE로 처리된 마우스에서는 치사성이 없었다. CBE-주사 마우스가 개방 필드 분석에서 일반적인 운동 결손을 나타내지 않은 반면(PBS가 제공된 마우스와 동일한 거리를 그리고 동일한 속도로 이동함), CBE-처리 마우스는 로타로드 분석에 의해 측정된 바와 같이 운동 협응 및 균형 결손을 나타내었다.
연구 종료시까지 생존한 마우스를 마지막 CBE 투약 후(P27, "제1일") 또는 CBE 중단 3일 후(P29, "제3일")에 희생시켰다. 25 ㎎/㎏ CBE를 제공한 마우스의 피질에서 지질 분석을 수행하여 제1일 및 제3일 코호트 둘 다에서 GCase 기질의 축적을 평가하였다. (이 실시예에서 합계로 측정된) GluSph 및 GalSph 수준은 PBS-처리 대조군과 비교하여 CBE-처리 마우스에서 유의하게 축적되었으며, 이는 GCase 불충분과 일치한다.
상기 기재한 연구를 기반으로 하여, 25 ㎎/㎏ CBE 용량이 생존에 영향을 미치지 않으면서 행동 결손을 나타내었기 때문에 선택하였다. CBE 처리 동안 뇌 전반에 걸친 광범위한 GBA1 분포 및 이식유전자 발현을 달성하기 위해, 생후 제3일(P3)에 뇌실내(intracerebroventricular; ICV) 주사에 의해, 그 다음 P8에 개시되는 매일 IP CBE 또는 PBS 처리에 의해 rAAV-GBA1 또는 부형제를 전달하였다(도 10).
rAAV-GBA1을 받은 CBE-처리 마우스는 부형제를 받은 마우스보다 로타로드에서 통계적으로 유의하게 더 나은 수행을 하였다(도 11). 변이체 처리군의 마우스는 테스트 동안 이동한 총 거리와 같은 다른 행동 측정의 관점에서 부형제 처리 마우스와 상이하지 않았다(도 11).
생전 연구의 완료시, 마우스의 절반을 생화학적 분석을 위해 마지막 CBE 투약 후 당일(P36, "제1일") 또는 CBE 중단 3일 후(P38, "제3일")에 희생시켰다(도 12). 생물학적으로 삼중으로 수행한 형광 효소 분석을 사용하여 피질에서 GCase 활성을 평가하였다. GCase 활성은 rAAV-GBA1로 처리한 마우스에서 증가한 반면, CBE 처리는 GCase 활성을 감소시켰다. 추가적으로, CBE 및 rAAV-GBA1을 둘 다 받은 마우스는 PBS-처리군과 유사한 GCase 활성 수준을 가졌으며, 이는 rAAV-GBA1의 전달이 CBE 처리에 의해 유도된 GCase 활성의 저해를 극복할 수 있음을 나타낸다. 마우스의 운동 피질에서 지질 분석을 수행하여 GluCer 및 GluSph 기질의 수준을 조사하였다. CBE 및 rAAV-GBA1 처리를 제공받은 마우스의 뇌에 축적된 두 가지 지질 모두 기질 축적을 유의하게 감소시켰다.
지질 수준은 처리군에 걸쳐 로타로드에 대한 GCase 활성 및 성능 둘 다와 음의 상관관계가 있었다. rAAV-GBA1 투여 후 증가된 GCase 활성은 기질 감소 및 향상된 운동 기능과 연관이 있었다(도 13). 도 14에 나타낸 바와 같이, 예비 생체분포를 qPCR에 의해 측정된 바와 같은 벡터 게놈 존재에 의해 평가하였다(1㎍ 게놈 DNA당 100개 초과의 벡터 게놈을 양성으로 정의함). CBE와 함께 그리고 없이 rAAV-GBA1을 받은 마우스는 피질에서 rAAV-GBA1 벡터 게놈에 대해 양성이었으며, 이는 ICV 전달이 피질로의 rAAV-GBA1 전달을 초래함을 나타낸다. 추가적으로, 벡터 게놈은 간에서 검출되고, 비장에서는 거의 검출되지 않았으며, 심장, 신장 또는 생식선에서는 검출되지 않았다. 모든 측정에 있어서, 제1일과 제3일 그룹 간에 통계적으로 유의한 차이는 없었다.
CBE 모델에서 더 큰 연구는 CBE 모델에서 rAAV-GBA1의 유효 용량을 추가로 조사하였다. 25 ㎎/㎏ CBE 용량 모델을 사용하여, 부형제 또는 rAAV-GBA1을 ICV를 통해 P3에 전달하고, 매일 IP PBS 또는 CBE 처리를 P8에 개시하였다. 이전 연구에서 관찰된 CBE 중단이 있는 그룹과 없는 그룹 간의 유사성을 고려하여, 최종 CBE 투약 1일 후(P38 내지 40)에 모든 마우스를 희생시켰다. 3가지 상이한 rAAV-GBA1 용량의 효과를 평가하여 그룹당 10마리 마우스(5M/5F)가 있는 다음 5개 그룹을 생성하였다:
부형제 ICV + PBS IP
부형제 ICV + 25 ㎎/㎏ CBE IP
3.2e9 vg(2.13e10 vg/뇌 g) rAAV-GBA1 ICV + 25 ㎎/㎏ CBE IP
1.0e10 vg(6.67e10 vg/뇌 g) rAAV-GBA1 ICV + 25 ㎎/㎏ CBE IP
3.2e10 vg(2.13e11 vg/뇌 g) rAAV-GBA1 ICV + 25 ㎎/㎏ CBE IP.
최고 용량의 rAAV-GBA1은 CBE 처리-관련 실패를 구제하여 P37에 체중이 증가하였다. 추가적으로, 이 용량은 부형제 + CBE 처리군과 비교하여 로타로드 및 테이퍼 빔에 대한 성능의 통계적으로 유의한 증가를 초래하였다(도 15). 부형제-처리군 및 rAAV-GBA1-처리군(부형제 + PBS: 0; 부형제 + 25 ㎎/㎏ CBE: 1; 3.2e9 vg rAAV-GBA1+ 25 ㎎/㎏ CBE: 4; 1.0e10 vg rAAV-GBA1+ 25 ㎎/㎏ CBE: 0; 3.2e10 vg rAAV-GBA1+ 25 ㎎/㎏ CBE: 3) 모두를 포함하여, 여러 그룹에서 치사성이 관찰되었다.
생전 연구의 완료시, 생화학적 분석을 위해 마우스를 희생시켰다(도 16). 형광 분석에 의해 생물학적 삼중으로 피질에서 GCase 활성을 평가하였다. CBE-처리 마우스는 감소된 GCase 활성을 나타낸 반면, 높은 rAAV-GBA1 용량을 받은 마우스는 CBE 처리와 비교하여 GCase 활성에서 통계적으로 유의한 증가를 나타내었다. CBE-처리 마우스에는 또한 GluCer 및 GluSph의 축적이 있었으며, 이들 둘 다 고용량의 rAAV-GBA1을 투여함으로써 구제되었다.
확립된 화학적 CBE 모델에 추가적으로, Gba1의 V394L GD 돌연변이에 대해 동형접합성이고 GCase 국재화 및 활성에 영향을 미치는 사포신이 부분적으로 결핍된 4L/PS-NA 유전자 모델에서 rAAV-GBA1을 또한 평가하였다. 이들 마우스는 빔 워크, 로타로드, 및 와이어 행(wire hang) 분석에서의 성능에 의해 입증된 바와 같이, 운동 강도, 협응, 및 균형 결핍을 나타낸다. 전형적으로 이들 마우스의 수명은 22주 미만이다. 초기 연구에서, 3㎕의 최대 역가 바이러스를 ICV에 의해 P23에 전달하였으며, 이 때 최종 용량은 2.4e10 vg(6.0e10 vg/뇌 g)이었다. 그룹당 6마리의 마우스로 하여, 처리군은 다음과 같았다:
WT + 부형제 ICV
4L/PS-NA + 부형제 ICV
4L/PS-NA + 2.4e10 vg(6.0e10 vg/뇌 g) rAAV-GBA1 ICV
rAAV-GBA1 전달 4주 후에 빔 워크 테스트에 의한 운동 성능을 평가하였다. rAAV-GBA1을 받은 돌연변이 마우스의 그룹은 부형제로 처리한 돌연변이 마우스와 비교할 때 더 적은 총 미끄러짐 및 속도당 더 적은 미끄러짐에 대한 경향을 나타내어, 거의 WT 수준으로 운동 기능을 회복시켰다(도 17). 운동 표현형은 이들 마우스가 나이를 먹음에 따라 더 심해지기 때문에, 이러한 행동 테스트 및 다른 행동 테스트에 대한 마우스의 성능을 나중 시점에 평가한다. 생전 연구의 완료시, 이들 마우스에서 지질 수준, GCase 활성, 및 생체분포를 평가한다.
제안된 1상의 높은 임상 용량의 0.03×, 0.1×, 및 1×에 해당하는 추가적인 더 낮은 용량의 rAAV-GBA1이 CBE 모델을 사용하여 현재 테스트되고 있다. 각각의 그룹은 그룹당 10마리의 마우스(5M/5F)를 포함한다:
부형제 ICV
부형제 ICV + 25 ㎎/㎏ CBE IP
3.2e8 vg(2.13e9 vg/뇌 g) rAAV-GBA1 ICV + 25 ㎎/㎏ CBE IP
1.0e9 vg(6.67e9 vg/뇌 g) rAAV-GBA1 ICV + 25 ㎎/㎏ CBE IP
1.0e10 vg(6.67e10 vg/뇌 g) rAAV-GBA1 ICV + 25 ㎎/㎏ CBE IP.
운동 표현형에 추가적으로, 피질에서 지질 수준 및 GCase 활성을 평가한다. 처리의 시간경로 및 분석을 또한 수행한다.
더 큰 용량 범위 연구를 개시하여 효능 및 안전성 데이터를 평가하였다. 10마리의 4L/PS-NA 마우스(그룹당 5M/5F)에 10㎕의 rAAV-GBA1을 주사하였다. 상대성장(allometric) 뇌 중량 계산을 사용하면, 용량은 제안된 1상의 높은 임상 용량의 0.15×, 1.5×, 4.4×, 및 14.5×와 상관관계가 있다. 주사 그룹은 다음으로 이루어진다:
WT + 부형제 ICV
4L/PS-NA + 부형제 ICV
4L/PS-NA + 4.3e9 vg(1.1e10 vg/뇌 g) rAAV-GBA1 ICV
4L/PS-NA + 4.3e10 vg(1.1e11 vg/g/뇌) rAAV-GBA1 ICV
4L/PS-NA + 1.3e11 vg(3.2e11 vg/뇌 g) rAAV-GBA1 ICV
4L/PS-NA + 4.3e11 vg(1.1e12 vg/뇌 g) rAAV-GBA1 ICV.
실시예 9: rAAV 벡터의 시험관내 분석
rAAV 작제물을 시험관내 및 생체내에서 테스트하였다. 도 18은 프로그래뉼린(PGRN) 단백질을 인코딩하는 rAAV 작제물의 시험관내 발현에 대한 대표적인 데이터를 나타낸다. 좌측 패널은 프로그래뉼린(PGRN) ELISA 분석의 표준 곡선을 나타낸다. 하단 패널은 rAAV로 형질도입된 HEK293T 세포의 세포 용해물에서 ELISA 분석에 의해 측정된 PGRN 발현의 용량-반응을 나타낸다. MOI = 감염다중도(세포당 벡터 게놈).
파일럿 연구를 수행하여 단독으로 또는 GBA1 및/또는 하나 이상의 저해성 RNA와 조합하여 프로사포신(PSAP) 및 SCARB2를 인코딩하는 rAAV 벡터의 시험관내 활성을 평가하였다. PSAP 및 프로그래뉼린(PGRN)을 인코딩하는 하나의 작제물을 또한 테스트하였다. 테스트한 벡터는 표 3에 나타낸 것을 포함한다. "Opt"는 포유동물 세포(예컨대, 인간 세포)에서의 발현을 위해 코돈 최적화된 핵산 서열을 지칭한다. 도 19는 각각의 작제물을 이용한 HEK293 세포의 형질감염이 모의 형질감염된 세포와 비교하여 상응하는 유전자 산물의 과발현을 초래하였음을 나타내는 대표적인 데이터를 나타낸다.
파일럿 연구를 수행하여 단독으로 또는 하나 이상의 저해성 RNA와 조합하여 TREM2를 인코딩하는 rAAV 벡터의 시험관내 활성을 평가하였다. 테스트한 벡터는 표 3에 나타낸 것을 포함한다. "Opt"는 포유동물 세포(예컨대, 인간 세포)에서의 발현을 위해 코돈 최적화된 핵산 서열을 지칭한다. 도 36A 내지 도 36B는 각각의 작제물을 이용한 HEK293 세포의 형질감염이 모의 형질감염된 세포와 비교하여 상응하는 유전자 산물의 과발현을 초래하였음을 나타내는 대표적인 데이터를 나타낸다.
Figure pct00005
실시예 10: SNCA TMEM106B shRNA 작제물의 테스트
HEK293 세포
인간 배아 신장 293 세포주(HEK293)를 이 연구에 사용하였다(#85120602, Sigma-Aldrich). 100 유닛/㎖ 페니실린 및 100 ㎍/㎖ 스트렙토마이신(#15140122, Thermo Fisher Scientific)을 포함하는 배양 배지(10% 소태아혈청[FBS][#10082147, Thermo Fisher Scientific]이 보충된 D-MEM[#11995065, Thermo Fisher Scientific])에서 HEK293 세포를 유지하였다.
플라스미드 형질감염
제조업체의 지침에 따라 Lipofectamine 2000 형질감염 시약(#11668019, Thermo Fisher Scientific)을 사용하여 플라스미드 형질감염을 수행하였다. 간략하게, 항생제가 없는 배양 배지에 3×105개 세포/㎖의 밀도로 HEK293 세포(#12022001, Sigma-Aldrich)를 도말하였다. 다음 날, 플라스미드와 Lipofectamine 2000 시약을 Opti-MEM 용액(#31985062, Thermo Fisher Scientific) 중에서 혼합하였다. 5분 후, 혼합물을 HEK293 배양물에 첨가하였다. 72시간 후, 세포를 RNA 또는 단백질 추출을 위해 수확하거나, 영상 분석을 수행하였다. 영상 분석을 위해, 세포를 도말하기 전에 플레이트를 0.01% 폴리-L-라이신 용액(P8920, Sigma-Aldrich)으로 미리 코팅하였다.
정량적 실시간 PCR(qRT-PCR)에 의한 유전자 발현 분석
제조업체의 지침에 따라 Power SYBR Green Cells-to-CT Kit(#4402955, Thermo Fisher Scientific)를 사용하는 정량적 실시간 PCR(qRT-PCR)에 의해 상대적인 유전자 발현 수준을 결정하였다. Lipofectamine 2000 형질감염 시약(50㎕ Opti-MEM 용액 중 0.5㎍ 플라스미드 및 1.5㎕ 시약)을 사용하여 48-웰 플레이트에 도말된 HEK293 세포(7.5×104개 세포/웰)로 후보 플라스미드를 일시적으로 형질감염시켰다. 72시간 후, RNA를 세포에서 추출하고 역전사에 사용하여 제조업체의 지침에 따라 cDNA를 합성하였다. 정량적 PCR 분석을 위해, Power SYBR Green PCR Master Mix(#4367659, Thermo Fisher Scientific)와 함께 유전자 특이적 프라이머 쌍(250 nM 최종 농도)을 사용하여 2 내지 5㎕의 cDNA 산물을 이중으로 증폭시켰다. SNCA , TMEM106B, 및 GAPDH 유전자에 대한 프라이머 서열은 다음과 같았다: SNCA에 대해 5'- AAG AGG GTG TTC TCT ATG TAG GC -3'(서열번호 71), 5'- GCT CCT CCA ACA TTT GTC ACT T -3'(서열번호 72), TMEM106B에 대해 5'-ACA CAG TAC CTA CCG TTA TAG CA-3'(서열번호 73), 5'-TGT TGT CAC AGT AAC TTG CAT CA-3'(서열번호 74), 및 GAPDH에 대해 5'- CTG GGC TAC ACT GAG CAC C -3'(서열번호 75), 5'- AAG TGG TCG TTG AGG GCA ATG -3'(서열번호 76). 정량적 PCR을 QuantStudio 3 Real-Time PCR 시스템(Thermo Fisher Scientific)에서 수행하였다. 발현 수준을 하우스키핑 유전자인 GAPDH에 의해 정규화하고 비교 CT 방법을 사용하여 계산하였다.
형광 영상 분석
EGFP 코딩 영역의 하류에 인간 SNCA 유전자의 3'-UTR을 포함하는 EGFP 리포터 플라스미드를 SNCATMEM106B 넉다운 플라스미드의 검증에 사용하였다. Lipofectamine 2000 형질감염 시약(10㎕ Opti-MEM 용액 중 0.04㎍ 리포터 플라스미드, 0.06㎍ 넉다운 플라스미드 및 0.3㎕ 시약)을 사용하여 폴리-L-라이신 코팅 96-웰 플레이트에 도말된 HEK293 세포(3.0×104개 세포/웰)로 EGFP 리포터 플라스미드 및 후보 넉다운 플라스미드를 동시에 형질감염시켰다. 72시간 후, Varioskan LUX 다중모드 판독기(Thermo Fisher Scientific)를 사용하여 여기 488㎚/방출 512㎚에서 EGFP 신호의 형광 강도를 측정하였다. 세포를 RT에서 10분 동안 4% PFA로 고정시키고, 40 ㎍/㎖ 7-아미노악티노마이신 D(7-AAD)를 포함하는 D-PBS와 함께 RT에서 30분 동안 인큐베이션시켰다. D-PBS로 세척한 후, Varioskan 판독기를 사용하여 여기 546㎚/방출 647㎚에서 7-AAD 신호의 형광 강도를 측정하여 세포 수를 정량화하였다. 7-AAD 신호 수준당 정규화한 EGFP 신호를 대조군 넉다운 샘플과 비교하였다.
효소-결합 면역흡착 분석(ELISA)
SNCA 코딩 영역의 하류에 인간 SNCA 유전자 또는 TMEM106B 유전자의 3'-UTR을 포함하는 α-시누클레인 리포터 플라스미드를 단백질 수준에서 넉다운 플라스미드의 검증에 사용하였다. HEK293 세포로부터 추출한 용해물을 사용하여 ELISA(#KHB0061, Thermo Fisher Scientific)에 의해 α-시누클레인 단백질의 수준을 결정하였다. Lipofectamine 2000 형질감염 시약(25㎕ Opti-MEM 용액 중 0.1㎍ 리포터 플라스미드, 0.15㎍ 넉다운 플라스미드 및 0.75㎕ 시약)을 사용하여 48-웰 플레이트에 도말된 HEK293 세포(7.5×104개 세포/웰)로 후보 플라스미드를 일시적으로 형질감염시켰다. 72시간 후, 프로테아제 저해제 칵테일(#P8340, Sigma-Aldrich)이 보충된 방사선면역침전 분석(RIPA) 완충액(#89900, Thermo Fisher Scientific)에서 세포를 용해시키고, 몇 초 동안 초음파 처리하였다. 얼음 상에서 30분 동안 인큐베이션한 후, 4℃에서 15분 동안 20,000×g로 용해물을 원심분리하고, 상청액을 수집하였다. 단백질 수준을 정량화하였다. 450㎚에서 Varioskan 플레이트 판독기로 플레이트를 판독하였고, SoftMax Pro 5 소프트웨어를 사용하여 농도를 계산하였다. 측정된 단백질 농도를 바이신초니닉산(bicinchoninic acid) 분석(#23225, Thermo Fisher Scientific)을 이용하여 결정된 총 단백질 농도에 대해 정규화하였다.
도 37 및 표 4는 GFP 리포터 분석(상단) 및 α-Syn 분석(하단)에 의한 시험관내 SNCA의 성공적인 침묵을 나타내는 대표적인 데이터를 나타낸다. 도 38 및 표 5는 GFP 리포터 분석(상단) 및 α-Syn 분석(하단)에 의한 시험관내 TMEM106B의 성공적인 침묵을 나타내는 대표적인 데이터를 나타낸다.
Figure pct00006
Figure pct00007
실시예 11: ITR "D" 서열 배치 및 세포 형질도입
rAAV 벡터의 세포 형질도입에 대한 ITR "D" 서열의 배치 효과를 조사하였다. 도 20에 나타낸 바와 같이, 1) 야생형 ITR(예컨대, 이식유전자 삽입체에 대해 근위이고 ITR의 말단에 대해 원위인 "D" 서열) 또는 2) 벡터의 "외부"에 위치한 "D" 서열이 있는 ITR(예컨대, ITR의 말단에 대해 근위이고 이식유전자 삽입체에 대해 원위에 위치한 "D" 서열)을 갖는 Gcase-인코딩 rAAV로 HEK293 세포를 형질도입하였다. 놀랍게도, 데이터는 "외부" 위치에 위치한 "D" 서열을 갖는 rAAV가 패키징되고 세포를 효율적으로 형질도입하는 능력을 보유함을 나타낸다(도 40).
실시예 12: 프로그래뉼린 rAAV의 시험관내 테스트
도 39는 PGRN을 인코딩하는 발현 작제물을 포함하는 벡터의 일 실시형태를 도시하는 개략도이다. 프로그래뉼린은 대조 내로의 주사와 같은 실질내 또는 척추강내 주사에 의해, PGRN(예컨대, 코돈-최적화된 PGRN)을 인코딩하는 rAAV 벡터의 주사에 의해, GRN 결실에 대해 이형접합 또는 동형접합인 GRN이 결핍된 설치류의 CNS에서 과발현된다.
생후 2개월 또는 6개월에 마우스에 주사하고, 6개월 또는 12개월까지 성장시킨 다음 다음 중 하나 이상에 대해 분석한다: RNA 및 단백질 수준에서 GRN의 발현 수준, 행동 분석(예컨대, 움직임 개선), 생존 분석(예컨대, 생존 개선), 미세아교세포 및 염증성 마커, 신경아교증, 뉴런 손실, 리포푸신증, 및/또는 리소좀 마커 축적 구제, 예컨대, LAMP1. PGRN-결핍 마우스에 대한 분석은, 예를 들어 문헌[Arrant et al. (2017) Brain 140: 1477-1465; Arrant et al. (2018) J. Neuroscience 38(9):2341-2358; 및 Amado et al. (2018) doi:https://doi.org/10.1101/30869]에 기재되어 있으며; 이들의 전체 내용은 본 명세서에 참조에 의해 원용된다.
실시예 13: 프로그래뉼린 rAAV의 시험관내 생체내 테스트
시험관내 및 생체내 분석을 수행하여 프로그래뉼린(PGRN) 단백질을 인코딩하는 rAAV 작제물(PR006(또한 PR006A로도 지칭됨); 도 64 참조)의 효과를 분석하였다. PR006은 AAV9 혈청형을 갖는 캡시드를 포함한다.
시험관내 비임상 연구
HEK293T 세포에서 PR006A로부터 유래된 프로그래뉼린 발현
세포 맥락에서 프로그래뉼린 단백질 생성을 유도하는 PR006A의 능력을 조사하였다. 2.1×105 내지 3.3×106개 벡터 게놈(vg)/세포 범위의 감염다중도(MOI) 범위에 걸쳐 PR006A로 HEK293T 세포를 형질도입하였다. PR006A 형질도입은 프로그래뉼린 단백질 발현 및 세포 배지로의 분비에서 강력한 용량-의존적 증가를 초래하였다(도 60). 내인성 인간 GRN 유전자로부터 유래된 발현을 반영하는 실질적으로 더 낮은 프로그래뉼린 단백질 수준을 부형제(의도된 임상 비히클) 단독으로 처리한 음성 대조군에서 검출하였다.
FTD - GRN iPSC -유래 뉴런의 효능
인간 FTD-GRN(GRN 돌연변이가 있는 전두측두엽 치매) 뉴런 배양물에서 시험관내 rAAV 작제물의 효능을 분석하는 분석을 수행하였다. 세포주는 미국 국립 신경질환 및 뇌졸중 연구소(National Institute of Neurological Disorders and Stroke; NINDS) 인간 세포 및 데이터 저장소(Human Cell and Data Repository; NHCDR)로부터 수득하였다: 물질 ND50015(FTD-GRN, M1L), ND50060(FTD-GRN, R493X) 및 ND38555(대조군, 야생형)(표 6 참조).
Figure pct00008
FTD-GRN과 병리학적으로 관련된 세포 모델을 확립하기 위해, 각각의 계통 유래의 iPSC를 2 단계 프로토콜을 사용하여 신경 세포로 분화시켰다. 제1 단계에서, iPSC를, 면역형광 표지에 의해 검출된 바와 같이 다능성 마커(즉, Oct4 및 SSEA1)의 발현이 결여되었고 신경 줄기 세포 마커(즉, SOX2, Nestin, SOX1 및 PAX6)의 발현을 얻는 증식하는 신경 줄기 세포(NSC) 계통으로 분화시켰다.
대조군 및 FTD-GRN NSC 계통을 동일한 밀도로 시딩하고, 48시간 후, 세포 용해물(세포내 프로그래뉼린)(도 52E) 및 세포 배지(분비된 프로그래뉼린)(도 52A)에서 효소-결합 면역흡착 분석(ELISA)에 의해 프로그래뉼린 발현을 측정하였다. 프로그래뉼린 발현을 총 단백질 농도에 대해 정규화하여 세포수의 차이를 설명하였다(n=3; 평균±SEM). 이종접합 GRN 돌연변이가 있는 NSC 계통은 대조군 NSC와 비교하여 현저하게 더 낮은 세포내 및 분비된 프로그래뉼린 수준을 가졌으며, 여기서 FTD-GRN NSC는 약 25 내지 50%가 내인성 프로그래뉼린 수준을 발현하였다. 이는 이러한 FTD-GRN 세포 모델이 혈장에서 정상 프로그래뉼린 수준의 1/3 내지 1/2을 발현하는 FTD-GRN 환자에서 관찰되는 임상 프로그래뉼린 결핍을 반복한다는 것을 시사한다(Finch et al., Brain 132, 583-591 (2009); Ghidoni et al., Neurology 71, 1235-1239, (2008); Sleegers et al., Ann Neurol 65, 603-609 (2009)).
모든 세포주 유래의 NSC를 뉴런 배양물로 분화시켰다. iPSC-유래 NSC가 감소된 프로그래뉼린 발현을 나타낸다는 것을 확립한 후, 상기 계통을 뉴런으로 분화시켜 PR006A의 비임상 효능 연구를 위해 임상적으로 대표적인 세포 유형을 생성하였다. NSC를 뉴런 분화 배지에 시딩하고, 7일 동안 유사분열후 뉴런으로 최종 분화시킨 다음, 면역형광법에 의해 뉴런 마커(즉, MAP2, NeuN, Tau, Tuj1, NF-H)의 발현에 대해 평가하였다(도 52G). 이 프로토콜을 사용하여 대조군 및 FTD-GRN iPSC-유래 NSC 계통은 둘 다 뉴런으로 효율적으로 분화되었다.
FTD-GRN iPSC-유래 신경 배양물을 사용하여 시험관내에서 PR006A의 효능을 평가하였다. FTD-GRN 뉴런을 부형제 또는 2.7×105, 5.3×105, 또는 1.1×106개 vg/세포의 MOI로 PR006A로 처리하였다. PR006 형질도입은 모든 세포주에서 ELISA에 의해 측정된 바와 같이, 분비된 프로그래뉼린의 강력한 용량-의존적 발현을 초래하였다(도 52B). 부형제-처리 대조군 및 FTD-GRN 뉴런을 내인성 프로그래뉼린 수준에 대해 평가하였다. 대조군 뉴런은 내인성 분비된 프로그래뉼린을 발현한 반면, FTD-GRN 뉴런에서는 어떠한 분비된 프로그래뉼린도 검출되지 않았다(도 52B). 선형 회귀 분석으로 두 가지 FTD-GRN 세포주에 걸쳐 PR006A 용량과 프로그래뉼린 수준 사이의 유의한 상관관계를 확인하였다(p=3.5×10-13). 이러한 결과는 PR006A를 이용한 처리가 FTD-GRN 뉴런 모델에서 프로그래뉼린의 분비 상승을 초래한다는 것을 입증한다.
프로그래뉼린은 리소좀 프로테아제 카텝신 D(CTSD)의 성숙을 자극하는 것으로 알려져 있으며, CTSD의 기능 상실은 또한 리소좀 축적 장애 및 신경퇴화에 관련이 있다. CTSD는 효소적으로 활성적인 성숙한 프로테아제(matCTSD)로 단백질분해 처리를 거치는 비활성 전장 프로단백질(proCTSD)로서 발현된다. 프로그래뉼린은 proCTSD에 결합하여 matCTSD 프로테아제로의 성숙을 향상시키는 분자 샤페론으로 작용하는 것으로 보고되었다. FTD-GRN 뉴런 배양물에서, PR006 형질도입은 카텝신 D의 결함이 있는 성숙을 구제하였다(도 52C). 대조군, FTD-GRN #1, 및 FTD-GRN #2 뉴런을 PR006A 또는 부형제를 이용하여 형질도입하였다. 5.3×105 PR006A의 MOI가 프로그래뉼린 수준을 대조군 세포의 적어도 2배로 회복시켰기 때문에, 이를 효능 실험에 사용하였다(도 52B). 효능을 평가하기 위해, 자동화된 Simple Western™(Jess) 플랫폼을 사용하여 세포 용해물에서 proCTSD 및 matCTSD 발현 수준을 측정하였다(도 52C). 부형제-처리 FTD-GRN 뉴런은 부형제-처리 대조군 뉴런과 비교하여 proCTSD에 대한 matCTSD의 비율이 더 낮았으며; PR006A 처리는 FTD-GRN 뉴런 계통 둘 다에서 비율을 유의하게 증가시켰다(도 52C). 대조군 뉴런에서, proCTSD에 대한 matCTSD의 비율은 PR006A 처리에 의해 유의하게 변경되지 않았다. 이러한 결과는 PR006A가 FTD-GRN 뉴런에서 리소좀 기능-관련 표현형을 회복시킨다는 것을 입증한다.
정상 뉴런에서, TDP-43(트랜스액티프 반응 DNA 결합 단백질 43 kDa) 단백질은 핵에 국재화된다. FTD-GRN 환자의 사후 검시 뇌에서, 뉴런의 세포질에서 TDP-43의 응집이 관찰되고, TDP-43의 핵 축적이 감소된다. FTD 뉴런은 핵 TDP-43을 감소시켜, 뉴런에서 응집 및 하류 독성을 야기하였다. Grn KO 마우스는 이러한 TDP-43 병리를 완전히 반복하지 않으므로, 유도 만능 줄기 세포(iPSC)-유래 뉴런은 TDP-43 생물학을 연구하기 위한 귀중한 FTD-GRN 모델이다. 핵에서 TDP-43의 축적 감소, 및 불용성 TDP-43의 축적 증가는, 문헌[Valdez et al., Human Molecular Genetics 26, 4861-4872 (2017)]에 기재된 바와 같이 GRN 돌연변이를 보유하지 않는 대조군 뉴런에 비해, FTD-GRN 환자의 iPSC-유래 뉴런에서 보고되었다. FTD-GRN 돌연변이 보인자 계통 둘 다로부터의 뉴런 배양물의 PR006A 형질도입은 TDP-43 이상을 역전시켜, 불용성 TDP-43의 감소(Simple Western™(Jess) 플랫폼을 사용하여 측정됨(도 52D)) 및 TDP-43의 핵 국재화의 증가(면역형광법을 사용하여 측정됨(도 52F))를 초래하였다.
요약하면, PR006 형질도입은 리소좀 효소인 카텝신 D에서 결함이 있는 성숙을 회복시키고, FTD-GRN 뉴런에서 비정상적인 TDP-43 병리를 개선시켰다.
생체내 비임상 연구
노화된 Grn 녹아웃 마우스에서의 효능 및 생체분포
PR006A 생체내 효능 및 최대 용량 PR006A를 Grn 녹아웃(KO) 마우스 모델에서 평가하였다. 이 연구에 사용된 Grn KO 마우스 모델(B6(Cg)-Grn tm1 . 1Aidi/J(Jackson Laboratory, 미국 메인주 바하버 소재)에서, 엑손 1 내지 4는 표적 프로그래뉼린(Grn) 유전자로부터 결실되어 있다(Yin et al., J Exp Med 207, 117-128 (2010)). 이 동물은 프로그래뉼린이 완전히 상실되고, 리소좀 변경, 뉴런 리포푸신 축적, 유비퀴틴 축적, 미세아교세포증(microgliosis), 및 신경염증을 포함하는 연령-의존적 표현형을 나타내고, 따라서 FTD-GRN을 모델링하는 데 널리 사용된다. 연구에서 편향을 제거하기 위한 모든 시도가 이루어졌으며; 마우스는 성별과 체중에 대해 균형을 이루는 처리 그룹으로 할당되었고, 실험 종점에 대한 맹검 평가를 유자격자가 수행하였다.
초기 연구에서, PR006A를 노화된 Grn KO 마우스에게 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 용량으로 전달하였으며, 상기 용량은 주사 부피 제약 및 연구에 사용된 바이러스 로트의 물리적 역가로 인해 연구 시점에 달성 가능한 최고 용량이었다. CNS 염증 및 미세아교세포증을 포함하여 다수의 FTD-GRN-관련 표현형이 연령 의존적 방식으로 발생하고, 이 때 표현형의 가장 확고한 발현이 12 내지 24개월 사이에 발생하기 때문에 노화된 마우스를 사용하였다.
노화된 Grn KO 마우스를 이용한 연구에서, 단일 뇌실내(ICV) 주사에 의해 PR006A를 투여하였다. 10㎕ 부형제(의도된 임상 비히클; 20mM Tris pH 8.0, 200mM NaCl, 및 1mM MgCl2 + 0.001% Pluronic F68) 또는 9.7×1010개 vg PR006A(2.4×1011개 vg/뇌 g[400 ㎎의 성체 마우스 뇌 중량을 기반으로 함])를 노화된 Grn KO 마우스의 2개 코호트에 ICV 주사에 의해 전달하였다: (1) 주사 시점에서 16개월령(n=4/그룹; PRV-2018-027; 도 61) 및 (2) 주사 시점에서 14개월령(계획된 n=3/그룹; PRV-2019-002; 도 61). 주사하고 2개월 후에 동물을 희생시켰다.
연구 PRV-2018-027에서, 단일 용량의 PR006A를 하기 처리군을 가지는 16개월령 마우스에 전달하였다:
Figure pct00009
예측하지 못한 연구 편차(동물의 유전자형 오류 및 조기 상실)로 인해, 연구 PRV-2019-002(14개월령 코호트)는 계획된 n=3 대신에 부형제-처리 그룹에서 1마리의 마우스만 등록하였다. 샘플수가 적어 통계적 분석이 불가능하므로, 여기에서는 추가 논의에서 본 연구를 배제한다. 그러나, 연구 결과는 연구 PRV-2018-027과 비슷하였다.
생체분포 및 프로그래뉼린 발현: PCR 민감도에 대한 현재 미국 식품의약국(U.S. Food and Drug Administration) 생물제제 평가 연구 센터(Center for Biologics Evaluation and Research: CBER)/조직 및 최신 치료제 담당 부서(Office of Tissues and Advanced Therapies: OTAT) 표준(1㎍ 게놈 DNA당 50개 초과의 벡터 게놈이 양성으로 정의됨)을 충족하는 qPCR 분석을 사용하여 벡터 게놈 존재를 측정함으로써 생체분포를 결정하였다. PR006A를 받은 모든 마우스는 대뇌 피질 및 척수의 벡터 게놈에 대해 양성이었고, 이는 ICV 투여가 뇌 및 CNS에서 PR006A 형질도입을 성공적으로 초래함을 나타낸다(도 59A). ICV PR006A는 Grn KO 마우스의 CNS(뇌 척수)에서 상당한 수준의 인간 프로그래뉼린 단백질을 생성한 반면, 예상한 바와 같이, 인간 프로그래뉼린은 부형제를 받은 마우스에서는 검출 가능하지 않았다(도 59B). 프로그래뉼린은 주로 분비되는 단백질이므로, CSF에서의 발현은 뇌 내의 단백질 생성의 대용인 것으로 간주될 수 있으며, CSF 프로그래뉼린 수준이 감소된 FTD-GRN 환자에 대한 잠재적인 번역 종점을 나타낸다. 본 발명자들은 PR006A-처리 마우스의 CSF에서 인간 프로그래뉼린을 검출할 수 있었지만, 적은 샘플 부피와 마우스에서 충분한 부피의 CSF를 얻기 위한 기술적 한계로 인해, CSF 프로그래뉼린 수준의 측정은 분석의 정량화 하한(LLOQ) 미만이었다(도 59C).
ICV 투여는 또한 간, 심장, 폐, 신장, 비장, 및 생식선을 포함하는 말초 조직에서 광범위한 벡터 게놈 존재 및 프로그래뉼린 단백질 수준을 초래하였다(도 62A 내지 도 62B). 추가적으로, 상당한 수준의 인간 프로그래뉼린이 PR006A-처리 Grn KO 마우스의 혈장에서 검출 가능하였다. 예상한 바와 같이, 인간 프로그래뉼린은 부형제 처리 Grn KO 마우스에서 검출되지 않았다.
리포푸신 축적: 유사분열 후 세포의 리소좀에서 시간 경과에 따라 점진적으로 축적되고 리소좀 기능 장애의 지표인 전자 밀도가 높은 자가형광 물질인 뉴런 리포푸신의 축적은 Grn KO 마우스의 특징적인 연령-의존적 표현형이다. 인접한 뇌 섹션에서 2가지 독립적인 방법, 즉, (1) 보다 임상적인 접근법으로, 맹검 병리학자가 뇌에서 리포푸신 축적을 0(관찰된 리포푸신이 없음) 내지 4(광범위한 리포푸신 축적)의 척도로 점수를 매기는 방법 및 (2) 보다 정량적인 접근법으로, 면역조직화학(IHC)에 의해 리포푸신 형광을 검출하고 자동으로 정량화하는 방법을 사용하여 리포푸신 축적을 평가하였다. Grn KO 마우스는 뇌 전반에 걸쳐 상당한 리포푸신증을 나타내었고, ICV PR006A 처리는 대뇌 피질, 해마, 및 시상에서 리포푸신 점수 중증도를 감소시켰다(도 59D). IHC 이미지로부터 리포푸신 축적의 정량화는 또한 3개의 뇌 영역 모두에서 PR006A 처리로 감소된 리포푸신증을 감지하였다. 유비퀴틴-양성 내포물은 연령-의존적 방식으로 Grn KO 마우스 모델에서도 축적되는 FTD-GRN 환자의 정의되는 병리학적 특성이므로, 관심이 있는 뇌 영역(대뇌 피질, 해마, 시상)에서 IHC를 수행하고 정량화하여 유비퀴틴 축적을 평가하였다. PR006A 처리는 Grn KO 마우스에서 유비퀴틴 축적을 상당히 감소시켰다(도 59E). 이러한 결과는 PR006A가 FTD-GRN의 Grn KO 마우스 모델에서 리소좀 기능 장애를 개선시킨다는 것을 시사한다.
신경염증: 만성 CNS 염증은 연령-의존적 방식으로 Grn KO 마우스에서 반복되는 FTD-GRN 환자의 뇌의 병리학적 특성이다. 프로그래뉼린은 FTD-GRN의 마우스 모델에서 항염증 효과가 있으며, 프로그래뉼린의 손실은 TNFα를 포함한 전염증성 사이토카인의 상향조절을 야기한다. 이 연구에서, PR006A를 이용한 처리는 노화된 Grn KO 마우스에서 염증성 마커 수준을 억제하였다. ICV PR006A는 대뇌 피질에서 전염증성 사이토카인 Tnf(TNFα) 및 미세아교세포의 마커인 Cd68(CD68)의 유전자 발현을 감소시켰다(도 59F). TNFα 단백질 수준은 또한 Mesoscale Discovery 마우스 전염증성 사이토카인 분석을 사용하여 PR006A-처리 Grn KO 마우스 유래의 대뇌 피질 샘플에서 감소되었다(도 59G). 신경염증을 추가로 평가하기 위해, 미세아교세포증의 마커인 Iba1, 및 성상교세포증의 마커인 GFAP에 대해 면역조직화학(IHC)을 수행하였고, 관심이 있는 뇌 영역(대뇌 피질, 해마, 시상)에서 정량화하였다. PR006A 처리는 미세아교세포증(Iba1) 감소에 대한 경향을 초래하였지만, Grn KO 마우스에서 성상교세포증(GFAP)에 영향을 미치지 않았다(도 59H; 도 59I). 종합하면, 이러한 결과는 PR006A 처리가 FTD-GRN의 노화된 Grn KO 마우스 모델에서 신경염증을 감소시킨다는 것을 나타낸다.
조직병리학: 이들 연구로부터의 모든 마우스의 뇌, 흉추, 간, 심장, 비장, 폐, 및 신장의 헤마톡실린 및 에오신(H&E) 염색의 맹검 공인 병리학자에 의한 철저한 조직병리학적 분석으로 PR006A 처리와 관련된 이상 반응이 없는 것으로 밝혀졌다. Grn KO 마우스에 대한 PR006A의 투여는 수질 및 뇌교에서 신경 괴사의 빈도 및/또는 중증도 점수의 감소를 포함하여, 모델의 특징인 소견의 발생률 및/또는 중증도의 감소를 초래하였다. 추가적으로, PR006A 처리로 흉추에서 축삭 변성의 발생률 및 중증도가 둘 다 감소하였다. 이러한 결과는 하기 독성학 섹션에서 상세하게 논의된다.
결론: 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 용량으로 ICV PR006A는 노화된 Grn KO 마우스에서 뇌 및 말초 조직 전반에 걸쳐 광범위한 벡터 게놈 존재를 초래하였다. PR006A 처리는 전반적인 프로그래뉼린 발현을 증가시켰다. 추가적으로, PR006A는 Grn KO 마우스 모델과 FTD-GRN 환자 둘 다에서 발생하는 것으로 알려진 병리인 뇌의 리포푸신 및 유비퀴틴의 축적을 감소시켰다. PR006A는 또한 만성 CNS 염증을 나타내는 표현형인 대뇌 피질에서의 전염증성 사이토카인의 발현 및 면역 세포 활성화를 감소시켰다.
성체 Grn 녹아웃 마우스에서의 용량-범위 효능
PR006A의 효과적인 용량을 추가로 평가하기 위해, 성체 Grn KO 마우스에서 더 큰 용량-범위 연구를 수행하였다. PRV-2019-004에서, 10㎕ 부형제(의도된 임상 비히클; 20mM Tris(pH 8.0), 200mM NaCl, 및 1mM MgCl2 + 0.001% Pluronic F68) 또는 PR006A를 ICV를 통해 4개월령 동물에 전달하였다. 노화된 Grn KO 마우스는 용량-범위 연구를 수행하기에 충분한 수로 이용 가능하지 않았기 때문에 이러한 성체 마우스를 노화된 Grn KO 마우스 대신에 사용하였다. 성체 Grn KO 마우스는 노화된 마우스보다 표현형이 더 온화하지만, 성체 Grn KO 마우스는 여전히 리소좀 결함과 신경염증성 변화를 나타내므로, PR006A의 효과적인 용량 범위를 평가하는 데 적합하다. 광범위한 범위의 바이러스 용량에 대한 PR006A 효능을 평가하기 위해, PR006A를, 주사 부피 제약 및 연구에 사용되는 바이러스 로트의 물리적 역가로 인해 연구 당시에 획득 가능한 가장 높은 용량인 1.1×1011개 vg(2.7×1011개 vg/뇌 g), 1.1×1010개 vg(2.7×1010개 vg/뇌 g)의 중간 용량, 또는 1.1×109개 vg(2.7×109개 vg/뇌 g)의 낮은 용량으로 투여하였으며, 전체 로그 차이는 각각의 용량에 걸쳐 있다. 실험 설계의 상세 내용은 도 63에 제공되어 있다.
그룹당 10마리의 마우스(4M/6F)로 3가지 용량의 PR006A를 평가하였다:
Figure pct00010
야생형(WT) Grn 대립유전자를 가진 Grn KO 마우스와 동일한 배경 유형의 연령 일치 마우스(7개월령의 C57BL/6J)가 이 연구에서 선택된 효능 종점에 대한 대조군으로 사용되었다.
Figure pct00011
생체분포 및 프로그래뉼린 발현: PCR 민감도에 대한 현재 미국 식품의약국 CBER/OTAT 표준(게놈 DNA ㎍당 50개 초과의 벡터 게놈이 양성으로 정의됨)을 충족하는 qPCR 분석을 사용하여 벡터 게놈 존재를 측정함으로써 생체분포를 결정하였다. PR006A를 받은 마우스는 용량-의존적 방식으로 대뇌 피질 및 척수의 벡터 게놈에 대해 양성이었고, 이는 ICV 투여가 CNS에서 PR006A 형질도입을 성공적으로 초래함을 나타낸다(도 53A). PR006A-인코딩된 GRN의 qRT-PCR 분석으로 PR006A의 ICV 투약이 대뇌 피질에서 인간 GRN mRNA 발현의 용량-의존적 유도를 초래하는 것으로 밝혀졌다(도 53B). PR006A 처리는 뇌 및 척수에서 인간 프로그래뉼린 단백질의 수준을 증가시켰다(도 53C). 뇌 조직에서, 인간 프로그래뉼린 수준은 가장 높은 PR006A 용량에서 검출되고 정량화되었으며; 가장 낮은 용량에서, 프로그래뉼린 수준은 뇌에서의 높은 배경으로 인해 검출의 분석 한계 미만이었다. 그러나, 용량 간의 로그-배수 차이를 기반으로, 더 낮은 용량에서 예상되는 프로그래뉼린 수준의 비례 추정은 뇌 조직에서 분석의 정량화 하한(LLOQ)보다 훨씬 더 낮을 것이다. 내인성 마우스 프로그래뉼린의 수준을 야생형(WT) Grn 대립유전자가 있는 연령 및 유형 일치 마우스에서 측정하였으며; 대뇌 피질 및 척수 둘 다에서, PR006A-처리 Grn KO 마우스에서 인간 프로그래뉼린의 수준은 어떠한 용량에서도 WT 마우스의 내인성 프로그래뉼린의 수준을 초과하지 않았다. 비-종간-교차반응성 항-프로그래뉼린 항체를 이용하는 상이한 검출 분석을 사용하여 인간 및 마우스 프로그래뉼린을 측정하였기 때문에, 절대 수치를 정확도와 비교할 수 없다.
PR006A 투여는 또한 간, 심장, 폐, 신장, 비장, 및 생식선을 포함하는 말초 조직에서 광범위한 벡터 게놈 존재 및 프로그래뉼린 단백질 수준을 초래하였다(도 53D; 도 53E).
혈장에서, 모든 용량 수준에서 PR006A-처리 Grn KO 마우스에서 상당한 수준의 인간 프로그래뉼린을 검출하였다(도 53F). 예상대로, 인간 프로그래뉼린은 부형제 처리 Grn KO 마우스에서 검출되지 않았다. 중간 용량의 PR006A로 처리된 동물에서 인간 프로그래뉼린의 수준은 WT Grn 대립유전자를 가진 마우스에서 측정된 마우스 프로그래뉼린의 수준과 동일한 범위에 있었다. 비-종간-교차반응성 항-프로그래뉼린 항체를 이용하는 상이한 검출 분석을 사용하여 인간 및 마우스 프로그래뉼린을 측정하였기 때문에, 절대 수치를 정확도와 비교할 수 없다.
리포푸신 축적: 인접한 뇌 섹션에서 2가지 독립적인 방법, 즉, (1) 보다 임상적인 접근법으로, 맹검 병리학자가 뇌에서 리포푸신 축적을 0(관찰된 리포푸신이 없음) 내지 4(광범위한 리포푸신 축적)의 척도로 점수를 매기는 방법 및 (2) 보다 정량적인 접근법으로, IHC에 의해 리포푸신 자가형광을 검출하고 자동으로 정량화하는 방법을 사용하여 리포푸신 축적을 평가하였다. Grn KO 마우스는 뇌 전반에 걸쳐 리포푸신증을 나타낸 반면, WT 마우스는 뇌에서 검출 가능한 리포푸신을 가지지 않았다(도 53G). PR006A의 ICV 투여는 Grn KO 마우스의 뇌에서 세포내 리포푸신 축적의 중증도 점수의 용량-의존적 감소를 야기하였다(도 53G). 리포푸신 감소에 대한 PR006A 효능은, 해마 및 시상을 포함하여, FTD-GRN의 Grn KO 마우스 모델에서 가장 강력한 리포푸신증 표현형을 나타내는 뇌 영역에서 가장 용이하게 정량화될 수 있었다. 병리학자의 리포푸신 채점에 추가적으로, 리포푸신증을 정량적으로 평가하기 위해 관심이 있는 뇌 영역(즉, 대뇌 피질, 해마, 시상)에서 수행된 IHC로 대뇌 피질 및 시상 뇌 영역에서 리포푸신 축적량의 용량-의존적 감소를 검출하였으며, 이 때 중간 및 높은 PR006A 용량에서 상당한 감소가 일어났다. IHC를 또한 수행하여, Grn KO 마우스에서 일어나는 추가적인 FTD-GRN-관련 병리인 뇌에서의 유비퀴틴 축적을 평가하였다. WT 마우스와 비교하여, Grn KO 마우스는 뇌 전반에 걸쳐 유비퀴틴의 증가를 나타내었다(도 53H). PR006A는 3가지 모든 용량에서 유비퀴틴 면역반응성 물체 크기를 거의 WT 수준으로 유의하게 감소시켰다(도 53H).
신경염증: PR006A를 이용한 처리는 성체 Grn KO 마우스의 뇌에서 염증성 마커 수준을 억제하였다. ICV PR006A는 피질에서 2.7×109개 vg/뇌 g 내지 2.7×1011개 vg/뇌 g의 용량 범위에 대해 전염증성 사이토카인 Tnf(TNFα) 및 미세아교세포의 마커인 Cd68(CD68)의 유전자 발현을 감소시켰다(도 53I). 공개된 데이터에 따라, 본 발명자들은 야생형 Grn 대립유전자가 있는 연령 일치 마우스와 비교하여 부형제-처리 Grn KO 마우스에서 이러한 신경염증성 마커의 유전자 발현 증가를 관찰하였다(도 53I). PRV-2018-027의 18개월령 Grn KO 마우스에서의 관찰 및 문헌의 TNFα 이상에 대한 보고와 대조적으로, 7개월령 성체 부형제-처리 Grn KO 마우스에서 대뇌 피질 TNFα 단백질 수준의 강력한 증가는 없었으며; 추가적으로, Grn KO 마우스에서 PR006A에 의한 유의한 변화가 관찰되지 않았다. 이러한 발견은 12 내지 24개월령이 될 때까지 Grn KO 마우스 모델에서 강력한 신경염증성 표현형이 일어나지 않는다는 이전에 발표된 결과와 일치한다. 관심이 있는 뇌 영역(대뇌 피질, 해마, 시상)에서 IHC를 수행하고 정량화하여 미세아교세포증의 마커인 Iba1, 및 성상교세포증의 마커인 GFAP에 대한 염색에 의해 뉴런 염증을 추가로 평가하였다. WT 마우스와 비교하여, Grn KO 마우스의 뇌 전반에 걸쳐 미세아교세포증(Iba1) 및 성상교세포증(GFAP)의 상당한 증가가 있었다(도 53J 내지 도 53K). 3가지 모든 용량에서 PR006A 처리는 미세아교세포증(Iba1)을 상당히 감소시켰다(도 53J). 감소된 성상교세포증(GFAP)에 대한 경향은 PR006A 중간 용량에서 관찰되었고 성상교세포(GFAP)의 상당한 감소는 시상 뇌 영역에서 PR006A 높은 용량에서 관찰되었다(도 53K).
Grn KO 마우스 모델 표현형의 다수가 노년기에 발생하지만, 연구는 Grn KO 마우스가 리소좀- 및 면역-관련 경로의 변화를 포함하여, 빠르면 4개월령에 광범위한 유전자 발현 변화를 나타내는 것으로 보고하였다. 따라서, 상기 기재된 표적화된 qRT-PCR 분석에 추가적으로, 민감하고 높은 처리량의 기술(RNA 서열결정)로 전반적으로 평가될 수 있는 mRNA 수준의 변화를 평가하고, 최소한의 샘플 재료를 필요로 하는 전사체학 접근법을 이용하였다. 본 발명자들은 대뇌 피질에 대해 RNA 서열결정을 수행하였고 유전자 세트 변이 분석(GSVA)을 사용하여(Hanzelmann et al., BMC Bioinformatics 14, 7 (2013)) 동일한 유형의 연령-일치 WT 마우스와 비교하여, 7개월령 부형제-처리 Grn KO 마우스에서 어떠한 유전자 발현 경로가 변경되는지를 결정하였다. 본 발명자들은 이전에 발표된 연구에서 보고된 바와 같이, Grn이 결핍된 마우스에서 리소좀- 및 면역-관련 경로의 결핍을 확인하였다. GO TERM (GO:0005773) "액포" 유전자(문헌[Lui et al (Cell 165, 921-935 (2016))]에 의해 기재된 Grn KO 마우스에서 조절에 이상이 있는 것으로 보고된 4개의 유전자를 포함함), "리소좀 유전자" 세트(문헌[Evers et al (Cell Reports 20, 2565-2574 (2017))]에 의해 기재된 Grn KO 마우스에서 조절에 이상이 있는 것으로 나타난 25개 리소좀-관련 유전자의 하위세트), 및 유전자 세트 농축 분석 특성 데이터베이스(Gene Set Enrichment Analysis HALLMARK database)(선천성 면역계의 일부인, 보체 시스템의 구성성분을 인코딩하는 유전자를 포함함)로부터의 "보체" 유전자 세트의 하위세트에서 상당한 변화가 기록되었다. 그 다음, 본 발명자들은 PR006A 처리로 이들 유전자 세트의 활성 수준을 측정하고 비교하였다(도 53L 내지 도 53N). PR006A로의 처리는 Grn KO 마우스에서 관찰되는 유전자 세트 결핍을 용량-의존적으로 역전시켰다.
조직병리학: 이들 연구로부터 모든 마우스의 뇌, 흉추, 간, 심장, 비장, 폐, 신장, 및 생식선의 헤마톡실린 및 에오신(H&E) 염색에 대해 맹검 공인 병리학자에 의해 수행된 철저한 조직병리학적 분석으로 PR006A 처리와 관련된 독성의 증거를 발견하지 못하였다. 독성 분석에 대한 상세 내용은 하기 섹션에 제공되어 있다.
결론: 2.7×109개 vg/뇌 g 내지 2.7×1011개 vg/뇌 g 범위의 용량으로 ICV PR006A는 뇌 및 말초 조직 전반에 걸쳐 용량-의존적 방식으로 광범위한 벡터 게놈 존재를 초래하였다. PR006A 처리는 또한 CNS에서 프로그래뉼린 mRNA 및 단백질의 생성을 야기하였다. 리소좀 기능 장애의 판독물인 감소된 리포푸신증과 PR006A 사이의 명확한 용량-반응 관계는, 다수의 뇌 영역 전반에 걸쳐 관찰되었다. PR006A의 중간 및 최고 용량 수준에서 리포푸신증의 강력하고 통계적으로 유의한 감소가 관찰되었다. 모든 PR006A 용량은 뇌에서 유비퀴틴 축적을 감소시켰다. 2.7×109개 vg/뇌 g의 최저 용량에서 시작하여, PR006A는 RNA 및 단백질 수준에서 뇌의 전염증성 마커의 발현을 감소시켰다.
요약: 생체내 비임상 연구
PR006A는 Grn KO 마우스를 효과적으로 형질도입하여, CNS에서 이식유전자의 강력하고 용량-의존적인 생체분포 및 프로그래뉼린 mRNA 및 단백질의 생성을 초래하였다. PR006A는 리소좀 및 신경염증성 경로에서 유전자 발현 이상을 용량-의존적으로 역전시켰다. PR006A는 리포푸신증, 유비퀴틴 축적, 및 미세아교세포증을 포함하여 이러한 FTD-GRN 마우스 모델의 뇌에서 일어나는 많은 표현형을 감소시켰다. 용량-의존적 연구에서, 2.7×109개 vg/뇌 g PR006A의 최저 용량은 대뇌 피질에서 염증성 마커의 발현을 상당히 억제하였다. 2.7×1010개 vg/뇌 g PR006A의 중간 용량은 강력하고 통계적으로 유의한 방식으로 리소좀 결함(예컨대, 리포푸신증) 및 신경염증 둘 다를 개선시켰다. 2.7×1011개 vg/뇌 g PR006A의 고용량은 독성에 대한 증거 없이 프로그래뉼린 발현을 추가로 증가시켰다.
Figure pct00012
양성 생체분포는 50 vg/㎍ 게놈 DNA 초과로 정의된다.
안전성 약리학
이들 연구 전반에 걸쳐, 테스트 물품에 기인할 수 있는 이상 반응은 없었다. PRV-2018-027, PRV-2019-002, 및 PRV-2019-004에서 동물의 생전 및 조직병리학적 분석으로부터의 안정성 결과는 하기 섹션에서 논의된다.
단일-용량 독성
마우스 및 원숭이에서 안전성 종점을 조사하기 위해 PR006A를 이용한 일련의 비임상 연구를 수행하였다. 연구 중 3가지는 Grn KO 마우스 모델에서 수행하였고, 여기서 종점은 신경병리학적 평가를 포함하고 보호 활성뿐만 아니라 뇌실내(ICV) 주사를 통한 PR006A 투여로 인한 잠재적 독성을 평가하였으며; ICM 투여는 마우스에서 기술적으로 더 어렵다. 이러한 마우스 모델은 환자가 프로그래뉼린 수준의 감소를 초래하는 GRN 유전자의 돌연변이를 가진 FTD-GRN을 대표한다. 필리핀 원숭이에서, PR006A를 대조내로(ICM) 주사한 파일럿 연구의 일부로 신경병리학을 수행하였다. PR006A를 ICM으로 전달하고, 원숭이를 제7일, 제30일, 또는 제183일에 희생시킨 GLP 연구를 필리핀 원숭이에서 수행하였다. GLP 연구는 조직의 전체 목록에 대한 해부학적 병리학 평가에 추가적으로 임상 종점의 포괄적인 목록을 포함하였다. 임상에서 단일-용량 투여를 뒷받침하기 위해, 다음과 같은 단일-용량 연구를 수행하였다.
노화된 FTD - GRN 마우스 모델에서 최대 용량 PR006A ( PRV -2018-027 및 PRV -2019-002)
Grn KO 마우스에서 이러한 효능 연구의 일부로서, 부형제 또는 PR006A를 이용하여 ICV 처리된 마우스에서 신경병리학적 평가를 수행하였다. Grn KO 마우스는 프로그래뉼린의 완전한 손실을 가지며, 리소좀 변경, 신경성 리포푸신 축적, 미세아교세포증, 및 신경염증을 포함하는 이의 연령-의존적 표현형으로 인해 FTD-GRN의 모델로서 광범위하게 사용된다. 연구의 약리학 부분의 양상은 상기 섹션에서 요약되어 있는 반면, 이 연구에서 평가되는 독성학-관련 종점은 하기에 요약되어 있다. 노화된 Grn KO 마우스 모델에서 PR006A의 2가지 연구를 수행하였다. 첫번째 연구(PRV-2018-027)에서, 16개월령의 9마리의 혼성 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여하였다. 투여하고 9주 후에 동물을 희생시켰다. 이 연구에 단일 PR006A 용량 그룹, 즉, 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 총 용량에 대해 10㎕의 비희석 바이러스를 포함하였고, 대조군을 10㎕의 부형제로 처리하였다.
Figure pct00013
ROA: 투여 경로
다양한 사후 종점, 예컨대, 생체분포, 리소좀 변경, 및 염증성 마커를 이 연구 프로토콜의 일부로 평가하였다(상기 섹션 참조). 또한 동물을 하루에 2번 생존 여부에 대해 확인하고, 하루에 한번 체중을 측정하였다. 처리하고 2개월째에 안락사 후, 표적 조직을 채취하여 냉각된 4% 파라폼알데하이드에 드롭 고정시키고, 4℃에서 저장하였다. 연구를 완료한 8마리의 동물로부터의 조직을 다듬고, 가공하여, 파라핀 블록에 포매시켰다. 그 다음 이를 약 5㎛로 절편화하고, 헤마톡실린 및 에오신(H&E)로 염색한 다음, 공인 수의 병리학자가 검사하였다.
이 연구 동안, 처리군에서 1마리의 마우스가 조기에 사망하였고; 부검 동안 사망한 동물에 대한 이상은 기록되지 않았으므로, 알려진 사망 원인은 없다. 다른 사망 또는 이상이 관찰되지 않았다. 모든 처리군은 체중 측면에서 유사하게 추적되었으며, 유의한 차이는 존재하지 않았다.
조직병리학적 검사에서, PR006A-관련 유해 소견은 없었다. Grn KO 마우스에서 예상되는 결과와 일치하는, 뇌에 광범위한 리포푸신 축적이 있었다. PR006A-처리 동물에서, 뇌의 모든 영역에서 리포푸신 축적에 대한 점수 심각도의 감소가 있었다. 형태학적 변화는 또한 PR006A 처리로, 특히 수질 및 뇌교에서 신경 괴사와 관련하여 빈도 및/또는 중증도 점수의 약간의 감소를 나타내는 것으로 나타났다. 그러나, 형태학적 변화의 이러한 경향은 리포푸신 점수의 경향과 일관되지 않았다.
흉추에서, 축삭 변성이 있었고, 매우 드물게(각각의 그룹에서 4마리 동물 중 1마리), 최소한의 신경 괴사가 관찰되었다. PR006A로 처리된 동물에서 축삭 변성의 발생률 및 중증도 둘 다의 약간의 감소가 있었다.
Grn 동형접합 녹아웃 마우스와 연관된 것으로 추정되는 다음 결과는, PR006A로 처리된 동물에서 발생률 및/또는 중증도 감소가 있는 것으로 보였다: 신장 수질의 확장된 세뇨관, 신장의 사구체병증, 및 폐의 이물질(보통 기도 내에 있으며 종종 이물 거대 세포 및/또는 대식세포와 연관되는, 선형, 무세포, 짙은 분홍색 구조로 특징지어짐). 더 확정적인 결론을 위해 동물의 더 큰 코호트가 필요할 것이다.
관찰된 모든 다른 조직병리학적 소견은 부형제- 및 테스트 물품-처리 동물에서 우연한 것으로 간주되고/되거나 유사한 발생률 및 중증도를 가지므로, PR006A의 투여와 관련이 없는 것으로 간주되었다.
두 번째 연구(PRV-2019-002)에서, 14개월령의 5마리의 혼성 Grn KO 마우스에 PR006A 또는 부형제를 ICV 투여하였다. 투여하고 8주 후에 동물을 희생시켰다. 이 연구에 단일 PR006A 용량 그룹, 즉, 9.7×1010개 vg(2.4×1011개 vg/뇌 g)의 총 용량에 대해 10㎕의 비희석 바이러스를 포함하였고, 대조군을 10㎕의 부형제로 처리하였다.
Figure pct00014
PRV-2018-027을 연구하기 위해 동일한 방식으로 동물을 분석하였다. 동물을 하루에 2번 생존 여부에 대해 확인하고, 하루에 한번 체중을 측정하였다. 처리하고 2개월째에 안락사 후, 표적 조직을 채취하여 냉각된 4% 파라폼알데하이드에 드롭 고정시키고, 평가할 때까지 4℃에서 저장하였다.
CNS에서, Grn KO 마우스에서 이전에 관찰된 것과 일치하는 결과가 뇌에서 관찰되었다(Yin et al., J Exp Med 207(1):117-128 (2010)). 구체적으로, 뇌 전반에 걸쳐 리포푸신 축적이 광범위하게 증가하였다. 또한 (단일 비처리 조기 사망 동물에서 그리고 1마리의 부형제 동물에서) 드물게 최소한의 뉴런 괴사도 관찰되었다.
적은 샘플 수로 인해, 처리와 관련된 결과에서 일관된 경향을 입증할 수 없었다. 테스트 물품(PR006A)과 부형제 사이에서 일관된 반응 차이가 없었다.
비-CNS 조직의 경우, Grn KO 마우스의 표현형과 일치하는 것으로 고려되는 결과가 신장(세뇨관 확장 및 단핵구 염증성 세포의 침윤) 및 간(쿠퍼 세포/동양 내별 세포(sinusoidal lining cell)의 액포 형성, 및 쿠퍼 세포 미세육아종)에서 관찰되었다(Yin et al., J Exp Med 207(1):117-128 (2010)).
수술을 받고 연구에 등록된 모든 동물에서 관찰된 "사구체병증"의 소견이 있었다. 이 소견에 대한 공개된 보고서는 도전받지 않은 표준 Grn 녹아웃 마우스와 연관된 변화로서 발견되지 않았지만, 한 연구는 고호모시스테인혈증을 유도하고, 사구체 기저막 비후 및 족세포 발 돌기 소실을 발달시키는 식이로 처리한 프로그래뉼린-결핍 마우스를 입증하였다(Fu et al., Hypertension 69(2):259-266 (2017)).
다른 모든 결과는 실험실 마우스에서 공통적으로 관찰된 것과 일치하였다. 적은 샘플 수로 인해, 처리와 관련된 결정적인 차이는 나타날 수 없었다.
성체 FTD - GRN 마우스 모델에서 용량 범위 PR006A ( PRV -2019-004)
PR006A의 안전성을 추가로 평가하기 위해, 성체 Grn KO 마우스에서 더 큰 용량-범위 연구를 수행하였다. 총 40마리의 혼성 마우스를 4개의 그룹으로 나누고 좌반구에 단일 일방적 ICV 주사에 의해 부형제 또는 PR006A의 3가지 용량 중 1가지를 투여하였으며; 처리군에 관계없이, 모든 동물은 10㎕의 총 용량 부피를 받았다. 4개월령때 마우스를 처리하고 3개월 후에 안락사시켰다. 대략 7개월령의 노화된 미처리 C57BL/6J 마우스(동일한 배경 유형)를 포함하는 추가적인 야생형(WT) 대조군을 또한 안락사시키고 유사한 부검을 실시하였다.
하기 연구 설계에 따라 연구를 수행하였다:
Figure pct00015
연구 동안, 동물을 하루에 2번 생존 여부에 대해 확인하고, 1주에 한번 체중을 측정하였다. 처리하고 3개월 후에 마우스를 안락사시키고, PR006A의 효능을 평가하기 위해 다양한 사후 평가를 수행하였다(상기 섹션 참조). 추가적으로, 뇌, 흉추, 간, 심장, 비장, 폐, 신장 및 생식선으로부터 H&E에 대해 염색된 절편을 공인 병리학자가 평가하였다.
조직병리학적 검사에서 처리군에 관계없이 임의의 마우스에서 유해한 PR006A-관련 결과는 없었다.
뇌의 다양한 영역, 즉, 대뇌 피질, 대뇌 핵, 해마, 시상/시상하부, 소뇌 및 뇌간(특히 뇌교 및 수질)에서 세포내 리포푸신의 축적과 같은 Grn KO 마우스 모델 표현형과 일치하는 결과가 있었다. H&E 염색 섹션에서 형태학적 변화의 명확한 증거(뉴런의 액포화 및 신경아교증)는 관찰되지 않았다. 리포푸신 색소의 축적은 용이하게 검출될 수 있는 형태학적 변화에 선행할 수 있으므로, 효능의 적절한 바이오마커의 역할을 한다. 모든 Grn 동형접합 KO 그룹이 리포푸신 축적을 나타내었지만, 처리 그룹 간에 이러한 결과의 중증도에는 차이가 있었다. 리포푸신 축적에 대한 더 높은 점수의 빈도는 부형제로 처리된 동물의 그룹(그룹 1)에 대하여 가장 컸다. PR006A로 처리된 동물 중에서, 더 높은 점수의 빈도가 그룹 4(저용량 PR006A; 2.7× 109개 vg/뇌 g), 그 다음 그룹 3(중간 용량 PR006A; 2.7× 1010개 vg/뇌 g)에서 관찰되었다. 가장 낮은 중증도 점수는 그룹 2(고용량 PR006A; 2.7× 1011개 vg/뇌 g)에서 관찰되었다. 이러한 결과는 Grn 동형접합 녹아웃 마우스의 뇌에서 세포내 리포푸신 축적의 중증도 점수의 용량-의존적 감소를 입증한다. 다른 모든 조직병리학적 소견은 부형제- 및 테스트 물품-처리 동물에서 우연한 것으로 간주되고/되거나 유사한 발생률 및 중증도를 가지므로, PR006A의 투여와 관련이 없는 것으로 간주되었다.
원숭이에서 GLP 단일-용량 연구( PRV -2018-028)
연구 설계
이 GLP 연구의 목적은 투여 후 6일, 29일, 또는 182일 관찰 기간을 통해 필리핀 원숭이에서 ICM 주사를 통해 1회 투여될 때, 테스트 물품인 PR006A의 독성 및 생체분포를 평가하는 것이었으며; 동물을 연구 제7일, 제30일, 또는 제183일에 희생시켰다. 연구를 두 가지 용량 수준을 평가하도록 설계하였으며: 최고 용량은 비희석 PR006A의 1.2 ㎖ 부피(투여에서 경험한 최고 부피)로 달성 가능한 최대 가능 용량이고, 더 낮은 용량은 최고 용량보다 1 로그 단위 더 낮은 것에 해당한다. 용량은 4.8×1011개 vg의 낮은 용량 및 4.8×1012개 vg의 높은 용량에 해당하며; 이 연구에서 사용된 NHP 종인 필리핀 원숭이에서 74 g의 뇌 중량 추정치를 이용하면, 이는 대략 6.5×109개 vg/뇌 g 및 6.5×1010 vg/뇌 g로 해석된다. 이 연구는 또한 동물이 1.2 ㎖의 부형제(20mM Tris(pH 8.0), 200mM NaCl, 및 1mM MgCl2 + 0.001%[w/v] Pluronic F68)만을 받은 대조군을 포함한다. 이 연구는 수컷 및 암컷 필리핀 원숭이를 둘 다 이용하였다. 제7일 그룹은 최고 용량으로 1마리의 암컷을 포함하였으며, 조기 독성을 위한 감시장치로 설계되었고; 나머지 2개의 시점(제30일 및 제183일)은 각각의 용량에서 2마리의 수컷과 1마리의 암컷을 포함하였다. 다수의 뇌 영역 유래의 샘플에 추가적으로, qPCR 분석을 위해 말초 조직 샘플을 수집하였다. qPCR에서 양성인 모든 샘플을 이식유전자 발현에 대해 분석하였다. 이 연구 설계의 표로 작성한 요약이 표 11에 제공되어 있다.
Figure pct00016
Figure pct00017
Figure pct00018
사망률/이환율(매일), 임상 관찰(매일), 체중(기준선 및 이후 매주), 음식 소비의 육안 검사(매일), 신경학적 관찰(기준선 및 2주 및 26주 동안), 간접 검안경검사(기준선 및 2주 및 26주 동안), 및 심전도(ECG) 측정(기준선 및 2주 및 26주 동안)을 포함하여, 다수의 생전 관찰 및 측정에 의해 필리핀 원숭이 NHP를 평가하였다.
기준선 및 제7일, 제30일, 또는 제183일의 희생 시에 AAV9 캡시드에 대한 중화 항체(nAb)의 분석을 수행하였다. 혈액학, 응고, 임상 화학, 및 소변검사로 이루어진 임상 병리학을 기준선에서 2번(혈액 검사; 소변검사를 위해 1번) 그리고 투약 단계의 제1주 및 제13주 동안 1번 수행하였다.
동물을 안락사시키고 제7일, 제30일, 또는 제183일에 조직을 채취하였다. 존재하는 경우, 표 11에 개괄된 조직을 모든 동물로부터 수집하고, 무게를 측정한 다음(적용 가능한 경우), 복제물로 나누었다. 하나의 복제물을 조직병리학적 평가(모든 동물)를 위해 10% 중성-완충 포말린(최적의 고정을 위해 특수 고정제가 필요한 경우는 제외함)에 보존시켰다. qPCR 및 이식유전자 발현 분석을 위해 추가적인 복제물을 수집하였다.
안정성 및 독성학
예정에 없었던 사망은 없었으며, 예정된 부검 때까지 모든 동물이 생존하였다. 유해한 PR006A-관련 임상 관찰, 체중 변화, 안과 관찰, 또는 물리적 또는 신경학적 검사 소견은 없었고; 부검시 맨눈의 육안 검사는 임의의 코호트에서 약물-관련 이상을 나타내지 않았다. 추가적으로, 6.5×109 또는 6.5×1010개 vg/뇌 g을 투여한 수컷 또는 혼성에서 관찰된 PR 간격, QRS 기간, QT 간격, 보정된 QT(QTc) 간격, 또는 심박수에서 PR006A-관련 변화는 없었다. ECG의 정성적 평가 동안 비정상적인 ECG 파형 또는 부정맥은 관찰되지 않았다.
생체분포
qPCR-기반 분석을 사용하여 PR006A 이식유전자의 생체분포 분석을 수행하였다. 제183일에 고용량 그룹(6.5×1010개 vg/뇌 g)에서, CNS 및 말초 전반에 걸쳐 광범위한 형질도입이 있었고, 이 때 모든 조직은, qPCR 분석에 대한 정량화 하한인 50 vg/㎍ DNA의 컷오프로 벡터 존재에 대해 양성으로 검사되었다. 제183일로부터 선택된 대표적인 영역의 데이터가 도 54A에 표시되어 있으며; 제30일 데이터는 표시되어 있지 않다. 제30일에 고용량 그룹(6.5×1010개 vg/뇌 g)에서, 검사된 모든 CNS 조직은 피각을 제외하고, 형질도입에 대해 양성이었다. 저용량(6.5×109개 vg/뇌 g)으로 처리된 동물 유래의 조직은 제183일에 CNS에서 양성이었지만, 말초 조직에서는 비장 및 간만 양성이었다. 추가적으로, 고용량의 PR006A로 처리된 1마리의 암컷 NHP는 제7일에 난소에서 양성이었고, 고용량으로 처리된 수컷은 제30일 및 제183일에 고환에서 양성이었다. PR006A 형질도입은 간 및 신경계의 조직에서 가장 강력하였고, 검사한 다른 말초 기관에서는 일관되게 더 낮았다. 뇌에서, 벡터 형질도입은 제30일과 비교하여 제183일에서 안정화되었으며, 이는 이식유전자의 강력하고 내구성있는 형질도입을 입증한다.
PR006A의 ICM 투여를 받은 NHP에서, 처리 후 제30일 및 제183일에 수집된 혈청 및 CSF 샘플에서 검출된 항-프로그래뉼린 항체와 함께 이식유전자 산물인 프로그래뉼린에 대한 상당한 동종이계 면역 반응이 있었으며; 면역 반응은 인간 프로그래뉼린 단백질이 NHP에서 발현되었음을 나타낸다. 확립된 면역 분석 기법을 사용하여 항약물 항체(ADA) 수준을 결정하였다. 데이터는 도 54B에 예시되어 있다.
RT-qPCR-기반 분석을 사용하여 mRNA 수준에서, 그리고 Simple Western™(Jess) 분석을 사용하여 단백질 수준에서 PR006A(GRN)의 발현을 측정하였다. PR006A 형질도입의 수준에 부수적으로, 제183일에 수집된 선택된 뇌 영역(도 54C), 간, 생식선, 척수 및 DRG에서 RT-qPCR을 사용하여 mRNA 측정에 의해 이식유전자의 발현을 관찰하였다.
이식유전자의 발현은 PR006A의 두 가지 용량 모두에서 뇌 및 간에서 측정 가능하였고, 발현 수준은 둘 다 용량-의존적이고 지속성이 있었다. 생식선에서, 발현은 수컷에서 고용량에서만 측정 가능하였고; 암컷에서는 두 가지 용량 모두에서 제7일 및 제30일에 측정 가능하였고, 제183일에는 측정 가능하지 않았다.
인간 프로그래뉼린이 처리된 NHP에서 생성되었음을 확인하기 위해, CSF의 단백질 수준을 Simple Western™(Jess) 플랫폼에서 평가하였다. 방법의 상세한 내용은 실시예 14에 제공되어 있다. FTD-GRN 환자 유래의 CSF 샘플에서 프로그래뉼린 수준을 측정하고 이들이 건강한 인간 대조군 및 GRN 돌연변이가 없는 FTD 환자 유래의 CSF 샘플에서 측정된 수준의 대략 절반임을 확립함으로써 방법을 검증하였다. CSF로부터의 결과는 저용량 및 고용량의 PR006A 둘 다로 처리된 동물에서 용량-의존적 방식으로 프로그래뉼린의 수준이 상승되었음을 나타낸다(도 54D). 이러한 결과는 ICM 투여 후 NHP에서 PR006A의 효과적이고 광범위한 형질도입이 프로그래뉼린의 수준 증가를 야기한다는 것을 나타낸다.
Simple Western™(Jess) 분석은 높은 수준의 비특이적인 배경 밴드로 인해 뇌 조직에서 프로그래뉼린 수준을 측정하는 데 적합하지 않기 때문에 프로그래뉼린 단백질 측정은 CSF에 초점을 맞추었다. 현재 이용 가능한 분석법은 높은 수준의 비특이적인 배경으로 인해 NHP 조직에서 이식유전자-유래 인간 프로그래뉼린의 수준을 신뢰성있게 측정하지 않는다. CSF 수준은 일반적으로 관련 뇌 농도를 반영하는 것으로 여겨지며, 임상 연구에 대한 번역 바이오마커로서 특히 가치가 있다.
요약
임상 연구의 개시를 배제하는, 제183일까지의 NHP에서 소규모 파일럿 비-GLP 연구 및 NHP에서 GLP 연구를 포함하여, 임의의 비임상 연구에서 유해한 안전성 결과 또는 독성 우려는 없었다. GLP 연구의 병리학적 소견은 두 가지 용량 그룹 둘 다에 걸쳐 이환된 세포의 수가 적어 중증도가 일관되게 최소였다. 다른 생전 또는 사후 PR006A-관련 유해 결과는 없었다.
FTD - GRN이 있는 인간 대상체에서 1/2상 시험
PR006 재조합 AAV의 공개 임상시험에 인간 대상체(n =15)를 등록시킬 것이다. 대상체 포함 기준은 다음을 포함한다: 30 내지 80세(이를 포함함), 병원성 GRN 돌연변이를 가짐, 증상이 있는 질환 단계에 있음, 연구용 제품 투약 이전에 배경 약물을 안정적으로 사용함. 각각의 대상체는 단일 ICM(대조내) 주사로 연구용 제품을 받을 것이다. 시험은 3개월의 바이오마커 판독, 12개월의 임상 판독, 및 5년의 안전성 및 임상 추적을 포함할 것이다. 시험은 다음을 분석할 것이다: (1) 안전성 및 내약성: (2) 프로그래뉼린, NfL(신경미세섬유 경쇄), 및 체적 MRI(자기 공명 영상)을 포함한 주요 바이오마커; 및 (3) 효능: CDR + NACC FTLD(Clinical Dementia Rating plus National Alzheimer's Coordinating Center Frontal Temporal Lobar Dementia; 임상 치매 평가척도 및 국립 알츠하이머 조정 센터 전두측두엽 치매); 행동, 인지, 언어, 기능, 및 QoL(삶의 질)의 측정.
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
실시예 14: 뇌척수액에서 프로그래뉼린의 검출을 위한 자동화된 웨스턴 분석
이 실험의 목적은 ProteinSimple(미국 캘리포니아주 새너제이 소재) Automated Western platform Jess를 사용하여 뇌척수액(CSF)에서 프로그래뉼린(PGRN)의 단백질 수준을 정량화하는 것이었다. 이 테스트 방법은 비-인간 영장류(NHP) CSF 샘플을 분석하는 데 사용될 수 있다. 인간 프로그래뉼린 단백질의 발현 수준을 결정하기 위해, 인간 프로그래뉼린 단백질을 특이적으로 검출하는 항체를 사용하여 Simple Western™(Jess) 플랫폼에서 비-인간 영장류 대상체 유래의 CSF 샘플인 PR006A의 이식유전자 산물을 분석하였다. Simple Western™ 플랫폼은 모세관-기반의 자동화된 웨스턴 블롯 면역분석 플랫폼으로, 여기서 단백질 분리, 면역프로빙, 세척, 및 화학발광에 의한 검출을 포함한 모든 단계가 모세관 카트리지에서 일어난다. ProteinSimple이 제조한 2차 항체 및 모든 완충액에 추가적으로 샘플(4배 희석) 및 인간 프로그래뉼린에 대한 1차 항체(Adipogen PG-359-7, 10배 희석)를 Jess 플랫폼에서 실행되는 맞춤형 카트리지 상으로 로딩하였다. 각각의 실행이 완료된 후 반-정량적 데이터 분석이 자동으로 일어나고, 여기서 Jess 기기를 사용하여 매개변수, 예컨대, 신호 강도, 피크 면적, 및 신호 대 잡음 비를 계산하였다. 각각의 개별 샘플에 대해, 항체에 대한 면역반응성의 피크 면적으로서 프로그래뉼린의 수준을 측정하였다. 모든 분석을 맹검 샘플로 수행하였다.
여기에 기재된 분석을 비-인간 영장류 동물 연구 유래의 CSF 샘플에 대해 수행하였다. 프로그래뉼린(PGRN) 단백질을 인코딩하는 rAAV 작제물(PR006; 도 64 참조)을 사용하여 유전자 요법의 효능을 연구하기 위해 프로그래뉼린 단백질의 존재 및 수준에 대해 CSF 샘플을 테스트하였다. 이 연구에서, 부형제 또는 PR006을 NHP 동물 내로 대조내(ICM) 주사에 의해 저용량의 PR006(1.8×1010개 vg/뇌 중량 g) 또는 고용량의 PR006(1.8×1011개 vg/뇌 중량 g)으로 전달하였다. 각각의 그룹은 3마리의 동물로 이루어졌다. 감염 후 제180일에 9마리의 NHP 동물을 희생시켰고(표 16), Jess-기반 분석을 사용하여 CSF 샘플을 분석하였다.
Figure pct00023
Figure pct00024
이 방법을 수행하는 데 다음 절차를 따랐다:
원액의 제조:
1. 분리 모듈 EZ 표준 팩(EZ Standard Pack)의 투명 튜브에 40㎕의 물을 첨가하여 400mM DTT 용액을 준비한다. 부드럽게 혼합한다.
2. 마스터 믹스를 준비하기 위해, 20㎕의 10× 샘플 완충액 및 20㎕의 400mM DTT를 EZ 분홍색 마스터 믹스 튜브에 첨가한다. 부드럽게 혼합한다.
3. 바이오티닐화 사다리를 준비하기 위해, 분홍색 펠릿이 있는 EZ 투명한 바이오티닐화 사다리 튜브에 20㎕의 물을 피펫팅하여 넣는다. 부드럽게 혼합한다.
4. 루미놀과 퍼옥사이드를 각각 동량을 첨가함으로써 루미놀과 퍼옥사이드 믹스를 준비한다. 한 번의 실행에 대해, 200㎕의 루미놀을 200㎕의 퍼옥사이드에 첨가한다.
5. 25㎕의 1차 항체 및 225㎕의 항체 희석액 2를 혼합함으로써 1차 항체 희석액(10배 희석)을 준비한다.
샘플의 준비:
1. 0.1× 샘플 완충액에 샘플을 희석한다. 10㎕의 10× 샘플 완충액을 990㎕의 물에 첨가함으로써 0.1× 샘플 완충액을 준비한다.
2. 필요에 따라 샘플을 희석한다. 예를 들어, 마스터 믹스를 첨가하기 이전에 NHP CSF 샘플을 4배 희석시켰다. 5㎕의 NHP CSF를 15㎕의 0.1× 샘플 완충액에 첨가한다.
3. 1×의 마스터 믹스를 4×의 샘플에 첨가함으로써 샘플을 준비한다. 기술적 복제를 실행하기 위해, 샘플당 총 15㎕의 샘플과 마스터 믹스를 준비한다. 예를 들어, 3㎕의 마스터 믹스를 12㎕의 희석된 샘플에 첨가한다. 부드럽게 혼합한다.
4. 95℃에서 5분 동안 샘플을 끓인다.
5. 데스크탑 미니-원심분리기를 사용하여 샘플을 짧게 스핀다운시킨다. 샘플을 로딩하기 전에 와동시킨다.
시약 및 샘플의 카트리지 내로의 로딩:
1. 카트리지 맵을 따라 모든 샘플을 피펫팅한다.
a. 레인 E의 각각의 웰에 15㎕의 루미놀+퍼옥사이드를 피펫팅한다.
b. 레인 D의 제1 웰에 10㎕의 스트렙타비딘을 피펫팅한다.
c. 레인 D의 나머지 24개 웰에 10㎕의 2차 항체를 피펫팅한다.
d. 레인 C의 제1 웰에 10㎕의 항체 희석액을 피펫팅한다.
e. 레인 C의 나머지 24개 웰에 10㎕의 1차 항체 희석액을 피펫팅한다.
f. 레인 B의 모든 웰에 10㎕의 항체 희석액을 피펫팅한다.
g. 레인 A의 제1 웰에 10㎕의 준비된 EZ 사다리를 피펫팅한다.
h. 5㎕의 샘플과 마스터 믹스 용액을 피펫팅하여 레인 A의 레인을 중복해서 한다.
2. 2500 RPM에서 5분 동안 실온에서 카트리지를 회전시킨다.
기기에 모세관 및 카트리지의 로딩:
1. 모세관을 슬롯에 로딩한다. 표시등이 파랑색으로 바뀌는지를 확인한다.
2. 회전시킨 카트리지를 기기에 로딩한다.
3. 기기에서 파랑색 표시등이 깜박임을 멈춘 후 시작 버튼을 누른다.
중복에 대한 CV(분산 계수) 백분율이 30% 이하인 경우, 분석 시스템 적합성을 허용 가능한 것으로 간주하였다.
분석을 NHP CSF 샘플에서 프로그래뉼린을 검출하는 데 사용하기 전에, 분석을 다음과 같이 테스트하였다. Jess 분석의 적격성은 희석 선형성, 선택성 및 특이성의 평가를 포함하였다. BioIVT의 정상적인 CSF 샘플을 Jess 분석의 희석 선형성을 결정하는 데 사용하였다. PGRN 돌연변이가 있는 전두측두엽 치매(FTD) 환자 유래의 CSF 샘플(국립 알츠하이머병 및 관련 치매 인체자원은행(National Centralized Repository for Alzheimer's Disease and Related Dementias(NCRAD; 미국 인디애나주 인디애니폴리스 소재))에서 획득함)을 사용하여 Jess 분석의 선택성 및 특이성을 결정하였다.
Figure pct00025
결과 및 논의
희석 선형성
상업적으로 입수 가능한(BioIVT) 정상 개체 유래의 CSF 샘플에서 Jess에 의해 검출된 PGRN 단백질의 희석 선형성을 테스트하였다. CSF 샘플에서 PGRN의 내인성 수준을 측정하여 희석 선형성을 결정하였다. 2 내지 64배 희석 범위인 2배 연속 희석으로 2명의 개체를 테스트하였다.
표 19는 Jess에 의해 검출된 58 kDa의 PGRN 단백질의 피크 면적 및 16배 희석액으로부터 각각의 희석액의 차이%를 기록하였다. 선형성 범위 내의 결과는 굵은 체로 제시되어 있다(100± 30% 차이 이내). 희석 선형성은 4 내지 16배 희석 범위 내에 있는 것으로 규명되었다.
Figure pct00026
요약하면, 테스트된 모든 매트릭스는 범위의 크기 및 희석량이 매트릭스 간에 다양하지만, 0± 30%인 차이%의 허용 기준을 통과하는 허용 가능한 선형 범위를 가졌다. 샘플 선형성 MRD는 4배 희석인 것으로 규명되었다. 희석 선형성은 4 내지 16배 희석 범위 내에 있는 것으로 규명되었다. CSF에 대한 허용 기준을 통과하는 MRD 및 선형 희석 범위의 요약이 표 20에 서술되어 있다.
Figure pct00027
선택성 및 특이성
NCRAD로부터의 PR006 FTD 환자 샘플 유래의 CSF 샘플에서 Jess에 의해 검출된 PGRN 단백질의 선택성 및 특이성을 테스트하였다. CSF 샘플의 3개 그룹(그룹 A, B, 및 C)을 이형접합 FTD 환자(그룹 A), 가족성 비-보인자(그룹 B 또는 C), 및 정상 개체(그룹 B 또는 C)로부터 수집하였다. 각각의 그룹에 대해 6개의 샘플을 분석하였다. 샘플 그룹은 표 16의 FTD 환자 CSF 샘플 정보에 열거되어 있다.
CSF 샘플을 ProteinSimple에서 제공하는 0.1× 샘플 완충액에서 4배 희석시키고 기술적 복제물로 테스트하였다. 결과 CV%가 20%를 초과하는 샘플 복제물을 재분석하였다. CV%가 20% 미만인 결과를 표 22에 기록하였다. 표 22는 Jess에 의해 검출된 58 kDa에서의 PGRN 단백질의 피크 영역 및 복제물 간의 CV%를 기록하였다. 결과는 그룹 A와 비교하여 그룹 B 및 C에서 약 2배 더 높은 PGRN 수준을 나타내었으며, 이는 CSF 샘플에 대한 PGRN 수준 결정에서 Jess 분석의 선택성 및 특이성을 나타낸다(도 55).
Figure pct00028
Figure pct00029
FTD 환자 연구 유래의 CSF 샘플(표 21)을 또한 인간 PGRN ELISA 키트(Adipogen, AG-45A-0018YEK-KI01)로 분석하였다. ELISA로부터의 결과(도 56)는 그룹 간 PGRN 수준의 경향이 Jess와 유사함을 나타내었고 Jess 분석이 CSF 샘플에서 PGRN 수준의 평가에 사용하기에 적합함을 입증하였다.
결론적으로, 이러한 ProteinSimple 자동화된 웨스턴 Jess 분석은 NHP CSF 샘플에서 PGRN 수준의 평가에 사용하기에 적합한 것으로 결정되었다.
NHP CSF 샘플에 대한 Jess 데이터는 표 23에 표시되어 있다. 각각의 샘플은 2개의 기술적 복제물에 대한 평균을 나타낸다. 샘플 레인에서 58 kDa 밴드에 대한 피크 면적이 기록되어 있다. 데이터는 기술적 복제물의 평균 피크 면적 및 조정된 희석 배수로 표시되어 있다.
Figure pct00030
이 분석의 목표는 NHP 연구에 대한 관심이 있는 조직 영역에서 PR006의 형질도입 후 프로그래뉼린(PGRN) 단백질 발현 수준의 수준을 확인하는 것이었다. 이는 단클론성 항체를 사용하여 프로그래뉼린 단백질을 검출하는 자동화된 웨스턴 플랫폼을 사용하여 수행되었다. 프로그래뉼린 발현은 대조군 및 PR006-처리 NHP 둘 다의 CSF에서 측정 가능하였으며; 분석은 내인성 프로그래뉼린 단백질과 PR006A-유도 프로그래뉼린 단백질을 구별하지 않았다.
본 출원은 하기 문서의 내용 전문을 참조에 의해 원용한다: 국제 PCT 출원 공개 WO 제2019/070893호; 국제 PCT 출원 공개 WO 제2019/070891호; 2017년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,296호; 2017년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,311호; 2017년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,319호; 2018년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,301호; 2017년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,310호; 2017년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,303호; 및 2017년 10월 3일자로 출원되고 명칭이 "GENE THERAPIES FOR LYSOSOMAL DISORDERS"인 미국 가출원 일련번호 제62/567,305호.
이와 같이 본 발명의 적어도 하나의 실시형태의 여러 양상을 기재하였으나, 다양한 변경, 변형, 및 개선이 당업자에게 용이하게 일어날 것임을 이해하여야 한다. 이와 같은 변경, 변형, 및 개선은 본 개시내용의 일부인 것으로 의도되고, 본 발명의 사상 및 범주 내에 있는 것으로 의도된다. 따라서, 전술한 기재 및 도면은 단지 예시일 뿐이다.
본 발명의 여러 실시형태를 본 명세서에 기재하고 예시하였지만, 당업자는 본 명세서에 기재된 기능을 수행하고/하거나 결과 및/또는 하나 이상의 장점을 얻기 위해 다양한 다른 수단 및/또는 구조를 용이하게 구상할 것이고, 이와 같은 변화 및/또는 변형 각각은 본 발명의 범주 내에 있는 것으로 간주된다. 더 일반적으로, 당업자는 본 명세서에 기재된 모든 매개변수, 치수, 재료, 및 구성이 예시임을 의미하고 실제 매개변수, 치수, 재료, 및/또는 구성은 본 발명의 교시가 사용되는 특정 응용분야 또는 응용분야들에 따라 달라질 것임을 용이하게 이해할 것이다. 당업자는 본 명세서에 기재된 발명의 특정 실시형태에 대한 많은 등가물을 인식하거나, 단지 일상적인 실험을 사용하여 확인할 수 있을 것이다. 따라서, 전술한 실시형태는 단지 예로서 제시되고, 첨부된 청구범위 및 이에 대한 균등물의 범주 내에서 본 발명은 구체적으로 기재되고 청구된 것과 다르게 실시될 수 있음을 이해해야 한다. 본 발명은 본 명세서에 기재된 각각의 개별적인 특징, 시스템, 물품, 재료, 및/또는 방법에 관한 것이다. 추가적으로, 이와 같은 특징, 시스템, 물품, 재료, 및/또는 방법이 서로 일치하지 않는 경우, 2가지 이상의 이와 같은 특징, 시스템, 물품, 재료, 및/또는 방법의 임의의 조합은 본 발명의 범주 내에 포함된다.
명세서 및 청구범위에서 본 명세서에서 사용되는 바와 같이, 단수표현은 반대로 명확하게 나타내지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
명세서 및 청구범위에서 본 명세서에서 사용되는 바와 같이, 어구 "및/또는"은 그렇게 결합된 요소, 즉, 일부 경우에 결합하여 존재하고 다른 경우에 분리적으로 존재하는 요소의 "어느 하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. 반대로 명확하게 나타내지 않는 한 구체적으로 식별된 요소와 관련이 있든 관련이 없든 상관없이, "및/또는" 절에 의해 구체적으로 식별되는 요소 이외의 다른 요소가 선택적으로 존재할 수 있다. 따라서, 비-제한적인 예로서, "포함하는"과 같은 개방형 언어와 함께 사용될 때 "A 및/또는 B"에 대한 언급은 일 실시형태에서 B 없이 A(선택적으로 B 이외의 요소를 포함함); 또 다른 실시형태에서 A 없이 B(선택적으로 A 이외의 요소를 포함함); 또 다른 실시형태에서 A 및 B 둘 다(선택적으로 다른 요소를 포함함) 등을 지칭할 수 있다.
명세서 및 청구범위에서 본 명세서에서 사용되는 바와 같이, "또는"은 상기 정의된 바와 같은 "및/또는"과 동일한 의미를 가지는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로, 즉, 다수의 또는 목록의 요소 중 적어도 하나를 포함하는 것뿐만 아니라 하나 초과를 포함하고, 선택적으로 추가적인 목록에 없는 항목을 포함하는 것으로 해석되어야 한다. "~중 단지 하나" 또는 "~중 정확히 하나", 또는 청구범위에서 사용될 때 "~로 이루어진"과 같이 명확하게 반대로 나타내는 용어만 다수 또는 목록의 요소 중 정확히 하나의 요소를 포함하는 것을 지칭할 것이다. 일반적으로, 본 명세서에서 사용되는 바와 같이 용어 "또는"은 "어느 하나", "~중 하나", "~중 단지 하나", 또는 "~중 정확히 하나"와 같은 배타적인 용어가 선행하는 경우 배타적인 대안(즉, "하나 또는 다른 하나, 그러나 둘 다는 아님")을 나타내는 것으로만 해석되어야 한다.
명세서 및 청구범위에서 본 명세서에서 사용되는 바와 같이, 하나 이상의 요소의 목록과 관련하여 어구 "적어도 하나"는, 요소 목록의 요소 중 임의의 하나 이상으로부터 선택되는 적어도 하나의 요소를 의미하는 것으로 이해되어야 하지만, 요소 목록 내에 구체적으로 열거된 각각의 모든 요소 중 적어도 하나를 반드시 포함할 필요는 없으며, 요소 목록의 요소의 임의의 조합을 제외하지 않는다. 이러한 정의는 또한 요소가 구체적으로 식별된 요소와 관련이 있든 관련이 없든 상관없이, 어구 "적어도 하나"가 지칭하는 요소 목록 내에서 구체적으로 식별된 요소 이외의 요소가 선택적으로 존재할 수 있음을 허용한다. 따라서, 비-제한적인 예로서, "A 및 B 중 적어도 하나"(또는, 동등하게, "A 또는 B 중 적어도 하나", 또는 동등하게 "A 및/또는 B 중 적어도 하나")는, 일 실시형태에서 B가 존재하지 않고(선택적으로 B 이외의 요소를 포함함) 선택적으로 하나 초과를 포함하여 적어도 하나의 A; 또 다른 실시형태에서 A가 존재하지 않고(선택적으로 A 이외의 요소를 포함함) 선택적으로 하나 초과를 포함하여 적어도 하나의 B; 또 다른 실시형태에서 선택적으로 하나 초과를 포함하여 적어도 하나의 A, 및 선택적으로 하나 초과를 포함하여 적어도 하나의 B(선택적으로 다른 요소를 포함함) 등을 지칭할 수 있다.
청구 요소를 변형하기 위하여 청구범위에서 "제1", "제2", "제3" 등과 같은 서수 용어의 사용은 그 자체로 하나의 청구 요소의 다른 요소에 비한 임의의 우선권, 우선 순위, 또는 순서 또는 방법의 동작이 수행되는 시간적 순서를 내포하지 않지만, 단지 청구 요소를 구별하기 위해 특정 명칭을 가진 하나의 청구 요소를 (서수 용어의 사용이 없다면) 동일한 명칭을 가진 다른 요소와 구별하기 위한 표지로서 사용된다.
또한, 반대로 명확하게 나타내지 않는 한, 하나 초과의 단계 또는 작용을 포함하는 본 명세서에서 청구된 임의의 방법에서, 방법의 단계 또는 작용의 순서는 반드시 방법의 단계 또는 작용이 언급된 순서로 제한되지 않는 것으로 이해되어야 한다.
본 출원에서 언급된 미국 특허, 미국 특허출원 공개, 미국 특허출원, 외국 특허, 외국 특허출원 및 비-특허 간행물 각각은 그 전문이 본 명세서에 참조에 의해 원용된다.
서열
일부 실시형태에서, 하나 이상의 유전자 산물(예컨대, 제1, 제2 및/또는 제3 유전자 산물)을 인코딩하는 발현 카세트는 서열번호 1 내지 91 중 어느 하나에 제시된 서열을 포함하거나 이로 이루어진다(또는 상기 서열을 갖는 펩타이드를 인코딩함). 일부 실시형태에서, 유전자 산물은 서열번호 1 내지 91 중 임의의 하나의 일부(예컨대, 단편)에 의해 인코딩된다.
번호를 매긴 실시형태
첨부된 청구범위에도 불구하고, 본 개시내용은 하기 번호를 매긴 실시형태를 제시한다:
1. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 Gcase 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) Gcase 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
2. 실시형태 1에 있어서, 상기 Gcase 단백질은 서열번호 14에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
3. 실시형태 1 또는 2에 있어서, 상기 Gcase 단백질은 코돈-최적화된 핵산 서열, 선택적으로 서열번호 15에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
4. 실시형태 1 내지 3 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
5. 실시형태 1 내지 4 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
6. 실시형태 1 내지 5 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
7. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 프로사포신 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) 프로사포신 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
8. 실시형태 7에 있어서, 상기 프로사포신 단백질은 서열번호 16에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
9. 실시형태 7 또는 8에 있어서, 상기 프로사포신 단백질은 코돈-최적화된 핵산 서열, 선택적으로 서열번호 17에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
10. 실시형태 7 내지 9 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
11. 실시형태 7 내지 10 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
12. 실시형태 7 내지 11 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
13. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 SCARB2 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) SCARB2 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
14. 실시형태 13에 있어서, 상기 SCARB2 단백질은 서열번호 18에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
15. 실시형태 13 또는 14에 있어서, 상기 SCARB2 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 19에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
16. 실시형태 13 내지 15 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
17. 실시형태 13 내지 16 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
18. 실시형태 13 내지 17 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
19. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 GBA2 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) GBA2 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
20. 실시형태 19에 있어서, 상기 GBA2 단백질은 서열번호 30에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
21. 실시형태 19 또는 20에 있어서, 상기 GBA2 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 31에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
22. 실시형태 19 내지 21 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
23. 실시형태 19 내지 22 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
24. 실시형태 19 내지 23 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
25. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 GALC 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) GALC 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
26. 실시형태 25에 있어서, 상기 GALC 단백질은 서열번호 33에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
27. 실시형태 25 또는 26에 있어서, 상기 GALC 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 34에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
28. 실시형태 25 내지 27 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
29. 실시형태 25 내지 28 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
30. 실시형태 25 내지 29 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
31. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 CTSB 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) CTSB 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
32. 실시형태 31에 있어서, 상기 CTSB 단백질은 서열번호 30에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
33. 실시형태 31 또는 32에 있어서, 상기 CTSB 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 36에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
34. 실시형태 31 내지 33 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
35. 실시형태 31 내지 34 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
36. 실시형태 31 내지 35 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
37. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 SMPD1 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) SMPD1 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
38. 실시형태 37에 있어서, 상기 SMPD1 단백질은 서열번호 37에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
39. 실시형태 37 또는 38에 있어서, 상기 SMPD1 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 38에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
40. 실시형태 37 내지 39 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
41. 실시형태 37 내지 40 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
42. 실시형태 37 내지 41 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
43. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 GCH1 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) GCH1 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
44. 실시형태 43에 있어서, 상기 GCH1 단백질은 서열번호 45에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
45. 실시형태 43 또는 44에 있어서, 상기 GCH1 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 46에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
46. 실시형태 43 내지 45 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
47. 실시형태 43 내지 46 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
48. 실시형태 43 내지 47 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
49. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 RAB7L 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) RAB7L 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
50. 실시형태 49에 있어서, 상기 RAB7L 단백질은 서열번호 47에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
51. 실시형태 49 또는 50에 있어서, 상기 RAB7L 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 48에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
52. 실시형태 49 내지 51 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
53. 실시형태 49 내지 52 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
54. 실시형태 49 내지 53 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
55. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 VPS35 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) VPS35 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
56. 실시형태 55에 있어서, 상기 VPS35 단백질은 서열번호 49에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
57. 실시형태 55 또는 56에 있어서, 상기 VPS35 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 50에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
58. 실시형태 55 내지 57 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
59. 실시형태 55 내지 58 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
60. 실시형태 55 내지 59 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
61. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 IL-34 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) IL-34 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
62. 실시형태 61에 있어서, 상기 IL-34 단백질은 서열번호 55에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
63. 실시형태 61 또는 62에 있어서, 상기 IL-34 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 56에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
64. 실시형태 61 내지 63 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
65. 실시형태 61 내지 64 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
66. 실시형태 61 내지 65 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
67. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 TREM2 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) TREM2 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
68. 실시형태 67에 있어서, 상기 TREM2 단백질은 서열번호 57에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
69. 실시형태 67 또는 68에 있어서, 상기 TREM2 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 58에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
70. 실시형태 67 내지 69 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
71. 실시형태 67 내지 70 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
72. 실시형태 67 내지 71 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
73. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 TMEM106B 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) TMEM106B 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
74. 실시형태 73에 있어서, 상기 TMEM106B 단백질은 서열번호 63에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
75. 실시형태 73 또는 74에 있어서, 상기 TMEM106B 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 64에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
76. 실시형태 73 내지 75 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
77. 실시형태 73 내지 76 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
78. 실시형태 73 내지 77 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
79. 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR)가 측접한 프로그래뉼린(PGRN) 단백질을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서,
(i) ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하고/하거나;
(ii) PGRN 단백질은 코돈-최적화된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
80. 실시형태 79에 있어서, 상기 PGRN 단백질은 서열번호 67에 제시된 아미노산 서열 또는 이의 일부를 포함하는, 단리된 핵산.
81. 실시형태 79 또는 80에 있어서, 상기 PGRN 단백질은 코돈-최적화된 핵산 서열 또는 서열번호 68에 제시된 핵산 서열에 의해 인코딩되는, 단리된 핵산.
82. 실시형태 79 내지 81 중 어느 하나에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
83. 실시형태 79 내지 82 중 어느 하나에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
84. 실시형태 79 내지 83 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
85. 제1 유전자 산물 및 제2 유전자 산물을 인코딩하는 발현 작제물을 포함하는 단리된 핵산으로서, 각각의 유전자 산물은 독립적으로 표 1에 제시된 유전자 산물, 또는 이의 일부로부터 선택되는, 단리된 핵산.
86. 실시형태 85에 있어서, 상기 제1 유전자 산물은 Gcase 단백질, 또는 이의 일부인, 단리된 핵산.
87. 실시형태 85 또는 86에 있어서, 상기 제2 유전자 산물은 LIMP2 또는 이의 일부, 또는 프로사포신 또는 이의 일부인, 단리된 핵산.
88. 실시형태 85 내지 87 중 어느 하나에 있어서, 간섭 핵산(예컨대, shRNA, miRNA, dsRNA 등)을 추가로 인코딩하고, 선택적으로 간섭 핵산은 α-Syn 또는 TMEM106B의 발현을 저해하는, 단리된 핵산.
89. 실시형태 85 내지 88 중 어느 하나에 있어서, 하나 이상의 프로모터를 추가로 포함하고, 선택적으로 하나 이상의 프로모터 각각은 독립적으로 닭-베타 액틴(CBA) 프로모터, CAG 프로모터, CD68 프로모터, 또는 JeT 프로모터인, 단리된 핵산.
90. 실시형태 85 내지 89 중 어느 하나에 있어서, 내부 리보솜 유입 부위(IRES)를 추가로 포함하고, 선택적으로 IRES는 제1 유전자 산물과 제2 유전자 산물 사이에 위치하는, 단리된 핵산.
91. 실시형태 85 내지 90 중 어느 하나에 있어서, 자가-절단 펩타이드 코딩 서열을 추가로 포함하고, 선택적으로 자가-절단 펩타이드는 T2A인, 단리된 핵산.
92. 실시형태 85 내지 91 중 어느 하나에 있어서, 상기 발현 작제물은 제1 유전자 산물 및 제2 유전자 산물에 측접하는 2개의 아데노-연관 바이러스(AAV) 반전 말단 반복부(ITR) 서열을 포함하고, 선택적으로 ITR 서열 중 하나는 기능성 말단 분해 부위가 결여되어 있는, 단리된 핵산.
93. 실시형태 92에 있어서, 상기 ITR 중 적어도 하나는 야생형 AAV2 ITR(서열번호 29)에 대해 변형된 "D" 영역을 포함하는, 단리된 핵산.
94. 실시형태 93에 있어서, 상기 변형된 "D" 영역은 발현 작제물에 대해 ITR의 외부에 위치한 "D" 서열인, 단리된 핵산.
95. 실시형태 93 또는 94에 있어서, 상기 변형된 "D" 서열을 포함하는 ITR은 3' ITR인, 단리된 핵산.
96. 실시형태 85 내지 95 중 어느 하나에 있어서, TRY 서열을 추가로 포함하고, 선택적으로 TRY 서열은 서열번호 28에 제시된, 단리된 핵산.
97. 서열번호 1 내지 91 중 어느 하나에 제시된 서열을 갖는 단리된 핵산.
98. 실시형태 1 내지 97 중 어느 하나의 단리된 핵산을 포함하는 벡터.
99. 실시형태 98에 있어서, 상기 벡터는 플라스미드인, 벡터.
100. 실시형태 98에 있어서, 상기 벡터는 바이러스 벡터이고, 선택적으로 바이러스 벡터는 재조합 AAV(rAAV) 벡터 또는 바큘로바이러스 벡터인, 벡터.
101. 실시형태 1 내지 97 중 어느 하나의 단리된 핵산 또는 실시형태 98 내지 100 중 어느 하나의 벡터를 포함하는 조성물.
102. 실시형태 1 내지 97 중 어느 하나의 단리된 핵산 또는 실시형태 98 내지 100 중 어느 하나의 벡터를 포함하는 숙주 세포.
103. (i) 캡시드 단백질; 및
(ii) 실시형태 1 내지 97 중 어느 하나의 단리된 핵산, 또는 실시형태 98 내지 100 중 어느 하나의 벡터
를 포함하는 재조합 아데노-연관 바이러스(rAAV).
104. 실시형태 103에 있어서, 상기 캡시드 단백질은 혈액-뇌 장벽을 통과할 수 있고, 선택적으로 캡시드 단백질은 AAV9 캡시드 단백질 또는 AAVrh.10 캡시드 단백질인, rAAV.
105. 실시형태 103 또는 104에 있어서, 상기 rAAV는 중추신경계(CNS)의 뉴런 세포 및 비-뉴런 세포를 형질도입하는, rAAV.
106. 파킨슨병을 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법으로서, 실시형태 1 내지 97 중 어느 하나의 단리된 핵산, 실시형태 98 내지 100 중 어느 하나의 벡터, 실시형태 101의 조성물, 또는 실시형태 103 내지 105 중 어느 하나의 rAAV를 대상체에게 투여하는 단계를 포함하는, 방법.
107. 실시형태 106에 있어서, 상기 투여는 대상체의 CNS에 대한 직접 주사를 포함하고, 선택적으로 직접 주사는 뇌내 주사, 뇌실질내 주사, 척수강내 주사, 대조내 주사 또는 이들의 임의의 조합인, 방법.
108. 실시형태 107에 있어서, 상기 대상체의 CNS에 대한 직접 주사는 전도 촉진 투여(CED)를 포함하는, 방법.
109. 실시형태 106 내지 108 중 어느 하나에 있어서, 상기 투여는 말초 주사를 포함하고, 선택적으로 말초 주사는 정맥내 주사인, 방법.
110. GRN 돌연변이가 있는 전두측두엽 치매를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법으로서,
(i) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, rAAV 벡터; 및
(ii) AAV9 캡시드 단백질
을 포함하는 재조합 아데노-연관 바이러스(rAAV)를 대상체에게 투여하는 단계를 포함하는, 방법.
111. 실시형태 110에 있어서, 상기 rAAV는 약 1×1013개 벡터 게놈(vg) 내지 약 7×1014개 vg 범위의 용량으로 대상체에게 투여되는, 방법.
112. 실시형태 110 또는 111에 있어서, 상기 rAAV는 주사를 통해 대조 내로 투여되는, 방법.
113. 실시형태 110 내지 112 중 어느 하나에 있어서, 상기 프로모터는 닭 베타 액틴(CBA) 프로모터인, 방법.
114. 실시형태 110 내지 113 중 어느 하나에 있어서, 상기 rAAV 벡터는 거대세포바이러스(CMV) 인핸서를 추가로 포함하는, 방법.
115. 실시형태 110 내지 114 중 어느 하나에 있어서, 상기 rAAV 벡터는 우드척 간염 바이러스 전사후 조절 요소(WPRE)를 추가로 포함하는, 방법.
116. 실시형태 110 내지 115 중 어느 하나에 있어서, 상기 rAAV 벡터는 소 성장 호르몬 폴리A 신호 꼬리를 추가로 포함하는, 방법.
117. 실시형태 110 내지 116 중 어느 하나에 있어서, 상기 핵산은 발현 작제물에 측접하는 2개의 아데노-연관 바이러스 반전 말단 반복부(ITR) 서열을 포함하는, 방법.
118. 실시형태 117에 있어서, 각각의 ITR 서열은 야생형 AAV2 ITR 서열인, 방법.
119. 실시형태 110 내지 118 중 어느 하나에 있어서, 상기 rAAV 벡터는 5' ITR과 발현 작제물 사이에 TRY 영역을 추가로 포함하되, TRY 영역은 서열번호 28을 포함하는, 방법.
120. GRN 돌연변이가 있는 전두측두엽 치매를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법으로서,
(i) 5'에서 3'순서로
(a) AAV2 ITR;
(b) CMV 인핸서;
(c) CBA 프로모터;
(d) PGRN 단백질을 인코딩하는 이식유전자 삽입체로서, 서열번호 68의 뉴클레오타이드 서열을 포함하는, 이식유전자 삽입체;
(e) WPRE;
(f) 소 성장 호르몬 폴리A 신호 꼬리; 및
(g) AAV2 ITR
을 포함하는 핵산을 포함하는 rAAV 벡터; 및
(ii) AAV9 캡시드 단백질
을 포함하는 rAAV를 대상체에게 투여하는 단계를 포함하는, 방법.
121. 실시형태 120에 있어서, 상기 rAAV는 약 1×1013개 vg 내지 약 7×1014개 vg 범위의 용량으로 대상체에게 투여되는, 방법.
122. 실시형태 120 또는 121에 있어서, 상기 rAAV는 주사를 통해 대조 내로 투여되는, 방법.
123. 실시형태 110 내지 122 중 어느 하나에 있어서, 상기 rAAV는 약 20mM Tris(pH 8.0), 약 1mM MgCl2, 약 200mM NaCl, 및 약 0.001% w/v 폴록사머 188을 포함하는 제형으로 투여되는, 방법.
124. 약제학적 조성물로서,
(i) rAAV로서,
(a) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, rAAV 벡터; 및
(b) AAV9 캡시드 단백질
을 포함하는, rAAV; 및
(ii) 약 20mM Tris(pH 8.0),
(iii) 약 1mM MgCl2 ,
(iv) 약 200mM NaCl, 및
(v) 약 0.001% w/v 폴록사머 188
을 포함하는 약제학적 조성물.
125. 대상체에서 GRN 돌연변이가 있는 전두측두엽 치매를 치료하는 방법에서 사용하기 위한,
(a) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, rAAV 벡터; 및
(b) AAV9 캡시드 단백질
을 포함하는 rAAV.
126. 뇌척수액(CSF) 샘플에서 PGRN 단백질 수준을 정량화하는 방법으로서,
(1) 다이티오트레이톨(DTT) 및 샘플 완충액을 포함하는 마스터 믹스에서 CSF 샘플을 희석시키는 단계;
(2) 희석된 CSF 샘플, 항-프로그래뉼린 항체, 항-프로그래뉼린 항체를 검출하는 2차 항체, 루미놀 및 퍼옥사이드를 모세관 카트리지의 웰에 로딩하는 단계;
(3) 모세관 카트리지를 자동화된 웨스턴 블롯 면역분석 기기에 로딩하는 단계;
(4) 자동화된 웨스턴 블롯 면역분석 기기를 사용하여 신호 강도, 피크 면적, 및 신호 대 잡음 비를 계산하는 단계; 및
(5) 항-그래뉼린 항체에 대한 면역반응성의 피크 면적으로서 CSF 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 단계
를 포함하는, 방법.
SEQUENCE LISTING <110> Prevail Therapeutics, Inc. <120> GENE THERAPIES FOR LYSOSOMAL DISORDERS <130> PRVL-010/05WO 334806-2052 <140> PCT/US2020/027764 <141> 2020-04-10 <150> US 62/988,665 <151> 2020-03-12 <150> US 62/960,471 <151> 2020-01-13 <150> US 62/954,089 <151> 2019-12-27 <150> US 62/934,450 <151> 2019-11-12 <150> US 62/831,846 <151> 2019-04-10 <160> 91 <170> PatentIn version 3.5 <210> 1 <211> 10697 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 1 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 360 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 420 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 480 caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 540 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 600 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 660 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 720 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 780 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 840 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 900 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 960 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1020 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1080 gcgcttggtt taatgacggc ttgttttctg tggctgcgtg aaagccttga ggggctccgg 1140 gagctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1200 acgtgctggt tattgtgctg tctcatcatt ttggcaaaga attcctcgaa gatccgaagg 1260 gaaagtcttc cacgactgtg ggatccgttc gaagatatca ccggttgagc caccatggaa 1320 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 1380 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1440 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1500 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1560 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1620 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1680 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1740 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1800 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1860 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1920 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1980 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 2040 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 2100 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 2160 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 2220 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 2280 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 2340 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 2400 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2460 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2520 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2580 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2640 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2700 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2760 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2820 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2880 agccctggct actccatcca cacctacctg tggcgtagac agtgacaatt gttaattaag 2940 tttaaaccct cgaggccgca agcttatcga taatcaacct ctggattaca aaatttgtga 3000 aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 3060 aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 3120 atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 3180 gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 3240 cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 3300 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 3360 ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 3420 gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 3480 gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 3540 cctttgggcc gcctccccgc atcgataccg tcgactagag ctcgctgatc agcctcgact 3600 gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 3660 gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 3720 agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 3780 gaagacaata gcaggcatgc tggggagaga tccacgataa caaacagctt ttttggggtg 3840 aacatattga ctgaattccc tgcaggttgg ccactccctc tctgcgcgct cgctcgctca 3900 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3960 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc tgcggccgct 4020 cgtacggtct cgaggaattc ctgcaggata acttgccaac ctcattctaa aatgtatata 4080 gaagcccaaa agacaataac aaaaatattc ttgtagaaca aaatgggaaa gaatgttcca 4140 ctaaatatca agatttagag caaagcatga gatgtgtggg gatagacagt gaggctgata 4200 aaatagagta gagctcagaa acagacccat tgatatatgt aagtgaccta tgaaaaaaat 4260 atggcatttt acaatgggaa aatgatggtc tttttctttt ttagaaaaac agggaaatat 4320 atttatatgt aaaaaataaa agggaaccca tatgtcatac catacacaca aaaaaattcc 4380 agtgaattat aagtctaaat ggagaaggca aaactttaaa tcttttagaa aataatatag 4440 aagcatgcag accagcctgg ccaacatgat gaaaccctct ctactaataa taaaatcagt 4500 agaactactc aggactactt tgagtgggaa gtccttttct atgaagactt ctttggccaa 4560 aattaggctc taaatgcaag gagatagtgc atcatgcctg gctgcactta ctgataaatg 4620 atgttatcac catctttaac caaatgcaca ggaacaagtt atggtactga tgtgctggat 4680 tgagaaggag ctctacttcc ttgacaggac acatttgtat caacttaaaa aagcagattt 4740 ttgccagcag aactattcat tcagaggtag gaaacttaga atagatgatg tcactgatta 4800 gcatggcttc cccatctcca cagctgcttc ccacccaggt tgcccacagt tgagtttgtc 4860 cagtgctcag ggctgcccac tctcagtaag aagccccaca ccagcccctc tccaaatatg 4920 ttggctgttc cttccattaa agtgacccca ctttagagca gcaagtggat ttctgtttct 4980 tacagttcag gaaggaggag tcagctgtga gaacctggag cctgagatgc ttctaagtcc 5040 cactgctact ggggtcaggg aagccagact ccagcatcag cagtcaggag cactaagccc 5100 ttgccaacat cctgtttctc agagaaactg cttccattat aatggttgtc cttttttaag 5160 ctatcaagcc aaacaaccag tgtctaccat tattctcatc acctgaagcc aagggttcta 5220 gcaaaagtca agctgtcttg taatggttga tgtgcctcca gcttctgtct tcagtcactc 5280 cactcttagc ctgctctgaa tcaactctga ccacagttcc ctggagcccc tgccacctgc 5340 tgcccctgcc accttctcca tctgcagtgc tgtgcagcct tctgcactct tgcagagcta 5400 ataggtggag acttgaagga agaggaggaa agtttctcat aatagccttg ctgcaagctc 5460 aaatgggagg tgggcactgt gcccaggagc cttggagcaa aggctgtgcc caacctctga 5520 ctgcatccag gtttggtctt gacagagata agaagccctg gcttttggag ccaaaatcta 5580 ggtcagactt aggcaggatt ctcaaagttt atcagcagaa catgaggcag aagacccttt 5640 ctgctccagc ttcttcaggc tcaaccttca tcagaataga tagaaagaga ggctgtgagg 5700 gttcttaaaa cagaagcaaa tctgactcag agaataaaca acctcctagt aaactacagc 5760 ttagacagag catctggtgg tgagtgtgct cagtgtccta ctcaactgtc tggtatcagc 5820 cctcatgagg acttctcttc tttccctcat agacctccat ctctgttttc cttagcctgc 5880 agaaatctgg atggctattc acagaatgcc tgtgctttca gagttgcatt ttttctctgg 5940 tattctggtt caagcatttg aaggtaggaa aggttctcca agtgcaagaa agccagccct 6000 gagcctcaac tgcctggcta gtgtggtcag taggatgcaa aggctgttga atgccacaag 6060 gccaaacttt aacctgtgta ccacaagcct agcagcagag gcagctctgc tcactggaac 6120 tctctgtctt ctttctcctg agccttttct tttcctgagt tttctagctc tcctcaacct 6180 tacctctgcc ctacccagga caaacccaag agccactgtt tctgtgatgt cctctccagc 6240 cctaattagg catcatgact tcagcctgac cttccatgct cagaagcagt gctaatccac 6300 ttcagatgag ctgctctatg caacacaggc agagcctaca aacctttgca ccagagccct 6360 ccacatatca gtgtttgttc atactcactt caacagcaaa tgtgactgct gagattaaga 6420 ttttacacaa gatggtctgt aatttcacag ttagttttat cccattaggt atgaaagaat 6480 tagcataatt ccccttaaac atgaatgaat cttagatttt ttaataaata gttttggaag 6540 taaagacaga gacatcagga gcacaaggaa tagcctgaga ggacaaacag aacaagaaag 6600 agtctggaaa tacacaggat gttcttggcc tcctcaaagc aagtgcaagc agatagtacc 6660 agcagcccca ggctatcaga gcccagtgaa gagaagtacc atgaaagcca cagctctaac 6720 caccctgttc cagagtgaca gacagtcccc aagacaagcc agcctgagcc agagagagaa 6780 ctgcaagaga aagtttctaa tttaggttct gttagattca gacaagtgca ggtcatcctc 6840 tctccacagc tactcacctc tccagcctaa caaagcctgc agtccacact ccaaccctgg 6900 tgtctcacct cctagcctct cccaacatcc tgctctctga ccatcttctg catctctcat 6960 ctcaccatct cccactgtct acagcctact cttgcaacta ccatctcatt ttctgacatc 7020 ctgtctacat cttctgccat actctgccat ctaccatacc acctcttacc atctaccaca 7080 ccatctttta tctccatccc tctcagaagc ctccaagctg aatcctgctt tatgtgttca 7140 tctcagcccc tgcatggaaa gctgacccca gaggcagaac tattcccaga gagcttggcc 7200 aagaaaaaca aaactaccag cctggccagg ctcaggagta gtaagctgca gtgtctgttg 7260 tgttctagct tcaacagctg caggagttcc actctcaaat gctccacatt tctcacatcc 7320 tcctgattct ggtcactacc catcttcaaa gaacagaata tctcacatca gcatactgtg 7380 aaggactagt catgggtgca gctgctcaga gctgcaaagt cattctggat ggtggagagc 7440 ttacaaacat ttcatgatgc tccccccgct ctgatggctg gagcccaatc cctacacaga 7500 ctcctgctgt atgtgttttc ctttcactct gagccacagc cagagggcag gcattcagtc 7560 tcctcttcag gctggggctg gggcactgag aactcaccca acaccttgct ctcactcctt 7620 ctgcaaaaca agaaagagct ttgtgctgca gtagccatga agaatgaaag gaaggcttta 7680 actaaaaaat gtcagagatt attttcaacc ccttactgtg gatcaccagc aaggaggaaa 7740 cacaacacag agacattttt tcccctcaaa ttatcaaaag aatcactgca tttgttaaag 7800 agagcaactg aatcaggaag cagagttttg aacatatcag aagttaggaa tctgcatcag 7860 agacaaatgc agtcatggtt gtttgctgca taccagccct aatcattaga agcctcatgg 7920 acttcaaaca tcattccctc tgacaagatg ctctagccta actccatgag ataaaataaa 7980 tctgcctttc agagccaaag aagagtccac cagcttcttc tcagtgtgaa caagagctcc 8040 agtcaggtta gtcagtccag tgcagtagag gagaccagtc tgcatcctct aattttcaaa 8100 ggcaagaaga tttgtttacc ctggacacca ggcacaagtg aggtcacaga gctcttagat 8160 atgcagtcct catgagtgag gagactaaag cgcatgccat caagacttca gtgtagagaa 8220 aacctccaaa aaagcctcct cactacttct ggaatagctc agaggccgag gcggcctcgg 8280 cctctgcata aataaaaaaa attagtcagc catggggcgg agaatgggcg gaactgggcg 8340 gagttagggg cgggatgggc ggagttaggg gcgggactat ggttgctgac taattgagat 8400 gcatgctttg catacttctg cctgctgggg agcctgggga ctttccacac ctggttgctg 8460 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 8520 accctaactg acacacattc cacagctgca ttaatgaatc ggccaacgcg cggggagagg 8580 cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 8640 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 8700 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 8760 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 8820 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 8880 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 8940 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9000 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 9060 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 9120 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 9180 agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 9240 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 9300 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 9360 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 9420 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 9480 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 9540 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 9600 agttgcctga ctcctgcaaa ccacgttgtg tctcaaaatc tctgatgtta cattgcacaa 9660 gataaaaata tatcatcatg aacaataaaa ctgtctgctt acataaacag taatacaagg 9720 ggtgttatga gccatattca acgggaaacg tcttgctcga ggccgcgatt aaattccaac 9780 atggatgctg atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg 9840 acaatctatc gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa 9900 ggtagcgttg ccaatgatgt tacagatgag atggtcagac taaactggct gacggaattt 9960 atgcctcttc cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc 10020 actgcgatcc ccgggaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa 10080 aatattgttg atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat 10140 tgtcctttta acagcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac 10200 ggtttggttg atgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc 10260 tggaaagaaa tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat 10320 ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga 10380 cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag 10440 ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg 10500 aataaattgc agtttcattt gatgctcgat gagtttttct aagggcggcc tgccaccata 10560 cccacgccga aacaagcgct catgagcccg aagtggcgag cccgatcttc cccatcggtg 10620 atgtcggcga tataggcgcc agcaaccgca cctgtggcgc cggtgatgag ggcgcgccaa 10680 gtcgacgtcc ggcagtc 10697 <210> 2 <211> 11355 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 2 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catgggccgc tgctgcttct acaccgccgg 660 caccctgagc ctgctgctgc tggtgaccag cgtgaccctg ctggtggccc gcgtgttcca 720 gaaggccgtg gaccagagca tcgagaagaa gatcgtgctg cgcaacggca ccgaggcctt 780 cgacagctgg gagaagcccc ccctgcccgt gtacacccag ttctacttct tcaacgtgac 840 caaccccgag gagatcctgc gcggcgagac cccccgcgtg gaggaggtgg gcccctacac 900 ctaccgcgag ctgcgcaaca aggccaacat ccagttcggc gacaacggca ccaccatcag 960 cgccgtgagc aacaaggcct acgtgttcga gcgcgaccag agcgtgggcg accccaagat 1020 cgacctgatc cgcaccctga acatccccgt gctgaccgtg atcgagtgga gccaggtgca 1080 cttcctgcgc gagatcatcg aggccatgct gaaggcctac cagcagaagc tgttcgtgac 1140 ccacaccgtg gacgagctgc tgtggggcta caaggacgag atcctgagcc tgatccacgt 1200 gttccgcccc gacatcagcc cctacttcgg cctgttctac gagaagaacg gcaccaacga 1260 cggcgactac gtgttcctga ccggcgagga cagctacctg aacttcacca agatcgtgga 1320 gtggaacggc aagaccagcc tggactggtg gatcaccgac aagtgcaaca tgatcaacgg 1380 caccgacggc gacagcttcc accccctgat caccaaggac gaggtgctgt acgtgttccc 1440 cagcgacttc tgccgcagcg tgtacatcac cttcagcgac tacgagagcg tgcagggcct 1500 gcccgccttc cgctacaagg tgcccgccga gatcctggcc aacaccagcg acaacgccgg 1560 cttctgcatc cccgagggca actgcctggg cagcggcgtg ctgaacgtga gcatctgcaa 1620 gaacggcgcc cccatcatca tgagcttccc ccacttctac caggccgacg agcgcttcgt 1680 gagcgccatc gagggcatgc accccaacca ggaggaccac gagaccttcg tggacatcaa 1740 ccccctgacc ggcatcatcc tgaaggccgc caagcgcttc cagatcaaca tctacgtgaa 1800 gaagctggac gacttcgtgg agaccggcga catccgcacc atggtgttcc ccgtgatgta 1860 cctgaacgag agcgtgcaca tcgacaagga gaccgccagc cgcctgaaga gcatgatcaa 1920 caccaccctg atcatcacca acatccccta catcatcatg gccctgggcg tgttcttcgg 1980 cctggtgttc acctggctgg cctgcaaggg ccagggcagc atggacgagg gcaccgccga 2040 cgagcgcgcc cccctgatcc gcacctgatt gtggccgaac cgccgaactc agaggccggc 2100 cccagaaaac ccgagcgagt agggggcggc gcgcaggagg gaggagaact gggggcgcgg 2160 gaggctggtg ggtgtggggg gtggagatgt agaagatgtg acgccgcggc ccggcgggtg 2220 ccagattagc ggacgcggtg cccgcggttg caacgggatc ccgggcgctg cagcttggga 2280 ggcggctctc cccaggcggc gtccgcggag acacccatcc gtgaacccca ggtcccgggc 2340 cgccggctcg ccgcgcacca ggggccggcg gacagaagag cggccgagcg gctcgaggct 2400 gggggaccgc gggcgcggcc gcgcgctgcc gggcgggagg ctggggggcc ggggccgggg 2460 ccgtgccccg gagcgggtcg gaggccgggg ccggggccgg gggacggcgg ctccccgcgc 2520 ggctccagcg gctcggggat cccggccggg ccccgcaggg accatgatgg aattcagcag 2580 ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg ccggatctct 2640 gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac cttgcatccc 2700 caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact gcgacagctt 2760 cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca ccagatccgg 2820 cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca ctggcctgct 2880 gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg gagccatgac 2940 agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc tgctgctcaa 3000 gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca tggccagctg 3060 cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc agctgcacaa 3120 cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca gagccctgca 3180 gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca cctggctgaa 3240 aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg acatctacca 3300 ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc acaagctgca 3360 gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg gctacccctt 3420 tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg atctgggacc 3480 cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg accagagact 3540 gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca aatacgtgca 3600 cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca cactgggaga 3660 gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg tgggcagcaa 3720 gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt acagccacag 3780 catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc tggccctgaa 3840 tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca tcgtggacat 3900 caccaaggac accttctaca agcagcccat gttctaccac ctgggacact tcagcaagtt 3960 catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg atctggacgc 4020 cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc gcagcagcaa 4080 agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa tcagccctgg 4140 ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta agtttaaacc 4200 ctcgaggccg caagccgcat cgataccgtc gactagagct cgctgatcag cctcgactgt 4260 gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 4320 aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 4380 taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 4440 agacaatagc aggcatgctg gggagagatc cacgataaca aacagctttt ttggggtgaa 4500 catattgact gaattccctg caggttggcc actccctctc tgcgcgctcg ctcgctcact 4560 gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc 4620 gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg cggccgctcg 4680 tacggtctcg aggaattcct gcaggataac ttgccaacct cattctaaaa tgtatataga 4740 agcccaaaag acaataacaa aaatattctt gtagaacaaa atgggaaaga atgttccact 4800 aaatatcaag atttagagca aagcatgaga tgtgtgggga tagacagtga ggctgataaa 4860 atagagtaga gctcagaaac agacccattg atatatgtaa gtgacctatg aaaaaaatat 4920 ggcattttac aatgggaaaa tgatggtctt tttctttttt agaaaaacag ggaaatatat 4980 ttatatgtaa aaaataaaag ggaacccata tgtcatacca tacacacaaa aaaattccag 5040 tgaattataa gtctaaatgg agaaggcaaa actttaaatc ttttagaaaa taatatagaa 5100 gcatgcagac cagcctggcc aacatgatga aaccctctct actaataata aaatcagtag 5160 aactactcag gactactttg agtgggaagt ccttttctat gaagacttct ttggccaaaa 5220 ttaggctcta aatgcaagga gatagtgcat catgcctggc tgcacttact gataaatgat 5280 gttatcacca tctttaacca aatgcacagg aacaagttat ggtactgatg tgctggattg 5340 agaaggagct ctacttcctt gacaggacac atttgtatca acttaaaaaa gcagattttt 5400 gccagcagaa ctattcattc agaggtagga aacttagaat agatgatgtc actgattagc 5460 atggcttccc catctccaca gctgcttccc acccaggttg cccacagttg agtttgtcca 5520 gtgctcaggg ctgcccactc tcagtaagaa gccccacacc agcccctctc caaatatgtt 5580 ggctgttcct tccattaaag tgaccccact ttagagcagc aagtggattt ctgtttctta 5640 cagttcagga aggaggagtc agctgtgaga acctggagcc tgagatgctt ctaagtccca 5700 ctgctactgg ggtcagggaa gccagactcc agcatcagca gtcaggagca ctaagccctt 5760 gccaacatcc tgtttctcag agaaactgct tccattataa tggttgtcct tttttaagct 5820 atcaagccaa acaaccagtg tctaccatta ttctcatcac ctgaagccaa gggttctagc 5880 aaaagtcaag ctgtcttgta atggttgatg tgcctccagc ttctgtcttc agtcactcca 5940 ctcttagcct gctctgaatc aactctgacc acagttccct ggagcccctg ccacctgctg 6000 cccctgccac cttctccatc tgcagtgctg tgcagccttc tgcactcttg cagagctaat 6060 aggtggagac ttgaaggaag aggaggaaag tttctcataa tagccttgct gcaagctcaa 6120 atgggaggtg ggcactgtgc ccaggagcct tggagcaaag gctgtgccca acctctgact 6180 gcatccaggt ttggtcttga cagagataag aagccctggc ttttggagcc aaaatctagg 6240 tcagacttag gcaggattct caaagtttat cagcagaaca tgaggcagaa gaccctttct 6300 gctccagctt cttcaggctc aaccttcatc agaatagata gaaagagagg ctgtgagggt 6360 tcttaaaaca gaagcaaatc tgactcagag aataaacaac ctcctagtaa actacagctt 6420 agacagagca tctggtggtg agtgtgctca gtgtcctact caactgtctg gtatcagccc 6480 tcatgaggac ttctcttctt tccctcatag acctccatct ctgttttcct tagcctgcag 6540 aaatctggat ggctattcac agaatgcctg tgctttcaga gttgcatttt ttctctggta 6600 ttctggttca agcatttgaa ggtaggaaag gttctccaag tgcaagaaag ccagccctga 6660 gcctcaactg cctggctagt gtggtcagta ggatgcaaag gctgttgaat gccacaaggc 6720 caaactttaa cctgtgtacc acaagcctag cagcagaggc agctctgctc actggaactc 6780 tctgtcttct ttctcctgag ccttttcttt tcctgagttt tctagctctc ctcaacctta 6840 cctctgccct acccaggaca aacccaagag ccactgtttc tgtgatgtcc tctccagccc 6900 taattaggca tcatgacttc agcctgacct tccatgctca gaagcagtgc taatccactt 6960 cagatgagct gctctatgca acacaggcag agcctacaaa cctttgcacc agagccctcc 7020 acatatcagt gtttgttcat actcacttca acagcaaatg tgactgctga gattaagatt 7080 ttacacaaga tggtctgtaa tttcacagtt agttttatcc cattaggtat gaaagaatta 7140 gcataattcc ccttaaacat gaatgaatct tagatttttt aataaatagt tttggaagta 7200 aagacagaga catcaggagc acaaggaata gcctgagagg acaaacagaa caagaaagag 7260 tctggaaata cacaggatgt tcttggcctc ctcaaagcaa gtgcaagcag atagtaccag 7320 cagccccagg ctatcagagc ccagtgaaga gaagtaccat gaaagccaca gctctaacca 7380 ccctgttcca gagtgacaga cagtccccaa gacaagccag cctgagccag agagagaact 7440 gcaagagaaa gtttctaatt taggttctgt tagattcaga caagtgcagg tcatcctctc 7500 tccacagcta ctcacctctc cagcctaaca aagcctgcag tccacactcc aaccctggtg 7560 tctcacctcc tagcctctcc caacatcctg ctctctgacc atcttctgca tctctcatct 7620 caccatctcc cactgtctac agcctactct tgcaactacc atctcatttt ctgacatcct 7680 gtctacatct tctgccatac tctgccatct accataccac ctcttaccat ctaccacacc 7740 atcttttatc tccatccctc tcagaagcct ccaagctgaa tcctgcttta tgtgttcatc 7800 tcagcccctg catggaaagc tgaccccaga ggcagaacta ttcccagaga gcttggccaa 7860 gaaaaacaaa actaccagcc tggccaggct caggagtagt aagctgcagt gtctgttgtg 7920 ttctagcttc aacagctgca ggagttccac tctcaaatgc tccacatttc tcacatcctc 7980 ctgattctgg tcactaccca tcttcaaaga acagaatatc tcacatcagc atactgtgaa 8040 ggactagtca tgggtgcagc tgctcagagc tgcaaagtca ttctggatgg tggagagctt 8100 acaaacattt catgatgctc cccccgctct gatggctgga gcccaatccc tacacagact 8160 cctgctgtat gtgttttcct ttcactctga gccacagcca gagggcaggc attcagtctc 8220 ctcttcaggc tggggctggg gcactgagaa ctcacccaac accttgctct cactccttct 8280 gcaaaacaag aaagagcttt gtgctgcagt agccatgaag aatgaaagga aggctttaac 8340 taaaaaatgt cagagattat tttcaacccc ttactgtgga tcaccagcaa ggaggaaaca 8400 caacacagag acattttttc ccctcaaatt atcaaaagaa tcactgcatt tgttaaagag 8460 agcaactgaa tcaggaagca gagttttgaa catatcagaa gttaggaatc tgcatcagag 8520 acaaatgcag tcatggttgt ttgctgcata ccagccctaa tcattagaag cctcatggac 8580 ttcaaacatc attccctctg acaagatgct ctagcctaac tccatgagat aaaataaatc 8640 tgcctttcag agccaaagaa gagtccacca gcttcttctc agtgtgaaca agagctccag 8700 tcaggttagt cagtccagtg cagtagagga gaccagtctg catcctctaa ttttcaaagg 8760 caagaagatt tgtttaccct ggacaccagg cacaagtgag gtcacagagc tcttagatat 8820 gcagtcctca tgagtgagga gactaaagcg catgccatca agacttcagt gtagagaaaa 8880 cctccaaaaa agcctcctca ctacttctgg aatagctcag aggccgaggc ggcctcggcc 8940 tctgcataaa taaaaaaaat tagtcagcca tggggcggag aatgggcgga actgggcgga 9000 gttaggggcg ggatgggcgg agttaggggc gggactatgg ttgctgacta attgagatgc 9060 atgctttgca tacttctgcc tgctggggag cctggggact ttccacacct ggttgctgac 9120 taattgagat gcatgctttg catacttctg cctgctgggg agcctgggga ctttccacac 9180 cctaactgac acacattcca cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 9240 gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 9300 ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 9360 gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 9420 aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 9480 gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 9540 ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 9600 cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 9660 cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 9720 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 9780 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 9840 agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 9900 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 9960 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 10020 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 10080 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 10140 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 10200 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 10260 ttgcctgact cctgcaaacc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 10320 taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 10380 tgttatgagc catattcaac gggaaacgtc ttgctcgagg ccgcgattaa attccaacat 10440 ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 10500 aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 10560 tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 10620 gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 10680 tgcgatcccc gggaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa 10740 tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg 10800 tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg 10860 tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 10920 gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt 10980 ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 11040 agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 11100 ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 11160 taaattgcag tttcatttga tgctcgatga gtttttctaa gggcggcctg ccaccatacc 11220 cacgccgaaa caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat 11280 gtcggcgata taggcgccag caaccgcacc tgtggcgccg gtgatgaggg cgcgccaagt 11340 cgacgtccgg cagtc 11355 <210> 3 <211> 11420 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 3 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggaattc agcagcccca gcagagagga 660 atgccccaag cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct 720 gcttcaggcc gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta 780 cagcagcgtc gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt 840 tcctgctctg ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact 900 gagcatggga cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc 960 tgagcagaaa ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct 1020 gaatatcctg gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga 1080 ggaaggcatc ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag 1140 gacctacacc tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga 1200 agaggacacc aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc 1260 cgtgtcactg ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt 1320 gaatggcaag ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag 1380 atacttcgtg aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac 1440 agccgagaac gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt 1500 tacacccgag caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag 1560 cacccaccat aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg 1620 ggctaaagtg gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca 1680 ctggtatctg gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt 1740 ccccaacacc atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag 1800 cgtgcggctc ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct 1860 gctgtaccac gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc 1920 taactgggtc cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt 1980 ctacaagcag cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc 2040 tcagcgcgtt ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca 2100 ccctgatgga tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac 2160 catcaaggat cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac 2220 ctacctgtgg cgtagacagt gacaattgtt aattaagttt catcgatacc gtcgactaga 2280 gctcgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 2340 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 2400 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 2460 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggagag atccacgata 2520 acaaacagct tttttggggg ggcggagtta gggcggagcc aatcagcgtg cgccgttccg 2580 aaagttgcct tttatggctg ggcggagaat gggcggtgaa cgccgatgat tatataagga 2640 cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc ggttcttgtt 2700 tgtggatccc tgtgatcgtc acttggtaag tcactgactg tctatgcctg ggaaagggtg 2760 ggcaggagat ggggcagtgc aggaaaagtg gcactatgaa ccctgcagcc ctaggaatgc 2820 atctagacaa ttgtactaac cttcttctct ttcctctcct gacagtccgg aaagccacca 2880 tgggccgctg ctgcttctac accgccggca ccctgagcct gctgctgctg gtgaccagcg 2940 tgaccctgct ggtggcccgc gtgttccaga aggccgtgga ccagagcatc gagaagaaga 3000 tcgtgctgcg caacggcacc gaggccttcg acagctggga gaagcccccc ctgcccgtgt 3060 acacccagtt ctacttcttc aacgtgacca accccgagga gatcctgcgc ggcgagaccc 3120 cccgcgtgga ggaggtgggc ccctacacct accgcgagct gcgcaacaag gccaacatcc 3180 agttcggcga caacggcacc accatcagcg ccgtgagcaa caaggcctac gtgttcgagc 3240 gcgaccagag cgtgggcgac cccaagatcg acctgatccg caccctgaac atccccgtgc 3300 tgaccgtgat cgagtggagc caggtgcact tcctgcgcga gatcatcgag gccatgctga 3360 aggcctacca gcagaagctg ttcgtgaccc acaccgtgga cgagctgctg tggggctaca 3420 aggacgagat cctgagcctg atccacgtgt tccgccccga catcagcccc tacttcggcc 3480 tgttctacga gaagaacggc accaacgacg gcgactacgt gttcctgacc ggcgaggaca 3540 gctacctgaa cttcaccaag atcgtggagt ggaacggcaa gaccagcctg gactggtgga 3600 tcaccgacaa gtgcaacatg atcaacggca ccgacggcga cagcttccac cccctgatca 3660 ccaaggacga ggtgctgtac gtgttcccca gcgacttctg ccgcagcgtg tacatcacct 3720 tcagcgacta cgagagcgtg cagggcctgc ccgccttccg ctacaaggtg cccgccgaga 3780 tcctggccaa caccagcgac aacgccggct tctgcatccc cgagggcaac tgcctgggca 3840 gcggcgtgct gaacgtgagc atctgcaaga acggcgcccc catcatcatg agcttccccc 3900 acttctacca ggccgacgag cgcttcgtga gcgccatcga gggcatgcac cccaaccagg 3960 aggaccacga gaccttcgtg gacatcaacc ccctgaccgg catcatcctg aaggccgcca 4020 agcgcttcca gatcaacatc tacgtgaaga agctggacga cttcgtggag accggcgaca 4080 tccgcaccat ggtgttcccc gtgatgtacc tgaacgagag cgtgcacatc gacaaggaga 4140 ccgccagccg cctgaagagc atgatcaaca ccaccctgat catcaccaac atcccctaca 4200 tcatcatggc cctgggcgtg ttcttcggcc tggtgttcac ctggctggcc tgcaagggcc 4260 agggcagcat ggacgagggc accgccgacg agcgcgcccc cctgatccgc acctgaccca 4320 ggggactcaa tcagcctcga agacatgata agatacattg atgagtttgg acaaaccaca 4380 acaagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 4440 gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 4500 caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 4560 atgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 4620 tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4680 tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4740 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4800 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4860 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4920 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4980 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 5040 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 5100 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 5160 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 5220 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 5280 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 5340 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 5400 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 5460 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 5520 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 5580 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 5640 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 5700 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5760 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5820 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5880 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5940 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 6000 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 6060 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 6120 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 6180 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 6240 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 6300 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 6360 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 6420 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 6480 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 6540 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 6600 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 6660 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6720 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6780 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6840 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6900 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6960 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 7020 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 7080 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 7140 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 7200 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 7260 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 7320 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 7380 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 7440 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 7500 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 7560 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 7620 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 7680 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7740 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7800 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7860 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7920 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7980 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 8040 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 8100 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 8160 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 8220 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 8280 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 8340 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 8400 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 8460 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 8520 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 8580 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 8640 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 8700 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8760 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8820 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8880 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8940 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 9000 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 9060 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 9120 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 9180 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 9240 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 9300 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 9360 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 9420 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 9480 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 9540 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 9600 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 9660 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9720 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9780 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9840 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9900 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9960 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 10020 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 10080 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 10140 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 10200 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 10260 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 10320 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 10380 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 10440 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 10500 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 10560 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 10620 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 10680 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10740 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10800 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10860 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10920 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10980 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 11040 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 11100 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 11160 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 11220 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 11280 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 11340 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 11400 caagtcgacg tccggcagtc 11420 <210> 4 <211> 11171 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 4 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgggc 900 cgctgctgct tctacaccgc cggcaccctg agcctgctgc tgctggtgac cagcgtgacc 960 ctgctggtgg cccgcgtgtt ccagaaggcc gtggaccaga gcatcgagaa gaagatcgtg 1020 ctgcgcaacg gcaccgaggc cttcgacagc tgggagaagc cccccctgcc cgtgtacacc 1080 cagttctact tcttcaacgt gaccaacccc gaggagatcc tgcgcggcga gaccccccgc 1140 gtggaggagg tgggccccta cacctaccgc gagctgcgca acaaggccaa catccagttc 1200 ggcgacaacg gcaccaccat cagcgccgtg agcaacaagg cctacgtgtt cgagcgcgac 1260 cagagcgtgg gcgaccccaa gatcgacctg atccgcaccc tgaacatccc cgtgctgacc 1320 gtgatcgagt ggagccaggt gcacttcctg cgcgagatca tcgaggccat gctgaaggcc 1380 taccagcaga agctgttcgt gacccacacc gtggacgagc tgctgtgggg ctacaaggac 1440 gagatcctga gcctgatcca cgtgttccgc cccgacatca gcccctactt cggcctgttc 1500 tacgagaaga acggcaccaa cgacggcgac tacgtgttcc tgaccggcga ggacagctac 1560 ctgaacttca ccaagatcgt ggagtggaac ggcaagacca gcctggactg gtggatcacc 1620 gacaagtgca acatgatcaa cggcaccgac ggcgacagct tccaccccct gatcaccaag 1680 gacgaggtgc tgtacgtgtt ccccagcgac ttctgccgca gcgtgtacat caccttcagc 1740 gactacgaga gcgtgcaggg cctgcccgcc ttccgctaca aggtgcccgc cgagatcctg 1800 gccaacacca gcgacaacgc cggcttctgc atccccgagg gcaactgcct gggcagcggc 1860 gtgctgaacg tgagcatctg caagaacggc gcccccatca tcatgagctt cccccacttc 1920 taccaggccg acgagcgctt cgtgagcgcc atcgagggca tgcaccccaa ccaggaggac 1980 cacgagacct tcgtggacat caaccccctg accggcatca tcctgaaggc cgccaagcgc 2040 ttccagatca acatctacgt gaagaagctg gacgacttcg tggagaccgg cgacatccgc 2100 accatggtgt tccccgtgat gtacctgaac gagagcgtgc acatcgacaa ggagaccgcc 2160 agccgcctga agagcatgat caacaccacc ctgatcatca ccaacatccc ctacatcatc 2220 atggccctgg gcgtgttctt cggcctggtg ttcacctggc tggcctgcaa gggccagggc 2280 agcatggacg agggcaccgc cgacgagcgc gcccccctga tccgcaccga gggcagagga 2340 agtcttctga catgcggaga cgtggaagag aatcccggcc ctatggaatt cagcagcccc 2400 agcagagagg aatgccccaa gcctctgagc cgggtgtcaa tcatggccgg atctctgaca 2460 ggactgctgc tgcttcaggc cgtgtcttgg gcttctggcg ctagaccttg catccccaag 2520 agcttcggct acagcagcgt cgtgtgcgtg tgcaatgcca cctactgcga cagcttcgac 2580 cctcctacct ttcctgctct gggcaccttc agcagatacg agagcaccag atccggcaga 2640 cggatggaac tgagcatggg acccatccag gccaatcaca caggcactgg cctgctgctg 2700 acactgcagc ctgagcagaa attccagaaa gtgaaaggct tcggcggagc catgacagat 2760 gccgccgctc tgaatatcct ggctctgtct ccaccagctc agaacctgct gctcaagagc 2820 tacttcagcg aggaaggcat cggctacaac atcatcagag tgcccatggc cagctgcgac 2880 ttcagcatca ggacctacac ctacgccgac acacccgacg atttccagct gcacaacttc 2940 agcctgcctg aagaggacac caagctgaag atccctctga tccacagagc cctgcagctg 3000 gcacaaagac ccgtgtcact gctggcctct ccatggacat ctcccacctg gctgaaaaca 3060 aatggcgccg tgaatggcaa gggcagcctg aaaggccaac ctggcgacat ctaccaccag 3120 acctgggcca gatacttcgt gaagttcctg gacgcctatg ccgagcacaa gctgcagttt 3180 tgggccgtga cagccgagaa cgaaccttct gctggactgc tgagcggcta cccctttcag 3240 tgcctgggct ttacacccga gcaccagcgg gactttatcg cccgtgatct gggacccaca 3300 ctggccaata gcacccacca taatgtgcgg ctgctgatgc tggacgacca gagactgctt 3360 ctgccccact gggctaaagt ggtgctgaca gatcctgagg ccgccaaata cgtgcacgga 3420 atcgccgtgc actggtatct ggactttctg gcccctgcca aggccacact gggagagaca 3480 cacagactgt tccccaacac catgctgttc gccagcgaag cctgtgtggg cagcaagttt 3540 tgggaacaga gcgtgcggct cggcagctgg gatagaggca tgcagtacag ccacagcatc 3600 atcaccaacc tgctgtacca cgtcgtcggc tggaccgact ggaatctggc cctgaatcct 3660 gaaggcggcc ctaactgggt ccgaaacttc gtggacagcc ccatcatcgt ggacatcacc 3720 aaggacacct tctacaagca gcccatgttc taccacctgg gacacttcag caagttcatc 3780 cccgagggct ctcagcgcgt tggactggtg gcttcccaga agaacgatct ggacgccgtg 3840 gctctgatgc accctgatgg atctgctgtg gtggtggtcc tgaaccgcag cagcaaagat 3900 gtgcccctga ccatcaagga tcccgccgtg ggattcctgg aaacaatcag ccctggctac 3960 tccatccaca cctacctgtg gcgtagacag tgacaattgt taattaagtt taaaccctcg 4020 aggccgcaag ccgcatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 4080 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 4140 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 4200 tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 4260 aatagcaggc atgctgggga gagatccacg ataacaaaca gcttttttgg ggtgaacata 4320 ttgactgaat tccctgcagg ttggccactc cctctctgcg cgctcgctcg ctcactgagg 4380 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 4440 gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctgcggc cgctcgtacg 4500 gtctcgagga attcctgcag gataacttgc caacctcatt ctaaaatgta tatagaagcc 4560 caaaagacaa taacaaaaat attcttgtag aacaaaatgg gaaagaatgt tccactaaat 4620 atcaagattt agagcaaagc atgagatgtg tggggataga cagtgaggct gataaaatag 4680 agtagagctc agaaacagac ccattgatat atgtaagtga cctatgaaaa aaatatggca 4740 ttttacaatg ggaaaatgat ggtctttttc ttttttagaa aaacagggaa atatatttat 4800 atgtaaaaaa taaaagggaa cccatatgtc ataccataca cacaaaaaaa ttccagtgaa 4860 ttataagtct aaatggagaa ggcaaaactt taaatctttt agaaaataat atagaagcat 4920 gcagaccagc ctggccaaca tgatgaaacc ctctctacta ataataaaat cagtagaact 4980 actcaggact actttgagtg ggaagtcctt ttctatgaag acttctttgg ccaaaattag 5040 gctctaaatg caaggagata gtgcatcatg cctggctgca cttactgata aatgatgtta 5100 tcaccatctt taaccaaatg cacaggaaca agttatggta ctgatgtgct ggattgagaa 5160 ggagctctac ttccttgaca ggacacattt gtatcaactt aaaaaagcag atttttgcca 5220 gcagaactat tcattcagag gtaggaaact tagaatagat gatgtcactg attagcatgg 5280 cttccccatc tccacagctg cttcccaccc aggttgccca cagttgagtt tgtccagtgc 5340 tcagggctgc ccactctcag taagaagccc cacaccagcc cctctccaaa tatgttggct 5400 gttccttcca ttaaagtgac cccactttag agcagcaagt ggatttctgt ttcttacagt 5460 tcaggaagga ggagtcagct gtgagaacct ggagcctgag atgcttctaa gtcccactgc 5520 tactggggtc agggaagcca gactccagca tcagcagtca ggagcactaa gcccttgcca 5580 acatcctgtt tctcagagaa actgcttcca ttataatggt tgtccttttt taagctatca 5640 agccaaacaa ccagtgtcta ccattattct catcacctga agccaagggt tctagcaaaa 5700 gtcaagctgt cttgtaatgg ttgatgtgcc tccagcttct gtcttcagtc actccactct 5760 tagcctgctc tgaatcaact ctgaccacag ttccctggag cccctgccac ctgctgcccc 5820 tgccaccttc tccatctgca gtgctgtgca gccttctgca ctcttgcaga gctaataggt 5880 ggagacttga aggaagagga ggaaagtttc tcataatagc cttgctgcaa gctcaaatgg 5940 gaggtgggca ctgtgcccag gagccttgga gcaaaggctg tgcccaacct ctgactgcat 6000 ccaggtttgg tcttgacaga gataagaagc cctggctttt ggagccaaaa tctaggtcag 6060 acttaggcag gattctcaaa gtttatcagc agaacatgag gcagaagacc ctttctgctc 6120 cagcttcttc aggctcaacc ttcatcagaa tagatagaaa gagaggctgt gagggttctt 6180 aaaacagaag caaatctgac tcagagaata aacaacctcc tagtaaacta cagcttagac 6240 agagcatctg gtggtgagtg tgctcagtgt cctactcaac tgtctggtat cagccctcat 6300 gaggacttct cttctttccc tcatagacct ccatctctgt tttccttagc ctgcagaaat 6360 ctggatggct attcacagaa tgcctgtgct ttcagagttg cattttttct ctggtattct 6420 ggttcaagca tttgaaggta ggaaaggttc tccaagtgca agaaagccag ccctgagcct 6480 caactgcctg gctagtgtgg tcagtaggat gcaaaggctg ttgaatgcca caaggccaaa 6540 ctttaacctg tgtaccacaa gcctagcagc agaggcagct ctgctcactg gaactctctg 6600 tcttctttct cctgagcctt ttcttttcct gagttttcta gctctcctca accttacctc 6660 tgccctaccc aggacaaacc caagagccac tgtttctgtg atgtcctctc cagccctaat 6720 taggcatcat gacttcagcc tgaccttcca tgctcagaag cagtgctaat ccacttcaga 6780 tgagctgctc tatgcaacac aggcagagcc tacaaacctt tgcaccagag ccctccacat 6840 atcagtgttt gttcatactc acttcaacag caaatgtgac tgctgagatt aagattttac 6900 acaagatggt ctgtaatttc acagttagtt ttatcccatt aggtatgaaa gaattagcat 6960 aattcccctt aaacatgaat gaatcttaga ttttttaata aatagttttg gaagtaaaga 7020 cagagacatc aggagcacaa ggaatagcct gagaggacaa acagaacaag aaagagtctg 7080 gaaatacaca ggatgttctt ggcctcctca aagcaagtgc aagcagatag taccagcagc 7140 cccaggctat cagagcccag tgaagagaag taccatgaaa gccacagctc taaccaccct 7200 gttccagagt gacagacagt ccccaagaca agccagcctg agccagagag agaactgcaa 7260 gagaaagttt ctaatttagg ttctgttaga ttcagacaag tgcaggtcat cctctctcca 7320 cagctactca cctctccagc ctaacaaagc ctgcagtcca cactccaacc ctggtgtctc 7380 acctcctagc ctctcccaac atcctgctct ctgaccatct tctgcatctc tcatctcacc 7440 atctcccact gtctacagcc tactcttgca actaccatct cattttctga catcctgtct 7500 acatcttctg ccatactctg ccatctacca taccacctct taccatctac cacaccatct 7560 tttatctcca tccctctcag aagcctccaa gctgaatcct gctttatgtg ttcatctcag 7620 cccctgcatg gaaagctgac cccagaggca gaactattcc cagagagctt ggccaagaaa 7680 aacaaaacta ccagcctggc caggctcagg agtagtaagc tgcagtgtct gttgtgttct 7740 agcttcaaca gctgcaggag ttccactctc aaatgctcca catttctcac atcctcctga 7800 ttctggtcac tacccatctt caaagaacag aatatctcac atcagcatac tgtgaaggac 7860 tagtcatggg tgcagctgct cagagctgca aagtcattct ggatggtgga gagcttacaa 7920 acatttcatg atgctccccc cgctctgatg gctggagccc aatccctaca cagactcctg 7980 ctgtatgtgt tttcctttca ctctgagcca cagccagagg gcaggcattc agtctcctct 8040 tcaggctggg gctggggcac tgagaactca cccaacacct tgctctcact ccttctgcaa 8100 aacaagaaag agctttgtgc tgcagtagcc atgaagaatg aaaggaaggc tttaactaaa 8160 aaatgtcaga gattattttc aaccccttac tgtggatcac cagcaaggag gaaacacaac 8220 acagagacat tttttcccct caaattatca aaagaatcac tgcatttgtt aaagagagca 8280 actgaatcag gaagcagagt tttgaacata tcagaagtta ggaatctgca tcagagacaa 8340 atgcagtcat ggttgtttgc tgcataccag ccctaatcat tagaagcctc atggacttca 8400 aacatcattc cctctgacaa gatgctctag cctaactcca tgagataaaa taaatctgcc 8460 tttcagagcc aaagaagagt ccaccagctt cttctcagtg tgaacaagag ctccagtcag 8520 gttagtcagt ccagtgcagt agaggagacc agtctgcatc ctctaatttt caaaggcaag 8580 aagatttgtt taccctggac accaggcaca agtgaggtca cagagctctt agatatgcag 8640 tcctcatgag tgaggagact aaagcgcatg ccatcaagac ttcagtgtag agaaaacctc 8700 caaaaaagcc tcctcactac ttctggaata gctcagaggc cgaggcggcc tcggcctctg 8760 cataaataaa aaaaattagt cagccatggg gcggagaatg ggcggaactg ggcggagtta 8820 ggggcgggat gggcggagtt aggggcggga ctatggttgc tgactaattg agatgcatgc 8880 tttgcatact tctgcctgct ggggagcctg gggactttcc acacctggtt gctgactaat 8940 tgagatgcat gctttgcata cttctgcctg ctggggagcc tggggacttt ccacacccta 9000 actgacacac attccacagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 9060 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 9120 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 9180 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 9240 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 9300 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 9360 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 9420 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 9480 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 9540 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 9600 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 9660 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 9720 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 9780 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 9840 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 9900 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 9960 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 10020 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 10080 ctgactcctg caaaccacgt tgtgtctcaa aatctctgat gttacattgc acaagataaa 10140 aatatatcat catgaacaat aaaactgtct gcttacataa acagtaatac aaggggtgtt 10200 atgagccata ttcaacggga aacgtcttgc tcgaggccgc gattaaattc caacatggat 10260 gctgatttat atgggtataa atgggctcgc gataatgtcg ggcaatcagg tgcgacaatc 10320 tatcgattgt atgggaagcc cgatgcgcca gagttgtttc tgaaacatgg caaaggtagc 10380 gttgccaatg atgttacaga tgagatggtc agactaaact ggctgacgga atttatgcct 10440 cttccgacca tcaagcattt tatccgtact cctgatgatg catggttact caccactgcg 10500 atccccggga aaacagcatt ccaggtatta gaagaatatc ctgattcagg tgaaaatatt 10560 gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga ttcctgtttg taattgtcct 10620 tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat cacgaatgaa taacggtttg 10680 gttgatgcga gtgattttga tgacgagcgt aatggctggc ctgttgaaca agtctggaaa 10740 gaaatgcata agcttttgcc attctcaccg gattcagtcg tcactcatgg tgatttctca 10800 cttgataacc ttatttttga cgaggggaaa ttaataggtt gtattgatgt tggacgagtc 10860 ggaatcgcag accgatacca ggatcttgcc atcctatgga actgcctcgg tgagttttct 10920 ccttcattac agaaacggct ttttcaaaaa tatggtattg ataatcctga tatgaataaa 10980 ttgcagtttc atttgatgct cgatgagttt ttctaagggc ggcctgccac catacccacg 11040 ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc ggtgatgtcg 11100 gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgagggcgcg ccaagtcgac 11160 gtccggcagt c 11171 <210> 5 <211> 11309 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 5 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgtac 900 gccctgttcc tgctggccag cctgctgggc gccgccctgg ccggccccgt gctgggcctg 960 aaggagtgca cccgcggcag cgccgtgtgg tgccagaacg tgaagaccgc cagcgactgc 1020 ggcgccgtga agcactgcct gcagaccgtg tggaacaagc ccaccgtgaa gagcctgccc 1080 tgcgacatct gcaaggacgt ggtgaccgcc gccggcgaca tgctgaagga caacgccacc 1140 gaggaggaga tcctggtgta cctggagaag acctgcgact ggctgcccaa gcccaacatg 1200 agcgccagct gcaaggagat cgtggacagc tacctgcccg tgatcctgga catcatcaag 1260 ggcgagatga gccgccccgg cgaggtgtgc agcgccctga acctgtgcga gagcctgcag 1320 aagcacctgg ccgagctgaa ccaccagaag cagctggaga gcaacaagat ccccgagctg 1380 gacatgaccg aggtggtggc ccccttcatg gccaacatcc ccctgctgct gtacccccag 1440 gacggccccc gcagcaagcc ccagcccaag gacaacggcg acgtgtgcca ggactgcatc 1500 cagatggtga ccgacatcca gaccgccgtg cgcaccaaca gcaccttcgt gcaggccctg 1560 gtggagcacg tgaaggagga gtgcgaccgc ctgggccccg gcatggccga catctgcaag 1620 aactacatca gccagtacag cgagatcgcc atccagatga tgatgcacat gcagcccaag 1680 gagatctgcg ccctggtggg cttctgcgac gaggtgaagg agatgcccat gcagaccctg 1740 gtgcccgcca aggtggccag caagaacgtg atccccgccc tggagctggt ggagcccatc 1800 aagaagcacg aggtgcccgc caagagcgac gtgtactgcg aggtgtgcga gttcctggtg 1860 aaggaggtga ccaagctgat cgacaacaac aagaccgaga aggagatcct ggacgccttc 1920 gacaagatgt gcagcaagct gcccaagagc ctgagcgagg agtgccagga ggtggtggac 1980 acctacggca gcagcatcct gagcatcctg ctggaggagg tgagccccga gctggtgtgc 2040 agcatgctgc acctgtgcag cggcacccgc ctgcccgccc tgaccgtgca cgtgacccag 2100 cccaaggacg gcggcttctg cgaggtgtgc aagaagctgg tgggctacct ggaccgcaac 2160 ctggagaaga acagcaccaa gcaggagatc ctggccgccc tggagaaggg ctgcagcttc 2220 ctgcccgacc cctaccagaa gcagtgcgac cagttcgtgg ccgagtacga gcccgtgctg 2280 atcgagatcc tggtggaggt gatggacccc agcttcgtgt gcctgaagat cggcgcctgc 2340 cccagcgccc acaagcccct gctgggcacc gagaagtgca tctggggccc cagctactgg 2400 tgccagaaca ccgagaccgc cgcccagtgc aacgccgtgg agcactgcaa gcgccacgtg 2460 tggaacgagg gcagaggaag tcttctgaca tgcggagacg tggaagagaa tcccggccct 2520 atggaattca gcagccccag cagagaggaa tgccccaagc ctctgagccg ggtgtcaatc 2580 atggccggat ctctgacagg actgctgctg cttcaggccg tgtcttgggc ttctggcgct 2640 agaccttgca tccccaagag cttcggctac agcagcgtcg tgtgcgtgtg caatgccacc 2700 tactgcgaca gcttcgaccc tcctaccttt cctgctctgg gcaccttcag cagatacgag 2760 agcaccagat ccggcagacg gatggaactg agcatgggac ccatccaggc caatcacaca 2820 ggcactggcc tgctgctgac actgcagcct gagcagaaat tccagaaagt gaaaggcttc 2880 ggcggagcca tgacagatgc cgccgctctg aatatcctgg ctctgtctcc accagctcag 2940 aacctgctgc tcaagagcta cttcagcgag gaaggcatcg gctacaacat catcagagtg 3000 cccatggcca gctgcgactt cagcatcagg acctacacct acgccgacac acccgacgat 3060 ttccagctgc acaacttcag cctgcctgaa gaggacacca agctgaagat ccctctgatc 3120 cacagagccc tgcagctggc acaaagaccc gtgtcactgc tggcctctcc atggacatct 3180 cccacctggc tgaaaacaaa tggcgccgtg aatggcaagg gcagcctgaa aggccaacct 3240 ggcgacatct accaccagac ctgggccaga tacttcgtga agttcctgga cgcctatgcc 3300 gagcacaagc tgcagttttg ggccgtgaca gccgagaacg aaccttctgc tggactgctg 3360 agcggctacc cctttcagtg cctgggcttt acacccgagc accagcggga ctttatcgcc 3420 cgtgatctgg gacccacact ggccaatagc acccaccata atgtgcggct gctgatgctg 3480 gacgaccaga gactgcttct gccccactgg gctaaagtgg tgctgacaga tcctgaggcc 3540 gccaaatacg tgcacggaat cgccgtgcac tggtatctgg actttctggc ccctgccaag 3600 gccacactgg gagagacaca cagactgttc cccaacacca tgctgttcgc cagcgaagcc 3660 tgtgtgggca gcaagttttg ggaacagagc gtgcggctcg gcagctggga tagaggcatg 3720 cagtacagcc acagcatcat caccaacctg ctgtaccacg tcgtcggctg gaccgactgg 3780 aatctggccc tgaatcctga aggcggccct aactgggtcc gaaacttcgt ggacagcccc 3840 atcatcgtgg acatcaccaa ggacaccttc tacaagcagc ccatgttcta ccacctggga 3900 cacttcagca agttcatccc cgagggctct cagcgcgttg gactggtggc ttcccagaag 3960 aacgatctgg acgccgtggc tctgatgcac cctgatggat ctgctgtggt ggtggtcctg 4020 aaccgcagca gcaaagatgt gcccctgacc atcaaggatc ccgccgtggg attcctggaa 4080 acaatcagcc ctggctactc catccacacc tacctgtggc gtagacagtg acaattgtta 4140 attaagttta aaccctcgag gccgcaagcc gcatcgatac cgtcgactag agctcgctga 4200 tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 4260 tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 4320 tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 4380 ggggaggatt gggaagacaa tagcaggcat gctggggaga gatccacgat aacaaacagc 4440 ttttttgggg tgaacatatt gactgaattc cctgcaggtt ggccactccc tctctgcgcg 4500 ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc 4560 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt 4620 cctgcggccg ctcgtacggt ctcgaggaat tcctgcagga taacttgcca acctcattct 4680 aaaatgtata tagaagccca aaagacaata acaaaaatat tcttgtagaa caaaatggga 4740 aagaatgttc cactaaatat caagatttag agcaaagcat gagatgtgtg gggatagaca 4800 gtgaggctga taaaatagag tagagctcag aaacagaccc attgatatat gtaagtgacc 4860 tatgaaaaaa atatggcatt ttacaatggg aaaatgatgg tctttttctt ttttagaaaa 4920 acagggaaat atatttatat gtaaaaaata aaagggaacc catatgtcat accatacaca 4980 caaaaaaatt ccagtgaatt ataagtctaa atggagaagg caaaacttta aatcttttag 5040 aaaataatat agaagcatgc agaccagcct ggccaacatg atgaaaccct ctctactaat 5100 aataaaatca gtagaactac tcaggactac tttgagtggg aagtcctttt ctatgaagac 5160 ttctttggcc aaaattaggc tctaaatgca aggagatagt gcatcatgcc tggctgcact 5220 tactgataaa tgatgttatc accatcttta accaaatgca caggaacaag ttatggtact 5280 gatgtgctgg attgagaagg agctctactt ccttgacagg acacatttgt atcaacttaa 5340 aaaagcagat ttttgccagc agaactattc attcagaggt aggaaactta gaatagatga 5400 tgtcactgat tagcatggct tccccatctc cacagctgct tcccacccag gttgcccaca 5460 gttgagtttg tccagtgctc agggctgccc actctcagta agaagcccca caccagcccc 5520 tctccaaata tgttggctgt tccttccatt aaagtgaccc cactttagag cagcaagtgg 5580 atttctgttt cttacagttc aggaaggagg agtcagctgt gagaacctgg agcctgagat 5640 gcttctaagt cccactgcta ctggggtcag ggaagccaga ctccagcatc agcagtcagg 5700 agcactaagc ccttgccaac atcctgtttc tcagagaaac tgcttccatt ataatggttg 5760 tcctttttta agctatcaag ccaaacaacc agtgtctacc attattctca tcacctgaag 5820 ccaagggttc tagcaaaagt caagctgtct tgtaatggtt gatgtgcctc cagcttctgt 5880 cttcagtcac tccactctta gcctgctctg aatcaactct gaccacagtt ccctggagcc 5940 cctgccacct gctgcccctg ccaccttctc catctgcagt gctgtgcagc cttctgcact 6000 cttgcagagc taataggtgg agacttgaag gaagaggagg aaagtttctc ataatagcct 6060 tgctgcaagc tcaaatggga ggtgggcact gtgcccagga gccttggagc aaaggctgtg 6120 cccaacctct gactgcatcc aggtttggtc ttgacagaga taagaagccc tggcttttgg 6180 agccaaaatc taggtcagac ttaggcagga ttctcaaagt ttatcagcag aacatgaggc 6240 agaagaccct ttctgctcca gcttcttcag gctcaacctt catcagaata gatagaaaga 6300 gaggctgtga gggttcttaa aacagaagca aatctgactc agagaataaa caacctccta 6360 gtaaactaca gcttagacag agcatctggt ggtgagtgtg ctcagtgtcc tactcaactg 6420 tctggtatca gccctcatga ggacttctct tctttccctc atagacctcc atctctgttt 6480 tccttagcct gcagaaatct ggatggctat tcacagaatg cctgtgcttt cagagttgca 6540 ttttttctct ggtattctgg ttcaagcatt tgaaggtagg aaaggttctc caagtgcaag 6600 aaagccagcc ctgagcctca actgcctggc tagtgtggtc agtaggatgc aaaggctgtt 6660 gaatgccaca aggccaaact ttaacctgtg taccacaagc ctagcagcag aggcagctct 6720 gctcactgga actctctgtc ttctttctcc tgagcctttt cttttcctga gttttctagc 6780 tctcctcaac cttacctctg ccctacccag gacaaaccca agagccactg tttctgtgat 6840 gtcctctcca gccctaatta ggcatcatga cttcagcctg accttccatg ctcagaagca 6900 gtgctaatcc acttcagatg agctgctcta tgcaacacag gcagagccta caaacctttg 6960 caccagagcc ctccacatat cagtgtttgt tcatactcac ttcaacagca aatgtgactg 7020 ctgagattaa gattttacac aagatggtct gtaatttcac agttagtttt atcccattag 7080 gtatgaaaga attagcataa ttccccttaa acatgaatga atcttagatt ttttaataaa 7140 tagttttgga agtaaagaca gagacatcag gagcacaagg aatagcctga gaggacaaac 7200 agaacaagaa agagtctgga aatacacagg atgttcttgg cctcctcaaa gcaagtgcaa 7260 gcagatagta ccagcagccc caggctatca gagcccagtg aagagaagta ccatgaaagc 7320 cacagctcta accaccctgt tccagagtga cagacagtcc ccaagacaag ccagcctgag 7380 ccagagagag aactgcaaga gaaagtttct aatttaggtt ctgttagatt cagacaagtg 7440 caggtcatcc tctctccaca gctactcacc tctccagcct aacaaagcct gcagtccaca 7500 ctccaaccct ggtgtctcac ctcctagcct ctcccaacat cctgctctct gaccatcttc 7560 tgcatctctc atctcaccat ctcccactgt ctacagccta ctcttgcaac taccatctca 7620 ttttctgaca tcctgtctac atcttctgcc atactctgcc atctaccata ccacctctta 7680 ccatctacca caccatcttt tatctccatc cctctcagaa gcctccaagc tgaatcctgc 7740 tttatgtgtt catctcagcc cctgcatgga aagctgaccc cagaggcaga actattccca 7800 gagagcttgg ccaagaaaaa caaaactacc agcctggcca ggctcaggag tagtaagctg 7860 cagtgtctgt tgtgttctag cttcaacagc tgcaggagtt ccactctcaa atgctccaca 7920 tttctcacat cctcctgatt ctggtcacta cccatcttca aagaacagaa tatctcacat 7980 cagcatactg tgaaggacta gtcatgggtg cagctgctca gagctgcaaa gtcattctgg 8040 atggtggaga gcttacaaac atttcatgat gctccccccg ctctgatggc tggagcccaa 8100 tccctacaca gactcctgct gtatgtgttt tcctttcact ctgagccaca gccagagggc 8160 aggcattcag tctcctcttc aggctggggc tggggcactg agaactcacc caacaccttg 8220 ctctcactcc ttctgcaaaa caagaaagag ctttgtgctg cagtagccat gaagaatgaa 8280 aggaaggctt taactaaaaa atgtcagaga ttattttcaa ccccttactg tggatcacca 8340 gcaaggagga aacacaacac agagacattt tttcccctca aattatcaaa agaatcactg 8400 catttgttaa agagagcaac tgaatcagga agcagagttt tgaacatatc agaagttagg 8460 aatctgcatc agagacaaat gcagtcatgg ttgtttgctg cataccagcc ctaatcatta 8520 gaagcctcat ggacttcaaa catcattccc tctgacaaga tgctctagcc taactccatg 8580 agataaaata aatctgcctt tcagagccaa agaagagtcc accagcttct tctcagtgtg 8640 aacaagagct ccagtcaggt tagtcagtcc agtgcagtag aggagaccag tctgcatcct 8700 ctaattttca aaggcaagaa gatttgttta ccctggacac caggcacaag tgaggtcaca 8760 gagctcttag atatgcagtc ctcatgagtg aggagactaa agcgcatgcc atcaagactt 8820 cagtgtagag aaaacctcca aaaaagcctc ctcactactt ctggaatagc tcagaggccg 8880 aggcggcctc ggcctctgca taaataaaaa aaattagtca gccatggggc ggagaatggg 8940 cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact atggttgctg 9000 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 9060 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 9120 gggactttcc acaccctaac tgacacacat tccacagctg cattaatgaa tcggccaacg 9180 cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 9240 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 9300 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 9360 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 9420 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 9480 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 9540 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 9600 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 9660 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 9720 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 9780 aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 9840 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 9900 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 9960 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 10020 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 10080 ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 10140 ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 10200 tcgttcatcc atagttgcct gactcctgca aaccacgttg tgtctcaaaa tctctgatgt 10260 tacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgc ttacataaac 10320 agtaatacaa ggggtgttat gagccatatt caacgggaaa cgtcttgctc gaggccgcga 10380 ttaaattcca acatggatgc tgatttatat gggtataaat gggctcgcga taatgtcggg 10440 caatcaggtg cgacaatcta tcgattgtat gggaagcccg atgcgccaga gttgtttctg 10500 aaacatggca aaggtagcgt tgccaatgat gttacagatg agatggtcag actaaactgg 10560 ctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcc tgatgatgca 10620 tggttactca ccactgcgat ccccgggaaa acagcattcc aggtattaga agaatatcct 10680 gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt 10740 cctgtttgta attgtccttt taacagcgat cgcgtatttc gtctcgctca ggcgcaatca 10800 cgaatgaata acggtttggt tgatgcgagt gattttgatg acgagcgtaa tggctggcct 10860 gttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccgga ttcagtcgtc 10920 actcatggtg atttctcact tgataacctt atttttgacg aggggaaatt aataggttgt 10980 attgatgttg gacgagtcgg aatcgcagac cgataccagg atcttgccat cctatggaac 11040 tgcctcggtg agttttctcc ttcattacag aaacggcttt ttcaaaaata tggtattgat 11100 aatcctgata tgaataaatt gcagtttcat ttgatgctcg atgagttttt ctaagggcgg 11160 cctgccacca tacccacgcc gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct 11220 tccccatcgg tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg 11280 agggcgcgcc aagtcgacgt ccggcagtc 11309 <210> 6 <211> 11293 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 6 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catgtacgcc ctgttcctgc tggccagcct 660 gctgggcgcc gccctggccg gccccgtgct gggcctgaag gagtgcaccc gcggcagcgc 720 cgtgtggtgc cagaacgtga agaccgccag cgactgcggc gccgtgaagc actgcctgca 780 gaccgtgtgg aacaagccca ccgtgaagag cctgccctgc gacatctgca aggacgtggt 840 gaccgccgcc ggcgacatgc tgaaggacaa cgccaccgag gaggagatcc tggtgtacct 900 ggagaagacc tgcgactggc tgcccaagcc caacatgagc gccagctgca aggagatcgt 960 ggacagctac ctgcccgtga tcctggacat catcaagggc gagatgagcc gccccggcga 1020 ggtgtgcagc gccctgaacc tgtgcgagag cctgcagaag cacctggccg agctgaacca 1080 ccagaagcag ctggagagca acaagatccc cgagctggac atgaccgagg tggtggcccc 1140 cttcatggcc aacatccccc tgctgctgta cccccaggac ggcccccgca gcaagcccca 1200 gcccaaggac aacggcgacg tgtgccagga ctgcatccag atggtgaccg acatccagac 1260 cgccgtgcgc accaacagca ccttcgtgca ggccctggtg gagcacgtga aggaggagtg 1320 cgaccgcctg ggccccggca tggccgacat ctgcaagaac tacatcagcc agtacagcga 1380 gatcgccatc cagatgatga tgcacatgca gcccaaggag atctgcgccc tggtgggctt 1440 ctgcgacgag gtgaaggaga tgcccatgca gaccctggtg cccgccaagg tggccagcaa 1500 gaacgtgatc cccgccctgg agctggtgga gcccatcaag aagcacgagg tgcccgccaa 1560 gagcgacgtg tactgcgagg tgtgcgagtt cctggtgaag gaggtgacca agctgatcga 1620 caacaacaag accgagaagg agatcctgga cgccttcgac aagatgtgca gcaagctgcc 1680 caagagcctg agcgaggagt gccaggaggt ggtggacacc tacggcagca gcatcctgag 1740 catcctgctg gaggaggtga gccccgagct ggtgtgcagc atgctgcacc tgtgcagcgg 1800 cacccgcctg cccgccctga ccgtgcacgt gacccagccc aaggacggcg gcttctgcga 1860 ggtgtgcaag aagctggtgg gctacctgga ccgcaacctg gagaagaaca gcaccaagca 1920 ggagatcctg gccgccctgg agaagggctg cagcttcctg cccgacccct accagaagca 1980 gtgcgaccag ttcgtggccg agtacgagcc cgtgctgatc gagatcctgg tggaggtgat 2040 ggaccccagc ttcgtgtgcc tgaagatcgg cgcctgcccc agcgcccaca agcccctgct 2100 gggcaccgag aagtgcatct ggggccccag ctactggtgc cagaacaccg agaccgccgc 2160 ccagtgcaac gccgtggagc actgcaagcg ccacgtgtgg aactgattgt ggccgaaccg 2220 ccgaactcag aggccggccc cagaaaaccc gagcgagtag ggggcggcgc gcaggaggga 2280 ggagaactgg gggcgcggga ggctggtggg tgtggggggt ggagatgtag aagatgtgac 2340 gccgcggccc ggcgggtgcc agattagcgg acgcggtgcc cgcggttgca acgggatccc 2400 gggcgctgca gcttgggagg cggctctccc caggcggcgt ccgcggagac acccatccgt 2460 gaaccccagg tcccgggccg ccggctcgcc gcgcaccagg ggccggcgga cagaagagcg 2520 gccgagcggc tcgaggctgg gggaccgcgg gcgcggccgc gcgctgccgg gcgggaggct 2580 ggggggccgg ggccggggcc gtgccccgga gcgggtcgga ggccggggcc ggggccgggg 2640 gacggcggct ccccgcgcgg ctccagcggc tcggggatcc cggccgggcc ccgcagggac 2700 catgatggaa ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc 2760 aatcatggcc ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg 2820 cgctagacct tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc 2880 cacctactgc gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata 2940 cgagagcacc agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca 3000 cacaggcact ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg 3060 cttcggcgga gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc 3120 tcagaacctg ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag 3180 agtgcccatg gccagctgcg acttcagcat caggacctac acctacgccg acacacccga 3240 cgatttccag ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct 3300 gatccacaga gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac 3360 atctcccacc tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca 3420 acctggcgac atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta 3480 tgccgagcac aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact 3540 gctgagcggc tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat 3600 cgcccgtgat ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat 3660 gctggacgac cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga 3720 ggccgccaaa tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc 3780 caaggccaca ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga 3840 agcctgtgtg ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg 3900 catgcagtac agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga 3960 ctggaatctg gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag 4020 ccccatcatc gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct 4080 gggacacttc agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca 4140 gaagaacgat ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt 4200 cctgaaccgc agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct 4260 ggaaacaatc agccctggct actccatcca cacctacctg tggcgtagac agtgacaatt 4320 gttaattaag tttaaaccct cgaggccgca agcaataaaa tatctttatt ttcattacat 4380 ctgtgtgttg gttttttgtg tggagatcca cgataacaaa cagctttttt ggggtgaaca 4440 tattgactga attccctgca ggttggccac tccctctctg cgcgctcgct cgctcactga 4500 ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct cagtgagcga 4560 gcgagcgcgc agagagggag tggccaactc catcactagg ggttcctgcg gccgctcgta 4620 cggtctcgag gaattcctgc aggataactt gccaacctca ttctaaaatg tatatagaag 4680 cccaaaagac aataacaaaa atattcttgt agaacaaaat gggaaagaat gttccactaa 4740 atatcaagat ttagagcaaa gcatgagatg tgtggggata gacagtgagg ctgataaaat 4800 agagtagagc tcagaaacag acccattgat atatgtaagt gacctatgaa aaaaatatgg 4860 cattttacaa tgggaaaatg atggtctttt tcttttttag aaaaacaggg aaatatattt 4920 atatgtaaaa aataaaaggg aacccatatg tcataccata cacacaaaaa aattccagtg 4980 aattataagt ctaaatggag aaggcaaaac tttaaatctt ttagaaaata atatagaagc 5040 atgcagacca gcctggccaa catgatgaaa ccctctctac taataataaa atcagtagaa 5100 ctactcagga ctactttgag tgggaagtcc ttttctatga agacttcttt ggccaaaatt 5160 aggctctaaa tgcaaggaga tagtgcatca tgcctggctg cacttactga taaatgatgt 5220 tatcaccatc tttaaccaaa tgcacaggaa caagttatgg tactgatgtg ctggattgag 5280 aaggagctct acttccttga caggacacat ttgtatcaac ttaaaaaagc agatttttgc 5340 cagcagaact attcattcag aggtaggaaa cttagaatag atgatgtcac tgattagcat 5400 ggcttcccca tctccacagc tgcttcccac ccaggttgcc cacagttgag tttgtccagt 5460 gctcagggct gcccactctc agtaagaagc cccacaccag cccctctcca aatatgttgg 5520 ctgttccttc cattaaagtg accccacttt agagcagcaa gtggatttct gtttcttaca 5580 gttcaggaag gaggagtcag ctgtgagaac ctggagcctg agatgcttct aagtcccact 5640 gctactgggg tcagggaagc cagactccag catcagcagt caggagcact aagcccttgc 5700 caacatcctg tttctcagag aaactgcttc cattataatg gttgtccttt tttaagctat 5760 caagccaaac aaccagtgtc taccattatt ctcatcacct gaagccaagg gttctagcaa 5820 aagtcaagct gtcttgtaat ggttgatgtg cctccagctt ctgtcttcag tcactccact 5880 cttagcctgc tctgaatcaa ctctgaccac agttccctgg agcccctgcc acctgctgcc 5940 cctgccacct tctccatctg cagtgctgtg cagccttctg cactcttgca gagctaatag 6000 gtggagactt gaaggaagag gaggaaagtt tctcataata gccttgctgc aagctcaaat 6060 gggaggtggg cactgtgccc aggagccttg gagcaaaggc tgtgcccaac ctctgactgc 6120 atccaggttt ggtcttgaca gagataagaa gccctggctt ttggagccaa aatctaggtc 6180 agacttaggc aggattctca aagtttatca gcagaacatg aggcagaaga ccctttctgc 6240 tccagcttct tcaggctcaa ccttcatcag aatagataga aagagaggct gtgagggttc 6300 ttaaaacaga agcaaatctg actcagagaa taaacaacct cctagtaaac tacagcttag 6360 acagagcatc tggtggtgag tgtgctcagt gtcctactca actgtctggt atcagccctc 6420 atgaggactt ctcttctttc cctcatagac ctccatctct gttttcctta gcctgcagaa 6480 atctggatgg ctattcacag aatgcctgtg ctttcagagt tgcatttttt ctctggtatt 6540 ctggttcaag catttgaagg taggaaaggt tctccaagtg caagaaagcc agccctgagc 6600 ctcaactgcc tggctagtgt ggtcagtagg atgcaaaggc tgttgaatgc cacaaggcca 6660 aactttaacc tgtgtaccac aagcctagca gcagaggcag ctctgctcac tggaactctc 6720 tgtcttcttt ctcctgagcc ttttcttttc ctgagttttc tagctctcct caaccttacc 6780 tctgccctac ccaggacaaa cccaagagcc actgtttctg tgatgtcctc tccagcccta 6840 attaggcatc atgacttcag cctgaccttc catgctcaga agcagtgcta atccacttca 6900 gatgagctgc tctatgcaac acaggcagag cctacaaacc tttgcaccag agccctccac 6960 atatcagtgt ttgttcatac tcacttcaac agcaaatgtg actgctgaga ttaagatttt 7020 acacaagatg gtctgtaatt tcacagttag ttttatccca ttaggtatga aagaattagc 7080 ataattcccc ttaaacatga atgaatctta gattttttaa taaatagttt tggaagtaaa 7140 gacagagaca tcaggagcac aaggaatagc ctgagaggac aaacagaaca agaaagagtc 7200 tggaaataca caggatgttc ttggcctcct caaagcaagt gcaagcagat agtaccagca 7260 gccccaggct atcagagccc agtgaagaga agtaccatga aagccacagc tctaaccacc 7320 ctgttccaga gtgacagaca gtccccaaga caagccagcc tgagccagag agagaactgc 7380 aagagaaagt ttctaattta ggttctgtta gattcagaca agtgcaggtc atcctctctc 7440 cacagctact cacctctcca gcctaacaaa gcctgcagtc cacactccaa ccctggtgtc 7500 tcacctccta gcctctccca acatcctgct ctctgaccat cttctgcatc tctcatctca 7560 ccatctccca ctgtctacag cctactcttg caactaccat ctcattttct gacatcctgt 7620 ctacatcttc tgccatactc tgccatctac cataccacct cttaccatct accacaccat 7680 cttttatctc catccctctc agaagcctcc aagctgaatc ctgctttatg tgttcatctc 7740 agcccctgca tggaaagctg accccagagg cagaactatt cccagagagc ttggccaaga 7800 aaaacaaaac taccagcctg gccaggctca ggagtagtaa gctgcagtgt ctgttgtgtt 7860 ctagcttcaa cagctgcagg agttccactc tcaaatgctc cacatttctc acatcctcct 7920 gattctggtc actacccatc ttcaaagaac agaatatctc acatcagcat actgtgaagg 7980 actagtcatg ggtgcagctg ctcagagctg caaagtcatt ctggatggtg gagagcttac 8040 aaacatttca tgatgctccc cccgctctga tggctggagc ccaatcccta cacagactcc 8100 tgctgtatgt gttttccttt cactctgagc cacagccaga gggcaggcat tcagtctcct 8160 cttcaggctg gggctggggc actgagaact cacccaacac cttgctctca ctccttctgc 8220 aaaacaagaa agagctttgt gctgcagtag ccatgaagaa tgaaaggaag gctttaacta 8280 aaaaatgtca gagattattt tcaacccctt actgtggatc accagcaagg aggaaacaca 8340 acacagagac attttttccc ctcaaattat caaaagaatc actgcatttg ttaaagagag 8400 caactgaatc aggaagcaga gttttgaaca tatcagaagt taggaatctg catcagagac 8460 aaatgcagtc atggttgttt gctgcatacc agccctaatc attagaagcc tcatggactt 8520 caaacatcat tccctctgac aagatgctct agcctaactc catgagataa aataaatctg 8580 cctttcagag ccaaagaaga gtccaccagc ttcttctcag tgtgaacaag agctccagtc 8640 aggttagtca gtccagtgca gtagaggaga ccagtctgca tcctctaatt ttcaaaggca 8700 agaagatttg tttaccctgg acaccaggca caagtgaggt cacagagctc ttagatatgc 8760 agtcctcatg agtgaggaga ctaaagcgca tgccatcaag acttcagtgt agagaaaacc 8820 tccaaaaaag cctcctcact acttctggaa tagctcagag gccgaggcgg cctcggcctc 8880 tgcataaata aaaaaaatta gtcagccatg gggcggagaa tgggcggaac tgggcggagt 8940 taggggcggg atgggcggag ttaggggcgg gactatggtt gctgactaat tgagatgcat 9000 gctttgcata cttctgcctg ctggggagcc tggggacttt ccacacctgg ttgctgacta 9060 attgagatgc atgctttgca tacttctgcc tgctggggag cctggggact ttccacaccc 9120 taactgacac acattccaca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 9180 ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 9240 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 9300 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 9360 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 9420 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 9480 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 9540 tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 9600 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 9660 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 9720 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 9780 ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct 9840 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 9900 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 9960 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 10020 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 10080 taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 10140 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 10200 gcctgactcc tgcaaaccac gttgtgtctc aaaatctctg atgttacatt gcacaagata 10260 aaaatatatc atcatgaaca ataaaactgt ctgcttacat aaacagtaat acaaggggtg 10320 ttatgagcca tattcaacgg gaaacgtctt gctcgaggcc gcgattaaat tccaacatgg 10380 atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa 10440 tctatcgatt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta 10500 gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc 10560 ctcttccgac catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg 10620 cgatccccgg gaaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata 10680 ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc 10740 cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt 10800 tggttgatgc gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga 10860 aagaaatgca taagcttttg ccattctcac cggattcagt cgtcactcat ggtgatttct 10920 cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag 10980 tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt 11040 ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata 11100 aattgcagtt tcatttgatg ctcgatgagt ttttctaagg gcggcctgcc accataccca 11160 cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt 11220 cggcgatata ggcgccagca accgcacctg tggcgccggt gatgagggcg cgccaagtcg 11280 acgtccggca gtc 11293 <210> 7 <211> 10700 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 7 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140 cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200 gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260 agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320 gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380 gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440 ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500 tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560 accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620 actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680 ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740 ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800 atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860 cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920 agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980 acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040 gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100 cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160 ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220 gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280 gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340 aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400 acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460 gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520 tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580 ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640 atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700 ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760 gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820 cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880 atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940 aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000 tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060 tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120 taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180 ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240 gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300 ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360 gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420 cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480 cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540 ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780 tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840 gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 3900 tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 3960 tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4020 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680 caagtcgacg tccggcagtc 10700 <210> 8 <211> 10700 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 8 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactatt agatctgatg gccgcgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140 cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200 gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260 agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320 gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380 gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440 ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500 tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560 accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620 actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680 ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740 ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800 atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860 cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920 agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980 acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040 gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100 cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160 ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220 gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280 gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340 aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400 acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460 gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520 tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580 ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640 atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700 ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760 gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820 cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880 atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940 aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000 tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060 tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120 taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180 ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240 gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300 ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360 gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420 cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480 cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540 ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780 tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840 gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 3900 tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 3960 tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4020 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680 caagtcgacg tccggcagtc 10700 <210> 9 <211> 10700 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 9 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140 cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200 gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260 agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320 gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380 gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440 ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500 tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560 accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620 actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680 ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740 ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800 atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860 cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920 agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980 acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040 gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100 cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160 ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220 gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280 gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340 aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400 acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460 gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520 tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580 ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640 atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700 ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760 gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820 cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880 atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940 aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000 tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060 tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120 taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180 ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240 gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300 ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360 gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420 cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480 cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540 ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780 tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840 gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 3900 tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 3960 tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4020 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680 caagtcgacg tccggcagtc 10700 <210> 10 <211> 10700 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 10 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140 cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200 gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260 agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320 gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380 gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440 ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500 tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560 accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620 actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680 ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740 ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800 atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860 cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920 agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980 acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040 gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100 cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160 ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220 gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280 gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340 aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400 acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460 gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520 tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580 ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640 atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700 ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760 gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820 cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880 atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940 aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000 tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060 tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120 taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180 ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240 gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300 ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360 gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420 cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480 cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540 ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780 tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840 gtgaacatat tgactgaatt ccctgcagga ggaaccccta gtgatggagt tggccactcc 3900 ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 3960 ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaagcggcc 4020 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680 caagtcgacg tccggcagtc 10700 <210> 11 <211> 11188 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 11 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactatt agatctgatg gccgcgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 gtggtgactg agatgttttc taggaaacac aaaagataca aaaaagaaca cgtggaagga 300 tagccaaaaa ggggggctgc ccccatttcc tgcaccccgc tgcgatggct ggcaccattt 360 ggaagacttc gagatacact gttgagcgca gtaagacaac agtgtatctc gaagtcttcc 420 agatggggcc agccggtcca ctctgtatcc aggccagttc tgcaaggcgt tcgaggacca 480 cccccctccc ctcgccacca gggtggtctc atacagaact tataagattc ccaaatccaa 540 agacatttca cgtttatggt gatttcccag aacacatagc gacatgcaaa tattgcaggg 600 cgccactccc ctgtccctca cagccatctt cctgccaggg cgcacgcgcg ctgggtgttc 660 ccgcctagtg acactgggcc cgcgattcct tggagcgggt tgatgacgtc agcgtttccc 720 atggtgaatc cctaggttct agaaccggtg acgtctccca tggtgaagct tggatctgaa 780 ttcggtacct agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat 840 ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 900 ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 960 ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 1020 tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 1080 tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat 1140 cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca tctccccccc 1200 ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag cgatgggggc 1260 gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc 1320 gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat 1380 ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagtcgc 1440 tgcgacgctg ccttcgcccc gtgccccgct ccgccgccgc ctcgcgccgc ccgccccggc 1500 tctgactgac cgcgttactc ccacaggtga gcgggcggga cggcccttct cctccgggct 1560 gtaattagcg cttggtttaa tgacggcttg tttcttttct gtggctgcgt gaaagccttg 1620 aggggctccg ggagctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca 1680 gctcctgggc aacgtgctgg ttattgtgct gtctcatcat tttggcaaag aattcctcga 1740 agatccgaag ggaaagtctt ccacgactgt gggatccgtt cgaagatatc accggttgag 1800 ccaccatgga attcagcagc cccagcagag aggaatgccc caagcctctg agccgggtgt 1860 caatcatggc cggatctctg acaggactgc tgctgcttca ggccgtgtct tgggcttctg 1920 gcgctagacc ttgcatcccc aagagcttcg gctacagcag cgtcgtgtgc gtgtgcaatg 1980 ccacctactg cgacagcttc gaccctccta cctttcctgc tctgggcacc ttcagcagat 2040 acgagagcac cagatccggc agacggatgg aactgagcat gggacccatc caggccaatc 2100 acacaggcac tggcctgctg ctgacactgc agcctgagca gaaattccag aaagtgaaag 2160 gcttcggcgg agccatgaca gatgccgccg ctctgaatat cctggctctg tctccaccag 2220 ctcagaacct gctgctcaag agctacttca gcgaggaagg catcggctac aacatcatca 2280 gagtgcccat ggccagctgc gacttcagca tcaggaccta cacctacgcc gacacacccg 2340 acgatttcca gctgcacaac ttcagcctgc ctgaagagga caccaagctg aagatccctc 2400 tgatccacag agccctgcag ctggcacaaa gacccgtgtc actgctggcc tctccatgga 2460 catctcccac ctggctgaaa acaaatggcg ccgtgaatgg caagggcagc ctgaaaggcc 2520 aacctggcga catctaccac cagacctggg ccagatactt cgtgaagttc ctggacgcct 2580 atgccgagca caagctgcag ttttgggccg tgacagccga gaacgaacct tctgctggac 2640 tgctgagcgg ctaccccttt cagtgcctgg gctttacacc cgagcaccag cgggacttta 2700 tcgcccgtga tctgggaccc acactggcca atagcaccca ccataatgtg cggctgctga 2760 tgctggacga ccagagactg cttctgcccc actgggctaa agtggtgctg acagatcctg 2820 aggccgccaa atacgtgcac ggaatcgccg tgcactggta tctggacttt ctggcccctg 2880 ccaaggccac actgggagag acacacagac tgttccccaa caccatgctg ttcgccagcg 2940 aagcctgtgt gggcagcaag ttttgggaac agagcgtgcg gctcggcagc tgggatagag 3000 gcatgcagta cagccacagc atcatcacca acctgctgta ccacgtcgtc ggctggaccg 3060 actggaatct ggccctgaat cctgaaggcg gccctaactg ggtccgaaac ttcgtggaca 3120 gccccatcat cgtggacatc accaaggaca ccttctacaa gcagcccatg ttctaccacc 3180 tgggacactt cagcaagttc atccccgagg gctctcagcg cgttggactg gtggcttccc 3240 agaagaacga tctggacgcc gtggctctga tgcaccctga tggatctgct gtggtggtgg 3300 tcctgaaccg cagcagcaaa gatgtgcccc tgaccatcaa ggatcccgcc gtgggattcc 3360 tggaaacaat cagccctggc tactccatcc acacctacct gtggcgtaga cagtgacaat 3420 tgttaattaa gtttaaaccc tcgaggccgc aagcttatcg ataatcaacc tctggattac 3480 aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 3540 tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 3600 tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa 3660 cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc 3720 acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc 3780 atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 3840 gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg 3900 attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct 3960 tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg 4020 agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgactaga gctcgctgat 4080 cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 4140 ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 4200 cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 4260 gggaggattg ggaagacaat agcaggcatg ctggggagag atccacgata acaaacagct 4320 tttttggggt gaacatattg actgaattcc ctgcaggttg gccactccct ctctgcgcgc 4380 tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 4440 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 4500 ctgcggccgc tcgtacggtc tcgaggaatt cctgcaggat aacttgccaa cctcattcta 4560 aaatgtatat agaagcccaa aagacaataa caaaaatatt cttgtagaac aaaatgggaa 4620 agaatgttcc actaaatatc aagatttaga gcaaagcatg agatgtgtgg ggatagacag 4680 tgaggctgat aaaatagagt agagctcaga aacagaccca ttgatatatg taagtgacct 4740 atgaaaaaaa tatggcattt tacaatggga aaatgatggt ctttttcttt tttagaaaaa 4800 cagggaaata tatttatatg taaaaaataa aagggaaccc atatgtcata ccatacacac 4860 aaaaaaattc cagtgaatta taagtctaaa tggagaaggc aaaactttaa atcttttaga 4920 aaataatata gaagcatgca gaccagcctg gccaacatga tgaaaccctc tctactaata 4980 ataaaatcag tagaactact caggactact ttgagtggga agtccttttc tatgaagact 5040 tctttggcca aaattaggct ctaaatgcaa ggagatagtg catcatgcct ggctgcactt 5100 actgataaat gatgttatca ccatctttaa ccaaatgcac aggaacaagt tatggtactg 5160 atgtgctgga ttgagaagga gctctacttc cttgacagga cacatttgta tcaacttaaa 5220 aaagcagatt tttgccagca gaactattca ttcagaggta ggaaacttag aatagatgat 5280 gtcactgatt agcatggctt ccccatctcc acagctgctt cccacccagg ttgcccacag 5340 ttgagtttgt ccagtgctca gggctgccca ctctcagtaa gaagccccac accagcccct 5400 ctccaaatat gttggctgtt ccttccatta aagtgacccc actttagagc agcaagtgga 5460 tttctgtttc ttacagttca ggaaggagga gtcagctgtg agaacctgga gcctgagatg 5520 cttctaagtc ccactgctac tggggtcagg gaagccagac tccagcatca gcagtcagga 5580 gcactaagcc cttgccaaca tcctgtttct cagagaaact gcttccatta taatggttgt 5640 ccttttttaa gctatcaagc caaacaacca gtgtctacca ttattctcat cacctgaagc 5700 caagggttct agcaaaagtc aagctgtctt gtaatggttg atgtgcctcc agcttctgtc 5760 ttcagtcact ccactcttag cctgctctga atcaactctg accacagttc cctggagccc 5820 ctgccacctg ctgcccctgc caccttctcc atctgcagtg ctgtgcagcc ttctgcactc 5880 ttgcagagct aataggtgga gacttgaagg aagaggagga aagtttctca taatagcctt 5940 gctgcaagct caaatgggag gtgggcactg tgcccaggag ccttggagca aaggctgtgc 6000 ccaacctctg actgcatcca ggtttggtct tgacagagat aagaagccct ggcttttgga 6060 gccaaaatct aggtcagact taggcaggat tctcaaagtt tatcagcaga acatgaggca 6120 gaagaccctt tctgctccag cttcttcagg ctcaaccttc atcagaatag atagaaagag 6180 aggctgtgag ggttcttaaa acagaagcaa atctgactca gagaataaac aacctcctag 6240 taaactacag cttagacaga gcatctggtg gtgagtgtgc tcagtgtcct actcaactgt 6300 ctggtatcag ccctcatgag gacttctctt ctttccctca tagacctcca tctctgtttt 6360 ccttagcctg cagaaatctg gatggctatt cacagaatgc ctgtgctttc agagttgcat 6420 tttttctctg gtattctggt tcaagcattt gaaggtagga aaggttctcc aagtgcaaga 6480 aagccagccc tgagcctcaa ctgcctggct agtgtggtca gtaggatgca aaggctgttg 6540 aatgccacaa ggccaaactt taacctgtgt accacaagcc tagcagcaga ggcagctctg 6600 ctcactggaa ctctctgtct tctttctcct gagccttttc ttttcctgag ttttctagct 6660 ctcctcaacc ttacctctgc cctacccagg acaaacccaa gagccactgt ttctgtgatg 6720 tcctctccag ccctaattag gcatcatgac ttcagcctga ccttccatgc tcagaagcag 6780 tgctaatcca cttcagatga gctgctctat gcaacacagg cagagcctac aaacctttgc 6840 accagagccc tccacatatc agtgtttgtt catactcact tcaacagcaa atgtgactgc 6900 tgagattaag attttacaca agatggtctg taatttcaca gttagtttta tcccattagg 6960 tatgaaagaa ttagcataat tccccttaaa catgaatgaa tcttagattt tttaataaat 7020 agttttggaa gtaaagacag agacatcagg agcacaagga atagcctgag aggacaaaca 7080 gaacaagaaa gagtctggaa atacacagga tgttcttggc ctcctcaaag caagtgcaag 7140 cagatagtac cagcagcccc aggctatcag agcccagtga agagaagtac catgaaagcc 7200 acagctctaa ccaccctgtt ccagagtgac agacagtccc caagacaagc cagcctgagc 7260 cagagagaga actgcaagag aaagtttcta atttaggttc tgttagattc agacaagtgc 7320 aggtcatcct ctctccacag ctactcacct ctccagccta acaaagcctg cagtccacac 7380 tccaaccctg gtgtctcacc tcctagcctc tcccaacatc ctgctctctg accatcttct 7440 gcatctctca tctcaccatc tcccactgtc tacagcctac tcttgcaact accatctcat 7500 tttctgacat cctgtctaca tcttctgcca tactctgcca tctaccatac cacctcttac 7560 catctaccac accatctttt atctccatcc ctctcagaag cctccaagct gaatcctgct 7620 ttatgtgttc atctcagccc ctgcatggaa agctgacccc agaggcagaa ctattcccag 7680 agagcttggc caagaaaaac aaaactacca gcctggccag gctcaggagt agtaagctgc 7740 agtgtctgtt gtgttctagc ttcaacagct gcaggagttc cactctcaaa tgctccacat 7800 ttctcacatc ctcctgattc tggtcactac ccatcttcaa agaacagaat atctcacatc 7860 agcatactgt gaaggactag tcatgggtgc agctgctcag agctgcaaag tcattctgga 7920 tggtggagag cttacaaaca tttcatgatg ctccccccgc tctgatggct ggagcccaat 7980 ccctacacag actcctgctg tatgtgtttt cctttcactc tgagccacag ccagagggca 8040 ggcattcagt ctcctcttca ggctggggct ggggcactga gaactcaccc aacaccttgc 8100 tctcactcct tctgcaaaac aagaaagagc tttgtgctgc agtagccatg aagaatgaaa 8160 ggaaggcttt aactaaaaaa tgtcagagat tattttcaac cccttactgt ggatcaccag 8220 caaggaggaa acacaacaca gagacatttt ttcccctcaa attatcaaaa gaatcactgc 8280 atttgttaaa gagagcaact gaatcaggaa gcagagtttt gaacatatca gaagttagga 8340 atctgcatca gagacaaatg cagtcatggt tgtttgctgc ataccagccc taatcattag 8400 aagcctcatg gacttcaaac atcattccct ctgacaagat gctctagcct aactccatga 8460 gataaaataa atctgccttt cagagccaaa gaagagtcca ccagcttctt ctcagtgtga 8520 acaagagctc cagtcaggtt agtcagtcca gtgcagtaga ggagaccagt ctgcatcctc 8580 taattttcaa aggcaagaag atttgtttac cctggacacc aggcacaagt gaggtcacag 8640 agctcttaga tatgcagtcc tcatgagtga ggagactaaa gcgcatgcca tcaagacttc 8700 agtgtagaga aaacctccaa aaaagcctcc tcactacttc tggaatagct cagaggccga 8760 ggcggcctcg gcctctgcat aaataaaaaa aattagtcag ccatggggcg gagaatgggc 8820 ggaactgggc ggagttaggg gcgggatggg cggagttagg ggcgggacta tggttgctga 8880 ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg actttccaca 8940 cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg gggagcctgg 9000 ggactttcca caccctaact gacacacatt ccacagctgc attaatgaat cggccaacgc 9060 gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 9120 cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 9180 tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 9240 aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 9300 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9360 caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9420 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 9480 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 9540 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 9600 cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 9660 ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 9720 tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 9780 tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 9840 cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 9900 tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 9960 tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 10020 tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 10080 cgttcatcca tagttgcctg actcctgcaa accacgttgt gtctcaaaat ctctgatgtt 10140 acattgcaca agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca 10200 gtaatacaag gggtgttatg agccatattc aacgggaaac gtcttgctcg aggccgcgat 10260 taaattccaa catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc 10320 aatcaggtgc gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga 10380 aacatggcaa aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc 10440 tgacggaatt tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat 10500 ggttactcac cactgcgatc cccgggaaaa cagcattcca ggtattagaa gaatatcctg 10560 attcaggtga aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc 10620 ctgtttgtaa ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac 10680 gaatgaataa cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg 10740 ttgaacaagt ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca 10800 ctcatggtga tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta 10860 ttgatgttgg acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact 10920 gcctcggtga gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata 10980 atcctgatat gaataaattg cagtttcatt tgatgctcga tgagtttttc taagggcggc 11040 ctgccaccat acccacgccg aaacaagcgc tcatgagccc gaagtggcga gcccgatctt 11100 ccccatcggt gatgtcggcg atataggcgc cagcaaccgc acctgtggcg ccggtgatga 11160 gggcgcgcca agtcgacgtc cggcagtc 11188 <210> 12 <211> 11187 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 12 ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac ctagttataa 60 tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 120 cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 180 atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 240 tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 300 cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 360 tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag 420 gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg 480 tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc 540 gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg 600 gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg 660 cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc 720 cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact 780 cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc gcttggttta 840 atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc gggagctaga 900 gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg 960 gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa gggaaagtct 1020 tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgg aattcagcag 1080 ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg ccggatctct 1140 gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac cttgcatccc 1200 caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact gcgacagctt 1260 cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca ccagatccgg 1320 cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca ctggcctgct 1380 gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg gagccatgac 1440 agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc tgctgctcaa 1500 gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca tggccagctg 1560 cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc agctgcacaa 1620 cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca gagccctgca 1680 gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca cctggctgaa 1740 aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg acatctacca 1800 ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc acaagctgca 1860 gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg gctacccctt 1920 tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg atctgggacc 1980 cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg accagagact 2040 gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca aatacgtgca 2100 cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca cactgggaga 2160 gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg tgggcagcaa 2220 gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt acagccacag 2280 catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc tggccctgaa 2340 tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca tcgtggacat 2400 caccaaggac accttctaca agcagcccat gttctaccac ctgggacact tcagcaagtt 2460 catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg atctggacgc 2520 cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc gcagcagcaa 2580 agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa tcagccctgg 2640 ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta agtttaaacc 2700 ctcgaggccg caagcttatc gataatcaac ctctggatta caaaatttgt gaaagattga 2760 ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 2820 tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 2880 tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 2940 tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 3000 ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 3060 gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat 3120 catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 3180 tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 3240 ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 3300 ccgcctcccc gcatcgatac cgtcgactag agctcgctga tcagcctcga ctgtgccttc 3360 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 3420 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 3480 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 3540 tagcaggcat gctggggaga gatccacgat aacaaacagc ttttttgggg tgaacatatt 3600 gactgaattc cctgcaggtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 3660 gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga 3720 gcgcgcagag agggagtggc caactccatc actaggggtt cctgcggccg ctcgtacggt 3780 ctcgaggaat tcctgcagga taacttgcca acctcattct aaaatgtata tagaagccca 3840 aaagacaata acaaaaatat tcttgtagaa caaaatggga aagaatgttc cactaaatat 3900 caagatttag agcaaagcat gagatgtgtg gggatagaca gtgaggctga taaaatagag 3960 tagagctcag aaacagaccc attgatatat gtaagtgacc tatgaaaaaa atatggcatt 4020 ttacaatggg aaaatgatgg tctttttctt ttttagaaaa acagggaaat atatttatat 4080 gtaaaaaata aaagggaacc catatgtcat accatacaca caaaaaaatt ccagtgaatt 4140 ataagtctaa atggagaagg caaaacttta aatcttttag aaaataatat agaagcatgc 4200 agaccagcct ggccaacatg atgaaaccct ctctactaat aataaaatca gtagaactac 4260 tcaggactac tttgagtggg aagtcctttt ctatgaagac ttctttggcc aaaattaggc 4320 tctaaatgca aggagatagt gcatcatgcc tggctgcact tactgataaa tgatgttatc 4380 accatcttta accaaatgca caggaacaag ttatggtact gatgtgctgg attgagaagg 4440 agctctactt ccttgacagg acacatttgt atcaacttaa aaaagcagat ttttgccagc 4500 agaactattc attcagaggt aggaaactta gaatagatga tgtcactgat tagcatggct 4560 tccccatctc cacagctgct tcccacccag gttgcccaca gttgagtttg tccagtgctc 4620 agggctgccc actctcagta agaagcccca caccagcccc tctccaaata tgttggctgt 4680 tccttccatt aaagtgaccc cactttagag cagcaagtgg atttctgttt cttacagttc 4740 aggaaggagg agtcagctgt gagaacctgg agcctgagat gcttctaagt cccactgcta 4800 ctggggtcag ggaagccaga ctccagcatc agcagtcagg agcactaagc ccttgccaac 4860 atcctgtttc tcagagaaac tgcttccatt ataatggttg tcctttttta agctatcaag 4920 ccaaacaacc agtgtctacc attattctca tcacctgaag ccaagggttc tagcaaaagt 4980 caagctgtct tgtaatggtt gatgtgcctc cagcttctgt cttcagtcac tccactctta 5040 gcctgctctg aatcaactct gaccacagtt ccctggagcc cctgccacct gctgcccctg 5100 ccaccttctc catctgcagt gctgtgcagc cttctgcact cttgcagagc taataggtgg 5160 agacttgaag gaagaggagg aaagtttctc ataatagcct tgctgcaagc tcaaatggga 5220 ggtgggcact gtgcccagga gccttggagc aaaggctgtg cccaacctct gactgcatcc 5280 aggtttggtc ttgacagaga taagaagccc tggcttttgg agccaaaatc taggtcagac 5340 ttaggcagga ttctcaaagt ttatcagcag aacatgaggc agaagaccct ttctgctcca 5400 gcttcttcag gctcaacctt catcagaata gatagaaaga gaggctgtga gggttcttaa 5460 aacagaagca aatctgactc agagaataaa caacctccta gtaaactaca gcttagacag 5520 agcatctggt ggtgagtgtg ctcagtgtcc tactcaactg tctggtatca gccctcatga 5580 ggacttctct tctttccctc atagacctcc atctctgttt tccttagcct gcagaaatct 5640 ggatggctat tcacagaatg cctgtgcttt cagagttgca ttttttctct ggtattctgg 5700 ttcaagcatt tgaaggtagg aaaggttctc caagtgcaag aaagccagcc ctgagcctca 5760 actgcctggc tagtgtggtc agtaggatgc aaaggctgtt gaatgccaca aggccaaact 5820 ttaacctgtg taccacaagc ctagcagcag aggcagctct gctcactgga actctctgtc 5880 ttctttctcc tgagcctttt cttttcctga gttttctagc tctcctcaac cttacctctg 5940 ccctacccag gacaaaccca agagccactg tttctgtgat gtcctctcca gccctaatta 6000 ggcatcatga cttcagcctg accttccatg ctcagaagca gtgctaatcc acttcagatg 6060 agctgctcta tgcaacacag gcagagccta caaacctttg caccagagcc ctccacatat 6120 cagtgtttgt tcatactcac ttcaacagca aatgtgactg ctgagattaa gattttacac 6180 aagatggtct gtaatttcac agttagtttt atcccattag gtatgaaaga attagcataa 6240 ttccccttaa acatgaatga atcttagatt ttttaataaa tagttttgga agtaaagaca 6300 gagacatcag gagcacaagg aatagcctga gaggacaaac agaacaagaa agagtctgga 6360 aatacacagg atgttcttgg cctcctcaaa gcaagtgcaa gcagatagta ccagcagccc 6420 caggctatca gagcccagtg aagagaagta ccatgaaagc cacagctcta accaccctgt 6480 tccagagtga cagacagtcc ccaagacaag ccagcctgag ccagagagag aactgcaaga 6540 gaaagtttct aatttaggtt ctgttagatt cagacaagtg caggtcatcc tctctccaca 6600 gctactcacc tctccagcct aacaaagcct gcagtccaca ctccaaccct ggtgtctcac 6660 ctcctagcct ctcccaacat cctgctctct gaccatcttc tgcatctctc atctcaccat 6720 ctcccactgt ctacagccta ctcttgcaac taccatctca ttttctgaca tcctgtctac 6780 atcttctgcc atactctgcc atctaccata ccacctctta ccatctacca caccatcttt 6840 tatctccatc cctctcagaa gcctccaagc tgaatcctgc tttatgtgtt catctcagcc 6900 cctgcatgga aagctgaccc cagaggcaga actattccca gagagcttgg ccaagaaaaa 6960 caaaactacc agcctggcca ggctcaggag tagtaagctg cagtgtctgt tgtgttctag 7020 cttcaacagc tgcaggagtt ccactctcaa atgctccaca tttctcacat cctcctgatt 7080 ctggtcacta cccatcttca aagaacagaa tatctcacat cagcatactg tgaaggacta 7140 gtcatgggtg cagctgctca gagctgcaaa gtcattctgg atggtggaga gcttacaaac 7200 atttcatgat gctccccccg ctctgatggc tggagcccaa tccctacaca gactcctgct 7260 gtatgtgttt tcctttcact ctgagccaca gccagagggc aggcattcag tctcctcttc 7320 aggctggggc tggggcactg agaactcacc caacaccttg ctctcactcc ttctgcaaaa 7380 caagaaagag ctttgtgctg cagtagccat gaagaatgaa aggaaggctt taactaaaaa 7440 atgtcagaga ttattttcaa ccccttactg tggatcacca gcaaggagga aacacaacac 7500 agagacattt tttcccctca aattatcaaa agaatcactg catttgttaa agagagcaac 7560 tgaatcagga agcagagttt tgaacatatc agaagttagg aatctgcatc agagacaaat 7620 gcagtcatgg ttgtttgctg cataccagcc ctaatcatta gaagcctcat ggacttcaaa 7680 catcattccc tctgacaaga tgctctagcc taactccatg agataaaata aatctgcctt 7740 tcagagccaa agaagagtcc accagcttct tctcagtgtg aacaagagct ccagtcaggt 7800 tagtcagtcc agtgcagtag aggagaccag tctgcatcct ctaattttca aaggcaagaa 7860 gatttgttta ccctggacac caggcacaag tgaggtcaca gagctcttag atatgcagtc 7920 ctcatgagtg aggagactaa agcgcatgcc atcaagactt cagtgtagag aaaacctcca 7980 aaaaagcctc ctcactactt ctggaatagc tcagaggccg aggcggcctc ggcctctgca 8040 taaataaaaa aaattagtca gccatggggc ggagaatggg cggaactggg cggagttagg 8100 ggcgggatgg gcggagttag gggcgggact atggttgctg actaattgag atgcatgctt 8160 tgcatacttc tgcctgctgg ggagcctggg gactttccac acctggttgc tgactaattg 8220 agatgcatgc tttgcatact tctgcctgct ggggagcctg gggactttcc acaccctaac 8280 tgacacacat tccacagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 8340 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 8400 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 8460 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 8520 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 8580 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 8640 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 8700 tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 8760 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8820 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8880 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8940 tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 9000 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 9060 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 9120 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 9180 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 9240 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 9300 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 9360 gactcctgca aaccacgttg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa 9420 tatatcatca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat 9480 gagccatatt caacgggaaa cgtcttgctc gaggccgcga ttaaattcca acatggatgc 9540 tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta 9600 tcgattgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt 9660 tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct 9720 tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat 9780 ccccgggaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt 9840 tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt 9900 taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt 9960 tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga 10020 aatgcataag cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact 10080 tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg 10140 aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc 10200 ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt 10260 gcagtttcat ttgatgctcg atgagttttt ctaagggcgg cctgccacca tacccacgcc 10320 gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc 10380 gatataggcg ccagcaaccg cacctgtggc gccggtgatg agggcgcgcc aagtcgacgt 10440 ccggcagtct tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca 10500 aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga 10560 gagggagtgg ccaactccat cactaggggt tcctgctagc tctgggtatt taagcccgag 10620 tgagcacgca gggtctccat tttgaagcgg gaggttacgc gttcgtcgac tactagtggg 10680 taccagagcg tggtgactga gatgttttct aggaaacaca aaagatacaa aaaagaacac 10740 gtggaaggat agccaaaaag gggggctgcc cccatttcct gcaccccgct gcgatggctg 10800 gcaccatttg gaagacttcg agatacactg ttgagcgcag taagacaaca gtgtatctcg 10860 aagtcttcca gatggggcca gccggtccac tctgtatcca ggccagttct gcaaggcgtt 10920 cgaggaccac ccccctcccc tcgccaccag ggtggtctca tacagaactt ataagattcc 10980 caaatccaaa gacatttcac gtttatggtg atttcccaga acacatagcg acatgcaaat 11040 attgcagggc gccactcccc tgtccctcac agccatcttc ctgccagggc gcacgcgcgc 11100 tgggtgttcc cgcctagtga cactgggccc gcgattcctt ggagcgggtt gatgacgtca 11160 gcgtttccca tggtgaatcc ctaggtt 11187 <210> 13 <211> 10960 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 13 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 360 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 420 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 480 caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 540 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 600 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 660 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 720 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 780 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 840 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 900 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 960 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1020 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1080 gcgcttggtt taatgacggc ttgtcctggt ggcgagggga ggggggtggt cctcgaacgc 1140 cttgcagaac tggcctggat acagagtgga ccggctggcc ccatctggaa gacttcgaga 1200 tacactgttg tcttactgcg ctcaacagtg tatctcgaag tcttccaaat ggtgccagcc 1260 atcgcagcgg ggtgcaggaa atgggggcag cccccctttt tggctatcct tccacgtgtt 1320 cttttttgta tcttttgtgt ttcctagaaa acatctcagt caccaccttt ctgtggctgc 1380 gtgaaagcct tgaggggctc cgggagctag agcctctgct aaccatgttc atgccttctt 1440 ctttttccta cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa 1500 agaattcctc gaagatccga agggaaagtc ttccacgact gtgggatccg ttcgaagata 1560 tcaccggttg agccaccatg gaattcagca gccccagcag agaggaatgc cccaagcctc 1620 tgagccgggt gtcaatcatg gccggatctc tgacaggact gctgctgctt caggccgtgt 1680 cttgggcttc tggcgctaga ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt 1740 gcgtgtgcaa tgccacctac tgcgacagct tcgaccctcc tacctttcct gctctgggca 1800 ccttcagcag atacgagagc accagatccg gcagacggat ggaactgagc atgggaccca 1860 tccaggccaa tcacacaggc actggcctgc tgctgacact gcagcctgag cagaaattcc 1920 agaaagtgaa aggcttcggc ggagccatga cagatgccgc cgctctgaat atcctggctc 1980 tgtctccacc agctcagaac ctgctgctca agagctactt cagcgaggaa ggcatcggct 2040 acaacatcat cagagtgccc atggccagct gcgacttcag catcaggacc tacacctacg 2100 ccgacacacc cgacgatttc cagctgcaca acttcagcct gcctgaagag gacaccaagc 2160 tgaagatccc tctgatccac agagccctgc agctggcaca aagacccgtg tcactgctgg 2220 cctctccatg gacatctccc acctggctga aaacaaatgg cgccgtgaat ggcaagggca 2280 gcctgaaagg ccaacctggc gacatctacc accagacctg ggccagatac ttcgtgaagt 2340 tcctggacgc ctatgccgag cacaagctgc agttttgggc cgtgacagcc gagaacgaac 2400 cttctgctgg actgctgagc ggctacccct ttcagtgcct gggctttaca cccgagcacc 2460 agcgggactt tatcgcccgt gatctgggac ccacactggc caatagcacc caccataatg 2520 tgcggctgct gatgctggac gaccagagac tgcttctgcc ccactgggct aaagtggtgc 2580 tgacagatcc tgaggccgcc aaatacgtgc acggaatcgc cgtgcactgg tatctggact 2640 ttctggcccc tgccaaggcc acactgggag agacacacag actgttcccc aacaccatgc 2700 tgttcgccag cgaagcctgt gtgggcagca agttttggga acagagcgtg cggctcggca 2760 gctgggatag aggcatgcag tacagccaca gcatcatcac caacctgctg taccacgtcg 2820 tcggctggac cgactggaat ctggccctga atcctgaagg cggccctaac tgggtccgaa 2880 acttcgtgga cagccccatc atcgtggaca tcaccaagga caccttctac aagcagccca 2940 tgttctacca cctgggacac ttcagcaagt tcatccccga gggctctcag cgcgttggac 3000 tggtggcttc ccagaagaac gatctggacg ccgtggctct gatgcaccct gatggatctg 3060 ctgtggtggt ggtcctgaac cgcagcagca aagatgtgcc cctgaccatc aaggatcccg 3120 ccgtgggatt cctggaaaca atcagccctg gctactccat ccacacctac ctgtggcgta 3180 gacagtgaca attgttaatt aagtttaaac cctcgaggcc gcaagcttat cgataatcaa 3240 cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 3300 acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 3360 ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 3420 gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 3480 ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 3540 acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 3600 actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt 3660 gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 3720 gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 3780 cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcgata ccgtcgacta 3840 gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 3900 cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 3960 aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 4020 aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggag agatccacga 4080 taacaaacag cttttttggg gtgaacatat tgactgaatt ccctgcaggt tggccactcc 4140 ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4200 ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaactccat 4260 cactaggggt tcctgcggcc gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc 4320 aacctcattc taaaatgtat atagaagccc aaaagacaat aacaaaaata ttcttgtaga 4380 acaaaatggg aaagaatgtt ccactaaata tcaagattta gagcaaagca tgagatgtgt 4440 ggggatagac agtgaggctg ataaaataga gtagagctca gaaacagacc cattgatata 4500 tgtaagtgac ctatgaaaaa aatatggcat tttacaatgg gaaaatgatg gtctttttct 4560 tttttagaaa aacagggaaa tatatttata tgtaaaaaat aaaagggaac ccatatgtca 4620 taccatacac acaaaaaaat tccagtgaat tataagtcta aatggagaag gcaaaacttt 4680 aaatctttta gaaaataata tagaagcatg cagaccagcc tggccaacat gatgaaaccc 4740 tctctactaa taataaaatc agtagaacta ctcaggacta ctttgagtgg gaagtccttt 4800 tctatgaaga cttctttggc caaaattagg ctctaaatgc aaggagatag tgcatcatgc 4860 ctggctgcac ttactgataa atgatgttat caccatcttt aaccaaatgc acaggaacaa 4920 gttatggtac tgatgtgctg gattgagaag gagctctact tccttgacag gacacatttg 4980 tatcaactta aaaaagcaga tttttgccag cagaactatt cattcagagg taggaaactt 5040 agaatagatg atgtcactga ttagcatggc ttccccatct ccacagctgc ttcccaccca 5100 ggttgcccac agttgagttt gtccagtgct cagggctgcc cactctcagt aagaagcccc 5160 acaccagccc ctctccaaat atgttggctg ttccttccat taaagtgacc ccactttaga 5220 gcagcaagtg gatttctgtt tcttacagtt caggaaggag gagtcagctg tgagaacctg 5280 gagcctgaga tgcttctaag tcccactgct actggggtca gggaagccag actccagcat 5340 cagcagtcag gagcactaag cccttgccaa catcctgttt ctcagagaaa ctgcttccat 5400 tataatggtt gtcctttttt aagctatcaa gccaaacaac cagtgtctac cattattctc 5460 atcacctgaa gccaagggtt ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct 5520 ccagcttctg tcttcagtca ctccactctt agcctgctct gaatcaactc tgaccacagt 5580 tccctggagc ccctgccacc tgctgcccct gccaccttct ccatctgcag tgctgtgcag 5640 ccttctgcac tcttgcagag ctaataggtg gagacttgaa ggaagaggag gaaagtttct 5700 cataatagcc ttgctgcaag ctcaaatggg aggtgggcac tgtgcccagg agccttggag 5760 caaaggctgt gcccaacctc tgactgcatc caggtttggt cttgacagag ataagaagcc 5820 ctggcttttg gagccaaaat ctaggtcaga cttaggcagg attctcaaag tttatcagca 5880 gaacatgagg cagaagaccc tttctgctcc agcttcttca ggctcaacct tcatcagaat 5940 agatagaaag agaggctgtg agggttctta aaacagaagc aaatctgact cagagaataa 6000 acaacctcct agtaaactac agcttagaca gagcatctgg tggtgagtgt gctcagtgtc 6060 ctactcaact gtctggtatc agccctcatg aggacttctc ttctttccct catagacctc 6120 catctctgtt ttccttagcc tgcagaaatc tggatggcta ttcacagaat gcctgtgctt 6180 tcagagttgc attttttctc tggtattctg gttcaagcat ttgaaggtag gaaaggttct 6240 ccaagtgcaa gaaagccagc cctgagcctc aactgcctgg ctagtgtggt cagtaggatg 6300 caaaggctgt tgaatgccac aaggccaaac tttaacctgt gtaccacaag cctagcagca 6360 gaggcagctc tgctcactgg aactctctgt cttctttctc ctgagccttt tcttttcctg 6420 agttttctag ctctcctcaa ccttacctct gccctaccca ggacaaaccc aagagccact 6480 gtttctgtga tgtcctctcc agccctaatt aggcatcatg acttcagcct gaccttccat 6540 gctcagaagc agtgctaatc cacttcagat gagctgctct atgcaacaca ggcagagcct 6600 acaaaccttt gcaccagagc cctccacata tcagtgtttg ttcatactca cttcaacagc 6660 aaatgtgact gctgagatta agattttaca caagatggtc tgtaatttca cagttagttt 6720 tatcccatta ggtatgaaag aattagcata attcccctta aacatgaatg aatcttagat 6780 tttttaataa atagttttgg aagtaaagac agagacatca ggagcacaag gaatagcctg 6840 agaggacaaa cagaacaaga aagagtctgg aaatacacag gatgttcttg gcctcctcaa 6900 agcaagtgca agcagatagt accagcagcc ccaggctatc agagcccagt gaagagaagt 6960 accatgaaag ccacagctct aaccaccctg ttccagagtg acagacagtc cccaagacaa 7020 gccagcctga gccagagaga gaactgcaag agaaagtttc taatttaggt tctgttagat 7080 tcagacaagt gcaggtcatc ctctctccac agctactcac ctctccagcc taacaaagcc 7140 tgcagtccac actccaaccc tggtgtctca cctcctagcc tctcccaaca tcctgctctc 7200 tgaccatctt ctgcatctct catctcacca tctcccactg tctacagcct actcttgcaa 7260 ctaccatctc attttctgac atcctgtcta catcttctgc catactctgc catctaccat 7320 accacctctt accatctacc acaccatctt ttatctccat ccctctcaga agcctccaag 7380 ctgaatcctg ctttatgtgt tcatctcagc ccctgcatgg aaagctgacc ccagaggcag 7440 aactattccc agagagcttg gccaagaaaa acaaaactac cagcctggcc aggctcagga 7500 gtagtaagct gcagtgtctg ttgtgttcta gcttcaacag ctgcaggagt tccactctca 7560 aatgctccac atttctcaca tcctcctgat tctggtcact acccatcttc aaagaacaga 7620 atatctcaca tcagcatact gtgaaggact agtcatgggt gcagctgctc agagctgcaa 7680 agtcattctg gatggtggag agcttacaaa catttcatga tgctcccccc gctctgatgg 7740 ctggagccca atccctacac agactcctgc tgtatgtgtt ttcctttcac tctgagccac 7800 agccagaggg caggcattca gtctcctctt caggctgggg ctggggcact gagaactcac 7860 ccaacacctt gctctcactc cttctgcaaa acaagaaaga gctttgtgct gcagtagcca 7920 tgaagaatga aaggaaggct ttaactaaaa aatgtcagag attattttca accccttact 7980 gtggatcacc agcaaggagg aaacacaaca cagagacatt ttttcccctc aaattatcaa 8040 aagaatcact gcatttgtta aagagagcaa ctgaatcagg aagcagagtt ttgaacatat 8100 cagaagttag gaatctgcat cagagacaaa tgcagtcatg gttgtttgct gcataccagc 8160 cctaatcatt agaagcctca tggacttcaa acatcattcc ctctgacaag atgctctagc 8220 ctaactccat gagataaaat aaatctgcct ttcagagcca aagaagagtc caccagcttc 8280 ttctcagtgt gaacaagagc tccagtcagg ttagtcagtc cagtgcagta gaggagacca 8340 gtctgcatcc tctaattttc aaaggcaaga agatttgttt accctggaca ccaggcacaa 8400 gtgaggtcac agagctctta gatatgcagt cctcatgagt gaggagacta aagcgcatgc 8460 catcaagact tcagtgtaga gaaaacctcc aaaaaagcct cctcactact tctggaatag 8520 ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc agccatgggg 8580 cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta ggggcgggac 8640 tatggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg gggagcctgg 8700 ggactttcca cacctggttg ctgactaatt gagatgcatg ctttgcatac ttctgcctgc 8760 tggggagcct ggggactttc cacaccctaa ctgacacaca ttccacagct gcattaatga 8820 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 8880 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 8940 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 9000 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 9060 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 9120 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 9180 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 9240 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 9300 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 9360 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 9420 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 9480 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 9540 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 9600 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 9660 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 9720 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 9780 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 9840 atctgtctat ttcgttcatc catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa 9900 atctctgatg ttacattgca caagataaaa atatatcatc atgaacaata aaactgtctg 9960 cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa acgtcttgct 10020 cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg 10080 ataatgtcgg gcaatcaggt gcgacaatct atcgattgta tgggaagccc gatgcgccag 10140 agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca 10200 gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc 10260 ctgatgatgc atggttactc accactgcga tccccgggaa aacagcattc caggtattag 10320 aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt 10380 tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc 10440 aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta 10500 atggctggcc tgttgaacaa gtctggaaag aaatgcataa gcttttgcca ttctcaccgg 10560 attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat 10620 taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca 10680 tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat 10740 atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt 10800 tctaagggcg gcctgccacc atacccacgc cgaaacaagc gctcatgagc ccgaagtggc 10860 gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg 10920 cgccggtgat gagggcgcgc caagtcgacg tccggcagtc 10960 <210> 14 <211> 536 <212> PRT <213> Homo sapiens <400> 14 Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser 1 5 10 15 Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln 20 25 30 Ala Val Ser Trp Ala Ser Gly Ala Arg Pro Cys Ile Pro Lys Ser Phe 35 40 45 Gly Tyr Ser Ser Val Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser 50 55 60 Phe Asp Pro Pro Thr Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu 65 70 75 80 Ser Thr Arg Ser Gly Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln 85 90 95 Ala Asn His Thr Gly Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln 100 105 110 Lys Phe Gln Lys Val Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala 115 120 125 Ala Leu Asn Ile Leu Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu 130 135 140 Lys Ser Tyr Phe Ser Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val 145 150 155 160 Pro Met Ala Ser Cys Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp 165 170 175 Thr Pro Asp Asp Phe Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp 180 185 190 Thr Lys Leu Lys Ile Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln 195 200 205 Arg Pro Val Ser Leu Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu 210 215 220 Lys Thr Asn Gly Ala Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro 225 230 235 240 Gly Asp Ile Tyr His Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu 245 250 255 Asp Ala Tyr Ala Glu His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu 260 265 270 Asn Glu Pro Ser Ala Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu 275 280 285 Gly Phe Thr Pro Glu His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly 290 295 300 Pro Thr Leu Ala Asn Ser Thr His His Asn Val Arg Leu Leu Met Leu 305 310 315 320 Asp Asp Gln Arg Leu Leu Leu Pro His Trp Ala Lys Val Val Leu Thr 325 330 335 Asp Pro Glu Ala Ala Lys Tyr Val His Gly Ile Ala Val His Trp Tyr 340 345 350 Leu Asp Phe Leu Ala Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg 355 360 365 Leu Phe Pro Asn Thr Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser 370 375 380 Lys Phe Trp Glu Gln Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met 385 390 395 400 Gln Tyr Ser His Ser Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly 405 410 415 Trp Thr Asp Trp Asn Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp 420 425 430 Val Arg Asn Phe Val Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp 435 440 445 Thr Phe Tyr Lys Gln Pro Met Phe Tyr His Leu Gly His Phe Ser Lys 450 455 460 Phe Ile Pro Glu Gly Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys 465 470 475 480 Asn Asp Leu Asp Ala Val Ala Leu Met His Pro Asp Gly Ser Ala Val 485 490 495 Val Val Val Leu Asn Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys 500 505 510 Asp Pro Ala Val Gly Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile 515 520 525 His Thr Tyr Leu Trp Arg Arg Gln 530 535 <210> 15 <211> 1608 <212> DNA <213> Homo sapiens <400> 15 atggaattca gcagccccag cagagaggaa tgccccaagc ctctgagccg ggtgtcaatc 60 atggccggat ctctgacagg actgctgctg cttcaggccg tgtcttgggc ttctggcgct 120 agaccttgca tccccaagag cttcggctac agcagcgtcg tgtgcgtgtg caatgccacc 180 tactgcgaca gcttcgaccc tcctaccttt cctgctctgg gcaccttcag cagatacgag 240 agcaccagat ccggcagacg gatggaactg agcatgggac ccatccaggc caatcacaca 300 ggcactggcc tgctgctgac actgcagcct gagcagaaat tccagaaagt gaaaggcttc 360 ggcggagcca tgacagatgc cgccgctctg aatatcctgg ctctgtctcc accagctcag 420 aacctgctgc tcaagagcta cttcagcgag gaaggcatcg gctacaacat catcagagtg 480 cccatggcca gctgcgactt cagcatcagg acctacacct acgccgacac acccgacgat 540 ttccagctgc acaacttcag cctgcctgaa gaggacacca agctgaagat ccctctgatc 600 cacagagccc tgcagctggc acaaagaccc gtgtcactgc tggcctctcc atggacatct 660 cccacctggc tgaaaacaaa tggcgccgtg aatggcaagg gcagcctgaa aggccaacct 720 ggcgacatct accaccagac ctgggccaga tacttcgtga agttcctgga cgcctatgcc 780 gagcacaagc tgcagttttg ggccgtgaca gccgagaacg aaccttctgc tggactgctg 840 agcggctacc cctttcagtg cctgggcttt acacccgagc accagcggga ctttatcgcc 900 cgtgatctgg gacccacact ggccaatagc acccaccata atgtgcggct gctgatgctg 960 gacgaccaga gactgcttct gccccactgg gctaaagtgg tgctgacaga tcctgaggcc 1020 gccaaatacg tgcacggaat cgccgtgcac tggtatctgg actttctggc ccctgccaag 1080 gccacactgg gagagacaca cagactgttc cccaacacca tgctgttcgc cagcgaagcc 1140 tgtgtgggca gcaagttttg ggaacagagc gtgcggctcg gcagctggga tagaggcatg 1200 cagtacagcc acagcatcat caccaacctg ctgtaccacg tcgtcggctg gaccgactgg 1260 aatctggccc tgaatcctga aggcggccct aactgggtcc gaaacttcgt ggacagcccc 1320 atcatcgtgg acatcaccaa ggacaccttc tacaagcagc ccatgttcta ccacctggga 1380 cacttcagca agttcatccc cgagggctct cagcgcgttg gactggtggc ttcccagaag 1440 aacgatctgg acgccgtggc tctgatgcac cctgatggat ctgctgtggt ggtggtcctg 1500 aaccgcagca gcaaagatgt gcccctgacc atcaaggatc ccgccgtggg attcctggaa 1560 acaatcagcc ctggctactc catccacacc tacctgtggc gtagacag 1608 <210> 16 <211> 524 <212> PRT <213> Homo sapiens <400> 16 Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala 1 5 10 15 Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp 20 25 30 Cys Gln Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys 35 40 45 Leu Gln Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp 50 55 60 Ile Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn 65 70 75 80 Ala Thr Glu Glu Glu Ile Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp 85 90 95 Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu Ile Val Asp Ser 100 105 110 Tyr Leu Pro Val Ile Leu Asp Ile Ile Lys Gly Glu Met Ser Arg Pro 115 120 125 Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gln Lys His 130 135 140 Leu Ala Glu Leu Asn His Gln Lys Gln Leu Glu Ser Asn Lys Ile Pro 145 150 155 160 Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn Ile Pro 165 170 175 Leu Leu Leu Tyr Pro Gln Asp Gly Pro Arg Ser Lys Pro Gln Pro Lys 180 185 190 Asp Asn Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile 195 200 205 Gln Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu 210 215 220 His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile 225 230 235 240 Cys Lys Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met 245 250 255 Met His Met Gln Pro Lys Glu Ile Cys Ala Leu Val Gly Phe Cys Asp 260 265 270 Glu Val Lys Glu Met Pro Met Gln Thr Leu Val Pro Ala Lys Val Ala 275 280 285 Ser Lys Asn Val Ile Pro Ala Leu Glu Leu Val Glu Pro Ile Lys Lys 290 295 300 His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val Cys Glu Phe 305 310 315 320 Leu Val Lys Glu Val Thr Lys Leu Ile Asp Asn Asn Lys Thr Glu Lys 325 330 335 Glu Ile Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu Pro Lys Ser 340 345 350 Leu Ser Glu Glu Cys Gln Glu Val Val Asp Thr Tyr Gly Ser Ser Ile 355 360 365 Leu Ser Ile Leu Leu Glu Glu Val Ser Pro Glu Leu Val Cys Ser Met 370 375 380 Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr Val His Val 385 390 395 400 Thr Gln Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys Lys Leu Val 405 410 415 Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys Gln Glu Ile 420 425 430 Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp Pro Tyr Gln 435 440 445 Lys Gln Cys Asp Gln Phe Val Ala Glu Tyr Glu Pro Val Leu Ile Glu 450 455 460 Ile Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu Lys Ile Gly 465 470 475 480 Ala Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu Lys Cys Ile 485 490 495 Trp Gly Pro Ser Tyr Trp Cys Gln Asn Thr Glu Thr Ala Ala Gln Cys 500 505 510 Asn Ala Val Glu His Cys Lys Arg His Val Trp Asn 515 520 <210> 17 <211> 1572 <212> DNA <213> Homo sapiens <400> 17 atgtacgccc tgttcctgct ggccagcctg ctgggcgccg ccctggccgg ccccgtgctg 60 ggcctgaagg agtgcacccg cggcagcgcc gtgtggtgcc agaacgtgaa gaccgccagc 120 gactgcggcg ccgtgaagca ctgcctgcag accgtgtgga acaagcccac cgtgaagagc 180 ctgccctgcg acatctgcaa ggacgtggtg accgccgccg gcgacatgct gaaggacaac 240 gccaccgagg aggagatcct ggtgtacctg gagaagacct gcgactggct gcccaagccc 300 aacatgagcg ccagctgcaa ggagatcgtg gacagctacc tgcccgtgat cctggacatc 360 atcaagggcg agatgagccg ccccggcgag gtgtgcagcg ccctgaacct gtgcgagagc 420 ctgcagaagc acctggccga gctgaaccac cagaagcagc tggagagcaa caagatcccc 480 gagctggaca tgaccgaggt ggtggccccc ttcatggcca acatccccct gctgctgtac 540 ccccaggacg gcccccgcag caagccccag cccaaggaca acggcgacgt gtgccaggac 600 tgcatccaga tggtgaccga catccagacc gccgtgcgca ccaacagcac cttcgtgcag 660 gccctggtgg agcacgtgaa ggaggagtgc gaccgcctgg gccccggcat ggccgacatc 720 tgcaagaact acatcagcca gtacagcgag atcgccatcc agatgatgat gcacatgcag 780 cccaaggaga tctgcgccct ggtgggcttc tgcgacgagg tgaaggagat gcccatgcag 840 accctggtgc ccgccaaggt ggccagcaag aacgtgatcc ccgccctgga gctggtggag 900 cccatcaaga agcacgaggt gcccgccaag agcgacgtgt actgcgaggt gtgcgagttc 960 ctggtgaagg aggtgaccaa gctgatcgac aacaacaaga ccgagaagga gatcctggac 1020 gccttcgaca agatgtgcag caagctgccc aagagcctga gcgaggagtg ccaggaggtg 1080 gtggacacct acggcagcag catcctgagc atcctgctgg aggaggtgag ccccgagctg 1140 gtgtgcagca tgctgcacct gtgcagcggc acccgcctgc ccgccctgac cgtgcacgtg 1200 acccagccca aggacggcgg cttctgcgag gtgtgcaaga agctggtggg ctacctggac 1260 cgcaacctgg agaagaacag caccaagcag gagatcctgg ccgccctgga gaagggctgc 1320 agcttcctgc ccgaccccta ccagaagcag tgcgaccagt tcgtggccga gtacgagccc 1380 gtgctgatcg agatcctggt ggaggtgatg gaccccagct tcgtgtgcct gaagatcggc 1440 gcctgcccca gcgcccacaa gcccctgctg ggcaccgaga agtgcatctg gggccccagc 1500 tactggtgcc agaacaccga gaccgccgcc cagtgcaacg ccgtggagca ctgcaagcgc 1560 cacgtgtgga ac 1572 <210> 18 <211> 478 <212> PRT <213> Homo sapiens <400> 18 Met Gly Arg Cys Cys Phe Tyr Thr Ala Gly Thr Leu Ser Leu Leu Leu 1 5 10 15 Leu Val Thr Ser Val Thr Leu Leu Val Ala Arg Val Phe Gln Lys Ala 20 25 30 Val Asp Gln Ser Ile Glu Lys Lys Ile Val Leu Arg Asn Gly Thr Glu 35 40 45 Ala Phe Asp Ser Trp Glu Lys Pro Pro Leu Pro Val Tyr Thr Gln Phe 50 55 60 Tyr Phe Phe Asn Val Thr Asn Pro Glu Glu Ile Leu Arg Gly Glu Thr 65 70 75 80 Pro Arg Val Glu Glu Val Gly Pro Tyr Thr Tyr Arg Glu Leu Arg Asn 85 90 95 Lys Ala Asn Ile Gln Phe Gly Asp Asn Gly Thr Thr Ile Ser Ala Val 100 105 110 Ser Asn Lys Ala Tyr Val Phe Glu Arg Asp Gln Ser Val Gly Asp Pro 115 120 125 Lys Ile Asp Leu Ile Arg Thr Leu Asn Ile Pro Val Leu Thr Val Ile 130 135 140 Glu Trp Ser Gln Val His Phe Leu Arg Glu Ile Ile Glu Ala Met Leu 145 150 155 160 Lys Ala Tyr Gln Gln Lys Leu Phe Val Thr His Thr Val Asp Glu Leu 165 170 175 Leu Trp Gly Tyr Lys Asp Glu Ile Leu Ser Leu Ile His Val Phe Arg 180 185 190 Pro Asp Ile Ser Pro Tyr Phe Gly Leu Phe Tyr Glu Lys Asn Gly Thr 195 200 205 Asn Asp Gly Asp Tyr Val Phe Leu Thr Gly Glu Asp Ser Tyr Leu Asn 210 215 220 Phe Thr Lys Ile Val Glu Trp Asn Gly Lys Thr Ser Leu Asp Trp Trp 225 230 235 240 Ile Thr Asp Lys Cys Asn Met Ile Asn Gly Thr Asp Gly Asp Ser Phe 245 250 255 His Pro Leu Ile Thr Lys Asp Glu Val Leu Tyr Val Phe Pro Ser Asp 260 265 270 Phe Cys Arg Ser Val Tyr Ile Thr Phe Ser Asp Tyr Glu Ser Val Gln 275 280 285 Gly Leu Pro Ala Phe Arg Tyr Lys Val Pro Ala Glu Ile Leu Ala Asn 290 295 300 Thr Ser Asp Asn Ala Gly Phe Cys Ile Pro Glu Gly Asn Cys Leu Gly 305 310 315 320 Ser Gly Val Leu Asn Val Ser Ile Cys Lys Asn Gly Ala Pro Ile Ile 325 330 335 Met Ser Phe Pro His Phe Tyr Gln Ala Asp Glu Arg Phe Val Ser Ala 340 345 350 Ile Glu Gly Met His Pro Asn Gln Glu Asp His Glu Thr Phe Val Asp 355 360 365 Ile Asn Pro Leu Thr Gly Ile Ile Leu Lys Ala Ala Lys Arg Phe Gln 370 375 380 Ile Asn Ile Tyr Val Lys Lys Leu Asp Asp Phe Val Glu Thr Gly Asp 385 390 395 400 Ile Arg Thr Met Val Phe Pro Val Met Tyr Leu Asn Glu Ser Val His 405 410 415 Ile Asp Lys Glu Thr Ala Ser Arg Leu Lys Ser Met Ile Asn Thr Thr 420 425 430 Leu Ile Ile Thr Asn Ile Pro Tyr Ile Ile Met Ala Leu Gly Val Phe 435 440 445 Phe Gly Leu Val Phe Thr Trp Leu Ala Cys Lys Gly Gln Gly Ser Met 450 455 460 Asp Glu Gly Thr Ala Asp Glu Arg Ala Pro Leu Ile Arg Thr 465 470 475 <210> 19 <211> 1434 <212> DNA <213> Homo sapiens <400> 19 atgggccgct gctgcttcta caccgccggc accctgagcc tgctgctgct ggtgaccagc 60 gtgaccctgc tggtggcccg cgtgttccag aaggccgtgg accagagcat cgagaagaag 120 atcgtgctgc gcaacggcac cgaggccttc gacagctggg agaagccccc cctgcccgtg 180 tacacccagt tctacttctt caacgtgacc aaccccgagg agatcctgcg cggcgagacc 240 ccccgcgtgg aggaggtggg cccctacacc taccgcgagc tgcgcaacaa ggccaacatc 300 cagttcggcg acaacggcac caccatcagc gccgtgagca acaaggccta cgtgttcgag 360 cgcgaccaga gcgtgggcga ccccaagatc gacctgatcc gcaccctgaa catccccgtg 420 ctgaccgtga tcgagtggag ccaggtgcac ttcctgcgcg agatcatcga ggccatgctg 480 aaggcctacc agcagaagct gttcgtgacc cacaccgtgg acgagctgct gtggggctac 540 aaggacgaga tcctgagcct gatccacgtg ttccgccccg acatcagccc ctacttcggc 600 ctgttctacg agaagaacgg caccaacgac ggcgactacg tgttcctgac cggcgaggac 660 agctacctga acttcaccaa gatcgtggag tggaacggca agaccagcct ggactggtgg 720 atcaccgaca agtgcaacat gatcaacggc accgacggcg acagcttcca ccccctgatc 780 accaaggacg aggtgctgta cgtgttcccc agcgacttct gccgcagcgt gtacatcacc 840 ttcagcgact acgagagcgt gcagggcctg cccgccttcc gctacaaggt gcccgccgag 900 atcctggcca acaccagcga caacgccggc ttctgcatcc ccgagggcaa ctgcctgggc 960 agcggcgtgc tgaacgtgag catctgcaag aacggcgccc ccatcatcat gagcttcccc 1020 cacttctacc aggccgacga gcgcttcgtg agcgccatcg agggcatgca ccccaaccag 1080 gaggaccacg agaccttcgt ggacatcaac cccctgaccg gcatcatcct gaaggccgcc 1140 aagcgcttcc agatcaacat ctacgtgaag aagctggacg acttcgtgga gaccggcgac 1200 atccgcacca tggtgttccc cgtgatgtac ctgaacgaga gcgtgcacat cgacaaggag 1260 accgccagcc gcctgaagag catgatcaac accaccctga tcatcaccaa catcccctac 1320 atcatcatgg ccctgggcgt gttcttcggc ctggtgttca cctggctggc ctgcaagggc 1380 cagggcagca tggacgaggg caccgccgac gagcgcgccc ccctgatccg cacc 1434 <210> 20 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 20 tggaagactt cgagatacac tgt 23 <210> 21 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 21 acagtgtatc tcgaagtctt cca 23 <210> 22 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 22 tttagaaata agtggtagtc a 21 <210> 23 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 23 tgactaccac ttatttctaa a 21 <210> 24 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 24 agggtatcaa gactacgaa 19 <210> 25 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 25 ttcgtagtct tgataccct 19 <210> 26 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 26 tattagatct gatggccgc 19 <210> 27 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 27 ctccatcact aggggttcct 20 <210> 28 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 28 agctctgggt atttaagccc gagtgagcac gcagggtctc cattttgaag cgggaggtta 60 <210> 29 <211> 145 <212> DNA <213> Unknown <220> <223> AAV2 ITR <400> 29 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 30 <211> 927 <212> PRT <213> Homo sapiens <400> 30 Met Gly Thr Gln Asp Pro Gly Asn Met Gly Thr Gly Val Pro Ala Ser 1 5 10 15 Glu Gln Ile Ser Cys Ala Lys Glu Asp Pro Gln Val Tyr Cys Pro Glu 20 25 30 Glu Thr Gly Gly Thr Lys Asp Val Gln Val Thr Asp Cys Lys Ser Pro 35 40 45 Glu Asp Ser Arg Pro Pro Lys Glu Thr Asp Cys Cys Asn Pro Glu Asp 50 55 60 Ser Gly Gln Leu Met Val Ser Tyr Glu Gly Lys Ala Met Gly Tyr Gln 65 70 75 80 Val Pro Pro Phe Gly Trp Arg Ile Cys Leu Ala His Glu Phe Thr Glu 85 90 95 Lys Arg Lys Pro Phe Gln Ala Asn Asn Val Ser Leu Ser Asn Met Ile 100 105 110 Lys His Ile Gly Met Gly Leu Arg Tyr Leu Gln Trp Trp Tyr Arg Lys 115 120 125 Thr His Val Glu Lys Lys Thr Pro Phe Ile Asp Met Ile Asn Ser Val 130 135 140 Pro Leu Arg Gln Ile Tyr Gly Cys Pro Leu Gly Gly Ile Gly Gly Gly 145 150 155 160 Thr Ile Thr Arg Gly Trp Arg Gly Gln Phe Cys Arg Trp Gln Leu Asn 165 170 175 Pro Gly Met Tyr Gln His Arg Thr Val Ile Ala Asp Gln Phe Thr Val 180 185 190 Cys Leu Arg Arg Glu Gly Gln Thr Val Tyr Gln Gln Val Leu Ser Leu 195 200 205 Glu Arg Pro Ser Val Leu Arg Ser Trp Asn Trp Gly Leu Cys Gly Tyr 210 215 220 Phe Ala Phe Tyr His Ala Leu Tyr Pro Arg Ala Trp Thr Val Tyr Gln 225 230 235 240 Leu Pro Gly Gln Asn Val Thr Leu Thr Cys Arg Gln Ile Thr Pro Ile 245 250 255 Leu Pro His Asp Tyr Gln Asp Ser Ser Leu Pro Val Gly Val Phe Val 260 265 270 Trp Asp Val Glu Asn Glu Gly Asp Glu Ala Leu Asp Val Ser Ile Met 275 280 285 Phe Ser Met Arg Asn Gly Leu Gly Gly Gly Asp Asp Ala Pro Gly Gly 290 295 300 Leu Trp Asn Glu Pro Phe Cys Leu Glu Arg Ser Gly Glu Thr Val Arg 305 310 315 320 Gly Leu Leu Leu His His Pro Thr Leu Pro Asn Pro Tyr Thr Met Ala 325 330 335 Val Ala Ala Arg Val Thr Ala Ala Thr Thr Val Thr His Ile Thr Ala 340 345 350 Phe Asp Pro Asp Ser Thr Gly Gln Gln Val Trp Gln Asp Leu Leu Gln 355 360 365 Asp Gly Gln Leu Asp Ser Pro Thr Gly Gln Ser Thr Pro Thr Gln Lys 370 375 380 Gly Val Gly Ile Ala Gly Ala Val Cys Val Ser Ser Lys Leu Arg Pro 385 390 395 400 Arg Gly Gln Cys Arg Leu Glu Phe Ser Leu Ala Trp Asp Met Pro Arg 405 410 415 Ile Met Phe Gly Ala Lys Gly Gln Val His Tyr Arg Arg Tyr Thr Arg 420 425 430 Phe Phe Gly Gln Asp Gly Asp Ala Ala Pro Ala Leu Ser His Tyr Ala 435 440 445 Leu Cys Arg Tyr Ala Glu Trp Glu Glu Arg Ile Ser Ala Trp Gln Ser 450 455 460 Pro Val Leu Asp Asp Arg Ser Leu Pro Ala Trp Tyr Lys Ser Ala Leu 465 470 475 480 Phe Asn Glu Leu Tyr Phe Leu Ala Asp Gly Gly Thr Val Trp Leu Glu 485 490 495 Val Leu Glu Asp Ser Leu Pro Glu Glu Leu Gly Arg Asn Met Cys His 500 505 510 Leu Arg Pro Thr Leu Arg Asp Tyr Gly Arg Phe Gly Tyr Leu Glu Gly 515 520 525 Gln Glu Tyr Arg Met Tyr Asn Thr Tyr Asp Val His Phe Tyr Ala Ser 530 535 540 Phe Ala Leu Ile Met Leu Trp Pro Lys Leu Glu Leu Ser Leu Gln Tyr 545 550 555 560 Asp Met Ala Leu Ala Thr Leu Arg Glu Asp Leu Thr Arg Arg Arg Tyr 565 570 575 Leu Met Ser Gly Val Met Ala Pro Val Lys Arg Arg Asn Val Ile Pro 580 585 590 His Asp Ile Gly Asp Pro Asp Asp Glu Pro Trp Leu Arg Val Asn Ala 595 600 605 Tyr Leu Ile His Asp Thr Ala Asp Trp Lys Asp Leu Asn Leu Lys Phe 610 615 620 Val Leu Gln Val Tyr Arg Asp Tyr Tyr Leu Thr Gly Asp Gln Asn Phe 625 630 635 640 Leu Lys Asp Met Trp Pro Val Cys Leu Ala Val Met Glu Ser Glu Met 645 650 655 Lys Phe Asp Lys Asp His Asp Gly Leu Ile Glu Asn Gly Gly Tyr Ala 660 665 670 Asp Gln Thr Tyr Asp Gly Trp Val Thr Thr Gly Pro Ser Ala Tyr Cys 675 680 685 Gly Gly Leu Trp Leu Ala Ala Val Ala Val Met Val Gln Met Ala Ala 690 695 700 Leu Cys Gly Ala Gln Asp Ile Gln Asp Lys Phe Ser Ser Ile Leu Ser 705 710 715 720 Arg Gly Gln Glu Ala Tyr Glu Arg Leu Leu Trp Asn Gly Arg Tyr Tyr 725 730 735 Asn Tyr Asp Ser Ser Ser Arg Pro Gln Ser Arg Ser Val Met Ser Asp 740 745 750 Gln Cys Ala Gly Gln Trp Phe Leu Lys Ala Cys Gly Leu Gly Glu Gly 755 760 765 Asp Thr Glu Val Phe Pro Thr Gln His Val Val Arg Ala Leu Gln Thr 770 775 780 Ile Phe Glu Leu Asn Val Gln Ala Phe Ala Gly Gly Ala Met Gly Ala 785 790 795 800 Val Asn Gly Met Gln Pro His Gly Val Pro Asp Lys Ser Ser Val Gln 805 810 815 Ser Asp Glu Val Trp Val Gly Val Val Tyr Gly Leu Ala Ala Thr Met 820 825 830 Ile Gln Glu Gly Leu Thr Trp Glu Gly Phe Gln Thr Ala Glu Gly Cys 835 840 845 Tyr Arg Thr Val Trp Glu Arg Leu Gly Leu Ala Phe Gln Thr Pro Glu 850 855 860 Ala Tyr Cys Gln Gln Arg Val Phe Arg Ser Leu Ala Tyr Met Arg Pro 865 870 875 880 Leu Ser Ile Trp Ala Met Gln Leu Ala Leu Gln Gln Gln Gln His Lys 885 890 895 Lys Ala Ser Trp Pro Lys Val Lys Gln Gly Thr Gly Leu Arg Thr Gly 900 905 910 Pro Met Phe Gly Pro Lys Glu Ala Met Ala Asn Leu Ser Pro Glu 915 920 925 <210> 31 <211> 2781 <212> DNA <213> Homo sapiens <400> 31 atgggcaccc aggaccccgg caacatgggc accggcgtgc ccgccagcga gcagatcagc 60 tgcgccaagg aggaccccca ggtgtactgc cccgaggaga ccggcggcac caaggacgtg 120 caggtgaccg actgcaagag ccccgaggac agccgccccc ccaaggagac cgactgctgc 180 aaccccgagg acagcggcca gctgatggtg agctacgagg gcaaggccat gggctaccag 240 gtgcccccct tcggctggcg catctgcctg gcccacgagt tcaccgagaa gcgcaagccc 300 ttccaggcca acaacgtgag cctgagcaac atgatcaagc acatcggcat gggcctgcgc 360 tacctgcagt ggtggtaccg caagacccac gtggagaaga agaccccctt catcgacatg 420 atcaacagcg tgcccctgcg ccagatctac ggctgccccc tgggcggcat cggcggcggc 480 accatcaccc gcggctggcg cggccagttc tgccgctggc agctgaaccc cggcatgtac 540 cagcaccgca ccgtgatcgc cgaccagttc accgtgtgcc tgcgccgcga gggccagacc 600 gtgtaccagc aggtgctgag cctggagcgc cccagcgtgc tgcgcagctg gaactggggc 660 ctgtgcggct acttcgcctt ctaccacgcc ctgtaccccc gcgcctggac cgtgtaccag 720 ctgcccggcc agaacgtgac cctgacctgc cgccagatca cccccatcct gccccacgac 780 taccaggaca gcagcctgcc cgtgggcgtg ttcgtgtggg acgtggagaa cgagggcgac 840 gaggccctgg acgtgagcat catgttcagc atgcgcaacg gcctgggcgg cggcgacgac 900 gcccccggcg gcctgtggaa cgagcccttc tgcctggagc gcagcggcga gaccgtgcgc 960 ggcctgctgc tgcaccaccc caccctgccc aacccctaca ccatggccgt ggccgcccgc 1020 gtgaccgccg ccaccaccgt gacccacatc accgccttcg accccgacag caccggccag 1080 caggtgtggc aggacctgct gcaggacggc cagctggaca gccccaccgg ccagagcacc 1140 cccacccaga agggcgtggg catcgccggc gccgtgtgcg tgagcagcaa gctgcgcccc 1200 cgcggccagt gccgcctgga gttcagcctg gcctgggaca tgccccgcat catgttcggc 1260 gccaagggcc aggtgcacta ccgccgctac acccgcttct tcggccagga cggcgacgcc 1320 gcccccgccc tgagccacta cgccctgtgc cgctacgccg agtgggagga gcgcatcagc 1380 gcctggcaga gccccgtgct ggacgaccgc agcctgcccg cctggtacaa gagcgccctg 1440 ttcaacgagc tgtacttcct ggccgacggc ggcaccgtgt ggctggaggt gctggaggac 1500 agcctgcccg aggagctggg ccgcaacatg tgccacctgc gccccaccct gcgcgactac 1560 ggccgcttcg gctacctgga gggccaggag taccgcatgt acaacaccta cgacgtgcac 1620 ttctacgcca gcttcgccct gatcatgctg tggcccaagc tggagctgag cctgcagtac 1680 gacatggccc tggccaccct gcgcgaggac ctgacccgcc gccgctacct gatgagcggc 1740 gtgatggccc ccgtgaagcg ccgcaacgtg atcccccacg acatcggcga ccccgacgac 1800 gagccctggc tgcgcgtgaa cgcctacctg atccacgaca ccgccgactg gaaggacctg 1860 aacctgaagt tcgtgctgca ggtgtaccgc gactactacc tgaccggcga ccagaacttc 1920 ctgaaggaca tgtggcccgt gtgcctggcc gtgatggaga gcgagatgaa gttcgacaag 1980 gaccacgacg gcctgatcga gaacggcggc tacgccgacc agacctacga cggctgggtg 2040 accaccggcc ccagcgccta ctgcggcggc ctgtggctgg ccgccgtggc cgtgatggtg 2100 cagatggccg ccctgtgcgg cgcccaggac atccaggaca agttcagcag catcctgagc 2160 cgcggccagg aggcctacga gcgcctgctg tggaacggcc gctactacaa ctacgacagc 2220 agcagccgcc cccagagccg cagcgtgatg agcgaccagt gcgccggcca gtggttcctg 2280 aaggcctgcg gcctgggcga gggcgacacc gaggtgttcc ccacccagca cgtggtgcgc 2340 gccctgcaga ccatcttcga gctgaacgtg caggccttcg ccggcggcgc catgggcgcc 2400 gtgaacggca tgcagcccca cggcgtgccc gacaagagca gcgtgcagag cgacgaggtg 2460 tgggtgggcg tggtgtacgg cctggccgcc accatgatcc aggagggcct gacctgggag 2520 ggcttccaga ccgccgaggg ctgctaccgc accgtgtggg agcgcctggg cctggccttc 2580 cagacccccg aggcctactg ccagcagcgc gtgttccgca gcctggccta catgcgcccc 2640 ctgagcatct gggccatgca gctggccctg cagcagcagc agcacaagaa ggccagctgg 2700 cccaaggtga agcagggcac cggcctgcgc accggcccca tgttcggccc caaggaggcc 2760 atggccaacc tgagccccga g 2781 <210> 32 <211> 11264 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 32 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agtaagtcac 300 tgactgtcta tgcctgggaa agggtgggca ggagatgggg cagtgcagga aaagtggcac 360 tatgaaccct cctggtggcg aggggagggg ggtggtcctc gaacgccttg cagaactggc 420 ctggatacag agtggaccgg ctggccccat ctggaagact tcgagataca ctgttgtctt 480 actgcgctca acagtgtatc tcgaagtctt ccaaatggtg ccagccatcg cagcggggtg 540 caggaaatgg gggcagcccc cctttttggc tatccttcca cgtgttcttt tttgtatctt 600 ttgtgtttcc tagaaaacat ctcagtcacc accgcagccc taggaatgca tctagacaat 660 tgtactaacc ttcttctctt tcctctcctg acagtccgga aagccaccat gggcacccag 720 gaccccggca acatgggcac cggcgtgccc gccagcgagc agatcagctg cgccaaggag 780 gacccccagg tgtactgccc cgaggagacc ggcggcacca aggacgtgca ggtgaccgac 840 tgcaagagcc ccgaggacag ccgccccccc aaggagaccg actgctgcaa ccccgaggac 900 agcggccagc tgatggtgag ctacgagggc aaggccatgg gctaccaggt gccccccttc 960 ggctggcgca tctgcctggc ccacgagttc accgagaagc gcaagccctt ccaggccaac 1020 aacgtgagcc tgagcaacat gatcaagcac atcggcatgg gcctgcgcta cctgcagtgg 1080 tggtaccgca agacccacgt ggagaagaag acccccttca tcgacatgat caacagcgtg 1140 cccctgcgcc agatctacgg ctgccccctg ggcggcatcg gcggcggcac catcacccgc 1200 ggctggcgcg gccagttctg ccgctggcag ctgaaccccg gcatgtacca gcaccgcacc 1260 gtgatcgccg accagttcac cgtgtgcctg cgccgcgagg gccagaccgt gtaccagcag 1320 gtgctgagcc tggagcgccc cagcgtgctg cgcagctgga actggggcct gtgcggctac 1380 ttcgccttct accacgccct gtacccccgc gcctggaccg tgtaccagct gcccggccag 1440 aacgtgaccc tgacctgccg ccagatcacc cccatcctgc cccacgacta ccaggacagc 1500 agcctgcccg tgggcgtgtt cgtgtgggac gtggagaacg agggcgacga ggccctggac 1560 gtgagcatca tgttcagcat gcgcaacggc ctgggcggcg gcgacgacgc ccccggcggc 1620 ctgtggaacg agcccttctg cctggagcgc agcggcgaga ccgtgcgcgg cctgctgctg 1680 caccacccca ccctgcccaa cccctacacc atggccgtgg ccgcccgcgt gaccgccgcc 1740 accaccgtga cccacatcac cgccttcgac cccgacagca ccggccagca ggtgtggcag 1800 gacctgctgc aggacggcca gctggacagc cccaccggcc agagcacccc cacccagaag 1860 ggcgtgggca tcgccggcgc cgtgtgcgtg agcagcaagc tgcgcccccg cggccagtgc 1920 cgcctggagt tcagcctggc ctgggacatg ccccgcatca tgttcggcgc caagggccag 1980 gtgcactacc gccgctacac ccgcttcttc ggccaggacg gcgacgccgc ccccgccctg 2040 agccactacg ccctgtgccg ctacgccgag tgggaggagc gcatcagcgc ctggcagagc 2100 cccgtgctgg acgaccgcag cctgcccgcc tggtacaaga gcgccctgtt caacgagctg 2160 tacttcctgg ccgacggcgg caccgtgtgg ctggaggtgc tggaggacag cctgcccgag 2220 gagctgggcc gcaacatgtg ccacctgcgc cccaccctgc gcgactacgg ccgcttcggc 2280 tacctggagg gccaggagta ccgcatgtac aacacctacg acgtgcactt ctacgccagc 2340 ttcgccctga tcatgctgtg gcccaagctg gagctgagcc tgcagtacga catggccctg 2400 gccaccctgc gcgaggacct gacccgccgc cgctacctga tgagcggcgt gatggccccc 2460 gtgaagcgcc gcaacgtgat cccccacgac atcggcgacc ccgacgacga gccctggctg 2520 cgcgtgaacg cctacctgat ccacgacacc gccgactgga aggacctgaa cctgaagttc 2580 gtgctgcagg tgtaccgcga ctactacctg accggcgacc agaacttcct gaaggacatg 2640 tggcccgtgt gcctggccgt gatggagagc gagatgaagt tcgacaagga ccacgacggc 2700 ctgatcgaga acggcggcta cgccgaccag acctacgacg gctgggtgac caccggcccc 2760 agcgcctact gcggcggcct gtggctggcc gccgtggccg tgatggtgca gatggccgcc 2820 ctgtgcggcg cccaggacat ccaggacaag ttcagcagca tcctgagccg cggccaggag 2880 gcctacgagc gcctgctgtg gaacggccgc tactacaact acgacagcag cagccgcccc 2940 cagagccgca gcgtgatgag cgaccagtgc gccggccagt ggttcctgaa ggcctgcggc 3000 ctgggcgagg gcgacaccga ggtgttcccc acccagcacg tggtgcgcgc cctgcagacc 3060 atcttcgagc tgaacgtgca ggccttcgcc ggcggcgcca tgggcgccgt gaacggcatg 3120 cagccccacg gcgtgcccga caagagcagc gtgcagagcg acgaggtgtg ggtgggcgtg 3180 gtgtacggcc tggccgccac catgatccag gagggcctga cctgggaggg cttccagacc 3240 gccgagggct gctaccgcac cgtgtgggag cgcctgggcc tggccttcca gacccccgag 3300 gcctactgcc agcagcgcgt gttccgcagc ctggcctaca tgcgccccct gagcatctgg 3360 gccatgcagc tggccctgca gcagcagcag cacaagaagg ccagctggcc caaggtgaag 3420 cagggcaccg gcctgcgcac cggccccatg ttcggcccca aggaggccat ggccaacctg 3480 agccccgagt gacaattgtt aattaagttt aaaccctcga ggccgcaagc ttatcgataa 3540 tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 3600 ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 3660 ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 3720 gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 3780 ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 3840 tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 3900 gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 3960 ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 4020 tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 4080 ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcatc gataccgtcg 4140 actagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 4200 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 4260 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 4320 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggagagatcc 4380 acgataacaa acagcttttt tggggtgaac atattgactg aattccctgc aggttggcca 4440 ctccctctct gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg 4500 cgacctttgg tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact 4560 ccatcactag gggttcctgc ggccgctcgt acggtctcga ggaattcctg caggataact 4620 tgccaacctc attctaaaat gtatatagaa gcccaaaaga caataacaaa aatattcttg 4680 tagaacaaaa tgggaaagaa tgttccacta aatatcaaga tttagagcaa agcatgagat 4740 gtgtggggat agacagtgag gctgataaaa tagagtagag ctcagaaaca gacccattga 4800 tatatgtaag tgacctatga aaaaaatatg gcattttaca atgggaaaat gatggtcttt 4860 ttctttttta gaaaaacagg gaaatatatt tatatgtaaa aaataaaagg gaacccatat 4920 gtcataccat acacacaaaa aaattccagt gaattataag tctaaatgga gaaggcaaaa 4980 ctttaaatct tttagaaaat aatatagaag catgcagacc agcctggcca acatgatgaa 5040 accctctcta ctaataataa aatcagtaga actactcagg actactttga gtgggaagtc 5100 cttttctatg aagacttctt tggccaaaat taggctctaa atgcaaggag atagtgcatc 5160 atgcctggct gcacttactg ataaatgatg ttatcaccat ctttaaccaa atgcacagga 5220 acaagttatg gtactgatgt gctggattga gaaggagctc tacttccttg acaggacaca 5280 tttgtatcaa cttaaaaaag cagatttttg ccagcagaac tattcattca gaggtaggaa 5340 acttagaata gatgatgtca ctgattagca tggcttcccc atctccacag ctgcttccca 5400 cccaggttgc ccacagttga gtttgtccag tgctcagggc tgcccactct cagtaagaag 5460 ccccacacca gcccctctcc aaatatgttg gctgttcctt ccattaaagt gaccccactt 5520 tagagcagca agtggatttc tgtttcttac agttcaggaa ggaggagtca gctgtgagaa 5580 cctggagcct gagatgcttc taagtcccac tgctactggg gtcagggaag ccagactcca 5640 gcatcagcag tcaggagcac taagcccttg ccaacatcct gtttctcaga gaaactgctt 5700 ccattataat ggttgtcctt ttttaagcta tcaagccaaa caaccagtgt ctaccattat 5760 tctcatcacc tgaagccaag ggttctagca aaagtcaagc tgtcttgtaa tggttgatgt 5820 gcctccagct tctgtcttca gtcactccac tcttagcctg ctctgaatca actctgacca 5880 cagttccctg gagcccctgc cacctgctgc ccctgccacc ttctccatct gcagtgctgt 5940 gcagccttct gcactcttgc agagctaata ggtggagact tgaaggaaga ggaggaaagt 6000 ttctcataat agccttgctg caagctcaaa tgggaggtgg gcactgtgcc caggagcctt 6060 ggagcaaagg ctgtgcccaa cctctgactg catccaggtt tggtcttgac agagataaga 6120 agccctggct tttggagcca aaatctaggt cagacttagg caggattctc aaagtttatc 6180 agcagaacat gaggcagaag accctttctg ctccagcttc ttcaggctca accttcatca 6240 gaatagatag aaagagaggc tgtgagggtt cttaaaacag aagcaaatct gactcagaga 6300 ataaacaacc tcctagtaaa ctacagctta gacagagcat ctggtggtga gtgtgctcag 6360 tgtcctactc aactgtctgg tatcagccct catgaggact tctcttcttt ccctcataga 6420 cctccatctc tgttttcctt agcctgcaga aatctggatg gctattcaca gaatgcctgt 6480 gctttcagag ttgcattttt tctctggtat tctggttcaa gcatttgaag gtaggaaagg 6540 ttctccaagt gcaagaaagc cagccctgag cctcaactgc ctggctagtg tggtcagtag 6600 gatgcaaagg ctgttgaatg ccacaaggcc aaactttaac ctgtgtacca caagcctagc 6660 agcagaggca gctctgctca ctggaactct ctgtcttctt tctcctgagc cttttctttt 6720 cctgagtttt ctagctctcc tcaaccttac ctctgcccta cccaggacaa acccaagagc 6780 cactgtttct gtgatgtcct ctccagccct aattaggcat catgacttca gcctgacctt 6840 ccatgctcag aagcagtgct aatccacttc agatgagctg ctctatgcaa cacaggcaga 6900 gcctacaaac ctttgcacca gagccctcca catatcagtg tttgttcata ctcacttcaa 6960 cagcaaatgt gactgctgag attaagattt tacacaagat ggtctgtaat ttcacagtta 7020 gttttatccc attaggtatg aaagaattag cataattccc cttaaacatg aatgaatctt 7080 agatttttta ataaatagtt ttggaagtaa agacagagac atcaggagca caaggaatag 7140 cctgagagga caaacagaac aagaaagagt ctggaaatac acaggatgtt cttggcctcc 7200 tcaaagcaag tgcaagcaga tagtaccagc agccccaggc tatcagagcc cagtgaagag 7260 aagtaccatg aaagccacag ctctaaccac cctgttccag agtgacagac agtccccaag 7320 acaagccagc ctgagccaga gagagaactg caagagaaag tttctaattt aggttctgtt 7380 agattcagac aagtgcaggt catcctctct ccacagctac tcacctctcc agcctaacaa 7440 agcctgcagt ccacactcca accctggtgt ctcacctcct agcctctccc aacatcctgc 7500 tctctgacca tcttctgcat ctctcatctc accatctccc actgtctaca gcctactctt 7560 gcaactacca tctcattttc tgacatcctg tctacatctt ctgccatact ctgccatcta 7620 ccataccacc tcttaccatc taccacacca tcttttatct ccatccctct cagaagcctc 7680 caagctgaat cctgctttat gtgttcatct cagcccctgc atggaaagct gaccccagag 7740 gcagaactat tcccagagag cttggccaag aaaaacaaaa ctaccagcct ggccaggctc 7800 aggagtagta agctgcagtg tctgttgtgt tctagcttca acagctgcag gagttccact 7860 ctcaaatgct ccacatttct cacatcctcc tgattctggt cactacccat cttcaaagaa 7920 cagaatatct cacatcagca tactgtgaag gactagtcat gggtgcagct gctcagagct 7980 gcaaagtcat tctggatggt ggagagctta caaacatttc atgatgctcc ccccgctctg 8040 atggctggag cccaatccct acacagactc ctgctgtatg tgttttcctt tcactctgag 8100 ccacagccag agggcaggca ttcagtctcc tcttcaggct ggggctgggg cactgagaac 8160 tcacccaaca ccttgctctc actccttctg caaaacaaga aagagctttg tgctgcagta 8220 gccatgaaga atgaaaggaa ggctttaact aaaaaatgtc agagattatt ttcaacccct 8280 tactgtggat caccagcaag gaggaaacac aacacagaga cattttttcc cctcaaatta 8340 tcaaaagaat cactgcattt gttaaagaga gcaactgaat caggaagcag agttttgaac 8400 atatcagaag ttaggaatct gcatcagaga caaatgcagt catggttgtt tgctgcatac 8460 cagccctaat cattagaagc ctcatggact tcaaacatca ttccctctga caagatgctc 8520 tagcctaact ccatgagata aaataaatct gcctttcaga gccaaagaag agtccaccag 8580 cttcttctca gtgtgaacaa gagctccagt caggttagtc agtccagtgc agtagaggag 8640 accagtctgc atcctctaat tttcaaaggc aagaagattt gtttaccctg gacaccaggc 8700 acaagtgagg tcacagagct cttagatatg cagtcctcat gagtgaggag actaaagcgc 8760 atgccatcaa gacttcagtg tagagaaaac ctccaaaaaa gcctcctcac tacttctgga 8820 atagctcaga ggccgaggcg gcctcggcct ctgcataaat aaaaaaaatt agtcagccat 8880 ggggcggaga atgggcggaa ctgggcggag ttaggggcgg gatgggcgga gttaggggcg 8940 ggactatggt tgctgactaa ttgagatgca tgctttgcat acttctgcct gctggggagc 9000 ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc atacttctgc 9060 ctgctgggga gcctggggac tttccacacc ctaactgaca cacattccac agctgcatta 9120 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 9180 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 9240 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 9300 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9360 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 9420 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9480 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 9540 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9600 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9660 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9720 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9780 cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9840 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9900 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9960 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 10020 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 10080 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 10140 agcgatctgt ctatttcgtt catccatagt tgcctgactc ctgcaaacca cgttgtgtct 10200 caaaatctct gatgttacat tgcacaagat aaaaatatat catcatgaac aataaaactg 10260 tctgcttaca taaacagtaa tacaaggggt gttatgagcc atattcaacg ggaaacgtct 10320 tgctcgaggc cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct 10380 cgcgataatg tcgggcaatc aggtgcgaca atctatcgat tgtatgggaa gcccgatgcg 10440 ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg 10500 gtcagactaa actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt 10560 actcctgatg atgcatggtt actcaccact gcgatccccg ggaaaacagc attccaggta 10620 ttagaagaat atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc 10680 cggttgcatt cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc 10740 gctcaggcgc aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag 10800 cgtaatggct ggcctgttga acaagtctgg aaagaaatgc ataagctttt gccattctca 10860 ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg 10920 aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt 10980 gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa 11040 aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag 11100 tttttctaag ggcggcctgc caccataccc acgccgaaac aagcgctcat gagcccgaag 11160 tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc aaccgcacct 11220 gtggcgccgg tgatgagggc gcgccaagtc gacgtccggc agtc 11264 <210> 33 <211> 685 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 33 Met Ala Glu Trp Leu Leu Ser Ala Ser Trp Gln Arg Arg Ala Lys Ala 1 5 10 15 Met Thr Ala Ala Ala Gly Ser Ala Gly Arg Ala Ala Val Pro Leu Leu 20 25 30 Leu Cys Ala Leu Leu Ala Pro Gly Gly Ala Tyr Val Leu Asp Asp Ser 35 40 45 Asp Gly Leu Gly Arg Glu Phe Asp Gly Ile Gly Ala Val Ser Gly Gly 50 55 60 Gly Ala Thr Ser Arg Leu Leu Val Asn Tyr Pro Glu Pro Tyr Arg Ser 65 70 75 80 Gln Ile Leu Asp Tyr Leu Phe Lys Pro Asn Phe Gly Ala Ser Leu His 85 90 95 Ile Leu Lys Val Glu Ile Gly Gly Asp Gly Gln Thr Thr Asp Gly Thr 100 105 110 Glu Pro Ser His Met His Tyr Ala Leu Asp Glu Asn Tyr Phe Arg Gly 115 120 125 Tyr Glu Trp Trp Leu Met Lys Glu Ala Lys Lys Arg Asn Pro Asn Ile 130 135 140 Thr Leu Ile Gly Leu Pro Trp Ser Phe Pro Gly Trp Leu Gly Lys Gly 145 150 155 160 Phe Asp Trp Pro Tyr Val Asn Leu Gln Leu Thr Ala Tyr Tyr Val Val 165 170 175 Thr Trp Ile Val Gly Ala Lys Arg Tyr His Asp Leu Asp Ile Asp Tyr 180 185 190 Ile Gly Ile Trp Asn Glu Arg Ser Tyr Asn Ala Asn Tyr Ile Lys Ile 195 200 205 Leu Arg Lys Met Leu Asn Tyr Gln Gly Leu Gln Arg Val Lys Ile Ile 210 215 220 Ala Ser Asp Asn Leu Trp Glu Ser Ile Ser Ala Ser Met Leu Leu Asp 225 230 235 240 Ala Glu Leu Phe Lys Val Val Asp Val Ile Gly Ala His Tyr Pro Gly 245 250 255 Thr His Ser Ala Lys Asp Ala Lys Leu Thr Gly Lys Lys Leu Trp Ser 260 265 270 Ser Glu Asp Phe Ser Thr Leu Asn Ser Asp Met Gly Ala Gly Cys Trp 275 280 285 Gly Arg Ile Leu Asn Gln Asn Tyr Ile Asn Gly Tyr Met Thr Ser Thr 290 295 300 Ile Ala Trp Asn Leu Val Ala Ser Tyr Tyr Glu Gln Leu Pro Tyr Gly 305 310 315 320 Arg Cys Gly Leu Met Thr Ala Gln Glu Pro Trp Ser Gly His Tyr Val 325 330 335 Val Glu Ser Pro Val Trp Val Ser Ala His Thr Thr Gln Phe Thr Gln 340 345 350 Pro Gly Trp Tyr Tyr Leu Lys Thr Val Gly His Leu Glu Lys Gly Gly 355 360 365 Ser Tyr Val Ala Leu Thr Asp Gly Leu Gly Asn Leu Thr Ile Ile Ile 370 375 380 Glu Thr Met Ser His Lys His Ser Lys Cys Ile Arg Pro Phe Leu Pro 385 390 395 400 Tyr Phe Asn Val Ser Gln Gln Phe Ala Thr Phe Val Leu Lys Gly Ser 405 410 415 Phe Ser Glu Ile Pro Glu Leu Gln Val Trp Tyr Thr Lys Leu Gly Lys 420 425 430 Thr Ser Glu Arg Phe Leu Phe Lys Gln Leu Asp Ser Leu Trp Leu Leu 435 440 445 Asp Ser Asp Gly Ser Phe Thr Leu Ser Leu His Glu Asp Glu Leu Phe 450 455 460 Thr Leu Thr Thr Leu Thr Thr Gly Arg Lys Gly Ser Tyr Pro Leu Pro 465 470 475 480 Pro Lys Ser Gln Pro Phe Pro Ser Thr Tyr Lys Asp Asp Phe Asn Val 485 490 495 Asp Tyr Pro Phe Phe Ser Glu Ala Pro Asn Phe Ala Asp Gln Thr Gly 500 505 510 Val Phe Glu Tyr Phe Thr Asn Ile Glu Asp Pro Gly Glu His His Phe 515 520 525 Thr Leu Arg Gln Val Leu Asn Gln Arg Pro Ile Thr Trp Ala Ala Asp 530 535 540 Ala Ser Asn Thr Ile Ser Ile Ile Gly Asp Tyr Asn Trp Thr Asn Leu 545 550 555 560 Thr Ile Lys Cys Asp Val Tyr Ile Glu Thr Pro Asp Thr Gly Gly Val 565 570 575 Phe Ile Ala Gly Arg Val Asn Lys Gly Gly Ile Leu Ile Arg Ser Ala 580 585 590 Arg Gly Ile Phe Phe Trp Ile Phe Ala Asn Gly Ser Tyr Arg Val Thr 595 600 605 Gly Asp Leu Ala Gly Trp Ile Ile Tyr Ala Leu Gly Arg Val Glu Val 610 615 620 Thr Ala Lys Lys Trp Tyr Thr Leu Thr Leu Thr Ile Lys Gly His Phe 625 630 635 640 Thr Ser Gly Met Leu Asn Asp Lys Ser Leu Trp Thr Asp Ile Pro Val 645 650 655 Asn Phe Pro Lys Asn Gly Trp Ala Ala Ile Gly Thr His Ser Phe Glu 660 665 670 Phe Ala Gln Phe Asp Asn Phe Leu Val Glu Ala Thr Arg 675 680 685 <210> 34 <211> 2055 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 34 atggccgagt ggctgctgag cgccagctgg cagcgccgcg ccaaggccat gaccgccgcc 60 gccggcagcg ccggccgcgc cgccgtgccc ctgctgctgt gcgccctgct ggcccccggc 120 ggcgcctacg tgctggacga cagcgacggc ctgggccgcg agttcgacgg catcggcgcc 180 gtgagcggcg gcggcgccac cagccgcctg ctggtgaact accccgagcc ctaccgcagc 240 cagatcctgg actacctgtt caagcccaac ttcggcgcca gcctgcacat cctgaaggtg 300 gagatcggcg gcgacggcca gaccaccgac ggcaccgagc ccagccacat gcactacgcc 360 ctggacgaga actacttccg cggctacgag tggtggctga tgaaggaggc caagaagcgc 420 aaccccaaca tcaccctgat cggcctgccc tggagcttcc ccggctggct gggcaagggc 480 ttcgactggc cctacgtgaa cctgcagctg accgcctact acgtggtgac ctggatcgtg 540 ggcgccaagc gctaccacga cctggacatc gactacatcg gcatctggaa cgagcgcagc 600 tacaacgcca actacatcaa gatcctgcgc aagatgctga actaccaggg cctgcagcgc 660 gtgaagatca tcgccagcga caacctgtgg gagagcatca gcgccagcat gctgctggac 720 gccgagctgt tcaaggtggt ggacgtgatc ggcgcccact accccggcac ccacagcgcc 780 aaggacgcca agctgaccgg caagaagctg tggagcagcg aggacttcag caccctgaac 840 agcgacatgg gcgccggctg ctggggccgc atcctgaacc agaactacat caacggctac 900 atgaccagca ccatcgcctg gaacctggtg gccagctact acgagcagct gccctacggc 960 cgctgcggcc tgatgaccgc ccaggagccc tggagcggcc actacgtggt ggagagcccc 1020 gtgtgggtga gcgcccacac cacccagttc acccagcccg gctggtacta cctgaagacc 1080 gtgggccacc tggagaaggg cggcagctac gtggccctga ccgacggcct gggcaacctg 1140 accatcatca tcgagaccat gagccacaag cacagcaagt gcatccgccc cttcctgccc 1200 tacttcaacg tgagccagca gttcgccacc ttcgtgctga agggcagctt cagcgagatc 1260 cccgagctgc aggtgtggta caccaagctg ggcaagacca gcgagcgctt cctgttcaag 1320 cagctggaca gcctgtggct gctggacagc gacggcagct tcaccctgag cctgcacgag 1380 gacgagctgt tcaccctgac caccctgacc accggccgca agggcagcta ccccctgccc 1440 cccaagagcc agcccttccc cagcacctac aaggacgact tcaacgtgga ctaccccttc 1500 ttcagcgagg cccccaactt cgccgaccag accggcgtgt tcgagtactt caccaacatc 1560 gaggaccccg gcgagcacca cttcaccctg cgccaggtgc tgaaccagcg ccccatcacc 1620 tgggccgccg acgccagcaa caccatcagc atcatcggcg actacaactg gaccaacctg 1680 accatcaagt gcgacgtgta catcgagacc cccgacaccg gcggcgtgtt catcgccggc 1740 cgcgtgaaca agggcggcat cctgatccgc agcgcccgcg gcatcttctt ctggatcttc 1800 gccaacggca gctaccgcgt gaccggcgac ctggccggct ggatcatcta cgccctgggc 1860 cgcgtggagg tgaccgccaa gaagtggtac accctgaccc tgaccatcaa gggccacttc 1920 accagcggca tgctgaacga caagagcctg tggaccgaca tccccgtgaa cttccccaag 1980 aacggctggg ccgccatcgg cacccacagc ttcgagttcg cccagttcga caacttcctg 2040 gtggaggcca cccgc 2055 <210> 35 <211> 339 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 35 Met Trp Gln Leu Trp Ala Ser Leu Cys Cys Leu Leu Val Leu Ala Asn 1 5 10 15 Ala Arg Ser Arg Pro Ser Phe His Pro Leu Ser Asp Glu Leu Val Asn 20 25 30 Tyr Val Asn Lys Arg Asn Thr Thr Trp Gln Ala Gly His Asn Phe Tyr 35 40 45 Asn Val Asp Met Ser Tyr Leu Lys Arg Leu Cys Gly Thr Phe Leu Gly 50 55 60 Gly Pro Lys Pro Pro Gln Arg Val Met Phe Thr Glu Asp Leu Lys Leu 65 70 75 80 Pro Ala Ser Phe Asp Ala Arg Glu Gln Trp Pro Gln Cys Pro Thr Ile 85 90 95 Lys Glu Ile Arg Asp Gln Gly Ser Cys Gly Ser Cys Trp Ala Phe Gly 100 105 110 Ala Val Glu Ala Ile Ser Asp Arg Ile Cys Ile His Thr Asn Ala His 115 120 125 Val Ser Val Glu Val Ser Ala Glu Asp Leu Leu Thr Cys Cys Gly Ser 130 135 140 Met Cys Gly Asp Gly Cys Asn Gly Gly Tyr Pro Ala Glu Ala Trp Asn 145 150 155 160 Phe Trp Thr Arg Lys Gly Leu Val Ser Gly Gly Leu Tyr Glu Ser His 165 170 175 Val Gly Cys Arg Pro Tyr Ser Ile Pro Pro Cys Glu His His Val Asn 180 185 190 Gly Ser Arg Pro Pro Cys Thr Gly Glu Gly Asp Thr Pro Lys Cys Ser 195 200 205 Lys Ile Cys Glu Pro Gly Tyr Ser Pro Thr Tyr Lys Gln Asp Lys His 210 215 220 Tyr Gly Tyr Asn Ser Tyr Ser Val Ser Asn Ser Glu Lys Asp Ile Met 225 230 235 240 Ala Glu Ile Tyr Lys Asn Gly Pro Val Glu Gly Ala Phe Ser Val Tyr 245 250 255 Ser Asp Phe Leu Leu Tyr Lys Ser Gly Val Tyr Gln His Val Thr Gly 260 265 270 Glu Met Met Gly Gly His Ala Ile Arg Ile Leu Gly Trp Gly Val Glu 275 280 285 Asn Gly Thr Pro Tyr Trp Leu Val Ala Asn Ser Trp Asn Thr Asp Trp 290 295 300 Gly Asp Asn Gly Phe Phe Lys Ile Leu Arg Gly Gln Asp His Cys Gly 305 310 315 320 Ile Glu Ser Glu Val Val Ala Gly Ile Pro Arg Thr Asp Gln Tyr Trp 325 330 335 Glu Lys Ile <210> 36 <211> 1017 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 36 atgtggcagc tgtgggccag cctgtgctgc ctgctggtgc tggccaacgc ccgcagccgc 60 cccagcttcc accccctgag cgacgagctg gtgaactacg tgaacaagcg caacaccacc 120 tggcaggccg gccacaactt ctacaacgtg gacatgagct acctgaagcg cctgtgcggc 180 accttcctgg gcggccccaa gcccccccag cgcgtgatgt tcaccgagga cctgaagctg 240 cccgccagct tcgacgcccg cgagcagtgg ccccagtgcc ccaccatcaa ggagatccgc 300 gaccagggca gctgcggcag ctgctgggcc ttcggcgccg tggaggccat cagcgaccgc 360 atctgcatcc acaccaacgc ccacgtgagc gtggaggtga gcgccgagga cctgctgacc 420 tgctgcggca gcatgtgcgg cgacggctgc aacggcggct accccgccga ggcctggaac 480 ttctggaccc gcaagggcct ggtgagcggc ggcctgtacg agagccacgt gggctgccgc 540 ccctacagca tccccccctg cgagcaccac gtgaacggca gccgcccccc ctgcaccggc 600 gagggcgaca cccccaagtg cagcaagatc tgcgagcccg gctacagccc cacctacaag 660 caggacaagc actacggcta caacagctac agcgtgagca acagcgagaa ggacatcatg 720 gccgagatct acaagaacgg ccccgtggag ggcgccttca gcgtgtacag cgacttcctg 780 ctgtacaaga gcggcgtgta ccagcacgtg accggcgaga tgatgggcgg ccacgccatc 840 cgcatcctgg gctggggcgt ggagaacggc accccctact ggctggtggc caacagctgg 900 aacaccgact ggggcgacaa cggcttcttc aagatcctgc gcggccagga ccactgcggc 960 atcgagagcg aggtggtggc cggcatcccc cgcaccgacc agtactggga gaagatc 1017 <210> 37 <211> 631 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 37 Met Pro Arg Tyr Gly Ala Ser Leu Arg Gln Ser Cys Pro Arg Ser Gly 1 5 10 15 Arg Glu Gln Gly Gln Asp Gly Thr Ala Gly Ala Pro Gly Leu Leu Trp 20 25 30 Met Gly Leu Val Leu Ala Leu Ala Leu Ala Leu Ala Leu Ala Leu Ala 35 40 45 Leu Ser Asp Ser Arg Val Leu Trp Ala Pro Ala Glu Ala His Pro Leu 50 55 60 Ser Pro Gln Gly His Pro Ala Arg Leu His Arg Ile Val Pro Arg Leu 65 70 75 80 Arg Asp Val Phe Gly Trp Gly Asn Leu Thr Cys Pro Ile Cys Lys Gly 85 90 95 Leu Phe Thr Ala Ile Asn Leu Gly Leu Lys Lys Glu Pro Asn Val Ala 100 105 110 Arg Val Gly Ser Val Ala Ile Lys Leu Cys Asn Leu Leu Lys Ile Ala 115 120 125 Pro Pro Ala Val Cys Gln Ser Ile Val His Leu Phe Glu Asp Asp Met 130 135 140 Val Glu Val Trp Arg Arg Ser Val Leu Ser Pro Ser Glu Ala Cys Gly 145 150 155 160 Leu Leu Leu Gly Ser Thr Cys Gly His Trp Asp Ile Phe Ser Ser Trp 165 170 175 Asn Ile Ser Leu Pro Thr Val Pro Lys Pro Pro Pro Lys Pro Pro Ser 180 185 190 Pro Pro Ala Pro Gly Ala Pro Val Ser Arg Ile Leu Phe Leu Thr Asp 195 200 205 Leu His Trp Asp His Asp Tyr Leu Glu Gly Thr Asp Pro Asp Cys Ala 210 215 220 Asp Pro Leu Cys Cys Arg Arg Gly Ser Gly Leu Pro Pro Ala Ser Arg 225 230 235 240 Pro Gly Ala Gly Tyr Trp Gly Glu Tyr Ser Lys Cys Asp Leu Pro Leu 245 250 255 Arg Thr Leu Glu Ser Leu Leu Ser Gly Leu Gly Pro Ala Gly Pro Phe 260 265 270 Asp Met Val Tyr Trp Thr Gly Asp Ile Pro Ala His Asp Val Trp His 275 280 285 Gln Thr Arg Gln Asp Gln Leu Arg Ala Leu Thr Thr Val Thr Ala Leu 290 295 300 Val Arg Lys Phe Leu Gly Pro Val Pro Val Tyr Pro Ala Val Gly Asn 305 310 315 320 His Glu Ser Thr Pro Val Asn Ser Phe Pro Pro Pro Phe Ile Glu Gly 325 330 335 Asn His Ser Ser Arg Trp Leu Tyr Glu Ala Met Ala Lys Ala Trp Glu 340 345 350 Pro Trp Leu Pro Ala Glu Ala Leu Arg Thr Leu Arg Ile Gly Gly Phe 355 360 365 Tyr Ala Leu Ser Pro Tyr Pro Gly Leu Arg Leu Ile Ser Leu Asn Met 370 375 380 Asn Phe Cys Ser Arg Glu Asn Phe Trp Leu Leu Ile Asn Ser Thr Asp 385 390 395 400 Pro Ala Gly Gln Leu Gln Trp Leu Val Gly Glu Leu Gln Ala Ala Glu 405 410 415 Asp Arg Gly Asp Lys Val His Ile Ile Gly His Ile Pro Pro Gly His 420 425 430 Cys Leu Lys Ser Trp Ser Trp Asn Tyr Tyr Arg Ile Val Ala Arg Tyr 435 440 445 Glu Asn Thr Leu Ala Ala Gln Phe Phe Gly His Thr His Val Asp Glu 450 455 460 Phe Glu Val Phe Tyr Asp Glu Glu Thr Leu Ser Arg Pro Leu Ala Val 465 470 475 480 Ala Phe Leu Ala Pro Ser Ala Thr Thr Tyr Ile Gly Leu Asn Pro Gly 485 490 495 Tyr Arg Val Tyr Gln Ile Asp Gly Asn Tyr Ser Gly Ser Ser His Val 500 505 510 Val Leu Asp His Glu Thr Tyr Ile Leu Asn Leu Thr Gln Ala Asn Ile 515 520 525 Pro Gly Ala Ile Pro His Trp Gln Leu Leu Tyr Arg Ala Arg Glu Thr 530 535 540 Tyr Gly Leu Pro Asn Thr Leu Pro Thr Ala Trp His Asn Leu Val Tyr 545 550 555 560 Arg Met Arg Gly Asp Met Gln Leu Phe Gln Thr Phe Trp Phe Leu Tyr 565 570 575 His Lys Gly His Pro Pro Ser Glu Pro Cys Gly Thr Pro Cys Arg Leu 580 585 590 Ala Thr Leu Cys Ala Gln Leu Ser Ala Arg Ala Asp Ser Pro Ala Leu 595 600 605 Cys Arg His Leu Met Pro Asp Gly Ser Leu Pro Glu Ala Gln Ser Leu 610 615 620 Trp Pro Arg Pro Leu Phe Cys 625 630 <210> 38 <211> 1896 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 38 atgccccgct acggcgccag cctgcgccag agctgccccc gcagcggccg cgagcagggc 60 caggacggca ccgccggcgc ccccggcctg ctgtggatgg gcctggtgct ggccctggcc 120 ctggccctgg ccctggccct ggccctgagc gacagccgcg tgctgtgggc ccccgccgag 180 gcccaccccc tgagccccca gggccacccc gcccgcctgc accgcatcgt gccccgcctg 240 cgcgacgtgt tcggctgggg caacctgacc tgccccatct gcaagggcct gttcaccgcc 300 atcaacctgg gcctgaagaa ggagcccaac gtggcccgcg tgggcagcgt ggccatcaag 360 ctgtgcaacc tgctgaagat cgcccccccc gccgtgtgcc agagcatcgt gcacctgttc 420 gaggacgaca tggtggaggt gtggcgccgc agcgtgctga gccccagcga ggcctgcggc 480 ctgctgctgg gcagcacctg cggccactgg gacatcttca gcagctggaa catcagcctg 540 cccaccgtgc ccaagccccc ccccaagccc cccagccccc ccgcccccgg cgcccccgtg 600 agccgcatcc tgttcctgac cgacctgcac tgggaccacg actacctgga gggcaccgac 660 cccgactgcg ccgaccccct gtgctgccgc cgcggcagcg gcctgccccc cgccagccgc 720 cccggcgccg gctactgggg cgagtacagc aagtgcgacc tgcccctgcg caccctggag 780 agcctgctga gcggcctggg ccccgccggc cccttcgaca tggtgtactg gaccggcgac 840 atccccgccc acgacgtgtg gcaccagacc cgccaggacc agctgcgcgc cctgaccacc 900 gtgaccgccc tggtgcgcaa gttcctgggc cccgtgcccg tgtaccccgc cgtgggcaac 960 cacgagagca cccccgtgaa cagcttcccc ccccccttca tcgagggcaa ccacagcagc 1020 cgctggctgt acgaggccat ggccaaggcc tgggagccct ggctgcccgc cgaggccctg 1080 cgcaccctgc gcatcggcgg cttctacgcc ctgagcccct accccggcct gcgcctgatc 1140 agcctgaaca tgaacttctg cagccgcgag aacttctggc tgctgatcaa cagcaccgac 1200 cccgccggcc agctgcagtg gctggtgggc gagctgcagg ccgccgagga ccgcggcgac 1260 aaggtgcaca tcatcggcca catccccccc ggccactgcc tgaagagctg gagctggaac 1320 tactaccgca tcgtggcccg ctacgagaac accctggccg cccagttctt cggccacacc 1380 cacgtggacg agttcgaggt gttctacgac gaggagaccc tgagccgccc cctggccgtg 1440 gccttcctgg cccccagcgc caccacctac atcggcctga accccggcta ccgcgtgtac 1500 cagatcgacg gcaactacag cggcagcagc cacgtggtgc tggaccacga gacctacatc 1560 ctgaacctga cccaggccaa catccccggc gccatccccc actggcagct gctgtaccgc 1620 gcccgcgaga cctacggcct gcccaacacc ctgcccaccg cctggcacaa cctggtgtac 1680 cgcatgcgcg gcgacatgca gctgttccag accttctggt tcctgtacca caagggccac 1740 ccccccagcg agccctgcgg caccccctgc cgcctggcca ccctgtgcgc ccagctgagc 1800 gcccgcgccg acagccccgc cctgtgccgc cacctgatgc ccgacggcag cctgcccgag 1860 gcccagagcc tgtggccccg ccccctgttc tgctaa 1896 <210> 39 <211> 11329 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 39 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggaattc agcagcccca gcagagagga 660 atgccccaag cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct 720 gcttcaggcc gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta 780 cagcagcgtc gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt 840 tcctgctctg ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact 900 gagcatggga cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc 960 tgagcagaaa ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct 1020 gaatatcctg gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga 1080 ggaaggcatc ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag 1140 gacctacacc tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga 1200 agaggacacc aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc 1260 cgtgtcactg ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt 1320 gaatggcaag ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag 1380 atacttcgtg aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac 1440 agccgagaac gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt 1500 tacacccgag caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag 1560 cacccaccat aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg 1620 ggctaaagtg gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca 1680 ctggtatctg gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt 1740 ccccaacacc atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag 1800 cgtgcggctc ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct 1860 gctgtaccac gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc 1920 taactgggtc cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt 1980 ctacaagcag cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc 2040 tcagcgcgtt ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca 2100 ccctgatgga tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac 2160 catcaaggat cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac 2220 ctacctgtgg cgtagacagg agggcagagg aagtcttctg acatgcggag acgtggaaga 2280 gaatcccggc cctatggccg agtggctgct gagcgccagc tggcagcgcc gcgccaaggc 2340 catgaccgcc gccgccggca gcgccggccg cgccgccgtg cccctgctgc tgtgcgccct 2400 gctggccccc ggcggcgcct acgtgctgga cgacagcgac ggcctgggcc gcgagttcga 2460 cggcatcggc gccgtgagcg gcggcggcgc caccagccgc ctgctggtga actaccccga 2520 gccctaccgc agccagatcc tggactacct gttcaagccc aacttcggcg ccagcctgca 2580 catcctgaag gtggagatcg gcggcgacgg ccagaccacc gacggcaccg agcccagcca 2640 catgcactac gccctggacg agaactactt ccgcggctac gagtggtggc tgatgaagga 2700 ggccaagaag cgcaacccca acatcaccct gatcggcctg ccctggagct tccccggctg 2760 gctgggcaag ggcttcgact ggccctacgt gaacctgcag ctgaccgcct actacgtggt 2820 gacctggatc gtgggcgcca agcgctacca cgacctggac atcgactaca tcggcatctg 2880 gaacgagcgc agctacaacg ccaactacat caagatcctg cgcaagatgc tgaactacca 2940 gggcctgcag cgcgtgaaga tcatcgccag cgacaacctg tgggagagca tcagcgccag 3000 catgctgctg gacgccgagc tgttcaaggt ggtggacgtg atcggcgccc actaccccgg 3060 cacccacagc gccaaggacg ccaagctgac cggcaagaag ctgtggagca gcgaggactt 3120 cagcaccctg aacagcgaca tgggcgccgg ctgctggggc cgcatcctga accagaacta 3180 catcaacggc tacatgacca gcaccatcgc ctggaacctg gtggccagct actacgagca 3240 gctgccctac ggccgctgcg gcctgatgac cgcccaggag ccctggagcg gccactacgt 3300 ggtggagagc cccgtgtggg tgagcgccca caccacccag ttcacccagc ccggctggta 3360 ctacctgaag accgtgggcc acctggagaa gggcggcagc tacgtggccc tgaccgacgg 3420 cctgggcaac ctgaccatca tcatcgagac catgagccac aagcacagca agtgcatccg 3480 ccccttcctg ccctacttca acgtgagcca gcagttcgcc accttcgtgc tgaagggcag 3540 cttcagcgag atccccgagc tgcaggtgtg gtacaccaag ctgggcaaga ccagcgagcg 3600 cttcctgttc aagcagctgg acagcctgtg gctgctggac agcgacggca gcttcaccct 3660 gagcctgcac gaggacgagc tgttcaccct gaccaccctg accaccggcc gcaagggcag 3720 ctaccccctg ccccccaaga gccagccctt ccccagcacc tacaaggacg acttcaacgt 3780 ggactacccc ttcttcagcg aggcccccaa cttcgccgac cagaccggcg tgttcgagta 3840 cttcaccaac atcgaggacc ccggcgagca ccacttcacc ctgcgccagg tgctgaacca 3900 gcgccccatc acctgggccg ccgacgccag caacaccatc agcatcatcg gcgactacaa 3960 ctggaccaac ctgaccatca agtgcgacgt gtacatcgag acccccgaca ccggcggcgt 4020 gttcatcgcc ggccgcgtga acaagggcgg catcctgatc cgcagcgccc gcggcatctt 4080 cttctggatc ttcgccaacg gcagctaccg cgtgaccggc gacctggccg gctggatcat 4140 ctacgccctg ggccgcgtgg aggtgaccgc caagaagtgg tacaccctga ccctgaccat 4200 caagggccac ttcaccagcg gcatgctgaa cgacaagagc ctgtggaccg acatccccgt 4260 gaacttcccc aagaacggct gggccgccat cggcacccac agcttcgagt tcgcccagtt 4320 cgacaacttc ctggtggagg ccacccgctg acaattgtta attaagttta aaccctcgag 4380 gccgcaagca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgga 4440 gatccacgat aacaaacagc ttttttgggg tgaacatatt gactgaattc cctgcaggtt 4500 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg 4560 tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc 4620 caactccatc actaggggtt cctgcggccg ctcgtacggt ctcgaggaat tcctgcagga 4680 taacttgcca acctcattct aaaatgtata tagaagccca aaagacaata acaaaaatat 4740 tcttgtagaa caaaatggga aagaatgttc cactaaatat caagatttag agcaaagcat 4800 gagatgtgtg gggatagaca gtgaggctga taaaatagag tagagctcag aaacagaccc 4860 attgatatat gtaagtgacc tatgaaaaaa atatggcatt ttacaatggg aaaatgatgg 4920 tctttttctt ttttagaaaa acagggaaat atatttatat gtaaaaaata aaagggaacc 4980 catatgtcat accatacaca caaaaaaatt ccagtgaatt ataagtctaa atggagaagg 5040 caaaacttta aatcttttag aaaataatat agaagcatgc agaccagcct ggccaacatg 5100 atgaaaccct ctctactaat aataaaatca gtagaactac tcaggactac tttgagtggg 5160 aagtcctttt ctatgaagac ttctttggcc aaaattaggc tctaaatgca aggagatagt 5220 gcatcatgcc tggctgcact tactgataaa tgatgttatc accatcttta accaaatgca 5280 caggaacaag ttatggtact gatgtgctgg attgagaagg agctctactt ccttgacagg 5340 acacatttgt atcaacttaa aaaagcagat ttttgccagc agaactattc attcagaggt 5400 aggaaactta gaatagatga tgtcactgat tagcatggct tccccatctc cacagctgct 5460 tcccacccag gttgcccaca gttgagtttg tccagtgctc agggctgccc actctcagta 5520 agaagcccca caccagcccc tctccaaata tgttggctgt tccttccatt aaagtgaccc 5580 cactttagag cagcaagtgg atttctgttt cttacagttc aggaaggagg agtcagctgt 5640 gagaacctgg agcctgagat gcttctaagt cccactgcta ctggggtcag ggaagccaga 5700 ctccagcatc agcagtcagg agcactaagc ccttgccaac atcctgtttc tcagagaaac 5760 tgcttccatt ataatggttg tcctttttta agctatcaag ccaaacaacc agtgtctacc 5820 attattctca tcacctgaag ccaagggttc tagcaaaagt caagctgtct tgtaatggtt 5880 gatgtgcctc cagcttctgt cttcagtcac tccactctta gcctgctctg aatcaactct 5940 gaccacagtt ccctggagcc cctgccacct gctgcccctg ccaccttctc catctgcagt 6000 gctgtgcagc cttctgcact cttgcagagc taataggtgg agacttgaag gaagaggagg 6060 aaagtttctc ataatagcct tgctgcaagc tcaaatggga ggtgggcact gtgcccagga 6120 gccttggagc aaaggctgtg cccaacctct gactgcatcc aggtttggtc ttgacagaga 6180 taagaagccc tggcttttgg agccaaaatc taggtcagac ttaggcagga ttctcaaagt 6240 ttatcagcag aacatgaggc agaagaccct ttctgctcca gcttcttcag gctcaacctt 6300 catcagaata gatagaaaga gaggctgtga gggttcttaa aacagaagca aatctgactc 6360 agagaataaa caacctccta gtaaactaca gcttagacag agcatctggt ggtgagtgtg 6420 ctcagtgtcc tactcaactg tctggtatca gccctcatga ggacttctct tctttccctc 6480 atagacctcc atctctgttt tccttagcct gcagaaatct ggatggctat tcacagaatg 6540 cctgtgcttt cagagttgca ttttttctct ggtattctgg ttcaagcatt tgaaggtagg 6600 aaaggttctc caagtgcaag aaagccagcc ctgagcctca actgcctggc tagtgtggtc 6660 agtaggatgc aaaggctgtt gaatgccaca aggccaaact ttaacctgtg taccacaagc 6720 ctagcagcag aggcagctct gctcactgga actctctgtc ttctttctcc tgagcctttt 6780 cttttcctga gttttctagc tctcctcaac cttacctctg ccctacccag gacaaaccca 6840 agagccactg tttctgtgat gtcctctcca gccctaatta ggcatcatga cttcagcctg 6900 accttccatg ctcagaagca gtgctaatcc acttcagatg agctgctcta tgcaacacag 6960 gcagagccta caaacctttg caccagagcc ctccacatat cagtgtttgt tcatactcac 7020 ttcaacagca aatgtgactg ctgagattaa gattttacac aagatggtct gtaatttcac 7080 agttagtttt atcccattag gtatgaaaga attagcataa ttccccttaa acatgaatga 7140 atcttagatt ttttaataaa tagttttgga agtaaagaca gagacatcag gagcacaagg 7200 aatagcctga gaggacaaac agaacaagaa agagtctgga aatacacagg atgttcttgg 7260 cctcctcaaa gcaagtgcaa gcagatagta ccagcagccc caggctatca gagcccagtg 7320 aagagaagta ccatgaaagc cacagctcta accaccctgt tccagagtga cagacagtcc 7380 ccaagacaag ccagcctgag ccagagagag aactgcaaga gaaagtttct aatttaggtt 7440 ctgttagatt cagacaagtg caggtcatcc tctctccaca gctactcacc tctccagcct 7500 aacaaagcct gcagtccaca ctccaaccct ggtgtctcac ctcctagcct ctcccaacat 7560 cctgctctct gaccatcttc tgcatctctc atctcaccat ctcccactgt ctacagccta 7620 ctcttgcaac taccatctca ttttctgaca tcctgtctac atcttctgcc atactctgcc 7680 atctaccata ccacctctta ccatctacca caccatcttt tatctccatc cctctcagaa 7740 gcctccaagc tgaatcctgc tttatgtgtt catctcagcc cctgcatgga aagctgaccc 7800 cagaggcaga actattccca gagagcttgg ccaagaaaaa caaaactacc agcctggcca 7860 ggctcaggag tagtaagctg cagtgtctgt tgtgttctag cttcaacagc tgcaggagtt 7920 ccactctcaa atgctccaca tttctcacat cctcctgatt ctggtcacta cccatcttca 7980 aagaacagaa tatctcacat cagcatactg tgaaggacta gtcatgggtg cagctgctca 8040 gagctgcaaa gtcattctgg atggtggaga gcttacaaac atttcatgat gctccccccg 8100 ctctgatggc tggagcccaa tccctacaca gactcctgct gtatgtgttt tcctttcact 8160 ctgagccaca gccagagggc aggcattcag tctcctcttc aggctggggc tggggcactg 8220 agaactcacc caacaccttg ctctcactcc ttctgcaaaa caagaaagag ctttgtgctg 8280 cagtagccat gaagaatgaa aggaaggctt taactaaaaa atgtcagaga ttattttcaa 8340 ccccttactg tggatcacca gcaaggagga aacacaacac agagacattt tttcccctca 8400 aattatcaaa agaatcactg catttgttaa agagagcaac tgaatcagga agcagagttt 8460 tgaacatatc agaagttagg aatctgcatc agagacaaat gcagtcatgg ttgtttgctg 8520 cataccagcc ctaatcatta gaagcctcat ggacttcaaa catcattccc tctgacaaga 8580 tgctctagcc taactccatg agataaaata aatctgcctt tcagagccaa agaagagtcc 8640 accagcttct tctcagtgtg aacaagagct ccagtcaggt tagtcagtcc agtgcagtag 8700 aggagaccag tctgcatcct ctaattttca aaggcaagaa gatttgttta ccctggacac 8760 caggcacaag tgaggtcaca gagctcttag atatgcagtc ctcatgagtg aggagactaa 8820 agcgcatgcc atcaagactt cagtgtagag aaaacctcca aaaaagcctc ctcactactt 8880 ctggaatagc tcagaggccg aggcggcctc ggcctctgca taaataaaaa aaattagtca 8940 gccatggggc ggagaatggg cggaactggg cggagttagg ggcgggatgg gcggagttag 9000 gggcgggact atggttgctg actaattgag atgcatgctt tgcatacttc tgcctgctgg 9060 ggagcctggg gactttccac acctggttgc tgactaattg agatgcatgc tttgcatact 9120 tctgcctgct ggggagcctg gggactttcc acaccctaac tgacacacat tccacagctg 9180 cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 9240 tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 9300 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 9360 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 9420 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 9480 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 9540 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 9600 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 9660 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 9720 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 9780 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 9840 ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 9900 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 9960 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 10020 tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 10080 ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 10140 taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 10200 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactcctgca aaccacgttg 10260 tgtctcaaaa tctctgatgt tacattgcac aagataaaaa tatatcatca tgaacaataa 10320 aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaa 10380 cgtcttgctc gaggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat 10440 gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg 10500 atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg 10560 agatggtcag actaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta 10620 tccgtactcc tgatgatgca tggttactca ccactgcgat ccccgggaaa acagcattcc 10680 aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc 10740 tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacagcgat cgcgtatttc 10800 gtctcgctca ggcgcaatca cgaatgaata acggtttggt tgatgcgagt gattttgatg 10860 acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataag cttttgccat 10920 tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt atttttgacg 10980 aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac cgataccagg 11040 atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag aaacggcttt 11100 ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcat ttgatgctcg 11160 atgagttttt ctaagggcgg cctgccacca tacccacgcc gaaacaagcg ctcatgagcc 11220 cgaagtggcg agcccgatct tccccatcgg tgatgtcggc gatataggcg ccagcaaccg 11280 cacctgtggc gccggtgatg agggcgcgcc aagtcgacgt ccggcagtc 11329 <210> 40 <211> 11776 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 40 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggccgag tggctgctga gcgccagctg 660 gcagcgccgc gccaaggcca tgaccgccgc cgccggcagc gccggccgcg ccgccgtgcc 720 cctgctgctg tgcgccctgc tggcccccgg cggcgcctac gtgctggacg acagcgacgg 780 cctgggccgc gagttcgacg gcatcggcgc cgtgagcggc ggcggcgcca ccagccgcct 840 gctggtgaac taccccgagc cctaccgcag ccagatcctg gactacctgt tcaagcccaa 900 cttcggcgcc agcctgcaca tcctgaaggt ggagatcggc ggcgacggcc agaccaccga 960 cggcaccgag cccagccaca tgcactacgc cctggacgag aactacttcc gcggctacga 1020 gtggtggctg atgaaggagg ccaagaagcg caaccccaac atcaccctga tcggcctgcc 1080 ctggagcttc cccggctggc tgggcaaggg cttcgactgg ccctacgtga acctgcagct 1140 gaccgcctac tacgtggtga cctggatcgt gggcgccaag cgctaccacg acctggacat 1200 cgactacatc ggcatctgga acgagcgcag ctacaacgcc aactacatca agatcctgcg 1260 caagatgctg aactaccagg gcctgcagcg cgtgaagatc atcgccagcg acaacctgtg 1320 ggagagcatc agcgccagca tgctgctgga cgccgagctg ttcaaggtgg tggacgtgat 1380 cggcgcccac taccccggca cccacagcgc caaggacgcc aagctgaccg gcaagaagct 1440 gtggagcagc gaggacttca gcaccctgaa cagcgacatg ggcgccggct gctggggccg 1500 catcctgaac cagaactaca tcaacggcta catgaccagc accatcgcct ggaacctggt 1560 ggccagctac tacgagcagc tgccctacgg ccgctgcggc ctgatgaccg cccaggagcc 1620 ctggagcggc cactacgtgg tggagagccc cgtgtgggtg agcgcccaca ccacccagtt 1680 cacccagccc ggctggtact acctgaagac cgtgggccac ctggagaagg gcggcagcta 1740 cgtggccctg accgacggcc tgggcaacct gaccatcatc atcgagacca tgagccacaa 1800 gcacagcaag tgcatccgcc ccttcctgcc ctacttcaac gtgagccagc agttcgccac 1860 cttcgtgctg aagggcagct tcagcgagat ccccgagctg caggtgtggt acaccaagct 1920 gggcaagacc agcgagcgct tcctgttcaa gcagctggac agcctgtggc tgctggacag 1980 cgacggcagc ttcaccctga gcctgcacga ggacgagctg ttcaccctga ccaccctgac 2040 caccggccgc aagggcagct accccctgcc ccccaagagc cagcccttcc ccagcaccta 2100 caaggacgac ttcaacgtgg actacccctt cttcagcgag gcccccaact tcgccgacca 2160 gaccggcgtg ttcgagtact tcaccaacat cgaggacccc ggcgagcacc acttcaccct 2220 gcgccaggtg ctgaaccagc gccccatcac ctgggccgcc gacgccagca acaccatcag 2280 catcatcggc gactacaact ggaccaacct gaccatcaag tgcgacgtgt acatcgagac 2340 ccccgacacc ggcggcgtgt tcatcgccgg ccgcgtgaac aagggcggca tcctgatccg 2400 cagcgcccgc ggcatcttct tctggatctt cgccaacggc agctaccgcg tgaccggcga 2460 cctggccggc tggatcatct acgccctggg ccgcgtggag gtgaccgcca agaagtggta 2520 caccctgacc ctgaccatca agggccactt caccagcggc atgctgaacg acaagagcct 2580 gtggaccgac atccccgtga acttccccaa gaacggctgg gccgccatcg gcacccacag 2640 cttcgagttc gcccagttcg acaacttcct ggtggaggcc acccgctgat tgtggccgaa 2700 ccgccgaact cagaggccgg ccccagaaaa cccgagcgag tagggggcgg cgcgcaggag 2760 ggaggagaac tgggggcgcg ggaggctggt gggtgtgggg ggtggagatg tagaagatgt 2820 gacgccgcgg cccggcgggt gccagattag cggacgcggt gcccgcggtt gcaacgggat 2880 cccgggcgct gcagcttggg aggcggctct ccccaggcgg cgtccgcgga gacacccatc 2940 cgtgaacccc aggtcccggg ccgccggctc gccgcgcacc aggggccggc ggacagaaga 3000 gcggccgagc ggctcgaggc tgggggaccg cgggcgcggc cgcgcgctgc cgggcgggag 3060 gctggggggc cggggccggg gccgtgcccc ggagcgggtc ggaggccggg gccggggccg 3120 ggggacggcg gctccccgcg cggctccagc ggctcgggga tcccggccgg gccccgcagg 3180 gaccatgatg gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt 3240 gtcaatcatg gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc 3300 tggcgctaga ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa 3360 tgccacctac tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag 3420 atacgagagc accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa 3480 tcacacaggc actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa 3540 aggcttcggc ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc 3600 agctcagaac ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat 3660 cagagtgccc atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc 3720 cgacgatttc cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc 3780 tctgatccac agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg 3840 gacatctccc acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg 3900 ccaacctggc gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc 3960 ctatgccgag cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg 4020 actgctgagc ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt 4080 tatcgcccgt gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct 4140 gatgctggac gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc 4200 tgaggccgcc aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc 4260 tgccaaggcc acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag 4320 cgaagcctgt gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag 4380 aggcatgcag tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac 4440 cgactggaat ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga 4500 cagccccatc atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca 4560 cctgggacac ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc 4620 ccagaagaac gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt 4680 ggtcctgaac cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt 4740 cctggaaaca atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca 4800 attgttaatt aagtttaaac cctcgaggcc gcaagcaata aaatatcttt attttcatta 4860 catctgtgtg ttggtttttt gtgtggagat ccacgataac aaacagcttt tttggggtga 4920 acatattgac tgaattccct gcaggttggc cactccctct ctgcgcgctc gctcgctcac 4980 tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 5040 cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct gcggccgctc 5100 gtacggtctc gaggaattcc tgcaggataa cttgccaacc tcattctaaa atgtatatag 5160 aagcccaaaa gacaataaca aaaatattct tgtagaacaa aatgggaaag aatgttccac 5220 taaatatcaa gatttagagc aaagcatgag atgtgtgggg atagacagtg aggctgataa 5280 aatagagtag agctcagaaa cagacccatt gatatatgta agtgacctat gaaaaaaata 5340 tggcatttta caatgggaaa atgatggtct ttttcttttt tagaaaaaca gggaaatata 5400 tttatatgta aaaaataaaa gggaacccat atgtcatacc atacacacaa aaaaattcca 5460 gtgaattata agtctaaatg gagaaggcaa aactttaaat cttttagaaa ataatataga 5520 agcatgcaga ccagcctggc caacatgatg aaaccctctc tactaataat aaaatcagta 5580 gaactactca ggactacttt gagtgggaag tccttttcta tgaagacttc tttggccaaa 5640 attaggctct aaatgcaagg agatagtgca tcatgcctgg ctgcacttac tgataaatga 5700 tgttatcacc atctttaacc aaatgcacag gaacaagtta tggtactgat gtgctggatt 5760 gagaaggagc tctacttcct tgacaggaca catttgtatc aacttaaaaa agcagatttt 5820 tgccagcaga actattcatt cagaggtagg aaacttagaa tagatgatgt cactgattag 5880 catggcttcc ccatctccac agctgcttcc cacccaggtt gcccacagtt gagtttgtcc 5940 agtgctcagg gctgcccact ctcagtaaga agccccacac cagcccctct ccaaatatgt 6000 tggctgttcc ttccattaaa gtgaccccac tttagagcag caagtggatt tctgtttctt 6060 acagttcagg aaggaggagt cagctgtgag aacctggagc ctgagatgct tctaagtccc 6120 actgctactg gggtcaggga agccagactc cagcatcagc agtcaggagc actaagccct 6180 tgccaacatc ctgtttctca gagaaactgc ttccattata atggttgtcc ttttttaagc 6240 tatcaagcca aacaaccagt gtctaccatt attctcatca cctgaagcca agggttctag 6300 caaaagtcaa gctgtcttgt aatggttgat gtgcctccag cttctgtctt cagtcactcc 6360 actcttagcc tgctctgaat caactctgac cacagttccc tggagcccct gccacctgct 6420 gcccctgcca ccttctccat ctgcagtgct gtgcagcctt ctgcactctt gcagagctaa 6480 taggtggaga cttgaaggaa gaggaggaaa gtttctcata atagccttgc tgcaagctca 6540 aatgggaggt gggcactgtg cccaggagcc ttggagcaaa ggctgtgccc aacctctgac 6600 tgcatccagg tttggtcttg acagagataa gaagccctgg cttttggagc caaaatctag 6660 gtcagactta ggcaggattc tcaaagttta tcagcagaac atgaggcaga agaccctttc 6720 tgctccagct tcttcaggct caaccttcat cagaatagat agaaagagag gctgtgaggg 6780 ttcttaaaac agaagcaaat ctgactcaga gaataaacaa cctcctagta aactacagct 6840 tagacagagc atctggtggt gagtgtgctc agtgtcctac tcaactgtct ggtatcagcc 6900 ctcatgagga cttctcttct ttccctcata gacctccatc tctgttttcc ttagcctgca 6960 gaaatctgga tggctattca cagaatgcct gtgctttcag agttgcattt tttctctggt 7020 attctggttc aagcatttga aggtaggaaa ggttctccaa gtgcaagaaa gccagccctg 7080 agcctcaact gcctggctag tgtggtcagt aggatgcaaa ggctgttgaa tgccacaagg 7140 ccaaacttta acctgtgtac cacaagccta gcagcagagg cagctctgct cactggaact 7200 ctctgtcttc tttctcctga gccttttctt ttcctgagtt ttctagctct cctcaacctt 7260 acctctgccc tacccaggac aaacccaaga gccactgttt ctgtgatgtc ctctccagcc 7320 ctaattaggc atcatgactt cagcctgacc ttccatgctc agaagcagtg ctaatccact 7380 tcagatgagc tgctctatgc aacacaggca gagcctacaa acctttgcac cagagccctc 7440 cacatatcag tgtttgttca tactcacttc aacagcaaat gtgactgctg agattaagat 7500 tttacacaag atggtctgta atttcacagt tagttttatc ccattaggta tgaaagaatt 7560 agcataattc cccttaaaca tgaatgaatc ttagattttt taataaatag ttttggaagt 7620 aaagacagag acatcaggag cacaaggaat agcctgagag gacaaacaga acaagaaaga 7680 gtctggaaat acacaggatg ttcttggcct cctcaaagca agtgcaagca gatagtacca 7740 gcagccccag gctatcagag cccagtgaag agaagtacca tgaaagccac agctctaacc 7800 accctgttcc agagtgacag acagtcccca agacaagcca gcctgagcca gagagagaac 7860 tgcaagagaa agtttctaat ttaggttctg ttagattcag acaagtgcag gtcatcctct 7920 ctccacagct actcacctct ccagcctaac aaagcctgca gtccacactc caaccctggt 7980 gtctcacctc ctagcctctc ccaacatcct gctctctgac catcttctgc atctctcatc 8040 tcaccatctc ccactgtcta cagcctactc ttgcaactac catctcattt tctgacatcc 8100 tgtctacatc ttctgccata ctctgccatc taccatacca cctcttacca tctaccacac 8160 catcttttat ctccatccct ctcagaagcc tccaagctga atcctgcttt atgtgttcat 8220 ctcagcccct gcatggaaag ctgaccccag aggcagaact attcccagag agcttggcca 8280 agaaaaacaa aactaccagc ctggccaggc tcaggagtag taagctgcag tgtctgttgt 8340 gttctagctt caacagctgc aggagttcca ctctcaaatg ctccacattt ctcacatcct 8400 cctgattctg gtcactaccc atcttcaaag aacagaatat ctcacatcag catactgtga 8460 aggactagtc atgggtgcag ctgctcagag ctgcaaagtc attctggatg gtggagagct 8520 tacaaacatt tcatgatgct ccccccgctc tgatggctgg agcccaatcc ctacacagac 8580 tcctgctgta tgtgttttcc tttcactctg agccacagcc agagggcagg cattcagtct 8640 cctcttcagg ctggggctgg ggcactgaga actcacccaa caccttgctc tcactccttc 8700 tgcaaaacaa gaaagagctt tgtgctgcag tagccatgaa gaatgaaagg aaggctttaa 8760 ctaaaaaatg tcagagatta ttttcaaccc cttactgtgg atcaccagca aggaggaaac 8820 acaacacaga gacatttttt cccctcaaat tatcaaaaga atcactgcat ttgttaaaga 8880 gagcaactga atcaggaagc agagttttga acatatcaga agttaggaat ctgcatcaga 8940 gacaaatgca gtcatggttg tttgctgcat accagcccta atcattagaa gcctcatgga 9000 cttcaaacat cattccctct gacaagatgc tctagcctaa ctccatgaga taaaataaat 9060 ctgcctttca gagccaaaga agagtccacc agcttcttct cagtgtgaac aagagctcca 9120 gtcaggttag tcagtccagt gcagtagagg agaccagtct gcatcctcta attttcaaag 9180 gcaagaagat ttgtttaccc tggacaccag gcacaagtga ggtcacagag ctcttagata 9240 tgcagtcctc atgagtgagg agactaaagc gcatgccatc aagacttcag tgtagagaaa 9300 acctccaaaa aagcctcctc actacttctg gaatagctca gaggccgagg cggcctcggc 9360 ctctgcataa ataaaaaaaa ttagtcagcc atggggcgga gaatgggcgg aactgggcgg 9420 agttaggggc gggatgggcg gagttagggg cgggactatg gttgctgact aattgagatg 9480 catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc tggttgctga 9540 ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg actttccaca 9600 ccctaactga cacacattcc acagctgcat taatgaatcg gccaacgcgc ggggagaggc 9660 ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 9720 cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 9780 ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 9840 aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 9900 cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 9960 cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 10020 gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 10080 tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 10140 cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 10200 ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 10260 gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 10320 gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 10380 accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 10440 ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 10500 tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 10560 aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 10620 taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 10680 gttgcctgac tcctgcaaac cacgttgtgt ctcaaaatct ctgatgttac attgcacaag 10740 ataaaaatat atcatcatga acaataaaac tgtctgctta cataaacagt aatacaaggg 10800 gtgttatgag ccatattcaa cgggaaacgt cttgctcgag gccgcgatta aattccaaca 10860 tggatgctga tttatatggg tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga 10920 caatctatcg attgtatggg aagcccgatg cgccagagtt gtttctgaaa catggcaaag 10980 gtagcgttgc caatgatgtt acagatgaga tggtcagact aaactggctg acggaattta 11040 tgcctcttcc gaccatcaag cattttatcc gtactcctga tgatgcatgg ttactcacca 11100 ctgcgatccc cgggaaaaca gcattccagg tattagaaga atatcctgat tcaggtgaaa 11160 atattgttga tgcgctggca gtgttcctgc gccggttgca ttcgattcct gtttgtaatt 11220 gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc gcaatcacga atgaataacg 11280 gtttggttga tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct 11340 ggaaagaaat gcataagctt ttgccattct caccggattc agtcgtcact catggtgatt 11400 tctcacttga taaccttatt tttgacgagg ggaaattaat aggttgtatt gatgttggac 11460 gagtcggaat cgcagaccga taccaggatc ttgccatcct atggaactgc ctcggtgagt 11520 tttctccttc attacagaaa cggctttttc aaaaatatgg tattgataat cctgatatga 11580 ataaattgca gtttcatttg atgctcgatg agtttttcta agggcggcct gccaccatac 11640 ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc ccatcggtga 11700 tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc ggtgatgagg gcgcgccaag 11760 tcgacgtccg gcagtc 11776 <210> 41 <211> 11348 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 41 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgtgg 900 cagctgtggg ccagcctgtg ctgcctgctg gtgctggcca acgcccgcag ccgccccagc 960 ttccaccccc tgagcgacga gctggtgaac tacgtgaaca agcgcaacac cacctggcag 1020 gccggccaca acttctacaa cgtggacatg agctacctga agcgcctgtg cggcaccttc 1080 ctgggcggcc ccaagccccc ccagcgcgtg atgttcaccg aggacctgaa gctgcccgcc 1140 agcttcgacg cccgcgagca gtggccccag tgccccacca tcaaggagat ccgcgaccag 1200 ggcagctgcg gcagctgctg ggccttcggc gccgtggagg ccatcagcga ccgcatctgc 1260 atccacacca acgcccacgt gagcgtggag gtgagcgccg aggacctgct gacctgctgc 1320 ggcagcatgt gcggcgacgg ctgcaacggc ggctaccccg ccgaggcctg gaacttctgg 1380 acccgcaagg gcctggtgag cggcggcctg tacgagagcc acgtgggctg ccgcccctac 1440 agcatccccc cctgcgagca ccacgtgaac ggcagccgcc ccccctgcac cggcgagggc 1500 gacaccccca agtgcagcaa gatctgcgag cccggctaca gccccaccta caagcaggac 1560 aagcactacg gctacaacag ctacagcgtg agcaacagcg agaaggacat catggccgag 1620 atctacaaga acggccccgt ggagggcgcc ttcagcgtgt acagcgactt cctgctgtac 1680 aagagcggcg tgtaccagca cgtgaccggc gagatgatgg gcggccacgc catccgcatc 1740 ctgggctggg gcgtggagaa cggcaccccc tactggctgg tggccaacag ctggaacacc 1800 gactggggcg acaacggctt cttcaagatc ctgcgcggcc aggaccactg cggcatcgag 1860 agcgaggtgg tggccggcat cccccgcacc gaccagtact gggagaagat cgagggcaga 1920 ggaagtcttc tgacatgcgg agacgtggaa gagaatcccg gccctatgga attcagcagc 1980 cccagcagag aggaatgccc caagcctctg agccgggtgt caatcatggc cggatctctg 2040 acaggactgc tgctgcttca ggccgtgtct tgggcttctg gcgctagacc ttgcatcccc 2100 aagagcttcg gctacagcag cgtcgtgtgc gtgtgcaatg ccacctactg cgacagcttc 2160 gaccctccta cctttcctgc tctgggcacc ttcagcagat acgagagcac cagatccggc 2220 agacggatgg aactgagcat gggacccatc caggccaatc acacaggcac tggcctgctg 2280 ctgacactgc agcctgagca gaaattccag aaagtgaaag gcttcggcgg agccatgaca 2340 gatgccgccg ctctgaatat cctggctctg tctccaccag ctcagaacct gctgctcaag 2400 agctacttca gcgaggaagg catcggctac aacatcatca gagtgcccat ggccagctgc 2460 gacttcagca tcaggaccta cacctacgcc gacacacccg acgatttcca gctgcacaac 2520 ttcagcctgc ctgaagagga caccaagctg aagatccctc tgatccacag agccctgcag 2580 ctggcacaaa gacccgtgtc actgctggcc tctccatgga catctcccac ctggctgaaa 2640 acaaatggcg ccgtgaatgg caagggcagc ctgaaaggcc aacctggcga catctaccac 2700 cagacctggg ccagatactt cgtgaagttc ctggacgcct atgccgagca caagctgcag 2760 ttttgggccg tgacagccga gaacgaacct tctgctggac tgctgagcgg ctaccccttt 2820 cagtgcctgg gctttacacc cgagcaccag cgggacttta tcgcccgtga tctgggaccc 2880 acactggcca atagcaccca ccataatgtg cggctgctga tgctggacga ccagagactg 2940 cttctgcccc actgggctaa agtggtgctg acagatcctg aggccgccaa atacgtgcac 3000 ggaatcgccg tgcactggta tctggacttt ctggcccctg ccaaggccac actgggagag 3060 acacacagac tgttccccaa caccatgctg ttcgccagcg aagcctgtgt gggcagcaag 3120 ttttgggaac agagcgtgcg gctcggcagc tgggatagag gcatgcagta cagccacagc 3180 atcatcacca acctgctgta ccacgtcgtc ggctggaccg actggaatct ggccctgaat 3240 cctgaaggcg gccctaactg ggtccgaaac ttcgtggaca gccccatcat cgtggacatc 3300 accaaggaca ccttctacaa gcagcccatg ttctaccacc tgggacactt cagcaagttc 3360 atccccgagg gctctcagcg cgttggactg gtggcttccc agaagaacga tctggacgcc 3420 gtggctctga tgcaccctga tggatctgct gtggtggtgg tcctgaaccg cagcagcaaa 3480 gatgtgcccc tgaccatcaa ggatcccgcc gtgggattcc tggaaacaat cagccctggc 3540 tactccatcc acacctacct gtggcgtaga cagtgacaat tgttaattaa gtttaaaccc 3600 tcgaggccgc aagcttatcg ataatcaacc tctggattac aaaatttgtg aaagattgac 3660 tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 3720 gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 3780 gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 3840 gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 3900 gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 3960 ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaaatc 4020 atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 4080 ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 4140 tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 4200 cgcctccccg catcgatacc gtcgactaga gctcgctgat cagcctcgac tgtgccttct 4260 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 4320 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 4380 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 4440 agcaggcatg ctggggagag atccacgata acaaacagct tttttggggt gaacatattg 4500 actgaattcc ctgcaggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 4560 cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag 4620 cgcgcagaga gggagtggcc aactccatca ctaggggttc ctgcggccgc tcgtacggtc 4680 tcgaggaatt cctgcaggat aacttgccaa cctcattcta aaatgtatat agaagcccaa 4740 aagacaataa caaaaatatt cttgtagaac aaaatgggaa agaatgttcc actaaatatc 4800 aagatttaga gcaaagcatg agatgtgtgg ggatagacag tgaggctgat aaaatagagt 4860 agagctcaga aacagaccca ttgatatatg taagtgacct atgaaaaaaa tatggcattt 4920 tacaatggga aaatgatggt ctttttcttt tttagaaaaa cagggaaata tatttatatg 4980 taaaaaataa aagggaaccc atatgtcata ccatacacac aaaaaaattc cagtgaatta 5040 taagtctaaa tggagaaggc aaaactttaa atcttttaga aaataatata gaagcatgca 5100 gaccagcctg gccaacatga tgaaaccctc tctactaata ataaaatcag tagaactact 5160 caggactact ttgagtggga agtccttttc tatgaagact tctttggcca aaattaggct 5220 ctaaatgcaa ggagatagtg catcatgcct ggctgcactt actgataaat gatgttatca 5280 ccatctttaa ccaaatgcac aggaacaagt tatggtactg atgtgctgga ttgagaagga 5340 gctctacttc cttgacagga cacatttgta tcaacttaaa aaagcagatt tttgccagca 5400 gaactattca ttcagaggta ggaaacttag aatagatgat gtcactgatt agcatggctt 5460 ccccatctcc acagctgctt cccacccagg ttgcccacag ttgagtttgt ccagtgctca 5520 gggctgccca ctctcagtaa gaagccccac accagcccct ctccaaatat gttggctgtt 5580 ccttccatta aagtgacccc actttagagc agcaagtgga tttctgtttc ttacagttca 5640 ggaaggagga gtcagctgtg agaacctgga gcctgagatg cttctaagtc ccactgctac 5700 tggggtcagg gaagccagac tccagcatca gcagtcagga gcactaagcc cttgccaaca 5760 tcctgtttct cagagaaact gcttccatta taatggttgt ccttttttaa gctatcaagc 5820 caaacaacca gtgtctacca ttattctcat cacctgaagc caagggttct agcaaaagtc 5880 aagctgtctt gtaatggttg atgtgcctcc agcttctgtc ttcagtcact ccactcttag 5940 cctgctctga atcaactctg accacagttc cctggagccc ctgccacctg ctgcccctgc 6000 caccttctcc atctgcagtg ctgtgcagcc ttctgcactc ttgcagagct aataggtgga 6060 gacttgaagg aagaggagga aagtttctca taatagcctt gctgcaagct caaatgggag 6120 gtgggcactg tgcccaggag ccttggagca aaggctgtgc ccaacctctg actgcatcca 6180 ggtttggtct tgacagagat aagaagccct ggcttttgga gccaaaatct aggtcagact 6240 taggcaggat tctcaaagtt tatcagcaga acatgaggca gaagaccctt tctgctccag 6300 cttcttcagg ctcaaccttc atcagaatag atagaaagag aggctgtgag ggttcttaaa 6360 acagaagcaa atctgactca gagaataaac aacctcctag taaactacag cttagacaga 6420 gcatctggtg gtgagtgtgc tcagtgtcct actcaactgt ctggtatcag ccctcatgag 6480 gacttctctt ctttccctca tagacctcca tctctgtttt ccttagcctg cagaaatctg 6540 gatggctatt cacagaatgc ctgtgctttc agagttgcat tttttctctg gtattctggt 6600 tcaagcattt gaaggtagga aaggttctcc aagtgcaaga aagccagccc tgagcctcaa 6660 ctgcctggct agtgtggtca gtaggatgca aaggctgttg aatgccacaa ggccaaactt 6720 taacctgtgt accacaagcc tagcagcaga ggcagctctg ctcactggaa ctctctgtct 6780 tctttctcct gagccttttc ttttcctgag ttttctagct ctcctcaacc ttacctctgc 6840 cctacccagg acaaacccaa gagccactgt ttctgtgatg tcctctccag ccctaattag 6900 gcatcatgac ttcagcctga ccttccatgc tcagaagcag tgctaatcca cttcagatga 6960 gctgctctat gcaacacagg cagagcctac aaacctttgc accagagccc tccacatatc 7020 agtgtttgtt catactcact tcaacagcaa atgtgactgc tgagattaag attttacaca 7080 agatggtctg taatttcaca gttagtttta tcccattagg tatgaaagaa ttagcataat 7140 tccccttaaa catgaatgaa tcttagattt tttaataaat agttttggaa gtaaagacag 7200 agacatcagg agcacaagga atagcctgag aggacaaaca gaacaagaaa gagtctggaa 7260 atacacagga tgttcttggc ctcctcaaag caagtgcaag cagatagtac cagcagcccc 7320 aggctatcag agcccagtga agagaagtac catgaaagcc acagctctaa ccaccctgtt 7380 ccagagtgac agacagtccc caagacaagc cagcctgagc cagagagaga actgcaagag 7440 aaagtttcta atttaggttc tgttagattc agacaagtgc aggtcatcct ctctccacag 7500 ctactcacct ctccagccta acaaagcctg cagtccacac tccaaccctg gtgtctcacc 7560 tcctagcctc tcccaacatc ctgctctctg accatcttct gcatctctca tctcaccatc 7620 tcccactgtc tacagcctac tcttgcaact accatctcat tttctgacat cctgtctaca 7680 tcttctgcca tactctgcca tctaccatac cacctcttac catctaccac accatctttt 7740 atctccatcc ctctcagaag cctccaagct gaatcctgct ttatgtgttc atctcagccc 7800 ctgcatggaa agctgacccc agaggcagaa ctattcccag agagcttggc caagaaaaac 7860 aaaactacca gcctggccag gctcaggagt agtaagctgc agtgtctgtt gtgttctagc 7920 ttcaacagct gcaggagttc cactctcaaa tgctccacat ttctcacatc ctcctgattc 7980 tggtcactac ccatcttcaa agaacagaat atctcacatc agcatactgt gaaggactag 8040 tcatgggtgc agctgctcag agctgcaaag tcattctgga tggtggagag cttacaaaca 8100 tttcatgatg ctccccccgc tctgatggct ggagcccaat ccctacacag actcctgctg 8160 tatgtgtttt cctttcactc tgagccacag ccagagggca ggcattcagt ctcctcttca 8220 ggctggggct ggggcactga gaactcaccc aacaccttgc tctcactcct tctgcaaaac 8280 aagaaagagc tttgtgctgc agtagccatg aagaatgaaa ggaaggcttt aactaaaaaa 8340 tgtcagagat tattttcaac cccttactgt ggatcaccag caaggaggaa acacaacaca 8400 gagacatttt ttcccctcaa attatcaaaa gaatcactgc atttgttaaa gagagcaact 8460 gaatcaggaa gcagagtttt gaacatatca gaagttagga atctgcatca gagacaaatg 8520 cagtcatggt tgtttgctgc ataccagccc taatcattag aagcctcatg gacttcaaac 8580 atcattccct ctgacaagat gctctagcct aactccatga gataaaataa atctgccttt 8640 cagagccaaa gaagagtcca ccagcttctt ctcagtgtga acaagagctc cagtcaggtt 8700 agtcagtcca gtgcagtaga ggagaccagt ctgcatcctc taattttcaa aggcaagaag 8760 atttgtttac cctggacacc aggcacaagt gaggtcacag agctcttaga tatgcagtcc 8820 tcatgagtga ggagactaaa gcgcatgcca tcaagacttc agtgtagaga aaacctccaa 8880 aaaagcctcc tcactacttc tggaatagct cagaggccga ggcggcctcg gcctctgcat 8940 aaataaaaaa aattagtcag ccatggggcg gagaatgggc ggaactgggc ggagttaggg 9000 gcgggatggg cggagttagg ggcgggacta tggttgctga ctaattgaga tgcatgcttt 9060 gcatacttct gcctgctggg gagcctgggg actttccaca cctggttgct gactaattga 9120 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca caccctaact 9180 gacacacatt ccacagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 9240 tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 9300 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 9360 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 9420 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 9480 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 9540 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 9600 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 9660 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 9720 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 9780 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 9840 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 9900 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 9960 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 10020 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 10080 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 10140 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 10200 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 10260 actcctgcaa accacgttgt gtctcaaaat ctctgatgtt acattgcaca agataaaaat 10320 atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag gggtgttatg 10380 agccatattc aacgggaaac gtcttgctcg aggccgcgat taaattccaa catggatgct 10440 gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat 10500 cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt 10560 gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt 10620 ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc 10680 cccgggaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt 10740 gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt 10800 aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt 10860 gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa 10920 atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt 10980 gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga 11040 atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct 11100 tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg 11160 cagtttcatt tgatgctcga tgagtttttc taagggcggc ctgccaccat acccacgccg 11220 aaacaagcgc tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg 11280 atataggcgc cagcaaccgc acctgtggcg ccggtgatga gggcgcgcca agtcgacgtc 11340 cggcagtc 11348 <210> 42 <211> 11433 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 42 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatggaa 900 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 960 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1020 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1080 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1140 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1200 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1260 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1320 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1380 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1440 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1500 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1560 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 1620 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 1680 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 1740 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 1800 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 1860 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 1920 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 1980 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2040 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2100 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2160 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2220 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2280 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2340 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2400 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2460 agccctggct actccatcca cacctacctg tggcgtagac aggagggcag aggaagtctt 2520 ctgacatgcg gagacgtgga agagaatccc ggccctatgc cccgctacgg cgccagcctg 2580 cgccagagct gcccccgcag cggccgcgag cagggccagg acggcaccgc cggcgccccc 2640 ggcctgctgt ggatgggcct ggtgctggcc ctggccctgg ccctggccct ggccctggcc 2700 ctgagcgaca gccgcgtgct gtgggccccc gccgaggccc accccctgag cccccagggc 2760 caccccgccc gcctgcaccg catcgtgccc cgcctgcgcg acgtgttcgg ctggggcaac 2820 ctgacctgcc ccatctgcaa gggcctgttc accgccatca acctgggcct gaagaaggag 2880 cccaacgtgg cccgcgtggg cagcgtggcc atcaagctgt gcaacctgct gaagatcgcc 2940 ccccccgccg tgtgccagag catcgtgcac ctgttcgagg acgacatggt ggaggtgtgg 3000 cgccgcagcg tgctgagccc cagcgaggcc tgcggcctgc tgctgggcag cacctgcggc 3060 cactgggaca tcttcagcag ctggaacatc agcctgccca ccgtgcccaa gccccccccc 3120 aagcccccca gcccccccgc ccccggcgcc cccgtgagcc gcatcctgtt cctgaccgac 3180 ctgcactggg accacgacta cctggagggc accgaccccg actgcgccga ccccctgtgc 3240 tgccgccgcg gcagcggcct gccccccgcc agccgccccg gcgccggcta ctggggcgag 3300 tacagcaagt gcgacctgcc cctgcgcacc ctggagagcc tgctgagcgg cctgggcccc 3360 gccggcccct tcgacatggt gtactggacc ggcgacatcc ccgcccacga cgtgtggcac 3420 cagacccgcc aggaccagct gcgcgccctg accaccgtga ccgccctggt gcgcaagttc 3480 ctgggccccg tgcccgtgta ccccgccgtg ggcaaccacg agagcacccc cgtgaacagc 3540 ttcccccccc ccttcatcga gggcaaccac agcagccgct ggctgtacga ggccatggcc 3600 aaggcctggg agccctggct gcccgccgag gccctgcgca ccctgcgcat cggcggcttc 3660 tacgccctga gcccctaccc cggcctgcgc ctgatcagcc tgaacatgaa cttctgcagc 3720 cgcgagaact tctggctgct gatcaacagc accgaccccg ccggccagct gcagtggctg 3780 gtgggcgagc tgcaggccgc cgaggaccgc ggcgacaagg tgcacatcat cggccacatc 3840 ccccccggcc actgcctgaa gagctggagc tggaactact accgcatcgt ggcccgctac 3900 gagaacaccc tggccgccca gttcttcggc cacacccacg tggacgagtt cgaggtgttc 3960 tacgacgagg agaccctgag ccgccccctg gccgtggcct tcctggcccc cagcgccacc 4020 acctacatcg gcctgaaccc cggctaccgc gtgtaccaga tcgacggcaa ctacagcggc 4080 agcagccacg tggtgctgga ccacgagacc tacatcctga acctgaccca ggccaacatc 4140 cccggcgcca tcccccactg gcagctgctg taccgcgccc gcgagaccta cggcctgccc 4200 aacaccctgc ccaccgcctg gcacaacctg gtgtaccgca tgcgcggcga catgcagctg 4260 ttccagacct tctggttcct gtaccacaag ggccaccccc ccagcgagcc ctgcggcacc 4320 ccctgccgcc tggccaccct gtgcgcccag ctgagcgccc gcgccgacag ccccgccctg 4380 tgccgccacc tgatgcccga cggcagcctg cccgaggccc agagcctgtg gccccgcccc 4440 ctgttctgct aatgacaatt gttaattaag tttaaaccct cgaggccgca agcaataaaa 4500 tatctttatt ttcattacat ctgtgtgttg gttttttgtg tggagatcca cgataacaaa 4560 cagctttttt ggggtgaaca tattgactga attccctgca ggttggccac tccctctctg 4620 cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt 4680 cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg 4740 ggttcctgcg gccgctcgta cggtctcgag gaattcctgc aggataactt gccaacctca 4800 ttctaaaatg tatatagaag cccaaaagac aataacaaaa atattcttgt agaacaaaat 4860 gggaaagaat gttccactaa atatcaagat ttagagcaaa gcatgagatg tgtggggata 4920 gacagtgagg ctgataaaat agagtagagc tcagaaacag acccattgat atatgtaagt 4980 gacctatgaa aaaaatatgg cattttacaa tgggaaaatg atggtctttt tcttttttag 5040 aaaaacaggg aaatatattt atatgtaaaa aataaaaggg aacccatatg tcataccata 5100 cacacaaaaa aattccagtg aattataagt ctaaatggag aaggcaaaac tttaaatctt 5160 ttagaaaata atatagaagc atgcagacca gcctggccaa catgatgaaa ccctctctac 5220 taataataaa atcagtagaa ctactcagga ctactttgag tgggaagtcc ttttctatga 5280 agacttcttt ggccaaaatt aggctctaaa tgcaaggaga tagtgcatca tgcctggctg 5340 cacttactga taaatgatgt tatcaccatc tttaaccaaa tgcacaggaa caagttatgg 5400 tactgatgtg ctggattgag aaggagctct acttccttga caggacacat ttgtatcaac 5460 ttaaaaaagc agatttttgc cagcagaact attcattcag aggtaggaaa cttagaatag 5520 atgatgtcac tgattagcat ggcttcccca tctccacagc tgcttcccac ccaggttgcc 5580 cacagttgag tttgtccagt gctcagggct gcccactctc agtaagaagc cccacaccag 5640 cccctctcca aatatgttgg ctgttccttc cattaaagtg accccacttt agagcagcaa 5700 gtggatttct gtttcttaca gttcaggaag gaggagtcag ctgtgagaac ctggagcctg 5760 agatgcttct aagtcccact gctactgggg tcagggaagc cagactccag catcagcagt 5820 caggagcact aagcccttgc caacatcctg tttctcagag aaactgcttc cattataatg 5880 gttgtccttt tttaagctat caagccaaac aaccagtgtc taccattatt ctcatcacct 5940 gaagccaagg gttctagcaa aagtcaagct gtcttgtaat ggttgatgtg cctccagctt 6000 ctgtcttcag tcactccact cttagcctgc tctgaatcaa ctctgaccac agttccctgg 6060 agcccctgcc acctgctgcc cctgccacct tctccatctg cagtgctgtg cagccttctg 6120 cactcttgca gagctaatag gtggagactt gaaggaagag gaggaaagtt tctcataata 6180 gccttgctgc aagctcaaat gggaggtggg cactgtgccc aggagccttg gagcaaaggc 6240 tgtgcccaac ctctgactgc atccaggttt ggtcttgaca gagataagaa gccctggctt 6300 ttggagccaa aatctaggtc agacttaggc aggattctca aagtttatca gcagaacatg 6360 aggcagaaga ccctttctgc tccagcttct tcaggctcaa ccttcatcag aatagataga 6420 aagagaggct gtgagggttc ttaaaacaga agcaaatctg actcagagaa taaacaacct 6480 cctagtaaac tacagcttag acagagcatc tggtggtgag tgtgctcagt gtcctactca 6540 actgtctggt atcagccctc atgaggactt ctcttctttc cctcatagac ctccatctct 6600 gttttcctta gcctgcagaa atctggatgg ctattcacag aatgcctgtg ctttcagagt 6660 tgcatttttt ctctggtatt ctggttcaag catttgaagg taggaaaggt tctccaagtg 6720 caagaaagcc agccctgagc ctcaactgcc tggctagtgt ggtcagtagg atgcaaaggc 6780 tgttgaatgc cacaaggcca aactttaacc tgtgtaccac aagcctagca gcagaggcag 6840 ctctgctcac tggaactctc tgtcttcttt ctcctgagcc ttttcttttc ctgagttttc 6900 tagctctcct caaccttacc tctgccctac ccaggacaaa cccaagagcc actgtttctg 6960 tgatgtcctc tccagcccta attaggcatc atgacttcag cctgaccttc catgctcaga 7020 agcagtgcta atccacttca gatgagctgc tctatgcaac acaggcagag cctacaaacc 7080 tttgcaccag agccctccac atatcagtgt ttgttcatac tcacttcaac agcaaatgtg 7140 actgctgaga ttaagatttt acacaagatg gtctgtaatt tcacagttag ttttatccca 7200 ttaggtatga aagaattagc ataattcccc ttaaacatga atgaatctta gattttttaa 7260 taaatagttt tggaagtaaa gacagagaca tcaggagcac aaggaatagc ctgagaggac 7320 aaacagaaca agaaagagtc tggaaataca caggatgttc ttggcctcct caaagcaagt 7380 gcaagcagat agtaccagca gccccaggct atcagagccc agtgaagaga agtaccatga 7440 aagccacagc tctaaccacc ctgttccaga gtgacagaca gtccccaaga caagccagcc 7500 tgagccagag agagaactgc aagagaaagt ttctaattta ggttctgtta gattcagaca 7560 agtgcaggtc atcctctctc cacagctact cacctctcca gcctaacaaa gcctgcagtc 7620 cacactccaa ccctggtgtc tcacctccta gcctctccca acatcctgct ctctgaccat 7680 cttctgcatc tctcatctca ccatctccca ctgtctacag cctactcttg caactaccat 7740 ctcattttct gacatcctgt ctacatcttc tgccatactc tgccatctac cataccacct 7800 cttaccatct accacaccat cttttatctc catccctctc agaagcctcc aagctgaatc 7860 ctgctttatg tgttcatctc agcccctgca tggaaagctg accccagagg cagaactatt 7920 cccagagagc ttggccaaga aaaacaaaac taccagcctg gccaggctca ggagtagtaa 7980 gctgcagtgt ctgttgtgtt ctagcttcaa cagctgcagg agttccactc tcaaatgctc 8040 cacatttctc acatcctcct gattctggtc actacccatc ttcaaagaac agaatatctc 8100 acatcagcat actgtgaagg actagtcatg ggtgcagctg ctcagagctg caaagtcatt 8160 ctggatggtg gagagcttac aaacatttca tgatgctccc cccgctctga tggctggagc 8220 ccaatcccta cacagactcc tgctgtatgt gttttccttt cactctgagc cacagccaga 8280 gggcaggcat tcagtctcct cttcaggctg gggctggggc actgagaact cacccaacac 8340 cttgctctca ctccttctgc aaaacaagaa agagctttgt gctgcagtag ccatgaagaa 8400 tgaaaggaag gctttaacta aaaaatgtca gagattattt tcaacccctt actgtggatc 8460 accagcaagg aggaaacaca acacagagac attttttccc ctcaaattat caaaagaatc 8520 actgcatttg ttaaagagag caactgaatc aggaagcaga gttttgaaca tatcagaagt 8580 taggaatctg catcagagac aaatgcagtc atggttgttt gctgcatacc agccctaatc 8640 attagaagcc tcatggactt caaacatcat tccctctgac aagatgctct agcctaactc 8700 catgagataa aataaatctg cctttcagag ccaaagaaga gtccaccagc ttcttctcag 8760 tgtgaacaag agctccagtc aggttagtca gtccagtgca gtagaggaga ccagtctgca 8820 tcctctaatt ttcaaaggca agaagatttg tttaccctgg acaccaggca caagtgaggt 8880 cacagagctc ttagatatgc agtcctcatg agtgaggaga ctaaagcgca tgccatcaag 8940 acttcagtgt agagaaaacc tccaaaaaag cctcctcact acttctggaa tagctcagag 9000 gccgaggcgg cctcggcctc tgcataaata aaaaaaatta gtcagccatg gggcggagaa 9060 tgggcggaac tgggcggagt taggggcggg atgggcggag ttaggggcgg gactatggtt 9120 gctgactaat tgagatgcat gctttgcata cttctgcctg ctggggagcc tggggacttt 9180 ccacacctgg ttgctgacta attgagatgc atgctttgca tacttctgcc tgctggggag 9240 cctggggact ttccacaccc taactgacac acattccaca gctgcattaa tgaatcggcc 9300 aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 9360 cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 9420 ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 9480 aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 9540 acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 9600 gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 9660 ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 9720 gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 9780 cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 9840 taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 9900 atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 9960 cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 10020 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 10080 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 10140 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 10200 tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 10260 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 10320 tatttcgttc atccatagtt gcctgactcc tgcaaaccac gttgtgtctc aaaatctctg 10380 atgttacatt gcacaagata aaaatatatc atcatgaaca ataaaactgt ctgcttacat 10440 aaacagtaat acaaggggtg ttatgagcca tattcaacgg gaaacgtctt gctcgaggcc 10500 gcgattaaat tccaacatgg atgctgattt atatgggtat aaatgggctc gcgataatgt 10560 cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag cccgatgcgc cagagttgtt 10620 tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg tcagactaaa 10680 ctggctgacg gaatttatgc ctcttccgac catcaagcat tttatccgta ctcctgatga 10740 tgcatggtta ctcaccactg cgatccccgg gaaaacagca ttccaggtat tagaagaata 10800 tcctgattca ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc 10860 gattcctgtt tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca 10920 atcacgaatg aataacggtt tggttgatgc gagtgatttt gatgacgagc gtaatggctg 10980 gcctgttgaa caagtctgga aagaaatgca taagcttttg ccattctcac cggattcagt 11040 cgtcactcat ggtgatttct cacttgataa ccttattttt gacgagggga aattaatagg 11100 ttgtattgat gttggacgag tcggaatcgc agaccgatac caggatcttg ccatcctatg 11160 gaactgcctc ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa aatatggtat 11220 tgataatcct gatatgaata aattgcagtt tcatttgatg ctcgatgagt ttttctaagg 11280 gcggcctgcc accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg 11340 atcttcccca tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt 11400 gatgagggcg cgccaagtcg acgtccggca gtc 11433 <210> 43 <211> 11776 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 43 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggccgag tggctgctga gcgccagctg 660 gcagcgccgc gccaaggcca tgaccgccgc cgccggcagc gccggccgcg ccgccgtgcc 720 cctgctgctg tgcgccctgc tggcccccgg cggcgcctac gtgctggacg acagcgacgg 780 cctgggccgc gagttcgacg gcatcggcgc cgtgagcggc ggcggcgcca ccagccgcct 840 gctggtgaac taccccgagc cctaccgcag ccagatcctg gactacctgt tcaagcccaa 900 cttcggcgcc agcctgcaca tcctgaaggt ggagatcggc ggcgacggcc agaccaccga 960 cggcaccgag cccagccaca tgcactacgc cctggacgag aactacttcc gcggctacga 1020 gtggtggctg atgaaggagg ccaagaagcg caaccccaac atcaccctga tcggcctgcc 1080 ctggagcttc cccggctggc tgggcaaggg cttcgactgg ccctacgtga acctgcagct 1140 gaccgcctac tacgtggtga cctggatcgt gggcgccaag cgctaccacg acctggacat 1200 cgactacatc ggcatctgga acgagcgcag ctacaacgcc aactacatca agatcctgcg 1260 caagatgctg aactaccagg gcctgcagcg cgtgaagatc atcgccagcg acaacctgtg 1320 ggagagcatc agcgccagca tgctgctgga cgccgagctg ttcaaggtgg tggacgtgat 1380 cggcgcccac taccccggca cccacagcgc caaggacgcc aagctgaccg gcaagaagct 1440 gtggagcagc gaggacttca gcaccctgaa cagcgacatg ggcgccggct gctggggccg 1500 catcctgaac cagaactaca tcaacggcta catgaccagc accatcgcct ggaacctggt 1560 ggccagctac tacgagcagc tgccctacgg ccgctgcggc ctgatgaccg cccaggagcc 1620 ctggagcggc cactacgtgg tggagagccc cgtgtgggtg agcgcccaca ccacccagtt 1680 cacccagccc ggctggtact acctgaagac cgtgggccac ctggagaagg gcggcagcta 1740 cgtggccctg accgacggcc tgggcaacct gaccatcatc atcgagacca tgagccacaa 1800 gcacagcaag tgcatccgcc ccttcctgcc ctacttcaac gtgagccagc agttcgccac 1860 cttcgtgctg aagggcagct tcagcgagat ccccgagctg caggtgtggt acaccaagct 1920 gggcaagacc agcgagcgct tcctgttcaa gcagctggac agcctgtggc tgctggacag 1980 cgacggcagc ttcaccctga gcctgcacga ggacgagctg ttcaccctga ccaccctgac 2040 caccggccgc aagggcagct accccctgcc ccccaagagc cagcccttcc ccagcaccta 2100 caaggacgac ttcaacgtgg actacccctt cttcagcgag gcccccaact tcgccgacca 2160 gaccggcgtg ttcgagtact tcaccaacat cgaggacccc ggcgagcacc acttcaccct 2220 gcgccaggtg ctgaaccagc gccccatcac ctgggccgcc gacgccagca acaccatcag 2280 catcatcggc gactacaact ggaccaacct gaccatcaag tgcgacgtgt acatcgagac 2340 ccccgacacc ggcggcgtgt tcatcgccgg ccgcgtgaac aagggcggca tcctgatccg 2400 cagcgcccgc ggcatcttct tctggatctt cgccaacggc agctaccgcg tgaccggcga 2460 cctggccggc tggatcatct acgccctggg ccgcgtggag gtgaccgcca agaagtggta 2520 caccctgacc ctgaccatca agggccactt caccagcggc atgctgaacg acaagagcct 2580 gtggaccgac atccccgtga acttccccaa gaacggctgg gccgccatcg gcacccacag 2640 cttcgagttc gcccagttcg acaacttcct ggtggaggcc acccgctgat tgtggccgaa 2700 ccgccgaact cagaggccgg ccccagaaaa cccgagcgag tagggggcgg cgcgcaggag 2760 ggaggagaac tgggggcgcg ggaggctggt gggtgtgggg ggtggagatg tagaagatgt 2820 gacgccgcgg cccggcgggt gccagattag cggacgcggt gcccgcggtt gcaacgggat 2880 cccgggcgct gcagcttggg aggcggctct ccccaggcgg cgtccgcgga gacacccatc 2940 cgtgaacccc aggtcccggg ccgccggctc gccgcgcacc aggggccggc ggacagaaga 3000 gcggccgagc ggctcgaggc tgggggaccg cgggcgcggc cgcgcgctgc cgggcgggag 3060 gctggggggc cggggccggg gccgtgcccc ggagcgggtc ggaggccggg gccggggccg 3120 ggggacggcg gctccccgcg cggctccagc ggctcgggga tcccggccgg gccccgcagg 3180 gaccatgatg gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt 3240 gtcaatcatg gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc 3300 tggcgctaga ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa 3360 tgccacctac tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag 3420 atacgagagc accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa 3480 tcacacaggc actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa 3540 aggcttcggc ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc 3600 agctcagaac ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat 3660 cagagtgccc atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc 3720 cgacgatttc cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc 3780 tctgatccac agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg 3840 gacatctccc acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg 3900 ccaacctggc gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc 3960 ctatgccgag cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg 4020 actgctgagc ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt 4080 tatcgcccgt gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct 4140 gatgctggac gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc 4200 tgaggccgcc aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc 4260 tgccaaggcc acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag 4320 cgaagcctgt gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag 4380 aggcatgcag tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac 4440 cgactggaat ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga 4500 cagccccatc atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca 4560 cctgggacac ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc 4620 ccagaagaac gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt 4680 ggtcctgaac cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt 4740 cctggaaaca atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca 4800 attgttaatt aagtttaaac cctcgaggcc gcaagcaata aaatatcttt attttcatta 4860 catctgtgtg ttggtttttt gtgtggagat ccacgataac aaacagcttt tttggggtga 4920 acatattgac tgaattccct gcaggttggc cactccctct ctgcgcgctc gctcgctcac 4980 tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 5040 cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct gcggccgctc 5100 gtacggtctc gaggaattcc tgcaggataa cttgccaacc tcattctaaa atgtatatag 5160 aagcccaaaa gacaataaca aaaatattct tgtagaacaa aatgggaaag aatgttccac 5220 taaatatcaa gatttagagc aaagcatgag atgtgtgggg atagacagtg aggctgataa 5280 aatagagtag agctcagaaa cagacccatt gatatatgta agtgacctat gaaaaaaata 5340 tggcatttta caatgggaaa atgatggtct ttttcttttt tagaaaaaca gggaaatata 5400 tttatatgta aaaaataaaa gggaacccat atgtcatacc atacacacaa aaaaattcca 5460 gtgaattata agtctaaatg gagaaggcaa aactttaaat cttttagaaa ataatataga 5520 agcatgcaga ccagcctggc caacatgatg aaaccctctc tactaataat aaaatcagta 5580 gaactactca ggactacttt gagtgggaag tccttttcta tgaagacttc tttggccaaa 5640 attaggctct aaatgcaagg agatagtgca tcatgcctgg ctgcacttac tgataaatga 5700 tgttatcacc atctttaacc aaatgcacag gaacaagtta tggtactgat gtgctggatt 5760 gagaaggagc tctacttcct tgacaggaca catttgtatc aacttaaaaa agcagatttt 5820 tgccagcaga actattcatt cagaggtagg aaacttagaa tagatgatgt cactgattag 5880 catggcttcc ccatctccac agctgcttcc cacccaggtt gcccacagtt gagtttgtcc 5940 agtgctcagg gctgcccact ctcagtaaga agccccacac cagcccctct ccaaatatgt 6000 tggctgttcc ttccattaaa gtgaccccac tttagagcag caagtggatt tctgtttctt 6060 acagttcagg aaggaggagt cagctgtgag aacctggagc ctgagatgct tctaagtccc 6120 actgctactg gggtcaggga agccagactc cagcatcagc agtcaggagc actaagccct 6180 tgccaacatc ctgtttctca gagaaactgc ttccattata atggttgtcc ttttttaagc 6240 tatcaagcca aacaaccagt gtctaccatt attctcatca cctgaagcca agggttctag 6300 caaaagtcaa gctgtcttgt aatggttgat gtgcctccag cttctgtctt cagtcactcc 6360 actcttagcc tgctctgaat caactctgac cacagttccc tggagcccct gccacctgct 6420 gcccctgcca ccttctccat ctgcagtgct gtgcagcctt ctgcactctt gcagagctaa 6480 taggtggaga cttgaaggaa gaggaggaaa gtttctcata atagccttgc tgcaagctca 6540 aatgggaggt gggcactgtg cccaggagcc ttggagcaaa ggctgtgccc aacctctgac 6600 tgcatccagg tttggtcttg acagagataa gaagccctgg cttttggagc caaaatctag 6660 gtcagactta ggcaggattc tcaaagttta tcagcagaac atgaggcaga agaccctttc 6720 tgctccagct tcttcaggct caaccttcat cagaatagat agaaagagag gctgtgaggg 6780 ttcttaaaac agaagcaaat ctgactcaga gaataaacaa cctcctagta aactacagct 6840 tagacagagc atctggtggt gagtgtgctc agtgtcctac tcaactgtct ggtatcagcc 6900 ctcatgagga cttctcttct ttccctcata gacctccatc tctgttttcc ttagcctgca 6960 gaaatctgga tggctattca cagaatgcct gtgctttcag agttgcattt tttctctggt 7020 attctggttc aagcatttga aggtaggaaa ggttctccaa gtgcaagaaa gccagccctg 7080 agcctcaact gcctggctag tgtggtcagt aggatgcaaa ggctgttgaa tgccacaagg 7140 ccaaacttta acctgtgtac cacaagccta gcagcagagg cagctctgct cactggaact 7200 ctctgtcttc tttctcctga gccttttctt ttcctgagtt ttctagctct cctcaacctt 7260 acctctgccc tacccaggac aaacccaaga gccactgttt ctgtgatgtc ctctccagcc 7320 ctaattaggc atcatgactt cagcctgacc ttccatgctc agaagcagtg ctaatccact 7380 tcagatgagc tgctctatgc aacacaggca gagcctacaa acctttgcac cagagccctc 7440 cacatatcag tgtttgttca tactcacttc aacagcaaat gtgactgctg agattaagat 7500 tttacacaag atggtctgta atttcacagt tagttttatc ccattaggta tgaaagaatt 7560 agcataattc cccttaaaca tgaatgaatc ttagattttt taataaatag ttttggaagt 7620 aaagacagag acatcaggag cacaaggaat agcctgagag gacaaacaga acaagaaaga 7680 gtctggaaat acacaggatg ttcttggcct cctcaaagca agtgcaagca gatagtacca 7740 gcagccccag gctatcagag cccagtgaag agaagtacca tgaaagccac agctctaacc 7800 accctgttcc agagtgacag acagtcccca agacaagcca gcctgagcca gagagagaac 7860 tgcaagagaa agtttctaat ttaggttctg ttagattcag acaagtgcag gtcatcctct 7920 ctccacagct actcacctct ccagcctaac aaagcctgca gtccacactc caaccctggt 7980 gtctcacctc ctagcctctc ccaacatcct gctctctgac catcttctgc atctctcatc 8040 tcaccatctc ccactgtcta cagcctactc ttgcaactac catctcattt tctgacatcc 8100 tgtctacatc ttctgccata ctctgccatc taccatacca cctcttacca tctaccacac 8160 catcttttat ctccatccct ctcagaagcc tccaagctga atcctgcttt atgtgttcat 8220 ctcagcccct gcatggaaag ctgaccccag aggcagaact attcccagag agcttggcca 8280 agaaaaacaa aactaccagc ctggccaggc tcaggagtag taagctgcag tgtctgttgt 8340 gttctagctt caacagctgc aggagttcca ctctcaaatg ctccacattt ctcacatcct 8400 cctgattctg gtcactaccc atcttcaaag aacagaatat ctcacatcag catactgtga 8460 aggactagtc atgggtgcag ctgctcagag ctgcaaagtc attctggatg gtggagagct 8520 tacaaacatt tcatgatgct ccccccgctc tgatggctgg agcccaatcc ctacacagac 8580 tcctgctgta tgtgttttcc tttcactctg agccacagcc agagggcagg cattcagtct 8640 cctcttcagg ctggggctgg ggcactgaga actcacccaa caccttgctc tcactccttc 8700 tgcaaaacaa gaaagagctt tgtgctgcag tagccatgaa gaatgaaagg aaggctttaa 8760 ctaaaaaatg tcagagatta ttttcaaccc cttactgtgg atcaccagca aggaggaaac 8820 acaacacaga gacatttttt cccctcaaat tatcaaaaga atcactgcat ttgttaaaga 8880 gagcaactga atcaggaagc agagttttga acatatcaga agttaggaat ctgcatcaga 8940 gacaaatgca gtcatggttg tttgctgcat accagcccta atcattagaa gcctcatgga 9000 cttcaaacat cattccctct gacaagatgc tctagcctaa ctccatgaga taaaataaat 9060 ctgcctttca gagccaaaga agagtccacc agcttcttct cagtgtgaac aagagctcca 9120 gtcaggttag tcagtccagt gcagtagagg agaccagtct gcatcctcta attttcaaag 9180 gcaagaagat ttgtttaccc tggacaccag gcacaagtga ggtcacagag ctcttagata 9240 tgcagtcctc atgagtgagg agactaaagc gcatgccatc aagacttcag tgtagagaaa 9300 acctccaaaa aagcctcctc actacttctg gaatagctca gaggccgagg cggcctcggc 9360 ctctgcataa ataaaaaaaa ttagtcagcc atggggcgga gaatgggcgg aactgggcgg 9420 agttaggggc gggatgggcg gagttagggg cgggactatg gttgctgact aattgagatg 9480 catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc tggttgctga 9540 ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg actttccaca 9600 ccctaactga cacacattcc acagctgcat taatgaatcg gccaacgcgc ggggagaggc 9660 ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 9720 cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 9780 ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 9840 aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 9900 cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 9960 cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 10020 gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 10080 tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 10140 cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 10200 ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 10260 gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 10320 gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 10380 accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 10440 ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 10500 tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 10560 aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 10620 taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 10680 gttgcctgac tcctgcaaac cacgttgtgt ctcaaaatct ctgatgttac attgcacaag 10740 ataaaaatat atcatcatga acaataaaac tgtctgctta cataaacagt aatacaaggg 10800 gtgttatgag ccatattcaa cgggaaacgt cttgctcgag gccgcgatta aattccaaca 10860 tggatgctga tttatatggg tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga 10920 caatctatcg attgtatggg aagcccgatg cgccagagtt gtttctgaaa catggcaaag 10980 gtagcgttgc caatgatgtt acagatgaga tggtcagact aaactggctg acggaattta 11040 tgcctcttcc gaccatcaag cattttatcc gtactcctga tgatgcatgg ttactcacca 11100 ctgcgatccc cgggaaaaca gcattccagg tattagaaga atatcctgat tcaggtgaaa 11160 atattgttga tgcgctggca gtgttcctgc gccggttgca ttcgattcct gtttgtaatt 11220 gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc gcaatcacga atgaataacg 11280 gtttggttga tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct 11340 ggaaagaaat gcataagctt ttgccattct caccggattc agtcgtcact catggtgatt 11400 tctcacttga taaccttatt tttgacgagg ggaaattaat aggttgtatt gatgttggac 11460 gagtcggaat cgcagaccga taccaggatc ttgccatcct atggaactgc ctcggtgagt 11520 tttctccttc attacagaaa cggctttttc aaaaatatgg tattgataat cctgatatga 11580 ataaattgca gtttcatttg atgctcgatg agtttttcta agggcggcct gccaccatac 11640 ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc ccatcggtga 11700 tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc ggtgatgagg gcgcgccaag 11760 tcgacgtccg gcagtc 11776 <210> 44 <211> 11064 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 44 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggaattc agcagcccca gcagagagga 660 atgccccaag cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct 720 gcttcaggcc gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta 780 cagcagcgtc gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt 840 tcctgctctg ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact 900 gagcatggga cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc 960 tgagcagaaa ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct 1020 gaatatcctg gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga 1080 ggaaggcatc ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag 1140 gacctacacc tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga 1200 agaggacacc aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc 1260 cgtgtcactg ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt 1320 gaatggcaag ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag 1380 atacttcgtg aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac 1440 agccgagaac gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt 1500 tacacccgag caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag 1560 cacccaccat aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg 1620 ggctaaagtg gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca 1680 ctggtatctg gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt 1740 ccccaacacc atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag 1800 cgtgcggctc ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct 1860 gctgtaccac gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc 1920 taactgggtc cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt 1980 ctacaagcag cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc 2040 tcagcgcgtt ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca 2100 ccctgatgga tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac 2160 catcaaggat cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac 2220 ctacctgtgg cgtagacagt gacaattgtt aattaagttt aaaccctcga ggccgcaagc 2280 cgcatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2340 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2400 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2460 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 2520 tgctggggag agatccacga taacaaacag cttttttggg ggggcggagt tagggcggag 2580 ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga atgggcggtg 2640 aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg tcgcagccgg 2700 gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta agtcactgac 2760 tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag tggcactatg 2820 aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct ctttcctctc 2880 ctgacagtcc ggaaagccac catgtggcag ctgtgggcca gcctgtgctg cctgctggtg 2940 ctggccaacg cccgcagccg ccccagcttc caccccctga gcgacgagct ggtgaactac 3000 gtgaacaagc gcaacaccac ctggcaggcc ggccacaact tctacaacgt ggacatgagc 3060 tacctgaagc gcctgtgcgg caccttcctg ggcggcccca agccccccca gcgcgtgatg 3120 ttcaccgagg acctgaagct gcccgccagc ttcgacgccc gcgagcagtg gccccagtgc 3180 cccaccatca aggagatccg cgaccagggc agctgcggca gctgctgggc cttcggcgcc 3240 gtggaggcca tcagcgaccg catctgcatc cacaccaacg cccacgtgag cgtggaggtg 3300 agcgccgagg acctgctgac ctgctgcggc agcatgtgcg gcgacggctg caacggcggc 3360 taccccgccg aggcctggaa cttctggacc cgcaagggcc tggtgagcgg cggcctgtac 3420 gagagccacg tgggctgccg cccctacagc atccccccct gcgagcacca cgtgaacggc 3480 agccgccccc cctgcaccgg cgagggcgac acccccaagt gcagcaagat ctgcgagccc 3540 ggctacagcc ccacctacaa gcaggacaag cactacggct acaacagcta cagcgtgagc 3600 aacagcgaga aggacatcat ggccgagatc tacaagaacg gccccgtgga gggcgccttc 3660 agcgtgtaca gcgacttcct gctgtacaag agcggcgtgt accagcacgt gaccggcgag 3720 atgatgggcg gccacgccat ccgcatcctg ggctggggcg tggagaacgg caccccctac 3780 tggctggtgg ccaacagctg gaacaccgac tggggcgaca acggcttctt caagatcctg 3840 cgcggccagg accactgcgg catcgagagc gaggtggtgg ccggcatccc ccgcaccgac 3900 cagtactggg agaagatctg acccagggga ctcagcggcc gctcgagtct agagggcccg 3960 tttaaacccg ctgatcagcc tcgaagacat gataagatac attgatgagt ttggacaaac 4020 cacaacaaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt 4080 atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca ttcattttat 4140 gtttcaggtt cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg 4200 tggtatgaac atattgactg aattccctgc aggttggcca ctccctctct gcgcgctcgc 4260 tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc 4320 tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag gggttcctgc 4380 ggccgctcgt acggtctcga ggaattcctg caggataact tgccaacctc attctaaaat 4440 gtatatagaa gcccaaaaga caataacaaa aatattcttg tagaacaaaa tgggaaagaa 4500 tgttccacta aatatcaaga tttagagcaa agcatgagat gtgtggggat agacagtgag 4560 gctgataaaa tagagtagag ctcagaaaca gacccattga tatatgtaag tgacctatga 4620 aaaaaatatg gcattttaca atgggaaaat gatggtcttt ttctttttta gaaaaacagg 4680 gaaatatatt tatatgtaaa aaataaaagg gaacccatat gtcataccat acacacaaaa 4740 aaattccagt gaattataag tctaaatgga gaaggcaaaa ctttaaatct tttagaaaat 4800 aatatagaag catgcagacc agcctggcca acatgatgaa accctctcta ctaataataa 4860 aatcagtaga actactcagg actactttga gtgggaagtc cttttctatg aagacttctt 4920 tggccaaaat taggctctaa atgcaaggag atagtgcatc atgcctggct gcacttactg 4980 ataaatgatg ttatcaccat ctttaaccaa atgcacagga acaagttatg gtactgatgt 5040 gctggattga gaaggagctc tacttccttg acaggacaca tttgtatcaa cttaaaaaag 5100 cagatttttg ccagcagaac tattcattca gaggtaggaa acttagaata gatgatgtca 5160 ctgattagca tggcttcccc atctccacag ctgcttccca cccaggttgc ccacagttga 5220 gtttgtccag tgctcagggc tgcccactct cagtaagaag ccccacacca gcccctctcc 5280 aaatatgttg gctgttcctt ccattaaagt gaccccactt tagagcagca agtggatttc 5340 tgtttcttac agttcaggaa ggaggagtca gctgtgagaa cctggagcct gagatgcttc 5400 taagtcccac tgctactggg gtcagggaag ccagactcca gcatcagcag tcaggagcac 5460 taagcccttg ccaacatcct gtttctcaga gaaactgctt ccattataat ggttgtcctt 5520 ttttaagcta tcaagccaaa caaccagtgt ctaccattat tctcatcacc tgaagccaag 5580 ggttctagca aaagtcaagc tgtcttgtaa tggttgatgt gcctccagct tctgtcttca 5640 gtcactccac tcttagcctg ctctgaatca actctgacca cagttccctg gagcccctgc 5700 cacctgctgc ccctgccacc ttctccatct gcagtgctgt gcagccttct gcactcttgc 5760 agagctaata ggtggagact tgaaggaaga ggaggaaagt ttctcataat agccttgctg 5820 caagctcaaa tgggaggtgg gcactgtgcc caggagcctt ggagcaaagg ctgtgcccaa 5880 cctctgactg catccaggtt tggtcttgac agagataaga agccctggct tttggagcca 5940 aaatctaggt cagacttagg caggattctc aaagtttatc agcagaacat gaggcagaag 6000 accctttctg ctccagcttc ttcaggctca accttcatca gaatagatag aaagagaggc 6060 tgtgagggtt cttaaaacag aagcaaatct gactcagaga ataaacaacc tcctagtaaa 6120 ctacagctta gacagagcat ctggtggtga gtgtgctcag tgtcctactc aactgtctgg 6180 tatcagccct catgaggact tctcttcttt ccctcataga cctccatctc tgttttcctt 6240 agcctgcaga aatctggatg gctattcaca gaatgcctgt gctttcagag ttgcattttt 6300 tctctggtat tctggttcaa gcatttgaag gtaggaaagg ttctccaagt gcaagaaagc 6360 cagccctgag cctcaactgc ctggctagtg tggtcagtag gatgcaaagg ctgttgaatg 6420 ccacaaggcc aaactttaac ctgtgtacca caagcctagc agcagaggca gctctgctca 6480 ctggaactct ctgtcttctt tctcctgagc cttttctttt cctgagtttt ctagctctcc 6540 tcaaccttac ctctgcccta cccaggacaa acccaagagc cactgtttct gtgatgtcct 6600 ctccagccct aattaggcat catgacttca gcctgacctt ccatgctcag aagcagtgct 6660 aatccacttc agatgagctg ctctatgcaa cacaggcaga gcctacaaac ctttgcacca 6720 gagccctcca catatcagtg tttgttcata ctcacttcaa cagcaaatgt gactgctgag 6780 attaagattt tacacaagat ggtctgtaat ttcacagtta gttttatccc attaggtatg 6840 aaagaattag cataattccc cttaaacatg aatgaatctt agatttttta ataaatagtt 6900 ttggaagtaa agacagagac atcaggagca caaggaatag cctgagagga caaacagaac 6960 aagaaagagt ctggaaatac acaggatgtt cttggcctcc tcaaagcaag tgcaagcaga 7020 tagtaccagc agccccaggc tatcagagcc cagtgaagag aagtaccatg aaagccacag 7080 ctctaaccac cctgttccag agtgacagac agtccccaag acaagccagc ctgagccaga 7140 gagagaactg caagagaaag tttctaattt aggttctgtt agattcagac aagtgcaggt 7200 catcctctct ccacagctac tcacctctcc agcctaacaa agcctgcagt ccacactcca 7260 accctggtgt ctcacctcct agcctctccc aacatcctgc tctctgacca tcttctgcat 7320 ctctcatctc accatctccc actgtctaca gcctactctt gcaactacca tctcattttc 7380 tgacatcctg tctacatctt ctgccatact ctgccatcta ccataccacc tcttaccatc 7440 taccacacca tcttttatct ccatccctct cagaagcctc caagctgaat cctgctttat 7500 gtgttcatct cagcccctgc atggaaagct gaccccagag gcagaactat tcccagagag 7560 cttggccaag aaaaacaaaa ctaccagcct ggccaggctc aggagtagta agctgcagtg 7620 tctgttgtgt tctagcttca acagctgcag gagttccact ctcaaatgct ccacatttct 7680 cacatcctcc tgattctggt cactacccat cttcaaagaa cagaatatct cacatcagca 7740 tactgtgaag gactagtcat gggtgcagct gctcagagct gcaaagtcat tctggatggt 7800 ggagagctta caaacatttc atgatgctcc ccccgctctg atggctggag cccaatccct 7860 acacagactc ctgctgtatg tgttttcctt tcactctgag ccacagccag agggcaggca 7920 ttcagtctcc tcttcaggct ggggctgggg cactgagaac tcacccaaca ccttgctctc 7980 actccttctg caaaacaaga aagagctttg tgctgcagta gccatgaaga atgaaaggaa 8040 ggctttaact aaaaaatgtc agagattatt ttcaacccct tactgtggat caccagcaag 8100 gaggaaacac aacacagaga cattttttcc cctcaaatta tcaaaagaat cactgcattt 8160 gttaaagaga gcaactgaat caggaagcag agttttgaac atatcagaag ttaggaatct 8220 gcatcagaga caaatgcagt catggttgtt tgctgcatac cagccctaat cattagaagc 8280 ctcatggact tcaaacatca ttccctctga caagatgctc tagcctaact ccatgagata 8340 aaataaatct gcctttcaga gccaaagaag agtccaccag cttcttctca gtgtgaacaa 8400 gagctccagt caggttagtc agtccagtgc agtagaggag accagtctgc atcctctaat 8460 tttcaaaggc aagaagattt gtttaccctg gacaccaggc acaagtgagg tcacagagct 8520 cttagatatg cagtcctcat gagtgaggag actaaagcgc atgccatcaa gacttcagtg 8580 tagagaaaac ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggccgaggcg 8640 gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 8700 ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 8760 ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 8820 gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 8880 tttccacacc ctaactgaca cacattccac agctgcatta atgaatcggc caacgcgcgg 8940 ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 9000 cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 9060 cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 9120 accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 9180 acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 9240 cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 9300 acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 9360 atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 9420 agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 9480 acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 9540 gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 9600 gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 9660 gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 9720 gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 9780 acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 9840 tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 9900 ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 9960 catccatagt tgcctgactc ctgcaaacca cgttgtgtct caaaatctct gatgttacat 10020 tgcacaagat aaaaatatat catcatgaac aataaaactg tctgcttaca taaacagtaa 10080 tacaaggggt gttatgagcc atattcaacg ggaaacgtct tgctcgaggc cgcgattaaa 10140 ttccaacatg gatgctgatt tatatgggta taaatgggct cgcgataatg tcgggcaatc 10200 aggtgcgaca atctatcgat tgtatgggaa gcccgatgcg ccagagttgt ttctgaaaca 10260 tggcaaaggt agcgttgcca atgatgttac agatgagatg gtcagactaa actggctgac 10320 ggaatttatg cctcttccga ccatcaagca ttttatccgt actcctgatg atgcatggtt 10380 actcaccact gcgatccccg ggaaaacagc attccaggta ttagaagaat atcctgattc 10440 aggtgaaaat attgttgatg cgctggcagt gttcctgcgc cggttgcatt cgattcctgt 10500 ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc gctcaggcgc aatcacgaat 10560 gaataacggt ttggttgatg cgagtgattt tgatgacgag cgtaatggct ggcctgttga 10620 acaagtctgg aaagaaatgc ataagctttt gccattctca ccggattcag tcgtcactca 10680 tggtgatttc tcacttgata accttatttt tgacgagggg aaattaatag gttgtattga 10740 tgttggacga gtcggaatcg cagaccgata ccaggatctt gccatcctat ggaactgcct 10800 cggtgagttt tctccttcat tacagaaacg gctttttcaa aaatatggta ttgataatcc 10860 tgatatgaat aaattgcagt ttcatttgat gctcgatgag tttttctaag ggcggcctgc 10920 caccataccc acgccgaaac aagcgctcat gagcccgaag tggcgagccc gatcttcccc 10980 atcggtgatg tcggcgatat aggcgccagc aaccgcacct gtggcgccgg tgatgagggc 11040 gcgccaagtc gacgtccggc agtc 11064 <210> 45 <211> 250 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 45 Met Glu Lys Gly Pro Val Arg Ala Pro Ala Glu Lys Pro Arg Gly Ala 1 5 10 15 Arg Cys Ser Asn Gly Phe Pro Glu Arg Asp Pro Pro Arg Pro Gly Pro 20 25 30 Ser Arg Pro Ala Glu Lys Pro Pro Arg Pro Glu Ala Lys Ser Ala Gln 35 40 45 Pro Ala Asp Gly Trp Lys Gly Glu Arg Pro Arg Ser Glu Glu Asp Asn 50 55 60 Glu Leu Asn Leu Pro Asn Leu Ala Ala Ala Tyr Ser Ser Ile Leu Ser 65 70 75 80 Ser Leu Gly Glu Asn Pro Gln Arg Gln Gly Leu Leu Lys Thr Pro Trp 85 90 95 Arg Ala Ala Ser Ala Met Gln Phe Phe Thr Lys Gly Tyr Gln Glu Thr 100 105 110 Ile Ser Asp Val Leu Asn Asp Ala Ile Phe Asp Glu Asp His Asp Glu 115 120 125 Met Val Ile Val Lys Asp Ile Asp Met Phe Ser Met Cys Glu His His 130 135 140 Leu Val Pro Phe Val Gly Lys Val His Ile Gly Tyr Leu Pro Asn Lys 145 150 155 160 Gln Val Leu Gly Leu Ser Lys Leu Ala Arg Ile Val Glu Ile Tyr Ser 165 170 175 Arg Arg Leu Gln Val Gln Glu Arg Leu Thr Lys Gln Ile Ala Val Ala 180 185 190 Ile Thr Glu Ala Leu Arg Pro Ala Gly Val Gly Val Val Val Glu Ala 195 200 205 Thr His Met Cys Met Val Met Arg Gly Val Gln Lys Met Asn Ser Lys 210 215 220 Thr Val Thr Ser Thr Met Leu Gly Val Phe Arg Glu Asp Pro Lys Thr 225 230 235 240 Arg Glu Glu Phe Leu Thr Leu Ile Arg Ser 245 250 <210> 46 <211> 750 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 46 atggagaagg gccccgtgcg cgcccccgcc gagaagcccc gcggcgcccg ctgcagcaac 60 ggcttccccg agcgcgaccc cccccgcccc ggccccagcc gccccgccga gaagcccccc 120 cgccccgagg ccaagagcgc ccagcccgcc gacggctgga agggcgagcg cccccgcagc 180 gaggaggaca acgagctgaa cctgcccaac ctggccgccg cctacagcag catcctgagc 240 agcctgggcg agaaccccca gcgccagggc ctgctgaaga ccccctggcg cgccgccagc 300 gccatgcagt tcttcaccaa gggctaccag gagaccatca gcgacgtgct gaacgacgcc 360 atcttcgacg aggaccacga cgagatggtg atcgtgaagg acatcgacat gttcagcatg 420 tgcgagcacc acctggtgcc cttcgtgggc aaggtgcaca tcggctacct gcccaacaag 480 caggtgctgg gcctgagcaa gctggcccgc atcgtggaga tctacagccg ccgcctgcag 540 gtgcaggagc gcctgaccaa gcagatcgcc gtggccatca ccgaggccct gcgccccgcc 600 ggcgtgggcg tggtggtgga ggccacccac atgtgcatgg tgatgcgcgg cgtgcagaag 660 atgaacagca agaccgtgac cagcaccatg ctgggcgtgt tccgcgagga ccccaagacc 720 cgcgaggagt tcctgaccct gatccgcagc 750 <210> 47 <211> 203 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 47 Met Gly Ser Arg Asp His Leu Phe Lys Val Leu Val Val Gly Asp Ala 1 5 10 15 Ala Val Gly Lys Thr Ser Leu Val Gln Arg Tyr Ser Gln Asp Ser Phe 20 25 30 Ser Lys His Tyr Lys Ser Thr Val Gly Val Asp Phe Ala Leu Lys Val 35 40 45 Leu Gln Trp Ser Asp Tyr Glu Ile Val Arg Leu Gln Leu Trp Asp Ile 50 55 60 Ala Gly Gln Glu Arg Phe Thr Ser Met Thr Arg Leu Tyr Tyr Arg Asp 65 70 75 80 Ala Ser Ala Cys Val Ile Met Phe Asp Val Thr Asn Ala Thr Thr Phe 85 90 95 Ser Asn Ser Gln Arg Trp Lys Gln Asp Leu Asp Ser Lys Leu Thr Leu 100 105 110 Pro Asn Gly Glu Pro Val Pro Cys Leu Leu Leu Ala Asn Lys Cys Asp 115 120 125 Leu Ser Pro Trp Ala Val Ser Arg Asp Gln Ile Asp Arg Phe Ser Lys 130 135 140 Glu Asn Gly Phe Thr Gly Trp Thr Glu Thr Ser Val Lys Glu Asn Lys 145 150 155 160 Asn Ile Asn Glu Ala Met Arg Val Leu Ile Glu Lys Met Met Arg Asn 165 170 175 Ser Thr Glu Asp Ile Met Ser Leu Ser Thr Gln Gly Asp Tyr Ile Asn 180 185 190 Leu Gln Thr Lys Ser Ser Ser Trp Ser Cys Cys 195 200 <210> 48 <211> 609 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 48 atgggcagcc gcgaccacct gttcaaggtg ctggtggtgg gcgacgccgc cgtgggcaag 60 accagcctgg tgcagcgcta cagccaggac agcttcagca agcactacaa gagcaccgtg 120 ggcgtggact tcgccctgaa ggtgctgcag tggagcgact acgagatcgt gcgcctgcag 180 ctgtgggaca tcgccggcca ggagcgcttc accagcatga cccgcctgta ctaccgcgac 240 gccagcgcct gcgtgatcat gttcgacgtg accaacgcca ccaccttcag caacagccag 300 cgctggaagc aggacctgga cagcaagctg accctgccca acggcgagcc cgtgccctgc 360 ctgctgctgg ccaacaagtg cgacctgagc ccctgggccg tgagccgcga ccagatcgac 420 cgcttcagca aggagaacgg cttcaccggc tggaccgaga ccagcgtgaa ggagaacaag 480 aacatcaacg aggccatgcg cgtgctgatc gagaagatga tgcgcaacag caccgaggac 540 atcatgagcc tgagcaccca gggcgactac atcaacctgc agaccaagag cagcagctgg 600 agctgctgc 609 <210> 49 <211> 796 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 49 Met Pro Thr Thr Gln Gln Ser Pro Gln Asp Glu Gln Glu Lys Leu Leu 1 5 10 15 Asp Glu Ala Ile Gln Ala Val Lys Val Gln Ser Phe Gln Met Lys Arg 20 25 30 Cys Leu Asp Lys Asn Lys Leu Met Asp Ala Leu Lys His Ala Ser Asn 35 40 45 Met Leu Gly Glu Leu Arg Thr Ser Met Leu Ser Pro Lys Ser Tyr Tyr 50 55 60 Glu Leu Tyr Met Ala Ile Ser Asp Glu Leu His Tyr Leu Glu Val Tyr 65 70 75 80 Leu Thr Asp Glu Phe Ala Lys Gly Arg Lys Val Ala Asp Leu Tyr Glu 85 90 95 Leu Val Gln Tyr Ala Gly Asn Ile Ile Pro Arg Leu Tyr Leu Leu Ile 100 105 110 Thr Val Gly Val Val Tyr Val Lys Ser Phe Pro Gln Ser Arg Lys Asp 115 120 125 Ile Leu Lys Asp Leu Val Glu Met Cys Arg Gly Val Gln His Pro Leu 130 135 140 Arg Gly Leu Phe Leu Arg Asn Tyr Leu Leu Gln Cys Thr Arg Asn Ile 145 150 155 160 Leu Pro Asp Glu Gly Glu Pro Thr Asp Glu Glu Thr Thr Gly Asp Ile 165 170 175 Ser Asp Ser Met Asp Phe Val Leu Leu Asn Phe Ala Glu Met Asn Lys 180 185 190 Leu Trp Val Arg Met Gln His Gln Gly His Ser Arg Asp Arg Glu Lys 195 200 205 Arg Glu Arg Glu Arg Gln Glu Leu Arg Ile Leu Val Gly Thr Asn Leu 210 215 220 Val Arg Leu Ser Gln Leu Glu Gly Val Asn Val Glu Arg Tyr Lys Gln 225 230 235 240 Ile Val Leu Thr Gly Ile Leu Glu Gln Val Val Asn Cys Arg Asp Ala 245 250 255 Leu Ala Gln Glu Tyr Leu Met Glu Cys Ile Ile Gln Val Phe Pro Asp 260 265 270 Glu Phe His Leu Gln Thr Leu Asn Pro Phe Leu Arg Ala Cys Ala Glu 275 280 285 Leu His Gln Asn Val Asn Val Lys Asn Ile Ile Ile Ala Leu Ile Asp 290 295 300 Arg Leu Ala Leu Phe Ala His Arg Glu Asp Gly Pro Gly Ile Pro Ala 305 310 315 320 Asp Ile Lys Leu Phe Asp Ile Phe Ser Gln Gln Val Ala Thr Val Ile 325 330 335 Gln Ser Arg Gln Asp Met Pro Ser Glu Asp Val Val Ser Leu Gln Val 340 345 350 Ser Leu Ile Asn Leu Ala Met Lys Cys Tyr Pro Asp Arg Val Asp Tyr 355 360 365 Val Asp Lys Val Leu Glu Thr Thr Val Glu Ile Phe Asn Lys Leu Asn 370 375 380 Leu Glu His Ile Ala Thr Ser Ser Ala Val Ser Lys Glu Leu Thr Arg 385 390 395 400 Leu Leu Lys Ile Pro Val Asp Thr Tyr Asn Asn Ile Leu Thr Val Leu 405 410 415 Lys Leu Lys His Phe His Pro Leu Phe Glu Tyr Phe Asp Tyr Glu Ser 420 425 430 Arg Lys Ser Met Ser Cys Tyr Val Leu Ser Asn Val Leu Asp Tyr Asn 435 440 445 Thr Glu Ile Val Ser Gln Asp Gln Val Asp Ser Ile Met Asn Leu Val 450 455 460 Ser Thr Leu Ile Gln Asp Gln Pro Asp Gln Pro Val Glu Asp Pro Asp 465 470 475 480 Pro Glu Asp Phe Ala Asp Glu Gln Ser Leu Val Gly Arg Phe Ile His 485 490 495 Leu Leu Arg Ser Glu Asp Pro Asp Gln Gln Tyr Leu Ile Leu Asn Thr 500 505 510 Ala Arg Lys His Phe Gly Ala Gly Gly Asn Gln Arg Ile Arg Phe Thr 515 520 525 Leu Pro Pro Leu Val Phe Ala Ala Tyr Gln Leu Ala Phe Arg Tyr Lys 530 535 540 Glu Asn Ser Lys Val Asp Asp Lys Trp Glu Lys Lys Cys Gln Lys Ile 545 550 555 560 Phe Ser Phe Ala His Gln Thr Ile Ser Ala Leu Ile Lys Ala Glu Leu 565 570 575 Ala Glu Leu Pro Leu Arg Leu Phe Leu Gln Gly Ala Leu Ala Ala Gly 580 585 590 Glu Ile Gly Phe Glu Asn His Glu Thr Val Ala Tyr Glu Phe Met Ser 595 600 605 Gln Ala Phe Ser Leu Tyr Glu Asp Glu Ile Ser Asp Ser Lys Ala Gln 610 615 620 Leu Ala Ala Ile Thr Leu Ile Ile Gly Thr Phe Glu Arg Met Lys Cys 625 630 635 640 Phe Ser Glu Glu Asn His Glu Pro Leu Arg Thr Gln Cys Ala Leu Ala 645 650 655 Ala Ser Lys Leu Leu Lys Lys Pro Asp Gln Gly Arg Ala Val Ser Thr 660 665 670 Cys Ala His Leu Phe Trp Ser Gly Arg Asn Thr Asp Lys Asn Gly Glu 675 680 685 Glu Leu His Gly Gly Lys Arg Val Met Glu Cys Leu Lys Lys Ala Leu 690 695 700 Lys Ile Ala Asn Gln Cys Met Asp Pro Ser Leu Gln Val Gln Leu Phe 705 710 715 720 Ile Glu Ile Leu Asn Arg Tyr Ile Tyr Phe Tyr Glu Lys Glu Asn Asp 725 730 735 Ala Val Thr Ile Gln Val Leu Asn Gln Leu Ile Gln Lys Ile Arg Glu 740 745 750 Asp Leu Pro Asn Leu Glu Ser Ser Glu Glu Thr Glu Gln Ile Asn Lys 755 760 765 His Phe His Asn Thr Leu Glu His Leu Arg Leu Arg Arg Glu Ser Pro 770 775 780 Glu Ser Glu Gly Pro Ile Tyr Glu Gly Leu Ile Leu 785 790 795 <210> 50 <211> 2388 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 50 atgcccacca cccagcagag cccccaggac gagcaggaga agctgctgga cgaggccatc 60 caggccgtga aggtgcagag cttccagatg aagcgctgcc tggacaagaa caagctgatg 120 gacgccctga agcacgccag caacatgctg ggcgagctgc gcaccagcat gctgagcccc 180 aagagctact acgagctgta catggccatc agcgacgagc tgcactacct ggaggtgtac 240 ctgaccgacg agttcgccaa gggccgcaag gtggccgacc tgtacgagct ggtgcagtac 300 gccggcaaca tcatcccccg cctgtacctg ctgatcaccg tgggcgtggt gtacgtgaag 360 agcttccccc agagccgcaa ggacatcctg aaggacctgg tggagatgtg ccgcggcgtg 420 cagcaccccc tgcgcggcct gttcctgcgc aactacctgc tgcagtgcac ccgcaacatc 480 ctgcccgacg agggcgagcc caccgacgag gagaccaccg gcgacatcag cgacagcatg 540 gacttcgtgc tgctgaactt cgccgagatg aacaagctgt gggtgcgcat gcagcaccag 600 ggccacagcc gcgaccgcga gaagcgcgag cgcgagcgcc aggagctgcg catcctggtg 660 ggcaccaacc tggtgcgcct gagccagctg gagggcgtga acgtggagcg ctacaagcag 720 atcgtgctga ccggcatcct ggagcaggtg gtgaactgcc gcgacgccct ggcccaggag 780 tacctgatgg agtgcatcat ccaggtgttc cccgacgagt tccacctgca gaccctgaac 840 cccttcctgc gcgcctgcgc cgagctgcac cagaacgtga acgtgaagaa catcatcatc 900 gccctgatcg accgcctggc cctgttcgcc caccgcgagg acggccccgg catccccgcc 960 gacatcaagc tgttcgacat cttcagccag caggtggcca ccgtgatcca gagccgccag 1020 gacatgccca gcgaggacgt ggtgagcctg caggtgagcc tgatcaacct ggccatgaag 1080 tgctaccccg accgcgtgga ctacgtggac aaggtgctgg agaccaccgt ggagatcttc 1140 aacaagctga acctggagca catcgccacc agcagcgccg tgagcaagga gctgacccgc 1200 ctgctgaaga tccccgtgga cacctacaac aacatcctga ccgtgctgaa gctgaagcac 1260 ttccaccccc tgttcgagta cttcgactac gagagccgca agagcatgag ctgctacgtg 1320 ctgagcaacg tgctggacta caacaccgag atcgtgagcc aggaccaggt ggacagcatc 1380 atgaacctgg tgagcaccct gatccaggac cagcccgacc agcccgtgga ggaccccgac 1440 cccgaggact tcgccgacga gcagagcctg gtgggccgct tcatccacct gctgcgcagc 1500 gaggaccccg accagcagta cctgatcctg aacaccgccc gcaagcactt cggcgccggc 1560 ggcaaccagc gcatccgctt caccctgccc cccctggtgt tcgccgccta ccagctggcc 1620 ttccgctaca aggagaacag caaggtggac gacaagtggg agaagaagtg ccagaagatc 1680 ttcagcttcg cccaccagac catcagcgcc ctgatcaagg ccgagctggc cgagctgccc 1740 ctgcgcctgt tcctgcaggg cgccctggcc gccggcgaga tcggcttcga gaaccacgag 1800 accgtggcct acgagttcat gagccaggcc ttcagcctgt acgaggacga gatcagcgac 1860 agcaaggccc agctggccgc catcaccctg atcatcggca ccttcgagcg catgaagtgc 1920 ttcagcgagg agaaccacga gcccctgcgc acccagtgcg ccctggccgc cagcaagctg 1980 ctgaagaagc ccgaccaggg ccgcgccgtg agcacctgcg cccacctgtt ctggagcggc 2040 cgcaacaccg acaagaacgg cgaggagctg cacggcggca agcgcgtgat ggagtgcctg 2100 aagaaggccc tgaagatcgc caaccagtgc atggacccca gcctgcaggt gcagctgttc 2160 atcgagatcc tgaaccgcta catctacttc tacgagaagg agaacgacgc cgtgaccatc 2220 caggtgctga accagctgat ccagaagatc cgcgaggacc tgcccaacct ggagagcagc 2280 gaggagaccg agcagatcaa caagcacttc cacaacaccc tggagcacct gcgcctgcgc 2340 cgcgagagcc ccgagagcga gggccccatc tacgagggcc tgatcctg 2388 <210> 51 <211> 11081 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 51 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatggaa 900 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 960 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1020 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1080 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1140 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1200 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1260 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1320 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1380 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1440 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1500 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1560 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 1620 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 1680 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 1740 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 1800 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 1860 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 1920 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 1980 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2040 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2100 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2160 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2220 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2280 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2340 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2400 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2460 agccctggct actccatcca cacctacctg tggcgtagac aggagggcag aggaagtctt 2520 ctgacatgcg gagacgtgga agagaatccc ggccctatgg agaagggccc cgtgcgcgcc 2580 cccgccgaga agccccgcgg cgcccgctgc agcaacggct tccccgagcg cgaccccccc 2640 cgccccggcc ccagccgccc cgccgagaag cccccccgcc ccgaggccaa gagcgcccag 2700 cccgccgacg gctggaaggg cgagcgcccc cgcagcgagg aggacaacga gctgaacctg 2760 cccaacctgg ccgccgccta cagcagcatc ctgagcagcc tgggcgagaa cccccagcgc 2820 cagggcctgc tgaagacccc ctggcgcgcc gccagcgcca tgcagttctt caccaagggc 2880 taccaggaga ccatcagcga cgtgctgaac gacgccatct tcgacgagga ccacgacgag 2940 atggtgatcg tgaaggacat cgacatgttc agcatgtgcg agcaccacct ggtgcccttc 3000 gtgggcaagg tgcacatcgg ctacctgccc aacaagcagg tgctgggcct gagcaagctg 3060 gcccgcatcg tggagatcta cagccgccgc ctgcaggtgc aggagcgcct gaccaagcag 3120 atcgccgtgg ccatcaccga ggccctgcgc cccgccggcg tgggcgtggt ggtggaggcc 3180 acccacatgt gcatggtgat gcgcggcgtg cagaagatga acagcaagac cgtgaccagc 3240 accatgctgg gcgtgttccg cgaggacccc aagacccgcg aggagttcct gaccctgatc 3300 cgcagctgac aattgttaat taagtttaaa ccctcgaggc cgcaagctta tcgataatca 3360 acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt 3420 tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc 3480 tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc 3540 cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg 3600 gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc 3660 cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg 3720 cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg 3780 tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc 3840 agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct 3900 tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcatcgat accgtcgact 3960 agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 4020 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 4080 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 4140 caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga gagatccacg 4200 ataacaaaca gcttttttgg ggtgaacata ttgactgaat tccctgcagg ttggccactc 4260 cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 4320 cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 4380 tcactagggg ttcctgcggc cgctcgtacg gtctcgagga attcctgcag gataacttgc 4440 caacctcatt ctaaaatgta tatagaagcc caaaagacaa taacaaaaat attcttgtag 4500 aacaaaatgg gaaagaatgt tccactaaat atcaagattt agagcaaagc atgagatgtg 4560 tggggataga cagtgaggct gataaaatag agtagagctc agaaacagac ccattgatat 4620 atgtaagtga cctatgaaaa aaatatggca ttttacaatg ggaaaatgat ggtctttttc 4680 ttttttagaa aaacagggaa atatatttat atgtaaaaaa taaaagggaa cccatatgtc 4740 ataccataca cacaaaaaaa ttccagtgaa ttataagtct aaatggagaa ggcaaaactt 4800 taaatctttt agaaaataat atagaagcat gcagaccagc ctggccaaca tgatgaaacc 4860 ctctctacta ataataaaat cagtagaact actcaggact actttgagtg ggaagtcctt 4920 ttctatgaag acttctttgg ccaaaattag gctctaaatg caaggagata gtgcatcatg 4980 cctggctgca cttactgata aatgatgtta tcaccatctt taaccaaatg cacaggaaca 5040 agttatggta ctgatgtgct ggattgagaa ggagctctac ttccttgaca ggacacattt 5100 gtatcaactt aaaaaagcag atttttgcca gcagaactat tcattcagag gtaggaaact 5160 tagaatagat gatgtcactg attagcatgg cttccccatc tccacagctg cttcccaccc 5220 aggttgccca cagttgagtt tgtccagtgc tcagggctgc ccactctcag taagaagccc 5280 cacaccagcc cctctccaaa tatgttggct gttccttcca ttaaagtgac cccactttag 5340 agcagcaagt ggatttctgt ttcttacagt tcaggaagga ggagtcagct gtgagaacct 5400 ggagcctgag atgcttctaa gtcccactgc tactggggtc agggaagcca gactccagca 5460 tcagcagtca ggagcactaa gcccttgcca acatcctgtt tctcagagaa actgcttcca 5520 ttataatggt tgtccttttt taagctatca agccaaacaa ccagtgtcta ccattattct 5580 catcacctga agccaagggt tctagcaaaa gtcaagctgt cttgtaatgg ttgatgtgcc 5640 tccagcttct gtcttcagtc actccactct tagcctgctc tgaatcaact ctgaccacag 5700 ttccctggag cccctgccac ctgctgcccc tgccaccttc tccatctgca gtgctgtgca 5760 gccttctgca ctcttgcaga gctaataggt ggagacttga aggaagagga ggaaagtttc 5820 tcataatagc cttgctgcaa gctcaaatgg gaggtgggca ctgtgcccag gagccttgga 5880 gcaaaggctg tgcccaacct ctgactgcat ccaggtttgg tcttgacaga gataagaagc 5940 cctggctttt ggagccaaaa tctaggtcag acttaggcag gattctcaaa gtttatcagc 6000 agaacatgag gcagaagacc ctttctgctc cagcttcttc aggctcaacc ttcatcagaa 6060 tagatagaaa gagaggctgt gagggttctt aaaacagaag caaatctgac tcagagaata 6120 aacaacctcc tagtaaacta cagcttagac agagcatctg gtggtgagtg tgctcagtgt 6180 cctactcaac tgtctggtat cagccctcat gaggacttct cttctttccc tcatagacct 6240 ccatctctgt tttccttagc ctgcagaaat ctggatggct attcacagaa tgcctgtgct 6300 ttcagagttg cattttttct ctggtattct ggttcaagca tttgaaggta ggaaaggttc 6360 tccaagtgca agaaagccag ccctgagcct caactgcctg gctagtgtgg tcagtaggat 6420 gcaaaggctg ttgaatgcca caaggccaaa ctttaacctg tgtaccacaa gcctagcagc 6480 agaggcagct ctgctcactg gaactctctg tcttctttct cctgagcctt ttcttttcct 6540 gagttttcta gctctcctca accttacctc tgccctaccc aggacaaacc caagagccac 6600 tgtttctgtg atgtcctctc cagccctaat taggcatcat gacttcagcc tgaccttcca 6660 tgctcagaag cagtgctaat ccacttcaga tgagctgctc tatgcaacac aggcagagcc 6720 tacaaacctt tgcaccagag ccctccacat atcagtgttt gttcatactc acttcaacag 6780 caaatgtgac tgctgagatt aagattttac acaagatggt ctgtaatttc acagttagtt 6840 ttatcccatt aggtatgaaa gaattagcat aattcccctt aaacatgaat gaatcttaga 6900 ttttttaata aatagttttg gaagtaaaga cagagacatc aggagcacaa ggaatagcct 6960 gagaggacaa acagaacaag aaagagtctg gaaatacaca ggatgttctt ggcctcctca 7020 aagcaagtgc aagcagatag taccagcagc cccaggctat cagagcccag tgaagagaag 7080 taccatgaaa gccacagctc taaccaccct gttccagagt gacagacagt ccccaagaca 7140 agccagcctg agccagagag agaactgcaa gagaaagttt ctaatttagg ttctgttaga 7200 ttcagacaag tgcaggtcat cctctctcca cagctactca cctctccagc ctaacaaagc 7260 ctgcagtcca cactccaacc ctggtgtctc acctcctagc ctctcccaac atcctgctct 7320 ctgaccatct tctgcatctc tcatctcacc atctcccact gtctacagcc tactcttgca 7380 actaccatct cattttctga catcctgtct acatcttctg ccatactctg ccatctacca 7440 taccacctct taccatctac cacaccatct tttatctcca tccctctcag aagcctccaa 7500 gctgaatcct gctttatgtg ttcatctcag cccctgcatg gaaagctgac cccagaggca 7560 gaactattcc cagagagctt ggccaagaaa aacaaaacta ccagcctggc caggctcagg 7620 agtagtaagc tgcagtgtct gttgtgttct agcttcaaca gctgcaggag ttccactctc 7680 aaatgctcca catttctcac atcctcctga ttctggtcac tacccatctt caaagaacag 7740 aatatctcac atcagcatac tgtgaaggac tagtcatggg tgcagctgct cagagctgca 7800 aagtcattct ggatggtgga gagcttacaa acatttcatg atgctccccc cgctctgatg 7860 gctggagccc aatccctaca cagactcctg ctgtatgtgt tttcctttca ctctgagcca 7920 cagccagagg gcaggcattc agtctcctct tcaggctggg gctggggcac tgagaactca 7980 cccaacacct tgctctcact ccttctgcaa aacaagaaag agctttgtgc tgcagtagcc 8040 atgaagaatg aaaggaaggc tttaactaaa aaatgtcaga gattattttc aaccccttac 8100 tgtggatcac cagcaaggag gaaacacaac acagagacat tttttcccct caaattatca 8160 aaagaatcac tgcatttgtt aaagagagca actgaatcag gaagcagagt tttgaacata 8220 tcagaagtta ggaatctgca tcagagacaa atgcagtcat ggttgtttgc tgcataccag 8280 ccctaatcat tagaagcctc atggacttca aacatcattc cctctgacaa gatgctctag 8340 cctaactcca tgagataaaa taaatctgcc tttcagagcc aaagaagagt ccaccagctt 8400 cttctcagtg tgaacaagag ctccagtcag gttagtcagt ccagtgcagt agaggagacc 8460 agtctgcatc ctctaatttt caaaggcaag aagatttgtt taccctggac accaggcaca 8520 agtgaggtca cagagctctt agatatgcag tcctcatgag tgaggagact aaagcgcatg 8580 ccatcaagac ttcagtgtag agaaaacctc caaaaaagcc tcctcactac ttctggaata 8640 gctcagaggc cgaggcggcc tcggcctctg cataaataaa aaaaattagt cagccatggg 8700 gcggagaatg ggcggaactg ggcggagtta ggggcgggat gggcggagtt aggggcggga 8760 ctatggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 8820 gggactttcc acacctggtt gctgactaat tgagatgcat gctttgcata cttctgcctg 8880 ctggggagcc tggggacttt ccacacccta actgacacac attccacagc tgcattaatg 8940 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 9000 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 9060 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 9120 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 9180 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 9240 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 9300 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 9360 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 9420 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 9480 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 9540 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 9600 tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 9660 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 9720 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 9780 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 9840 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 9900 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 9960 gatctgtcta tttcgttcat ccatagttgc ctgactcctg caaaccacgt tgtgtctcaa 10020 aatctctgat gttacattgc acaagataaa aatatatcat catgaacaat aaaactgtct 10080 gcttacataa acagtaatac aaggggtgtt atgagccata ttcaacggga aacgtcttgc 10140 tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 10200 gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca 10260 gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 10320 agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 10380 cctgatgatg catggttact caccactgcg atccccggga aaacagcatt ccaggtatta 10440 gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 10500 ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct 10560 caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 10620 aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 10680 gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 10740 ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 10800 atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 10860 tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 10920 ttctaagggc ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 10980 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 11040 gcgccggtga tgagggcgcg ccaagtcgac gtccggcagt c 11081 <210> 52 <211> 10940 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 52 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgggc 900 agccgcgacc acctgttcaa ggtgctggtg gtgggcgacg ccgccgtggg caagaccagc 960 ctggtgcagc gctacagcca ggacagcttc agcaagcact acaagagcac cgtgggcgtg 1020 gacttcgccc tgaaggtgct gcagtggagc gactacgaga tcgtgcgcct gcagctgtgg 1080 gacatcgccg gccaggagcg cttcaccagc atgacccgcc tgtactaccg cgacgccagc 1140 gcctgcgtga tcatgttcga cgtgaccaac gccaccacct tcagcaacag ccagcgctgg 1200 aagcaggacc tggacagcaa gctgaccctg cccaacggcg agcccgtgcc ctgcctgctg 1260 ctggccaaca agtgcgacct gagcccctgg gccgtgagcc gcgaccagat cgaccgcttc 1320 agcaaggaga acggcttcac cggctggacc gagaccagcg tgaaggagaa caagaacatc 1380 aacgaggcca tgcgcgtgct gatcgagaag atgatgcgca acagcaccga ggacatcatg 1440 agcctgagca cccagggcga ctacatcaac ctgcagacca agagcagcag ctggagctgc 1500 tgcgagggca gaggaagtct tctgacatgc ggagacgtgg aagagaatcc cggccctatg 1560 gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1620 gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1680 ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1740 tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1800 accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1860 actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1920 ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1980 ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 2040 atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 2100 cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 2160 agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 2220 acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2280 gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2340 cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2400 ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2460 gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2520 gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2580 aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2640 acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2700 gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2760 tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2820 ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2880 atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2940 ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 3000 gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 3060 cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 3120 atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 3180 aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3240 tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3300 tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3360 taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3420 ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3480 gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3540 ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3600 gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3660 cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3720 cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3780 ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3840 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3900 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3960 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 4020 tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 4080 gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 4140 tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4200 tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4260 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4320 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4380 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4440 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4500 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4560 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4620 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4680 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4740 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4800 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4860 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4920 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4980 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 5040 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 5100 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 5160 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 5220 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5280 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5340 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5400 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5460 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5520 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5580 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5640 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5700 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5760 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5820 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5880 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5940 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 6000 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 6060 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 6120 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 6180 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6240 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6300 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6360 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6420 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6480 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6540 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6600 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6660 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6720 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6780 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6840 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6900 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6960 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 7020 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 7080 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 7140 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 7200 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7260 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7320 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7380 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7440 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7500 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7560 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7620 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7680 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7740 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7800 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7860 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7920 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7980 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 8040 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 8100 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 8160 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 8220 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8280 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8340 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8400 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8460 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8520 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8580 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8640 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8700 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8760 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8820 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8880 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8940 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 9000 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 9060 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 9120 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 9180 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9240 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9300 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9360 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9420 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9480 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9540 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9600 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9660 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9720 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9780 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9840 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9900 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9960 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 10020 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 10080 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 10140 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 10200 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10260 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10320 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10380 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10440 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10500 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10560 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10620 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10680 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10740 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10800 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10860 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10920 caagtcgacg tccggcagtc 10940 <210> 53 <211> 10934 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 53 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatggaa 900 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 960 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1020 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1080 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1140 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1200 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1260 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1320 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1380 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1440 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1500 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1560 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 1620 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 1680 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 1740 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 1800 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 1860 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 1920 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 1980 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2040 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2100 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2160 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2220 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2280 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2340 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2400 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2460 agccctggct actccatcca cacctacctg tggcgtagac agtgattgtg gccgaaccgc 2520 cgaactcaga ggccggcccc agaaaacccg agcgagtagg gggcggcgcg caggagggag 2580 gagaactggg ggcgcgggag gctggtgggt gtggggggtg gagatgtaga agatgtgacg 2640 ccgcggcccg gcgggtgcca gattagcgga cgcggtgccc gcggttgcaa cgggatcccg 2700 ggcgctgcag cttgggaggc ggctctcccc aggcggcgtc cgcggagaca cccatccgtg 2760 aaccccaggt cccgggccgc cggctcgccg cgcaccaggg gccggcggac agaagagcgg 2820 ccgagcggct cgaggctggg ggaccgcggg cgcggccgcg cgctgccggg cgggaggctg 2880 gggggccggg gccggggccg tgccccggag cgggtcggag gccggggccg gggccggggg 2940 acggcggctc cccgcgcggc tccagcggct cggggatccc ggccgggccc cgcagggacc 3000 atgatggaga agggccccgt gcgcgccccc gccgagaagc cccgcggcgc ccgctgcagc 3060 aacggcttcc ccgagcgcga ccccccccgc cccggcccca gccgccccgc cgagaagccc 3120 ccccgccccg aggccaagag cgcccagccc gccgacggct ggaagggcga gcgcccccgc 3180 agcgaggagg acaacgagct gaacctgccc aacctggccg ccgcctacag cagcatcctg 3240 agcagcctgg gcgagaaccc ccagcgccag ggcctgctga agaccccctg gcgcgccgcc 3300 agcgccatgc agttcttcac caagggctac caggagacca tcagcgacgt gctgaacgac 3360 gccatcttcg acgaggacca cgacgagatg gtgatcgtga aggacatcga catgttcagc 3420 atgtgcgagc accacctggt gcccttcgtg ggcaaggtgc acatcggcta cctgcccaac 3480 aagcaggtgc tgggcctgag caagctggcc cgcatcgtgg agatctacag ccgccgcctg 3540 caggtgcagg agcgcctgac caagcagatc gccgtggcca tcaccgaggc cctgcgcccc 3600 gccggcgtgg gcgtggtggt ggaggccacc cacatgtgca tggtgatgcg cggcgtgcag 3660 aagatgaaca gcaagaccgt gaccagcacc atgctgggcg tgttccgcga ggaccccaag 3720 acccgcgagg agttcctgac cctgatccgc agctgacaat tgttaattaa gtttaaaccc 3780 tcgaggccgc aagccgcatc gataccgtcg actagagctc gctgatcagc ctcgactgtg 3840 ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 3900 ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 3960 aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 4020 gacaatagca ggcatgctgg ggagagatcc acgataacaa acagcttttt tggggtgaac 4080 atattgactg aattccctgc aggttggcca ctccctctct gcgcgctcgc tcgctcactg 4140 aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg 4200 agcgagcgcg cagagaggga gtggccaact ccatcactag gggttcctgc ggccgctcgt 4260 acggtctcga ggaattcctg caggataact tgccaacctc attctaaaat gtatatagaa 4320 gcccaaaaga caataacaaa aatattcttg tagaacaaaa tgggaaagaa tgttccacta 4380 aatatcaaga tttagagcaa agcatgagat gtgtggggat agacagtgag gctgataaaa 4440 tagagtagag ctcagaaaca gacccattga tatatgtaag tgacctatga aaaaaatatg 4500 gcattttaca atgggaaaat gatggtcttt ttctttttta gaaaaacagg gaaatatatt 4560 tatatgtaaa aaataaaagg gaacccatat gtcataccat acacacaaaa aaattccagt 4620 gaattataag tctaaatgga gaaggcaaaa ctttaaatct tttagaaaat aatatagaag 4680 catgcagacc agcctggcca acatgatgaa accctctcta ctaataataa aatcagtaga 4740 actactcagg actactttga gtgggaagtc cttttctatg aagacttctt tggccaaaat 4800 taggctctaa atgcaaggag atagtgcatc atgcctggct gcacttactg ataaatgatg 4860 ttatcaccat ctttaaccaa atgcacagga acaagttatg gtactgatgt gctggattga 4920 gaaggagctc tacttccttg acaggacaca tttgtatcaa cttaaaaaag cagatttttg 4980 ccagcagaac tattcattca gaggtaggaa acttagaata gatgatgtca ctgattagca 5040 tggcttcccc atctccacag ctgcttccca cccaggttgc ccacagttga gtttgtccag 5100 tgctcagggc tgcccactct cagtaagaag ccccacacca gcccctctcc aaatatgttg 5160 gctgttcctt ccattaaagt gaccccactt tagagcagca agtggatttc tgtttcttac 5220 agttcaggaa ggaggagtca gctgtgagaa cctggagcct gagatgcttc taagtcccac 5280 tgctactggg gtcagggaag ccagactcca gcatcagcag tcaggagcac taagcccttg 5340 ccaacatcct gtttctcaga gaaactgctt ccattataat ggttgtcctt ttttaagcta 5400 tcaagccaaa caaccagtgt ctaccattat tctcatcacc tgaagccaag ggttctagca 5460 aaagtcaagc tgtcttgtaa tggttgatgt gcctccagct tctgtcttca gtcactccac 5520 tcttagcctg ctctgaatca actctgacca cagttccctg gagcccctgc cacctgctgc 5580 ccctgccacc ttctccatct gcagtgctgt gcagccttct gcactcttgc agagctaata 5640 ggtggagact tgaaggaaga ggaggaaagt ttctcataat agccttgctg caagctcaaa 5700 tgggaggtgg gcactgtgcc caggagcctt ggagcaaagg ctgtgcccaa cctctgactg 5760 catccaggtt tggtcttgac agagataaga agccctggct tttggagcca aaatctaggt 5820 cagacttagg caggattctc aaagtttatc agcagaacat gaggcagaag accctttctg 5880 ctccagcttc ttcaggctca accttcatca gaatagatag aaagagaggc tgtgagggtt 5940 cttaaaacag aagcaaatct gactcagaga ataaacaacc tcctagtaaa ctacagctta 6000 gacagagcat ctggtggtga gtgtgctcag tgtcctactc aactgtctgg tatcagccct 6060 catgaggact tctcttcttt ccctcataga cctccatctc tgttttcctt agcctgcaga 6120 aatctggatg gctattcaca gaatgcctgt gctttcagag ttgcattttt tctctggtat 6180 tctggttcaa gcatttgaag gtaggaaagg ttctccaagt gcaagaaagc cagccctgag 6240 cctcaactgc ctggctagtg tggtcagtag gatgcaaagg ctgttgaatg ccacaaggcc 6300 aaactttaac ctgtgtacca caagcctagc agcagaggca gctctgctca ctggaactct 6360 ctgtcttctt tctcctgagc cttttctttt cctgagtttt ctagctctcc tcaaccttac 6420 ctctgcccta cccaggacaa acccaagagc cactgtttct gtgatgtcct ctccagccct 6480 aattaggcat catgacttca gcctgacctt ccatgctcag aagcagtgct aatccacttc 6540 agatgagctg ctctatgcaa cacaggcaga gcctacaaac ctttgcacca gagccctcca 6600 catatcagtg tttgttcata ctcacttcaa cagcaaatgt gactgctgag attaagattt 6660 tacacaagat ggtctgtaat ttcacagtta gttttatccc attaggtatg aaagaattag 6720 cataattccc cttaaacatg aatgaatctt agatttttta ataaatagtt ttggaagtaa 6780 agacagagac atcaggagca caaggaatag cctgagagga caaacagaac aagaaagagt 6840 ctggaaatac acaggatgtt cttggcctcc tcaaagcaag tgcaagcaga tagtaccagc 6900 agccccaggc tatcagagcc cagtgaagag aagtaccatg aaagccacag ctctaaccac 6960 cctgttccag agtgacagac agtccccaag acaagccagc ctgagccaga gagagaactg 7020 caagagaaag tttctaattt aggttctgtt agattcagac aagtgcaggt catcctctct 7080 ccacagctac tcacctctcc agcctaacaa agcctgcagt ccacactcca accctggtgt 7140 ctcacctcct agcctctccc aacatcctgc tctctgacca tcttctgcat ctctcatctc 7200 accatctccc actgtctaca gcctactctt gcaactacca tctcattttc tgacatcctg 7260 tctacatctt ctgccatact ctgccatcta ccataccacc tcttaccatc taccacacca 7320 tcttttatct ccatccctct cagaagcctc caagctgaat cctgctttat gtgttcatct 7380 cagcccctgc atggaaagct gaccccagag gcagaactat tcccagagag cttggccaag 7440 aaaaacaaaa ctaccagcct ggccaggctc aggagtagta agctgcagtg tctgttgtgt 7500 tctagcttca acagctgcag gagttccact ctcaaatgct ccacatttct cacatcctcc 7560 tgattctggt cactacccat cttcaaagaa cagaatatct cacatcagca tactgtgaag 7620 gactagtcat gggtgcagct gctcagagct gcaaagtcat tctggatggt ggagagctta 7680 caaacatttc atgatgctcc ccccgctctg atggctggag cccaatccct acacagactc 7740 ctgctgtatg tgttttcctt tcactctgag ccacagccag agggcaggca ttcagtctcc 7800 tcttcaggct ggggctgggg cactgagaac tcacccaaca ccttgctctc actccttctg 7860 caaaacaaga aagagctttg tgctgcagta gccatgaaga atgaaaggaa ggctttaact 7920 aaaaaatgtc agagattatt ttcaacccct tactgtggat caccagcaag gaggaaacac 7980 aacacagaga cattttttcc cctcaaatta tcaaaagaat cactgcattt gttaaagaga 8040 gcaactgaat caggaagcag agttttgaac atatcagaag ttaggaatct gcatcagaga 8100 caaatgcagt catggttgtt tgctgcatac cagccctaat cattagaagc ctcatggact 8160 tcaaacatca ttccctctga caagatgctc tagcctaact ccatgagata aaataaatct 8220 gcctttcaga gccaaagaag agtccaccag cttcttctca gtgtgaacaa gagctccagt 8280 caggttagtc agtccagtgc agtagaggag accagtctgc atcctctaat tttcaaaggc 8340 aagaagattt gtttaccctg gacaccaggc acaagtgagg tcacagagct cttagatatg 8400 cagtcctcat gagtgaggag actaaagcgc atgccatcaa gacttcagtg tagagaaaac 8460 ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggccgaggcg gcctcggcct 8520 ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa ctgggcggag 8580 ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa ttgagatgca 8640 tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg gttgctgact 8700 aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc 8760 ctaactgaca cacattccac agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 8820 tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 8880 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 8940 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 9000 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 9060 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 9120 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 9180 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 9240 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 9300 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 9360 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 9420 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 9480 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 9540 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 9600 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 9660 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 9720 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 9780 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 9840 tgcctgactc ctgcaaacca cgttgtgtct caaaatctct gatgttacat tgcacaagat 9900 aaaaatatat catcatgaac aataaaactg tctgcttaca taaacagtaa tacaaggggt 9960 gttatgagcc atattcaacg ggaaacgtct tgctcgaggc cgcgattaaa ttccaacatg 10020 gatgctgatt tatatgggta taaatgggct cgcgataatg tcgggcaatc aggtgcgaca 10080 atctatcgat tgtatgggaa gcccgatgcg ccagagttgt ttctgaaaca tggcaaaggt 10140 agcgttgcca atgatgttac agatgagatg gtcagactaa actggctgac ggaatttatg 10200 cctcttccga ccatcaagca ttttatccgt actcctgatg atgcatggtt actcaccact 10260 gcgatccccg ggaaaacagc attccaggta ttagaagaat atcctgattc aggtgaaaat 10320 attgttgatg cgctggcagt gttcctgcgc cggttgcatt cgattcctgt ttgtaattgt 10380 ccttttaaca gcgatcgcgt atttcgtctc gctcaggcgc aatcacgaat gaataacggt 10440 ttggttgatg cgagtgattt tgatgacgag cgtaatggct ggcctgttga acaagtctgg 10500 aaagaaatgc ataagctttt gccattctca ccggattcag tcgtcactca tggtgatttc 10560 tcacttgata accttatttt tgacgagggg aaattaatag gttgtattga tgttggacga 10620 gtcggaatcg cagaccgata ccaggatctt gccatcctat ggaactgcct cggtgagttt 10680 tctccttcat tacagaaacg gctttttcaa aaatatggta ttgataatcc tgatatgaat 10740 aaattgcagt ttcatttgat gctcgatgag tttttctaag ggcggcctgc caccataccc 10800 acgccgaaac aagcgctcat gagcccgaag tggcgagccc gatcttcccc atcggtgatg 10860 tcggcgatat aggcgccagc aaccgcacct gtggcgccgg tgatgagggc gcgccaagtc 10920 gacgtccggc agtc 10934 <210> 54 <211> 11138 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 54 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agtaagtcac 300 tgactgtcta tgcctgggaa agggtgggca ggagatgggg cagtgcagga aaagtggcac 360 tatgaaccct cctggtggcg aggggagggg ggtggtcctc gaacgccttg cagaactggc 420 ctggatacag agtggaccgg ctggccccat ctggaagact tcgagataca ctgttgtctt 480 actgcgctca acagtgtatc tcgaagtctt ccaaatggtg ccagccatcg cagcggggtg 540 caggaaatgg gggcagcccc cctttttggc tatccttcca cgtgttcttt tttgtatctt 600 ttgtgtttcc tagaaaacat ctcagtcacc accgtgatat cacaaggtcc cagggctggg 660 gtcagaaatt ctctcccgag ggaatgaagc cacaggagcc aagagcagga ggaccaaggc 720 cctggcgaag gccgtggcct cgttcaagta aaagatccta gtacagtgca ggtcccaatg 780 tgtactagga tcttttactt gaacggggac gccggcatcc gggctcagga cccccctctc 840 tgccagaggc accaacacca gagttcacaa atcagtctcc tgccctttgc atgtagcaaa 900 gcagccctag gaatgcatct agacaattgt actaaccttc ttctctttcc tctcctgaca 960 gtccggaaag ccaccatgcc caccacccag cagagccccc aggacgagca ggagaagctg 1020 ctggacgagg ccatccaggc cgtgaaggtg cagagcttcc agatgaagcg ctgcctggac 1080 aagaacaagc tgatggacgc cctgaagcac gccagcaaca tgctgggcga gctgcgcacc 1140 agcatgctga gccccaagag ctactacgag ctgtacatgg ccatcagcga cgagctgcac 1200 tacctggagg tgtacctgac cgacgagttc gccaagggcc gcaaggtggc cgacctgtac 1260 gagctggtgc agtacgccgg caacatcatc ccccgcctgt acctgctgat caccgtgggc 1320 gtggtgtacg tgaagagctt cccccagagc cgcaaggaca tcctgaagga cctggtggag 1380 atgtgccgcg gcgtgcagca ccccctgcgc ggcctgttcc tgcgcaacta cctgctgcag 1440 tgcacccgca acatcctgcc cgacgagggc gagcccaccg acgaggagac caccggcgac 1500 atcagcgaca gcatggactt cgtgctgctg aacttcgccg agatgaacaa gctgtgggtg 1560 cgcatgcagc accagggcca cagccgcgac cgcgagaagc gcgagcgcga gcgccaggag 1620 ctgcgcatcc tggtgggcac caacctggtg cgcctgagcc agctggaggg cgtgaacgtg 1680 gagcgctaca agcagatcgt gctgaccggc atcctggagc aggtggtgaa ctgccgcgac 1740 gccctggccc aggagtacct gatggagtgc atcatccagg tgttccccga cgagttccac 1800 ctgcagaccc tgaacccctt cctgcgcgcc tgcgccgagc tgcaccagaa cgtgaacgtg 1860 aagaacatca tcatcgccct gatcgaccgc ctggccctgt tcgcccaccg cgaggacggc 1920 cccggcatcc ccgccgacat caagctgttc gacatcttca gccagcaggt ggccaccgtg 1980 atccagagcc gccaggacat gcccagcgag gacgtggtga gcctgcaggt gagcctgatc 2040 aacctggcca tgaagtgcta ccccgaccgc gtggactacg tggacaaggt gctggagacc 2100 accgtggaga tcttcaacaa gctgaacctg gagcacatcg ccaccagcag cgccgtgagc 2160 aaggagctga cccgcctgct gaagatcccc gtggacacct acaacaacat cctgaccgtg 2220 ctgaagctga agcacttcca ccccctgttc gagtacttcg actacgagag ccgcaagagc 2280 atgagctgct acgtgctgag caacgtgctg gactacaaca ccgagatcgt gagccaggac 2340 caggtggaca gcatcatgaa cctggtgagc accctgatcc aggaccagcc cgaccagccc 2400 gtggaggacc ccgaccccga ggacttcgcc gacgagcaga gcctggtggg ccgcttcatc 2460 cacctgctgc gcagcgagga ccccgaccag cagtacctga tcctgaacac cgcccgcaag 2520 cacttcggcg ccggcggcaa ccagcgcatc cgcttcaccc tgccccccct ggtgttcgcc 2580 gcctaccagc tggccttccg ctacaaggag aacagcaagg tggacgacaa gtgggagaag 2640 aagtgccaga agatcttcag cttcgcccac cagaccatca gcgccctgat caaggccgag 2700 ctggccgagc tgcccctgcg cctgttcctg cagggcgccc tggccgccgg cgagatcggc 2760 ttcgagaacc acgagaccgt ggcctacgag ttcatgagcc aggccttcag cctgtacgag 2820 gacgagatca gcgacagcaa ggcccagctg gccgccatca ccctgatcat cggcaccttc 2880 gagcgcatga agtgcttcag cgaggagaac cacgagcccc tgcgcaccca gtgcgccctg 2940 gccgccagca agctgctgaa gaagcccgac cagggccgcg ccgtgagcac ctgcgcccac 3000 ctgttctgga gcggccgcaa caccgacaag aacggcgagg agctgcacgg cggcaagcgc 3060 gtgatggagt gcctgaagaa ggccctgaag atcgccaacc agtgcatgga ccccagcctg 3120 caggtgcagc tgttcatcga gatcctgaac cgctacatct acttctacga gaaggagaac 3180 gacgccgtga ccatccaggt gctgaaccag ctgatccaga agatccgcga ggacctgccc 3240 aacctggaga gcagcgagga gaccgagcag atcaacaagc acttccacaa caccctggag 3300 cacctgcgcc tgcgccgcga gagccccgag agcgagggcc ccatctacga gggcctgatc 3360 ctgtgacaat tgttaattaa gtttaaaccc tcgaggccgc aagcttatcg ataatcaacc 3420 tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3480 gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3540 cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3600 tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3660 cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3720 ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3780 tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 3840 tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 3900 ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 3960 ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgactaga 4020 gctcgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 4080 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 4140 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 4200 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggagag atccacgata 4260 acaaacagct tttttggggt gaacatattg actgaattcc ctgcaggttg gccactccct 4320 ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct 4380 ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca 4440 ctaggggttc ctgcggccgc tcgtacggtc tcgaggaatt cctgcaggat aacttgccaa 4500 cctcattcta aaatgtatat agaagcccaa aagacaataa caaaaatatt cttgtagaac 4560 aaaatgggaa agaatgttcc actaaatatc aagatttaga gcaaagcatg agatgtgtgg 4620 ggatagacag tgaggctgat aaaatagagt agagctcaga aacagaccca ttgatatatg 4680 taagtgacct atgaaaaaaa tatggcattt tacaatggga aaatgatggt ctttttcttt 4740 tttagaaaaa cagggaaata tatttatatg taaaaaataa aagggaaccc atatgtcata 4800 ccatacacac aaaaaaattc cagtgaatta taagtctaaa tggagaaggc aaaactttaa 4860 atcttttaga aaataatata gaagcatgca gaccagcctg gccaacatga tgaaaccctc 4920 tctactaata ataaaatcag tagaactact caggactact ttgagtggga agtccttttc 4980 tatgaagact tctttggcca aaattaggct ctaaatgcaa ggagatagtg catcatgcct 5040 ggctgcactt actgataaat gatgttatca ccatctttaa ccaaatgcac aggaacaagt 5100 tatggtactg atgtgctgga ttgagaagga gctctacttc cttgacagga cacatttgta 5160 tcaacttaaa aaagcagatt tttgccagca gaactattca ttcagaggta ggaaacttag 5220 aatagatgat gtcactgatt agcatggctt ccccatctcc acagctgctt cccacccagg 5280 ttgcccacag ttgagtttgt ccagtgctca gggctgccca ctctcagtaa gaagccccac 5340 accagcccct ctccaaatat gttggctgtt ccttccatta aagtgacccc actttagagc 5400 agcaagtgga tttctgtttc ttacagttca ggaaggagga gtcagctgtg agaacctgga 5460 gcctgagatg cttctaagtc ccactgctac tggggtcagg gaagccagac tccagcatca 5520 gcagtcagga gcactaagcc cttgccaaca tcctgtttct cagagaaact gcttccatta 5580 taatggttgt ccttttttaa gctatcaagc caaacaacca gtgtctacca ttattctcat 5640 cacctgaagc caagggttct agcaaaagtc aagctgtctt gtaatggttg atgtgcctcc 5700 agcttctgtc ttcagtcact ccactcttag cctgctctga atcaactctg accacagttc 5760 cctggagccc ctgccacctg ctgcccctgc caccttctcc atctgcagtg ctgtgcagcc 5820 ttctgcactc ttgcagagct aataggtgga gacttgaagg aagaggagga aagtttctca 5880 taatagcctt gctgcaagct caaatgggag gtgggcactg tgcccaggag ccttggagca 5940 aaggctgtgc ccaacctctg actgcatcca ggtttggtct tgacagagat aagaagccct 6000 ggcttttgga gccaaaatct aggtcagact taggcaggat tctcaaagtt tatcagcaga 6060 acatgaggca gaagaccctt tctgctccag cttcttcagg ctcaaccttc atcagaatag 6120 atagaaagag aggctgtgag ggttcttaaa acagaagcaa atctgactca gagaataaac 6180 aacctcctag taaactacag cttagacaga gcatctggtg gtgagtgtgc tcagtgtcct 6240 actcaactgt ctggtatcag ccctcatgag gacttctctt ctttccctca tagacctcca 6300 tctctgtttt ccttagcctg cagaaatctg gatggctatt cacagaatgc ctgtgctttc 6360 agagttgcat tttttctctg gtattctggt tcaagcattt gaaggtagga aaggttctcc 6420 aagtgcaaga aagccagccc tgagcctcaa ctgcctggct agtgtggtca gtaggatgca 6480 aaggctgttg aatgccacaa ggccaaactt taacctgtgt accacaagcc tagcagcaga 6540 ggcagctctg ctcactggaa ctctctgtct tctttctcct gagccttttc ttttcctgag 6600 ttttctagct ctcctcaacc ttacctctgc cctacccagg acaaacccaa gagccactgt 6660 ttctgtgatg tcctctccag ccctaattag gcatcatgac ttcagcctga ccttccatgc 6720 tcagaagcag tgctaatcca cttcagatga gctgctctat gcaacacagg cagagcctac 6780 aaacctttgc accagagccc tccacatatc agtgtttgtt catactcact tcaacagcaa 6840 atgtgactgc tgagattaag attttacaca agatggtctg taatttcaca gttagtttta 6900 tcccattagg tatgaaagaa ttagcataat tccccttaaa catgaatgaa tcttagattt 6960 tttaataaat agttttggaa gtaaagacag agacatcagg agcacaagga atagcctgag 7020 aggacaaaca gaacaagaaa gagtctggaa atacacagga tgttcttggc ctcctcaaag 7080 caagtgcaag cagatagtac cagcagcccc aggctatcag agcccagtga agagaagtac 7140 catgaaagcc acagctctaa ccaccctgtt ccagagtgac agacagtccc caagacaagc 7200 cagcctgagc cagagagaga actgcaagag aaagtttcta atttaggttc tgttagattc 7260 agacaagtgc aggtcatcct ctctccacag ctactcacct ctccagccta acaaagcctg 7320 cagtccacac tccaaccctg gtgtctcacc tcctagcctc tcccaacatc ctgctctctg 7380 accatcttct gcatctctca tctcaccatc tcccactgtc tacagcctac tcttgcaact 7440 accatctcat tttctgacat cctgtctaca tcttctgcca tactctgcca tctaccatac 7500 cacctcttac catctaccac accatctttt atctccatcc ctctcagaag cctccaagct 7560 gaatcctgct ttatgtgttc atctcagccc ctgcatggaa agctgacccc agaggcagaa 7620 ctattcccag agagcttggc caagaaaaac aaaactacca gcctggccag gctcaggagt 7680 agtaagctgc agtgtctgtt gtgttctagc ttcaacagct gcaggagttc cactctcaaa 7740 tgctccacat ttctcacatc ctcctgattc tggtcactac ccatcttcaa agaacagaat 7800 atctcacatc agcatactgt gaaggactag tcatgggtgc agctgctcag agctgcaaag 7860 tcattctgga tggtggagag cttacaaaca tttcatgatg ctccccccgc tctgatggct 7920 ggagcccaat ccctacacag actcctgctg tatgtgtttt cctttcactc tgagccacag 7980 ccagagggca ggcattcagt ctcctcttca ggctggggct ggggcactga gaactcaccc 8040 aacaccttgc tctcactcct tctgcaaaac aagaaagagc tttgtgctgc agtagccatg 8100 aagaatgaaa ggaaggcttt aactaaaaaa tgtcagagat tattttcaac cccttactgt 8160 ggatcaccag caaggaggaa acacaacaca gagacatttt ttcccctcaa attatcaaaa 8220 gaatcactgc atttgttaaa gagagcaact gaatcaggaa gcagagtttt gaacatatca 8280 gaagttagga atctgcatca gagacaaatg cagtcatggt tgtttgctgc ataccagccc 8340 taatcattag aagcctcatg gacttcaaac atcattccct ctgacaagat gctctagcct 8400 aactccatga gataaaataa atctgccttt cagagccaaa gaagagtcca ccagcttctt 8460 ctcagtgtga acaagagctc cagtcaggtt agtcagtcca gtgcagtaga ggagaccagt 8520 ctgcatcctc taattttcaa aggcaagaag atttgtttac cctggacacc aggcacaagt 8580 gaggtcacag agctcttaga tatgcagtcc tcatgagtga ggagactaaa gcgcatgcca 8640 tcaagacttc agtgtagaga aaacctccaa aaaagcctcc tcactacttc tggaatagct 8700 cagaggccga ggcggcctcg gcctctgcat aaataaaaaa aattagtcag ccatggggcg 8760 gagaatgggc ggaactgggc ggagttaggg gcgggatggg cggagttagg ggcgggacta 8820 tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 8880 actttccaca cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg 8940 gggagcctgg ggactttcca caccctaact gacacacatt ccacagctgc attaatgaat 9000 cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 9060 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 9120 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 9180 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 9240 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 9300 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 9360 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 9420 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 9480 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 9540 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 9600 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 9660 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 9720 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 9780 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 9840 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 9900 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 9960 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 10020 ctgtctattt cgttcatcca tagttgcctg actcctgcaa accacgttgt gtctcaaaat 10080 ctctgatgtt acattgcaca agataaaaat atatcatcat gaacaataaa actgtctgct 10140 tacataaaca gtaatacaag gggtgttatg agccatattc aacgggaaac gtcttgctcg 10200 aggccgcgat taaattccaa catggatgct gatttatatg ggtataaatg ggctcgcgat 10260 aatgtcgggc aatcaggtgc gacaatctat cgattgtatg ggaagcccga tgcgccagag 10320 ttgtttctga aacatggcaa aggtagcgtt gccaatgatg ttacagatga gatggtcaga 10380 ctaaactggc tgacggaatt tatgcctctt ccgaccatca agcattttat ccgtactcct 10440 gatgatgcat ggttactcac cactgcgatc cccgggaaaa cagcattcca ggtattagaa 10500 gaatatcctg attcaggtga aaatattgtt gatgcgctgg cagtgttcct gcgccggttg 10560 cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag 10620 gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg attttgatga cgagcgtaat 10680 ggctggcctg ttgaacaagt ctggaaagaa atgcataagc ttttgccatt ctcaccggat 10740 tcagtcgtca ctcatggtga tttctcactt gataacctta tttttgacga ggggaaatta 10800 ataggttgta ttgatgttgg acgagtcgga atcgcagacc gataccagga tcttgccatc 10860 ctatggaact gcctcggtga gttttctcct tcattacaga aacggctttt tcaaaaatat 10920 ggtattgata atcctgatat gaataaattg cagtttcatt tgatgctcga tgagtttttc 10980 taagggcggc ctgccaccat acccacgccg aaacaagcgc tcatgagccc gaagtggcga 11040 gcccgatctt ccccatcggt gatgtcggcg atataggcgc cagcaaccgc acctgtggcg 11100 ccggtgatga gggcgcgcca agtcgacgtc cggcagtc 11138 <210> 55 <211> 242 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 55 Met Pro Arg Gly Phe Thr Trp Leu Arg Tyr Leu Gly Ile Phe Leu Gly 1 5 10 15 Val Ala Leu Gly Asn Glu Pro Leu Glu Met Trp Pro Leu Thr Gln Asn 20 25 30 Glu Glu Cys Thr Val Thr Gly Phe Leu Arg Asp Lys Leu Gln Tyr Arg 35 40 45 Ser Arg Leu Gln Tyr Met Lys His Tyr Phe Pro Ile Asn Tyr Lys Ile 50 55 60 Ser Val Pro Tyr Glu Gly Val Phe Arg Ile Ala Asn Val Thr Arg Leu 65 70 75 80 Gln Arg Ala Gln Val Ser Glu Arg Glu Leu Arg Tyr Leu Trp Val Leu 85 90 95 Val Ser Leu Ser Ala Thr Glu Ser Val Gln Asp Val Leu Leu Glu Gly 100 105 110 His Pro Ser Trp Lys Tyr Leu Gln Glu Val Glu Thr Leu Leu Leu Asn 115 120 125 Val Gln Gln Gly Leu Thr Asp Val Glu Val Ser Pro Lys Val Glu Ser 130 135 140 Val Leu Ser Leu Leu Asn Ala Pro Gly Pro Asn Leu Lys Leu Val Arg 145 150 155 160 Pro Lys Ala Leu Leu Asp Asn Cys Phe Arg Val Met Glu Leu Leu Tyr 165 170 175 Cys Ser Cys Cys Lys Gln Ser Ser Val Leu Asn Trp Gln Asp Cys Glu 180 185 190 Val Pro Ser Pro Gln Ser Cys Ser Pro Glu Pro Ser Leu Gln Tyr Ala 195 200 205 Ala Thr Gln Leu Tyr Pro Pro Pro Pro Trp Ser Pro Ser Ser Pro Pro 210 215 220 His Ser Thr Gly Ser Val Arg Pro Val Arg Ala Gln Gly Glu Gly Leu 225 230 235 240 Leu Pro <210> 56 <211> 729 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 56 atgccccgcg gcttcacctg gctgcgctac ctgggcatct tcctgggcgt ggccctgggc 60 aacgagcccc tggagatgtg gcccctgacc cagaacgagg agtgcaccgt gaccggcttc 120 ctgcgcgaca agctgcagta ccgcagccgc ctgcagtaca tgaagcacta cttccccatc 180 aactacaaga tcagcgtgcc ctacgagggc gtgttccgca tcgccaacgt gacccgcctg 240 cagcgcgccc aggtgagcga gcgcgagctg cgctacctgt gggtgctggt gagcctgagc 300 gccaccgaga gcgtgcagga cgtgctgctg gagggccacc ccagctggaa gtacctgcag 360 gaggtggaga ccctgctgct gaacgtgcag cagggcctga ccgacgtgga ggtgagcccc 420 aaggtggaga gcgtgctgag cctgctgaac gcccccggcc ccaacctgaa gctggtgcgc 480 cccaaggccc tgctggacaa ctgcttccgc gtgatggagc tgctgtactg cagctgctgc 540 aagcagagca gcgtgctgaa ctggcaggac tgcgaggtgc ccagccccca gagctgcagc 600 cccgagccca gcctgcagta cgccgccacc cagctgtacc cccccccccc ctggagcccc 660 agcagccccc cccacagcac cggcagcgtg cgccccgtgc gcgcccaggg cgagggcctg 720 ctgccctaa 729 <210> 57 <211> 230 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 57 Met Glu Pro Leu Arg Leu Leu Ile Leu Leu Phe Val Thr Glu Leu Ser 1 5 10 15 Gly Ala His Asn Thr Thr Val Phe Gln Gly Val Ala Gly Gln Ser Leu 20 25 30 Gln Val Ser Cys Pro Tyr Asp Ser Met Lys His Trp Gly Arg Arg Lys 35 40 45 Ala Trp Cys Arg Gln Leu Gly Glu Lys Gly Pro Cys Gln Arg Val Val 50 55 60 Ser Thr His Asn Leu Trp Leu Leu Ser Phe Leu Arg Arg Trp Asn Gly 65 70 75 80 Ser Thr Ala Ile Thr Asp Asp Thr Leu Gly Gly Thr Leu Thr Ile Thr 85 90 95 Leu Arg Asn Leu Gln Pro His Asp Ala Gly Leu Tyr Gln Cys Gln Ser 100 105 110 Leu His Gly Ser Glu Ala Asp Thr Leu Arg Lys Val Leu Val Glu Val 115 120 125 Leu Ala Asp Pro Leu Asp His Arg Asp Ala Gly Asp Leu Trp Phe Pro 130 135 140 Gly Glu Ser Glu Ser Phe Glu Asp Ala His Val Glu His Ser Ile Ser 145 150 155 160 Arg Ser Leu Leu Glu Gly Glu Ile Pro Phe Pro Pro Thr Ser Ile Leu 165 170 175 Leu Leu Leu Ala Cys Ile Phe Leu Ile Lys Ile Leu Ala Ala Ser Ala 180 185 190 Leu Trp Ala Ala Ala Trp His Gly Gln Lys Pro Gly Thr His Pro Pro 195 200 205 Ser Glu Leu Asp Cys Gly His Asp Pro Gly Tyr Gln Leu Gln Thr Leu 210 215 220 Pro Gly Leu Arg Asp Thr 225 230 <210> 58 <211> 690 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 58 atggagcccc tgcgcctgct gatcctgctg ttcgtgaccg agctgagcgg cgcccacaac 60 accaccgtgt tccagggcgt ggccggccag agcctgcagg tgagctgccc ctacgacagc 120 atgaagcact ggggccgccg caaggcctgg tgccgccagc tgggcgagaa gggcccctgc 180 cagcgcgtgg tgagcaccca caacctgtgg ctgctgagct tcctgcgccg ctggaacggc 240 agcaccgcca tcaccgacga caccctgggc ggcaccctga ccatcaccct gcgcaacctg 300 cagccccacg acgccggcct gtaccagtgc cagagcctgc acggcagcga ggccgacacc 360 ctgcgcaagg tgctggtgga ggtgctggcc gaccccctgg accaccgcga cgccggcgac 420 ctgtggttcc ccggcgagag cgagagcttc gaggacgccc acgtggagca cagcatcagc 480 cgcagcctgc tggagggcga gatccccttc ccccccacca gcatcctgct gctgctggcc 540 tgcatcttcc tgatcaagat cctggccgcc agcgccctgt gggccgccgc ctggcacggc 600 cagaagcccg gcacccaccc ccccagcgag ctggactgcg gccacgaccc cggctaccag 660 ctgcagaccc tgcccggcct gcgcgacacc 690 <210> 59 <211> 11060 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 59 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatggaa 900 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 960 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1020 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1080 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1140 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1200 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1260 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1320 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1380 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1440 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1500 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1560 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 1620 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 1680 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 1740 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 1800 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 1860 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 1920 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 1980 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2040 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2100 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2160 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2220 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2280 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2340 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2400 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2460 agccctggct actccatcca cacctacctg tggcgtagac aggagggcag aggaagtctt 2520 ctgacatgcg gagacgtgga agagaatccc ggccctatgc cccgcggctt cacctggctg 2580 cgctacctgg gcatcttcct gggcgtggcc ctgggcaacg agcccctgga gatgtggccc 2640 ctgacccaga acgaggagtg caccgtgacc ggcttcctgc gcgacaagct gcagtaccgc 2700 agccgcctgc agtacatgaa gcactacttc cccatcaact acaagatcag cgtgccctac 2760 gagggcgtgt tccgcatcgc caacgtgacc cgcctgcagc gcgcccaggt gagcgagcgc 2820 gagctgcgct acctgtgggt gctggtgagc ctgagcgcca ccgagagcgt gcaggacgtg 2880 ctgctggagg gccaccccag ctggaagtac ctgcaggagg tggagaccct gctgctgaac 2940 gtgcagcagg gcctgaccga cgtggaggtg agccccaagg tggagagcgt gctgagcctg 3000 ctgaacgccc ccggccccaa cctgaagctg gtgcgcccca aggccctgct ggacaactgc 3060 ttccgcgtga tggagctgct gtactgcagc tgctgcaagc agagcagcgt gctgaactgg 3120 caggactgcg aggtgcccag cccccagagc tgcagccccg agcccagcct gcagtacgcc 3180 gccacccagc tgtacccccc ccccccctgg agccccagca gcccccccca cagcaccggc 3240 agcgtgcgcc ccgtgcgcgc ccagggcgag ggcctgctgc cctaatgaca attgttaatt 3300 aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3360 tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3420 tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3480 taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3540 ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3600 gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3660 ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3720 gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3780 cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3840 cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3900 ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3960 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 4020 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 4080 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 4140 tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 4200 gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 4260 tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4320 tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4380 gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4440 atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4500 ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4560 ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4620 aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4680 tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4740 tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4800 tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4860 agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4920 caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4980 atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 5040 gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 5100 tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 5160 ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 5220 gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 5280 atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 5340 tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5400 tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5460 cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5520 aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5580 ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5640 ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5700 tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5760 ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5820 ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5880 tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5940 ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 6000 tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 6060 agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 6120 agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 6180 agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 6240 tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 6300 tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6360 cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6420 aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6480 aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6540 ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6600 agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6660 cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6720 cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6780 agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6840 aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6900 aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6960 aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 7020 accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 7080 aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 7140 gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 7200 ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 7260 tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 7320 catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7380 atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7440 acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7500 tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7560 gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7620 ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7680 tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7740 gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7800 agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7860 agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7920 gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7980 cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 8040 ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 8100 aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 8160 aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 8220 cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 8280 tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 8340 aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8400 tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8460 aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8520 gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8580 gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8640 cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8700 gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8760 gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8820 ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8880 cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8940 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 9000 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 9060 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 9120 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 9180 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 9240 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 9300 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9360 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9420 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9480 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9540 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9600 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9660 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9720 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9780 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9840 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9900 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9960 catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 10020 caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 10080 aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 10140 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 10200 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 10260 aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 10320 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10380 accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10440 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10500 aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10560 aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10620 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10680 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10740 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10800 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10860 atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10920 atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10980 gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 11040 caagtcgacg tccggcagtc 11060 <210> 60 <211> 10913 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 60 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatggaa 900 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 960 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1020 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1080 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1140 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1200 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1260 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1320 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1380 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1440 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1500 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1560 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 1620 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 1680 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 1740 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 1800 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 1860 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 1920 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 1980 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2040 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2100 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2160 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2220 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2280 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2340 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2400 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2460 agccctggct actccatcca cacctacctg tggcgtagac agtgattgtg gccgaaccgc 2520 cgaactcaga ggccggcccc agaaaacccg agcgagtagg gggcggcgcg caggagggag 2580 gagaactggg ggcgcgggag gctggtgggt gtggggggtg gagatgtaga agatgtgacg 2640 ccgcggcccg gcgggtgcca gattagcgga cgcggtgccc gcggttgcaa cgggatcccg 2700 ggcgctgcag cttgggaggc ggctctcccc aggcggcgtc cgcggagaca cccatccgtg 2760 aaccccaggt cccgggccgc cggctcgccg cgcaccaggg gccggcggac agaagagcgg 2820 ccgagcggct cgaggctggg ggaccgcggg cgcggccgcg cgctgccggg cgggaggctg 2880 gggggccggg gccggggccg tgccccggag cgggtcggag gccggggccg gggccggggg 2940 acggcggctc cccgcgcggc tccagcggct cggggatccc ggccgggccc cgcagggacc 3000 atgatgcccc gcggcttcac ctggctgcgc tacctgggca tcttcctggg cgtggccctg 3060 ggcaacgagc ccctggagat gtggcccctg acccagaacg aggagtgcac cgtgaccggc 3120 ttcctgcgcg acaagctgca gtaccgcagc cgcctgcagt acatgaagca ctacttcccc 3180 atcaactaca agatcagcgt gccctacgag ggcgtgttcc gcatcgccaa cgtgacccgc 3240 ctgcagcgcg cccaggtgag cgagcgcgag ctgcgctacc tgtgggtgct ggtgagcctg 3300 agcgccaccg agagcgtgca ggacgtgctg ctggagggcc accccagctg gaagtacctg 3360 caggaggtgg agaccctgct gctgaacgtg cagcagggcc tgaccgacgt ggaggtgagc 3420 cccaaggtgg agagcgtgct gagcctgctg aacgcccccg gccccaacct gaagctggtg 3480 cgccccaagg ccctgctgga caactgcttc cgcgtgatgg agctgctgta ctgcagctgc 3540 tgcaagcaga gcagcgtgct gaactggcag gactgcgagg tgcccagccc ccagagctgc 3600 agccccgagc ccagcctgca gtacgccgcc acccagctgt accccccccc cccctggagc 3660 cccagcagcc ccccccacag caccggcagc gtgcgccccg tgcgcgccca gggcgagggc 3720 ctgctgccct aatgacaatt gttaattaag tttaaaccct cgaggccgca agccgcatcg 3780 ataccgtcga ctagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 3840 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3900 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3960 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 4020 gagagatcca cgataacaaa cagctttttt ggggtgaaca tattgactga attccctgca 4080 ggttggccac tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg 4140 ggcgtcgggc gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag 4200 tggccaactc catcactagg ggttcctgcg gccgctcgta cggtctcgag gaattcctgc 4260 aggataactt gccaacctca ttctaaaatg tatatagaag cccaaaagac aataacaaaa 4320 atattcttgt agaacaaaat gggaaagaat gttccactaa atatcaagat ttagagcaaa 4380 gcatgagatg tgtggggata gacagtgagg ctgataaaat agagtagagc tcagaaacag 4440 acccattgat atatgtaagt gacctatgaa aaaaatatgg cattttacaa tgggaaaatg 4500 atggtctttt tcttttttag aaaaacaggg aaatatattt atatgtaaaa aataaaaggg 4560 aacccatatg tcataccata cacacaaaaa aattccagtg aattataagt ctaaatggag 4620 aaggcaaaac tttaaatctt ttagaaaata atatagaagc atgcagacca gcctggccaa 4680 catgatgaaa ccctctctac taataataaa atcagtagaa ctactcagga ctactttgag 4740 tgggaagtcc ttttctatga agacttcttt ggccaaaatt aggctctaaa tgcaaggaga 4800 tagtgcatca tgcctggctg cacttactga taaatgatgt tatcaccatc tttaaccaaa 4860 tgcacaggaa caagttatgg tactgatgtg ctggattgag aaggagctct acttccttga 4920 caggacacat ttgtatcaac ttaaaaaagc agatttttgc cagcagaact attcattcag 4980 aggtaggaaa cttagaatag atgatgtcac tgattagcat ggcttcccca tctccacagc 5040 tgcttcccac ccaggttgcc cacagttgag tttgtccagt gctcagggct gcccactctc 5100 agtaagaagc cccacaccag cccctctcca aatatgttgg ctgttccttc cattaaagtg 5160 accccacttt agagcagcaa gtggatttct gtttcttaca gttcaggaag gaggagtcag 5220 ctgtgagaac ctggagcctg agatgcttct aagtcccact gctactgggg tcagggaagc 5280 cagactccag catcagcagt caggagcact aagcccttgc caacatcctg tttctcagag 5340 aaactgcttc cattataatg gttgtccttt tttaagctat caagccaaac aaccagtgtc 5400 taccattatt ctcatcacct gaagccaagg gttctagcaa aagtcaagct gtcttgtaat 5460 ggttgatgtg cctccagctt ctgtcttcag tcactccact cttagcctgc tctgaatcaa 5520 ctctgaccac agttccctgg agcccctgcc acctgctgcc cctgccacct tctccatctg 5580 cagtgctgtg cagccttctg cactcttgca gagctaatag gtggagactt gaaggaagag 5640 gaggaaagtt tctcataata gccttgctgc aagctcaaat gggaggtggg cactgtgccc 5700 aggagccttg gagcaaaggc tgtgcccaac ctctgactgc atccaggttt ggtcttgaca 5760 gagataagaa gccctggctt ttggagccaa aatctaggtc agacttaggc aggattctca 5820 aagtttatca gcagaacatg aggcagaaga ccctttctgc tccagcttct tcaggctcaa 5880 ccttcatcag aatagataga aagagaggct gtgagggttc ttaaaacaga agcaaatctg 5940 actcagagaa taaacaacct cctagtaaac tacagcttag acagagcatc tggtggtgag 6000 tgtgctcagt gtcctactca actgtctggt atcagccctc atgaggactt ctcttctttc 6060 cctcatagac ctccatctct gttttcctta gcctgcagaa atctggatgg ctattcacag 6120 aatgcctgtg ctttcagagt tgcatttttt ctctggtatt ctggttcaag catttgaagg 6180 taggaaaggt tctccaagtg caagaaagcc agccctgagc ctcaactgcc tggctagtgt 6240 ggtcagtagg atgcaaaggc tgttgaatgc cacaaggcca aactttaacc tgtgtaccac 6300 aagcctagca gcagaggcag ctctgctcac tggaactctc tgtcttcttt ctcctgagcc 6360 ttttcttttc ctgagttttc tagctctcct caaccttacc tctgccctac ccaggacaaa 6420 cccaagagcc actgtttctg tgatgtcctc tccagcccta attaggcatc atgacttcag 6480 cctgaccttc catgctcaga agcagtgcta atccacttca gatgagctgc tctatgcaac 6540 acaggcagag cctacaaacc tttgcaccag agccctccac atatcagtgt ttgttcatac 6600 tcacttcaac agcaaatgtg actgctgaga ttaagatttt acacaagatg gtctgtaatt 6660 tcacagttag ttttatccca ttaggtatga aagaattagc ataattcccc ttaaacatga 6720 atgaatctta gattttttaa taaatagttt tggaagtaaa gacagagaca tcaggagcac 6780 aaggaatagc ctgagaggac aaacagaaca agaaagagtc tggaaataca caggatgttc 6840 ttggcctcct caaagcaagt gcaagcagat agtaccagca gccccaggct atcagagccc 6900 agtgaagaga agtaccatga aagccacagc tctaaccacc ctgttccaga gtgacagaca 6960 gtccccaaga caagccagcc tgagccagag agagaactgc aagagaaagt ttctaattta 7020 ggttctgtta gattcagaca agtgcaggtc atcctctctc cacagctact cacctctcca 7080 gcctaacaaa gcctgcagtc cacactccaa ccctggtgtc tcacctccta gcctctccca 7140 acatcctgct ctctgaccat cttctgcatc tctcatctca ccatctccca ctgtctacag 7200 cctactcttg caactaccat ctcattttct gacatcctgt ctacatcttc tgccatactc 7260 tgccatctac cataccacct cttaccatct accacaccat cttttatctc catccctctc 7320 agaagcctcc aagctgaatc ctgctttatg tgttcatctc agcccctgca tggaaagctg 7380 accccagagg cagaactatt cccagagagc ttggccaaga aaaacaaaac taccagcctg 7440 gccaggctca ggagtagtaa gctgcagtgt ctgttgtgtt ctagcttcaa cagctgcagg 7500 agttccactc tcaaatgctc cacatttctc acatcctcct gattctggtc actacccatc 7560 ttcaaagaac agaatatctc acatcagcat actgtgaagg actagtcatg ggtgcagctg 7620 ctcagagctg caaagtcatt ctggatggtg gagagcttac aaacatttca tgatgctccc 7680 cccgctctga tggctggagc ccaatcccta cacagactcc tgctgtatgt gttttccttt 7740 cactctgagc cacagccaga gggcaggcat tcagtctcct cttcaggctg gggctggggc 7800 actgagaact cacccaacac cttgctctca ctccttctgc aaaacaagaa agagctttgt 7860 gctgcagtag ccatgaagaa tgaaaggaag gctttaacta aaaaatgtca gagattattt 7920 tcaacccctt actgtggatc accagcaagg aggaaacaca acacagagac attttttccc 7980 ctcaaattat caaaagaatc actgcatttg ttaaagagag caactgaatc aggaagcaga 8040 gttttgaaca tatcagaagt taggaatctg catcagagac aaatgcagtc atggttgttt 8100 gctgcatacc agccctaatc attagaagcc tcatggactt caaacatcat tccctctgac 8160 aagatgctct agcctaactc catgagataa aataaatctg cctttcagag ccaaagaaga 8220 gtccaccagc ttcttctcag tgtgaacaag agctccagtc aggttagtca gtccagtgca 8280 gtagaggaga ccagtctgca tcctctaatt ttcaaaggca agaagatttg tttaccctgg 8340 acaccaggca caagtgaggt cacagagctc ttagatatgc agtcctcatg agtgaggaga 8400 ctaaagcgca tgccatcaag acttcagtgt agagaaaacc tccaaaaaag cctcctcact 8460 acttctggaa tagctcagag gccgaggcgg cctcggcctc tgcataaata aaaaaaatta 8520 gtcagccatg gggcggagaa tgggcggaac tgggcggagt taggggcggg atgggcggag 8580 ttaggggcgg gactatggtt gctgactaat tgagatgcat gctttgcata cttctgcctg 8640 ctggggagcc tggggacttt ccacacctgg ttgctgacta attgagatgc atgctttgca 8700 tacttctgcc tgctggggag cctggggact ttccacaccc taactgacac acattccaca 8760 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 8820 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 8880 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 8940 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 9000 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 9060 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 9120 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 9180 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 9240 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 9300 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 9360 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 9420 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 9480 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 9540 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 9600 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 9660 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 9720 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 9780 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc tgcaaaccac 9840 gttgtgtctc aaaatctctg atgttacatt gcacaagata aaaatatatc atcatgaaca 9900 ataaaactgt ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg 9960 gaaacgtctt gctcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat 10020 aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag 10080 cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 10140 gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 10200 tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg gaaaacagca 10260 ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 10320 ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta 10380 tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt 10440 gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taagcttttg 10500 ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 10560 gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 10620 caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 10680 ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg 10740 ctcgatgagt ttttctaagg gcggcctgcc accataccca cgccgaaaca agcgctcatg 10800 agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata ggcgccagca 10860 accgcacctg tggcgccggt gatgagggcg cgccaagtcg acgtccggca gtc 10913 <210> 61 <211> 11209 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 61 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggaattc agcagcccca gcagagagga 660 atgccccaag cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct 720 gcttcaggcc gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta 780 cagcagcgtc gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt 840 tcctgctctg ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact 900 gagcatggga cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc 960 tgagcagaaa ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct 1020 gaatatcctg gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga 1080 ggaaggcatc ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag 1140 gacctacacc tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga 1200 agaggacacc aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc 1260 cgtgtcactg ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt 1320 gaatggcaag ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag 1380 atacttcgtg aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac 1440 agccgagaac gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt 1500 tacacccgag caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag 1560 cacccaccat aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg 1620 ggctaaagtg gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca 1680 ctggtatctg gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt 1740 ccccaacacc atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag 1800 cgtgcggctc ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct 1860 gctgtaccac gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc 1920 taactgggtc cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt 1980 ctacaagcag cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc 2040 tcagcgcgtt ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca 2100 ccctgatgga tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac 2160 catcaaggat cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac 2220 ctacctgtgg cgtagacagt gacaattgtt aattaagttt aaaccctcga ggccgcaagc 2280 cgcatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2340 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2400 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2460 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 2520 tgctggggag agatccacga taacaaacag cttttttggg ggatatcaaa ctgcctgttt 2580 gggcttctca tttcttacct ccccttccct ctcccacctg ctactgggtg catctctgct 2640 ccccccttcc ccagcagatg gttacctttg ggctgttgct ttcttgtcac catctgagtt 2700 ctcagacgct ggaaagccat gttctcggct ctgtgaatga caatgctgac tggagtgctg 2760 cccctctgta aagggctggg tgtggatggt cacaagcccc tcacatgcct cagccaagag 2820 gaagtagtac aggggtcagc ccagaggtcc aggggaaagg agtggaaacc gatttcccca 2880 ccaagggagg ggcctgtacc tcagctgttc ccatagctta cttgccacaa ctgccaagca 2940 agtttcgctg agtttgacac atggatccct gtggatcaac tgccctagga ctccgtttgc 3000 acccatgtga cactgttgac tttgccctga cgaagcaggg ccaacagtcc cctaacttaa 3060 ttacaaaaac taatgactaa gagagaggtg gctagagctg aggcccctga gtcaggctgt 3120 gggtgggatc atctccagta caggaagtga gactttcatt tcctcctttc caagagaggg 3180 ctgagggagc agggttgagc aactggtgca gacagcctag ctggactttg ggtgaggcgg 3240 ttcagccata tcgaattctg ctggggctac tggcaggtaa ggaggaagga ggctgagggg 3300 agggggcccc tgggagggag cctgccctgg gttgctaacc atctcctctc tgccaaaagt 3360 ccggaaagcc accatggagc ccctgcgcct gctgatcctg ctgttcgtga ccgagctgag 3420 cggcgcccac aacaccaccg tgttccaggg cgtggccggc cagagcctgc aggtgagctg 3480 cccctacgac agcatgaagc actggggccg ccgcaaggcc tggtgccgcc agctgggcga 3540 gaagggcccc tgccagcgcg tggtgagcac ccacaacctg tggctgctga gcttcctgcg 3600 ccgctggaac ggcagcaccg ccatcaccga cgacaccctg ggcggcaccc tgaccatcac 3660 cctgcgcaac ctgcagcccc acgacgccgg cctgtaccag tgccagagcc tgcacggcag 3720 cgaggccgac accctgcgca aggtgctggt ggaggtgctg gccgaccccc tggaccaccg 3780 cgacgccggc gacctgtggt tccccggcga gagcgagagc ttcgaggacg cccacgtgga 3840 gcacagcatc agccgcagcc tgctggaggg cgagatcccc ttccccccca ccagcatcct 3900 gctgctgctg gcctgcatct tcctgatcaa gatcctggcc gccagcgccc tgtgggccgc 3960 cgcctggcac ggccagaagc ccggcaccca cccccccagc gagctggact gcggccacga 4020 ccccggctac cagctgcaga ccctgcccgg cctgcgcgac acctgaccca ggggactcag 4080 cggccgctcg agtctagagg gcccgtttaa acccgctgat cagcctcgaa gacatgataa 4140 gatacattga tgagtttgga caaaccacaa caagaatgca gtgaaaaaaa tgctttattt 4200 gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta 4260 acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt 4320 aaagcaagta aaacctctac aaatgtggta tgaacatatt gactgaattc cctgcaggtt 4380 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg 4440 tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc 4500 caactccatc actaggggtt cctgcggccg ctcgtacggt ctcgaggaat tcctgcagga 4560 taacttgcca acctcattct aaaatgtata tagaagccca aaagacaata acaaaaatat 4620 tcttgtagaa caaaatggga aagaatgttc cactaaatat caagatttag agcaaagcat 4680 gagatgtgtg gggatagaca gtgaggctga taaaatagag tagagctcag aaacagaccc 4740 attgatatat gtaagtgacc tatgaaaaaa atatggcatt ttacaatggg aaaatgatgg 4800 tctttttctt ttttagaaaa acagggaaat atatttatat gtaaaaaata aaagggaacc 4860 catatgtcat accatacaca caaaaaaatt ccagtgaatt ataagtctaa atggagaagg 4920 caaaacttta aatcttttag aaaataatat agaagcatgc agaccagcct ggccaacatg 4980 atgaaaccct ctctactaat aataaaatca gtagaactac tcaggactac tttgagtggg 5040 aagtcctttt ctatgaagac ttctttggcc aaaattaggc tctaaatgca aggagatagt 5100 gcatcatgcc tggctgcact tactgataaa tgatgttatc accatcttta accaaatgca 5160 caggaacaag ttatggtact gatgtgctgg attgagaagg agctctactt ccttgacagg 5220 acacatttgt atcaacttaa aaaagcagat ttttgccagc agaactattc attcagaggt 5280 aggaaactta gaatagatga tgtcactgat tagcatggct tccccatctc cacagctgct 5340 tcccacccag gttgcccaca gttgagtttg tccagtgctc agggctgccc actctcagta 5400 agaagcccca caccagcccc tctccaaata tgttggctgt tccttccatt aaagtgaccc 5460 cactttagag cagcaagtgg atttctgttt cttacagttc aggaaggagg agtcagctgt 5520 gagaacctgg agcctgagat gcttctaagt cccactgcta ctggggtcag ggaagccaga 5580 ctccagcatc agcagtcagg agcactaagc ccttgccaac atcctgtttc tcagagaaac 5640 tgcttccatt ataatggttg tcctttttta agctatcaag ccaaacaacc agtgtctacc 5700 attattctca tcacctgaag ccaagggttc tagcaaaagt caagctgtct tgtaatggtt 5760 gatgtgcctc cagcttctgt cttcagtcac tccactctta gcctgctctg aatcaactct 5820 gaccacagtt ccctggagcc cctgccacct gctgcccctg ccaccttctc catctgcagt 5880 gctgtgcagc cttctgcact cttgcagagc taataggtgg agacttgaag gaagaggagg 5940 aaagtttctc ataatagcct tgctgcaagc tcaaatggga ggtgggcact gtgcccagga 6000 gccttggagc aaaggctgtg cccaacctct gactgcatcc aggtttggtc ttgacagaga 6060 taagaagccc tggcttttgg agccaaaatc taggtcagac ttaggcagga ttctcaaagt 6120 ttatcagcag aacatgaggc agaagaccct ttctgctcca gcttcttcag gctcaacctt 6180 catcagaata gatagaaaga gaggctgtga gggttcttaa aacagaagca aatctgactc 6240 agagaataaa caacctccta gtaaactaca gcttagacag agcatctggt ggtgagtgtg 6300 ctcagtgtcc tactcaactg tctggtatca gccctcatga ggacttctct tctttccctc 6360 atagacctcc atctctgttt tccttagcct gcagaaatct ggatggctat tcacagaatg 6420 cctgtgcttt cagagttgca ttttttctct ggtattctgg ttcaagcatt tgaaggtagg 6480 aaaggttctc caagtgcaag aaagccagcc ctgagcctca actgcctggc tagtgtggtc 6540 agtaggatgc aaaggctgtt gaatgccaca aggccaaact ttaacctgtg taccacaagc 6600 ctagcagcag aggcagctct gctcactgga actctctgtc ttctttctcc tgagcctttt 6660 cttttcctga gttttctagc tctcctcaac cttacctctg ccctacccag gacaaaccca 6720 agagccactg tttctgtgat gtcctctcca gccctaatta ggcatcatga cttcagcctg 6780 accttccatg ctcagaagca gtgctaatcc acttcagatg agctgctcta tgcaacacag 6840 gcagagccta caaacctttg caccagagcc ctccacatat cagtgtttgt tcatactcac 6900 ttcaacagca aatgtgactg ctgagattaa gattttacac aagatggtct gtaatttcac 6960 agttagtttt atcccattag gtatgaaaga attagcataa ttccccttaa acatgaatga 7020 atcttagatt ttttaataaa tagttttgga agtaaagaca gagacatcag gagcacaagg 7080 aatagcctga gaggacaaac agaacaagaa agagtctgga aatacacagg atgttcttgg 7140 cctcctcaaa gcaagtgcaa gcagatagta ccagcagccc caggctatca gagcccagtg 7200 aagagaagta ccatgaaagc cacagctcta accaccctgt tccagagtga cagacagtcc 7260 ccaagacaag ccagcctgag ccagagagag aactgcaaga gaaagtttct aatttaggtt 7320 ctgttagatt cagacaagtg caggtcatcc tctctccaca gctactcacc tctccagcct 7380 aacaaagcct gcagtccaca ctccaaccct ggtgtctcac ctcctagcct ctcccaacat 7440 cctgctctct gaccatcttc tgcatctctc atctcaccat ctcccactgt ctacagccta 7500 ctcttgcaac taccatctca ttttctgaca tcctgtctac atcttctgcc atactctgcc 7560 atctaccata ccacctctta ccatctacca caccatcttt tatctccatc cctctcagaa 7620 gcctccaagc tgaatcctgc tttatgtgtt catctcagcc cctgcatgga aagctgaccc 7680 cagaggcaga actattccca gagagcttgg ccaagaaaaa caaaactacc agcctggcca 7740 ggctcaggag tagtaagctg cagtgtctgt tgtgttctag cttcaacagc tgcaggagtt 7800 ccactctcaa atgctccaca tttctcacat cctcctgatt ctggtcacta cccatcttca 7860 aagaacagaa tatctcacat cagcatactg tgaaggacta gtcatgggtg cagctgctca 7920 gagctgcaaa gtcattctgg atggtggaga gcttacaaac atttcatgat gctccccccg 7980 ctctgatggc tggagcccaa tccctacaca gactcctgct gtatgtgttt tcctttcact 8040 ctgagccaca gccagagggc aggcattcag tctcctcttc aggctggggc tggggcactg 8100 agaactcacc caacaccttg ctctcactcc ttctgcaaaa caagaaagag ctttgtgctg 8160 cagtagccat gaagaatgaa aggaaggctt taactaaaaa atgtcagaga ttattttcaa 8220 ccccttactg tggatcacca gcaaggagga aacacaacac agagacattt tttcccctca 8280 aattatcaaa agaatcactg catttgttaa agagagcaac tgaatcagga agcagagttt 8340 tgaacatatc agaagttagg aatctgcatc agagacaaat gcagtcatgg ttgtttgctg 8400 cataccagcc ctaatcatta gaagcctcat ggacttcaaa catcattccc tctgacaaga 8460 tgctctagcc taactccatg agataaaata aatctgcctt tcagagccaa agaagagtcc 8520 accagcttct tctcagtgtg aacaagagct ccagtcaggt tagtcagtcc agtgcagtag 8580 aggagaccag tctgcatcct ctaattttca aaggcaagaa gatttgttta ccctggacac 8640 caggcacaag tgaggtcaca gagctcttag atatgcagtc ctcatgagtg aggagactaa 8700 agcgcatgcc atcaagactt cagtgtagag aaaacctcca aaaaagcctc ctcactactt 8760 ctggaatagc tcagaggccg aggcggcctc ggcctctgca taaataaaaa aaattagtca 8820 gccatggggc ggagaatggg cggaactggg cggagttagg ggcgggatgg gcggagttag 8880 gggcgggact atggttgctg actaattgag atgcatgctt tgcatacttc tgcctgctgg 8940 ggagcctggg gactttccac acctggttgc tgactaattg agatgcatgc tttgcatact 9000 tctgcctgct ggggagcctg gggactttcc acaccctaac tgacacacat tccacagctg 9060 cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 9120 tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 9180 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 9240 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 9300 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 9360 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 9420 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 9480 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 9540 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 9600 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 9660 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 9720 ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 9780 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 9840 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 9900 tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 9960 ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 10020 taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 10080 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactcctgca aaccacgttg 10140 tgtctcaaaa tctctgatgt tacattgcac aagataaaaa tatatcatca tgaacaataa 10200 aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaa 10260 cgtcttgctc gaggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat 10320 gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg 10380 atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg 10440 agatggtcag actaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta 10500 tccgtactcc tgatgatgca tggttactca ccactgcgat ccccgggaaa acagcattcc 10560 aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc 10620 tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacagcgat cgcgtatttc 10680 gtctcgctca ggcgcaatca cgaatgaata acggtttggt tgatgcgagt gattttgatg 10740 acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataag cttttgccat 10800 tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt atttttgacg 10860 aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac cgataccagg 10920 atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag aaacggcttt 10980 ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcat ttgatgctcg 11040 atgagttttt ctaagggcgg cctgccacca tacccacgcc gaaacaagcg ctcatgagcc 11100 cgaagtggcg agcccgatct tccccatcgg tgatgtcggc gatataggcg ccagcaaccg 11160 cacctgtggc gccggtgatg agggcgcgcc aagtcgacgt ccggcagtc 11209 <210> 62 <211> 11459 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 62 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 360 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 420 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 480 caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 540 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 600 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 660 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 720 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 780 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 840 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 900 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 960 ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1020 gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1080 gcgcttggtt taatgacggc ttgttttctg tggctgcgtg aaagccttga ggggctccgg 1140 gagctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1200 acgtgctggt tattgtgctg tctcatcatt ttggcaaaga attcctcgaa gatccgaagg 1260 gaaagtcttc cacgactgtg ggatccgttc gaagatatca ccggttgagc caccatggaa 1320 ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 1380 ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1440 tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1500 gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1560 agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1620 ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1680 gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1740 ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1800 gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1860 ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1920 gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1980 tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 2040 atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 2100 aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 2160 tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 2220 ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 2280 cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 2340 tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 2400 ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2460 ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2520 agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2580 gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2640 gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2700 agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2760 ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2820 agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2880 agccctggct actccatcca cacctacctg tggcgtagac agtgacaatt gttaattaag 2940 tttaaaccct cgaggccgca agccgcatcg ataccgtcga ctagagctcg ctgatcagcc 3000 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 3060 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 3120 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 3180 gattgggaag acaatagcag gcatgctggg gagagatcca cgataacaaa cagctttttt 3240 gggggggcgg agttagggcg gagccaatca gcgtgcgccg ttccgaaagt tgccttttat 3300 ggctgggcgg agaatgggcg gtgaacgccg atgattatat aaggacgcgc cgggtgtggc 3360 acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg atccctgtga 3420 tcgtcacttg gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc 3480 agtgcaggaa aagtggcact atgaaccctg cagccctagg aatgcatcta gacaattgta 3540 ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgccc cgcggcttca 3600 cctggctgcg ctacctgggc atcttcctgg gcgtggccct gggcaacgag cccctggaga 3660 tgtggcccct gacccagaac gaggagtgca ccgtgaccgg cttcctgcgc gacaagctgc 3720 agtaccgcag ccgcctgcag tacatgaagc actacttccc catcaactac aagatcagcg 3780 tgccctacga gggcgtgttc cgcatcgcca acgtgacccg cctgcagcgc gcccaggtga 3840 gcgagcgcga gctgcgctac ctgtgggtgc tggtgagcct gagcgccacc gagagcgtgc 3900 aggacgtgct gctggagggc caccccagct ggaagtacct gcaggaggtg gagaccctgc 3960 tgctgaacgt gcagcagggc ctgaccgacg tggaggtgag ccccaaggtg gagagcgtgc 4020 tgagcctgct gaacgccccc ggccccaacc tgaagctggt gcgccccaag gccctgctgg 4080 acaactgctt ccgcgtgatg gagctgctgt actgcagctg ctgcaagcag agcagcgtgc 4140 tgaactggca ggactgcgag gtgcccagcc cccagagctg cagccccgag cccagcctgc 4200 agtacgccgc cacccagctg tacccccccc ccccctggag ccccagcagc cccccccaca 4260 gcaccggcag cgtgcgcccc gtgcgcgccc agggcgaggg cctgctgccc taatgaccca 4320 ggggactcag cggccgctcg agtctagagg gcccgtttaa acccgctgat cagcctcgaa 4380 gacatgataa gatacattga tgagtttgga caaaccacaa caagaatgca gtgaaaaaaa 4440 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 4500 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg 4560 gaggtttttt aaagcaagta aaacctctac aaatgtggta tgaacatatt gactgaattc 4620 cctgcaggtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gcccgggcaa 4680 agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag 4740 agggagtggc caactccatc actaggggtt cctgcggccg ctcgtacggt ctcgaggaat 4800 tcctgcagga taacttgcca acctcattct aaaatgtata tagaagccca aaagacaata 4860 acaaaaatat tcttgtagaa caaaatggga aagaatgttc cactaaatat caagatttag 4920 agcaaagcat gagatgtgtg gggatagaca gtgaggctga taaaatagag tagagctcag 4980 aaacagaccc attgatatat gtaagtgacc tatgaaaaaa atatggcatt ttacaatggg 5040 aaaatgatgg tctttttctt ttttagaaaa acagggaaat atatttatat gtaaaaaata 5100 aaagggaacc catatgtcat accatacaca caaaaaaatt ccagtgaatt ataagtctaa 5160 atggagaagg caaaacttta aatcttttag aaaataatat agaagcatgc agaccagcct 5220 ggccaacatg atgaaaccct ctctactaat aataaaatca gtagaactac tcaggactac 5280 tttgagtggg aagtcctttt ctatgaagac ttctttggcc aaaattaggc tctaaatgca 5340 aggagatagt gcatcatgcc tggctgcact tactgataaa tgatgttatc accatcttta 5400 accaaatgca caggaacaag ttatggtact gatgtgctgg attgagaagg agctctactt 5460 ccttgacagg acacatttgt atcaacttaa aaaagcagat ttttgccagc agaactattc 5520 attcagaggt aggaaactta gaatagatga tgtcactgat tagcatggct tccccatctc 5580 cacagctgct tcccacccag gttgcccaca gttgagtttg tccagtgctc agggctgccc 5640 actctcagta agaagcccca caccagcccc tctccaaata tgttggctgt tccttccatt 5700 aaagtgaccc cactttagag cagcaagtgg atttctgttt cttacagttc aggaaggagg 5760 agtcagctgt gagaacctgg agcctgagat gcttctaagt cccactgcta ctggggtcag 5820 ggaagccaga ctccagcatc agcagtcagg agcactaagc ccttgccaac atcctgtttc 5880 tcagagaaac tgcttccatt ataatggttg tcctttttta agctatcaag ccaaacaacc 5940 agtgtctacc attattctca tcacctgaag ccaagggttc tagcaaaagt caagctgtct 6000 tgtaatggtt gatgtgcctc cagcttctgt cttcagtcac tccactctta gcctgctctg 6060 aatcaactct gaccacagtt ccctggagcc cctgccacct gctgcccctg ccaccttctc 6120 catctgcagt gctgtgcagc cttctgcact cttgcagagc taataggtgg agacttgaag 6180 gaagaggagg aaagtttctc ataatagcct tgctgcaagc tcaaatggga ggtgggcact 6240 gtgcccagga gccttggagc aaaggctgtg cccaacctct gactgcatcc aggtttggtc 6300 ttgacagaga taagaagccc tggcttttgg agccaaaatc taggtcagac ttaggcagga 6360 ttctcaaagt ttatcagcag aacatgaggc agaagaccct ttctgctcca gcttcttcag 6420 gctcaacctt catcagaata gatagaaaga gaggctgtga gggttcttaa aacagaagca 6480 aatctgactc agagaataaa caacctccta gtaaactaca gcttagacag agcatctggt 6540 ggtgagtgtg ctcagtgtcc tactcaactg tctggtatca gccctcatga ggacttctct 6600 tctttccctc atagacctcc atctctgttt tccttagcct gcagaaatct ggatggctat 6660 tcacagaatg cctgtgcttt cagagttgca ttttttctct ggtattctgg ttcaagcatt 6720 tgaaggtagg aaaggttctc caagtgcaag aaagccagcc ctgagcctca actgcctggc 6780 tagtgtggtc agtaggatgc aaaggctgtt gaatgccaca aggccaaact ttaacctgtg 6840 taccacaagc ctagcagcag aggcagctct gctcactgga actctctgtc ttctttctcc 6900 tgagcctttt cttttcctga gttttctagc tctcctcaac cttacctctg ccctacccag 6960 gacaaaccca agagccactg tttctgtgat gtcctctcca gccctaatta ggcatcatga 7020 cttcagcctg accttccatg ctcagaagca gtgctaatcc acttcagatg agctgctcta 7080 tgcaacacag gcagagccta caaacctttg caccagagcc ctccacatat cagtgtttgt 7140 tcatactcac ttcaacagca aatgtgactg ctgagattaa gattttacac aagatggtct 7200 gtaatttcac agttagtttt atcccattag gtatgaaaga attagcataa ttccccttaa 7260 acatgaatga atcttagatt ttttaataaa tagttttgga agtaaagaca gagacatcag 7320 gagcacaagg aatagcctga gaggacaaac agaacaagaa agagtctgga aatacacagg 7380 atgttcttgg cctcctcaaa gcaagtgcaa gcagatagta ccagcagccc caggctatca 7440 gagcccagtg aagagaagta ccatgaaagc cacagctcta accaccctgt tccagagtga 7500 cagacagtcc ccaagacaag ccagcctgag ccagagagag aactgcaaga gaaagtttct 7560 aatttaggtt ctgttagatt cagacaagtg caggtcatcc tctctccaca gctactcacc 7620 tctccagcct aacaaagcct gcagtccaca ctccaaccct ggtgtctcac ctcctagcct 7680 ctcccaacat cctgctctct gaccatcttc tgcatctctc atctcaccat ctcccactgt 7740 ctacagccta ctcttgcaac taccatctca ttttctgaca tcctgtctac atcttctgcc 7800 atactctgcc atctaccata ccacctctta ccatctacca caccatcttt tatctccatc 7860 cctctcagaa gcctccaagc tgaatcctgc tttatgtgtt catctcagcc cctgcatgga 7920 aagctgaccc cagaggcaga actattccca gagagcttgg ccaagaaaaa caaaactacc 7980 agcctggcca ggctcaggag tagtaagctg cagtgtctgt tgtgttctag cttcaacagc 8040 tgcaggagtt ccactctcaa atgctccaca tttctcacat cctcctgatt ctggtcacta 8100 cccatcttca aagaacagaa tatctcacat cagcatactg tgaaggacta gtcatgggtg 8160 cagctgctca gagctgcaaa gtcattctgg atggtggaga gcttacaaac atttcatgat 8220 gctccccccg ctctgatggc tggagcccaa tccctacaca gactcctgct gtatgtgttt 8280 tcctttcact ctgagccaca gccagagggc aggcattcag tctcctcttc aggctggggc 8340 tggggcactg agaactcacc caacaccttg ctctcactcc ttctgcaaaa caagaaagag 8400 ctttgtgctg cagtagccat gaagaatgaa aggaaggctt taactaaaaa atgtcagaga 8460 ttattttcaa ccccttactg tggatcacca gcaaggagga aacacaacac agagacattt 8520 tttcccctca aattatcaaa agaatcactg catttgttaa agagagcaac tgaatcagga 8580 agcagagttt tgaacatatc agaagttagg aatctgcatc agagacaaat gcagtcatgg 8640 ttgtttgctg cataccagcc ctaatcatta gaagcctcat ggacttcaaa catcattccc 8700 tctgacaaga tgctctagcc taactccatg agataaaata aatctgcctt tcagagccaa 8760 agaagagtcc accagcttct tctcagtgtg aacaagagct ccagtcaggt tagtcagtcc 8820 agtgcagtag aggagaccag tctgcatcct ctaattttca aaggcaagaa gatttgttta 8880 ccctggacac caggcacaag tgaggtcaca gagctcttag atatgcagtc ctcatgagtg 8940 aggagactaa agcgcatgcc atcaagactt cagtgtagag aaaacctcca aaaaagcctc 9000 ctcactactt ctggaatagc tcagaggccg aggcggcctc ggcctctgca taaataaaaa 9060 aaattagtca gccatggggc ggagaatggg cggaactggg cggagttagg ggcgggatgg 9120 gcggagttag gggcgggact atggttgctg actaattgag atgcatgctt tgcatacttc 9180 tgcctgctgg ggagcctggg gactttccac acctggttgc tgactaattg agatgcatgc 9240 tttgcatact tctgcctgct ggggagcctg gggactttcc acaccctaac tgacacacat 9300 tccacagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 9360 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 9420 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 9480 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 9540 gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 9600 gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 9660 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 9720 aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 9780 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 9840 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 9900 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 9960 gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 10020 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 10080 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 10140 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 10200 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 10260 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 10320 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactcctgca 10380 aaccacgttg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa tatatcatca 10440 tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt 10500 caacgggaaa cgtcttgctc gaggccgcga ttaaattcca acatggatgc tgatttatat 10560 gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat 10620 gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat 10680 gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct tccgaccatc 10740 aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat ccccgggaaa 10800 acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg 10860 gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacagcgat 10920 cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt tgatgcgagt 10980 gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataag 11040 cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt 11100 atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac 11160 cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag 11220 aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcat 11280 ttgatgctcg atgagttttt ctaagggcgg cctgccacca tacccacgcc gaaacaagcg 11340 ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc gatataggcg 11400 ccagcaaccg cacctgtggc gccggtgatg agggcgcgcc aagtcgacgt ccggcagtc 11459 <210> 63 <211> 274 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 63 Met Gly Lys Ser Leu Ser His Leu Pro Leu His Ser Ser Lys Glu Asp 1 5 10 15 Ala Tyr Asp Gly Val Thr Ser Glu Asn Met Arg Asn Gly Leu Val Asn 20 25 30 Ser Glu Val His Asn Glu Asp Gly Arg Asn Gly Asp Val Ser Gln Phe 35 40 45 Pro Tyr Val Glu Phe Thr Gly Arg Asp Ser Val Thr Cys Pro Thr Cys 50 55 60 Gln Gly Thr Gly Arg Ile Pro Arg Gly Gln Glu Asn Gln Leu Val Ala 65 70 75 80 Leu Ile Pro Tyr Ser Asp Gln Arg Leu Arg Pro Arg Arg Thr Lys Leu 85 90 95 Tyr Val Met Ala Ser Val Phe Val Cys Leu Leu Leu Ser Gly Leu Ala 100 105 110 Val Phe Phe Leu Phe Pro Arg Ser Ile Asp Val Lys Tyr Ile Gly Val 115 120 125 Lys Ser Ala Tyr Val Ser Tyr Asp Val Gln Lys Arg Thr Ile Tyr Leu 130 135 140 Asn Ile Thr Asn Thr Leu Asn Ile Thr Asn Asn Asn Tyr Tyr Ser Val 145 150 155 160 Glu Val Glu Asn Ile Thr Ala Gln Val Gln Phe Ser Lys Thr Val Ile 165 170 175 Gly Lys Ala Arg Leu Asn Asn Ile Thr Ile Ile Gly Pro Leu Asp Met 180 185 190 Lys Gln Ile Asp Tyr Thr Val Pro Thr Val Ile Ala Glu Glu Met Ser 195 200 205 Tyr Met Tyr Asp Phe Cys Thr Leu Ile Ser Ile Lys Val His Asn Ile 210 215 220 Val Leu Met Met Gln Val Thr Val Thr Thr Thr Tyr Phe Gly His Ser 225 230 235 240 Glu Gln Ile Ser Gln Glu Arg Tyr Gln Tyr Val Asp Cys Gly Arg Asn 245 250 255 Thr Thr Tyr Gln Leu Gly Gln Ser Glu Tyr Leu Asn Val Leu Gln Pro 260 265 270 Gln Gln <210> 64 <211> 825 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 64 atgggcaaga gcctgagcca cctgcccctg cacagcagca aggaggacgc ctacgacggc 60 gtgaccagcg agaacatgcg caacggcctg gtgaacagcg aggtgcacaa cgaggacggc 120 cgcaacggcg acgtgagcca gttcccctac gtggagttca ccggccgcga cagcgtgacc 180 tgccccacct gccagggcac cggccgcatc ccccgcggcc aggagaacca gctggtggcc 240 ctgatcccct acagcgacca gcgcctgcgc ccccgccgca ccaagctgta cgtgatggcc 300 agcgtgttcg tgtgcctgct gctgagcggc ctggccgtgt tcttcctgtt cccccgcagc 360 atcgacgtga agtacatcgg cgtgaagagc gcctacgtga gctacgacgt gcagaagcgc 420 accatctacc tgaacatcac caacaccctg aacatcacca acaacaacta ctacagcgtg 480 gaggtggaga acatcaccgc ccaggtgcag ttcagcaaga ccgtgatcgg caaggcccgc 540 ctgaacaaca tcaccatcat cggccccctg gacatgaagc agatcgacta caccgtgccc 600 accgtgatcg ccgaggagat gagctacatg tacgacttct gcaccctgat cagcatcaag 660 gtgcacaaca tcgtgctgat gatgcaggtg accgtgacca ccacctactt cggccacagc 720 gagcagatca gccaggagcg ctaccagtac gtggactgcg gccgcaacac cacctaccag 780 ctgggccaga gcgagtacct gaacgtgctg cagccccagc agtaa 825 <210> 65 <211> 267 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 65 gtgatatcac aaggtcccag ggctggggtc agaaattctc tcccgaggga atgaagccac 60 aggagccaag agcaggagga ccaaggccct ggcgaaggcc gtggcctcgt tcaagtaaaa 120 gatcctagta cagtgcaggt cccaatgtgt actaggatct tttacttgaa cggggacgcc 180 ggcatccggg ctcaggaccc ccctctctgc cagaggcacc aacaccagag ttcacaaatc 240 agtctcctgc cctttgcatg tagcaaa 267 <210> 66 <211> 267 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 66 tttgctacat gcaaagggca ggagactgat ttgtgaactc tggtgttggt gcctctggca 60 gagagggggg tcctgagccc ggatgccggc gtccccgttc aagtaaaaga tcctagtaca 120 cattgggacc tgcactgtac taggatcttt tacttgaacg aggccacggc cttcgccagg 180 gccttggtcc tcctgctctt ggctcctgtg gcttcattcc ctcgggagag aatttctgac 240 cccagccctg ggaccttgtg atatcac 267 <210> 67 <211> 593 <212> PRT <213> Artificial sequence <220> <223> Synthetic polypeptide <400> 67 Met Trp Thr Leu Val Ser Trp Val Ala Leu Thr Ala Gly Leu Val Ala 1 5 10 15 Gly Thr Arg Cys Pro Asp Gly Gln Phe Cys Pro Val Ala Cys Cys Leu 20 25 30 Asp Pro Gly Gly Ala Ser Tyr Ser Cys Cys Arg Pro Leu Leu Asp Lys 35 40 45 Trp Pro Thr Thr Leu Ser Arg His Leu Gly Gly Pro Cys Gln Val Asp 50 55 60 Ala His Cys Ser Ala Gly His Ser Cys Ile Phe Thr Val Ser Gly Thr 65 70 75 80 Ser Ser Cys Cys Pro Phe Pro Glu Ala Val Ala Cys Gly Asp Gly His 85 90 95 His Cys Cys Pro Arg Gly Phe His Cys Ser Ala Asp Gly Arg Ser Cys 100 105 110 Phe Gln Arg Ser Gly Asn Asn Ser Val Gly Ala Ile Gln Cys Pro Asp 115 120 125 Ser Gln Phe Glu Cys Pro Asp Phe Ser Thr Cys Cys Val Met Val Asp 130 135 140 Gly Ser Trp Gly Cys Cys Pro Met Pro Gln Ala Ser Cys Cys Glu Asp 145 150 155 160 Arg Val His Cys Cys Pro His Gly Ala Phe Cys Asp Leu Val His Thr 165 170 175 Arg Cys Ile Thr Pro Thr Gly Thr His Pro Leu Ala Lys Lys Leu Pro 180 185 190 Ala Gln Arg Thr Asn Arg Ala Val Ala Leu Ser Ser Ser Val Met Cys 195 200 205 Pro Asp Ala Arg Ser Arg Cys Pro Asp Gly Ser Thr Cys Cys Glu Leu 210 215 220 Pro Ser Gly Lys Tyr Gly Cys Cys Pro Met Pro Asn Ala Thr Cys Cys 225 230 235 240 Ser Asp His Leu His Cys Cys Pro Gln Asp Thr Val Cys Asp Leu Ile 245 250 255 Gln Ser Lys Cys Leu Ser Lys Glu Asn Ala Thr Thr Asp Leu Leu Thr 260 265 270 Lys Leu Pro Ala His Thr Val Gly Asp Val Lys Cys Asp Met Glu Val 275 280 285 Ser Cys Pro Asp Gly Tyr Thr Cys Cys Arg Leu Gln Ser Gly Ala Trp 290 295 300 Gly Cys Cys Pro Phe Thr Gln Ala Val Cys Cys Glu Asp His Ile His 305 310 315 320 Cys Cys Pro Ala Gly Phe Thr Cys Asp Thr Gln Lys Gly Thr Cys Glu 325 330 335 Gln Gly Pro His Gln Val Pro Trp Met Glu Lys Ala Pro Ala His Leu 340 345 350 Ser Leu Pro Asp Pro Gln Ala Leu Lys Arg Asp Val Pro Cys Asp Asn 355 360 365 Val Ser Ser Cys Pro Ser Ser Asp Thr Cys Cys Gln Leu Thr Ser Gly 370 375 380 Glu Trp Gly Cys Cys Pro Ile Pro Glu Ala Val Cys Cys Ser Asp His 385 390 395 400 Gln His Cys Cys Pro Gln Gly Tyr Thr Cys Val Ala Glu Gly Gln Cys 405 410 415 Gln Arg Gly Ser Glu Ile Val Ala Gly Leu Glu Lys Met Pro Ala Arg 420 425 430 Arg Ala Ser Leu Ser His Pro Arg Asp Ile Gly Cys Asp Gln His Thr 435 440 445 Ser Cys Pro Val Gly Gln Thr Cys Cys Pro Ser Leu Gly Gly Ser Trp 450 455 460 Ala Cys Cys Gln Leu Pro His Ala Val Cys Cys Glu Asp Arg Gln His 465 470 475 480 Cys Cys Pro Ala Gly Tyr Thr Cys Asn Val Lys Ala Arg Ser Cys Glu 485 490 495 Lys Glu Val Val Ser Ala Gln Pro Ala Thr Phe Leu Ala Arg Ser Pro 500 505 510 His Val Gly Val Lys Asp Val Glu Cys Gly Glu Gly His Phe Cys His 515 520 525 Asp Asn Gln Thr Cys Cys Arg Asp Asn Arg Gln Gly Trp Ala Cys Cys 530 535 540 Pro Tyr Arg Gln Gly Val Cys Cys Ala Asp Arg Arg His Cys Cys Pro 545 550 555 560 Ala Gly Phe Arg Cys Ala Ala Arg Gly Thr Lys Cys Leu Arg Arg Glu 565 570 575 Ala Pro Arg Trp Asp Ala Pro Leu Arg Asp Pro Ala Leu Arg Gln Leu 580 585 590 Leu <210> 68 <211> 1779 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 68 atgtggaccc tggtgagctg ggtggccctg accgccggcc tggtggccgg cacccgctgc 60 cccgacggcc agttctgccc cgtggcctgc tgcctggacc ccggcggcgc cagctacagc 120 tgctgccgcc ccctgctgga caagtggccc accaccctga gccgccacct gggcggcccc 180 tgccaggtgg acgcccactg cagcgccggc cacagctgca tcttcaccgt gagcggcacc 240 agcagctgct gccccttccc cgaggccgtg gcctgcggcg acggccacca ctgctgcccc 300 cgcggcttcc actgcagcgc cgacggccgc agctgcttcc agcgcagcgg caacaacagc 360 gtgggcgcca tccagtgccc cgacagccag ttcgagtgcc ccgacttcag cacctgctgc 420 gtgatggtgg acggcagctg gggctgctgc cccatgcccc aggccagctg ctgcgaggac 480 cgcgtgcact gctgccccca cggcgccttc tgcgacctgg tgcacacccg ctgcatcacc 540 cccaccggca cccaccccct ggccaagaag ctgcccgccc agcgcaccaa ccgcgccgtg 600 gccctgagca gcagcgtgat gtgccccgac gcccgcagcc gctgccccga cggcagcacc 660 tgctgcgagc tgcccagcgg caagtacggc tgctgcccca tgcccaacgc cacctgctgc 720 agcgaccacc tgcactgctg cccccaggac accgtgtgcg acctgatcca gagcaagtgc 780 ctgagcaagg agaacgccac caccgacctg ctgaccaagc tgcccgccca caccgtgggc 840 gacgtgaagt gcgacatgga ggtgagctgc cccgacggct acacctgctg ccgcctgcag 900 agcggcgcct ggggctgctg ccccttcacc caggccgtgt gctgcgagga ccacatccac 960 tgctgccccg ccggcttcac ctgcgacacc cagaagggca cctgcgagca gggcccccac 1020 caggtgccct ggatggagaa ggcccccgcc cacctgagcc tgcccgaccc ccaggccctg 1080 aagcgcgacg tgccctgcga caacgtgagc agctgcccca gcagcgacac ctgctgccag 1140 ctgaccagcg gcgagtgggg ctgctgcccc atccccgagg ccgtgtgctg cagcgaccac 1200 cagcactgct gcccccaggg ctacacctgc gtggccgagg gccagtgcca gcgcggcagc 1260 gagatcgtgg ccggcctgga gaagatgccc gcccgccgcg ccagcctgag ccacccccgc 1320 gacatcggct gcgaccagca caccagctgc cccgtgggcc agacctgctg ccccagcctg 1380 ggcggcagct gggcctgctg ccagctgccc cacgccgtgt gctgcgagga ccgccagcac 1440 tgctgccccg ccggctacac ctgcaacgtg aaggcccgca gctgcgagaa ggaggtggtg 1500 agcgcccagc ccgccacctt cctggcccgc agcccccacg tgggcgtgaa ggacgtggag 1560 tgcggcgagg gccacttctg ccacgacaac cagacctgct gccgcgacaa ccgccagggc 1620 tgggcctgct gcccctaccg ccagggcgtg tgctgcgccg accgccgcca ctgctgcccc 1680 gccggcttcc gctgcgccgc ccgcggcacc aagtgcctgc gccgcgaggc cccccgctgg 1740 gacgcccccc tgcgcgaccc cgccctgcgc cagctgctg 1779 <210> 69 <211> 10871 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 69 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140 cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200 gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260 agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320 tggaccctgg tgagctgggt ggccctgacc gccggcctgg tggccggcac ccgctgcccc 1380 gacggccagt tctgccccgt ggcctgctgc ctggaccccg gcggcgccag ctacagctgc 1440 tgccgccccc tgctggacaa gtggcccacc accctgagcc gccacctggg cggcccctgc 1500 caggtggacg cccactgcag cgccggccac agctgcatct tcaccgtgag cggcaccagc 1560 agctgctgcc ccttccccga ggccgtggcc tgcggcgacg gccaccactg ctgcccccgc 1620 ggcttccact gcagcgccga cggccgcagc tgcttccagc gcagcggcaa caacagcgtg 1680 ggcgccatcc agtgccccga cagccagttc gagtgccccg acttcagcac ctgctgcgtg 1740 atggtggacg gcagctgggg ctgctgcccc atgccccagg ccagctgctg cgaggaccgc 1800 gtgcactgct gcccccacgg cgccttctgc gacctggtgc acacccgctg catcaccccc 1860 accggcaccc accccctggc caagaagctg cccgcccagc gcaccaaccg cgccgtggcc 1920 ctgagcagca gcgtgatgtg ccccgacgcc cgcagccgct gccccgacgg cagcacctgc 1980 tgcgagctgc ccagcggcaa gtacggctgc tgccccatgc ccaacgccac ctgctgcagc 2040 gaccacctgc actgctgccc ccaggacacc gtgtgcgacc tgatccagag caagtgcctg 2100 agcaaggaga acgccaccac cgacctgctg accaagctgc ccgcccacac cgtgggcgac 2160 gtgaagtgcg acatggaggt gagctgcccc gacggctaca cctgctgccg cctgcagagc 2220 ggcgcctggg gctgctgccc cttcacccag gccgtgtgct gcgaggacca catccactgc 2280 tgccccgccg gcttcacctg cgacacccag aagggcacct gcgagcaggg cccccaccag 2340 gtgccctgga tggagaaggc ccccgcccac ctgagcctgc ccgaccccca ggccctgaag 2400 cgcgacgtgc cctgcgacaa cgtgagcagc tgccccagca gcgacacctg ctgccagctg 2460 accagcggcg agtggggctg ctgccccatc cccgaggccg tgtgctgcag cgaccaccag 2520 cactgctgcc cccagggcta cacctgcgtg gccgagggcc agtgccagcg cggcagcgag 2580 atcgtggccg gcctggagaa gatgcccgcc cgccgcgcca gcctgagcca cccccgcgac 2640 atcggctgcg accagcacac cagctgcccc gtgggccaga cctgctgccc cagcctgggc 2700 ggcagctggg cctgctgcca gctgccccac gccgtgtgct gcgaggaccg ccagcactgc 2760 tgccccgccg gctacacctg caacgtgaag gcccgcagct gcgagaagga ggtggtgagc 2820 gcccagcccg ccaccttcct ggcccgcagc ccccacgtgg gcgtgaagga cgtggagtgc 2880 ggcgagggcc acttctgcca cgacaaccag acctgctgcc gcgacaaccg ccagggctgg 2940 gcctgctgcc cctaccgcca gggcgtgtgc tgcgccgacc gccgccactg ctgccccgcc 3000 ggcttccgct gcgccgcccg cggcaccaag tgcctgcgcc gcgaggcccc ccgctgggac 3060 gcccccctgc gcgaccccgc cctgcgccag ctgctgtgac aattgttaat taagtttaaa 3120 ccctcgaggc cgcaagctta tcgataatca acctctggat tacaaaattt gtgaaagatt 3180 gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc 3240 tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg 3300 gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac 3360 tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc agctcctttc 3420 cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg cctgccttgc 3480 ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt tgtcggggaa 3540 atcatcgtcc tttccttggc tgctcgcctg tgttgccacc tggattctgc gcgggacgtc 3600 cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc 3660 ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga tctccctttg 3720 ggccgcctcc ccgcatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 3780 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 3840 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 3900 tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 3960 aatagcaggc atgctgggga gagatccacg ataacaaaca gcttttttgg ggtgaacata 4020 ttgactgaat tccctgcagg ttggccactc cctctctgcg cgctcgctcg ctcactgagg 4080 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 4140 gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctgcggc cgctcgtacg 4200 gtctcgagga attcctgcag gataacttgc caacctcatt ctaaaatgta tatagaagcc 4260 caaaagacaa taacaaaaat attcttgtag aacaaaatgg gaaagaatgt tccactaaat 4320 atcaagattt agagcaaagc atgagatgtg tggggataga cagtgaggct gataaaatag 4380 agtagagctc agaaacagac ccattgatat atgtaagtga cctatgaaaa aaatatggca 4440 ttttacaatg ggaaaatgat ggtctttttc ttttttagaa aaacagggaa atatatttat 4500 atgtaaaaaa taaaagggaa cccatatgtc ataccataca cacaaaaaaa ttccagtgaa 4560 ttataagtct aaatggagaa ggcaaaactt taaatctttt agaaaataat atagaagcat 4620 gcagaccagc ctggccaaca tgatgaaacc ctctctacta ataataaaat cagtagaact 4680 actcaggact actttgagtg ggaagtcctt ttctatgaag acttctttgg ccaaaattag 4740 gctctaaatg caaggagata gtgcatcatg cctggctgca cttactgata aatgatgtta 4800 tcaccatctt taaccaaatg cacaggaaca agttatggta ctgatgtgct ggattgagaa 4860 ggagctctac ttccttgaca ggacacattt gtatcaactt aaaaaagcag atttttgcca 4920 gcagaactat tcattcagag gtaggaaact tagaatagat gatgtcactg attagcatgg 4980 cttccccatc tccacagctg cttcccaccc aggttgccca cagttgagtt tgtccagtgc 5040 tcagggctgc ccactctcag taagaagccc cacaccagcc cctctccaaa tatgttggct 5100 gttccttcca ttaaagtgac cccactttag agcagcaagt ggatttctgt ttcttacagt 5160 tcaggaagga ggagtcagct gtgagaacct ggagcctgag atgcttctaa gtcccactgc 5220 tactggggtc agggaagcca gactccagca tcagcagtca ggagcactaa gcccttgcca 5280 acatcctgtt tctcagagaa actgcttcca ttataatggt tgtccttttt taagctatca 5340 agccaaacaa ccagtgtcta ccattattct catcacctga agccaagggt tctagcaaaa 5400 gtcaagctgt cttgtaatgg ttgatgtgcc tccagcttct gtcttcagtc actccactct 5460 tagcctgctc tgaatcaact ctgaccacag ttccctggag cccctgccac ctgctgcccc 5520 tgccaccttc tccatctgca gtgctgtgca gccttctgca ctcttgcaga gctaataggt 5580 ggagacttga aggaagagga ggaaagtttc tcataatagc cttgctgcaa gctcaaatgg 5640 gaggtgggca ctgtgcccag gagccttgga gcaaaggctg tgcccaacct ctgactgcat 5700 ccaggtttgg tcttgacaga gataagaagc cctggctttt ggagccaaaa tctaggtcag 5760 acttaggcag gattctcaaa gtttatcagc agaacatgag gcagaagacc ctttctgctc 5820 cagcttcttc aggctcaacc ttcatcagaa tagatagaaa gagaggctgt gagggttctt 5880 aaaacagaag caaatctgac tcagagaata aacaacctcc tagtaaacta cagcttagac 5940 agagcatctg gtggtgagtg tgctcagtgt cctactcaac tgtctggtat cagccctcat 6000 gaggacttct cttctttccc tcatagacct ccatctctgt tttccttagc ctgcagaaat 6060 ctggatggct attcacagaa tgcctgtgct ttcagagttg cattttttct ctggtattct 6120 ggttcaagca tttgaaggta ggaaaggttc tccaagtgca agaaagccag ccctgagcct 6180 caactgcctg gctagtgtgg tcagtaggat gcaaaggctg ttgaatgcca caaggccaaa 6240 ctttaacctg tgtaccacaa gcctagcagc agaggcagct ctgctcactg gaactctctg 6300 tcttctttct cctgagcctt ttcttttcct gagttttcta gctctcctca accttacctc 6360 tgccctaccc aggacaaacc caagagccac tgtttctgtg atgtcctctc cagccctaat 6420 taggcatcat gacttcagcc tgaccttcca tgctcagaag cagtgctaat ccacttcaga 6480 tgagctgctc tatgcaacac aggcagagcc tacaaacctt tgcaccagag ccctccacat 6540 atcagtgttt gttcatactc acttcaacag caaatgtgac tgctgagatt aagattttac 6600 acaagatggt ctgtaatttc acagttagtt ttatcccatt aggtatgaaa gaattagcat 6660 aattcccctt aaacatgaat gaatcttaga ttttttaata aatagttttg gaagtaaaga 6720 cagagacatc aggagcacaa ggaatagcct gagaggacaa acagaacaag aaagagtctg 6780 gaaatacaca ggatgttctt ggcctcctca aagcaagtgc aagcagatag taccagcagc 6840 cccaggctat cagagcccag tgaagagaag taccatgaaa gccacagctc taaccaccct 6900 gttccagagt gacagacagt ccccaagaca agccagcctg agccagagag agaactgcaa 6960 gagaaagttt ctaatttagg ttctgttaga ttcagacaag tgcaggtcat cctctctcca 7020 cagctactca cctctccagc ctaacaaagc ctgcagtcca cactccaacc ctggtgtctc 7080 acctcctagc ctctcccaac atcctgctct ctgaccatct tctgcatctc tcatctcacc 7140 atctcccact gtctacagcc tactcttgca actaccatct cattttctga catcctgtct 7200 acatcttctg ccatactctg ccatctacca taccacctct taccatctac cacaccatct 7260 tttatctcca tccctctcag aagcctccaa gctgaatcct gctttatgtg ttcatctcag 7320 cccctgcatg gaaagctgac cccagaggca gaactattcc cagagagctt ggccaagaaa 7380 aacaaaacta ccagcctggc caggctcagg agtagtaagc tgcagtgtct gttgtgttct 7440 agcttcaaca gctgcaggag ttccactctc aaatgctcca catttctcac atcctcctga 7500 ttctggtcac tacccatctt caaagaacag aatatctcac atcagcatac tgtgaaggac 7560 tagtcatggg tgcagctgct cagagctgca aagtcattct ggatggtgga gagcttacaa 7620 acatttcatg atgctccccc cgctctgatg gctggagccc aatccctaca cagactcctg 7680 ctgtatgtgt tttcctttca ctctgagcca cagccagagg gcaggcattc agtctcctct 7740 tcaggctggg gctggggcac tgagaactca cccaacacct tgctctcact ccttctgcaa 7800 aacaagaaag agctttgtgc tgcagtagcc atgaagaatg aaaggaaggc tttaactaaa 7860 aaatgtcaga gattattttc aaccccttac tgtggatcac cagcaaggag gaaacacaac 7920 acagagacat tttttcccct caaattatca aaagaatcac tgcatttgtt aaagagagca 7980 actgaatcag gaagcagagt tttgaacata tcagaagtta ggaatctgca tcagagacaa 8040 atgcagtcat ggttgtttgc tgcataccag ccctaatcat tagaagcctc atggacttca 8100 aacatcattc cctctgacaa gatgctctag cctaactcca tgagataaaa taaatctgcc 8160 tttcagagcc aaagaagagt ccaccagctt cttctcagtg tgaacaagag ctccagtcag 8220 gttagtcagt ccagtgcagt agaggagacc agtctgcatc ctctaatttt caaaggcaag 8280 aagatttgtt taccctggac accaggcaca agtgaggtca cagagctctt agatatgcag 8340 tcctcatgag tgaggagact aaagcgcatg ccatcaagac ttcagtgtag agaaaacctc 8400 caaaaaagcc tcctcactac ttctggaata gctcagaggc cgaggcggcc tcggcctctg 8460 cataaataaa aaaaattagt cagccatggg gcggagaatg ggcggaactg ggcggagtta 8520 ggggcgggat gggcggagtt aggggcggga ctatggttgc tgactaattg agatgcatgc 8580 tttgcatact tctgcctgct ggggagcctg gggactttcc acacctggtt gctgactaat 8640 tgagatgcat gctttgcata cttctgcctg ctggggagcc tggggacttt ccacacccta 8700 actgacacac attccacagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 8760 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 8820 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 8880 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 8940 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 9000 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 9060 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 9120 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 9180 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 9240 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 9300 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 9360 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 9420 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 9480 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 9540 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 9600 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 9660 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 9720 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 9780 ctgactcctg caaaccacgt tgtgtctcaa aatctctgat gttacattgc acaagataaa 9840 aatatatcat catgaacaat aaaactgtct gcttacataa acagtaatac aaggggtgtt 9900 atgagccata ttcaacggga aacgtcttgc tcgaggccgc gattaaattc caacatggat 9960 gctgatttat atgggtataa atgggctcgc gataatgtcg ggcaatcagg tgcgacaatc 10020 tatcgattgt atgggaagcc cgatgcgcca gagttgtttc tgaaacatgg caaaggtagc 10080 gttgccaatg atgttacaga tgagatggtc agactaaact ggctgacgga atttatgcct 10140 cttccgacca tcaagcattt tatccgtact cctgatgatg catggttact caccactgcg 10200 atccccggga aaacagcatt ccaggtatta gaagaatatc ctgattcagg tgaaaatatt 10260 gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga ttcctgtttg taattgtcct 10320 tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat cacgaatgaa taacggtttg 10380 gttgatgcga gtgattttga tgacgagcgt aatggctggc ctgttgaaca agtctggaaa 10440 gaaatgcata agcttttgcc attctcaccg gattcagtcg tcactcatgg tgatttctca 10500 cttgataacc ttatttttga cgaggggaaa ttaataggtt gtattgatgt tggacgagtc 10560 ggaatcgcag accgatacca ggatcttgcc atcctatgga actgcctcgg tgagttttct 10620 ccttcattac agaaacggct ttttcaaaaa tatggtattg ataatcctga tatgaataaa 10680 ttgcagtttc atttgatgct cgatgagttt ttctaagggc ggcctgccac catacccacg 10740 ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc ggtgatgtcg 10800 gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgagggcgcg ccaagtcgac 10860 gtccggcagt c 10871 <210> 70 <211> 4151 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 70 gggaggttac gcgttcgtcg actactagtg ggtaccagag cgggcggagt tagggcggag 60 ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga atgggcggtg 120 aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg tcgcagccgg 180 gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta agtcactgac 240 tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag tggcactatg 300 aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct ctttcctctc 360 ctgacagtcc ggaaagccac catgtacgcc ctgttcctgc tggccagcct gctgggcgcc 420 gccctggccg gccccgtgct gggcctgaag gagtgcaccc gcggcagcgc cgtgtggtgc 480 cagaacgtga agaccgccag cgactgcggc gccgtgaagc actgcctgca gaccgtgtgg 540 aacaagccca ccgtgaagag cctgccctgc gacatctgca aggacgtggt gaccgccgcc 600 ggcgacatgc tgaaggacaa cgccaccgag gaggagatcc tggtgtacct ggagaagacc 660 tgcgactggc tgcccaagcc caacatgagc gccagctgca aggagatcgt ggacagctac 720 ctgcccgtga tcctggacat catcaagggc gagatgagcc gccccggcga ggtgtgcagc 780 gccctgaacc tgtgcgagag cctgcagaag cacctggccg agctgaacca ccagaagcag 840 ctggagagca acaagatccc cgagctggac atgaccgagg tggtggcccc cttcatggcc 900 aacatccccc tgctgctgta cccccaggac ggcccccgca gcaagcccca gcccaaggac 960 aacggcgacg tgtgccagga ctgcatccag atggtgaccg acatccagac cgccgtgcgc 1020 accaacagca ccttcgtgca ggccctggtg gagcacgtga aggaggagtg cgaccgcctg 1080 ggccccggca tggccgacat ctgcaagaac tacatcagcc agtacagcga gatcgccatc 1140 cagatgatga tgcacatgca gcccaaggag atctgcgccc tggtgggctt ctgcgacgag 1200 gtgaaggaga tgcccatgca gaccctggtg cccgccaagg tggccagcaa gaacgtgatc 1260 cccgccctgg agctggtgga gcccatcaag aagcacgagg tgcccgccaa gagcgacgtg 1320 tactgcgagg tgtgcgagtt cctggtgaag gaggtgacca agctgatcga caacaacaag 1380 accgagaagg agatcctgga cgccttcgac aagatgtgca gcaagctgcc caagagcctg 1440 agcgaggagt gccaggaggt ggtggacacc tacggcagca gcatcctgag catcctgctg 1500 gaggaggtga gccccgagct ggtgtgcagc atgctgcacc tgtgcagcgg cacccgcctg 1560 cccgccctga ccgtgcacgt gacccagccc aaggacggcg gcttctgcga ggtgtgcaag 1620 aagctggtgg gctacctgga ccgcaacctg gagaagaaca gcaccaagca ggagatcctg 1680 gccgccctgg agaagggctg cagcttcctg cccgacccct accagaagca gtgcgaccag 1740 ttcgtggccg agtacgagcc cgtgctgatc gagatcctgg tggaggtgat ggaccccagc 1800 ttcgtgtgcc tgaagatcgg cgcctgcccc agcgcccaca agcccctgct gggcaccgag 1860 aagtgcatct ggggccccag ctactggtgc cagaacaccg agaccgccgc ccagtgcaac 1920 gccgtggagc actgcaagcg ccacgtgtgg aacagaagaa agagaggaag tggagagggc 1980 agaggaagtc ttctgacatg cggagacgtg gaagagaatc ccggccctat gtggaccctg 2040 gtgagctggg tggccctgac cgccggcctg gtggccggca cccgctgccc cgacggccag 2100 ttctgccccg tggcctgctg cctggacccc ggcggcgcca gctacagctg ctgccgcccc 2160 ctgctggaca agtggcccac caccctgagc cgccacctgg gcggcccctg ccaggtggac 2220 gcccactgca gcgccggcca cagctgcatc ttcaccgtga gcggcaccag cagctgctgc 2280 cccttccccg aggccgtggc ctgcggcgac ggccaccact gctgcccccg cggcttccac 2340 tgcagcgccg acggccgcag ctgcttccag cgcagcggca acaacagcgt gggcgccatc 2400 cagtgccccg acagccagtt cgagtgcccc gacttcagca cctgctgcgt gatggtggac 2460 ggcagctggg gctgctgccc catgccccag gccagctgct gcgaggaccg cgtgcactgc 2520 tgcccccacg gcgccttctg cgacctggtg cacacccgct gcatcacccc caccggcacc 2580 caccccctgg ccaagaagct gcccgcccag cgcaccaacc gcgccgtggc cctgagcagc 2640 agcgtgatgt gccccgacgc ccgcagccgc tgccccgacg gcagcacctg ctgcgagctg 2700 cccagcggca agtacggctg ctgccccatg cccaacgcca cctgctgcag cgaccacctg 2760 cactgctgcc cccaggacac cgtgtgcgac ctgatccaga gcaagtgcct gagcaaggag 2820 aacgccacca ccgacctgct gaccaagctg cccgcccaca ccgtgggcga cgtgaagtgc 2880 gacatggagg tgagctgccc cgacggctac acctgctgcc gcctgcagag cggcgcctgg 2940 ggctgctgcc ccttcaccca ggccgtgtgc tgcgaggacc acatccactg ctgccccgcc 3000 ggcttcacct gcgacaccca gaagggcacc tgcgagcagg gcccccacca ggtgccctgg 3060 atggagaagg cccccgccca cctgagcctg cccgaccccc aggccctgaa gcgcgacgtg 3120 ccctgcgaca acgtgagcag ctgccccagc agcgacacct gctgccagct gaccagcggc 3180 gagtggggct gctgccccat ccccgaggcc gtgtgctgca gcgaccacca gcactgctgc 3240 ccccagggct acacctgcgt ggccgagggc cagtgccagc gcggcagcga gatcgtggcc 3300 ggcctggaga agatgcccgc ccgccgcgcc agcctgagcc acccccgcga catcggctgc 3360 gaccagcaca ccagctgccc cgtgggccag acctgctgcc ccagcctggg cggcagctgg 3420 gcctgctgcc agctgcccca cgccgtgtgc tgcgaggacc gccagcactg ctgccccgcc 3480 ggctacacct gcaacgtgaa ggcccgcagc tgcgagaagg aggtggtgag cgcccagccc 3540 gccaccttcc tggcccgcag cccccacgtg ggcgtgaagg acgtggagtg cggcgagggc 3600 cacttctgcc acgacaacca gacctgctgc cgcgacaacc gccagggctg ggcctgctgc 3660 ccctaccgcc agggcgtgtg ctgcgccgac cgccgccact gctgccccgc cggcttccgc 3720 tgcgccgccc gcggcaccaa gtgcctgcgc cgcgaggccc cccgctggga cgcccccctg 3780 cgcgaccccg ccctgcgcca gctgctgtga caattgttaa ttaagtttaa accctcgagg 3840 ccgcaagcaa taaaatatct ttattttcat tacatctgtg tgttggtttt ttgtgtgaca 3900 attgttaatt aagtttaaac gttcgaggcc gcaagcgaga tccacgataa caaacagctt 3960 ttttggggtg aacatattga ctgaattccc tgcaggttgg ccactccctc tctgcgcgct 4020 cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg 4080 gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc 4140 tgcggccgct c 4151 <210> 71 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 71 aagagggtgt tctctatgta ggc 23 <210> 72 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 72 gctcctccaa catttgtcac tt 22 <210> 73 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 73 acacagtacc taccgttata gca 23 <210> 74 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 74 tgttgtcaca gtaacttgca tca 23 <210> 75 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 75 ctgggctaca ctgagcacc 19 <210> 76 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 76 aagtggtcgt tgagggcaat g 21 <210> 77 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 77 tattagatct gatggccgcg 20 <210> 78 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic polynucleotide <400> 78 tccatcacta ggggttcctg 20 <210> 79 <211> 4013 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 79 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgg 1320 aattcagcag ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg 1380 ccggatctct gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac 1440 cttgcatccc caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact 1500 gcgacagctt cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca 1560 ccagatccgg cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca 1620 ctggcctgct gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg 1680 gagccatgac agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc 1740 tgctgctcaa gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca 1800 tggccagctg cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc 1860 agctgcacaa cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca 1920 gagccctgca gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca 1980 cctggctgaa aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg 2040 acatctacca ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc 2100 acaagctgca gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg 2160 gctacccctt tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg 2220 atctgggacc cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg 2280 accagagact gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca 2340 aatacgtgca cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca 2400 cactgggaga gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg 2460 tgggcagcaa gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt 2520 acagccacag catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc 2580 tggccctgaa tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca 2640 tcgtggacat caccaaggac accttctaca agcagcccat gttctaccac ctgggacact 2700 tcagcaagtt catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg 2760 atctggacgc cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc 2820 gcagcagcaa agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa 2880 tcagccctgg ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta 2940 agtttaaacc ctcgaggccg caagcttatc gataatcaac ctctggatta caaaatttgt 3000 gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 3060 ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 3120 aaatcctggt tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg 3180 gtgtgcactg tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag 3240 ctcctttccg ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc 3300 tgccttgccc gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg 3360 tcggggaaat catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc 3420 gggacgtcct tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc 3480 ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc 3540 tccctttggg ccgcctcccc gcatcgatac cgtcgactag agctcgctga tcagcctcga 3600 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 3660 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 3720 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 3780 gggaagacaa tagcaggcat gctggggaga gatccacgat aacaaacagc ttttttgggg 3840 tgaacatatt gactgaattc cctgcaggtt ggccactccc tctctgcgcg ctcgctcgct 3900 cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 3960 gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cct 4013 <210> 80 <211> 4013 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 80 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgg 1320 aattcagcag ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg 1380 ccggatctct gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac 1440 cttgcatccc caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact 1500 gcgacagctt cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca 1560 ccagatccgg cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca 1620 ctggcctgct gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg 1680 gagccatgac agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc 1740 tgctgctcaa gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca 1800 tggccagctg cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc 1860 agctgcacaa cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca 1920 gagccctgca gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca 1980 cctggctgaa aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg 2040 acatctacca ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc 2100 acaagctgca gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg 2160 gctacccctt tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg 2220 atctgggacc cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg 2280 accagagact gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca 2340 aatacgtgca cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca 2400 cactgggaga gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg 2460 tgggcagcaa gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt 2520 acagccacag catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc 2580 tggccctgaa tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca 2640 tcgtggacat caccaaggac accttctaca agcagcccat gttctaccac ctgggacact 2700 tcagcaagtt catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg 2760 atctggacgc cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc 2820 gcagcagcaa agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa 2880 tcagccctgg ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta 2940 agtttaaacc ctcgaggccg caagcttatc gataatcaac ctctggatta caaaatttgt 3000 gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 3060 ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 3120 aaatcctggt tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg 3180 gtgtgcactg tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag 3240 ctcctttccg ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc 3300 tgccttgccc gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg 3360 tcggggaaat catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc 3420 gggacgtcct tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc 3480 ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc 3540 tccctttggg ccgcctcccc gcatcgatac cgtcgactag agctcgctga tcagcctcga 3600 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 3660 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 3720 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 3780 gggaagacaa tagcaggcat gctggggaga gatccacgat aacaaacagc ttttttgggg 3840 tgaacatatt gactgaattc cctgcaggtt ggccactccc tctctgcgcg ctcgctcgct 3900 cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 3960 gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cct 4013 <210> 81 <211> 4162 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 81 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctcagcg ctgtaattag 1080 cgcttggttt aatgacggct tgttggaggc ttgctgaagg ctgtatgctg ttgtctttag 1140 aaataagtgg tagtcaagtg aagccacaga tgtgactacc acttatttct aaaaggacac 1200 aaggcctgtt actagcactc acatggaaca aatggccacc gtgggaggat gacaatttct 1260 gtggctgcgt gaaagccttg aggggctccg ggagctagag cctctgctaa ccatgttcat 1320 gccttcttct ttttcctaca gctcctgggc aacgtgctgg ttattgtgct gtctcatcat 1380 tttggcaaag aattcctcga agatccgaag ggaaagtctt ccacgactgt gggatccgtt 1440 cgaagatatc accggttgag ccaccatgga attcagcagc cccagcagag aggaatgccc 1500 caagcctctg agccgggtgt caatcatggc cggatctctg acaggactgc tgctgcttca 1560 ggccgtgtct tgggcttctg gcgctagacc ttgcatcccc aagagcttcg gctacagcag 1620 cgtcgtgtgc gtgtgcaatg ccacctactg cgacagcttc gaccctccta cctttcctgc 1680 tctgggcacc ttcagcagat acgagagcac cagatccggc agacggatgg aactgagcat 1740 gggacccatc caggccaatc acacaggcac tggcctgctg ctgacactgc agcctgagca 1800 gaaattccag aaagtgaaag gcttcggcgg agccatgaca gatgccgccg ctctgaatat 1860 cctggctctg tctccaccag ctcagaacct gctgctcaag agctacttca gcgaggaagg 1920 catcggctac aacatcatca gagtgcccat ggccagctgc gacttcagca tcaggaccta 1980 cacctacgcc gacacacccg acgatttcca gctgcacaac ttcagcctgc ctgaagagga 2040 caccaagctg aagatccctc tgatccacag agccctgcag ctggcacaaa gacccgtgtc 2100 actgctggcc tctccatgga catctcccac ctggctgaaa acaaatggcg ccgtgaatgg 2160 caagggcagc ctgaaaggcc aacctggcga catctaccac cagacctggg ccagatactt 2220 cgtgaagttc ctggacgcct atgccgagca caagctgcag ttttgggccg tgacagccga 2280 gaacgaacct tctgctggac tgctgagcgg ctaccccttt cagtgcctgg gctttacacc 2340 cgagcaccag cgggacttta tcgcccgtga tctgggaccc acactggcca atagcaccca 2400 ccataatgtg cggctgctga tgctggacga ccagagactg cttctgcccc actgggctaa 2460 agtggtgctg acagatcctg aggccgccaa atacgtgcac ggaatcgccg tgcactggta 2520 tctggacttt ctggcccctg ccaaggccac actgggagag acacacagac tgttccccaa 2580 caccatgctg ttcgccagcg aagcctgtgt gggcagcaag ttttgggaac agagcgtgcg 2640 gctcggcagc tgggatagag gcatgcagta cagccacagc atcatcacca acctgctgta 2700 ccacgtcgtc ggctggaccg actggaatct ggccctgaat cctgaaggcg gccctaactg 2760 ggtccgaaac ttcgtggaca gccccatcat cgtggacatc accaaggaca ccttctacaa 2820 gcagcccatg ttctaccacc tgggacactt cagcaagttc atccccgagg gctctcagcg 2880 cgttggactg gtggcttccc agaagaacga tctggacgcc gtggctctga tgcaccctga 2940 tggatctgct gtggtggtgg tcctgaaccg cagcagcaaa gatgtgcccc tgaccatcaa 3000 ggatcccgcc gtgggattcc tggaaacaat cagccctggc tactccatcc acacctacct 3060 gtggcgtaga cagtgacaat tgttaattaa gtttaaaccc tcgaggccgc aagcttatcg 3120 ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 3180 ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 3240 gtatggcttt cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt 3300 tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca 3360 ctggttgggg cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc 3420 ctattgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc 3480 tgttgggcac tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc 3540 tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc 3600 tcaatccagc ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc 3660 ttcgccttcg ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc 3720 gtcgactaga gctcgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt 3780 ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 3840 ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 3900 ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggagag 3960 atccacgata acaaacagct tttttggggc ccacatgtac actgaattcc ctgcaggttg 4020 gccactccct ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 4080 cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 4140 aactccatca ctaggggttc ct 4162 <210> 82 <211> 4184 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 82 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgt 1320 ggaccctggt gagctgggtg gccctgaccg ccggcctggt ggccggcacc cgctgccccg 1380 acggccagtt ctgccccgtg gcctgctgcc tggaccccgg cggcgccagc tacagctgct 1440 gccgccccct gctggacaag tggcccacca ccctgagccg ccacctgggc ggcccctgcc 1500 aggtggacgc ccactgcagc gccggccaca gctgcatctt caccgtgagc ggcaccagca 1560 gctgctgccc cttccccgag gccgtggcct gcggcgacgg ccaccactgc tgcccccgcg 1620 gcttccactg cagcgccgac ggccgcagct gcttccagcg cagcggcaac aacagcgtgg 1680 gcgccatcca gtgccccgac agccagttcg agtgccccga cttcagcacc tgctgcgtga 1740 tggtggacgg cagctggggc tgctgcccca tgccccaggc cagctgctgc gaggaccgcg 1800 tgcactgctg cccccacggc gccttctgcg acctggtgca cacccgctgc atcaccccca 1860 ccggcaccca ccccctggcc aagaagctgc ccgcccagcg caccaaccgc gccgtggccc 1920 tgagcagcag cgtgatgtgc cccgacgccc gcagccgctg ccccgacggc agcacctgct 1980 gcgagctgcc cagcggcaag tacggctgct gccccatgcc caacgccacc tgctgcagcg 2040 accacctgca ctgctgcccc caggacaccg tgtgcgacct gatccagagc aagtgcctga 2100 gcaaggagaa cgccaccacc gacctgctga ccaagctgcc cgcccacacc gtgggcgacg 2160 tgaagtgcga catggaggtg agctgccccg acggctacac ctgctgccgc ctgcagagcg 2220 gcgcctgggg ctgctgcccc ttcacccagg ccgtgtgctg cgaggaccac atccactgct 2280 gccccgccgg cttcacctgc gacacccaga agggcacctg cgagcagggc ccccaccagg 2340 tgccctggat ggagaaggcc cccgcccacc tgagcctgcc cgacccccag gccctgaagc 2400 gcgacgtgcc ctgcgacaac gtgagcagct gccccagcag cgacacctgc tgccagctga 2460 ccagcggcga gtggggctgc tgccccatcc ccgaggccgt gtgctgcagc gaccaccagc 2520 actgctgccc ccagggctac acctgcgtgg ccgagggcca gtgccagcgc ggcagcgaga 2580 tcgtggccgg cctggagaag atgcccgccc gccgcgccag cctgagccac ccccgcgaca 2640 tcggctgcga ccagcacacc agctgccccg tgggccagac ctgctgcccc agcctgggcg 2700 gcagctgggc ctgctgccag ctgccccacg ccgtgtgctg cgaggaccgc cagcactgct 2760 gccccgccgg ctacacctgc aacgtgaagg cccgcagctg cgagaaggag gtggtgagcg 2820 cccagcccgc caccttcctg gcccgcagcc cccacgtggg cgtgaaggac gtggagtgcg 2880 gcgagggcca cttctgccac gacaaccaga cctgctgccg cgacaaccgc cagggctggg 2940 cctgctgccc ctaccgccag ggcgtgtgct gcgccgaccg ccgccactgc tgccccgccg 3000 gcttccgctg cgccgcccgc ggcaccaagt gcctgcgccg cgaggccccc cgctgggacg 3060 cccccctgcg cgaccccgcc ctgcgccagc tgctgtgaca attgttaatt aagtttaaac 3120 cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg tgaaagattg 3180 actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 3240 ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 3300 ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 3360 gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 3420 gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 3480 cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa 3540 tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 3600 ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 3660 gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 3720 gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt 3780 ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 3840 ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 3900 gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3960 atagcaggca tgctggggag agatccacga taacaaacag cttttttggg gcccacatgt 4020 acactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4080 cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag tgagcgagcg 4140 agcgcgcaga gagggagtgg ccaactccat cactaggggt tcct 4184 <210> 83 <211> 4184 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 83 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgt 1320 ggaccctggt gagctgggtg gccctgaccg ccggcctggt ggccggcacc cgctgccccg 1380 acggccagtt ctgccccgtg gcctgctgcc tggaccccgg cggcgccagc tacagctgct 1440 gccgccccct gctggacaag tggcccacca ccctgagccg ccacctgggc ggcccctgcc 1500 aggtggacgc ccactgcagc gccggccaca gctgcatctt caccgtgagc ggcaccagca 1560 gctgctgccc cttccccgag gccgtggcct gcggcgacgg ccaccactgc tgcccccgcg 1620 gcttccactg cagcgccgac ggccgcagct gcttccagcg cagcggcaac aacagcgtgg 1680 gcgccatcca gtgccccgac agccagttcg agtgccccga cttcagcacc tgctgcgtga 1740 tggtggacgg cagctggggc tgctgcccca tgccccaggc cagctgctgc gaggaccgcg 1800 tgcactgctg cccccacggc gccttctgcg acctggtgca cacccgctgc atcaccccca 1860 ccggcaccca ccccctggcc aagaagctgc ccgcccagcg caccaaccgc gccgtggccc 1920 tgagcagcag cgtgatgtgc cccgacgccc gcagccgctg ccccgacggc agcacctgct 1980 gcgagctgcc cagcggcaag tacggctgct gccccatgcc caacgccacc tgctgcagcg 2040 accacctgca ctgctgcccc caggacaccg tgtgcgacct gatccagagc aagtgcctga 2100 gcaaggagaa cgccaccacc gacctgctga ccaagctgcc cgcccacacc gtgggcgacg 2160 tgaagtgcga catggaggtg agctgccccg acggctacac ctgctgccgc ctgcagagcg 2220 gcgcctgggg ctgctgcccc ttcacccagg ccgtgtgctg cgaggaccac atccactgct 2280 gccccgccgg cttcacctgc gacacccaga agggcacctg cgagcagggc ccccaccagg 2340 tgccctggat ggagaaggcc cccgcccacc tgagcctgcc cgacccccag gccctgaagc 2400 gcgacgtgcc ctgcgacaac gtgagcagct gccccagcag cgacacctgc tgccagctga 2460 ccagcggcga gtggggctgc tgccccatcc ccgaggccgt gtgctgcagc gaccaccagc 2520 actgctgccc ccagggctac acctgcgtgg ccgagggcca gtgccagcgc ggcagcgaga 2580 tcgtggccgg cctggagaag atgcccgccc gccgcgccag cctgagccac ccccgcgaca 2640 tcggctgcga ccagcacacc agctgccccg tgggccagac ctgctgcccc agcctgggcg 2700 gcagctgggc ctgctgccag ctgccccacg ccgtgtgctg cgaggaccgc cagcactgct 2760 gccccgccgg ctacacctgc aacgtgaagg cccgcagctg cgagaaggag gtggtgagcg 2820 cccagcccgc caccttcctg gcccgcagcc cccacgtggg cgtgaaggac gtggagtgcg 2880 gcgagggcca cttctgccac gacaaccaga cctgctgccg cgacaaccgc cagggctggg 2940 cctgctgccc ctaccgccag ggcgtgtgct gcgccgaccg ccgccactgc tgccccgccg 3000 gcttccgctg cgccgcccgc ggcaccaagt gcctgcgccg cgaggccccc cgctgggacg 3060 cccccctgcg cgaccccgcc ctgcgccagc tgctgtgaca attgttaatt aagtttaaac 3120 cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg tgaaagattg 3180 actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 3240 ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 3300 ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 3360 gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 3420 gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 3480 cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa 3540 tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 3600 ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 3660 gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 3720 gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt 3780 ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 3840 ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 3900 gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3960 atagcaggca tgctggggag agatccacga taacaaacag cttttttggg gcccacatgt 4020 acactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4080 cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag tgagcgagcg 4140 agcgcgcaga gagggagtgg ccaactccat cactaggggt tcct 4184 <210> 84 <211> 4578 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 84 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 aaaaaaattg tcatcctccc acggtggcca tttgttccat gtgagtgcta gtaacaggcc 300 ttgtgtcctt tgtagactat ttgcacactg catctgtggc ttcactcagt gtgcaaatag 360 tctacaagac aacagcatac agccttcagc aagcctccag tggtctcata cagaacttat 420 aagattccca aatccaaaga catttcacgt ttatggtgat ttcccagaac acatagcgac 480 atgcaaatat tgcagggcgc cactcccctg tccctcacag ccatcttcct gccagggcgc 540 acgcgcgctg ggtgttcccg cctagtgaca ctgggcccgc gattccttgg agcgggttga 600 tgacgtcagc gtttcccatg gtgaagcttg gatctgatcc ctaggttcta gaaccggtga 660 cgtctcccat ggtgaagctt ggatctgaat tcggtaccta gttattaata gtaatcaatt 720 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 780 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 840 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 900 actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 960 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 1020 acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 1080 ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 1140 ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 1200 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 1260 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 1320 aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 1380 cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 1440 cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1500 tttctgtggc tgcgtgaaag ccttgagggg ctccgggagc tagagcctct gctaaccatg 1560 ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc 1620 atcattttgg caaagaattc ctcgaagatc cgaagggaaa gtcttccacg actgtgggat 1680 ccgttcgaag atatcaccgg ttgagccacc atgtggaccc tggtgagctg ggtggccctg 1740 accgccggcc tggtggccgg cacccgctgc cccgacggcc agttctgccc cgtggcctgc 1800 tgcctggacc ccggcggcgc cagctacagc tgctgccgcc ccctgctgga caagtggccc 1860 accaccctga gccgccacct gggcggcccc tgccaggtgg acgcccactg cagcgccggc 1920 cacagctgca tcttcaccgt gagcggcacc agcagctgct gccccttccc cgaggccgtg 1980 gcctgcggcg acggccacca ctgctgcccc cgcggcttcc actgcagcgc cgacggccgc 2040 agctgcttcc agcgcagcgg caacaacagc gtgggcgcca tccagtgccc cgacagccag 2100 ttcgagtgcc ccgacttcag cacctgctgc gtgatggtgg acggcagctg gggctgctgc 2160 cccatgcccc aggccagctg ctgcgaggac cgcgtgcact gctgccccca cggcgccttc 2220 tgcgacctgg tgcacacccg ctgcatcacc cccaccggca cccaccccct ggccaagaag 2280 ctgcccgccc agcgcaccaa ccgcgccgtg gccctgagca gcagcgtgat gtgccccgac 2340 gcccgcagcc gctgccccga cggcagcacc tgctgcgagc tgcccagcgg caagtacggc 2400 tgctgcccca tgcccaacgc cacctgctgc agcgaccacc tgcactgctg cccccaggac 2460 accgtgtgcg acctgatcca gagcaagtgc ctgagcaagg agaacgccac caccgacctg 2520 ctgaccaagc tgcccgccca caccgtgggc gacgtgaagt gcgacatgga ggtgagctgc 2580 cccgacggct acacctgctg ccgcctgcag agcggcgcct ggggctgctg ccccttcacc 2640 caggccgtgt gctgcgagga ccacatccac tgctgccccg ccggcttcac ctgcgacacc 2700 cagaagggca cctgcgagca gggcccccac caggtgccct ggatggagaa ggcccccgcc 2760 cacctgagcc tgcccgaccc ccaggccctg aagcgcgacg tgccctgcga caacgtgagc 2820 agctgcccca gcagcgacac ctgctgccag ctgaccagcg gcgagtgggg ctgctgcccc 2880 atccccgagg ccgtgtgctg cagcgaccac cagcactgct gcccccaggg ctacacctgc 2940 gtggccgagg gccagtgcca gcgcggcagc gagatcgtgg ccggcctgga gaagatgccc 3000 gcccgccgcg ccagcctgag ccacccccgc gacatcggct gcgaccagca caccagctgc 3060 cccgtgggcc agacctgctg ccccagcctg ggcggcagct gggcctgctg ccagctgccc 3120 cacgccgtgt gctgcgagga ccgccagcac tgctgccccg ccggctacac ctgcaacgtg 3180 aaggcccgca gctgcgagaa ggaggtggtg agcgcccagc ccgccacctt cctggcccgc 3240 agcccccacg tgggcgtgaa ggacgtggag tgcggcgagg gccacttctg ccacgacaac 3300 cagacctgct gccgcgacaa ccgccagggc tgggcctgct gcccctaccg ccagggcgtg 3360 tgctgcgccg accgccgcca ctgctgcccc gccggcttcc gctgcgccgc ccgcggcacc 3420 aagtgcctgc gccgcgaggc cccccgctgg gacgcccccc tgcgcgaccc cgccctgcgc 3480 cagctgctgt gacaattgtt aattaagttt aaaccctcga ggccgcaagc ttatcgataa 3540 tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 3600 ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 3660 ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 3720 gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 3780 ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 3840 tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 3900 gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 3960 ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 4020 tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 4080 ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcatc gataccgtcg 4140 actagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 4200 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 4260 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 4320 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggagagatcc 4380 acgataacaa acagcttttt tggggtgaac atattgactg aattccctgc aggttggcca 4440 ctccctctct gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg 4500 cgacctttgg tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact 4560 ccatcactag gggttcct 4578 <210> 85 <211> 4162 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 85 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctcagcg ctgtaattag 1080 cgcttggttt aatgacggct tgttggaggc ttgctgaagg ctgtatgctg ttgtctttag 1140 aaataagtgg tagtcaagtg aagccacaga tgtgactacc acttatttct aaaaggacac 1200 aaggcctgtt actagcactc acatggaaca aatggccacc gtgggaggat gacaatttct 1260 gtggctgcgt gaaagccttg aggggctccg ggagctagag cctctgctaa ccatgttcat 1320 gccttcttct ttttcctaca gctcctgggc aacgtgctgg ttattgtgct gtctcatcat 1380 tttggcaaag aattcctcga agatccgaag ggaaagtctt ccacgactgt gggatccgtt 1440 cgaagatatc accggttgag ccaccatgga attcagcagc cccagcagag aggaatgccc 1500 caagcctctg agccgggtgt caatcatggc cggatctctg acaggactgc tgctgcttca 1560 ggccgtgtct tgggcttctg gcgctagacc ttgcatcccc aagagcttcg gctacagcag 1620 cgtcgtgtgc gtgtgcaatg ccacctactg cgacagcttc gaccctccta cctttcctgc 1680 tctgggcacc ttcagcagat acgagagcac cagatccggc agacggatgg aactgagcat 1740 gggacccatc caggccaatc acacaggcac tggcctgctg ctgacactgc agcctgagca 1800 gaaattccag aaagtgaaag gcttcggcgg agccatgaca gatgccgccg ctctgaatat 1860 cctggctctg tctccaccag ctcagaacct gctgctcaag agctacttca gcgaggaagg 1920 catcggctac aacatcatca gagtgcccat ggccagctgc gacttcagca tcaggaccta 1980 cacctacgcc gacacacccg acgatttcca gctgcacaac ttcagcctgc ctgaagagga 2040 caccaagctg aagatccctc tgatccacag agccctgcag ctggcacaaa gacccgtgtc 2100 actgctggcc tctccatgga catctcccac ctggctgaaa acaaatggcg ccgtgaatgg 2160 caagggcagc ctgaaaggcc aacctggcga catctaccac cagacctggg ccagatactt 2220 cgtgaagttc ctggacgcct atgccgagca caagctgcag ttttgggccg tgacagccga 2280 gaacgaacct tctgctggac tgctgagcgg ctaccccttt cagtgcctgg gctttacacc 2340 cgagcaccag cgggacttta tcgcccgtga tctgggaccc acactggcca atagcaccca 2400 ccataatgtg cggctgctga tgctggacga ccagagactg cttctgcccc actgggctaa 2460 agtggtgctg acagatcctg aggccgccaa atacgtgcac ggaatcgccg tgcactggta 2520 tctggacttt ctggcccctg ccaaggccac actgggagag acacacagac tgttccccaa 2580 caccatgctg ttcgccagcg aagcctgtgt gggcagcaag ttttgggaac agagcgtgcg 2640 gctcggcagc tgggatagag gcatgcagta cagccacagc atcatcacca acctgctgta 2700 ccacgtcgtc ggctggaccg actggaatct ggccctgaat cctgaaggcg gccctaactg 2760 ggtccgaaac ttcgtggaca gccccatcat cgtggacatc accaaggaca ccttctacaa 2820 gcagcccatg ttctaccacc tgggacactt cagcaagttc atccccgagg gctctcagcg 2880 cgttggactg gtggcttccc agaagaacga tctggacgcc gtggctctga tgcaccctga 2940 tggatctgct gtggtggtgg tcctgaaccg cagcagcaaa gatgtgcccc tgaccatcaa 3000 ggatcccgcc gtgggattcc tggaaacaat cagccctggc tactccatcc acacctacct 3060 gtggcgtaga cagtgacaat tgttaattaa gtttaaaccc tcgaggccgc aagcttatcg 3120 ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 3180 ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 3240 gtatggcttt cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt 3300 tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca 3360 ctggttgggg cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc 3420 ctattgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc 3480 tgttgggcac tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc 3540 tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc 3600 tcaatccagc ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc 3660 ttcgccttcg ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc 3720 gtcgactaga gctcgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt 3780 ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 3840 ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 3900 ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggagag 3960 atccacgata acaaacagct tttttggggc ccacatgtac actgaattcc ctgcaggttg 4020 gccactccct ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 4080 cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 4140 aactccatca ctaggggttc ct 4162 <210> 86 <211> 3977 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 86 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgt 1320 acgccctgtt cctgctggcc agcctgctgg gcgccgccct ggccggcccc gtgctgggcc 1380 tgaaggagtg cacccgcggc agcgccgtgt ggtgccagaa cgtgaagacc gccagcgact 1440 gcggcgccgt gaagcactgc ctgcagaccg tgtggaacaa gcccaccgtg aagagcctgc 1500 cctgcgacat ctgcaaggac gtggtgaccg ccgccggcga catgctgaag gacaacgcca 1560 ccgaggagga gatcctggtg tacctggaga agacctgcga ctggctgccc aagcccaaca 1620 tgagcgccag ctgcaaggag atcgtggaca gctacctgcc cgtgatcctg gacatcatca 1680 agggcgagat gagccgcccc ggcgaggtgt gcagcgccct gaacctgtgc gagagcctgc 1740 agaagcacct ggccgagctg aaccaccaga agcagctgga gagcaacaag atccccgagc 1800 tggacatgac cgaggtggtg gcccccttca tggccaacat ccccctgctg ctgtaccccc 1860 aggacggccc ccgcagcaag ccccagccca aggacaacgg cgacgtgtgc caggactgca 1920 tccagatggt gaccgacatc cagaccgccg tgcgcaccaa cagcaccttc gtgcaggccc 1980 tggtggagca cgtgaaggag gagtgcgacc gcctgggccc cggcatggcc gacatctgca 2040 agaactacat cagccagtac agcgagatcg ccatccagat gatgatgcac atgcagccca 2100 aggagatctg cgccctggtg ggcttctgcg acgaggtgaa ggagatgccc atgcagaccc 2160 tggtgcccgc caaggtggcc agcaagaacg tgatccccgc cctggagctg gtggagccca 2220 tcaagaagca cgaggtgccc gccaagagcg acgtgtactg cgaggtgtgc gagttcctgg 2280 tgaaggaggt gaccaagctg atcgacaaca acaagaccga gaaggagatc ctggacgcct 2340 tcgacaagat gtgcagcaag ctgcccaaga gcctgagcga ggagtgccag gaggtggtgg 2400 acacctacgg cagcagcatc ctgagcatcc tgctggagga ggtgagcccc gagctggtgt 2460 gcagcatgct gcacctgtgc agcggcaccc gcctgcccgc cctgaccgtg cacgtgaccc 2520 agcccaagga cggcggcttc tgcgaggtgt gcaagaagct ggtgggctac ctggaccgca 2580 acctggagaa gaacagcacc aagcaggaga tcctggccgc cctggagaag ggctgcagct 2640 tcctgcccga cccctaccag aagcagtgcg accagttcgt ggccgagtac gagcccgtgc 2700 tgatcgagat cctggtggag gtgatggacc ccagcttcgt gtgcctgaag atcggcgcct 2760 gccccagcgc ccacaagccc ctgctgggca ccgagaagtg catctggggc cccagctact 2820 ggtgccagaa caccgagacc gccgcccagt gcaacgccgt ggagcactgc aagcgccacg 2880 tgtggaactg acaattgtta attaagttta aaccctcgag gccgcaagct tatcgataat 2940 caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 3000 tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 3060 gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg 3120 cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt 3180 tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt 3240 gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 3300 ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc 3360 tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat 3420 ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc 3480 cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg ataccgtcga 3540 ctagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 3600 cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 3660 atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 3720 ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gagagatcca 3780 cgataacaaa cagctttttt ggggcccaca tgtacactga attccctgca ggttggccac 3840 tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc 3900 gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 3960 catcactagg ggttcct 3977 <210> 87 <211> 4013 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 87 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgg 1320 aattcagcag ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg 1380 ccggatctct gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac 1440 cttgcatccc caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact 1500 gcgacagctt cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca 1560 ccagatccgg cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca 1620 ctggcctgct gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg 1680 gagccatgac agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc 1740 tgctgctcaa gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca 1800 tggccagctg cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc 1860 agctgcacaa cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca 1920 gagccctgca gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca 1980 cctggctgaa aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg 2040 acatctacca ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc 2100 acaagctgca gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg 2160 gctacccctt tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg 2220 atctgggacc cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg 2280 accagagact gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca 2340 aatacgtgca cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca 2400 cactgggaga gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg 2460 tgggcagcaa gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt 2520 acagccacag catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc 2580 tggccctgaa tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca 2640 tcgtggacat caccaaggac accttctaca agcagcccat gttctaccac ctgggacact 2700 tcagcaagtt catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg 2760 atctggacgc cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc 2820 gcagcagcaa agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa 2880 tcagccctgg ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta 2940 agtttaaacc ctcgaggccg caagcttatc gataatcaac ctctggatta caaaatttgt 3000 gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 3060 ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 3120 aaatcctggt tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg 3180 gtgtgcactg tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag 3240 ctcctttccg ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc 3300 tgccttgccc gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg 3360 tcggggaaat catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc 3420 gggacgtcct tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc 3480 ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc 3540 tccctttggg ccgcctcccc gcatcgatac cgtcgactag agctcgctga tcagcctcga 3600 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 3660 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 3720 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 3780 gggaagacaa tagcaggcat gctggggaga gatccacgat aacaaacagc ttttttgggg 3840 tgaacatatt gactgaattc cctgcaggtt ggccactccc tctctgcgcg ctcgctcgct 3900 cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 3960 gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cct 4013 <210> 88 <211> 4625 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 88 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600 ctttcctctc ctgacagtcc ggaaagccac catggaattc agcagcccca gcagagagga 660 atgccccaag cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct 720 gcttcaggcc gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta 780 cagcagcgtc gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt 840 tcctgctctg ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact 900 gagcatggga cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc 960 tgagcagaaa ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct 1020 gaatatcctg gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga 1080 ggaaggcatc ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag 1140 gacctacacc tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga 1200 agaggacacc aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc 1260 cgtgtcactg ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt 1320 gaatggcaag ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag 1380 atacttcgtg aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac 1440 agccgagaac gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt 1500 tacacccgag caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag 1560 cacccaccat aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg 1620 ggctaaagtg gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca 1680 ctggtatctg gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt 1740 ccccaacacc atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag 1800 cgtgcggctc ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct 1860 gctgtaccac gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc 1920 taactgggtc cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt 1980 ctacaagcag cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc 2040 tcagcgcgtt ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca 2100 ccctgatgga tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac 2160 catcaaggat cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac 2220 ctacctgtgg cgtagacaga gaagaaagag aggaagtgga gagggcagag gaagtcttct 2280 gacatgcgga gacgtggaag agaatcccgg ccctatggcc gagtggctgc tgagcgccag 2340 ctggcagcgc cgcgccaagg ccatgaccgc cgccgccggc agcgccggcc gcgccgccgt 2400 gcccctgctg ctgtgcgccc tgctggcccc cggcggcgcc tacgtgctgg acgacagcga 2460 cggcctgggc cgcgagttcg acggcatcgg cgccgtgagc ggcggcggcg ccaccagccg 2520 cctgctggtg aactaccccg agccctaccg cagccagatc ctggactacc tgttcaagcc 2580 caacttcggc gccagcctgc acatcctgaa ggtggagatc ggcggcgacg gccagaccac 2640 cgacggcacc gagcccagcc acatgcacta cgccctggac gagaactact tccgcggcta 2700 cgagtggtgg ctgatgaagg aggccaagaa gcgcaacccc aacatcaccc tgatcggcct 2760 gccctggagc ttccccggct ggctgggcaa gggcttcgac tggccctacg tgaacctgca 2820 gctgaccgcc tactacgtgg tgacctggat cgtgggcgcc aagcgctacc acgacctgga 2880 catcgactac atcggcatct ggaacgagcg cagctacaac gccaactaca tcaagatcct 2940 gcgcaagatg ctgaactacc agggcctgca gcgcgtgaag atcatcgcca gcgacaacct 3000 gtgggagagc atcagcgcca gcatgctgct ggacgccgag ctgttcaagg tggtggacgt 3060 gatcggcgcc cactaccccg gcacccacag cgccaaggac gccaagctga ccggcaagaa 3120 gctgtggagc agcgaggact tcagcaccct gaacagcgac atgggcgccg gctgctgggg 3180 ccgcatcctg aaccagaact acatcaacgg ctacatgacc agcaccatcg cctggaacct 3240 ggtggccagc tactacgagc agctgcccta cggccgctgc ggcctgatga ccgcccagga 3300 gccctggagc ggccactacg tggtggagag ccccgtgtgg gtgagcgccc acaccaccca 3360 gttcacccag cccggctggt actacctgaa gaccgtgggc cacctggaga agggcggcag 3420 ctacgtggcc ctgaccgacg gcctgggcaa cctgaccatc atcatcgaga ccatgagcca 3480 caagcacagc aagtgcatcc gccccttcct gccctacttc aacgtgagcc agcagttcgc 3540 caccttcgtg ctgaagggca gcttcagcga gatccccgag ctgcaggtgt ggtacaccaa 3600 gctgggcaag accagcgagc gcttcctgtt caagcagctg gacagcctgt ggctgctgga 3660 cagcgacggc agcttcaccc tgagcctgca cgaggacgag ctgttcaccc tgaccaccct 3720 gaccaccggc cgcaagggca gctaccccct gccccccaag agccagccct tccccagcac 3780 ctacaaggac gacttcaacg tggactaccc cttcttcagc gaggccccca acttcgccga 3840 ccagaccggc gtgttcgagt acttcaccaa catcgaggac cccggcgagc accacttcac 3900 cctgcgccag gtgctgaacc agcgccccat cacctgggcc gccgacgcca gcaacaccat 3960 cagcatcatc ggcgactaca actggaccaa cctgaccatc aagtgcgacg tgtacatcga 4020 gacccccgac accggcggcg tgttcatcgc cggccgcgtg aacaagggcg gcatcctgat 4080 ccgcagcgcc cgcggcatct tcttctggat cttcgccaac ggcagctacc gcgtgaccgg 4140 cgacctggcc ggctggatca tctacgccct gggccgcgtg gaggtgaccg ccaagaagtg 4200 gtacaccctg accctgacca tcaagggcca cttcaccagc ggcatgctga acgacaagag 4260 cctgtggacc gacatccccg tgaacttccc caagaacggc tgggccgcca tcggcaccca 4320 cagcttcgag ttcgcccagt tcgacaactt cctggtggag gccacccgct gacaattgtt 4380 aattaagttt aaaccctcga ggccgcaagc aataaaatat ctttattttc attacatctg 4440 tgtgttggtt ttttgtgttg tacactgaat tccctgcagg ttggccactc cctctctgcg 4500 cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg 4560 cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg 4620 ttcct 4625 <210> 89 <211> 4606 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 89 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480 agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540 tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600 actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660 tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720 ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780 tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840 gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgtac 900 gccctgttcc tgctggccag cctgctgggc gccgccctgg ccggccccgt gctgggcctg 960 aaggagtgca cccgcggcag cgccgtgtgg tgccagaacg tgaagaccgc cagcgactgc 1020 ggcgccgtga agcactgcct gcagaccgtg tggaacaagc ccaccgtgaa gagcctgccc 1080 tgcgacatct gcaaggacgt ggtgaccgcc gccggcgaca tgctgaagga caacgccacc 1140 gaggaggaga tcctggtgta cctggagaag acctgcgact ggctgcccaa gcccaacatg 1200 agcgccagct gcaaggagat cgtggacagc tacctgcccg tgatcctgga catcatcaag 1260 ggcgagatga gccgccccgg cgaggtgtgc agcgccctga acctgtgcga gagcctgcag 1320 aagcacctgg ccgagctgaa ccaccagaag cagctggaga gcaacaagat ccccgagctg 1380 gacatgaccg aggtggtggc ccccttcatg gccaacatcc ccctgctgct gtacccccag 1440 gacggccccc gcagcaagcc ccagcccaag gacaacggcg acgtgtgcca ggactgcatc 1500 cagatggtga ccgacatcca gaccgccgtg cgcaccaaca gcaccttcgt gcaggccctg 1560 gtggagcacg tgaaggagga gtgcgaccgc ctgggccccg gcatggccga catctgcaag 1620 aactacatca gccagtacag cgagatcgcc atccagatga tgatgcacat gcagcccaag 1680 gagatctgcg ccctggtggg cttctgcgac gaggtgaagg agatgcccat gcagaccctg 1740 gtgcccgcca aggtggccag caagaacgtg atccccgccc tggagctggt ggagcccatc 1800 aagaagcacg aggtgcccgc caagagcgac gtgtactgcg aggtgtgcga gttcctggtg 1860 aaggaggtga ccaagctgat cgacaacaac aagaccgaga aggagatcct ggacgccttc 1920 gacaagatgt gcagcaagct gcccaagagc ctgagcgagg agtgccagga ggtggtggac 1980 acctacggca gcagcatcct gagcatcctg ctggaggagg tgagccccga gctggtgtgc 2040 agcatgctgc acctgtgcag cggcacccgc ctgcccgccc tgaccgtgca cgtgacccag 2100 cccaaggacg gcggcttctg cgaggtgtgc aagaagctgg tgggctacct ggaccgcaac 2160 ctggagaaga acagcaccaa gcaggagatc ctggccgccc tggagaaggg ctgcagcttc 2220 ctgcccgacc cctaccagaa gcagtgcgac cagttcgtgg ccgagtacga gcccgtgctg 2280 atcgagatcc tggtggaggt gatggacccc agcttcgtgt gcctgaagat cggcgcctgc 2340 cccagcgccc acaagcccct gctgggcacc gagaagtgca tctggggccc cagctactgg 2400 tgccagaaca ccgagaccgc cgcccagtgc aacgccgtgg agcactgcaa gcgccacgtg 2460 tggaacagaa gaaagagagg aagtggagag ggcagaggaa gtcttctgac atgcggagac 2520 gtggaagaga atcccggccc tatggaattc agcagcccca gcagagagga atgccccaag 2580 cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct gcttcaggcc 2640 gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta cagcagcgtc 2700 gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt tcctgctctg 2760 ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact gagcatggga 2820 cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc tgagcagaaa 2880 ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct gaatatcctg 2940 gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga ggaaggcatc 3000 ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag gacctacacc 3060 tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga agaggacacc 3120 aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc cgtgtcactg 3180 ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt gaatggcaag 3240 ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag atacttcgtg 3300 aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac agccgagaac 3360 gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt tacacccgag 3420 caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag cacccaccat 3480 aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg ggctaaagtg 3540 gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca ctggtatctg 3600 gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt ccccaacacc 3660 atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag cgtgcggctc 3720 ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct gctgtaccac 3780 gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc taactgggtc 3840 cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt ctacaagcag 3900 cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc tcagcgcgtt 3960 ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca ccctgatgga 4020 tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac catcaaggat 4080 cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac ctacctgtgg 4140 cgtagacagt gacaattgtt aattaagttt aaaccctcga ggccgcaagc cgcatcgata 4200 ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 4260 gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 4320 taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 4380 ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 4440 gtacactgaa ttccctgcag gttggccact ccctctctgc gcgctcgctc gctcactgag 4500 gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc agtgagcgag 4560 cgagcgcgca gagagggagt ggccaactcc atcactaggg gttcct 4606 <210> 90 <211> 10870 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of first strand of PR006A vector <400> 90 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180 agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240 tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 960 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1020 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1080 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1140 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1200 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa 1260 gggaaagtct tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgt 1320 ggaccctggt gagctgggtg gccctgaccg ccggcctggt ggccggcacc cgctgccccg 1380 acggccagtt ctgccccgtg gcctgctgcc tggaccccgg cggcgccagc tacagctgct 1440 gccgccccct gctggacaag tggcccacca ccctgagccg ccacctgggc ggcccctgcc 1500 aggtggacgc ccactgcagc gccggccaca gctgcatctt caccgtgagc ggcaccagca 1560 gctgctgccc cttccccgag gccgtggcct gcggcgacgg ccaccactgc tgcccccgcg 1620 gcttccactg cagcgccgac ggccgcagct gcttccagcg cagcggcaac aacagcgtgg 1680 gcgccatcca gtgccccgac agccagttcg agtgccccga cttcagcacc tgctgcgtga 1740 tggtggacgg cagctggggc tgctgcccca tgccccaggc cagctgctgc gaggaccgcg 1800 tgcactgctg cccccacggc gccttctgcg acctggtgca cacccgctgc atcaccccca 1860 ccggcaccca ccccctggcc aagaagctgc ccgcccagcg caccaaccgc gccgtggccc 1920 tgagcagcag cgtgatgtgc cccgacgccc gcagccgctg ccccgacggc agcacctgct 1980 gcgagctgcc cagcggcaag tacggctgct gccccatgcc caacgccacc tgctgcagcg 2040 accacctgca ctgctgcccc caggacaccg tgtgcgacct gatccagagc aagtgcctga 2100 gcaaggagaa cgccaccacc gacctgctga ccaagctgcc cgcccacacc gtgggcgacg 2160 tgaagtgcga catggaggtg agctgccccg acggctacac ctgctgccgc ctgcagagcg 2220 gcgcctgggg ctgctgcccc ttcacccagg ccgtgtgctg cgaggaccac atccactgct 2280 gccccgccgg cttcacctgc gacacccaga agggcacctg cgagcagggc ccccaccagg 2340 tgccctggat ggagaaggcc cccgcccacc tgagcctgcc cgacccccag gccctgaagc 2400 gcgacgtgcc ctgcgacaac gtgagcagct gccccagcag cgacacctgc tgccagctga 2460 ccagcggcga gtggggctgc tgccccatcc ccgaggccgt gtgctgcagc gaccaccagc 2520 actgctgccc ccagggctac acctgcgtgg ccgagggcca gtgccagcgc ggcagcgaga 2580 tcgtggccgg cctggagaag atgcccgccc gccgcgccag cctgagccac ccccgcgaca 2640 tcggctgcga ccagcacacc agctgccccg tgggccagac ctgctgcccc agcctgggcg 2700 gcagctgggc ctgctgccag ctgccccacg ccgtgtgctg cgaggaccgc cagcactgct 2760 gccccgccgg ctacacctgc aacgtgaagg cccgcagctg cgagaaggag gtggtgagcg 2820 cccagcccgc caccttcctg gcccgcagcc cccacgtggg cgtgaaggac gtggagtgcg 2880 gcgagggcca cttctgccac gacaaccaga cctgctgccg cgacaaccgc cagggctggg 2940 cctgctgccc ctaccgccag ggcgtgtgct gcgccgaccg ccgccactgc tgccccgccg 3000 gcttccgctg cgccgcccgc ggcaccaagt gcctgcgccg cgaggccccc cgctgggacg 3060 cccccctgcg cgaccccgcc ctgcgccagc tgctgtgaca attgttaatt aagtttaaac 3120 cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg tgaaagattg 3180 actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 3240 ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 3300 ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 3360 gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 3420 gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 3480 cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa 3540 tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 3600 ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 3660 gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 3720 gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt 3780 ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 3840 ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 3900 gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3960 atagcaggca tgctggggag agatccacga taacaaacag cttttttggg gcccacatgt 4020 acactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4080 cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag tgagcgagcg 4140 agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc gctcgtacgg 4200 tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat atagaagccc 4260 aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt ccactaaata 4320 tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg ataaaataga 4380 gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa aatatggcat 4440 tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa tatatttata 4500 tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat tccagtgaat 4560 tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata tagaagcatg 4620 cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc agtagaacta 4680 ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc caaaattagg 4740 ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa atgatgttat 4800 caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg gattgagaag 4860 gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga tttttgccag 4920 cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga ttagcatggc 4980 ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt gtccagtgct 5040 cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat atgttggctg 5100 ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt tcttacagtt 5160 caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag tcccactgct 5220 actggggtca gggaagccag actccagcat cagcagtcag gagcactaag cccttgccaa 5280 catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt aagctatcaa 5340 gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt ctagcaaaag 5400 tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca ctccactctt 5460 agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc tgctgcccct 5520 gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag ctaataggtg 5580 gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag ctcaaatggg 5640 aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc tgactgcatc 5700 caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat ctaggtcaga 5760 cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc tttctgctcc 5820 agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg agggttctta 5880 aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac agcttagaca 5940 gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc agccctcatg 6000 aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc tgcagaaatc 6060 tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc tggtattctg 6120 gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc cctgagcctc 6180 aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac aaggccaaac 6240 tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg aactctctgt 6300 cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa ccttacctct 6360 gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc agccctaatt 6420 aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc cacttcagat 6480 gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc cctccacata 6540 tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta agattttaca 6600 caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag aattagcata 6660 attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg aagtaaagac 6720 agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga aagagtctgg 6780 aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt accagcagcc 6840 ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct aaccaccctg 6900 ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga gaactgcaag 6960 agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc ctctctccac 7020 agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc tggtgtctca 7080 cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct catctcacca 7140 tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac atcctgtcta 7200 catcttctgc catactctgc catctaccat accacctctt accatctacc acaccatctt 7260 ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt tcatctcagc 7320 ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg gccaagaaaa 7380 acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg ttgtgttcta 7440 gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca tcctcctgat 7500 tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact gtgaaggact 7560 agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag agcttacaaa 7620 catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac agactcctgc 7680 tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca gtctcctctt 7740 caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc cttctgcaaa 7800 acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct ttaactaaaa 7860 aatgtcagag attattttca accccttact gtggatcacc agcaaggagg aaacacaaca 7920 cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta aagagagcaa 7980 ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat cagagacaaa 8040 tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca tggacttcaa 8100 acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat aaatctgcct 8160 ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc tccagtcagg 8220 ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc aaaggcaaga 8280 agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta gatatgcagt 8340 cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga gaaaacctcc 8400 aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct cggcctctgc 8460 ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag 8520 gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct 8580 ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt 8640 gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccctaa 8700 ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag aggcggtttg 8760 cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 8820 cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 8880 aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 8940 gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 9000 tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 9060 agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 9120 ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 9180 taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 9240 gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 9300 gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 9360 ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 9420 ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 9480 gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 9540 caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 9600 taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 9660 aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 9720 tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 9780 tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca caagataaaa 9840 atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca aggggtgtta 9900 tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc aacatggatg 9960 ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct 10020 atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc aaaggtagcg 10080 ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa tttatgcctc 10140 ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc accactgcga 10200 tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt gaaaatattg 10260 ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt aattgtcctt 10320 ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat aacggtttgg 10380 ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa gtctggaaag 10440 aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt gatttctcac 10500 ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt ggacgagtcg 10560 gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt gagttttctc 10620 cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat atgaataaat 10680 tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc atacccacgc 10740 cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg gtgatgtcgg 10800 cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc caagtcgacg 10860 tccggcagtc 10870 <210> 91 <211> 10870 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of second strand of PR006A vector <400> 91 gactgccgga cgtcgacttg gcgcgccctc atcaccggcg ccacaggtgc ggttgctggc 60 gcctatatcg ccgacatcac cgatggggaa gatcgggctc gccacttcgg gctcatgagc 120 gcttgtttcg gcgtgggtat ggtggcaggc cgcccttaga aaaactcatc gagcatcaaa 180 tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 240 tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 300 tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 360 aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagc 420 ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 480 ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 540 tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 600 agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 660 ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 720 atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 780 tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 840 tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 900 tataaatcag catccatgtt ggaatttaat cgcggcctcg agcaagacgt ttcccgttga 960 atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 1020 gatgatatat ttttatcttg tgcaatgtaa catcagagat tttgagacac aacgtggttt 1080 gcaggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 1140 tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 1200 aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 1260 aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 1320 gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 1380 cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 1440 ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 1500 accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 1560 tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 1620 cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 1680 gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 1740 ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 1800 cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 1860 tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 1920 ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 1980 ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 2040 ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 2100 gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctgtggaa 2160 tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 2220 catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 2280 aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc 2340 catcccgccc ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt 2400 ttttatttat gcagaggccg aggccgcctc ggcctctgag ctattccaga agtagtgagg 2460 aggctttttt ggaggttttc tctacactga agtcttgatg gcatgcgctt tagtctcctc 2520 actcatgagg actgcatatc taagagctct gtgacctcac ttgtgcctgg tgtccagggt 2580 aaacaaatct tcttgccttt gaaaattaga ggatgcagac tggtctcctc tactgcactg 2640 gactgactaa cctgactgga gctcttgttc acactgagaa gaagctggtg gactcttctt 2700 tggctctgaa aggcagattt attttatctc atggagttag gctagagcat cttgtcagag 2760 ggaatgatgt ttgaagtcca tgaggcttct aatgattagg gctggtatgc agcaaacaac 2820 catgactgca tttgtctctg atgcagattc ctaacttctg atatgttcaa aactctgctt 2880 cctgattcag ttgctctctt taacaaatgc agtgattctt ttgataattt gaggggaaaa 2940 aatgtctctg tgttgtgttt cctccttgct ggtgatccac agtaaggggt tgaaaataat 3000 ctctgacatt ttttagttaa agccttcctt tcattcttca tggctactgc agcacaaagc 3060 tctttcttgt tttgcagaag gagtgagagc aaggtgttgg gtgagttctc agtgccccag 3120 ccccagcctg aagaggagac tgaatgcctg ccctctggct gtggctcaga gtgaaaggaa 3180 aacacataca gcaggagtct gtgtagggat tgggctccag ccatcagagc ggggggagca 3240 tcatgaaatg tttgtaagct ctccaccatc cagaatgact ttgcagctct gagcagctgc 3300 acccatgact agtccttcac agtatgctga tgtgagatat tctgttcttt gaagatgggt 3360 agtgaccaga atcaggagga tgtgagaaat gtggagcatt tgagagtgga actcctgcag 3420 ctgttgaagc tagaacacaa cagacactgc agcttactac tcctgagcct ggccaggctg 3480 gtagttttgt ttttcttggc caagctctct gggaatagtt ctgcctctgg ggtcagcttt 3540 ccatgcaggg gctgagatga acacataaag caggattcag cttggaggct tctgagaggg 3600 atggagataa aagatggtgt ggtagatggt aagaggtggt atggtagatg gcagagtatg 3660 gcagaagatg tagacaggat gtcagaaaat gagatggtag ttgcaagagt aggctgtaga 3720 cagtgggaga tggtgagatg agagatgcag aagatggtca gagagcagga tgttgggaga 3780 ggctaggagg tgagacacca gggttggagt gtggactgca ggctttgtta ggctggagag 3840 gtgagtagct gtggagagag gatgacctgc acttgtctga atctaacaga acctaaatta 3900 gaaactttct cttgcagttc tctctctggc tcaggctggc ttgtcttggg gactgtctgt 3960 cactctggaa cagggtggtt agagctgtgg ctttcatggt acttctcttc actgggctct 4020 gatagcctgg ggctgctggt actatctgct tgcacttgct ttgaggaggc caagaacatc 4080 ctgtgtattt ccagactctt tcttgttctg tttgtcctct caggctattc cttgtgctcc 4140 tgatgtctct gtctttactt ccaaaactat ttattaaaaa atctaagatt cattcatgtt 4200 taaggggaat tatgctaatt ctttcatacc taatgggata aaactaactg tgaaattaca 4260 gaccatcttg tgtaaaatct taatctcagc agtcacattt gctgttgaag tgagtatgaa 4320 caaacactga tatgtggagg gctctggtgc aaaggtttgt aggctctgcc tgtgttgcat 4380 agagcagctc atctgaagtg gattagcact gcttctgagc atggaaggtc aggctgaagt 4440 catgatgcct aattagggct ggagaggaca tcacagaaac agtggctctt gggtttgtcc 4500 tgggtagggc agaggtaagg ttgaggagag ctagaaaact caggaaaaga aaaggctcag 4560 gagaaagaag acagagagtt ccagtgagca gagctgcctc tgctgctagg cttgtggtac 4620 acaggttaaa gtttggcctt gtggcattca acagcctttg catcctactg accacactag 4680 ccaggcagtt gaggctcagg gctggctttc ttgcacttgg agaacctttc ctaccttcaa 4740 atgcttgaac cagaatacca gagaaaaaat gcaactctga aagcacaggc attctgtgaa 4800 tagccatcca gatttctgca ggctaaggaa aacagagatg gaggtctatg agggaaagaa 4860 gagaagtcct catgagggct gataccagac agttgagtag gacactgagc acactcacca 4920 ccagatgctc tgtctaagct gtagtttact aggaggttgt ttattctctg agtcagattt 4980 gcttctgttt taagaaccct cacagcctct ctttctatct attctgatga aggttgagcc 5040 tgaagaagct ggagcagaaa gggtcttctg cctcatgttc tgctgataaa ctttgagaat 5100 cctgcctaag tctgacctag attttggctc caaaagccag ggcttcttat ctctgtcaag 5160 accaaacctg gatgcagtca gaggttgggc acagcctttg ctccaaggct cctgggcaca 5220 gtgcccacct cccatttgag cttgcagcaa ggctattatg agaaactttc ctcctcttcc 5280 ttcaagtctc cacctattag ctctgcaaga gtgcagaagg ctgcacagca ctgcagatgg 5340 agaaggtggc aggggcagca ggtggcaggg gctccaggga actgtggtca gagttgattc 5400 agagcaggct aagagtggag tgactgaaga cagaagctgg aggcacatca accattacaa 5460 gacagcttga cttttgctag aacccttggc ttcaggtgat gagaataatg gtagacactg 5520 gttgtttggc ttgatagctt aaaaaaggac aaccattata atggaagcag tttctctgag 5580 aaacaggatg ttggcaaggg cttagtgctc ctgactgctg atgctggagt ctggcttccc 5640 tgaccccagt agcagtggga cttagaagca tctcaggctc caggttctca cagctgactc 5700 ctccttcctg aactgtaaga aacagaaatc cacttgctgc tctaaagtgg ggtcacttta 5760 atggaaggaa cagccaacat atttggagag gggctggtgt ggggcttctt actgagagtg 5820 ggcagccctg agcactggac aaactcaact gtgggcaacc tgggtgggaa gcagctgtgg 5880 agatggggaa gccatgctaa tcagtgacat catctattct aagtttccta cctctgaatg 5940 aatagttctg ctggcaaaaa tctgcttttt taagttgata caaatgtgtc ctgtcaagga 6000 agtagagctc cttctcaatc cagcacatca gtaccataac ttgttcctgt gcatttggtt 6060 aaagatggtg ataacatcat ttatcagtaa gtgcagccag gcatgatgca ctatctcctt 6120 gcatttagag cctaattttg gccaaagaag tcttcataga aaaggacttc ccactcaaag 6180 tagtcctgag tagttctact gattttatta ttagtagaga gggtttcatc atgttggcca 6240 ggctggtctg catgcttcta tattattttc taaaagattt aaagttttgc cttctccatt 6300 tagacttata attcactgga atttttttgt gtgtatggta tgacatatgg gttccctttt 6360 attttttaca tataaatata tttccctgtt tttctaaaaa agaaaaagac catcattttc 6420 ccattgtaaa atgccatatt tttttcatag gtcacttaca tatatcaatg ggtctgtttc 6480 tgagctctac tctattttat cagcctcact gtctatcccc acacatctca tgctttgctc 6540 taaatcttga tatttagtgg aacattcttt cccattttgt tctacaagaa tatttttgtt 6600 attgtctttt gggcttctat atacatttta gaatgaggtt ggcaagttat cctgcaggaa 6660 ttcctcgaga ccgtacgagc ggccgcagga acccctagtg atggagttgg ccactccctc 6720 tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 6780 tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca acctgcaggg 6840 aattcagtgt acatgtgggc cccaaaaaag ctgtttgtta tcgtggatct ctccccagca 6900 tgcctgctat tgtcttccca atcctccccc ttgctgtcct gccccacccc accccccaga 6960 atagaatgac acctactcag acaatgcgat gcaatttcct cattttatta ggaaaggaca 7020 gtgggagtgg caccttccag ggtcaaggaa ggcacggggg aggggcaaac aacagatggc 7080 tggcaactag aaggcacagt cgaggctgat cagcgagctc tagtcgacgg tatcgatgcg 7140 gggaggcggc ccaaagggag atccgactcg tctgagggcg aaggcgaaga cgcggaagag 7200 gccgcagagc cggcagcagg ccgcgggaag gaaggtccgc tggattgagg gccgaaggga 7260 cgtagcagaa ggacgtcccg cgcagaatcc aggtggcaac acaggcgagc agccaaggaa 7320 aggacgatga tttccccgac aacaccacgg aattgtcagt gcccaacagc cgagcccctg 7380 tccagcagcg ggcaaggcag gcggcgatga gttccgccgt ggcaataggg agggggaaag 7440 cgaaagtccc ggaaaggagc tgacaggtgg tggcaatgcc ccaaccagtg ggggttgcgt 7500 cagcaaacac agtgcacacc acgccacgtt gcctgacaac gggccacaac tcctcataaa 7560 gagacagcaa ccaggattta tacaaggagg agaaaatgaa agccatacgg gaagcaatag 7620 catgatacaa aggcattaaa gcagcgtatc cacatagcgt aaaaggagca acatagttaa 7680 gaataccagt caatctttca caaattttgt aatccagagg ttgattatcg ataagcttgc 7740 ggcctcgagg gtttaaactt aattaacaat tgtcacagca gctggcgcag ggcggggtcg 7800 cgcagggggg cgtcccagcg gggggcctcg cggcgcaggc acttggtgcc gcgggcggcg 7860 cagcggaagc cggcggggca gcagtggcgg cggtcggcgc agcacacgcc ctggcggtag 7920 gggcagcagg cccagccctg gcggttgtcg cggcagcagg tctggttgtc gtggcagaag 7980 tggccctcgc cgcactccac gtccttcacg cccacgtggg ggctgcgggc caggaaggtg 8040 gcgggctggg cgctcaccac ctccttctcg cagctgcggg ccttcacgtt gcaggtgtag 8100 ccggcggggc agcagtgctg gcggtcctcg cagcacacgg cgtggggcag ctggcagcag 8160 gcccagctgc cgcccaggct ggggcagcag gtctggccca cggggcagct ggtgtgctgg 8220 tcgcagccga tgtcgcgggg gtggctcagg ctggcgcggc gggcgggcat cttctccagg 8280 ccggccacga tctcgctgcc gcgctggcac tggccctcgg ccacgcaggt gtagccctgg 8340 gggcagcagt gctggtggtc gctgcagcac acggcctcgg ggatggggca gcagccccac 8400 tcgccgctgg tcagctggca gcaggtgtcg ctgctggggc agctgctcac gttgtcgcag 8460 ggcacgtcgc gcttcagggc ctgggggtcg ggcaggctca ggtgggcggg ggccttctcc 8520 atccagggca cctggtgggg gccctgctcg caggtgccct tctgggtgtc gcaggtgaag 8580 ccggcggggc agcagtggat gtggtcctcg cagcacacgg cctgggtgaa ggggcagcag 8640 ccccaggcgc cgctctgcag gcggcagcag gtgtagccgt cggggcagct cacctccatg 8700 tcgcacttca cgtcgcccac ggtgtgggcg ggcagcttgg tcagcaggtc ggtggtggcg 8760 ttctccttgc tcaggcactt gctctggatc aggtcgcaca cggtgtcctg ggggcagcag 8820 tgcaggtggt cgctgcagca ggtggcgttg ggcatggggc agcagccgta cttgccgctg 8880 ggcagctcgc agcaggtgct gccgtcgggg cagcggctgc gggcgtcggg gcacatcacg 8940 ctgctgctca gggccacggc gcggttggtg cgctgggcgg gcagcttctt ggccaggggg 9000 tgggtgccgg tgggggtgat gcagcgggtg tgcaccaggt cgcagaaggc gccgtggggg 9060 cagcagtgca cgcggtcctc gcagcagctg gcctggggca tggggcagca gccccagctg 9120 ccgtccacca tcacgcagca ggtgctgaag tcggggcact cgaactggct gtcggggcac 9180 tggatggcgc ccacgctgtt gttgccgctg cgctggaagc agctgcggcc gtcggcgctg 9240 cagtggaagc cgcgggggca gcagtggtgg ccgtcgccgc aggccacggc ctcggggaag 9300 gggcagcagc tgctggtgcc gctcacggtg aagatgcagc tgtggccggc gctgcagtgg 9360 gcgtccacct ggcaggggcc gcccaggtgg cggctcaggg tggtgggcca cttgtccagc 9420 agggggcggc agcagctgta gctggcgccg ccggggtcca ggcagcaggc cacggggcag 9480 aactggccgt cggggcagcg ggtgccggcc accaggccgg cggtcagggc cacccagctc 9540 accagggtcc acatggtggc tcaaccggtg atatcttcga acggatccca cagtcgtgga 9600 agactttccc ttcggatctt cgaggaattc tttgccaaaa tgatgagaca gcacaataac 9660 cagcacgttg cccaggagct gtaggaaaaa gaagaaggca tgaacatggt tagcagaggc 9720 tctagctccc ggagcccctc aaggctttca cgcagccaca gaaaagaaac aagccgtcat 9780 taaaccaagc gctaattaca gcccggagga gaagggccgt cccgcccgct cacctgtggg 9840 agtaacgcgg tcagtcagag ccggggcggg cggcgcgagg cggcggcgga gcggggcacg 9900 gggcgaaggc agcgcgcagc gactcccgcc cgccgcgcgc ttcgcttttt atagggccgc 9960 cgccgccgcc gcctcgccat aaaaggaaac tttcggagcg cgccgctctg attggctgcc 10020 gccgcacctc tccgcctcgc cccgccccgc ccctcgcccc gccccgcccc gcctggcgcg 10080 cgcccccccc ccccccccgc ccccatcgct gcacaaaata attaaaaaat aaataaatac 10140 aaaattgggg gtggggaggg gggggagatg gggagagtga agcagaacgt ggggctcacc 10200 tcgaccatgg taatagcgat gactaatacg tagatgtact gccaagtagg aaagtcccat 10260 aaggtcatgt actgggcata atgccaggcg ggccatttac cgtcattgac gtcaataggg 10320 ggcgtacttg gcatatgata cacttgatgt actgccaagt gggcagttta ccgtaaatac 10380 tccacccatt gacgtcaatg gaaagtccct attggcgtta ctatgggaac atacgtcatt 10440 attgacgtca atgggcgggg gtcgttgggc ggtcagccag gcgggccatt taccgtaagt 10500 tatgtaacgc ggaactccat atatgggcta tgaactaatg accccgtaat tgattactat 10560 taataactag gtaccgaatt cagatccaag cttcaccatg ggagacgtca ccggttctag 10620 aacctaggga gctctggtac ccactagtag tcgacgaacg cgtaacctcc cgcttcaaaa 10680 tggagaccct gcgtgctcac tcgggcttaa atacccagag ctagcaggaa cccctagtga 10740 tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc 10800 ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg 10860 gagtggccaa 10870

Claims (17)

  1. GRN 돌연변이가 있는 전두측두엽 치매를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법으로서,
    (i) 프로그래뉼린(PGRN) 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, 상기 rAAV 벡터; 및
    (ii) AAV9 캡시드 단백질
    을 포함하는 재조합 아데노-연관 바이러스(rAAV)를 대상체에게 투여하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 rAAV는 약 1×1013개 벡터 게놈(vg) 내지 약 7×1014개 vg 범위의 용량으로 대상체에게 투여되는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 rAAV는 주사를 통해 대조 내로 투여되는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 프로모터는 닭 베타 액틴(CBA) 프로모터인, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 rAAV 벡터는 거대세포바이러스(CMV) 인핸서를 추가로 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 rAAV 벡터는 우드척 간염 바이러스 전사후 조절 요소(WPRE)를 추가로 포함하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 rAAV 벡터는 소 성장 호르몬 폴리A 신호 꼬리를 추가로 포함하는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 핵산은 발현 작제물에 측접하는 2개의 아데노-연관 바이러스 반전 말단 반복부(ITR) 서열을 포함하는, 방법.
  9. 제8항에 있어서, 각각의 ITR 서열은 야생형 AAV2 ITR 서열인, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 rAAV 벡터는 5' ITR과 발현 작제물 사이에 TRY 영역을 추가로 포함하되, TRY 영역은 서열번호 28을 포함하는, 방법.
  11. GRN 돌연변이가 있는 전두측두엽 치매를 지니거나 지니는 것으로 의심되는 대상체를 치료하는 방법으로서,
    (i) 5'에서 3'순서로
    (a) AAV2 ITR;
    (b) CMV 인핸서;
    (c) CBA 프로모터;
    (d) PGRN 단백질을 인코딩하는 이식유전자 삽입체로서, 서열번호 68의 뉴클레오타이드 서열을 포함하는, 상기 이식유전자 삽입체;
    (e) WPRE;
    (f) 소 성장 호르몬 폴리A 신호 꼬리; 및
    (g) AAV2 ITR
    을 포함하는 핵산을 포함하는 rAAV 벡터; 및
    (ii) AAV9 캡시드 단백질
    을 포함하는 rAAV를 대상체에게 투여하는 단계를 포함하는, 방법.
  12. 제11항에 있어서, 상기 rAAV는 약 1×1013개 vg 내지 약 7×1014개 vg 범위의 용량으로 대상체에게 투여되는, 방법.
  13. 제11항 또는 제12항에 있어서, 상기 rAAV는 주사를 통해 대조 내로 투여되는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 rAAV는 약 20mM Tris(pH 8.0), 약 1mM MgCl2, 약 200mM NaCl 및 약 0.001% w/v 폴록사머 188을 포함하는 제형으로 투여되는, 방법.
  15. 약제학적 조성물로서,
    (i) rAAV로서,
    (a) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, 상기 rAAV 벡터; 및
    (b) AAV9 캡시드 단백질
    을 포함하는, 상기 rAAV; 및
    (ii) 약 20mM Tris(pH 8.0),
    (iii) 약 1mM MgCl2 ,
    (iv) 약 200mM NaCl, 및
    (v) 약 0.001% w/v 폴록사머 188
    을 포함하는, 약제학적 조성물.
  16. 대상체에서 GRN 돌연변이가 있는 전두측두엽 치매를 치료하는 방법에서 사용하기 위한,
    (a) PGRN 단백질을 인코딩하는 이식유전자 삽입체에 작동 가능하게 연결된 프로모터를 포함하는 발현 작제물을 포함하는 핵산을 포함하는 rAAV 벡터로서, 이식유전자 삽입체는 서열번호 68의 뉴클레오타이드 서열을 포함하는, 상기 rAAV 벡터; 및
    (b) AAV9 캡시드 단백질
    을 포함하는 rAAV.
  17. 뇌척수액(CSF) 샘플에서 PGRN 단백질 수준을 정량화하는 방법으로서,
    (1) 다이티오트레이톨(DTT) 및 샘플 완충액을 포함하는 마스터 믹스에서 CSF 샘플을 희석시키는 단계;
    (2) 희석된 CSF 샘플, 항-프로그래뉼린 항체, 항-프로그래뉼린 항체를 검출하는 2차 항체, 루미놀 및 퍼옥사이드를 모세관 카트리지의 웰에 로딩하는 단계;
    (3) 모세관 카트리지를 자동화된 웨스턴 블롯 면역분석 기기에 로딩하는 단계;
    (4) 자동화된 웨스턴 블롯 면역분석 기기를 사용하여 신호 강도, 피크 면적 및 신호 대 잡음 비를 계산하는 단계; 및
    (5) 항-그래뉼린 항체에 대한 면역반응성의 피크 면적으로서 CSF 샘플에서 프로그래뉼린 단백질 수준을 정량화하는 단계
    를 포함하는, 방법.
KR1020217036234A 2019-04-10 2020-04-10 리소좀 장애에 대한 유전자 요법 KR20210150486A (ko)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201962831846P 2019-04-10 2019-04-10
US62/831,846 2019-04-10
US201962934450P 2019-11-12 2019-11-12
US62/934,450 2019-11-12
US201962954089P 2019-12-27 2019-12-27
US62/954,089 2019-12-27
US202062960471P 2020-01-13 2020-01-13
US62/960,471 2020-01-13
US202062988665P 2020-03-12 2020-03-12
US62/988,665 2020-03-12
PCT/US2020/027764 WO2020210698A1 (en) 2019-04-10 2020-04-10 Gene therapies for lysosomal disorders

Publications (1)

Publication Number Publication Date
KR20210150486A true KR20210150486A (ko) 2021-12-10

Family

ID=70554180

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217036234A KR20210150486A (ko) 2019-04-10 2020-04-10 리소좀 장애에 대한 유전자 요법

Country Status (11)

Country Link
US (2) US11999974B2 (ko)
EP (1) EP3953377A1 (ko)
JP (1) JP7571044B2 (ko)
KR (1) KR20210150486A (ko)
CN (1) CN114174324A (ko)
AU (1) AU2020273182A1 (ko)
BR (1) BR112021020183A2 (ko)
CA (1) CA3136004A1 (ko)
IL (1) IL286903A (ko)
MX (1) MX2021011958A (ko)
WO (1) WO2020210698A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3583124A1 (en) 2017-02-17 2019-12-25 Bristol-Myers Squibb Company Antibodies to alpha-synuclein and uses thereof
MX2020004005A (es) 2017-10-03 2020-10-05 Prevail Therapeutics Inc Terapias genicas para los trastornos lisosomales.
CN111492061A (zh) 2017-10-03 2020-08-04 普利维尔治疗公司 用于溶酶体障碍的基因疗法
IL300409A (en) * 2020-08-10 2023-04-01 Prevail Therapeutics Inc Gene therapies for neurodegenerative disorders
WO2024100633A1 (en) * 2022-11-13 2024-05-16 Alexion Pharma International Operations Limited Gene therapy for frontotemporal dementia
WO2024178352A2 (en) * 2023-02-24 2024-08-29 The Board Of Trustees Of The Leland Stanford Junior University Bmp synthase activators and inhibitors

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU5557501A (en) 2000-04-28 2001-11-12 Univ Pennsylvania Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids
EP1319082B1 (en) 2000-09-18 2005-11-16 Genzyme Corporation Expression vectors containing hybrid ubiquitin promoters
US20030133924A1 (en) 2001-12-21 2003-07-17 Novazyme Pharmaceuticals, Inc. Highly phosphorylated acid beta-glucocerebrosidase and methods of treating gaucher's disease
AU2003221733A1 (en) 2002-04-17 2003-11-03 University Of Florida Research Foundation, Inc. Improved raav vectors
WO2006036465A2 (en) 2004-09-03 2006-04-06 University Of Florida Compositions and methods for treating cystic fibrosis
JP5123936B2 (ja) 2006-05-30 2013-01-23 メイヨ・ファウンデーション・フォー・メディカル・エデュケーション・アンド・リサーチ 認知症の検出および治療
EP2687223B1 (en) 2006-05-30 2017-07-12 Mayo Foundation For Medical Education And Research Detecting and treating dementia
MX364444B (es) 2006-06-07 2019-04-26 Genzyme Corp Terapia génica para esclerosis lateral amiotrófica y otros trastornos de la médula espinal.
ATE553206T1 (de) 2006-08-24 2012-04-15 Virovek Inc Expression von genen mit überlappenden offenen leserastern in insektenzellen, verfahren und zusammensetzungen dafür
US20090176729A1 (en) 2007-12-14 2009-07-09 Alnylam Pharmaceuticals, Inc. Method of treating neurodegenerative disease
ES2596360T3 (es) 2008-01-16 2017-01-09 Neurodyn Life Sciences Inc. Progranulina para su uso en el tratamiento de enfermedad de Parkinson o enfermedad de Alzheimer
WO2009120978A2 (en) 2008-03-27 2009-10-01 The Ohio State University Treatment of metabolic-related disorders using hypothalamic gene transfer of bdnf and compositions therfor
RS62779B1 (sr) 2009-05-02 2022-01-31 Genzyme Corp Genska terapija neurodegenerativnih poremećaja
EP2640407A4 (en) 2010-11-16 2014-07-09 Denis G Kay PROCESS FOR INCREASING THE EXPRESSION AND ACTIVITY OF NEPRILYSIN
CN104902923A (zh) 2012-11-05 2015-09-09 建新公司 用于治疗蛋白质病的组合物和方法
CA2912678C (en) 2013-05-15 2023-10-10 Regents Of The University Of Minnesota Adeno-associated virus mediated gene transfer to the central nervous system
US10603364B2 (en) 2014-08-11 2020-03-31 Shire Human Genetic Therapies, Inc. Lysosomal targeting and uses thereof
US10900053B2 (en) 2014-11-21 2021-01-26 University Of Florida Research Foundation, Incorporated Genome-modified recombinant adeno-associated virus vectors
US10967073B2 (en) 2015-05-07 2021-04-06 The Mclean Hospital Corporation Glucocerebrosidase gene therapy for Parkinson's disease
IL300254A (en) 2016-02-05 2023-03-01 Univ Emory Administration of single-stranded or self-complementary adeno-associated virus 9 by injection into cerebrospinal fluid for the purposes of gene therapy in the central nervous system
CA3016314A1 (en) 2016-03-02 2017-09-08 Julianne REIDERS Therapy for frontotemporal dementia
EP3445381A4 (en) 2016-04-21 2019-10-02 Virovek, Inc. AAV PREPARATION IN INSECT CELLS, METHOD AND COMPOSITIONS THEREFOR
MX2020004005A (es) 2017-10-03 2020-10-05 Prevail Therapeutics Inc Terapias genicas para los trastornos lisosomales.
CN111492061A (zh) 2017-10-03 2020-08-04 普利维尔治疗公司 用于溶酶体障碍的基因疗法
EP3692075A4 (en) 2017-10-03 2022-02-09 Prevail Therapeutics, Inc. GENE THERAPIES FOR LYSOSOMAL DISEASES
CA3177979A1 (en) 2017-10-23 2019-05-02 Prevail Therapeutics, Inc. Gene therapies for neurodegenerative disease
TWI827560B (zh) * 2017-11-08 2024-01-01 瑞士商諾華股份有限公司 用於製備病毒載體之手段及方法與其用途
CA3134841A1 (en) 2019-04-10 2020-10-15 Prevail Therapeutics, Inc. Gene therapies for lysosomal disorders
CN114026115A (zh) 2019-04-10 2022-02-08 普利维尔治疗公司 用于溶酶体病症的基因疗法
IL300409A (en) 2020-08-10 2023-04-01 Prevail Therapeutics Inc Gene therapies for neurodegenerative disorders

Also Published As

Publication number Publication date
CA3136004A1 (en) 2020-10-15
EP3953377A1 (en) 2022-02-16
CN114174324A (zh) 2022-03-11
IL286903A (en) 2021-10-31
MX2021011958A (es) 2021-12-15
BR112021020183A2 (pt) 2022-03-03
JP2022526823A (ja) 2022-05-26
AU2020273182A1 (en) 2021-12-02
US11999974B2 (en) 2024-06-04
JP7571044B2 (ja) 2024-10-22
US20240287471A1 (en) 2024-08-29
US20200332265A1 (en) 2020-10-22
WO2020210698A1 (en) 2020-10-15

Similar Documents

Publication Publication Date Title
AU2020260485B2 (en) Gene therapies for lysosomal disorders
AU2020260476B2 (en) Gene therapies for lysosomal disorders
AU2020205228B2 (en) Gene therapies for lysosomal disorders
KR102196884B1 (ko) 전립선-연관 항원의 발현을 위한 벡터
RU2758489C2 (ru) Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
CN114026115A (zh) 用于溶酶体病症的基因疗法
AU2020344628A1 (en) Compositions and methods for TCR reprogramming using fusion proteins
CN114502575A (zh) 用于arsa基因转移的腺相关病毒组合物和其使用方法
KR20200107990A (ko) 신경 생존 인자를 포함하는 컨스트럭트 및 이의 용도
KR20230051529A (ko) 리소좀 장애에 대한 유전자 요법
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법
AU2024220143A1 (en) Compositions and methods for the treatment of huntington&#39;s disease by editing the mutant huntingtin gene