[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN112029781B - 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用 - Google Patents

一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用 Download PDF

Info

Publication number
CN112029781B
CN112029781B CN202010818896.XA CN202010818896A CN112029781B CN 112029781 B CN112029781 B CN 112029781B CN 202010818896 A CN202010818896 A CN 202010818896A CN 112029781 B CN112029781 B CN 112029781B
Authority
CN
China
Prior art keywords
cov
novel coronavirus
coronavirus sars
replicon
sars
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010818896.XA
Other languages
English (en)
Other versions
CN112029781A (zh
Inventor
张辉
罗越文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202010818896.XA priority Critical patent/CN112029781B/zh
Priority to US18/021,348 priority patent/US20240192196A1/en
Priority to PCT/CN2020/119544 priority patent/WO2022032832A1/zh
Publication of CN112029781A publication Critical patent/CN112029781A/zh
Application granted granted Critical
Publication of CN112029781B publication Critical patent/CN112029781B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/66Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving luciferase
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5023Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20051Methods of production or purification of viral material
    • C12N2770/20052Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/902Oxidoreductases (1.)
    • G01N2333/90241Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种新型冠状病毒SARS‑CoV‑2的安全型复制子系统及其在筛选抗SARS‑CoV‑2药物病毒药物中的应用。具体包括编码新型冠状病毒SARS‑CoV‑2的非结构蛋白;新型冠状病毒SARS‑CoV‑2的5’UTR、3’UTR、新型冠状病毒SARS‑CoV‑2的非结构蛋白可作用的转录调控区域和报告基因。利用该SARS‑CoV‑2的安全复制子系统,可以在不依赖生物安全三级实验室的情况下,进行抗SARS‑CoV‑2药物的高通量筛选及药物的药效验证,并且操作简单方便。

Description

一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用
技术领域
本发明属于生物技术领域,更具体地,涉及一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用。
背景技术
截止2020年7月23日,新型冠状病毒SARS-CoV-2已经造成全球1500多万人感染,14多万人死亡。但是,目前应用于SARS-CoV-2感染的临床治疗药物非常有限。因为生物安全的原因,针对野生型SARS-CoV-2的药物开发和筛选只能局限在生物安全三级实验室(P3实验室)中进行,这大大限制了针对SARS-CoV-2的抗病毒药物开发。
之前的研究也显示,将E蛋白缺失的冠状病毒基因组插入到人工染色体(Bacterial Artificial Chromosome,BAC)上,所构建的安全复制子系统可以模拟冠状病毒的复制。该系统也已经应用在SARS-CoV的药物验证和药物筛选。但是该系统基于BAC质粒。BAC质粒分子量较大,且不稳定,在转导细胞后达不到理想的表达水平,同时,操作起来费时费力。
因此急需开发一种能够模拟SARS-CoV-2病毒复制并且能够在低级别生物安全实验室中简单操作的工具。
发明内容
本发明第一个方面的目的,为了弥补新型冠状病毒SARS-CoV-2安全复制子的空白,同时克服BAC复制子系统的不足,提供了一种新的SARS-CoV-2安全复制子结构。
本发明第二个方面的目的,在于提供一种含有上述复制子结构的新型冠状病毒SARS-CoV-2安全复制子系统。
本发明第三个方面的目的,在于提供一种含有上述复制子结构或复制子系统的包装细胞。
本发明第四个方面的目的,在于提供上述新型冠状病毒SARS-CoV-2安全复制子结构、复制子系统或包装细胞在抗新型冠状病毒SARS-CoV-2的药物检测或药物筛选方面的应用。
本发明第五个方面的目的,在于提供一种筛选抗新型冠状病毒SARS-CoV-2药物的方法。
本发明第六个方面的目的,在于提供一种筛选抗新型冠状病毒SARS-CoV-2药物的试剂盒。
本发明第七个方面的目的,在于提供一种抗新型冠状病毒SARS-CoV-2药物的筛选系统。
本发明第八个方面的目的,在于提供一种新型冠状病毒SARS-CoV-2分子流行病学监测系统。
本发明所采取的技术方案是:
本发明的第一个方面,提供一种新型冠状病毒SARS-CoV-2的复制子结构,包含以下内容的核酸序列:
(Ⅰ)编码新型冠状病毒SARS-CoV-2的非结构蛋白;
(Ⅱ)新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因。
优选地,根据本发明第一个方面所述的复制子结构,所述非结构蛋白选自新型冠状病毒SARS-CoV-2的nsp1~16蛋白中的至少一种。
优选地,根据本发明第一个方面所述的复制子结构,所述转录调控区域选自新型冠状病毒SARS-CoV-2的S、ORF3a、M、ORF7a、ORF8、或N基因的转录调控区域(TRS)中的至少一种。
进一步地,转录调控区域(TRS)的核心序列(AAACGAAC)单独使用或于其他序列组合使用也在保护范围内。
进一步地,根据本发明第一个方面所述的复制子结构,所述转录调控区域连接于报告基因的上游。
进一步地,根据本发明第一个方面所述的复制子结构,还包含作为参照的另一报告基因的核酸序列。
更进一步地,根据本发明第一个方面所述的复制子结构,所述作为参照的另一报告基因连接有终止密码子且位于转录调控区域的上游。
优选地,根据本发明第一个方面所述的复制子结构,所述核酸为DNA或RNA,优选为反义RNA。
本发明的第二个方面,提供一种新型冠状病毒SARS-CoV-2的复制子系统,包含插入有本发明第一个方面所述的复制子结构的表达载体。
优选地,根据本发明第二个方面所述的复制子系统,包括含有以下内容的两种表达载体:
(ⅰ)编码新型冠状病毒SARS-CoV-2的非结构蛋白的核酸序列;
(ⅱ)新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因的核酸序列。
更优选地,根据本发明第二个方面所述的复制子系统,表达载体(ⅱ)中依次插入有新型冠状病毒SARS-CoV-2的5’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域、报告基因、新型冠状病毒SARS-CoV-2的3’UTR的核酸序列。
进一步优选地,根据本发明第二个方面所述的复制子系统,表达载体(ⅱ)中依次插入有新型冠状病毒SARS-CoV-2的5’UTR、报告基因A、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域、报告基因B、新型冠状病毒SARS-CoV-2的3’UTR的核酸序列,其中报告基因A与报告基因B不同。
更优选地,报告基因A为荧光蛋白的核酸序列;报告基因B为编码荧光素酶的核酸序列。
更进一步地,根据本发明第二个方面所述的复制子系统,新型冠状病毒SARS-CoV-2的5’UTR与报告基因A之间还连接有核糖体进入位点IRES的核酸序列。
更进一步地,根据本发明第二个方面所述的复制子系统,所述报告基因A末端插入翻译终止密码子,优选插入4个终止密码子。
具体地,根据本发明第二个方面所述的复制子系统,表达载体(ⅱ)中依次插入有新型冠状病毒SARS-CoV-2的5’UTR、报告基因A、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域、报告基因B、新型冠状病毒SARS-CoV-2的3’UTR的核酸序列,其中报告基因A为荧光蛋白的核酸序列;报告基因B为编码荧光素酶的核酸序列。
进一步地,所述转录调控区域选自新型冠状病毒SARS-CoV-2的S、ORF3a、M、ORF7a、ORF8、或N基因的基因上游的转录调控区域。
更进一步地,S蛋白的转录调控区域(S-TRS)的核苷酸序列如SEQ ID No.20所示,ORF3a蛋白的转录调控区域(ORF3a-TRS)的核酸序列如SEQ ID No.21所示;M蛋白的转录调控区域(M-TRS)的核酸序列如SEQ ID No.22所示;ORF7a蛋白的转录调控区域(ORF7a-TRS)的核酸序列如SEQ ID No.23所示;ORF8蛋白的转录调控区域(ORF8-TRS)的核酸序列如SEQID No.24所示;N蛋白的转录调控区域(N-TRS)的核酸序列如SEQ ID No.25所示;
新型冠状病毒SARS-CoV-2的5’UTR的核苷酸序列如SEQ ID No.26所示。
新型冠状病毒SARS-CoV-2的3’UTR的核苷酸序列如SEQ ID No.27所示。
所述插入的核糖体进入位点IRES的核苷酸序列优选如SEQ ID No.28所示。
所述插入的4个终止密码子的核苷酸序列优选如SEQ ID No.29所示。
更具体地,表达载体(ⅱ)ps2V的核苷酸序列如SEQ ID No.30所示。
优选地,根据本发明第二个方面所述的复制子系统,所述编码新型冠状病毒SARS-CoV-2的非结构蛋白为新型冠状病毒SARS-CoV-2的nsp1~16蛋白。
更优选地,根据本发明第二个方面所述的复制子系统,报告基因A为荧光蛋白的核酸序列;报告基因B为编码荧光素酶的核酸序列。所述表达载体(ⅰ)中包括3个表达载体,分别插入有编码新型冠状病毒SARS-CoV-2的nsp1~16蛋白中的一个或多个的核酸序列。
进一步优选地,所述nsp1~16蛋白的核酸序列经过密码子优化。
更具体地,经过密码子优化后,nsp1的核苷酸序列如SEQ ID No.1所示;nsp2的核苷酸序列如SEQ ID No.2所示;nsp3的核苷酸序列如SEQ ID No.3所示;nsp4的核苷酸序列如SEQ ID No.4所示;nsp5的核苷酸序列如SEQ ID No.5所示;nsp6的核苷酸序列如SEQ IDNo.6所示;nsp7的核苷酸序列如SEQ ID No.7所示;nsp8的核苷酸序列如SEQ ID No.8所示;nsp9的核苷酸序列如SEQ ID No.9所示;nsp10的核苷酸序列如SEQ ID No.10所示;nsp11的核苷酸序列如SEQ ID No.11所示;nsp12的核苷酸序列如SEQ ID No.12所示;nsp13的核苷酸序列如SEQ ID No.13所示;nsp14的核苷酸序列如SEQ ID No.14所示;nsp15的核苷酸序列如SEQ ID No.15所示;nsp16的核苷酸序列如SEQ ID No.16所示。
进一步优选地,根据本发明第二个方面所述的复制子系统,所述的3个表达载体分别插入有编码新型冠状病毒SARS-CoV-2的nsp1~4蛋白的核酸序列、编码新型冠状病毒SARS-CoV-2的nsp5~11蛋白的核酸序列、新型冠状病毒SARS-CoV-2的nsp12~16蛋白的核酸序列。
更进一步地,根据本发明第二个方面所述的复制子系统,所述核酸序列经过密码子优化。
具体地,根据本发明第二个方面所述的复制子系统,表达载体(ⅰ)中包括以下3个表达载体:分别插入有ps2AN、ps2AC、ps2B三段核酸序列。
ps2AN中含有编码新型冠状病毒SARS-CoV-2的nsp1~4蛋白的核酸序列;
ps2AC中含有编码新型冠状病毒SARS-CoV-2的nsp5~11蛋白的核酸序列;
ps2B中含有新型冠状病毒SARS-CoV-2的nsp12~16蛋白的核酸序列。
更进一步地,ps2AN的核苷酸序列如SEQ ID No.17所示;ps2AC的核苷酸序列如SEQID No.18所示;ps2B的核苷酸序列如SEQ ID No.19所示。
优选地,根据本发明第二个方面所述的复制子系统,所述表达载体优选但不限于pcDNA3.1质粒。
更优选地,分别含有ps2AN、ps2AC、ps2B和ps2V的质粒的比例比为(0.01μg~1μg):(0.01μg~1μg):(0.01μg~1μg):(0.01μg~1μg)。
本发明的第三个方面,提供一种包装细胞,包括本发明第一个方面所述的复制子结构或本发明第二个方面所述的复制子系统。
优选地,根据本发明第三个方面所述的包装细胞,所述细胞为人源细胞。
更优选地,根据本发明第三个方面所述的包装细胞,所述细胞优选但不限于HEK293T细胞。
优选地,根据本发明第三个方面所述的包装细胞,所述复制子结构或复制子系统经过密码子优化。
进一步地,将所述复制子结构或复制子系统转染如细胞内形成包装细胞。
更进一步地,分别含有ps2AN、ps2AC、ps2B和ps2V的质粒转染时的比例比为(0.01μg~1μg):(0.01μg~1μg):(0.01μg~1μg):(0.01μg~1μg)。
质粒的比例浓度比为(0.01μg~1μg):(0.01μg~1μg):(0.01μg~1μg):(0.01μg~1μg)。
本发明的第四个方面,提供本发明第一个方面所述的复制子结构、本发明第二个方面所述的复制子系统或本发明第三个方面所述的包装细胞在抗新型冠状病毒SARS-CoV-2的药物检测或药物筛选方面的应用。
本发明的第五个方面,提供一种筛选抗新型冠状病毒SARS-CoV-2药物的方法,通过向包含有本发明第一个方面所述复制子结构、本发明第二个方面所述复制子系统或本发明第三个方面所述包装细胞的表达系统中,加入待测药物,检测报告基因的差异表达,评估所述待测药物抗新型冠状病毒SARS-CoV-2的效果。
本发明的第六个方面,提供一种筛选抗新型冠状病毒SARS-CoV-2药物的试剂盒,包括本发明第一个方面所述复制子结构、本发明第二个方面所述复制子系统或本发明第三个方面所述包装细胞。
本发明的第七个方面,提供一种抗新型冠状病毒SARS-CoV-2药物的筛选系统,包括本发明第一个方面所述复制子结构、本发明第二个方面所述复制子系统或本发明第三个方面所述包装细胞。
进一步地,根据本发明第七个方面所述的药物筛选系统,其特征在于,所述药物筛选系统还包括荧光素酶检测装置。
优选地,还包括荧光蛋白检测装置。
优选地,还包括全自动机械臂药筛平台。。
本发明的第八个方面,提供一种新型冠状病毒SARS-CoV-2分子流行病学监测系统,包括本发明第一个方面所述复制子结构、本发明第二个方面所述复制子系统或本发明第三个方面所述包装细胞。
根据本发明第八个方面所述的新型冠状病毒SARS-CoV-2分子流行病学监测系统,利用所述复制子系统监测SARS-CoV-2在流行过程中所产生突变对SARS-CoV-2病毒复制的影响。
本发明的有益效果是:
本发明弥补新型冠状病毒SARS-CoV-2安全复制子的空白,同时克服BAC复制子系统的技术不足,提供了一种新的新型冠状病毒SARS-CoV-2安全复制子结构、新型冠状病毒SARS-CoV-2安全复制子系统以及其包装细胞。将SARS-CoV-2RNA合成必备的分子人为拆分,并做了核苷酸序列优化,由4个质粒共同表达,破坏了原有的SARS-CoV-2序列,操作起来更加安全,不需要在高级别生物安全实验室中操作。
本发明构建的新型冠状病毒SARS-CoV-2安全复制子系统可以高度模拟野生型SARS-CoV-2对药物的反应。
本发明还提供了一种筛选抗新型冠状病毒SARS-CoV-2药物的方法,以及对应的试剂盒与检测系统。为生物安全三级实验室一下标准的实验室提供了筛选抗新型冠状病毒SARS-CoV-2药物的可能性,极大地促进了抗新型冠状病毒SARS-CoV-2药物的研究和筛选,具有广阔的应用前景。
本发明构建的新型冠状病毒SARS-CoV-2安全复制子系统可以高度模拟野生型SARS-CoV-2的复制特征。本发明的另外一个潜在应用是:可以根据流行毒株的突变特点,人为地在复制子系统进行点突变,进而检测评估该流行突变对病毒复制的影响,这对新型冠状病毒SARS-CoV-2的分子流行病学监测有积极意义。
附图说明
图1新型冠状病毒SARS-CoV-2的基因组组成示意图。
图2新型冠状病毒SARS-CoV-2的nsp1-nsp16蛋白功能示意图。
图3新型冠状病毒SARS-CoV-2的病毒结构示意图。
图4新型冠状病毒SARS-CoV-2的复制过程示意图。
图5构建的ps2V,ps2AN,ps2AC,ps2B载体的分子的结构示意图。
图6新型冠状病毒SARS-CoV-2安全复制子系统的工作原理。
图7 pcDNA3.1质粒图谱。
图8新型冠状病毒SARS-CoV-2安全复制子转染后GFP表达情况。
图9 ps2V,ps2AN,ps2AC,ps2B载体转染HEK 293T细胞荧光素酶活性随时间变化情况。
图10利用新型冠状病毒SARS-CoV-2安全复制子系统验证瑞德西韦(Remdesivir)的抑制效果。
图11利用新型冠状病毒SARS-CoV-2安全复制子系统验证洛匹那韦(Lopinavir)的抑制效果。
图12利用新型冠状病毒SARS-CoV-2安全复制子系统验证利托那韦(Ritonavir)的抑制效果。
图13利用新型冠状病毒SARS-CoV-2安全复制子系统,检测M01,A01,R01对病毒RNA复制的抑制效果。(A)M01;(B)A01;(C)R01。
图14 M01,A01,R01对野生型SARS-CoV-2的抑制效果。(A)M01;(B)A01;(C)R01。
图15病毒分子进化学研究示意图。
图16 5’UTR_241T_ps2V与5’UTR_241C_ps2V的荧光素酶检测结果。
具体实施方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例结合附图详细说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(NewYork:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用化学试剂,均为市售产品。
新型冠状病毒的基因组组成如附图1所示。其中5’UTR和3’UTR是非编码区域,和病毒的复制和转录相关。rep1a和rep1b编码nsp1-nsp16,这16个蛋白成熟后形成病毒的转录酶/复制酶复合体。其中nsp3表达出的蛋白酶可切割nsp1-nsp4蛋白nsp5表达出的蛋白酶可切割nsp5-nsp16蛋白,nsp1-nsp16的功能示意图如附图2所示。此外,除了5’UTR、3’UTR、rep1a和rep1b外,新型冠状病毒的基因组还具有编码N,S,E,M蛋白的序列(见附图1),N,S,E,M编码病毒的结构蛋白,形成病毒颗粒(如附图3所示)。其余ORF3a,ORF7a,ORF8,ORF6,ORF10,编码辅助蛋白(accessory protein),目前功能并不明确。
新冠病毒SARS-CoV-2通过ACE2受体进入细胞后:
1.rep1a-rep1b首先转录翻译出nsp1-nsp16蛋白,形成复合体(double-membranevesicles),病毒只能在该复合体内进行RNA的合成(RNA的复制和转录)。
2.病毒RNA在上述复合体里(double-membrane vesicles)发生两个生物过程:a.转录(Transcription):就是合成病毒的sub-genomic RNA(区别于病毒基因组RNA中的一小段RNA/亚基因组RNA),这个过程依赖于nsp1-nsp16蛋白的参与以及病毒基因组中的5’UTR序列,3’UTR序列,以及转录调控区域TRS序列。刚转录出的sub-genomic RNA是负链,复制转化为正链后,各subgenomic RNA表达结构蛋白N,S,E,M包裹基因组RNA,出胞形成病毒颗粒。
b.复制(Replication):基因组RNA及sub-genomic RNA可以在双层膜囊泡(double-membrane vesicles)进行复制-就是说从负链RNA和正链RNA互相转换,增加RNA的拷贝量,新型冠状病毒SARS-CoV-2的复制过程示意图见附图4。
新型冠状病毒SARS-CoV-2的原始序列,基于SARS-CoV-2Wuhan-Hu-1(Genbank:NC_045512.2)序列。
实施例1复制子的构建
发明人的团队基于新型冠状病毒的基因组组成以及病毒RNA合成(复制和转录过程)原理过程,创造性地构建出一种新型冠状病毒SARS-CoV-2的安全型复制子,包括以下两种表达结构:
(Ⅰ)编码新型冠状病毒SARS-CoV-2的非结构蛋白;
(Ⅱ)新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因。
(Ⅰ)中编码新型冠状病毒SARS-CoV-2的非结构蛋白为编码nsp1-nsp16蛋白序列的表达载体。
新型冠状病毒的基因组中rep1a和rep1b的序列共20000bp左右,约占病毒基因组的2/3。出于转染及表达效率的考虑,以及nsp1-nsp16的各蛋白在转录复合体中发挥的作用,将编码nsp1-nsp16蛋白的核苷酸序列进行密码子优化后,分别插入3个表达载体中,分别命名为ps2AN,ps2AC,ps2B。
经过密码子优化后,nsp1的核苷酸序列如SEQ ID No.1所示:
ATGGAGTCCCTGGTGCCCGGCTTCAACGAGAAGACCCACGTGCAGCTGTCTCTGCCTGTGCTGCAGGTGAGGGATGTGCTGGTGCGCGGCTTTGGCGACTCCGTCGAGGAGGTGCTGTCTGAGGCCAGGCAGCACCTGAAGGACGGAACCTGCGGACTGGTGGAGGTGGAGAAGGGCGTGCTGCCACAGCTGGAGCAGCCTTACGTGTTCATCAAGAGGTCCGATGCAAGGACAGCACCACACGGACACGTGATGGTGGAGCTGGTGGCCGAGCTGGAGGGCATCCAGTATGGCCGCTCTGGAGAGACCCTGGGCGTGCTGGTGCCACACGTGGGAGAGATCCCAGTGGCCTATCGGAAGGTGCTGCTGAGAAAGAACGGCAATAAGGGAGCAGGAGGACACTCTTACGGAGCAGACCTGAAGAGCTTCGATCTGGGCGACGAGCTGGGCACCGATCCTTATGAGGACTTTCAGGAGAACTGGAATACAAAGCACAGCTCCGGCGTGACCCGGGAGCTGATGAGAGAGCTGAACGGCGGC(SEQ ID No.1)。
nsp2的核苷酸序列如SEQ ID No.2所示:
GCCTACACCAGATATGTGGATAACAATTTCTGCGGACCAGACGGATACCCCCTGGAGTGTATCAAGGATCTGCTGGCCAGAGCAGGCAAGGCCTCCTGCACCCTGTCTGAGCAGCTGGACTTCATCGACACAAAGCGGGGCGTGTATTGCTGTAGAGAGCACGAGCACGAGATCGCCTGGTATACCGAGCGGTCCGAGAAGTCTTACGAGCTGCAGACACCATTCGAGATCAAGCTGGCCAAGAAGTTCGACACCTTCAACGGCGAGTGTCCAAACTTCGTGTTTCCCCTGAATAGCATCATCAAGACCATCCAGCCCAGAGTGGAGAAGAAGAAGCTGGATGGCTTTATGGGCAGGATCCGCAGCGTGTACCCTGTGGCCTCCCCAAACGAGTGCAATCAGATGTGCCTGTCCACACTGATGAAGTGCGATCACTGTGGCGAGACCTCTTGGCAGACAGGCGACTTCGTGAAGGCCACCTGCGAGTTTTGTGGCACCGAGAACCTGACAAAGGAGGGCGCCACCACATGCGGCTATCTGCCTCAGAATGCCGTGGTGAAGATCTACTGCCCAGCCTGTCACAACTCCGAAGTGGGACCAGAGCACTCTCTGGCCGAGTACCACAATGAGTCCGGCCTGAAGACAATCCTGAGGAAGGGAGGAAGGACCATCGCCTTCGGCGGATGCGTGTTTTCTTATGTGGGCTGCCACAACAAGTGTGCATACTGGGTGCCAAGGGCCAGCGCCAATATCGGCTGTAACCACACCGGAGTGGTGGGAGAGGGATCCGAGGGCCTGAACGATAATCTGCTGGAGATCCTGCAGAAGGAGAAGGTGAACATCAATATCGTGGGCGACTTCAAGCTGAACGAGGAGATCGCCATCATCCTGGCCTCCTTCTCTGCCAGCACATCCGCCTTTGTGGAGACCGTGAAGGGCCTGGACTACAAGGCCTTCAAGCAGATCGTGGAGAGCTGCGGCAACTTCAAGGTGACCAAGGGCAAGGCCAAGAAGGGCGCCTGGAACATCGGCGAGCAGAAGAGCATCCTGTCCCCTCTGTATGCCTTCGCCAGCGAGGCAGCAAGGGTGGTGAGATCTATCTTTAGCCGGACCCTGGAGACAGCCCAGAATTCCGTGAGAGTGCTGCAGAAGGCCGCCATCACCATCCTGGATGGCATCTCCCAGTACTCTCTGAGGCTGATCGATGCCATGATGTTCACCTCCGACCTGGCCACAAACAATCTGGTGGTCATGGCCTACATCACCGGCGGCGTGGTGCAGCTGACCTCTCAGTGGCTGACAAACATCTTTGGCACCGTGTATGAGAAGCTGAAGCCAGTGCTGGATTGGCTGGAGGAGAAGTTCAAGGAGGGCGTGGAGTTTCTGCGCGACGGCTGGGAGATCGTGAAGTTCATCAGCACCTGCGCATGTGAGATCGTGGGAGGACAGATCGTGACCTGTGCCAAGGAGATCAAGGAGTCCGTGCAGACATTCTTTAAGCTGGTGAACAAGTTCCTGGCCCTGTGCGCCGACTCTATCATCATCGGCGGCGCCAAGCTGAAGGCCCTGAACCTGGGCGAGACCTTTGTGACACACAGCAAGGGCCTGTACAGGAAGTGCGTGAAGTCCCGCGAGGAGACCGGACTGCTGATGCCCCTGAAGGCACCTAAGGAGATCATCTTCCTGGAGGGCGAGACCCTGCCCACAGAGGTGCTGACAGAGGAGGTGGTGCTGAAGACCGGCGACCTGCAGCCACTGGAGCAGCCCACCAGCGAGGCAGTGGAGGCACCTCTGGTGGGCACACCAGTGTGCATCAATGGCCTGATGCTGCTGGAGATCAAGGATACCGAGAAGTACTGTGCCCTGGCCCCTAACATGATGGTGACAAACAATACCTTCACACTGAAGGGCGGC(SEQ ID No.2)。
nsp3的核苷酸序列如SEQ ID No.3所示:
GCCCCAACCAAGGTGACATTTGGCGACGATACCGTGATCGAGGTGCAGGGCTACAAGTCTGTGAATATCACATTCGAGCTGGATGAGAGAATCGACAAGGTGCTGAACGAGAAGTGCAGCGCCTATACAGTGGAGCTGGGCACCGAGGTGAACGAGTTTGCCTGCGTGGTGGCCGACGCCGTGATCAAGACCCTGCAGCCAGTGTCCGAGCTGCTGACACCCCTGGGCATCGATCTGGACGAGTGGTCTATGGCCACCTACTATCTGTTCGACGAGAGCGGCGAGTTTAAGCTGGCCTCCCACATGTACTGCTCTTTCTATCCCCCTGATGAAGACGAGGAGGAGGGCGATTGCGAGGAGGAGGAGTTTGAGCCCAGCACACAGTACGAGTATGGCACCGAGGACGATTACCAGGGCAAGCCACTGGAGTTCGGAGCCACCTCCGCCGCCCTGCAGCCAGAGGAGGAGCAGGAGGAGGATTGGCTGGACGATGACTCCCAGCAGACCGTGGGCCAGCAGGATGGCTCTGAGGACAATCAGACCACAACCATCCAGACAATCGTGGAGGTGCAGCCTCAGCTGGAGATGGAGCTGACCCCAGTGGTGCAGACCATCGAGGTGAACTCTTTCAGCGGCTATCTGAAGCTGACAGATAACGTGTACATCAAGAACGCCGACATTGTGGAGGAGGCCAAGAAGGTGAAGCCTACCGTGGTGGTGAACGCCGCCAACGTGTACCTGAAGCACGGAGGAGGAGTGGCAGGCGCCCTGAACAAGGCCACCAACAATGCCATGCAGGTGGAGAGCGATGACTATATCGCCACAAATGGACCCCTGAAGGTCGGAGGAAGCTGCGTGCTGTCCGGACACAACCTGGCCAAGCACTGTCTGCACGTGGTGGGCCCTAACGTGAATAAGGGCGAGGACATCCAGCTGCTGAAGTCCGCCTACGAGAACTTCAATCAGCACGAGGTGCTGCTGGCCCCTCTGCTGAGCGCCGGCATCTTTGGCGCCGATCCAATCCACTCCCTGAGGGTGTGCGTGGACACCGTGCGCACAAACGTGTACCTGGCCGTGTTCGATAAGAACCTGTACGACAAGCTGGTGTCTAGCTTTCTGGAGATGAAGAGCGAGAAGCAGGTGGAGCAGAAGATCGCCGAGATCCCTAAGGAGGAGGTGAAGCCATTCATCACCGAGAGCAAGCCTTCCGTGGAGCAGAGGAAGCAGGATGACAAGAAGATCAAGGCCTGCGTGGAGGAGGTGACAACCACACTGGAGGAGACCAAGTTCCTGACAGAGAACCTGCTGCTGTACATCGATATCAACGGCAATCTGCACCCAGACAGCGCCACACTGGTGTCCGATATCGACATCACCTTTCTGAAGAAGGATGCCCCATATATCGTGGGCGACGTGGTGCAGGAGGGCGTGCTGACAGCCGTGGTCATCCCCACCAAGAAGGCCGGCGGCACCACAGAGATGCTGGCCAAGGCCCTGCGCAAGGTGCCTACCGACAATTACATCACCACATATCCAGGCCAGGGCCTGAACGGCTATACCGTGGAGGAGGCCAAGACCGTGCTGAAGAAGTGCAAGAGCGCCTTCTACATCCTGCCTTCTATCATCAGCAATGAGAAGCAGGAGATCCTGGGCACCGTGTCCTGGAACCTGAGGGAGATGCTGGCCCACGCCGAGGAGACACGCAAGCTGATGCCCGTGTGCGTGGAGACAAAGGCCATCGTGAGCACCATCCAGCGGAAGTATAAGGGCATCAAGATCCAGGAGGGAGTGGTGGACTACGGAGCAAGATTCTACTTTTATACCTCTAAGACCACAGTGGCCAGCCTGATCAACACACTGAATGATCTGAACGAGACCCTGGTGACAATGCCCCTGGGCTATGTGACCCACGGCCTGAATCTGGAGGAGGCCGCCAGGTACATGCGCTCCCTGAAGGTGCCAGCAACCGTGAGCGTGAGCTCTCCTGACGCCGTGACAGCCTACAACGGCTATCTGACAAGCTCCTCTAAGACCCCAGAGGAGCACTTCATCGAGACCATCTCTCTGGCCGGCAGCTATAAGGATTGGTCCTACTCTGGCCAGTCCACACAGCTGGGCATCGAGTTTCTGAAGAGGGGCGACAAGAGCGTGTACTATACCAGCAATCCCACCACATTCCACCTGGATGGCGAAGTGATCACCTTCGACAACCTGAAGACCCTGCTGAGCCTGCGGGAGGTGAGAACCATCAAGGTGTTCACCACAGTGGATAACATCAATCTGCACACACAGGTGGTGGACATGTCCATGACCTATGGCCAGCAGTTTGGCCCAACATACCTGGATGGCGCCGACGTGACCAAGATCAAGCCCCACAATAGCCACGAGGGCAAGACATTCTACGTGCTGCCTAATGCCACCAACTTTTCCCTGCTGAAGCAGGCAGGCGACGTGGAGGAGAACCCAGGACCAGATGACACCCTGAGGGTGGAGGCCTTCGAGTACTATCACACCACAGATCCTAGCTTTCTGGGCCGCTATATGTCCGCCCTGAATCACACCAAGAAGTGGAAGTACCCACAGGTGAACGGCCTGACAAGCATCAAGTGGGCCGACAACAATTGCTACCTGGCCACCGCCCTGCTGACACTGCAGCAGATCGAGCTGAAGTTCAACCCACCCGCCCTGCAGGATGCATACTATAGGGCAAGAGCAGGAGAGGCAGCCAATTTTTGCGCCCTGATCCTGGCCTATTGTAACAAGACCGTGGGAGAGCTGGGCGATGTGCGGGAGACAATGAGCTACCTGTTCCAGCACGCCAATCTGGACTCCTGCAAGAGAGTGCTGAACGTGGTGTGCAAGACATGTGGCCAGCAGCAGACCACACTGAAGGGCGTGGAGGCCGTGATGTATATGGGCACCCTGAGCTACGAGCAGTTTAAGAAGGGCGTGCAGATCCCCTGCACATGTGGCAAGCAGGCCACCAAGTACCTGGTGCAGCAGGAGTCCCCTTTCGTGATGATGTCTGCCCCTCCAGCCCAGTATGAGCTGAAGCACGGCACCTTTACATGCGCCTCTGAGTACACCGGCAATTATCAGTGTGGCCACTATAAGCACATCACCAGCAAGGAGACACTGTACTGCATCGATGGCGCCCTGCTGACCAAGAGCTCCGAGTACAAGGGCCCCATCACAGACGTGTTCTATAAGGAGAATTCTTACACCACAACCATCGCCACCAACTTTAGCCTGCTGAAGCAGGCCGGCGATGTGGAGGAGAACCCTGGACCAAAGCCCGTGACCTATAAGCTGGACGGCGTGGTGTGCACAGAGATCGATCCTAAGCTGGACAACTACTACAAGAAGGATAACTCTTATTTCACCGAGCAGCCCATCGACCTGGTGCCTAATCAGCCTTACCCAAACGCCAGCTTCGATAATTTCAAGTTCGTGTGCGACAATATCAAGTTTGCCGATGACCTGAACCAGCTGACCGGATACAAGAAGCCAGCCAGCCGGGAGCTGAAGGTGACATTCTTTCCTGATCTGAACGGCGACGTGGTGGCCATCGACTACAAGCACTATACACCTTCCTTCAAGAAGGGCGCCAAGCTGCTGCACAAGCCAATCGTGTGGCACGTGAACAATGCCACCAATAAGGCCACATACAAGCCAAACACCTGGTGCATCAGATGTCTGTGGTCTACAAAGCCCGTGGAGACCAGCAATTCCTTTGATGTGCTGAAGAGCGAGGATGCCCAGGGCATGGACAACCTGGCCTGCGAGGACCTGAAGCCCGTGAGCGAGGAGGTGGTGGAGAATCCTACCATCCAGAAGGATGTGCTGGAGTGTAACGTGAAGACAACCGAGGTGGTGGGCGACATCATCCTGAAGCCTGCCAACAATTCCCTGAAGATCACAGAGGAAGTGGGCCACACCGATCTGATGGCCGCCTACGTGGACAATTCTAGCCTGACCATCAAGAAGCCAAACGAGCTGAGCAGGGTGCTGGGCCTGAAGACCCTGGCCACACACGGCCTGGCCGCAGTGAATTCCGTGCCATGGGACACCATCGCCAATTATGCCAAGCCCTTCCTGAACAAGGTGGTGAGCACAACCACAAACATCGTGACACGGTGCCTGAACCGGGTGTGCACCAATTACATGCCATATTTCTTTACACTGCTGCTGCAGCTGTGCACCTTTACAAGGTCCACCAATTCTCGCATCAAGGCCTCCATGCCCACCACAATCGCCAAGAACACAGTGAAGAGCGTGGGCAAGTTCTGCCTGGAGGCCTCCTTTAACTACCTGAAGTCCCCCAATTTCTCTAAGCTGATCAACATCATCATCTGGTTTCTGCTGCTGAGCGTGTGCCTGGGCAGCCTGATCTATTCCACAGCCGCCCTGGGCGTGCTGATGAGCAACCTGGGCATGCCTTCCTACTGCACCGGCTATCGGGAGGGCTACCTGAATAGCACCAACGTGACAATCGCCACCTACTGTACAGGCTCTATCCCATGCAGCGTGTGCCTGTCCGGCCTGGATTCTCTGGACACCTATCCTTCCCTGGAGACCATCCAGATCACAATCTCCTCTTTCAAGTGGGACCTGACCGCCTTTGGCCTGGTGGCAGAGTGGTTCCTGGCCTATATCCTGTTTACAAGATTCTTTTACGTGCTGGGCCTGGCCGCCATCATGCAGCTGTTCTTTAGCTACTTCGCCGTGCACTTTATCTCTAATAGCTGGCTGATGTGGCTGATCATCAACCTGGTGCAGATGGCCCCCATCTCCGCCATGGTGAGGATGTATATCTTCTTTGCCTCTTTCTACTACGTGTGGAAGAGCTACGTGCACGTGGTGGACGGCTGCAATAGCTCCACCTGCATGATGTGCTACAAGAGGAACCGCGCCACACGCGTGGAGTGTACCACAATCGTGAATGGCGTGCGGAGAAGCTTCTACGTGTATGCCAACGGCGGCAAGGGCTTTTGCAAGCTGCACAACTGGAATTGCGTGAACTGTGATACATTCTGTGCCGGCAGCACCTTTATCTCCGATGAGGTGGCAAGGGACCTGTCCCTGCAGTTCAAGAGACCAATCAATCCCACCGATCAGTCTAGCTACATCGTGGACTCCGTGACAGTGAAGAACGGCTCTATCCACCTGTATTTCGATAAGGCCGGCCAGAAGACATACGAGAGGCACTCCCTGTCTCACTTTGTGAATCTGGACAACCTGCGCGCCAACAATACCAAGGGCAGCCTGCCCATCAACGTGATCGTGTTCGATGGCAAGTCCAAGTGCGAGGAGTCCTCTGCCAAGAGCGCCTCCGTGTACTATAGCCAGCTGATGTGCCAGCCTATCCTGCTGCTGGACCAGGCCCTGGTGTCCGATGTGGGCGACTCTGCCGAGGTGGCAGTGAAGATGTTTGATGCCTACGTGAATACCTTCAGCAGCACCTTCAACGTGCCAATGGAGAAGCTGAAGACCCTGGTGGCAACAGCAGAGGCAGAGCTGGCCAAGAACGTGTCCCTGGACAATGTGCTGTCTACCTTCATCAGCGCCGCCCGCCAGGGCTTTGTGGATTCTGACGTGGAGACAAAGGATGTGGTGGAGTGCCTGAAGCTGAGCCACCAGTCCGATATCGAGGTGACCGGCGACAGCTGTAACAATTATATGCTGACCTACAATAAGGTGGAGAACATGACACCCCGGGATCTGGGCGCCTGCATCGACTGTTCTGCCAGACACATCAATGCCCAGGTGGCCAAGAGCCACAATATCGCCCTGATCTGGAACGTGAAGGACTTCATGTCTCTGAGCGAGCAGCTGAGGAAGCAGATCCGCTCCGCCGCCAAGAAGAACAATCTGCCCTTCAAGCTGACCTGCGCCACCACAAGGCAGGTGGTGAACGTGGTCACCACAAAGATCGCCCTGAAGGGCGGC(SEQ ID No.3)。
nsp4的核苷酸序列如SEQ ID No.4所示:
AAGATCGTGAACAATTGGCTGAAGCAGCTGATCAAGGTGACCCTGGTGTTCCTGTTTGTGGCCGCCATCTTCTACCTGATCACCCCCGTGCACGTGATGTCTAAGCACACAGATTTTTCTAGCGAGATCATCGGCTATAAGGCCATCGACGGAGGAGTGACCAGGGATATCGCCAGCACCGACACATGCTTCGCCAATAAGCACGCCGATTTCGACACCTGGTTTAGCCAGAGGGGCGGCTCCTACACAAACGACAAGGCCTGTCCACTGATCGCAGCCGTGATCACCAGGGAAGTGGGATTCGTGGTGCCTGGACTGCCAGGAACAATCCTGAGGACCACAAATGGCGACTTCCTGCACTTTCTGCCTCGCGTGTTTTCCGCCGTGGGCAACATCTGCTATACCCCATCTAAGCTGATCGAGTACACCGATTTCGCCACATCCGCCTGCGTGCTGGCCGCAGAGTGTACCATCTTTAAGGATGCCTCTGGCAAGCCCGTGCCTTACTGTTATGACACAAATGTGCTGGAGGGCTCTGTGGCCTATGAGAGCCTGCGGCCAGATACCAGATACGTGCTGATGGACGGCAGCATCATCCAGTTCCCCAACACATATCTGGAGGGCTCTGTGCGGGTGGTGACCACATTTGACAGCGAGTACTGCCGGCACGGCACCTGTGAGAGATCTGAGGCCGGCGTGTGCGTGTCCACATCTGGCAGGTGGGTGCTGAACAATGATTACTATCGCAGCCTGCCTGGCGTGTTCTGTGGCGTGGACGCCGTGAATCTGCTGACCAACATGTTTACACCTCTGATCCAGCCAATCGGCGCCCTGGATATCAGCGCCTCCATCGTGGCAGGAGGAATCGTGGCAATCGTGGTGACATGCCTGGCCTACTATTTCATGCGGTTCCGGAGGGCCTTCGGCGAGTACTCTCACGTGGTGGCCTTTAATACCCTGCTGTTCCTGATGAGCTTCACCGTGCTGTGCCTGACCCCCGTGTATAGCTTCCTGCCTGGCGTGTACTCCGTGATCTACCTGTATCTGACCTTCTACCTGACAAACGACGTGAGCTTTCTGGCCCACATCCAGTGGATGGTCATGTTCACCCCCCTGGTGCCTTTTTGGATCACAATCGCCTATATCATCTGCATCTCCACCAAGCACTTCTATTGGTTCTTTTCTAATTACCTGAAGCGGAGAGTGGTGTTTAACGGCGTGTCTTTCAGCACCTTTGAGGAGGCCGCCCTGTGCACATTCCTGCTGAACAAGGAGATGTACCTGAAGCTGCGGTCCGACGTGCTGCTGCCACTGACCCAGTACAATAGATATCTGGCCCTGTATAACAAGTACAAGTATTTCTCTGGCGCCATGGATACCACAAGCTACAGAGAGGCAGCATGCTGTCACCTGGCAAAGGCCCTGAATGATTTTTCCAACTCTGGCAGCGACGTGCTGTACCAGCCCCCTCAGACCTCTATCACAAGCGCCGTGCTGCAGTAA(SEQ IDNo.4)。
nsp5的核苷酸序列如SEQ ID No.5所示:
AGTGGTTTTAGAAAAATGGCATTCCCATCTGGTAAAGTTGAGGGTTGTATGGTACAAGTAACTTGTGGTACAACTACACTTAACGGTCTTTGGCTTGATGACGTAGTTTACTGTCCAAGACATGTGATCTGCACCTCTGAAGACATGCTTAACCCTAATTATGAAGATTTACTCATTCGTAAGTCTAATCATAATTTCTTGGTACAGGCTGGTAATGTTCAACTCAGGGTTATTGGACATTCTATGCAAAATTGTGTACTTAAGCTTAAGGTTGATACAGCCAATCCTAAGACACCTAAGTATAAGTTTGTTCGCATTCAACCAGGACAGACTTTTTCAGTGTTAGCTTGTTACAATGGTTCACCATCTGGTGTTTACCAATGTGCTATGAGGCCCAATTTCACTATTAAGGGTTCATTCCTTAATGGTTCATGTGGTAGTGTTGGTTTTAACATAGATTATGACTGTGTCTCTTTTTGTTACATGCACCATATGGAATTACCAACTGGAGTTCATGCTGGCACAGACTTAGAAGGTAACTTTTATGGACCTTTTGTTGACAGGCAAACAGCACAAGCAGCTGGTACGGACACAACTATTACAGTTAATGTTTTAGCTTGGTTGTACGCTGCTGTTATAAATGGAGACAGGTGGTTTCTCAATCGATTTACCACAACTCTTAATGACTTTAACCTTGTGGCTATGAAGTACAATTATGAACCTCTAACACAAGACCATGTTGACATACTAGGACCTCTTTCTGCTCAAACTGGAATTGCCGTTTTAGATATGTGTGCTTCATTAAAAGAATTACTGCAAAATGGTATGAATGGACGTACCATATTGGGTAGTGCTTTATTAGAAGATGAATTTACACCTTTTGATGTTGTTAGACAATGCTCAGGTGTTACTTTCCAA(SEQ ID No.5)。
nsp6的核苷酸序列如SEQ ID No.6所示:
AGTGCAGTGAAAAGAACAATCAAGGGTACACACCACTGGTTGTTACTCACAATTTTGACTTCACTTTTAGTTTTAGTCCAGAGTACTCAATGGTCTTTGTTCTTTTTTTTGTATGAAAATGCCTTTTTACCTTTTGCTATGGGTATTATTGCTATGTCTGCTTTTGCAATGATGTTTGTCAAACATAAGCATGCATTTCTCTGTTTGTTTTTGTTACCTTCTCTTGCCACTGTAGCTTATTTTAATATGGTCTATATGCCTGCTAGTTGGGTGATGCGTATTATGACATGGTTGGATATGGTTGATACTAGTTTGTCTGGTTTTAAGCTAAAAGACTGTGTTATGTATGCATCAGCTGTAGTGTTACTAATCCTTATGACAGCAAGAACTGTGTATGATGATGGTGCTAGGAGAGTGTGGACACTTATGAATGTCTTGACACTCGTTTATAAAGTTTATTATGGTAATGCTTTAGATCAAGCCATTTCCATGTGGGCTCTTATAATCTCTGTTACTTCTAACTACTCAGGTGTAGTTACAACTGTCATGTTTTTGGCCAGAGGTATTGTTTTTATGTGTGTTGAGTATTGCCCTATTTTCTTCATAACTGGTAATACACTTCAGTGTATAATGCTAGTTTATTGTTTCTTAGGCTATTTTTGTACTTGTTACTTTGGCCTCTTTTGTTTACTCAACCGCTACTTTAGACTGACTCTTGGTGTTTATGATTACTTAGTTTCTACACAGGAGTTTAGATATATGAATTCACAGGGACTACTCCCACCCAAGAATAGCATAGATGCCTTCAAACTCAACATTAAATTGTTGGGTGTTGGTGGCAAACCTTGTATCAAAGTAGCCACTGTACAG(SEQ ID No.6)。
nsp7的核苷酸序列如SEQ ID No.7所示:
TCTAAAATGTCAGATGTAAAGTGCACATCAGTAGTCTTACTCTCAGTTTTGCAACAACTCAGAGTAGAATCATCATCTAAATTGTGGGCTCAATGTGTCCAGTTACACAATGACATTCTCTTAGCTAAAGATACTACTGAAGCCTTTGAAAAAATGGTTTCACTACTTTCTGTTTTGCTTTCCATGCAGGGTGCTGTAGACATAAACAAGCTTTGTGAAGAAATGCTGGACAACAGGGCAACCTTACAA(SEQ ID No.7)。
nsp8的核苷酸序列如SEQ ID No.8所示:
GCTATAGCCTCAGAGTTTAGTTCCCTTCCATCATATGCAGCTTTTGCTACTGCTCAAGAAGCTTATGAGCAGGCTGTTGCTAATGGTGATTCTGAAGTTGTTCTTAAAAAGTTGAAGAAGTCTTTGAATGTGGCTAAATCTGAATTTGACCGTGATGCAGCCATGCAACGTAAGTTGGAAAAGATGGCTGATCAAGCTATGACCCAAATGTATAAACAGGCTAGATCTGAGGACAAGAGGGCAAAAGTTACTAGTGCTATGCAGACAATGCTTTTCACTATGCTTAGAAAGTTGGATAATGATGCACTCAACAACATTATCAACAATGCAAGAGATGGTTGTGTTCCCTTGAACATAATACCTCTTACAACAGCAGCCAAACTAATGGTTGTCATACCAGACTATAACACATATAAAAATACGTGTGATGGTACAACATTTACTTATGCATCAGCATTGTGGGAAATCCAACAGGTTGTAGATGCAGATAGTAAAATTGTTCAACTTAGTGAAATTAGTATGGACAATTCACCTAATTTAGCATGGCCTCTTATTGTAACAGCTTTAAGGGCCAATTCTGCTGTCAAATTACAG(SEQ IDNo.8)。
nsp9的核苷酸序列如SEQ ID No.9所示:
AATAATGAGCTTAGTCCTGTTGCACTACGACAGATGTCTTGTGCTGCCGGTACTACACAAACTGCTTGCACTGATGACAATGCGTTAGCTTACTACAACACAACAAAGGGAGGTAGGTTTGTACTTGCACTGTTATCCGATTTACAGGATTTGAAATGGGCTAGATTCCCTAAGAGTGATGGAACTGGTACTATCTATACAGAACTGGAACCACCTTGTAGGTTTGTTACAGACACACCTAAAGGTCCTAAAGTGAAGTATTTATACTTTATTAAAGGATTAAACAACCTAAATAGAGGTATGGTACTTGGTAGTTTAGCTGCCACAGTACGTCTACAA(SEQ ID No.9)。
nsp10的核苷酸序列如SEQ ID No.10所示:
GCTGGTAATGCAACAGAAGTGCCTGCCAATTCAACTGTATTATCTTTCTGTGCTTTTGCTGTAGATGCTGCTAAAGCTTACAAAGATTATCTAGCTAGTGGGGGACAACCAATCACTAATTGTGTTAAGATGTTGTGTACACACACTGGTACTGGTCAGGCAATAACAGTTACACCGGAAGCCAATATGGATCAAGAATCCTTTGGTGGTGCATCGTGTTGTCTGTACTGCCGTTGCCACATAGATCATCCAAATCCTAAAGGATTTTGTGACTTAAAAGGTAAGTATGTACAAATACCTACAACTTGTGCTAATGACCCTGTGGGTTTTACACTTAAAAACACAGTCTGTACCGTCTGCGGTATGTGGAAAGGTTATGGCTGTAGTTGTGATCAACTCCGCGAACCCATGCTTCAG(SEQ ID No.10)。
nsp11的核苷酸序列如SEQ ID No.11所示:
TCAGCTGATGCACAATCGTTTTTAAACGGGTTTGCGGTG(SEQ ID No.11)。
nsp12的核苷酸序列如SEQ ID No.12所示:
ATGTCAGCAGATGCACAATCATTTCTTAACAGAGTGTGCGGAGTGTCAGCAGCAAGACTTACACCTTGCGGAACAGGAACATCAACAGATGTAGTTTATAGGGCCTTCGATATCTACAACGATAAAGTGGCAGGATTTGCAAAGTTCTTAAAGACCAATTGCTGCAGATTTCAAGAGAAGGACGAGGATGATAACCTTATCGATTCATACTTTGTGGTGAAGAGGCATACATTCAGCAATTACCAACACGAAGAAACAATCTACAACCTTCTTAAAGATTGCCCTGCAGTGGCAAAGCATGACTTCTTCAAGTTCAGAATCGATGGAGATATGGTGCCTCACATCTCAAGACAAAGACTTACAAAGTATACGATGGCAGATCTCGTTTATGCGTTGCGCCATTTCGACGAGGGTAATTGTGACACCCTGAAGGAGATCCTGGTCACGTATAATTGCTGCGATGATGATTACTTTAACAAGAAGGACTGGTATGATTTCGTAGAGAATCCTGACATTCTTAGAGTGTACGCAAACCTTGGAGAAAGAGTGAGACAAGCACTCCTAAAGACAGTTCAATTCTGCGACGCAATGAGAAACGCAGGAATCGTGGGAGTGCTTACACTTGATAACCAAGATCTTAACGGAAACTGGTATGACTTTGGCGACTTTATACAGACAACACCTGGATCAGGAGTGCCTGTGGTGGATTCATATTATAGCCTGCTGATGCCTATCCTTACACTTACAAGAGCACTTACAGCAGAATCACATGTGGATACCGACTTGACCAAACCCTATATTAAATGGGATCTGCTGAAATATGACTTTACAGAAGAACGACTTAAACTCTTCGACAGATACTTTAAATACTGGGATCAAACATACCACCCTAACTGCGTGAACTGCCTTGATGATAGATGCATCCTTCACTGCGCAAACTTTAACGTGCTGTTCTCGACCGTGTTTCCTCCTACATCATTTGGACCTCTTGTGAGAAAGATCTTTGTGGACGGAGTACCTTTCGTCGTATCAACAGGATACCACTTTAGAGAACTTGGAGTAGTGCATAATCAAGATGTGAACCTACATTCTAGCCGATTATCATTTAAAGAACTTCTGGTTTATGCCGCGGACCCTGCAATGCACGCAGCAAGTGGCAATTTATTACTTGACAAACGGACAACCTGTTTCTCGGTTGCCGCACTTACAAACAATGTAGCTTTCCAGACCGTAAAGCCAGGGAATTTCAACAAAGATTTCTATGACTTCGCCGTATCAAAGGGATTCTTCAAGGAGGGATCATCAGTGGAACTTAAACACTTCTTCTTCGCCCAGGATGGAAACGCAGCAATCTCAGATTACGATTACTACAGATACAACCTTCCTACAATGTGCGATATCAGACAACTTCTCTTCGTAGTTGAAGTGGTGGATAAATACTTTGATTGCTACGATGGAGGATGCATCAACGCAAACCAAGTGATCGTGAACAACTTGGATAAATCCGCTGGATTCCCGTTTAATAAGTGGGGTAAAGCCCGCCTTTACTACGATTCAATGTCATACGAAGATCAAGATGCATTATTCGCTTATACAAAGAGGAATGTGATCCCTACAATCACACAAATGAACCTTAAATACGCAATCTCAGCAAAGAATCGAGCAAGAACAGTGGCAGGAGTGTCAATCTGCTCAACAATGACAAACAGACAATTTCACCAGAAGCTCCTGAAATCAATCGCAGCAACAAGAGGAGCAACAGTGGTGATCGGAACATCAAAGTTCTATGGAGGTTGGCACAACATGCTCAAGACCGTGTATAGCGATGTTGAGAATCCGCATCTCATGGGATGGGATTACCCTAAATGCGATAGAGCTATGCCCAATATGCTGAGAATCATGGCATCACTTGTGCTTGCAAGAAAGCATACCACATGCTGCTCACTTTCACACAGATTCTATCGACTTGCAAACGAATGCGCACAGGTCCTCTCCGAGATGGTGATGTGCGGCGGGAGCTTGTATGTGAAACCAGGTGGAACATCATCAGGAGATGCAACAACAGCATACGCAAACTCAGTGTTTAACATCTGCCAAGCAGTGACAGCTAATGTAAACGCTCTCTTGAGCACTGACGGAAACAAGATAGCCGATAAATACGTGCGTAATCTGCAGCATCGACTTTACGAATGCCTTTACAGAAACAGAGATGTAGACACGGACTTTGTAAATGAATTCTATGCTTACCTTAGAAAGCATTTCTCCATGATGATACTGAGTGACGATGCTGTTGTATGTTTCAACTCAACATACGCATCACAAGGACTTGTGGCATCAATCAAGAATTTCAAATCAGTGCTTTACTACCAGAATAATGTGTTTATGTCAGAAGCAAAGTGTTGGACAGAAACTGACCTCACTAAGGGCCCTCACGAGTTCTGTAGCCAACACACAATGCTTGTGAAACAAGGAGATGACTATGTTTATCTCCCATACCCTGATCCTTCAAGAATCTTGGGTGCAGGGTGTTTCGTGGATGATATCGTGAAGACTGACGGAACACTTATGATCGAAAGATTTGTGTCACTTGCAATCGATGCATACCCTCTTACAAAGCATCCGAACCAAGAATACGCAGATGTGTTTCACCTTTACCTTCAATACATCAGAAAGTTGCATGATGAACTTACAGGACACATGCTTGATATGTACTCAGTGATGCTTACAAACGATAACACATCAAGATACTGGGAACCTGAATTCTATGAGGCAATGTACACACCTCACACAGTGCTTCAA(SEQID No.12)。
nsp13的核苷酸序列如SEQ ID No.13所示:
GCAGTGGGAGCATGCGTGCTTTGCAACTCACAAACATCACTTAGATGCGGAGCATGCATCAGAAGACCTTTCCTGTGTTGCAAATGCTGCTACGATCACGTGATCTCAACATCACACAAACTTGTGCTTTCAGTGAACCCTTACGTGTGCAACGCACCAGGCTGTGACGTAACTGACGTTACGCAGCTCTATCTTGGAGGAATGTCATACTACTGCAAATCACACAAACCTCCTATCTCATTTCCTCTTTGCGCAAACGGACAAGTGTTTGGACTTTACAAGAATACTTGCGTGGGATCAGATAACGTGACAGATTTCAATGCTATCGCAACATGCGATTGGACAAACGCAGGAGATTACATCCTTGCAAACACATGCACAGAGCGTCTGAAGTTGTTTGCGGCCGAAACACTTAAAGCAACAGAAGAAACATTTAAACTTTCATACGGAATCGCAACAGTGAGAGAGGTCCTATCGGACAGGGAACTCCACCTTTCATGGGAAGTGGGCAAACCACGCCCGCCGCTTAACAGAAACTACGTGTTTACAGGATACAGAGTGACAAAGAATTCTAAGGTACAGATCGGAGAATACACATTTGAGAAGGGCGACTACGGAGACGCCGTGGTGTACAGAGGGACGACTACGTATAAACTTAACGTGGGAGATTACTTTGTGCTTACATCACACACAGTGATGCCTCTTTCAGCACCTACACTTGTGCCTCAAGAGCATTATGTCCGAATAACGGGTCTCTATCCGACACTTAACATCTCAGATGAATTCTCGAGTAACGTGGCAAACTACCAGAAAGTGGGTATGCAGAAATACTCCACCTTACAGGGACCTCCTGGTACAGGAAAGTCTCATTTCGCGATAGGTCTAGCTCTCTATTACCCTTCAGCAAGAATCGTGTACACAGCATGCTCACACGCAGCAGTGGATGCACTTTGCGAGAAGGCGCTGAAATACCTTCCTATCGATAAATGCTCAAGAATCATCCCTGCAAGAGCAAGAGTGGAATGCTTTGATAAATTTAAAGTGAACTCAACACTTGAACAATACGTGTTCTGTACTGTAAATGCTCTGCCTGAAACTACCGCGGATATCGTGGTGTTCGACGAGATATCCATGGCAACAAACTACGACCTATCGGTCGTAAACGCGCGGCTAAGAGCAAAGCATTATGTGTACATCGGAGATCCTGCACAACTTCCTGCACCTAGAACATTACTAACTAAAGGGACGCTCGAACCTGAATACTTTAACAGTGTTTGTCGCCTAATGAAGACGATCGGGCCGGACATGTTTCTTGGAACATGCAGAAGATGCCCTGCAGAAATCGTGGATACAGTGTCAGCACTTGTGTACGATAACAAACTTAAAGCACACAAAGACAAGTCGGCTCAGTGTTTCAAGATGTTTTACAAAGGAGTGATCACACACGATGTGTCATCAGCAATCAACAGACCTCAAATCGGAGTGGTGAGAGAATTTCTTACAAGAAACCCTGCATGGAGAAAGGCGGTCTTCATAAGTCCTTACAACTCACAGAATGCCGTGGCATCAAAGATACTCGGGCTTCCTACACAAACAGTGGATTCATCACAAGGATCAGAATACGATTACGTGATCTTTACACAAACAACAGAAACAGCACACTCATGCAACGTGAACAGATTTAACGTGGCAATCACAAGAGCAAAGGTAGGGATCCTCTGTATCATGTCAGATAGAGATCTTTACGATAAACTTCAATTTACATCACTTGAAATCCCTAGAAGAAACGTGGCGACTCTGCAG(SEQ IDNo.13)。
nsp14的核苷酸序列如SEQ ID No.14所示:
GCTGAGAACGTGACAGGATTGTTCAAGGACTGCTCAAAGGTAATTACGGGTTTACATCCGACACAAGCACCTACACACCTTTCAGTGGATACAAAGTTCAAGACTGAAGGACTTTGCGTGGATATCCCTGGAATCCCTAAAGATATGACATACAGAAGACTTATCTCAATGATGGGATTTAAGATGAATTACCAAGTGAACGGATACCCTAACATGTTTATCACAAGAGAAGAAGCAATCAGACACGTGAGAGCATGGATAGGCTTCGACGTCGAGGGATGCCACGCAACAAGAGAAGCAGTGGGAACAAACCTTCCTCTTCAACTTGGATTCTCCACTGGAGTGAACCTTGTGGCAGTGCCTACAGGATACGTGGATACACCTAACAACACAGATTTCTCGCGAGTGTCAGCAAAGCCACCACCTGGAGATCAATTTAAACACCTTATCCCTCTTATGTACAAAGGACTTCCTTGGAACGTGGTGAGAATCAAGATAGTCCAAATGCTATCCGATACCTTAAAGAATCTTAGTGACCGTGTCGTATTTGTGCTTTGGGCACACGGATTTGAACTTACATCAATGAAATACTTTGTGAAGATCGGTCCCGAGCGTACATGCTGCCTTTGCGATAGAAGAGCTACGTGTTTCAGTACCGCTTCAGATACATACGCATGCTGGCACCACTCAATAGGCTTCGATTACGTTTATAATCCGTTCATGATAGATGTGCAACAATGGGGATTCACGGGCAATCTGCAGAGCAACCACGATCTTTACTGCCAAGTGCACGGAAACGCACACGTGGCATCATGCGATGCAATCATGACAAGATGCCTTGCAGTGCACGAATGCTTTGTGAAGCGGGTCGATTGGACAATCGAATACCCTATCATCGGAGATGAACTTAAGATAAATGCAGCATGCAGAAAGGTCCAGCACATGGTGGTGAAAGCAGCACTTCTTGCAGATAAATTTCCTGTGCTTCACGATATCGGAAACCCTAAAGCAATCAAATGCGTGCCTCAAGCAGATGTGGAATGGAAATTCTATGACGCACAACCTTGCTCAGATAAAGCATACAAGATAGAGGAACTATTCTATAGTTACGCAACACACTCAGATAAATTTACAGATGGAGTGTGCCTGTTCTGGAATTGCAACGTGGATAGATACCCTGCAAACTCAATCGTGTGCAGATTTGATACAAGAGTGCTTTCAAACCTTAACCTTCCAGGTTGTGACGGCGGCAGTCTATATGTTAATAAGCACGCATTTCACACACCTGCATTCGATAAGTCCGCATTCGTCAATTTAAAGCAGCTACCTTTCTTCTATTATTCAGATTCACCTTGCGAATCACACGGAAAGCAGGTTGTCAGTGACATCGATTACGTGCCTCTTAAATCAGCAACATGTATTACCAGGTGTAATCTTGGAGGAGCCGTCTGTCGACATCATGCAAACGAATACAGACTTTACCTTGATGCATACAACATGATGATCTCCGCCGGGTTCTCCCTATGGGTGTACAAACAATTTGATACATACAACCTTTGGAACACATTTACAAGACTTCAA(SEQ IDNo.14)。
nsp15的核苷酸序列如SEQ ID No.15所示:
TCACTTGAGAACGTTGCGTTCAATGTAGTCAATAAGGGACACTTCGACGGTCAACAGGGTGAGGTTCCTGTGTCAATCATCAACAATACCGTTTATACTAAAGTTGACGGCGTGGATGTGGAACTCTTCGAGAATAAGACTACGCTTCCTGTGAATGTTGCCTTCGAGTTGTGGGCAAAGCGCAATATCAAACCTGTGCCTGAAGTGAAGATACTCAATAACCTTGGAGTGGATATCGCAGCAAACACAGTGATCTGGGATTACAAGAGGGACGCACCTGCACACATCTCAACAATCGGAGTGTGCTCAATGACAGATATCGCAAAGAAGCCGACTGAAACAATCTGCGCACCTCTTACTGTATTCTTCGACGGAAGAGTGGATGGACAAGTGGATTTATTCCGAAATGCAAGAAACGGAGTGCTTATCACAGAAGGATCAGTGAAAGGACTTCAACCTTCAGTGGGACCTAAACAAGCATCACTTAACGGAGTGACTCTGATAGGCGAGGCCGTGAAGACTCAGTTTAACTACTACAAGAAAGTAGACGGTGTCGTCCAGCAGCTGCCCGAGACCTATTTCACACAATCACGGAATCTGCAGGAGTTCAAACCTAGATCACAAATGGAAATCGATTTCCTGGAGCTTGCAATGGATGAATTTATCGAAAGATACAAACTTGAAGGATACGCATTTGAACACATCGTGTACGGAGATTTCAGTCATTCACAACTTGGAGGACTTCACCTTCTTATTGGCCTAGCCAAACGTTTCAAAGAATCACCTTTCGAGCTCGAAGATTTCATTCCAATGGATTCAACAGTGAAGAATTATTTCATTACTGACGCCCAGACGGGATCATCAAAGTGTGTATGCTCAGTGATCGATCTACTACTAGACGATTTCGTTGAAATTATTAAATCACAAGACTTGAGTGTAGTTAGTAAGGTTGTGAAGGTCACAATCGATTACACAGAAATCTCATTTATGCTTTGGTGCAAAGATGGACACGTGGAAACATTCTATCCCAAACTTCAA(SEQ ID No.15)。
nsp16的核苷酸序列如SEQ ID No.16所示:
TCATCACAAGCATGGCAACCTGGAGTGGCCATGCCGAATTTGTATAAGATGCAGAGAATGCTTCTTGAGAAGTGTGACCTTCAGAATTATGGAGATTCAGCAACACTTCCTAAAGGAATCATGATGAACGTGGCAAAGTATACTCAACTTTGCCAATACCTTAACACACTTACACTTGCAGTGCCTTACAACATGAGAGTGATCCACTTCGGTGCAGGGTCGGACAAAGGAGTGGCACCTGGTACTGCTGTCCTTAGACAATGGCTTCCTACAGGAACACTTCTTGTGGATTCAGATCTTAACGATTTCGTCTCCGATGCAGATTCAACCCTCATTGGTGACTGTGCAACAGTGCACACAGCAAACAAGTGGGACTTAATAATATCAGATATGTACGATCCTAAGACTAAGAATGTAACGAAAGAGAATGACTCAAAGGAAGGTTTCTTCACCTATATCTGCGGATTTATCCAACAGAAGTTAGCTCTTGGAGGATCAGTGGCAATCAAGATTACGGAACACTCATGGAACGCAGATCTTTACAAACTTATGGGACACTTTGCATGGTGGACCGCGTTCGTTACAAACGTAAACGCGTCGTCCTCAGAAGCATTTCTTATCGGATGCAACTACCTTGGGAAACCAAGAGAGCAGATCGATGGATACGTGATGCACGCAAACTACATCTTCTGGAGGAACACAAACCCTATCCAACTTTCATCATACTCACTCTTCGACATGTCAAAGTTCCCGCTTAAACTTAGAGGGACTGCCGTAATGTCGCTTAAAGAAGGACAAATCAACGATATGATACTCAGCCTCCTAAGTAAAGGGAGGCTTATCATCAGAGAGAATAATAGAGTGGTGATCTCATCAGATGTGCTTGTGAACAACTAA(SEQ IDNo.16)。
本实施例中,ps2AN分子来源于SARS-CoV-2ORF1a N’端NSP1-NSP4序列,序列进行了人类密码子优化;ps2AN分子来源于SARS-CoV-2ORF1a C’端NSP5-NSP11序列,序列进行了人类密码子优化;ps2B分子来源于SARS-CoV-2ORF1ab C’端的NSP12-NSP16的序列,序列进行了人类密码子优化。
ps2AN中包括:nsp1-nsp4,共10429bp;
ps2AC中包括:nsp5-nsp11,共4012bp;
ps2B中包括:nsp12-nsp16,共8641bp。
ps2AN的核苷酸序列如SEQ ID No.17所示:
GCTAGCGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAATGGAGTCCCTGGTGCCCGGCTTCAACGAGAAGACCCACGTGCAGCTGTCTCTGCCTGTGCTGCAGGTGAGGGATGTGCTGGTGCGCGGCTTTGGCGACTCCGTCGAGGAGGTGCTGTCTGAGGCCAGGCAGCACCTGAAGGACGGAACCTGCGGACTGGTGGAGGTGGAGAAGGGCGTGCTGCCACAGCTGGAGCAGCCTTACGTGTTCATCAAGAGGTCCGATGCAAGGACAGCACCACACGGACACGTGATGGTGGAGCTGGTGGCCGAGCTGGAGGGCATCCAGTATGGCCGCTCTGGAGAGACCCTGGGCGTGCTGGTGCCACACGTGGGAGAGATCCCAGTGGCCTATCGGAAGGTGCTGCTGAGAAAGAACGGCAATAAGGGAGCAGGAGGACACTCTTACGGAGCAGACCTGAAGAGCTTCGATCTGGGCGACGAGCTGGGCACCGATCCTTATGAGGACTTTCAGGAGAACTGGAATACAAAGCACAGCTCCGGCGTGACCCGGGAGCTGATGAGAGAGCTGAACGGCGGCGCCTACACCAGATATGTGGATAACAATTTCTGCGGACCAGACGGATACCCCCTGGAGTGTATCAAGGATCTGCTGGCCAGAGCAGGCAAGGCCTCCTGCACCCTGTCTGAGCAGCTGGACTTCATCGACACAAAGCGGGGCGTGTATTGCTGTAGAGAGCACGAGCACGAGATCGCCTGGTATACCGAGCGGTCCGAGAAGTCTTACGAGCTGCAGACACCATTCGAGATCAAGCTGGCCAAGAAGTTCGACACCTTCAACGGCGAGTGTCCAAACTTCGTGTTTCCCCTGAATAGCATCATCAAGACCATCCAGCCCAGAGTGGAGAAGAAGAAGCTGGATGGCTTTATGGGCAGGATCCGCAGCGTGTACCCTGTGGCCTCCCCAAACGAGTGCAATCAGATGTGCCTGTCCACACTGATGAAGTGCGATCACTGTGGCGAGACCTCTTGGCAGACAGGCGACTTCGTGAAGGCCACCTGCGAGTTTTGTGGCACCGAGAACCTGACAAAGGAGGGCGCCACCACATGCGGCTATCTGCCTCAGAATGCCGTGGTGAAGATCTACTGCCCAGCCTGTCACAACTCCGAAGTGGGACCAGAGCACTCTCTGGCCGAGTACCACAATGAGTCCGGCCTGAAGACAATCCTGAGGAAGGGAGGAAGGACCATCGCCTTCGGCGGATGCGTGTTTTCTTATGTGGGCTGCCACAACAAGTGTGCATACTGGGTGCCAAGGGCCAGCGCCAATATCGGCTGTAACCACACCGGAGTGGTGGGAGAGGGATCCGAGGGCCTGAACGATAATCTGCTGGAGATCCTGCAGAAGGAGAAGGTGAACATCAATATCGTGGGCGACTTCAAGCTGAACGAGGAGATCGCCATCATCCTGGCCTCCTTCTCTGCCAGCACATCCGCCTTTGTGGAGACCGTGAAGGGCCTGGACTACAAGGCCTTCAAGCAGATCGTGGAGAGCTGCGGCAACTTCAAGGTGACCAAGGGCAAGGCCAAGAAGGGCGCCTGGAACATCGGCGAGCAGAAGAGCATCCTGTCCCCTCTGTATGCCTTCGCCAGCGAGGCAGCAAGGGTGGTGAGATCTATCTTTAGCCGGACCCTGGAGACAGCCCAGAATTCCGTGAGAGTGCTGCAGAAGGCCGCCATCACCATCCTGGATGGCATCTCCCAGTACTCTCTGAGGCTGATCGATGCCATGATGTTCACCTCCGACCTGGCCACAAACAATCTGGTGGTCATGGCCTACATCACCGGCGGCGTGGTGCAGCTGACCTCTCAGTGGCTGACAAACATCTTTGGCACCGTGTATGAGAAGCTGAAGCCAGTGCTGGATTGGCTGGAGGAGAAGTTCAAGGAGGGCGTGGAGTTTCTGCGCGACGGCTGGGAGATCGTGAAGTTCATCAGCACCTGCGCATGTGAGATCGTGGGAGGACAGATCGTGACCTGTGCCAAGGAGATCAAGGAGTCCGTGCAGACATTCTTTAAGCTGGTGAACAAGTTCCTGGCCCTGTGCGCCGACTCTATCATCATCGGCGGCGCCAAGCTGAAGGCCCTGAACCTGGGCGAGACCTTTGTGACACACAGCAAGGGCCTGTACAGGAAGTGCGTGAAGTCCCGCGAGGAGACCGGACTGCTGATGCCCCTGAAGGCACCTAAGGAGATCATCTTCCTGGAGGGCGAGACCCTGCCCACAGAGGTGCTGACAGAGGAGGTGGTGCTGAAGACCGGCGACCTGCAGCCACTGGAGCAGCCCACCAGCGAGGCAGTGGAGGCACCTCTGGTGGGCACACCAGTGTGCATCAATGGCCTGATGCTGCTGGAGATCAAGGATACCGAGAAGTACTGTGCCCTGGCCCCTAACATGATGGTGACAAACAATACCTTCACACTGAAGGGCGGCGCCCCAACCAAGGTGACATTTGGCGACGATACCGTGATCGAGGTGCAGGGCTACAAGTCTGTGAATATCACATTCGAGCTGGATGAGAGAATCGACAAGGTGCTGAACGAGAAGTGCAGCGCCTATACAGTGGAGCTGGGCACCGAGGTGAACGAGTTTGCCTGCGTGGTGGCCGACGCCGTGATCAAGACCCTGCAGCCAGTGTCCGAGCTGCTGACACCCCTGGGCATCGATCTGGACGAGTGGTCTATGGCCACCTACTATCTGTTCGACGAGAGCGGCGAGTTTAAGCTGGCCTCCCACATGTACTGCTCTTTCTATCCCCCTGATGAAGACGAGGAGGAGGGCGATTGCGAGGAGGAGGAGTTTGAGCCCAGCACACAGTACGAGTATGGCACCGAGGACGATTACCAGGGCAAGCCACTGGAGTTCGGAGCCACCTCCGCCGCCCTGCAGCCAGAGGAGGAGCAGGAGGAGGATTGGCTGGACGATGACTCCCAGCAGACCGTGGGCCAGCAGGATGGCTCTGAGGACAATCAGACCACAACCATCCAGACAATCGTGGAGGTGCAGCCTCAGCTGGAGATGGAGCTGACCCCAGTGGTGCAGACCATCGAGGTGAACTCTTTCAGCGGCTATCTGAAGCTGACAGATAACGTGTACATCAAGAACGCCGACATTGTGGAGGAGGCCAAGAAGGTGAAGCCTACCGTGGTGGTGAACGCCGCCAACGTGTACCTGAAGCACGGAGGAGGAGTGGCAGGCGCCCTGAACAAGGCCACCAACAATGCCATGCAGGTGGAGAGCGATGACTATATCGCCACAAATGGACCCCTGAAGGTCGGAGGAAGCTGCGTGCTGTCCGGACACAACCTGGCCAAGCACTGTCTGCACGTGGTGGGCCCTAACGTGAATAAGGGCGAGGACATCCAGCTGCTGAAGTCCGCCTACGAGAACTTCAATCAGCACGAGGTGCTGCTGGCCCCTCTGCTGAGCGCCGGCATCTTTGGCGCCGATCCAATCCACTCCCTGAGGGTGTGCGTGGACACCGTGCGCACAAACGTGTACCTGGCCGTGTTCGATAAGAACCTGTACGACAAGCTGGTGTCTAGCTTTCTGGAGATGAAGAGCGAGAAGCAGGTGGAGCAGAAGATCGCCGAGATCCCTAAGGAGGAGGTGAAGCCATTCATCACCGAGAGCAAGCCTTCCGTGGAGCAGAGGAAGCAGGATGACAAGAAGATCAAGGCCTGCGTGGAGGAGGTGACAACCACACTGGAGGAGACCAAGTTCCTGACAGAGAACCTGCTGCTGTACATCGATATCAACGGCAATCTGCACCCAGACAGCGCCACACTGGTGTCCGATATCGACATCACCTTTCTGAAGAAGGATGCCCCATATATCGTGGGCGACGTGGTGCAGGAGGGCGTGCTGACAGCCGTGGTCATCCCCACCAAGAAGGCCGGCGGCACCACAGAGATGCTGGCCAAGGCCCTGCGCAAGGTGCCTACCGACAATTACATCACCACATATCCAGGCCAGGGCCTGAACGGCTATACCGTGGAGGAGGCCAAGACCGTGCTGAAGAAGTGCAAGAGCGCCTTCTACATCCTGCCTTCTATCATCAGCAATGAGAAGCAGGAGATCCTGGGCACCGTGTCCTGGAACCTGAGGGAGATGCTGGCCCACGCCGAGGAGACACGCAAGCTGATGCCCGTGTGCGTGGAGACAAAGGCCATCGTGAGCACCATCCAGCGGAAGTATAAGGGCATCAAGATCCAGGAGGGAGTGGTGGACTACGGAGCAAGATTCTACTTTTATACCTCTAAGACCACAGTGGCCAGCCTGATCAACACACTGAATGATCTGAACGAGACCCTGGTGACAATGCCCCTGGGCTATGTGACCCACGGCCTGAATCTGGAGGAGGCCGCCAGGTACATGCGCTCCCTGAAGGTGCCAGCAACCGTGAGCGTGAGCTCTCCTGACGCCGTGACAGCCTACAACGGCTATCTGACAAGCTCCTCTAAGACCCCAGAGGAGCACTTCATCGAGACCATCTCTCTGGCCGGCAGCTATAAGGATTGGTCCTACTCTGGCCAGTCCACACAGCTGGGCATCGAGTTTCTGAAGAGGGGCGACAAGAGCGTGTACTATACCAGCAATCCCACCACATTCCACCTGGATGGCGAAGTGATCACCTTCGACAACCTGAAGACCCTGCTGAGCCTGCGGGAGGTGAGAACCATCAAGGTGTTCACCACAGTGGATAACATCAATCTGCACACACAGGTGGTGGACATGTCCATGACCTATGGCCAGCAGTTTGGCCCAACATACCTGGATGGCGCCGACGTGACCAAGATCAAGCCCCACAATAGCCACGAGGGCAAGACATTCTACGTGCTGCCTAATGCCACCAACTTTTCCCTGCTGAAGCAGGCAGGCGACGTGGAGGAGAACCCAGGACCAGATGACACCCTGAGGGTGGAGGCCTTCGAGTACTATCACACCACAGATCCTAGCTTTCTGGGCCGCTATATGTCCGCCCTGAATCACACCAAGAAGTGGAAGTACCCACAGGTGAACGGCCTGACAAGCATCAAGTGGGCCGACAACAATTGCTACCTGGCCACCGCCCTGCTGACACTGCAGCAGATCGAGCTGAAGTTCAACCCACCCGCCCTGCAGGATGCATACTATAGGGCAAGAGCAGGAGAGGCAGCCAATTTTTGCGCCCTGATCCTGGCCTATTGTAACAAGACCGTGGGAGAGCTGGGCGATGTGCGGGAGACAATGAGCTACCTGTTCCAGCACGCCAATCTGGACTCCTGCAAGAGAGTGCTGAACGTGGTGTGCAAGACATGTGGCCAGCAGCAGACCACACTGAAGGGCGTGGAGGCCGTGATGTATATGGGCACCCTGAGCTACGAGCAGTTTAAGAAGGGCGTGCAGATCCCCTGCACATGTGGCAAGCAGGCCACCAAGTACCTGGTGCAGCAGGAGTCCCCTTTCGTGATGATGTCTGCCCCTCCAGCCCAGTATGAGCTGAAGCACGGCACCTTTACATGCGCCTCTGAGTACACCGGCAATTATCAGTGTGGCCACTATAAGCACATCACCAGCAAGGAGACACTGTACTGCATCGATGGCGCCCTGCTGACCAAGAGCTCCGAGTACAAGGGCCCCATCACAGACGTGTTCTATAAGGAGAATTCTTACACCACAACCATCGCCACCAACTTTAGCCTGCTGAAGCAGGCCGGCGATGTGGAGGAGAACCCTGGACCAAAGCCCGTGACCTATAAGCTGGACGGCGTGGTGTGCACAGAGATCGATCCTAAGCTGGACAACTACTACAAGAAGGATAACTCTTATTTCACCGAGCAGCCCATCGACCTGGTGCCTAATCAGCCTTACCCAAACGCCAGCTTCGATAATTTCAAGTTCGTGTGCGACAATATCAAGTTTGCCGATGACCTGAACCAGCTGACCGGATACAAGAAGCCAGCCAGCCGGGAGCTGAAGGTGACATTCTTTCCTGATCTGAACGGCGACGTGGTGGCCATCGACTACAAGCACTATACACCTTCCTTCAAGAAGGGCGCCAAGCTGCTGCACAAGCCAATCGTGTGGCACGTGAACAATGCCACCAATAAGGCCACATACAAGCCAAACACCTGGTGCATCAGATGTCTGTGGTCTACAAAGCCCGTGGAGACCAGCAATTCCTTTGATGTGCTGAAGAGCGAGGATGCCCAGGGCATGGACAACCTGGCCTGCGAGGACCTGAAGCCCGTGAGCGAGGAGGTGGTGGAGAATCCTACCATCCAGAAGGATGTGCTGGAGTGTAACGTGAAGACAACCGAGGTGGTGGGCGACATCATCCTGAAGCCTGCCAACAATTCCCTGAAGATCACAGAGGAAGTGGGCCACACCGATCTGATGGCCGCCTACGTGGACAATTCTAGCCTGACCATCAAGAAGCCAAACGAGCTGAGCAGGGTGCTGGGCCTGAAGACCCTGGCCACACACGGCCTGGCCGCAGTGAATTCCGTGCCATGGGACACCATCGCCAATTATGCCAAGCCCTTCCTGAACAAGGTGGTGAGCACAACCACAAACATCGTGACACGGTGCCTGAACCGGGTGTGCACCAATTACATGCCATATTTCTTTACACTGCTGCTGCAGCTGTGCACCTTTACAAGGTCCACCAATTCTCGCATCAAGGCCTCCATGCCCACCACAATCGCCAAGAACACAGTGAAGAGCGTGGGCAAGTTCTGCCTGGAGGCCTCCTTTAACTACCTGAAGTCCCCCAATTTCTCTAAGCTGATCAACATCATCATCTGGTTTCTGCTGCTGAGCGTGTGCCTGGGCAGCCTGATCTATTCCACAGCCGCCCTGGGCGTGCTGATGAGCAACCTGGGCATGCCTTCCTACTGCACCGGCTATCGGGAGGGCTACCTGAATAGCACCAACGTGACAATCGCCACCTACTGTACAGGCTCTATCCCATGCAGCGTGTGCCTGTCCGGCCTGGATTCTCTGGACACCTATCCTTCCCTGGAGACCATCCAGATCACAATCTCCTCTTTCAAGTGGGACCTGACCGCCTTTGGCCTGGTGGCAGAGTGGTTCCTGGCCTATATCCTGTTTACAAGATTCTTTTACGTGCTGGGCCTGGCCGCCATCATGCAGCTGTTCTTTAGCTACTTCGCCGTGCACTTTATCTCTAATAGCTGGCTGATGTGGCTGATCATCAACCTGGTGCAGATGGCCCCCATCTCCGCCATGGTGAGGATGTATATCTTCTTTGCCTCTTTCTACTACGTGTGGAAGAGCTACGTGCACGTGGTGGACGGCTGCAATAGCTCCACCTGCATGATGTGCTACAAGAGGAACCGCGCCACACGCGTGGAGTGTACCACAATCGTGAATGGCGTGCGGAGAAGCTTCTACGTGTATGCCAACGGCGGCAAGGGCTTTTGCAAGCTGCACAACTGGAATTGCGTGAACTGTGATACATTCTGTGCCGGCAGCACCTTTATCTCCGATGAGGTGGCAAGGGACCTGTCCCTGCAGTTCAAGAGACCAATCAATCCCACCGATCAGTCTAGCTACATCGTGGACTCCGTGACAGTGAAGAACGGCTCTATCCACCTGTATTTCGATAAGGCCGGCCAGAAGACATACGAGAGGCACTCCCTGTCTCACTTTGTGAATCTGGACAACCTGCGCGCCAACAATACCAAGGGCAGCCTGCCCATCAACGTGATCGTGTTCGATGGCAAGTCCAAGTGCGAGGAGTCCTCTGCCAAGAGCGCCTCCGTGTACTATAGCCAGCTGATGTGCCAGCCTATCCTGCTGCTGGACCAGGCCCTGGTGTCCGATGTGGGCGACTCTGCCGAGGTGGCAGTGAAGATGTTTGATGCCTACGTGAATACCTTCAGCAGCACCTTCAACGTGCCAATGGAGAAGCTGAAGACCCTGGTGGCAACAGCAGAGGCAGAGCTGGCCAAGAACGTGTCCCTGGACAATGTGCTGTCTACCTTCATCAGCGCCGCCCGCCAGGGCTTTGTGGATTCTGACGTGGAGACAAAGGATGTGGTGGAGTGCCTGAAGCTGAGCCACCAGTCCGATATCGAGGTGACCGGCGACAGCTGTAACAATTATATGCTGACCTACAATAAGGTGGAGAACATGACACCCCGGGATCTGGGCGCCTGCATCGACTGTTCTGCCAGACACATCAATGCCCAGGTGGCCAAGAGCCACAATATCGCCCTGATCTGGAACGTGAAGGACTTCATGTCTCTGAGCGAGCAGCTGAGGAAGCAGATCCGCTCCGCCGCCAAGAAGAACAATCTGCCCTTCAAGCTGACCTGCGCCACCACAAGGCAGGTGGTGAACGTGGTCACCACAAAGATCGCCCTGAAGGGCGGCAAGATCGTGAACAATTGGCTGAAGCAGCTGATCAAGGTGACCCTGGTGTTCCTGTTTGTGGCCGCCATCTTCTACCTGATCACCCCCGTGCACGTGATGTCTAAGCACACAGATTTTTCTAGCGAGATCATCGGCTATAAGGCCATCGACGGAGGAGTGACCAGGGATATCGCCAGCACCGACACATGCTTCGCCAATAAGCACGCCGATTTCGACACCTGGTTTAGCCAGAGGGGCGGCTCCTACACAAACGACAAGGCCTGTCCACTGATCGCAGCCGTGATCACCAGGGAAGTGGGATTCGTGGTGCCTGGACTGCCAGGAACAATCCTGAGGACCACAAATGGCGACTTCCTGCACTTTCTGCCTCGCGTGTTTTCCGCCGTGGGCAACATCTGCTATACCCCATCTAAGCTGATCGAGTACACCGATTTCGCCACATCCGCCTGCGTGCTGGCCGCAGAGTGTACCATCTTTAAGGATGCCTCTGGCAAGCCCGTGCCTTACTGTTATGACACAAATGTGCTGGAGGGCTCTGTGGCCTATGAGAGCCTGCGGCCAGATACCAGATACGTGCTGATGGACGGCAGCATCATCCAGTTCCCCAACACATATCTGGAGGGCTCTGTGCGGGTGGTGACCACATTTGACAGCGAGTACTGCCGGCACGGCACCTGTGAGAGATCTGAGGCCGGCGTGTGCGTGTCCACATCTGGCAGGTGGGTGCTGAACAATGATTACTATCGCAGCCTGCCTGGCGTGTTCTGTGGCGTGGACGCCGTGAATCTGCTGACCAACATGTTTACACCTCTGATCCAGCCAATCGGCGCCCTGGATATCAGCGCCTCCATCGTGGCAGGAGGAATCGTGGCAATCGTGGTGACATGCCTGGCCTACTATTTCATGCGGTTCCGGAGGGCCTTCGGCGAGTACTCTCACGTGGTGGCCTTTAATACCCTGCTGTTCCTGATGAGCTTCACCGTGCTGTGCCTGACCCCCGTGTATAGCTTCCTGCCTGGCGTGTACTCCGTGATCTACCTGTATCTGACCTTCTACCTGACAAACGACGTGAGCTTTCTGGCCCACATCCAGTGGATGGTCATGTTCACCCCCCTGGTGCCTTTTTGGATCACAATCGCCTATATCATCTGCATCTCCACCAAGCACTTCTATTGGTTCTTTTCTAATTACCTGAAGCGGAGAGTGGTGTTTAACGGCGTGTCTTTCAGCACCTTTGAGGAGGCCGCCCTGTGCACATTCCTGCTGAACAAGGAGATGTACCTGAAGCTGCGGTCCGACGTGCTGCTGCCACTGACCCAGTACAATAGATATCTGGCCCTGTATAACAAGTACAAGTATTTCTCTGGCGCCATGGATACCACAAGCTACAGAGAGGCAGCATGCTGTCACCTGGCAAAGGCCCTGAATGATTTTTCCAACTCTGGCAGCGACGTGCTGTACCAGCCCCCTCAGACCTCTATCACAAGCGCCGTGCTGCAGTAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGTCTAGA(SEQ ID No.17)。
ps2AC的核苷酸序列如SEQ ID No.18所示:
GCTAGCGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAATGAGCGGCTTTCGGAAGATGGCATTCCCATCCGGCAAGGTGGAGGGATGCATGGTGCAGGTGACATGTGGCACCACAACCCTGAATGGCCTGTGGCTGGACGATGTGGTGTATTGCCCTAGACACGTGATCTGTACCAGCGAGGACATGCTGAACCCAAATTACGAGGATCTGCTGATCAGGAAGTCCAACCACAATTTCCTGGTGCAGGCAGGAAACGTGCAGCTGCGCGTGATCGGCCACAGCATGCAGAATTGCGTGCTGAAGCTGAAGGTGGACACAGCCAACCCAAAGACCCCCAAGTACAAGTTTGTGAGGATCCAGCCTGGCCAGACATTCTCCGTGCTGGCCTGCTATAACGGCTCTCCCAGCGGCGTGTACCAGTGTGCCATGCGCCCTAACTTTACCATCAAGGGCTCTTTCCTGAATGGCAGCTGCGGCTCCGTGGGCTTTAACATCGACTATGATTGCGTGAGCTTCTGTTACATGCACCACATGGAGCTGCCAACAGGAGTGCACGCAGGAACCGACCTGGAGGGAAACTTCTACGGCCCCTTCGTGGACAGGCAGACCGCACAGGCAGCAGGCACAGATACAACCATCACCGTGAACGTGCTGGCCTGGCTGTACGCCGCCGTGATCAACGGCGACCGGTGGTTTCTGAATAGATTCACAACCACACTGAACGATTTCAATCTGGTGGCCATGAAGTACAACTATGAGCCACTGACACAGGACCACGTGGATATCCTGGGACCACTGAGCGCCCAGACCGGAATCGCCGTGCTGGACATGTGCGCCTCCCTGAAGGAGCTGCTGCAGAACGGCATGAATGGAAGGACAATCCTGGGAAGCGCCCTGCTGGAGGACGAGTTTACCCCATTCGATGTGGTGAGACAGTGTTCCGGCGTGACATTTCAGGCCACCAATTTCTCTCTGCTGAAGCAGGCAGGCGATGTGGAGGAGAACCCTGGACCATCCGCCGTGAAGCGCACAATCAAGGGCACCCACCACTGGCTGCTGCTGACAATCCTGACCTCTCTGCTGGTGCTGGTGCAGTCTACCCAGTGGAGCCTGTTCTTTTTCCTGTATGAGAATGCCTTTCTGCCCTTCGCCATGGGCATCATCGCCATGTCCGCCTTTGCCATGATGTTCGTGAAGCACAAGCACGCCTTTCTGTGCCTGTTCCTGCTGCCATCCCTGGCCACCGTGGCCTACTTCAACATGGTGTATATGCCTGCCTCTTGGGTCATGAGGATCATGACATGGCTGGACATGGTGGATACCTCCCTGTCTGGCTTTAAGCTGAAGGACTGCGTGATGTATGCCAGCGCCGTGGTGCTGCTGATCCTGATGACAGCAAGGACCGTGTACGACGATGGAGCAAGGAGAGTGTGGACACTGATGAATGTGCTGACCCTGGTGTACAAGGTGTACTATGGCAACGCCCTGGATCAGGCCATCTCCATGTGGGCCCTGATCATCTCTGTGACCAGCAATTATTCCGGCGTGGTGACCACAGTGATGTTTCTGGCCCGGGGCATCGTGTTCATGTGCGTGGAGTACTGTCCTATCTTTTTCATCACAGGCAACACCCTGCAGTGCATCATGCTGGTGTACTGTTTTCTGGGCTATTTCTGCACCTGTTACTTTGGCCTGTTCTGCCTGCTGAATAGGTATTTTCGCCTGACACTGGGCGTGTACGACTATCTGGTGTCTACCCAGGAGTTCAGATACATGAACAGCCAGGGCCTGCTGCCCCCTAAGAACTCCATCGATGCCTTCAAGCTGAATATCAAGCTGCTGGGCGTGGGCGGCAAGCCATGCATCAAGGTGGCCACAGTGCAGTCTAAGATGAGCGACGTGAAGTGTACCAGCGTGGTGCTGCTGTCCGTGCTGCAGCAGCTGAGGGTGGAGAGCTCCTCTAAGCTGTGGGCCCAGTGCGTGCAGCTGCACAACGACATCCTGCTGGCCAAGGATACCACAGAGGCCTTCGAGAAGATGGTGTCCCTGCTGTCTGTGCTGCTGAGCATGCAGGGCGCCGTGGACATCAATAAGCTGTGCGAGGAGATGCTGGATAACCGCGCCACACTGCAGGCCATCGCCTCTGAGTTTAGCTCCCTGCCAAGCTATGCAGCCTTCGCCACCGCACAGGAGGCATACGAGCAGGCCGTGGCCAATGGCGACTCCGAGGTGGTGCTGAAGAAGCTGAAGAAGAGCCTGAACGTGGCCAAGTCCGAGTTCGACCGGGATGCCGCCATGCAGAGAAAGCTGGAGAAGATGGCCGACCAGGCCATGACACAGATGTATAAGCAGGCCAGGTCTGAGGATAAGCGCGCCAAGGTGACCAGCGCCATGCAGACAATGCTGTTTACCATGCTGCGGAAGCTGGACAATGATGCCCTGAACAATATCATCAACAATGCCAGAGACGGCTGCGTGCCCCTGAACATCATCCCTCTGACCACAGCCGCCAAGCTGATGGTGGTCATCCCTGACTACAACACATATAAGAATACCTGTGATGGCACCACATTCACATACGCCTCTGCCCTGTGGGAGATCCAGCAGGTGGTGGACGCCGATAGCAAGATCGTGCAGCTGAGCGAGATCTCCATGGATAACTCCCCAAATCTGGCATGGCCACTGATCGTGACCGCCCTGAGGGCCAATAGCGCCGTGAAGCTGCAGAACAATGAGCTGTCCCCAGTGGCCCTGAGGCAGATGTCTTGCGCAGCAGGAACCACACAGACAGCCTGTACCGACGATAACGCCCTGGCCTACTATAATACCACAAAGGGAGGCCGGTTTGTGCTGGCCCTGCTGTCTGACCTGCAGGATCTGAAGTGGGCCAGATTCCCTAAGAGCGACGGCACCGGCACAATCTACACCGAGCTGGAGCCACCCTGCCGGTTTGTGACCGATACACCTAAGGGCCCAAAGGTGAAGTACCTGTATTTCATCAAGGGCCTGAACAATCTGAACAGGGGAATGGTGCTGGGATCTCTGGCCGCAACCGTGCGCCTGCAGGCAGGAAACGCCACAGAGGTGCCCGCCAATTCCACCGTGCTGTCTTTTTGTGCCTTCGCCGTGGACGCAGCAAAGGCATACAAGGATTATCTGGCCTCCGGCGGCCAGCCTATCACCAATTGCGTGAAGATGCTGTGCACCCACACAGGAACCGGACAGGCCATCACAGTGACCCCAGAGGCCAACATGGACCAGGAGTCTTTTGGCGGCGCCAGCTGCTGTCTGTATTGCCGGTGTCACATCGACCACCCCAATCCTAAGGGCTTCTGCGATCTGAAGGGCAAGTACGTGCAGATCCCTACCACATGTGCCAATGATCCAGTGGGCTTTACCCTGAAGAACACAGTGTGCACCGTGTGCGGCATGTGGAAGGGCTACGGCTGCAGCTGTGACCAGCTGAGAGAGCCCATGCTGCAGTCCGCCGATGCCCAGTCTTTTCTGAACGGCTTCGCCGTGTAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGTCTAGA(SEQ IDNo.18)。
ps2B的核苷酸序列如SEQ ID No.19所示。
GCTAGCGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAATGTCAGCAGATGCACAATCATTTCTTAACAGAGTGTGCGGAGTGTCAGCAGCAAGACTTACACCTTGCGGAACAGGAACATCAACAGATGTAGTTTATAGGGCCTTCGATATCTACAACGATAAAGTGGCAGGATTTGCAAAGTTCTTAAAGACCAATTGCTGCAGATTTCAAGAGAAGGACGAGGATGATAACCTTATCGATTCATACTTTGTGGTGAAGAGGCATACATTCAGCAATTACCAACACGAAGAAACAATCTACAACCTTCTTAAAGATTGCCCTGCAGTGGCAAAGCATGACTTCTTCAAGTTCAGAATCGATGGAGATATGGTGCCTCACATCTCAAGACAAAGACTTACAAAGTATACGATGGCAGATCTCGTTTATGCGTTGCGCCATTTCGACGAGGGTAATTGTGACACCCTGAAGGAGATCCTGGTCACGTATAATTGCTGCGATGATGATTACTTTAACAAGAAGGACTGGTATGATTTCGTAGAGAATCCTGACATTCTTAGAGTGTACGCAAACCTTGGAGAAAGAGTGAGACAAGCACTCCTAAAGACAGTTCAATTCTGCGACGCAATGAGAAACGCAGGAATCGTGGGAGTGCTTACACTTGATAACCAAGATCTTAACGGAAACTGGTATGACTTTGGCGACTTTATACAGACAACACCTGGATCAGGAGTGCCTGTGGTGGATTCATATTATAGCCTGCTGATGCCTATCCTTACACTTACAAGAGCACTTACAGCAGAATCACATGTGGATACCGACTTGACCAAACCCTATATTAAATGGGATCTGCTGAAATATGACTTTACAGAAGAACGACTTAAACTCTTCGACAGATACTTTAAATACTGGGATCAAACATACCACCCTAACTGCGTGAACTGCCTTGATGATAGATGCATCCTTCACTGCGCAAACTTTAACGTGCTGTTCTCGACCGTGTTTCCTCCTACATCATTTGGACCTCTTGTGAGAAAGATCTTTGTGGACGGAGTACCTTTCGTCGTATCAACAGGATACCACTTTAGAGAACTTGGAGTAGTGCATAATCAAGATGTGAACCTACATTCTAGCCGATTATCATTTAAAGAACTTCTGGTTTATGCCGCGGACCCTGCAATGCACGCAGCAAGTGGCAATTTATTACTTGACAAACGGACAACCTGTTTCTCGGTTGCCGCACTTACAAACAATGTAGCTTTCCAGACCGTAAAGCCAGGGAATTTCAACAAAGATTTCTATGACTTCGCCGTATCAAAGGGATTCTTCAAGGAGGGATCATCAGTGGAACTTAAACACTTCTTCTTCGCCCAGGATGGAAACGCAGCAATCTCAGATTACGATTACTACAGATACAACCTTCCTACAATGTGCGATATCAGACAACTTCTCTTCGTAGTTGAAGTGGTGGATAAATACTTTGATTGCTACGATGGAGGATGCATCAACGCAAACCAAGTGATCGTGAACAACTTGGATAAATCCGCTGGATTCCCGTTTAATAAGTGGGGTAAAGCCCGCCTTTACTACGATTCAATGTCATACGAAGATCAAGATGCATTATTCGCTTATACAAAGAGGAATGTGATCCCTACAATCACACAAATGAACCTTAAATACGCAATCTCAGCAAAGAATCGAGCAAGAACAGTGGCAGGAGTGTCAATCTGCTCAACAATGACAAACAGACAATTTCACCAGAAGCTCCTGAAATCAATCGCAGCAACAAGAGGAGCAACAGTGGTGATCGGAACATCAAAGTTCTATGGAGGTTGGCACAACATGCTCAAGACCGTGTATAGCGATGTTGAGAATCCGCATCTCATGGGATGGGATTACCCTAAATGCGATAGAGCTATGCCCAATATGCTGAGAATCATGGCATCACTTGTGCTTGCAAGAAAGCATACCACATGCTGCTCACTTTCACACAGATTCTATCGACTTGCAAACGAATGCGCACAGGTCCTCTCCGAGATGGTGATGTGCGGCGGGAGCTTGTATGTGAAACCAGGTGGAACATCATCAGGAGATGCAACAACAGCATACGCAAACTCAGTGTTTAACATCTGCCAAGCAGTGACAGCTAATGTAAACGCTCTCTTGAGCACTGACGGAAACAAGATAGCCGATAAATACGTGCGTAATCTGCAGCATCGACTTTACGAATGCCTTTACAGAAACAGAGATGTAGACACGGACTTTGTAAATGAATTCTATGCTTACCTTAGAAAGCATTTCTCCATGATGATACTGAGTGACGATGCTGTTGTATGTTTCAACTCAACATACGCATCACAAGGACTTGTGGCATCAATCAAGAATTTCAAATCAGTGCTTTACTACCAGAATAATGTGTTTATGTCAGAAGCAAAGTGTTGGACAGAAACTGACCTCACTAAGGGCCCTCACGAGTTCTGTAGCCAACACACAATGCTTGTGAAACAAGGAGATGACTATGTTTATCTCCCATACCCTGATCCTTCAAGAATCTTGGGTGCAGGGTGTTTCGTGGATGATATCGTGAAGACTGACGGAACACTTATGATCGAAAGATTTGTGTCACTTGCAATCGATGCATACCCTCTTACAAAGCATCCGAACCAAGAATACGCAGATGTGTTTCACCTTTACCTTCAATACATCAGAAAGTTGCATGATGAACTTACAGGACACATGCTTGATATGTACTCAGTGATGCTTACAAACGATAACACATCAAGATACTGGGAACCTGAATTCTATGAGGCAATGTACACACCTCACACAGTGCTTCAAGCAGTGGGAGCATGCGTGCTTTGCAACTCACAAACATCACTTAGATGCGGAGCATGCATCAGAAGACCTTTCCTGTGTTGCAAATGCTGCTACGATCACGTGATCTCAACATCACACAAACTTGTGCTTTCAGTGAACCCTTACGTGTGCAACGCACCAGGCTGTGACGTAACTGACGTTACGCAGCTCTATCTTGGAGGAATGTCATACTACTGCAAATCACACAAACCTCCTATCTCATTTCCTCTTTGCGCAAACGGACAAGTGTTTGGACTTTACAAGAATACTTGCGTGGGATCAGATAACGTGACAGATTTCAATGCTATCGCAACATGCGATTGGACAAACGCAGGAGATTACATCCTTGCAAACACATGCACAGAGCGTCTGAAGTTGTTTGCGGCCGAAACACTTAAAGCAACAGAAGAAACATTTAAACTTTCATACGGAATCGCAACAGTGAGAGAGGTCCTATCGGACAGGGAACTCCACCTTTCATGGGAAGTGGGCAAACCACGCCCGCCGCTTAACAGAAACTACGTGTTTACAGGATACAGAGTGACAAAGAATTCTAAGGTACAGATCGGAGAATACACATTTGAGAAGGGCGACTACGGAGACGCCGTGGTGTACAGAGGGACGACTACGTATAAACTTAACGTGGGAGATTACTTTGTGCTTACATCACACACAGTGATGCCTCTTTCAGCACCTACACTTGTGCCTCAAGAGCATTATGTCCGAATAACGGGTCTCTATCCGACACTTAACATCTCAGATGAATTCTCGAGTAACGTGGCAAACTACCAGAAAGTGGGTATGCAGAAATACTCCACCTTACAGGGACCTCCTGGTACAGGAAAGTCTCATTTCGCGATAGGTCTAGCTCTCTATTACCCTTCAGCAAGAATCGTGTACACAGCATGCTCACACGCAGCAGTGGATGCACTTTGCGAGAAGGCGCTGAAATACCTTCCTATCGATAAATGCTCAAGAATCATCCCTGCAAGAGCAAGAGTGGAATGCTTTGATAAATTTAAAGTGAACTCAACACTTGAACAATACGTGTTCTGTACTGTAAATGCTCTGCCTGAAACTACCGCGGATATCGTGGTGTTCGACGAGATATCCATGGCAACAAACTACGACCTATCGGTCGTAAACGCGCGGCTAAGAGCAAAGCATTATGTGTACATCGGAGATCCTGCACAACTTCCTGCACCTAGAACATTACTAACTAAAGGGACGCTCGAACCTGAATACTTTAACAGTGTTTGTCGCCTAATGAAGACGATCGGGCCGGACATGTTTCTTGGAACATGCAGAAGATGCCCTGCAGAAATCGTGGATACAGTGTCAGCACTTGTGTACGATAACAAACTTAAAGCACACAAAGACAAGTCGGCTCAGTGTTTCAAGATGTTTTACAAAGGAGTGATCACACACGATGTGTCATCAGCAATCAACAGACCTCAAATCGGAGTGGTGAGAGAATTTCTTACAAGAAACCCTGCATGGAGAAAGGCGGTCTTCATAAGTCCTTACAACTCACAGAATGCCGTGGCATCAAAGATACTCGGGCTTCCTACACAAACAGTGGATTCATCACAAGGATCAGAATACGATTACGTGATCTTTACACAAACAACAGAAACAGCACACTCATGCAACGTGAACAGATTTAACGTGGCAATCACAAGAGCAAAGGTAGGGATCCTCTGTATCATGTCAGATAGAGATCTTTACGATAAACTTCAATTTACATCACTTGAAATCCCTAGAAGAAACGTGGCGACTCTGCAGGCTGAGAACGTGACAGGATTGTTCAAGGACTGCTCAAAGGTAATTACGGGTTTACATCCGACACAAGCACCTACACACCTTTCAGTGGATACAAAGTTCAAGACTGAAGGACTTTGCGTGGATATCCCTGGAATCCCTAAAGATATGACATACAGAAGACTTATCTCAATGATGGGATTTAAGATGAATTACCAAGTGAACGGATACCCTAACATGTTTATCACAAGAGAAGAAGCAATCAGACACGTGAGAGCATGGATAGGCTTCGACGTCGAGGGATGCCACGCAACAAGAGAAGCAGTGGGAACAAACCTTCCTCTTCAACTTGGATTCTCCACTGGAGTGAACCTTGTGGCAGTGCCTACAGGATACGTGGATACACCTAACAACACAGATTTCTCGCGAGTGTCAGCAAAGCCACCACCTGGAGATCAATTTAAACACCTTATCCCTCTTATGTACAAAGGACTTCCTTGGAACGTGGTGAGAATCAAGATAGTCCAAATGCTATCCGATACCTTAAAGAATCTTAGTGACCGTGTCGTATTTGTGCTTTGGGCACACGGATTTGAACTTACATCAATGAAATACTTTGTGAAGATCGGTCCCGAGCGTACATGCTGCCTTTGCGATAGAAGAGCTACGTGTTTCAGTACCGCTTCAGATACATACGCATGCTGGCACCACTCAATAGGCTTCGATTACGTTTATAATCCGTTCATGATAGATGTGCAACAATGGGGATTCACGGGCAATCTGCAGAGCAACCACGATCTTTACTGCCAAGTGCACGGAAACGCACACGTGGCATCATGCGATGCAATCATGACAAGATGCCTTGCAGTGCACGAATGCTTTGTGAAGCGGGTCGATTGGACAATCGAATACCCTATCATCGGAGATGAACTTAAGATAAATGCAGCATGCAGAAAGGTCCAGCACATGGTGGTGAAAGCAGCACTTCTTGCAGATAAATTTCCTGTGCTTCACGATATCGGAAACCCTAAAGCAATCAAATGCGTGCCTCAAGCAGATGTGGAATGGAAATTCTATGACGCACAACCTTGCTCAGATAAAGCATACAAGATAGAGGAACTATTCTATAGTTACGCAACACACTCAGATAAATTTACAGATGGAGTGTGCCTGTTCTGGAATTGCAACGTGGATAGATACCCTGCAAACTCAATCGTGTGCAGATTTGATACAAGAGTGCTTTCAAACCTTAACCTTCCAGGTTGTGACGGCGGCAGTCTATATGTTAATAAGCACGCATTTCACACACCTGCATTCGATAAGTCCGCATTCGTCAATTTAAAGCAGCTACCTTTCTTCTATTATTCAGATTCACCTTGCGAATCACACGGAAAGCAGGTTGTCAGTGACATCGATTACGTGCCTCTTAAATCAGCAACATGTATTACCAGGTGTAATCTTGGAGGAGCCGTCTGTCGACATCATGCAAACGAATACAGACTTTACCTTGATGCATACAACATGATGATCTCCGCCGGGTTCTCCCTATGGGTGTACAAACAATTTGATACATACAACCTTTGGAACACATTTACAAGACTTCAATCACTTGAGAACGTTGCGTTCAATGTAGTCAATAAGGGACACTTCGACGGTCAACAGGGTGAGGTTCCTGTGTCAATCATCAACAATACCGTTTATACTAAAGTTGACGGCGTGGATGTGGAACTCTTCGAGAATAAGACTACGCTTCCTGTGAATGTTGCCTTCGAGTTGTGGGCAAAGCGCAATATCAAACCTGTGCCTGAAGTGAAGATACTCAATAACCTTGGAGTGGATATCGCAGCAAACACAGTGATCTGGGATTACAAGAGGGACGCACCTGCACACATCTCAACAATCGGAGTGTGCTCAATGACAGATATCGCAAAGAAGCCGACTGAAACAATCTGCGCACCTCTTACTGTATTCTTCGACGGAAGAGTGGATGGACAAGTGGATTTATTCCGAAATGCAAGAAACGGAGTGCTTATCACAGAAGGATCAGTGAAAGGACTTCAACCTTCAGTGGGACCTAAACAAGCATCACTTAACGGAGTGACTCTGATAGGCGAGGCCGTGAAGACTCAGTTTAACTACTACAAGAAAGTAGACGGTGTCGTCCAGCAGCTGCCCGAGACCTATTTCACACAATCACGGAATCTGCAGGAGTTCAAACCTAGATCACAAATGGAAATCGATTTCCTGGAGCTTGCAATGGATGAATTTATCGAAAGATACAAACTTGAAGGATACGCATTTGAACACATCGTGTACGGAGATTTCAGTCATTCACAACTTGGAGGACTTCACCTTCTTATTGGCCTAGCCAAACGTTTCAAAGAATCACCTTTCGAGCTCGAAGATTTCATTCCAATGGATTCAACAGTGAAGAATTATTTCATTACTGACGCCCAGACGGGATCATCAAAGTGTGTATGCTCAGTGATCGATCTACTACTAGACGATTTCGTTGAAATTATTAAATCACAAGACTTGAGTGTAGTTAGTAAGGTTGTGAAGGTCACAATCGATTACACAGAAATCTCATTTATGCTTTGGTGCAAAGATGGACACGTGGAAACATTCTATCCCAAACTTCAATCATCACAAGCATGGCAACCTGGAGTGGCCATGCCGAATTTGTATAAGATGCAGAGAATGCTTCTTGAGAAGTGTGACCTTCAGAATTATGGAGATTCAGCAACACTTCCTAAAGGAATCATGATGAACGTGGCAAAGTATACTCAACTTTGCCAATACCTTAACACACTTACACTTGCAGTGCCTTACAACATGAGAGTGATCCACTTCGGTGCAGGGTCGGACAAAGGAGTGGCACCTGGTACTGCTGTCCTTAGACAATGGCTTCCTACAGGAACACTTCTTGTGGATTCAGATCTTAACGATTTCGTCTCCGATGCAGATTCAACCCTCATTGGTGACTGTGCAACAGTGCACACAGCAAACAAGTGGGACTTAATAATATCAGATATGTACGATCCTAAGACTAAGAATGTAACGAAAGAGAATGACTCAAAGGAAGGTTTCTTCACCTATATCTGCGGATTTATCCAACAGAAGTTAGCTCTTGGAGGATCAGTGGCAATCAAGATTACGGAACACTCATGGAACGCAGATCTTTACAAACTTATGGGACACTTTGCATGGTGGACCGCGTTCGTTACAAACGTAAACGCGTCGTCCTCAGAAGCATTTCTTATCGGATGCAACTACCTTGGGAAACCAAGAGAGCAGATCGATGGATACGTGATGCACGCAAACTACATCTTCTGGAGGAACACAAACCCTATCCAACTTTCATCATACTCACTCTTCGACATGTCAAAGTTCCCGCTTAAACTTAGAGGGACTGCCGTAATGTCGCTTAAAGAAGGACAAATCAACGATATGATACTCAGCCTCCTAAGTAAAGGGAGGCTTATCATCAGAGAGAATAATAGAGTGGTGATCTCATCAGATGTGCTTGTGAACAACTAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGTCTAGA(SEQ ID No.19)。
(Ⅱ)中含有新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因。
由于新型冠状病毒SARS-CoV-2的蛋白S、ORF3a、M、ORF7a、ORF8、或N蛋白的表达依赖于nsp1~nsp16这16个蛋白成熟后形成病毒的转录酶/复制酶复合体的参与以及病毒基因组中的5’UTR序列,3’UTR序列,以及转录调控区域TRS序列,因此,在(Ⅱ)中转录调控区域TRS序列可以选用S、ORF3a、M、ORF7a、ORF8、或N的TRS序列中的至少一种,TRS区域的核心序列(AAACGAAC)单独使用或于其他序列组合使用都可行。由于报告基因B的上游连接了新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域,因此报告基因B的表达依赖于ps2AN,ps2AC,ps2B转录翻译成熟形成的Nsp1-Nsp16复制酶/转录酶复合体。
S蛋白的转录调控区域(S-TRS)的核苷酸序列如SEQ ID No.20所示;ORF3a蛋白的转录调控区域(ORF3a-TRS)的核酸序列如SEQ ID No.21所示;M蛋白的转录调控区域(M-TRS)的核酸序列如SEQ ID No.22所示;ORF7a蛋白的转录调控区域(ORF7a-TRS)的核酸序列如SEQ ID No.23所示;ORF8蛋白的转录调控区域(ORF8-TRS)的核酸序列如SEQ ID No.24所示;N蛋白的转录调控区域(N-TRS)的核酸序列如SEQ ID No.25所示。
AGTGATGTTCTTGTTAACAACTAAACGAACAATGTTTGTTTTTCTTGTTT(SEQ ID No.20);
AGTCAAATTACATTACACATAAACGAACTTATGGATTTGTTTATGAGAAT(SEQ ID No.21);
TGATCTTCTGGTCTAAACGAACTAAATATTATATTAGTTTTTCTGTTTGGAACTTTAATTTTAGCC(SEQ ID No.22);
GCAACCAATGGAGATTGATTAAACGAACATGAAAATTATTCTTTTCTTGG(SEQ ID No.23);
TTGAACTTTCATTAATTGACTTCTATTTGTGCTTTTTAGCCTTTCTGCTATTCCTTGTTTTAATTATGCTTATTATCTTTTGGTTCTCACTTGAACTGCAAGATCATAATGAAACTTGTCACGCCTAAACGAAC(SEQ IDNo.24);
TTTAGATTTCATCTAAACGAACAAACTAAAATGTCTGATAATGGACCCCA(SEQ ID No.25)。
为了使含有上述表达结构的复制子系统更加准确,在表达结构(Ⅱ)中引入作为对照的另一个报告基因。
该表达结构中依次连接有新型冠状病毒SARS-CoV-2的5’UTR、作为对照的报告基因A、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域、报告基因B、新型冠状病毒SARS-CoV-2的3’UTR的核酸序列,报告基因A与报告基因B选用不同种类的报告基因。例如报告基因A为荧光蛋白,报告基因B为荧光素酶(luciferase)。
新型冠状病毒SARS-CoV-2的5’UTR与报告基因A之间还连接有核糖体进入位点IRES的核酸序列。报告基因A末端插入翻译终止密码子。
本实施例中,报告基因A选用GFP绿色荧光蛋白,其末端插入4个终止密码子;报告基因B选用荧光素酶;TRS序列选用M蛋白的转录调控区域(M-TRS)序列。
新型冠状病毒SARS-CoV-2的5’UTR的核苷酸序列如SEQ ID No.26所示:
ATTAAAGGTTTATACCTTCCCAGGTAACAAACCAACCAACTTTCGATCTCTTGTAGATCTGTTCTCTAAACGAACTTTAAAATCTGTGTGGCTGTCACTCGGCTGCATGCTTAGTGCACTCACGCAGTATAATTAATAACTAATTACTGTCGTTGACAGGACACGAGTAACTCGTCTATCTTCTGCAGGCTGCTTACGGTTTCGTCCGTGTTGCAGCCGATCATCAGCACATCTAGGTTTCGTCCGGGTGTGACCGAAAGGTAAG(SEQ ID No.26)
新型冠状病毒SARS-CoV-2的3’UTR的核苷酸序列如SEQ ID No.27所示:
TGGGCTATATAAACGTTTTCGCTTTTCCGTTTACGATATATAGTCTACTCTTGTGCAGAATGAATTCTCGTAACTACATAGCACAAGTAGATGTAGTTAACTTTAATCTCACATAGCAATCTTTAATCAGTGTGTAACATTAGGGAGGACTTGAAAGAGCCACCACATTTTCACCGAGGCCACGCGGAGTACGATCGAGTGTACAGTGAACAATGCTAGGGAGAGCTGCCTATATGGAAGAGCCCTAATGTGTAAAATTAATTTTAGTAGTGCTATCCCCATGTGATTTTAATA(SEQ ID No.27)。
所述插入的核糖体进入位点IRES的核苷酸序列优选如SEQ ID No.28所示:
GAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAA(SEQ ID No.28)。
所述插入的4个终止密码子的核苷酸序列优选如SEQ ID No.29所示:TAATAATAATAA(SEQ ID No.29)。
本实施例中,Ps2V分子的5’端为SARS-CoV-2的5’端的非编码区域5’-UTR,下游为核糖体进入位点IRES,再下游为GFP报告基因,其中GFP报告基因末端插入4个翻译终止密码子,再下游为SARS-CoV-2的M蛋白的转录调控区域TRS连接的萤火虫荧光素酶基因,3’端为SARS-CoV-2的3’端非编码区域5’-UTR。
最终构建出表达结构ps2V。ps2V的核苷酸序列如SEQ ID No.30所示:
GCTAGCATTAAAGGTTTATACCTTCCCAGGTAACAAACCAACCAACTTTCGATCTCTTGTAGATCTGTTCTCTAAACGAACTTTAAAATCTGTGTGGCTGTCACTCGGCTGCATGCTTAGTGCACTCACGCAGTATAATTAATAACTAATTACTGTCGTTGACAGGACACGAGTAACTCGTCTATCTTCTGCAGGCTGCTTACGGTTTCGTCCGTGTTGCAGCCGATCATCAGCACATCTAGGTTTCGTCCGGGTGTGACCGAAAGGTAAGGTGGAGAGCCTTGTCCCTGGTTTCAACGAGAAAACACACGTCCAACTCAGTTTGCCTGTTTTACAGGTTCGCGACGTGCTCGTACGTGGCTTTGGAGACTCCGTGGAGGAGGTCTTATCAGAGGCACGTCAACATCTTAAAGATGGCACTTGTGGCTTAGTAGAAGTTGAAAAAGGCGTTTTGCCTCAACTTGAACAGCCTGAGCTTTGGGCTAAGCGCAACATTAAACCAGTACCAGAGGTGAAAATACTCAATAATTTGGGTGTGGACATTGCTGCTAATACTGTGATCTGGGACTACAAAAGAGATGCTCCAGCACATATATCTACTATTGGTGTTTGTTCTATGACTGACATAGCCAAGAAACCAACTGAAACGATTTGTGCACCACTCACTGTCTTTTTTGATGGTAGAGTTGATGGTCAAGTAGACTTATTTAGAAATGCCCGTAATGGTGTTCTTATTACAGAAGGTAGTGTTAAAGGTTTACAACCATCTGTAGGTCCCAAACAAGCTAGTCTTAATGGAGTCACATTAATTGGAGAAGCCGTAAAAACACAGTTCAATTATTATAAGAAAGTTGATGGTGTTGTCCAACAATTACCTGAAACTTACTTTACTCAGAGTAGAAATTTACAAGAATTTAAACCCAGGAGTCAAATGGAAATTGATTTCTTAGAATTAGCTATGGATGAATTCATTGAACGGTATAAATTAGAAGGCTATGCCTTCGAACATATCGTTTATGGAGATTTTAGTCATGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAGCGGCCGCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAATAATAAGATATCTGATCTTCTGGTCTAAACGAACTAAATATTATATTAGTTTTTCTGTTTGGAACTTTAATTTTAGCCATGGCCGATGCTAAGAACATTAAGAAGGGCCCTGCTCCCTTCTACCCTCTGGAGGATGGCACCGCTGGCGAGCAGCTGCACAAGGCCATGAAGAGGTATGCCCTGGTGCCTGGCACCATTGCCTTCACCGATGCCCACATTGAGGTGGACATCACCTATGCCGAGTACTTCGAGATGTCTGTGCGCCTGGCCGAGGCCATGAAGAGGTACGGCCTGAACACCAACCACCGCATCGTGGTGTGCTCTGAGAACTCTCTGCAGTTCTTCATGCCAGTGCTGGGCGCCCTGTTCATCGGAGTGGCCGTGGCCCCTGCTAACGACATTTACAACGAGCGCGAGCTGCTGAACAGCATGGGCATTTCTCAGCCTACCGTGGTGTTCGTGTCTAAGAAGGGCCTGCAGAAGATCCTGAACGTGCAGAAGAAGCTGCCTATCATCCAGAAGATCATCATCATGGACTCTAAGACCGACTACCAGGGCTTCCAGAGCATGTACACATTCGTGACATCTCATCTGCCTCCTGGCTTCAACGAGTACGACTTCGTGCCAGAGTCTTTCGACAGGGACAAAACCATTGCCCTGATCATGAACAGCTCTGGGTCTACCGGCCTGCCTAAGGGCGTGGCCCTGCCTCATCGCACCGCCTGTGTGCGCTTCTCTCACGCCCGCGACCCTATTTTCGGCAACCAGATCATCCCCGACACCGCTATTCTGAGCGTGGTGCCATTCCACCACGGCTTCGGCATGTTCACCACCCTGGGCTACCTGATTTGCGGCTTTCGGGTGGTGCTGATGTACCGCTTCGAGGAGGAGCTGTTCCTGCGCAGCCTGCAAGACTACAAAATTCAGTCTGCCCTGCTGGTGCCAACCCTGTTCAGCTTCTTCGCTAAGAGCACCCTGATCGACAAGTACGACCTGTCTAACCTGCACGAGATTGCCTCTGGCGGCGCCCCACTGTCTAAGGAGGTGGGCGAAGCCGTGGCCAAGCGCTTTCATCTGCCAGGCATCCGCCAGGGCTACGGCCTGACCGAGACAACCAGCGCCATTCTGATTACCCCAGAGGGCGACGACAAGCCTGGCGCCGTGGGCAAGGTGGTGCCATTCTTCGAGGCCAAGGTGGTGGACCTGGACACCGGCAAGACCCTGGGAGTGAACCAGCGCGGCGAGCTGTGTGTGCGCGGCCCTATGATTATGTCCGGCTACGTGAATAACCCTGAGGCCACAAACGCCCTGATCGACAAGGACGGCTGGCTGCACTCTGGCGACATTGCCTACTGGGACGAGGACGAGCACTTCTTCATCGTGGACCGCCTGAAGTCTCTGATCAAGTACAAGGGCTACCAGGTGGCCCCAGCCGAGCTGGAGTCTATCCTGCTGCAGCACCCTAACATTTTCGACGCCGGAGTGGCCGGCCTGCCCGACGACGATGCCGGCGAGCTGCCTGCCGCCGTCGTCGTGCTGGAACACGGCAAGACCATGACCGAGAAGGAGATCGTGGACTATGTGGCCAGCCAGGTGACAACCGCCAAGAAGCTGCGCGGCGGAGTGGTGTTCGTGGACGAGGTGCCCAAGGGCCTGACCGGCAAGCTGGACGCCCGCAAGATCCGCGAGATCCTGATCAAGGCTAAGAAAGGCGGCAAGATCGCCGTGTAAGGATCCGTGGGCTATATAAACGTTTTCGCTTTTCCGTTTACGATATATAGTCTACTCTTGTGCAGAATGAATTCTCGTAACTACATAGCACAAGTAGATGTAGTTAACTTTAATCTCACATAGCAATCTTTAATCAGTGTGTAACATTAGGGAGGACTTGAAAGAGCCACCACATTTTCACCGAGGCCACGCGGAGTACGATCGAGTGTACAGTGAACAATGCTAGGGAGAGCTGCCTATATGGAAGAGCCCTAATGTGTAAAATTAATTTTAGTAGTGCTATCCCCATGTGATTTTAATAGCTTCTTAGGAGAATGACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGTCTAGA(SEQ ID No.30)。
将上述(Ⅰ)和(Ⅱ)中的复制子结构插入表达载体中,构建出一组含有以下内容的复制子系统:
(ⅰ)编码新型冠状病毒SARS-CoV-2的非结构蛋白的核酸序列;
(ⅱ)新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因的核酸序列。
表达载体可根据检测目的选用真核表达载体或原核表达载体。
本实施例中选用pcDNA3.1质粒作为表达载体,将ps2V、ps2AN、ps2AC、ps2B通过NheI和XbaI双酶切分别插入pcDNA3.1质粒中(质粒图谱图附图7所示),构建了4个真核表达载体(如附图5所示)。
实施例2新型冠状病毒SARS-CoV-2复制子系统的建立
实施例1中复制子系统构建的目的为筛选抗新型冠状病毒SARS-CoV-2的药物,特别是人类的药物,因此选用HEK 293T细胞系作为包装细胞,进行验证。ps2V、ps2AN、ps2AC、ps2B4个表达载体在人体或人体细胞中工作原理示意图如附图6所示。
将生长状态良好的HEK293T细胞平均铺于用多聚赖氨酸处理的12孔培养板中(细胞密度约为6.5×104/cm2),要求细胞呈单个均匀分布。培养约24h后,细胞汇合度应接近80%。此时,按照如表1配制Opti-Lipo2000-DNA混合液,进行转染。
4种载体的浓度可在0.01~1μg/μL间,4种载体之间的配比可在改范围内进行调整。
表1 Opti-Lipo2000-DNA混合液体系
Figure BDA0002633756560000241
转染后,可通过观察细胞中绿色荧光蛋白的表达情况来评估传染效果。如附图8中可以看出ps2V单独转染,或是ps2V与ps2AN,ps2AC,ps2B质粒混合转染,都有着高水平的GFP表达,说明该转染方案可让ps2V质粒有效表达,且因GFP的表达水平不依赖于SARS-CoV-2转录调控区域TRS的调控,所以GFP的表达与ps2AN,ps2AC,ps2B转染无关。
随后按照检测的时间点,将Promega细胞裂解液200μl加入细胞,用吸液器反复吹打细胞,将裂解液装入1.5mL Ep管中,置于振荡器上常温振荡20min。利用荧光素酶检测系统检测不同时间点的细胞内荧光素酶活性,结果如图9所示,可以看出ps2V,ps2AN,ps2AC,ps2B共转染的细胞在转染后54h左右细胞荧光素酶活性达到高峰,随后逐步下降。而只转染ps2V的细胞荧光素酶活性维持在低水平,首先说明了HEK293T细胞能够很好地支持本发明建立的新型冠状病毒SARS-CoV-2的安全型复制子的复制和转录,也进一步说明了本发明建立的新型冠状病毒SARS-CoV-2系统的有效性,该结果说明实施例1中构建的复制子系统在包装细胞中可以实现功能。
实施例3检测新型冠状病毒SARS-CoV-2复制子系统性能
按照实施例2中的步骤将ps2V,ps2AN,ps2AC,ps2B质粒进行转染。转染后6h,按照浓度梯度(20μM,10μM,5μM,2.5μM,1.25μM,0.625μM,0.3125μM,0.15625μM,0.078125μM,0.0390625μM)加入瑞德西韦(Remdesivir),洛匹那韦(Lopinavir),利托那韦(Ritonavir)。药物处理24h,检测细胞荧光素酶活性,以DMSO对照为基准,计算抑制率,并利用GraphpadPrism 7.0软件统计药物的半抑制浓度(下称IC50)。具体结果见图10至12。
其中图10结果显示瑞德西韦(Remdesivir)的IC50为12.4±1.08μM;图11结果显示洛匹那韦(Lopinavir)的IC50为6.785±1.09μM;图12结果显示利托那韦(Ritonavir)的IC50为14.77±1.05μM。
以上数据结果说明实施例1中构建的复制子系统,可以重现野生型SARS-CoV-2对药物的反应,IC50较为接近,说明构建的新型冠状病毒SARS-CoV-2复制子系统可以高度模拟野生型SARS-CoV-2对药物的反应。
实施例4通过新型冠状病毒SARS-CoV-2复制子系统进行药物筛选
将生长状态良好的HEK293T细胞平均铺于用多聚赖氨酸处理的96孔培养板中(细胞密度约为6.5×104/cm2),要求细胞呈单个均匀分布。培养约24h后,细胞汇合度应接近80%。按照实施例2中的步骤将ps2V,ps2AN,ps2AC,ps2B质粒比例进行转染。转染后6h,每孔加入成药库中的药物。药物处理后24h,检测细胞荧光素酶活性,以DMSO对照为基准,计算抑制率。经过4轮筛选,初步确定M01,A01,R01药物对病毒RNA复制有抑制效果,并利用Graphpad Prism 7.0软件统计药物的IC50,具体结果如附图13所示,可以看出M01的IC50为0.6521±0.0661μM,A01的IC50为0.5639±0.0175μM,R01的IC50为7.319±1.210μM。
随后进一步验证候选药物M01,A01,R01对野生型新型冠状病毒SARS-CoV-2的抑制效果。将一个生长状态良好的HEK293T细胞平均铺于用多聚赖氨酸处理的48孔培养板中(细胞密度约为6.5×104/cm2)。当细胞生长16h后(细胞密度约为1.6×105/mL),转染表达SARS-CoV-2的结合受体ACE2基因的质粒pCMV-ACE2-FLAG质粒0.1g。转染后24h,用PBS冲洗细胞后,感染野生型新型冠状病毒SARS-CoV-2(MOI=0.1,37℃,1h)。随后,替换含有不同浓度梯度(20μM,5μM,1.25μM,0.3125μM,0.078125μM,0.01953125μM)M01,A01,R01药物的DMEM(2%FBS)。药物处理24h后,利用TRIZOL提取细胞RNA,SARS-CoV-2的RNA拷贝利用达安基因的新型冠状病毒2019-nCOV核酸检测(PCR-荧光探针法)进行检测。获得Ct值,根据标准曲线计算病毒拷贝数,计算抑制率,并利用Graphpad Prism 7.0软件统计药物的IC50,结果如图14所示。
可以看出在抑制野生型SARS-CoV-2生长时:M01的IC50为:0.597±0.341μM,A01的IC50为:0.1396±0.0913μM,R01的IC50为:11.25±1.89μM,表现出明显的抗性。
以上实验结果进一步说明利用实施例1中构建的SARS-CoV-2复制子系统筛选的候选药物,可以有效抑制野生型SARS-CoV-2,SARS-CoV-2复制子系统可以作为可靠的抗SARS-CoV-2药物筛选系统。
实施例5新型冠状病毒SARS-CoV-2复制子系统检测评估突变对病毒复制的影响
根据上述实施例的结果,也可以预料利用实施例1中构建的复制子系统可以监测SARS-CoV-2在流行过程中所产生突变对SARS-CoV-2病毒复制的影响。
病毒分子进化学研究如附图15显示,SARS-CoV-2在全球流行中,5’UTR_241C是病毒早期流行的优势毒株,而5’UTR_241T是目前(截止2020年8月)流行的主要毒株。
在实施例1中构建的复制子系统中,5’UTR位于ps2V分子上,利用诺唯赞公司的MutExpress II Fast Mutagenesis试剂盒,将ps2V的5’UTR的241位C突变为T,构建了5’UTR_241T_ps2V。将5’UTR_241T_ps2V按照实施例2的实验方法进行转染,5’UTR_241C_ps2V作为实验对照,利用荧光素酶检测系统检测细胞内荧光素酶活性,结果如图16所示。
从图中可以看出,5’UTR_241T_ps2V的荧光素酶活性读值较5’UTR_241C_ps2V低,说明5’UTR_C241T的突变对病毒的复制是负性影响,一定程度上表明当前流行的5’UTR_241T的毒株较早期流行的5’UTR_241C毒株毒力降低。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
SEQUENCE LISTING
<110> 中山大学
<120> 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用
<130>
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 540
<212> DNA
<213> 人工序列
<400> 1
atggagtccc tggtgcccgg cttcaacgag aagacccacg tgcagctgtc tctgcctgtg 60
ctgcaggtga gggatgtgct ggtgcgcggc tttggcgact ccgtcgagga ggtgctgtct 120
gaggccaggc agcacctgaa ggacggaacc tgcggactgg tggaggtgga gaagggcgtg 180
ctgccacagc tggagcagcc ttacgtgttc atcaagaggt ccgatgcaag gacagcacca 240
cacggacacg tgatggtgga gctggtggcc gagctggagg gcatccagta tggccgctct 300
ggagagaccc tgggcgtgct ggtgccacac gtgggagaga tcccagtggc ctatcggaag 360
gtgctgctga gaaagaacgg caataaggga gcaggaggac actcttacgg agcagacctg 420
aagagcttcg atctgggcga cgagctgggc accgatcctt atgaggactt tcaggagaac 480
tggaatacaa agcacagctc cggcgtgacc cgggagctga tgagagagct gaacggcggc 540
<210> 2
<211> 1914
<212> DNA
<213> 人工序列
<400> 2
gcctacacca gatatgtgga taacaatttc tgcggaccag acggataccc cctggagtgt 60
atcaaggatc tgctggccag agcaggcaag gcctcctgca ccctgtctga gcagctggac 120
ttcatcgaca caaagcgggg cgtgtattgc tgtagagagc acgagcacga gatcgcctgg 180
tataccgagc ggtccgagaa gtcttacgag ctgcagacac cattcgagat caagctggcc 240
aagaagttcg acaccttcaa cggcgagtgt ccaaacttcg tgtttcccct gaatagcatc 300
atcaagacca tccagcccag agtggagaag aagaagctgg atggctttat gggcaggatc 360
cgcagcgtgt accctgtggc ctccccaaac gagtgcaatc agatgtgcct gtccacactg 420
atgaagtgcg atcactgtgg cgagacctct tggcagacag gcgacttcgt gaaggccacc 480
tgcgagtttt gtggcaccga gaacctgaca aaggagggcg ccaccacatg cggctatctg 540
cctcagaatg ccgtggtgaa gatctactgc ccagcctgtc acaactccga agtgggacca 600
gagcactctc tggccgagta ccacaatgag tccggcctga agacaatcct gaggaaggga 660
ggaaggacca tcgccttcgg cggatgcgtg ttttcttatg tgggctgcca caacaagtgt 720
gcatactggg tgccaagggc cagcgccaat atcggctgta accacaccgg agtggtggga 780
gagggatccg agggcctgaa cgataatctg ctggagatcc tgcagaagga gaaggtgaac 840
atcaatatcg tgggcgactt caagctgaac gaggagatcg ccatcatcct ggcctccttc 900
tctgccagca catccgcctt tgtggagacc gtgaagggcc tggactacaa ggccttcaag 960
cagatcgtgg agagctgcgg caacttcaag gtgaccaagg gcaaggccaa gaagggcgcc 1020
tggaacatcg gcgagcagaa gagcatcctg tcccctctgt atgccttcgc cagcgaggca 1080
gcaagggtgg tgagatctat ctttagccgg accctggaga cagcccagaa ttccgtgaga 1140
gtgctgcaga aggccgccat caccatcctg gatggcatct cccagtactc tctgaggctg 1200
atcgatgcca tgatgttcac ctccgacctg gccacaaaca atctggtggt catggcctac 1260
atcaccggcg gcgtggtgca gctgacctct cagtggctga caaacatctt tggcaccgtg 1320
tatgagaagc tgaagccagt gctggattgg ctggaggaga agttcaagga gggcgtggag 1380
tttctgcgcg acggctggga gatcgtgaag ttcatcagca cctgcgcatg tgagatcgtg 1440
ggaggacaga tcgtgacctg tgccaaggag atcaaggagt ccgtgcagac attctttaag 1500
ctggtgaaca agttcctggc cctgtgcgcc gactctatca tcatcggcgg cgccaagctg 1560
aaggccctga acctgggcga gacctttgtg acacacagca agggcctgta caggaagtgc 1620
gtgaagtccc gcgaggagac cggactgctg atgcccctga aggcacctaa ggagatcatc 1680
ttcctggagg gcgagaccct gcccacagag gtgctgacag aggaggtggt gctgaagacc 1740
ggcgacctgc agccactgga gcagcccacc agcgaggcag tggaggcacc tctggtgggc 1800
acaccagtgt gcatcaatgg cctgatgctg ctggagatca aggataccga gaagtactgt 1860
gccctggccc ctaacatgat ggtgacaaac aataccttca cactgaaggg cggc 1914
<210> 3
<211> 5949
<212> DNA
<213> 人工序列
<400> 3
gccccaacca aggtgacatt tggcgacgat accgtgatcg aggtgcaggg ctacaagtct 60
gtgaatatca cattcgagct ggatgagaga atcgacaagg tgctgaacga gaagtgcagc 120
gcctatacag tggagctggg caccgaggtg aacgagtttg cctgcgtggt ggccgacgcc 180
gtgatcaaga ccctgcagcc agtgtccgag ctgctgacac ccctgggcat cgatctggac 240
gagtggtcta tggccaccta ctatctgttc gacgagagcg gcgagtttaa gctggcctcc 300
cacatgtact gctctttcta tccccctgat gaagacgagg aggagggcga ttgcgaggag 360
gaggagtttg agcccagcac acagtacgag tatggcaccg aggacgatta ccagggcaag 420
ccactggagt tcggagccac ctccgccgcc ctgcagccag aggaggagca ggaggaggat 480
tggctggacg atgactccca gcagaccgtg ggccagcagg atggctctga ggacaatcag 540
accacaacca tccagacaat cgtggaggtg cagcctcagc tggagatgga gctgacccca 600
gtggtgcaga ccatcgaggt gaactctttc agcggctatc tgaagctgac agataacgtg 660
tacatcaaga acgccgacat tgtggaggag gccaagaagg tgaagcctac cgtggtggtg 720
aacgccgcca acgtgtacct gaagcacgga ggaggagtgg caggcgccct gaacaaggcc 780
accaacaatg ccatgcaggt ggagagcgat gactatatcg ccacaaatgg acccctgaag 840
gtcggaggaa gctgcgtgct gtccggacac aacctggcca agcactgtct gcacgtggtg 900
ggccctaacg tgaataaggg cgaggacatc cagctgctga agtccgccta cgagaacttc 960
aatcagcacg aggtgctgct ggcccctctg ctgagcgccg gcatctttgg cgccgatcca 1020
atccactccc tgagggtgtg cgtggacacc gtgcgcacaa acgtgtacct ggccgtgttc 1080
gataagaacc tgtacgacaa gctggtgtct agctttctgg agatgaagag cgagaagcag 1140
gtggagcaga agatcgccga gatccctaag gaggaggtga agccattcat caccgagagc 1200
aagccttccg tggagcagag gaagcaggat gacaagaaga tcaaggcctg cgtggaggag 1260
gtgacaacca cactggagga gaccaagttc ctgacagaga acctgctgct gtacatcgat 1320
atcaacggca atctgcaccc agacagcgcc acactggtgt ccgatatcga catcaccttt 1380
ctgaagaagg atgccccata tatcgtgggc gacgtggtgc aggagggcgt gctgacagcc 1440
gtggtcatcc ccaccaagaa ggccggcggc accacagaga tgctggccaa ggccctgcgc 1500
aaggtgccta ccgacaatta catcaccaca tatccaggcc agggcctgaa cggctatacc 1560
gtggaggagg ccaagaccgt gctgaagaag tgcaagagcg ccttctacat cctgccttct 1620
atcatcagca atgagaagca ggagatcctg ggcaccgtgt cctggaacct gagggagatg 1680
ctggcccacg ccgaggagac acgcaagctg atgcccgtgt gcgtggagac aaaggccatc 1740
gtgagcacca tccagcggaa gtataagggc atcaagatcc aggagggagt ggtggactac 1800
ggagcaagat tctactttta tacctctaag accacagtgg ccagcctgat caacacactg 1860
aatgatctga acgagaccct ggtgacaatg cccctgggct atgtgaccca cggcctgaat 1920
ctggaggagg ccgccaggta catgcgctcc ctgaaggtgc cagcaaccgt gagcgtgagc 1980
tctcctgacg ccgtgacagc ctacaacggc tatctgacaa gctcctctaa gaccccagag 2040
gagcacttca tcgagaccat ctctctggcc ggcagctata aggattggtc ctactctggc 2100
cagtccacac agctgggcat cgagtttctg aagaggggcg acaagagcgt gtactatacc 2160
agcaatccca ccacattcca cctggatggc gaagtgatca ccttcgacaa cctgaagacc 2220
ctgctgagcc tgcgggaggt gagaaccatc aaggtgttca ccacagtgga taacatcaat 2280
ctgcacacac aggtggtgga catgtccatg acctatggcc agcagtttgg cccaacatac 2340
ctggatggcg ccgacgtgac caagatcaag ccccacaata gccacgaggg caagacattc 2400
tacgtgctgc ctaatgccac caacttttcc ctgctgaagc aggcaggcga cgtggaggag 2460
aacccaggac cagatgacac cctgagggtg gaggccttcg agtactatca caccacagat 2520
cctagctttc tgggccgcta tatgtccgcc ctgaatcaca ccaagaagtg gaagtaccca 2580
caggtgaacg gcctgacaag catcaagtgg gccgacaaca attgctacct ggccaccgcc 2640
ctgctgacac tgcagcagat cgagctgaag ttcaacccac ccgccctgca ggatgcatac 2700
tatagggcaa gagcaggaga ggcagccaat ttttgcgccc tgatcctggc ctattgtaac 2760
aagaccgtgg gagagctggg cgatgtgcgg gagacaatga gctacctgtt ccagcacgcc 2820
aatctggact cctgcaagag agtgctgaac gtggtgtgca agacatgtgg ccagcagcag 2880
accacactga agggcgtgga ggccgtgatg tatatgggca ccctgagcta cgagcagttt 2940
aagaagggcg tgcagatccc ctgcacatgt ggcaagcagg ccaccaagta cctggtgcag 3000
caggagtccc ctttcgtgat gatgtctgcc cctccagccc agtatgagct gaagcacggc 3060
acctttacat gcgcctctga gtacaccggc aattatcagt gtggccacta taagcacatc 3120
accagcaagg agacactgta ctgcatcgat ggcgccctgc tgaccaagag ctccgagtac 3180
aagggcccca tcacagacgt gttctataag gagaattctt acaccacaac catcgccacc 3240
aactttagcc tgctgaagca ggccggcgat gtggaggaga accctggacc aaagcccgtg 3300
acctataagc tggacggcgt ggtgtgcaca gagatcgatc ctaagctgga caactactac 3360
aagaaggata actcttattt caccgagcag cccatcgacc tggtgcctaa tcagccttac 3420
ccaaacgcca gcttcgataa tttcaagttc gtgtgcgaca atatcaagtt tgccgatgac 3480
ctgaaccagc tgaccggata caagaagcca gccagccggg agctgaaggt gacattcttt 3540
cctgatctga acggcgacgt ggtggccatc gactacaagc actatacacc ttccttcaag 3600
aagggcgcca agctgctgca caagccaatc gtgtggcacg tgaacaatgc caccaataag 3660
gccacataca agccaaacac ctggtgcatc agatgtctgt ggtctacaaa gcccgtggag 3720
accagcaatt cctttgatgt gctgaagagc gaggatgccc agggcatgga caacctggcc 3780
tgcgaggacc tgaagcccgt gagcgaggag gtggtggaga atcctaccat ccagaaggat 3840
gtgctggagt gtaacgtgaa gacaaccgag gtggtgggcg acatcatcct gaagcctgcc 3900
aacaattccc tgaagatcac agaggaagtg ggccacaccg atctgatggc cgcctacgtg 3960
gacaattcta gcctgaccat caagaagcca aacgagctga gcagggtgct gggcctgaag 4020
accctggcca cacacggcct ggccgcagtg aattccgtgc catgggacac catcgccaat 4080
tatgccaagc ccttcctgaa caaggtggtg agcacaacca caaacatcgt gacacggtgc 4140
ctgaaccggg tgtgcaccaa ttacatgcca tatttcttta cactgctgct gcagctgtgc 4200
acctttacaa ggtccaccaa ttctcgcatc aaggcctcca tgcccaccac aatcgccaag 4260
aacacagtga agagcgtggg caagttctgc ctggaggcct cctttaacta cctgaagtcc 4320
cccaatttct ctaagctgat caacatcatc atctggtttc tgctgctgag cgtgtgcctg 4380
ggcagcctga tctattccac agccgccctg ggcgtgctga tgagcaacct gggcatgcct 4440
tcctactgca ccggctatcg ggagggctac ctgaatagca ccaacgtgac aatcgccacc 4500
tactgtacag gctctatccc atgcagcgtg tgcctgtccg gcctggattc tctggacacc 4560
tatccttccc tggagaccat ccagatcaca atctcctctt tcaagtggga cctgaccgcc 4620
tttggcctgg tggcagagtg gttcctggcc tatatcctgt ttacaagatt cttttacgtg 4680
ctgggcctgg ccgccatcat gcagctgttc tttagctact tcgccgtgca ctttatctct 4740
aatagctggc tgatgtggct gatcatcaac ctggtgcaga tggcccccat ctccgccatg 4800
gtgaggatgt atatcttctt tgcctctttc tactacgtgt ggaagagcta cgtgcacgtg 4860
gtggacggct gcaatagctc cacctgcatg atgtgctaca agaggaaccg cgccacacgc 4920
gtggagtgta ccacaatcgt gaatggcgtg cggagaagct tctacgtgta tgccaacggc 4980
ggcaagggct tttgcaagct gcacaactgg aattgcgtga actgtgatac attctgtgcc 5040
ggcagcacct ttatctccga tgaggtggca agggacctgt ccctgcagtt caagagacca 5100
atcaatccca ccgatcagtc tagctacatc gtggactccg tgacagtgaa gaacggctct 5160
atccacctgt atttcgataa ggccggccag aagacatacg agaggcactc cctgtctcac 5220
tttgtgaatc tggacaacct gcgcgccaac aataccaagg gcagcctgcc catcaacgtg 5280
atcgtgttcg atggcaagtc caagtgcgag gagtcctctg ccaagagcgc ctccgtgtac 5340
tatagccagc tgatgtgcca gcctatcctg ctgctggacc aggccctggt gtccgatgtg 5400
ggcgactctg ccgaggtggc agtgaagatg tttgatgcct acgtgaatac cttcagcagc 5460
accttcaacg tgccaatgga gaagctgaag accctggtgg caacagcaga ggcagagctg 5520
gccaagaacg tgtccctgga caatgtgctg tctaccttca tcagcgccgc ccgccagggc 5580
tttgtggatt ctgacgtgga gacaaaggat gtggtggagt gcctgaagct gagccaccag 5640
tccgatatcg aggtgaccgg cgacagctgt aacaattata tgctgaccta caataaggtg 5700
gagaacatga caccccggga tctgggcgcc tgcatcgact gttctgccag acacatcaat 5760
gcccaggtgg ccaagagcca caatatcgcc ctgatctgga acgtgaagga cttcatgtct 5820
ctgagcgagc agctgaggaa gcagatccgc tccgccgcca agaagaacaa tctgcccttc 5880
aagctgacct gcgccaccac aaggcaggtg gtgaacgtgg tcaccacaaa gatcgccctg 5940
aagggcggc 5949
<210> 4
<211> 1503
<212> DNA
<213> 人工序列
<400> 4
aagatcgtga acaattggct gaagcagctg atcaaggtga ccctggtgtt cctgtttgtg 60
gccgccatct tctacctgat cacccccgtg cacgtgatgt ctaagcacac agatttttct 120
agcgagatca tcggctataa ggccatcgac ggaggagtga ccagggatat cgccagcacc 180
gacacatgct tcgccaataa gcacgccgat ttcgacacct ggtttagcca gaggggcggc 240
tcctacacaa acgacaaggc ctgtccactg atcgcagccg tgatcaccag ggaagtggga 300
ttcgtggtgc ctggactgcc aggaacaatc ctgaggacca caaatggcga cttcctgcac 360
tttctgcctc gcgtgttttc cgccgtgggc aacatctgct ataccccatc taagctgatc 420
gagtacaccg atttcgccac atccgcctgc gtgctggccg cagagtgtac catctttaag 480
gatgcctctg gcaagcccgt gccttactgt tatgacacaa atgtgctgga gggctctgtg 540
gcctatgaga gcctgcggcc agataccaga tacgtgctga tggacggcag catcatccag 600
ttccccaaca catatctgga gggctctgtg cgggtggtga ccacatttga cagcgagtac 660
tgccggcacg gcacctgtga gagatctgag gccggcgtgt gcgtgtccac atctggcagg 720
tgggtgctga acaatgatta ctatcgcagc ctgcctggcg tgttctgtgg cgtggacgcc 780
gtgaatctgc tgaccaacat gtttacacct ctgatccagc caatcggcgc cctggatatc 840
agcgcctcca tcgtggcagg aggaatcgtg gcaatcgtgg tgacatgcct ggcctactat 900
ttcatgcggt tccggagggc cttcggcgag tactctcacg tggtggcctt taataccctg 960
ctgttcctga tgagcttcac cgtgctgtgc ctgacccccg tgtatagctt cctgcctggc 1020
gtgtactccg tgatctacct gtatctgacc ttctacctga caaacgacgt gagctttctg 1080
gcccacatcc agtggatggt catgttcacc cccctggtgc ctttttggat cacaatcgcc 1140
tatatcatct gcatctccac caagcacttc tattggttct tttctaatta cctgaagcgg 1200
agagtggtgt ttaacggcgt gtctttcagc acctttgagg aggccgccct gtgcacattc 1260
ctgctgaaca aggagatgta cctgaagctg cggtccgacg tgctgctgcc actgacccag 1320
tacaatagat atctggccct gtataacaag tacaagtatt tctctggcgc catggatacc 1380
acaagctaca gagaggcagc atgctgtcac ctggcaaagg ccctgaatga tttttccaac 1440
tctggcagcg acgtgctgta ccagccccct cagacctcta tcacaagcgc cgtgctgcag 1500
taa 1503
<210> 5
<211> 918
<212> DNA
<213> 人工序列
<400> 5
agtggtttta gaaaaatggc attcccatct ggtaaagttg agggttgtat ggtacaagta 60
acttgtggta caactacact taacggtctt tggcttgatg acgtagttta ctgtccaaga 120
catgtgatct gcacctctga agacatgctt aaccctaatt atgaagattt actcattcgt 180
aagtctaatc ataatttctt ggtacaggct ggtaatgttc aactcagggt tattggacat 240
tctatgcaaa attgtgtact taagcttaag gttgatacag ccaatcctaa gacacctaag 300
tataagtttg ttcgcattca accaggacag actttttcag tgttagcttg ttacaatggt 360
tcaccatctg gtgtttacca atgtgctatg aggcccaatt tcactattaa gggttcattc 420
cttaatggtt catgtggtag tgttggtttt aacatagatt atgactgtgt ctctttttgt 480
tacatgcacc atatggaatt accaactgga gttcatgctg gcacagactt agaaggtaac 540
ttttatggac cttttgttga caggcaaaca gcacaagcag ctggtacgga cacaactatt 600
acagttaatg ttttagcttg gttgtacgct gctgttataa atggagacag gtggtttctc 660
aatcgattta ccacaactct taatgacttt aaccttgtgg ctatgaagta caattatgaa 720
cctctaacac aagaccatgt tgacatacta ggacctcttt ctgctcaaac tggaattgcc 780
gttttagata tgtgtgcttc attaaaagaa ttactgcaaa atggtatgaa tggacgtacc 840
atattgggta gtgctttatt agaagatgaa tttacacctt ttgatgttgt tagacaatgc 900
tcaggtgtta ctttccaa 918
<210> 6
<211> 870
<212> DNA
<213> 人工序列
<400> 6
agtgcagtga aaagaacaat caagggtaca caccactggt tgttactcac aattttgact 60
tcacttttag ttttagtcca gagtactcaa tggtctttgt tctttttttt gtatgaaaat 120
gcctttttac cttttgctat gggtattatt gctatgtctg cttttgcaat gatgtttgtc 180
aaacataagc atgcatttct ctgtttgttt ttgttacctt ctcttgccac tgtagcttat 240
tttaatatgg tctatatgcc tgctagttgg gtgatgcgta ttatgacatg gttggatatg 300
gttgatacta gtttgtctgg ttttaagcta aaagactgtg ttatgtatgc atcagctgta 360
gtgttactaa tccttatgac agcaagaact gtgtatgatg atggtgctag gagagtgtgg 420
acacttatga atgtcttgac actcgtttat aaagtttatt atggtaatgc tttagatcaa 480
gccatttcca tgtgggctct tataatctct gttacttcta actactcagg tgtagttaca 540
actgtcatgt ttttggccag aggtattgtt tttatgtgtg ttgagtattg ccctattttc 600
ttcataactg gtaatacact tcagtgtata atgctagttt attgtttctt aggctatttt 660
tgtacttgtt actttggcct cttttgttta ctcaaccgct actttagact gactcttggt 720
gtttatgatt acttagtttc tacacaggag tttagatata tgaattcaca gggactactc 780
ccacccaaga atagcataga tgccttcaaa ctcaacatta aattgttggg tgttggtggc 840
aaaccttgta tcaaagtagc cactgtacag 870
<210> 7
<211> 249
<212> DNA
<213> 人工序列
<400> 7
tctaaaatgt cagatgtaaa gtgcacatca gtagtcttac tctcagtttt gcaacaactc 60
agagtagaat catcatctaa attgtgggct caatgtgtcc agttacacaa tgacattctc 120
ttagctaaag atactactga agcctttgaa aaaatggttt cactactttc tgttttgctt 180
tccatgcagg gtgctgtaga cataaacaag ctttgtgaag aaatgctgga caacagggca 240
accttacaa 249
<210> 8
<211> 594
<212> DNA
<213> 人工序列
<400> 8
gctatagcct cagagtttag ttcccttcca tcatatgcag cttttgctac tgctcaagaa 60
gcttatgagc aggctgttgc taatggtgat tctgaagttg ttcttaaaaa gttgaagaag 120
tctttgaatg tggctaaatc tgaatttgac cgtgatgcag ccatgcaacg taagttggaa 180
aagatggctg atcaagctat gacccaaatg tataaacagg ctagatctga ggacaagagg 240
gcaaaagtta ctagtgctat gcagacaatg cttttcacta tgcttagaaa gttggataat 300
gatgcactca acaacattat caacaatgca agagatggtt gtgttccctt gaacataata 360
cctcttacaa cagcagccaa actaatggtt gtcataccag actataacac atataaaaat 420
acgtgtgatg gtacaacatt tacttatgca tcagcattgt gggaaatcca acaggttgta 480
gatgcagata gtaaaattgt tcaacttagt gaaattagta tggacaattc acctaattta 540
gcatggcctc ttattgtaac agctttaagg gccaattctg ctgtcaaatt acag 594
<210> 9
<211> 339
<212> DNA
<213> 人工序列
<400> 9
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 60
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 120
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 180
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 240
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 300
atggtacttg gtagtttagc tgccacagta cgtctacaa 339
<210> 10
<211> 417
<212> DNA
<213> 人工序列
<400> 10
gctggtaatg caacagaagt gcctgccaat tcaactgtat tatctttctg tgcttttgct 60
gtagatgctg ctaaagctta caaagattat ctagctagtg ggggacaacc aatcactaat 120
tgtgttaaga tgttgtgtac acacactggt actggtcagg caataacagt tacaccggaa 180
gccaatatgg atcaagaatc ctttggtggt gcatcgtgtt gtctgtactg ccgttgccac 240
atagatcatc caaatcctaa aggattttgt gacttaaaag gtaagtatgt acaaatacct 300
acaacttgtg ctaatgaccc tgtgggtttt acacttaaaa acacagtctg taccgtctgc 360
ggtatgtgga aaggttatgg ctgtagttgt gatcaactcc gcgaacccat gcttcag 417
<210> 11
<211> 39
<212> DNA
<213> 人工序列
<400> 11
tcagctgatg cacaatcgtt tttaaacggg tttgcggtg 39
<210> 12
<211> 2799
<212> DNA
<213> 人工序列
<400> 12
atgtcagcag atgcacaatc atttcttaac agagtgtgcg gagtgtcagc agcaagactt 60
acaccttgcg gaacaggaac atcaacagat gtagtttata gggccttcga tatctacaac 120
gataaagtgg caggatttgc aaagttctta aagaccaatt gctgcagatt tcaagagaag 180
gacgaggatg ataaccttat cgattcatac tttgtggtga agaggcatac attcagcaat 240
taccaacacg aagaaacaat ctacaacctt cttaaagatt gccctgcagt ggcaaagcat 300
gacttcttca agttcagaat cgatggagat atggtgcctc acatctcaag acaaagactt 360
acaaagtata cgatggcaga tctcgtttat gcgttgcgcc atttcgacga gggtaattgt 420
gacaccctga aggagatcct ggtcacgtat aattgctgcg atgatgatta ctttaacaag 480
aaggactggt atgatttcgt agagaatcct gacattctta gagtgtacgc aaaccttgga 540
gaaagagtga gacaagcact cctaaagaca gttcaattct gcgacgcaat gagaaacgca 600
ggaatcgtgg gagtgcttac acttgataac caagatctta acggaaactg gtatgacttt 660
ggcgacttta tacagacaac acctggatca ggagtgcctg tggtggattc atattatagc 720
ctgctgatgc ctatccttac acttacaaga gcacttacag cagaatcaca tgtggatacc 780
gacttgacca aaccctatat taaatgggat ctgctgaaat atgactttac agaagaacga 840
cttaaactct tcgacagata ctttaaatac tgggatcaaa cataccaccc taactgcgtg 900
aactgccttg atgatagatg catccttcac tgcgcaaact ttaacgtgct gttctcgacc 960
gtgtttcctc ctacatcatt tggacctctt gtgagaaaga tctttgtgga cggagtacct 1020
ttcgtcgtat caacaggata ccactttaga gaacttggag tagtgcataa tcaagatgtg 1080
aacctacatt ctagccgatt atcatttaaa gaacttctgg tttatgccgc ggaccctgca 1140
atgcacgcag caagtggcaa tttattactt gacaaacgga caacctgttt ctcggttgcc 1200
gcacttacaa acaatgtagc tttccagacc gtaaagccag ggaatttcaa caaagatttc 1260
tatgacttcg ccgtatcaaa gggattcttc aaggagggat catcagtgga acttaaacac 1320
ttcttcttcg cccaggatgg aaacgcagca atctcagatt acgattacta cagatacaac 1380
cttcctacaa tgtgcgatat cagacaactt ctcttcgtag ttgaagtggt ggataaatac 1440
tttgattgct acgatggagg atgcatcaac gcaaaccaag tgatcgtgaa caacttggat 1500
aaatccgctg gattcccgtt taataagtgg ggtaaagccc gcctttacta cgattcaatg 1560
tcatacgaag atcaagatgc attattcgct tatacaaaga ggaatgtgat ccctacaatc 1620
acacaaatga accttaaata cgcaatctca gcaaagaatc gagcaagaac agtggcagga 1680
gtgtcaatct gctcaacaat gacaaacaga caatttcacc agaagctcct gaaatcaatc 1740
gcagcaacaa gaggagcaac agtggtgatc ggaacatcaa agttctatgg aggttggcac 1800
aacatgctca agaccgtgta tagcgatgtt gagaatccgc atctcatggg atgggattac 1860
cctaaatgcg atagagctat gcccaatatg ctgagaatca tggcatcact tgtgcttgca 1920
agaaagcata ccacatgctg ctcactttca cacagattct atcgacttgc aaacgaatgc 1980
gcacaggtcc tctccgagat ggtgatgtgc ggcgggagct tgtatgtgaa accaggtgga 2040
acatcatcag gagatgcaac aacagcatac gcaaactcag tgtttaacat ctgccaagca 2100
gtgacagcta atgtaaacgc tctcttgagc actgacggaa acaagatagc cgataaatac 2160
gtgcgtaatc tgcagcatcg actttacgaa tgcctttaca gaaacagaga tgtagacacg 2220
gactttgtaa atgaattcta tgcttacctt agaaagcatt tctccatgat gatactgagt 2280
gacgatgctg ttgtatgttt caactcaaca tacgcatcac aaggacttgt ggcatcaatc 2340
aagaatttca aatcagtgct ttactaccag aataatgtgt ttatgtcaga agcaaagtgt 2400
tggacagaaa ctgacctcac taagggccct cacgagttct gtagccaaca cacaatgctt 2460
gtgaaacaag gagatgacta tgtttatctc ccataccctg atccttcaag aatcttgggt 2520
gcagggtgtt tcgtggatga tatcgtgaag actgacggaa cacttatgat cgaaagattt 2580
gtgtcacttg caatcgatgc ataccctctt acaaagcatc cgaaccaaga atacgcagat 2640
gtgtttcacc tttaccttca atacatcaga aagttgcatg atgaacttac aggacacatg 2700
cttgatatgt actcagtgat gcttacaaac gataacacat caagatactg ggaacctgaa 2760
ttctatgagg caatgtacac acctcacaca gtgcttcaa 2799
<210> 13
<211> 1803
<212> DNA
<213> 人工序列
<400> 13
gcagtgggag catgcgtgct ttgcaactca caaacatcac ttagatgcgg agcatgcatc 60
agaagacctt tcctgtgttg caaatgctgc tacgatcacg tgatctcaac atcacacaaa 120
cttgtgcttt cagtgaaccc ttacgtgtgc aacgcaccag gctgtgacgt aactgacgtt 180
acgcagctct atcttggagg aatgtcatac tactgcaaat cacacaaacc tcctatctca 240
tttcctcttt gcgcaaacgg acaagtgttt ggactttaca agaatacttg cgtgggatca 300
gataacgtga cagatttcaa tgctatcgca acatgcgatt ggacaaacgc aggagattac 360
atccttgcaa acacatgcac agagcgtctg aagttgtttg cggccgaaac acttaaagca 420
acagaagaaa catttaaact ttcatacgga atcgcaacag tgagagaggt cctatcggac 480
agggaactcc acctttcatg ggaagtgggc aaaccacgcc cgccgcttaa cagaaactac 540
gtgtttacag gatacagagt gacaaagaat tctaaggtac agatcggaga atacacattt 600
gagaagggcg actacggaga cgccgtggtg tacagaggga cgactacgta taaacttaac 660
gtgggagatt actttgtgct tacatcacac acagtgatgc ctctttcagc acctacactt 720
gtgcctcaag agcattatgt ccgaataacg ggtctctatc cgacacttaa catctcagat 780
gaattctcga gtaacgtggc aaactaccag aaagtgggta tgcagaaata ctccacctta 840
cagggacctc ctggtacagg aaagtctcat ttcgcgatag gtctagctct ctattaccct 900
tcagcaagaa tcgtgtacac agcatgctca cacgcagcag tggatgcact ttgcgagaag 960
gcgctgaaat accttcctat cgataaatgc tcaagaatca tccctgcaag agcaagagtg 1020
gaatgctttg ataaatttaa agtgaactca acacttgaac aatacgtgtt ctgtactgta 1080
aatgctctgc ctgaaactac cgcggatatc gtggtgttcg acgagatatc catggcaaca 1140
aactacgacc tatcggtcgt aaacgcgcgg ctaagagcaa agcattatgt gtacatcgga 1200
gatcctgcac aacttcctgc acctagaaca ttactaacta aagggacgct cgaacctgaa 1260
tactttaaca gtgtttgtcg cctaatgaag acgatcgggc cggacatgtt tcttggaaca 1320
tgcagaagat gccctgcaga aatcgtggat acagtgtcag cacttgtgta cgataacaaa 1380
cttaaagcac acaaagacaa gtcggctcag tgtttcaaga tgttttacaa aggagtgatc 1440
acacacgatg tgtcatcagc aatcaacaga cctcaaatcg gagtggtgag agaatttctt 1500
acaagaaacc ctgcatggag aaaggcggtc ttcataagtc cttacaactc acagaatgcc 1560
gtggcatcaa agatactcgg gcttcctaca caaacagtgg attcatcaca aggatcagaa 1620
tacgattacg tgatctttac acaaacaaca gaaacagcac actcatgcaa cgtgaacaga 1680
tttaacgtgg caatcacaag agcaaaggta gggatcctct gtatcatgtc agatagagat 1740
ctttacgata aacttcaatt tacatcactt gaaatcccta gaagaaacgt ggcgactctg 1800
cag 1803
<210> 14
<211> 1581
<212> DNA
<213> 人工序列
<400> 14
gctgagaacg tgacaggatt gttcaaggac tgctcaaagg taattacggg tttacatccg 60
acacaagcac ctacacacct ttcagtggat acaaagttca agactgaagg actttgcgtg 120
gatatccctg gaatccctaa agatatgaca tacagaagac ttatctcaat gatgggattt 180
aagatgaatt accaagtgaa cggataccct aacatgttta tcacaagaga agaagcaatc 240
agacacgtga gagcatggat aggcttcgac gtcgagggat gccacgcaac aagagaagca 300
gtgggaacaa accttcctct tcaacttgga ttctccactg gagtgaacct tgtggcagtg 360
cctacaggat acgtggatac acctaacaac acagatttct cgcgagtgtc agcaaagcca 420
ccacctggag atcaatttaa acaccttatc cctcttatgt acaaaggact tccttggaac 480
gtggtgagaa tcaagatagt ccaaatgcta tccgatacct taaagaatct tagtgaccgt 540
gtcgtatttg tgctttgggc acacggattt gaacttacat caatgaaata ctttgtgaag 600
atcggtcccg agcgtacatg ctgcctttgc gatagaagag ctacgtgttt cagtaccgct 660
tcagatacat acgcatgctg gcaccactca ataggcttcg attacgttta taatccgttc 720
atgatagatg tgcaacaatg gggattcacg ggcaatctgc agagcaacca cgatctttac 780
tgccaagtgc acggaaacgc acacgtggca tcatgcgatg caatcatgac aagatgcctt 840
gcagtgcacg aatgctttgt gaagcgggtc gattggacaa tcgaataccc tatcatcgga 900
gatgaactta agataaatgc agcatgcaga aaggtccagc acatggtggt gaaagcagca 960
cttcttgcag ataaatttcc tgtgcttcac gatatcggaa accctaaagc aatcaaatgc 1020
gtgcctcaag cagatgtgga atggaaattc tatgacgcac aaccttgctc agataaagca 1080
tacaagatag aggaactatt ctatagttac gcaacacact cagataaatt tacagatgga 1140
gtgtgcctgt tctggaattg caacgtggat agataccctg caaactcaat cgtgtgcaga 1200
tttgatacaa gagtgctttc aaaccttaac cttccaggtt gtgacggcgg cagtctatat 1260
gttaataagc acgcatttca cacacctgca ttcgataagt ccgcattcgt caatttaaag 1320
cagctacctt tcttctatta ttcagattca ccttgcgaat cacacggaaa gcaggttgtc 1380
agtgacatcg attacgtgcc tcttaaatca gcaacatgta ttaccaggtg taatcttgga 1440
ggagccgtct gtcgacatca tgcaaacgaa tacagacttt accttgatgc atacaacatg 1500
atgatctccg ccgggttctc cctatgggtg tacaaacaat ttgatacata caacctttgg 1560
aacacattta caagacttca a 1581
<210> 15
<211> 1038
<212> DNA
<213> 人工序列
<400> 15
tcacttgaga acgttgcgtt caatgtagtc aataagggac acttcgacgg tcaacagggt 60
gaggttcctg tgtcaatcat caacaatacc gtttatacta aagttgacgg cgtggatgtg 120
gaactcttcg agaataagac tacgcttcct gtgaatgttg ccttcgagtt gtgggcaaag 180
cgcaatatca aacctgtgcc tgaagtgaag atactcaata accttggagt ggatatcgca 240
gcaaacacag tgatctggga ttacaagagg gacgcacctg cacacatctc aacaatcgga 300
gtgtgctcaa tgacagatat cgcaaagaag ccgactgaaa caatctgcgc acctcttact 360
gtattcttcg acggaagagt ggatggacaa gtggatttat tccgaaatgc aagaaacgga 420
gtgcttatca cagaaggatc agtgaaagga cttcaacctt cagtgggacc taaacaagca 480
tcacttaacg gagtgactct gataggcgag gccgtgaaga ctcagtttaa ctactacaag 540
aaagtagacg gtgtcgtcca gcagctgccc gagacctatt tcacacaatc acggaatctg 600
caggagttca aacctagatc acaaatggaa atcgatttcc tggagcttgc aatggatgaa 660
tttatcgaaa gatacaaact tgaaggatac gcatttgaac acatcgtgta cggagatttc 720
agtcattcac aacttggagg acttcacctt cttattggcc tagccaaacg tttcaaagaa 780
tcacctttcg agctcgaaga tttcattcca atggattcaa cagtgaagaa ttatttcatt 840
actgacgccc agacgggatc atcaaagtgt gtatgctcag tgatcgatct actactagac 900
gatttcgttg aaattattaa atcacaagac ttgagtgtag ttagtaaggt tgtgaaggtc 960
acaatcgatt acacagaaat ctcatttatg ctttggtgca aagatggaca cgtggaaaca 1020
ttctatccca aacttcaa 1038
<210> 16
<211> 897
<212> DNA
<213> 人工序列
<400> 16
tcatcacaag catggcaacc tggagtggcc atgccgaatt tgtataagat gcagagaatg 60
cttcttgaga agtgtgacct tcagaattat ggagattcag caacacttcc taaaggaatc 120
atgatgaacg tggcaaagta tactcaactt tgccaatacc ttaacacact tacacttgca 180
gtgccttaca acatgagagt gatccacttc ggtgcagggt cggacaaagg agtggcacct 240
ggtactgctg tccttagaca atggcttcct acaggaacac ttcttgtgga ttcagatctt 300
aacgatttcg tctccgatgc agattcaacc ctcattggtg actgtgcaac agtgcacaca 360
gcaaacaagt gggacttaat aatatcagat atgtacgatc ctaagactaa gaatgtaacg 420
aaagagaatg actcaaagga aggtttcttc acctatatct gcggatttat ccaacagaag 480
ttagctcttg gaggatcagt ggcaatcaag attacggaac actcatggaa cgcagatctt 540
tacaaactta tgggacactt tgcatggtgg accgcgttcg ttacaaacgt aaacgcgtcg 600
tcctcagaag catttcttat cggatgcaac taccttggga aaccaagaga gcagatcgat 660
ggatacgtga tgcacgcaaa ctacatcttc tggaggaaca caaaccctat ccaactttca 720
tcatactcac tcttcgacat gtcaaagttc ccgcttaaac ttagagggac tgccgtaatg 780
tcgcttaaag aaggacaaat caacgatatg atactcagcc tcctaagtaa agggaggctt 840
atcatcagag agaataatag agtggtgatc tcatcagatg tgcttgtgaa caactaa 897
<210> 17
<211> 10429
<212> DNA
<213> 人工序列
<400> 17
gctagcgagg gcccggaaac ctggccctgt cttcttgacg agcattccta ggggtctttc 60
ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga 120
agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga accccccacc 180
tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg caaaggcggc 240
acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat ggctctcctc 300
aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta tgggatctga 360
tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa aacgtctagg 420
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataaa tggagtccct 480
ggtgcccggc ttcaacgaga agacccacgt gcagctgtct ctgcctgtgc tgcaggtgag 540
ggatgtgctg gtgcgcggct ttggcgactc cgtcgaggag gtgctgtctg aggccaggca 600
gcacctgaag gacggaacct gcggactggt ggaggtggag aagggcgtgc tgccacagct 660
ggagcagcct tacgtgttca tcaagaggtc cgatgcaagg acagcaccac acggacacgt 720
gatggtggag ctggtggccg agctggaggg catccagtat ggccgctctg gagagaccct 780
gggcgtgctg gtgccacacg tgggagagat cccagtggcc tatcggaagg tgctgctgag 840
aaagaacggc aataagggag caggaggaca ctcttacgga gcagacctga agagcttcga 900
tctgggcgac gagctgggca ccgatcctta tgaggacttt caggagaact ggaatacaaa 960
gcacagctcc ggcgtgaccc gggagctgat gagagagctg aacggcggcg cctacaccag 1020
atatgtggat aacaatttct gcggaccaga cggatacccc ctggagtgta tcaaggatct 1080
gctggccaga gcaggcaagg cctcctgcac cctgtctgag cagctggact tcatcgacac 1140
aaagcggggc gtgtattgct gtagagagca cgagcacgag atcgcctggt ataccgagcg 1200
gtccgagaag tcttacgagc tgcagacacc attcgagatc aagctggcca agaagttcga 1260
caccttcaac ggcgagtgtc caaacttcgt gtttcccctg aatagcatca tcaagaccat 1320
ccagcccaga gtggagaaga agaagctgga tggctttatg ggcaggatcc gcagcgtgta 1380
ccctgtggcc tccccaaacg agtgcaatca gatgtgcctg tccacactga tgaagtgcga 1440
tcactgtggc gagacctctt ggcagacagg cgacttcgtg aaggccacct gcgagttttg 1500
tggcaccgag aacctgacaa aggagggcgc caccacatgc ggctatctgc ctcagaatgc 1560
cgtggtgaag atctactgcc cagcctgtca caactccgaa gtgggaccag agcactctct 1620
ggccgagtac cacaatgagt ccggcctgaa gacaatcctg aggaagggag gaaggaccat 1680
cgccttcggc ggatgcgtgt tttcttatgt gggctgccac aacaagtgtg catactgggt 1740
gccaagggcc agcgccaata tcggctgtaa ccacaccgga gtggtgggag agggatccga 1800
gggcctgaac gataatctgc tggagatcct gcagaaggag aaggtgaaca tcaatatcgt 1860
gggcgacttc aagctgaacg aggagatcgc catcatcctg gcctccttct ctgccagcac 1920
atccgccttt gtggagaccg tgaagggcct ggactacaag gccttcaagc agatcgtgga 1980
gagctgcggc aacttcaagg tgaccaaggg caaggccaag aagggcgcct ggaacatcgg 2040
cgagcagaag agcatcctgt cccctctgta tgccttcgcc agcgaggcag caagggtggt 2100
gagatctatc tttagccgga ccctggagac agcccagaat tccgtgagag tgctgcagaa 2160
ggccgccatc accatcctgg atggcatctc ccagtactct ctgaggctga tcgatgccat 2220
gatgttcacc tccgacctgg ccacaaacaa tctggtggtc atggcctaca tcaccggcgg 2280
cgtggtgcag ctgacctctc agtggctgac aaacatcttt ggcaccgtgt atgagaagct 2340
gaagccagtg ctggattggc tggaggagaa gttcaaggag ggcgtggagt ttctgcgcga 2400
cggctgggag atcgtgaagt tcatcagcac ctgcgcatgt gagatcgtgg gaggacagat 2460
cgtgacctgt gccaaggaga tcaaggagtc cgtgcagaca ttctttaagc tggtgaacaa 2520
gttcctggcc ctgtgcgccg actctatcat catcggcggc gccaagctga aggccctgaa 2580
cctgggcgag acctttgtga cacacagcaa gggcctgtac aggaagtgcg tgaagtcccg 2640
cgaggagacc ggactgctga tgcccctgaa ggcacctaag gagatcatct tcctggaggg 2700
cgagaccctg cccacagagg tgctgacaga ggaggtggtg ctgaagaccg gcgacctgca 2760
gccactggag cagcccacca gcgaggcagt ggaggcacct ctggtgggca caccagtgtg 2820
catcaatggc ctgatgctgc tggagatcaa ggataccgag aagtactgtg ccctggcccc 2880
taacatgatg gtgacaaaca ataccttcac actgaagggc ggcgccccaa ccaaggtgac 2940
atttggcgac gataccgtga tcgaggtgca gggctacaag tctgtgaata tcacattcga 3000
gctggatgag agaatcgaca aggtgctgaa cgagaagtgc agcgcctata cagtggagct 3060
gggcaccgag gtgaacgagt ttgcctgcgt ggtggccgac gccgtgatca agaccctgca 3120
gccagtgtcc gagctgctga cacccctggg catcgatctg gacgagtggt ctatggccac 3180
ctactatctg ttcgacgaga gcggcgagtt taagctggcc tcccacatgt actgctcttt 3240
ctatccccct gatgaagacg aggaggaggg cgattgcgag gaggaggagt ttgagcccag 3300
cacacagtac gagtatggca ccgaggacga ttaccagggc aagccactgg agttcggagc 3360
cacctccgcc gccctgcagc cagaggagga gcaggaggag gattggctgg acgatgactc 3420
ccagcagacc gtgggccagc aggatggctc tgaggacaat cagaccacaa ccatccagac 3480
aatcgtggag gtgcagcctc agctggagat ggagctgacc ccagtggtgc agaccatcga 3540
ggtgaactct ttcagcggct atctgaagct gacagataac gtgtacatca agaacgccga 3600
cattgtggag gaggccaaga aggtgaagcc taccgtggtg gtgaacgccg ccaacgtgta 3660
cctgaagcac ggaggaggag tggcaggcgc cctgaacaag gccaccaaca atgccatgca 3720
ggtggagagc gatgactata tcgccacaaa tggacccctg aaggtcggag gaagctgcgt 3780
gctgtccgga cacaacctgg ccaagcactg tctgcacgtg gtgggcccta acgtgaataa 3840
gggcgaggac atccagctgc tgaagtccgc ctacgagaac ttcaatcagc acgaggtgct 3900
gctggcccct ctgctgagcg ccggcatctt tggcgccgat ccaatccact ccctgagggt 3960
gtgcgtggac accgtgcgca caaacgtgta cctggccgtg ttcgataaga acctgtacga 4020
caagctggtg tctagctttc tggagatgaa gagcgagaag caggtggagc agaagatcgc 4080
cgagatccct aaggaggagg tgaagccatt catcaccgag agcaagcctt ccgtggagca 4140
gaggaagcag gatgacaaga agatcaaggc ctgcgtggag gaggtgacaa ccacactgga 4200
ggagaccaag ttcctgacag agaacctgct gctgtacatc gatatcaacg gcaatctgca 4260
cccagacagc gccacactgg tgtccgatat cgacatcacc tttctgaaga aggatgcccc 4320
atatatcgtg ggcgacgtgg tgcaggaggg cgtgctgaca gccgtggtca tccccaccaa 4380
gaaggccggc ggcaccacag agatgctggc caaggccctg cgcaaggtgc ctaccgacaa 4440
ttacatcacc acatatccag gccagggcct gaacggctat accgtggagg aggccaagac 4500
cgtgctgaag aagtgcaaga gcgccttcta catcctgcct tctatcatca gcaatgagaa 4560
gcaggagatc ctgggcaccg tgtcctggaa cctgagggag atgctggccc acgccgagga 4620
gacacgcaag ctgatgcccg tgtgcgtgga gacaaaggcc atcgtgagca ccatccagcg 4680
gaagtataag ggcatcaaga tccaggaggg agtggtggac tacggagcaa gattctactt 4740
ttatacctct aagaccacag tggccagcct gatcaacaca ctgaatgatc tgaacgagac 4800
cctggtgaca atgcccctgg gctatgtgac ccacggcctg aatctggagg aggccgccag 4860
gtacatgcgc tccctgaagg tgccagcaac cgtgagcgtg agctctcctg acgccgtgac 4920
agcctacaac ggctatctga caagctcctc taagacccca gaggagcact tcatcgagac 4980
catctctctg gccggcagct ataaggattg gtcctactct ggccagtcca cacagctggg 5040
catcgagttt ctgaagaggg gcgacaagag cgtgtactat accagcaatc ccaccacatt 5100
ccacctggat ggcgaagtga tcaccttcga caacctgaag accctgctga gcctgcggga 5160
ggtgagaacc atcaaggtgt tcaccacagt ggataacatc aatctgcaca cacaggtggt 5220
ggacatgtcc atgacctatg gccagcagtt tggcccaaca tacctggatg gcgccgacgt 5280
gaccaagatc aagccccaca atagccacga gggcaagaca ttctacgtgc tgcctaatgc 5340
caccaacttt tccctgctga agcaggcagg cgacgtggag gagaacccag gaccagatga 5400
caccctgagg gtggaggcct tcgagtacta tcacaccaca gatcctagct ttctgggccg 5460
ctatatgtcc gccctgaatc acaccaagaa gtggaagtac ccacaggtga acggcctgac 5520
aagcatcaag tgggccgaca acaattgcta cctggccacc gccctgctga cactgcagca 5580
gatcgagctg aagttcaacc cacccgccct gcaggatgca tactataggg caagagcagg 5640
agaggcagcc aatttttgcg ccctgatcct ggcctattgt aacaagaccg tgggagagct 5700
gggcgatgtg cgggagacaa tgagctacct gttccagcac gccaatctgg actcctgcaa 5760
gagagtgctg aacgtggtgt gcaagacatg tggccagcag cagaccacac tgaagggcgt 5820
ggaggccgtg atgtatatgg gcaccctgag ctacgagcag tttaagaagg gcgtgcagat 5880
cccctgcaca tgtggcaagc aggccaccaa gtacctggtg cagcaggagt cccctttcgt 5940
gatgatgtct gcccctccag cccagtatga gctgaagcac ggcaccttta catgcgcctc 6000
tgagtacacc ggcaattatc agtgtggcca ctataagcac atcaccagca aggagacact 6060
gtactgcatc gatggcgccc tgctgaccaa gagctccgag tacaagggcc ccatcacaga 6120
cgtgttctat aaggagaatt cttacaccac aaccatcgcc accaacttta gcctgctgaa 6180
gcaggccggc gatgtggagg agaaccctgg accaaagccc gtgacctata agctggacgg 6240
cgtggtgtgc acagagatcg atcctaagct ggacaactac tacaagaagg ataactctta 6300
tttcaccgag cagcccatcg acctggtgcc taatcagcct tacccaaacg ccagcttcga 6360
taatttcaag ttcgtgtgcg acaatatcaa gtttgccgat gacctgaacc agctgaccgg 6420
atacaagaag ccagccagcc gggagctgaa ggtgacattc tttcctgatc tgaacggcga 6480
cgtggtggcc atcgactaca agcactatac accttccttc aagaagggcg ccaagctgct 6540
gcacaagcca atcgtgtggc acgtgaacaa tgccaccaat aaggccacat acaagccaaa 6600
cacctggtgc atcagatgtc tgtggtctac aaagcccgtg gagaccagca attcctttga 6660
tgtgctgaag agcgaggatg cccagggcat ggacaacctg gcctgcgagg acctgaagcc 6720
cgtgagcgag gaggtggtgg agaatcctac catccagaag gatgtgctgg agtgtaacgt 6780
gaagacaacc gaggtggtgg gcgacatcat cctgaagcct gccaacaatt ccctgaagat 6840
cacagaggaa gtgggccaca ccgatctgat ggccgcctac gtggacaatt ctagcctgac 6900
catcaagaag ccaaacgagc tgagcagggt gctgggcctg aagaccctgg ccacacacgg 6960
cctggccgca gtgaattccg tgccatggga caccatcgcc aattatgcca agcccttcct 7020
gaacaaggtg gtgagcacaa ccacaaacat cgtgacacgg tgcctgaacc gggtgtgcac 7080
caattacatg ccatatttct ttacactgct gctgcagctg tgcaccttta caaggtccac 7140
caattctcgc atcaaggcct ccatgcccac cacaatcgcc aagaacacag tgaagagcgt 7200
gggcaagttc tgcctggagg cctcctttaa ctacctgaag tcccccaatt tctctaagct 7260
gatcaacatc atcatctggt ttctgctgct gagcgtgtgc ctgggcagcc tgatctattc 7320
cacagccgcc ctgggcgtgc tgatgagcaa cctgggcatg ccttcctact gcaccggcta 7380
tcgggagggc tacctgaata gcaccaacgt gacaatcgcc acctactgta caggctctat 7440
cccatgcagc gtgtgcctgt ccggcctgga ttctctggac acctatcctt ccctggagac 7500
catccagatc acaatctcct ctttcaagtg ggacctgacc gcctttggcc tggtggcaga 7560
gtggttcctg gcctatatcc tgtttacaag attcttttac gtgctgggcc tggccgccat 7620
catgcagctg ttctttagct acttcgccgt gcactttatc tctaatagct ggctgatgtg 7680
gctgatcatc aacctggtgc agatggcccc catctccgcc atggtgagga tgtatatctt 7740
ctttgcctct ttctactacg tgtggaagag ctacgtgcac gtggtggacg gctgcaatag 7800
ctccacctgc atgatgtgct acaagaggaa ccgcgccaca cgcgtggagt gtaccacaat 7860
cgtgaatggc gtgcggagaa gcttctacgt gtatgccaac ggcggcaagg gcttttgcaa 7920
gctgcacaac tggaattgcg tgaactgtga tacattctgt gccggcagca cctttatctc 7980
cgatgaggtg gcaagggacc tgtccctgca gttcaagaga ccaatcaatc ccaccgatca 8040
gtctagctac atcgtggact ccgtgacagt gaagaacggc tctatccacc tgtatttcga 8100
taaggccggc cagaagacat acgagaggca ctccctgtct cactttgtga atctggacaa 8160
cctgcgcgcc aacaatacca agggcagcct gcccatcaac gtgatcgtgt tcgatggcaa 8220
gtccaagtgc gaggagtcct ctgccaagag cgcctccgtg tactatagcc agctgatgtg 8280
ccagcctatc ctgctgctgg accaggccct ggtgtccgat gtgggcgact ctgccgaggt 8340
ggcagtgaag atgtttgatg cctacgtgaa taccttcagc agcaccttca acgtgccaat 8400
ggagaagctg aagaccctgg tggcaacagc agaggcagag ctggccaaga acgtgtccct 8460
ggacaatgtg ctgtctacct tcatcagcgc cgcccgccag ggctttgtgg attctgacgt 8520
ggagacaaag gatgtggtgg agtgcctgaa gctgagccac cagtccgata tcgaggtgac 8580
cggcgacagc tgtaacaatt atatgctgac ctacaataag gtggagaaca tgacaccccg 8640
ggatctgggc gcctgcatcg actgttctgc cagacacatc aatgcccagg tggccaagag 8700
ccacaatatc gccctgatct ggaacgtgaa ggacttcatg tctctgagcg agcagctgag 8760
gaagcagatc cgctccgccg ccaagaagaa caatctgccc ttcaagctga cctgcgccac 8820
cacaaggcag gtggtgaacg tggtcaccac aaagatcgcc ctgaagggcg gcaagatcgt 8880
gaacaattgg ctgaagcagc tgatcaaggt gaccctggtg ttcctgtttg tggccgccat 8940
cttctacctg atcacccccg tgcacgtgat gtctaagcac acagattttt ctagcgagat 9000
catcggctat aaggccatcg acggaggagt gaccagggat atcgccagca ccgacacatg 9060
cttcgccaat aagcacgccg atttcgacac ctggtttagc cagaggggcg gctcctacac 9120
aaacgacaag gcctgtccac tgatcgcagc cgtgatcacc agggaagtgg gattcgtggt 9180
gcctggactg ccaggaacaa tcctgaggac cacaaatggc gacttcctgc actttctgcc 9240
tcgcgtgttt tccgccgtgg gcaacatctg ctatacccca tctaagctga tcgagtacac 9300
cgatttcgcc acatccgcct gcgtgctggc cgcagagtgt accatcttta aggatgcctc 9360
tggcaagccc gtgccttact gttatgacac aaatgtgctg gagggctctg tggcctatga 9420
gagcctgcgg ccagatacca gatacgtgct gatggacggc agcatcatcc agttccccaa 9480
cacatatctg gagggctctg tgcgggtggt gaccacattt gacagcgagt actgccggca 9540
cggcacctgt gagagatctg aggccggcgt gtgcgtgtcc acatctggca ggtgggtgct 9600
gaacaatgat tactatcgca gcctgcctgg cgtgttctgt ggcgtggacg ccgtgaatct 9660
gctgaccaac atgtttacac ctctgatcca gccaatcggc gccctggata tcagcgcctc 9720
catcgtggca ggaggaatcg tggcaatcgt ggtgacatgc ctggcctact atttcatgcg 9780
gttccggagg gccttcggcg agtactctca cgtggtggcc tttaataccc tgctgttcct 9840
gatgagcttc accgtgctgt gcctgacccc cgtgtatagc ttcctgcctg gcgtgtactc 9900
cgtgatctac ctgtatctga ccttctacct gacaaacgac gtgagctttc tggcccacat 9960
ccagtggatg gtcatgttca cccccctggt gcctttttgg atcacaatcg cctatatcat 10020
ctgcatctcc accaagcact tctattggtt cttttctaat tacctgaagc ggagagtggt 10080
gtttaacggc gtgtctttca gcacctttga ggaggccgcc ctgtgcacat tcctgctgaa 10140
caaggagatg tacctgaagc tgcggtccga cgtgctgctg ccactgaccc agtacaatag 10200
atatctggcc ctgtataaca agtacaagta tttctctggc gccatggata ccacaagcta 10260
cagagaggca gcatgctgtc acctggcaaa ggccctgaat gatttttcca actctggcag 10320
cgacgtgctg taccagcccc ctcagacctc tatcacaagc gccgtgctgc agtaactagc 10380
ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgtctaga 10429
<210> 18
<211> 4012
<212> DNA
<213> 人工序列
<400> 18
gctagcgagg gcccggaaac ctggccctgt cttcttgacg agcattccta ggggtctttc 60
ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga 120
agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga accccccacc 180
tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg caaaggcggc 240
acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat ggctctcctc 300
aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta tgggatctga 360
tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa aacgtctagg 420
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataaa tgagcggctt 480
tcggaagatg gcattcccat ccggcaaggt ggagggatgc atggtgcagg tgacatgtgg 540
caccacaacc ctgaatggcc tgtggctgga cgatgtggtg tattgcccta gacacgtgat 600
ctgtaccagc gaggacatgc tgaacccaaa ttacgaggat ctgctgatca ggaagtccaa 660
ccacaatttc ctggtgcagg caggaaacgt gcagctgcgc gtgatcggcc acagcatgca 720
gaattgcgtg ctgaagctga aggtggacac agccaaccca aagaccccca agtacaagtt 780
tgtgaggatc cagcctggcc agacattctc cgtgctggcc tgctataacg gctctcccag 840
cggcgtgtac cagtgtgcca tgcgccctaa ctttaccatc aagggctctt tcctgaatgg 900
cagctgcggc tccgtgggct ttaacatcga ctatgattgc gtgagcttct gttacatgca 960
ccacatggag ctgccaacag gagtgcacgc aggaaccgac ctggagggaa acttctacgg 1020
ccccttcgtg gacaggcaga ccgcacaggc agcaggcaca gatacaacca tcaccgtgaa 1080
cgtgctggcc tggctgtacg ccgccgtgat caacggcgac cggtggtttc tgaatagatt 1140
cacaaccaca ctgaacgatt tcaatctggt ggccatgaag tacaactatg agccactgac 1200
acaggaccac gtggatatcc tgggaccact gagcgcccag accggaatcg ccgtgctgga 1260
catgtgcgcc tccctgaagg agctgctgca gaacggcatg aatggaagga caatcctggg 1320
aagcgccctg ctggaggacg agtttacccc attcgatgtg gtgagacagt gttccggcgt 1380
gacatttcag gccaccaatt tctctctgct gaagcaggca ggcgatgtgg aggagaaccc 1440
tggaccatcc gccgtgaagc gcacaatcaa gggcacccac cactggctgc tgctgacaat 1500
cctgacctct ctgctggtgc tggtgcagtc tacccagtgg agcctgttct ttttcctgta 1560
tgagaatgcc tttctgccct tcgccatggg catcatcgcc atgtccgcct ttgccatgat 1620
gttcgtgaag cacaagcacg cctttctgtg cctgttcctg ctgccatccc tggccaccgt 1680
ggcctacttc aacatggtgt atatgcctgc ctcttgggtc atgaggatca tgacatggct 1740
ggacatggtg gatacctccc tgtctggctt taagctgaag gactgcgtga tgtatgccag 1800
cgccgtggtg ctgctgatcc tgatgacagc aaggaccgtg tacgacgatg gagcaaggag 1860
agtgtggaca ctgatgaatg tgctgaccct ggtgtacaag gtgtactatg gcaacgccct 1920
ggatcaggcc atctccatgt gggccctgat catctctgtg accagcaatt attccggcgt 1980
ggtgaccaca gtgatgtttc tggcccgggg catcgtgttc atgtgcgtgg agtactgtcc 2040
tatctttttc atcacaggca acaccctgca gtgcatcatg ctggtgtact gttttctggg 2100
ctatttctgc acctgttact ttggcctgtt ctgcctgctg aataggtatt ttcgcctgac 2160
actgggcgtg tacgactatc tggtgtctac ccaggagttc agatacatga acagccaggg 2220
cctgctgccc cctaagaact ccatcgatgc cttcaagctg aatatcaagc tgctgggcgt 2280
gggcggcaag ccatgcatca aggtggccac agtgcagtct aagatgagcg acgtgaagtg 2340
taccagcgtg gtgctgctgt ccgtgctgca gcagctgagg gtggagagct cctctaagct 2400
gtgggcccag tgcgtgcagc tgcacaacga catcctgctg gccaaggata ccacagaggc 2460
cttcgagaag atggtgtccc tgctgtctgt gctgctgagc atgcagggcg ccgtggacat 2520
caataagctg tgcgaggaga tgctggataa ccgcgccaca ctgcaggcca tcgcctctga 2580
gtttagctcc ctgccaagct atgcagcctt cgccaccgca caggaggcat acgagcaggc 2640
cgtggccaat ggcgactccg aggtggtgct gaagaagctg aagaagagcc tgaacgtggc 2700
caagtccgag ttcgaccggg atgccgccat gcagagaaag ctggagaaga tggccgacca 2760
ggccatgaca cagatgtata agcaggccag gtctgaggat aagcgcgcca aggtgaccag 2820
cgccatgcag acaatgctgt ttaccatgct gcggaagctg gacaatgatg ccctgaacaa 2880
tatcatcaac aatgccagag acggctgcgt gcccctgaac atcatccctc tgaccacagc 2940
cgccaagctg atggtggtca tccctgacta caacacatat aagaatacct gtgatggcac 3000
cacattcaca tacgcctctg ccctgtggga gatccagcag gtggtggacg ccgatagcaa 3060
gatcgtgcag ctgagcgaga tctccatgga taactcccca aatctggcat ggccactgat 3120
cgtgaccgcc ctgagggcca atagcgccgt gaagctgcag aacaatgagc tgtccccagt 3180
ggccctgagg cagatgtctt gcgcagcagg aaccacacag acagcctgta ccgacgataa 3240
cgccctggcc tactataata ccacaaaggg aggccggttt gtgctggccc tgctgtctga 3300
cctgcaggat ctgaagtggg ccagattccc taagagcgac ggcaccggca caatctacac 3360
cgagctggag ccaccctgcc ggtttgtgac cgatacacct aagggcccaa aggtgaagta 3420
cctgtatttc atcaagggcc tgaacaatct gaacagggga atggtgctgg gatctctggc 3480
cgcaaccgtg cgcctgcagg caggaaacgc cacagaggtg cccgccaatt ccaccgtgct 3540
gtctttttgt gccttcgccg tggacgcagc aaaggcatac aaggattatc tggcctccgg 3600
cggccagcct atcaccaatt gcgtgaagat gctgtgcacc cacacaggaa ccggacaggc 3660
catcacagtg accccagagg ccaacatgga ccaggagtct tttggcggcg ccagctgctg 3720
tctgtattgc cggtgtcaca tcgaccaccc caatcctaag ggcttctgcg atctgaaggg 3780
caagtacgtg cagatcccta ccacatgtgc caatgatcca gtgggcttta ccctgaagaa 3840
cacagtgtgc accgtgtgcg gcatgtggaa gggctacggc tgcagctgtg accagctgag 3900
agagcccatg ctgcagtccg ccgatgccca gtcttttctg aacggcttcg ccgtgtaact 3960
agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgtcta ga 4012
<210> 19
<211> 8641
<212> DNA
<213> 人工序列
<400> 19
gctagcgagg gcccggaaac ctggccctgt cttcttgacg agcattccta ggggtctttc 60
ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga 120
agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga accccccacc 180
tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg caaaggcggc 240
acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat ggctctcctc 300
aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta tgggatctga 360
tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa aacgtctagg 420
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataaa tgtcagcaga 480
tgcacaatca tttcttaaca gagtgtgcgg agtgtcagca gcaagactta caccttgcgg 540
aacaggaaca tcaacagatg tagtttatag ggccttcgat atctacaacg ataaagtggc 600
aggatttgca aagttcttaa agaccaattg ctgcagattt caagagaagg acgaggatga 660
taaccttatc gattcatact ttgtggtgaa gaggcataca ttcagcaatt accaacacga 720
agaaacaatc tacaaccttc ttaaagattg ccctgcagtg gcaaagcatg acttcttcaa 780
gttcagaatc gatggagata tggtgcctca catctcaaga caaagactta caaagtatac 840
gatggcagat ctcgtttatg cgttgcgcca tttcgacgag ggtaattgtg acaccctgaa 900
ggagatcctg gtcacgtata attgctgcga tgatgattac tttaacaaga aggactggta 960
tgatttcgta gagaatcctg acattcttag agtgtacgca aaccttggag aaagagtgag 1020
acaagcactc ctaaagacag ttcaattctg cgacgcaatg agaaacgcag gaatcgtggg 1080
agtgcttaca cttgataacc aagatcttaa cggaaactgg tatgactttg gcgactttat 1140
acagacaaca cctggatcag gagtgcctgt ggtggattca tattatagcc tgctgatgcc 1200
tatccttaca cttacaagag cacttacagc agaatcacat gtggataccg acttgaccaa 1260
accctatatt aaatgggatc tgctgaaata tgactttaca gaagaacgac ttaaactctt 1320
cgacagatac tttaaatact gggatcaaac ataccaccct aactgcgtga actgccttga 1380
tgatagatgc atccttcact gcgcaaactt taacgtgctg ttctcgaccg tgtttcctcc 1440
tacatcattt ggacctcttg tgagaaagat ctttgtggac ggagtacctt tcgtcgtatc 1500
aacaggatac cactttagag aacttggagt agtgcataat caagatgtga acctacattc 1560
tagccgatta tcatttaaag aacttctggt ttatgccgcg gaccctgcaa tgcacgcagc 1620
aagtggcaat ttattacttg acaaacggac aacctgtttc tcggttgccg cacttacaaa 1680
caatgtagct ttccagaccg taaagccagg gaatttcaac aaagatttct atgacttcgc 1740
cgtatcaaag ggattcttca aggagggatc atcagtggaa cttaaacact tcttcttcgc 1800
ccaggatgga aacgcagcaa tctcagatta cgattactac agatacaacc ttcctacaat 1860
gtgcgatatc agacaacttc tcttcgtagt tgaagtggtg gataaatact ttgattgcta 1920
cgatggagga tgcatcaacg caaaccaagt gatcgtgaac aacttggata aatccgctgg 1980
attcccgttt aataagtggg gtaaagcccg cctttactac gattcaatgt catacgaaga 2040
tcaagatgca ttattcgctt atacaaagag gaatgtgatc cctacaatca cacaaatgaa 2100
ccttaaatac gcaatctcag caaagaatcg agcaagaaca gtggcaggag tgtcaatctg 2160
ctcaacaatg acaaacagac aatttcacca gaagctcctg aaatcaatcg cagcaacaag 2220
aggagcaaca gtggtgatcg gaacatcaaa gttctatgga ggttggcaca acatgctcaa 2280
gaccgtgtat agcgatgttg agaatccgca tctcatggga tgggattacc ctaaatgcga 2340
tagagctatg cccaatatgc tgagaatcat ggcatcactt gtgcttgcaa gaaagcatac 2400
cacatgctgc tcactttcac acagattcta tcgacttgca aacgaatgcg cacaggtcct 2460
ctccgagatg gtgatgtgcg gcgggagctt gtatgtgaaa ccaggtggaa catcatcagg 2520
agatgcaaca acagcatacg caaactcagt gtttaacatc tgccaagcag tgacagctaa 2580
tgtaaacgct ctcttgagca ctgacggaaa caagatagcc gataaatacg tgcgtaatct 2640
gcagcatcga ctttacgaat gcctttacag aaacagagat gtagacacgg actttgtaaa 2700
tgaattctat gcttacctta gaaagcattt ctccatgatg atactgagtg acgatgctgt 2760
tgtatgtttc aactcaacat acgcatcaca aggacttgtg gcatcaatca agaatttcaa 2820
atcagtgctt tactaccaga ataatgtgtt tatgtcagaa gcaaagtgtt ggacagaaac 2880
tgacctcact aagggccctc acgagttctg tagccaacac acaatgcttg tgaaacaagg 2940
agatgactat gtttatctcc cataccctga tccttcaaga atcttgggtg cagggtgttt 3000
cgtggatgat atcgtgaaga ctgacggaac acttatgatc gaaagatttg tgtcacttgc 3060
aatcgatgca taccctctta caaagcatcc gaaccaagaa tacgcagatg tgtttcacct 3120
ttaccttcaa tacatcagaa agttgcatga tgaacttaca ggacacatgc ttgatatgta 3180
ctcagtgatg cttacaaacg ataacacatc aagatactgg gaacctgaat tctatgaggc 3240
aatgtacaca cctcacacag tgcttcaagc agtgggagca tgcgtgcttt gcaactcaca 3300
aacatcactt agatgcggag catgcatcag aagacctttc ctgtgttgca aatgctgcta 3360
cgatcacgtg atctcaacat cacacaaact tgtgctttca gtgaaccctt acgtgtgcaa 3420
cgcaccaggc tgtgacgtaa ctgacgttac gcagctctat cttggaggaa tgtcatacta 3480
ctgcaaatca cacaaacctc ctatctcatt tcctctttgc gcaaacggac aagtgtttgg 3540
actttacaag aatacttgcg tgggatcaga taacgtgaca gatttcaatg ctatcgcaac 3600
atgcgattgg acaaacgcag gagattacat ccttgcaaac acatgcacag agcgtctgaa 3660
gttgtttgcg gccgaaacac ttaaagcaac agaagaaaca tttaaacttt catacggaat 3720
cgcaacagtg agagaggtcc tatcggacag ggaactccac ctttcatggg aagtgggcaa 3780
accacgcccg ccgcttaaca gaaactacgt gtttacagga tacagagtga caaagaattc 3840
taaggtacag atcggagaat acacatttga gaagggcgac tacggagacg ccgtggtgta 3900
cagagggacg actacgtata aacttaacgt gggagattac tttgtgctta catcacacac 3960
agtgatgcct ctttcagcac ctacacttgt gcctcaagag cattatgtcc gaataacggg 4020
tctctatccg acacttaaca tctcagatga attctcgagt aacgtggcaa actaccagaa 4080
agtgggtatg cagaaatact ccaccttaca gggacctcct ggtacaggaa agtctcattt 4140
cgcgataggt ctagctctct attacccttc agcaagaatc gtgtacacag catgctcaca 4200
cgcagcagtg gatgcacttt gcgagaaggc gctgaaatac cttcctatcg ataaatgctc 4260
aagaatcatc cctgcaagag caagagtgga atgctttgat aaatttaaag tgaactcaac 4320
acttgaacaa tacgtgttct gtactgtaaa tgctctgcct gaaactaccg cggatatcgt 4380
ggtgttcgac gagatatcca tggcaacaaa ctacgaccta tcggtcgtaa acgcgcggct 4440
aagagcaaag cattatgtgt acatcggaga tcctgcacaa cttcctgcac ctagaacatt 4500
actaactaaa gggacgctcg aacctgaata ctttaacagt gtttgtcgcc taatgaagac 4560
gatcgggccg gacatgtttc ttggaacatg cagaagatgc cctgcagaaa tcgtggatac 4620
agtgtcagca cttgtgtacg ataacaaact taaagcacac aaagacaagt cggctcagtg 4680
tttcaagatg ttttacaaag gagtgatcac acacgatgtg tcatcagcaa tcaacagacc 4740
tcaaatcgga gtggtgagag aatttcttac aagaaaccct gcatggagaa aggcggtctt 4800
cataagtcct tacaactcac agaatgccgt ggcatcaaag atactcgggc ttcctacaca 4860
aacagtggat tcatcacaag gatcagaata cgattacgtg atctttacac aaacaacaga 4920
aacagcacac tcatgcaacg tgaacagatt taacgtggca atcacaagag caaaggtagg 4980
gatcctctgt atcatgtcag atagagatct ttacgataaa cttcaattta catcacttga 5040
aatccctaga agaaacgtgg cgactctgca ggctgagaac gtgacaggat tgttcaagga 5100
ctgctcaaag gtaattacgg gtttacatcc gacacaagca cctacacacc tttcagtgga 5160
tacaaagttc aagactgaag gactttgcgt ggatatccct ggaatcccta aagatatgac 5220
atacagaaga cttatctcaa tgatgggatt taagatgaat taccaagtga acggataccc 5280
taacatgttt atcacaagag aagaagcaat cagacacgtg agagcatgga taggcttcga 5340
cgtcgaggga tgccacgcaa caagagaagc agtgggaaca aaccttcctc ttcaacttgg 5400
attctccact ggagtgaacc ttgtggcagt gcctacagga tacgtggata cacctaacaa 5460
cacagatttc tcgcgagtgt cagcaaagcc accacctgga gatcaattta aacaccttat 5520
ccctcttatg tacaaaggac ttccttggaa cgtggtgaga atcaagatag tccaaatgct 5580
atccgatacc ttaaagaatc ttagtgaccg tgtcgtattt gtgctttggg cacacggatt 5640
tgaacttaca tcaatgaaat actttgtgaa gatcggtccc gagcgtacat gctgcctttg 5700
cgatagaaga gctacgtgtt tcagtaccgc ttcagataca tacgcatgct ggcaccactc 5760
aataggcttc gattacgttt ataatccgtt catgatagat gtgcaacaat ggggattcac 5820
gggcaatctg cagagcaacc acgatcttta ctgccaagtg cacggaaacg cacacgtggc 5880
atcatgcgat gcaatcatga caagatgcct tgcagtgcac gaatgctttg tgaagcgggt 5940
cgattggaca atcgaatacc ctatcatcgg agatgaactt aagataaatg cagcatgcag 6000
aaaggtccag cacatggtgg tgaaagcagc acttcttgca gataaatttc ctgtgcttca 6060
cgatatcgga aaccctaaag caatcaaatg cgtgcctcaa gcagatgtgg aatggaaatt 6120
ctatgacgca caaccttgct cagataaagc atacaagata gaggaactat tctatagtta 6180
cgcaacacac tcagataaat ttacagatgg agtgtgcctg ttctggaatt gcaacgtgga 6240
tagataccct gcaaactcaa tcgtgtgcag atttgataca agagtgcttt caaaccttaa 6300
ccttccaggt tgtgacggcg gcagtctata tgttaataag cacgcatttc acacacctgc 6360
attcgataag tccgcattcg tcaatttaaa gcagctacct ttcttctatt attcagattc 6420
accttgcgaa tcacacggaa agcaggttgt cagtgacatc gattacgtgc ctcttaaatc 6480
agcaacatgt attaccaggt gtaatcttgg aggagccgtc tgtcgacatc atgcaaacga 6540
atacagactt taccttgatg catacaacat gatgatctcc gccgggttct ccctatgggt 6600
gtacaaacaa tttgatacat acaacctttg gaacacattt acaagacttc aatcacttga 6660
gaacgttgcg ttcaatgtag tcaataaggg acacttcgac ggtcaacagg gtgaggttcc 6720
tgtgtcaatc atcaacaata ccgtttatac taaagttgac ggcgtggatg tggaactctt 6780
cgagaataag actacgcttc ctgtgaatgt tgccttcgag ttgtgggcaa agcgcaatat 6840
caaacctgtg cctgaagtga agatactcaa taaccttgga gtggatatcg cagcaaacac 6900
agtgatctgg gattacaaga gggacgcacc tgcacacatc tcaacaatcg gagtgtgctc 6960
aatgacagat atcgcaaaga agccgactga aacaatctgc gcacctctta ctgtattctt 7020
cgacggaaga gtggatggac aagtggattt attccgaaat gcaagaaacg gagtgcttat 7080
cacagaagga tcagtgaaag gacttcaacc ttcagtggga cctaaacaag catcacttaa 7140
cggagtgact ctgataggcg aggccgtgaa gactcagttt aactactaca agaaagtaga 7200
cggtgtcgtc cagcagctgc ccgagaccta tttcacacaa tcacggaatc tgcaggagtt 7260
caaacctaga tcacaaatgg aaatcgattt cctggagctt gcaatggatg aatttatcga 7320
aagatacaaa cttgaaggat acgcatttga acacatcgtg tacggagatt tcagtcattc 7380
acaacttgga ggacttcacc ttcttattgg cctagccaaa cgtttcaaag aatcaccttt 7440
cgagctcgaa gatttcattc caatggattc aacagtgaag aattatttca ttactgacgc 7500
ccagacggga tcatcaaagt gtgtatgctc agtgatcgat ctactactag acgatttcgt 7560
tgaaattatt aaatcacaag acttgagtgt agttagtaag gttgtgaagg tcacaatcga 7620
ttacacagaa atctcattta tgctttggtg caaagatgga cacgtggaaa cattctatcc 7680
caaacttcaa tcatcacaag catggcaacc tggagtggcc atgccgaatt tgtataagat 7740
gcagagaatg cttcttgaga agtgtgacct tcagaattat ggagattcag caacacttcc 7800
taaaggaatc atgatgaacg tggcaaagta tactcaactt tgccaatacc ttaacacact 7860
tacacttgca gtgccttaca acatgagagt gatccacttc ggtgcagggt cggacaaagg 7920
agtggcacct ggtactgctg tccttagaca atggcttcct acaggaacac ttcttgtgga 7980
ttcagatctt aacgatttcg tctccgatgc agattcaacc ctcattggtg actgtgcaac 8040
agtgcacaca gcaaacaagt gggacttaat aatatcagat atgtacgatc ctaagactaa 8100
gaatgtaacg aaagagaatg actcaaagga aggtttcttc acctatatct gcggatttat 8160
ccaacagaag ttagctcttg gaggatcagt ggcaatcaag attacggaac actcatggaa 8220
cgcagatctt tacaaactta tgggacactt tgcatggtgg accgcgttcg ttacaaacgt 8280
aaacgcgtcg tcctcagaag catttcttat cggatgcaac taccttggga aaccaagaga 8340
gcagatcgat ggatacgtga tgcacgcaaa ctacatcttc tggaggaaca caaaccctat 8400
ccaactttca tcatactcac tcttcgacat gtcaaagttc ccgcttaaac ttagagggac 8460
tgccgtaatg tcgcttaaag aaggacaaat caacgatatg atactcagcc tcctaagtaa 8520
agggaggctt atcatcagag agaataatag agtggtgatc tcatcagatg tgcttgtgaa 8580
caactaacta gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgtctag 8640
a 8641
<210> 20
<211> 50
<212> DNA
<213> 人工序列
<400> 20
agtgatgttc ttgttaacaa ctaaacgaac aatgtttgtt tttcttgttt 50
<210> 21
<211> 50
<212> DNA
<213> 人工序列
<400> 21
agtcaaatta cattacacat aaacgaactt atggatttgt ttatgagaat 50
<210> 22
<211> 66
<212> DNA
<213> 人工序列
<400> 22
tgatcttctg gtctaaacga actaaatatt atattagttt ttctgtttgg aactttaatt 60
ttagcc 66
<210> 23
<211> 50
<212> DNA
<213> 人工序列
<400> 23
gcaaccaatg gagattgatt aaacgaacat gaaaattatt cttttcttgg 50
<210> 24
<211> 134
<212> DNA
<213> 人工序列
<400> 24
ttgaactttc attaattgac ttctatttgt gctttttagc ctttctgcta ttccttgttt 60
taattatgct tattatcttt tggttctcac ttgaactgca agatcataat gaaacttgtc 120
acgcctaaac gaac 134
<210> 25
<211> 50
<212> DNA
<213> 人工序列
<400> 25
tttagatttc atctaaacga acaaactaaa atgtctgata atggacccca 50
<210> 26
<211> 265
<212> DNA
<213> 人工序列
<400> 26
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaag 265
<210> 27
<211> 294
<212> DNA
<213> 人工序列
<400> 27
tgggctatat aaacgttttc gcttttccgt ttacgatata tagtctactc ttgtgcagaa 60
tgaattctcg taactacata gcacaagtag atgtagttaa ctttaatctc acatagcaat 120
ctttaatcag tgtgtaacat tagggaggac ttgaaagagc caccacattt tcaccgaggc 180
cacgcggagt acgatcgagt gtacagtgaa caatgctagg gagagctgcc tatatggaag 240
agccctaatg tgtaaaatta attttagtag tgctatcccc atgtgatttt aata 294
<210> 28
<211> 463
<212> DNA
<213> 人工序列
<400> 28
gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct 60
cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc 120
ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga 180
caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc 240
ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt 300
attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg 360
gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc taggcccccc 420
gaaccacggg gacgtggttt tcctttgaaa aacacgatga taa 463
<210> 29
<211> 12
<212> DNA
<213> 人工序列
<400> 29
taataataat aa 12
<210> 30
<211> 4364
<212> DNA
<213> 人工序列
<400> 30
gctagcatta aaggtttata ccttcccagg taacaaacca accaactttc gatctcttgt 60
agatctgttc tctaaacgaa ctttaaaatc tgtgtggctg tcactcggct gcatgcttag 120
tgcactcacg cagtataatt aataactaat tactgtcgtt gacaggacac gagtaactcg 180
tctatcttct gcaggctgct tacggtttcg tccgtgttgc agccgatcat cagcacatct 240
aggtttcgtc cgggtgtgac cgaaaggtaa ggtggagagc cttgtccctg gtttcaacga 300
gaaaacacac gtccaactca gtttgcctgt tttacaggtt cgcgacgtgc tcgtacgtgg 360
ctttggagac tccgtggagg aggtcttatc agaggcacgt caacatctta aagatggcac 420
ttgtggctta gtagaagttg aaaaaggcgt tttgcctcaa cttgaacagc ctgagctttg 480
ggctaagcgc aacattaaac cagtaccaga ggtgaaaata ctcaataatt tgggtgtgga 540
cattgctgct aatactgtga tctgggacta caaaagagat gctccagcac atatatctac 600
tattggtgtt tgttctatga ctgacatagc caagaaacca actgaaacga tttgtgcacc 660
actcactgtc ttttttgatg gtagagttga tggtcaagta gacttattta gaaatgcccg 720
taatggtgtt cttattacag aaggtagtgt taaaggttta caaccatctg taggtcccaa 780
acaagctagt cttaatggag tcacattaat tggagaagcc gtaaaaacac agttcaatta 840
ttataagaaa gttgatggtg ttgtccaaca attacctgaa acttacttta ctcagagtag 900
aaatttacaa gaatttaaac ccaggagtca aatggaaatt gatttcttag aattagctat 960
ggatgaattc attgaacggt ataaattaga aggctatgcc ttcgaacata tcgtttatgg 1020
agattttagt catgagggcc cggaaacctg gccctgtctt cttgacgagc attcctaggg 1080
gtctttcccc tctcgccaaa ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc 1140
ctctggaagc ttcttgaaga caaacaacgt ctgtagcgac cctttgcagg cagcggaacc 1200
ccccacctgg cgacaggtgc ctctgcggcc aaaagccacg tgtataagat acacctgcaa 1260
aggcggcaca accccagtgc cacgttgtga gttggatagt tgtggaaaga gtcaaatggc 1320
tctcctcaag cgtattcaac aaggggctga aggatgccca gaaggtaccc cattgtatgg 1380
gatctgatct ggggcctcgg tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaaac 1440
gtctaggccc cccgaaccac ggggacgtgg ttttcctttg aaaaacacga tgataagcgg 1500
ccgcatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct 1560
ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac 1620
ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc 1680
caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc ccgaccacat 1740
gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat 1800
cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac 1860
cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg 1920
gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa 1980
gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct 2040
cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa 2100
ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat 2160
ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa 2220
gtaataataa taagatatct gatcttctgg tctaaacgaa ctaaatatta tattagtttt 2280
tctgtttgga actttaattt tagccatggc cgatgctaag aacattaaga agggccctgc 2340
tcccttctac cctctggagg atggcaccgc tggcgagcag ctgcacaagg ccatgaagag 2400
gtatgccctg gtgcctggca ccattgcctt caccgatgcc cacattgagg tggacatcac 2460
ctatgccgag tacttcgaga tgtctgtgcg cctggccgag gccatgaaga ggtacggcct 2520
gaacaccaac caccgcatcg tggtgtgctc tgagaactct ctgcagttct tcatgccagt 2580
gctgggcgcc ctgttcatcg gagtggccgt ggcccctgct aacgacattt acaacgagcg 2640
cgagctgctg aacagcatgg gcatttctca gcctaccgtg gtgttcgtgt ctaagaaggg 2700
cctgcagaag atcctgaacg tgcagaagaa gctgcctatc atccagaaga tcatcatcat 2760
ggactctaag accgactacc agggcttcca gagcatgtac acattcgtga catctcatct 2820
gcctcctggc ttcaacgagt acgacttcgt gccagagtct ttcgacaggg acaaaaccat 2880
tgccctgatc atgaacagct ctgggtctac cggcctgcct aagggcgtgg ccctgcctca 2940
tcgcaccgcc tgtgtgcgct tctctcacgc ccgcgaccct attttcggca accagatcat 3000
ccccgacacc gctattctga gcgtggtgcc attccaccac ggcttcggca tgttcaccac 3060
cctgggctac ctgatttgcg gctttcgggt ggtgctgatg taccgcttcg aggaggagct 3120
gttcctgcgc agcctgcaag actacaaaat tcagtctgcc ctgctggtgc caaccctgtt 3180
cagcttcttc gctaagagca ccctgatcga caagtacgac ctgtctaacc tgcacgagat 3240
tgcctctggc ggcgccccac tgtctaagga ggtgggcgaa gccgtggcca agcgctttca 3300
tctgccaggc atccgccagg gctacggcct gaccgagaca accagcgcca ttctgattac 3360
cccagagggc gacgacaagc ctggcgccgt gggcaaggtg gtgccattct tcgaggccaa 3420
ggtggtggac ctggacaccg gcaagaccct gggagtgaac cagcgcggcg agctgtgtgt 3480
gcgcggccct atgattatgt ccggctacgt gaataaccct gaggccacaa acgccctgat 3540
cgacaaggac ggctggctgc actctggcga cattgcctac tgggacgagg acgagcactt 3600
cttcatcgtg gaccgcctga agtctctgat caagtacaag ggctaccagg tggccccagc 3660
cgagctggag tctatcctgc tgcagcaccc taacattttc gacgccggag tggccggcct 3720
gcccgacgac gatgccggcg agctgcctgc cgccgtcgtc gtgctggaac acggcaagac 3780
catgaccgag aaggagatcg tggactatgt ggccagccag gtgacaaccg ccaagaagct 3840
gcgcggcgga gtggtgttcg tggacgaggt gcccaagggc ctgaccggca agctggacgc 3900
ccgcaagatc cgcgagatcc tgatcaaggc taagaaaggc ggcaagatcg ccgtgtaagg 3960
atccgtgggc tatataaacg ttttcgcttt tccgtttacg atatatagtc tactcttgtg 4020
cagaatgaat tctcgtaact acatagcaca agtagatgta gttaacttta atctcacata 4080
gcaatcttta atcagtgtgt aacattaggg aggacttgaa agagccacca cattttcacc 4140
gaggccacgc ggagtacgat cgagtgtaca gtgaacaatg ctagggagag ctgcctatat 4200
ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg attttaatag 4260
cttcttagga gaatgacaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ctagcataac 4320
cccttggggc ctctaaacgg gtcttgaggg gttttttgtc taga 4364

Claims (27)

1.一种新型冠状病毒SARS-CoV-2的复制子,包含以下内容的核酸序列:
(Ⅰ)编码新型冠状病毒SARS-CoV-2的非结构蛋白的核酸序列,所述编码新型冠状病毒SARS-CoV-2的非结构蛋白为新型冠状病毒SARS-CoV-2的nsp1~16蛋白,所述nsp1~16蛋白的核苷酸序列如SEQ ID NO.1-16所示;
(Ⅱ)新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因的核酸序列,所述转录调控区域选自新型冠状病毒SARS-CoV-2的M基因的转录调控区域。
2.根据权利要求1所述的复制子,其特征在于,所述转录调控区域位于报告基因的上游。
3.根据权利要求1所述的复制子,其特征在于,还包含作为参照的另一报告基因的核酸序列。
4.根据权利要求3所述的复制子,其特征在于,所述作为参照的另一报告基因连接有终止密码子且位于转录调控区域的上游。
5.根据权利要求1至4任一所述的复制子,其特征在于,所述核酸为DNA或RNA。
6.根据权利要求5所述的复制子,其特征在于,所述核酸为反义RNA。
7.一种新型冠状病毒SARS-CoV-2的复制子系统,包含插入有权利要求1至6任一所述的复制子的表达载体;所述表达载体为包括含有以下内容的两种表达载体:
(ⅰ)编码新型冠状病毒SARS-CoV-2的非结构蛋白的核酸序列,所述编码新型冠状病毒SARS-CoV-2的非结构蛋白为新型冠状病毒SARS-CoV-2的nsp1~16蛋白,所述nsp1~16蛋白的核苷酸序列如SEQ ID NO.1-16所示;
(ⅱ)新型冠状病毒SARS-CoV-2的5’UTR、3’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域和报告基因的核酸序列,所述转录调控区域选自新型冠状病毒SARS-CoV-2的M基因的转录调控区域。
8.根据权利要求7所述的复制子系统,其特征在于,表达载体(ⅱ)中依次插入有新型冠状病毒SARS-CoV-2的5’UTR、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域、报告基因、新型冠状病毒SARS-CoV-2的3’UTR的核酸序列。
9.根据权利要求8所述的复制子系统,其特征在于,表达载体(ⅱ)中依次插入有新型冠状病毒SARS-CoV-2的5’UTR、报告基因A、新型冠状病毒SARS-CoV-2的非结构蛋白可作用的转录调控区域、报告基因B、新型冠状病毒SARS-CoV-2的3’UTR的核酸序列,其中报告基因A与报告基因B不同。
10.根据权利要求9所述的复制子系统,其特征在于,新型冠状病毒SARS-CoV-2的5’UTR与报告基因A之间还连接有核糖体进入位点的核酸序列。
11.根据权利要求9所述的复制子系统,其特征在于,报告基因A为荧光蛋白的核酸序列;报告基因B为编码荧光素酶的核酸序列。
12.根据权利要求9至11任一所述的复制子系统,其特征在于,所述表达载体(ⅱ)中插入的核酸序列如SEQ ID No.28所示。
13.根据权利要求7所述的复制子系统,其特征在于,所述表达载体(ⅰ)中包括3个表达载体,分别插入有编码新型冠状病毒SARS-CoV-2的nsp1~16蛋白中的一个或多个的核酸序列。
14.根据权利要求13所述的复制子系统,其特征在于,所述的3个表达载体分别插入有编码新型冠状病毒SARS-CoV-2的nsp1~4蛋白的核酸序列、编码新型冠状病毒SARS-CoV-2的nsp5~11蛋白的核酸序列、新型冠状病毒SARS-CoV-2的nsp12~16蛋白的核酸序列。
15.根据权利要求13或14所述的复制子系统,其特征在于,所述3个表达载体分别插入核酸序列如SEQ ID No.17~19所示。
16.一种包装细胞,包括权利要求1至6任一所述的复制子或权利要求7至15任一所述的复制子系统。
17.根据权利要求16所述的包装细胞,其特征在于,所述细胞为人源细胞。
18.根据权利要求16所述的包装细胞,其特征在于,所述复制子或复制子系统经过密码子优化。
19.权利要求1至6任一所述的复制子、权利要求7至15任一所述的复制子系统或权利要求16至18任一所述的包装细胞在抗新型冠状病毒SARS-CoV-2的药物检测或药物筛选方面的应用。
20.一种筛选抗新型冠状病毒SARS-CoV-2药物的方法,通过向包含有权利要求1至6任一所述复制子、权利要求7至15任一所述复制子系统或权利要求16至18任一所述包装细胞的表达系统中,加入待测药物,检测报告基因的差异表达,评估所述待测药物抗新型冠状病毒SARS-CoV-2的效果。
21.一种筛选抗新型冠状病毒SARS-CoV-2药物的试剂盒,包括权利要求1至6任一所述的复制子、权利要求7至15任一所述的复制子系统或权利要求16至18任一所述的包装细胞。
22.一种抗新型冠状病毒SARS-CoV-2药物的筛选装置,包括权利要求1至6任一所述的复制子、权利要求7至15任一所述的复制子系统或权利要求16至18任一所述的包装细胞。
23.根据权利要求22所述的药物筛选装置,其特征在于,所述药物筛选装置还包括荧光素酶检测装置。
24.根据权利要求22所述的药物筛选装置,其特征在于,所述药物筛选装置还包括荧光蛋白检测装置。
25.根据权利要求22所述的药物筛选装置,其特征在于,所述药物筛选装置还包括全自动机械臂药筛平台。
26.一种新型冠状病毒SARS-CoV-2分子流行病学监测装置,包括权利要求1至6任一所述的复制子、权利要求7至15任一所述的复制子系统或权利要求16至18任一所述的包装细胞。
27.根据权利要求26所述的SARS-CoV-2分子流行病学监测装置,其特征在于,利用所述复制子系统监测SARS-CoV-2在流行过程中所产生突变对SARS-CoV-2病毒复制的影响。
CN202010818896.XA 2020-08-14 2020-08-14 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用 Active CN112029781B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010818896.XA CN112029781B (zh) 2020-08-14 2020-08-14 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用
US18/021,348 US20240192196A1 (en) 2020-08-14 2020-09-30 NOVEL CORONAVIRUS SARS-CoV-2 SAFE REPLICON SYSTEM AND USE THEREOF
PCT/CN2020/119544 WO2022032832A1 (zh) 2020-08-14 2020-09-30 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010818896.XA CN112029781B (zh) 2020-08-14 2020-08-14 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用

Publications (2)

Publication Number Publication Date
CN112029781A CN112029781A (zh) 2020-12-04
CN112029781B true CN112029781B (zh) 2023-01-03

Family

ID=73577969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010818896.XA Active CN112029781B (zh) 2020-08-14 2020-08-14 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用

Country Status (3)

Country Link
US (1) US20240192196A1 (zh)
CN (1) CN112029781B (zh)
WO (1) WO2022032832A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116472345A (zh) * 2020-04-23 2023-07-21 J·大卫格莱斯顿研究所-根据J·大卫格莱斯顿遗嘱的遗嘱信托 冠状病毒的治疗性干扰颗粒
WO2022120819A1 (zh) * 2020-12-11 2022-06-16 中国科学院深圳先进技术研究院 Ires序列、ires序列的应用和多顺反子表达载体
CN112592923A (zh) * 2020-12-11 2021-04-02 中国科学院深圳先进技术研究院 Ires序列、ires序列的应用和多顺反子表达载体
WO2022170177A1 (en) * 2021-02-08 2022-08-11 The University Of North Carolina At Chapel Hill Fusion proteins and methods of using the same for the detection of neutralizing antibodies
CN115216452A (zh) * 2021-04-17 2022-10-21 复旦大学 一种SARS-CoV-2病毒复制子及其构建方法和用途
CN113388626B (zh) * 2021-06-10 2022-10-25 武汉大学 新型冠状病毒nsp13基因的用途
CN113913447B (zh) * 2021-10-15 2024-06-18 武汉生物制品研究所有限责任公司 SARS-CoV-2全长cDNA克隆单拷贝质粒及其构建方法
CN115029380B (zh) * 2022-05-16 2023-11-28 复旦大学 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用
CN118028541A (zh) * 2024-03-29 2024-05-14 浙江大学医学院附属邵逸夫医院 一种鉴定泛沙贝冠状病毒的rt-lamp引物探针组合物及应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103184228A (zh) * 2011-12-29 2013-07-03 天津市国际生物医药联合研究院 用于可结晶成熟型SARS冠状病毒非结构蛋白12(sars-nsp12)的外源重组表达及纯化方法
CN110352247A (zh) * 2016-12-05 2019-10-18 杨森制药公司 用于增强基因表达的组合物和方法
CN111217918A (zh) * 2020-03-04 2020-06-02 中山大学 一种基于2,4-二氧四氢喋啶合酶的新型冠状病毒s蛋白双区域亚单位纳米疫苗
CN111991559A (zh) * 2020-09-03 2020-11-27 中山大学 受体酪氨酸激酶抑制剂在制备预防和/或治疗新型冠状病毒感染药物中的应用
CN112076182A (zh) * 2020-09-03 2020-12-15 中山大学 Dna拓扑异构酶抑制剂在制备预防和/或治疗新型冠状病毒感染药物中的应用
CN112301043A (zh) * 2020-10-13 2021-02-02 中国医学科学院病原生物学研究所 一种新型冠状病毒SARS-CoV-2复制子、其构建方法及应用
CN112458064A (zh) * 2020-11-20 2021-03-09 广西大学 盖他病毒全长感染性克隆、复制子系统及其制备和应用
CN113684210A (zh) * 2021-07-19 2021-11-23 武汉大学 抗新型冠状病毒的核酸及其药物组合物与应用

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040213805A1 (en) * 1999-10-12 2004-10-28 Verheije Monique Helene Deletions in arterivirus replicons
US6750009B2 (en) * 2002-01-29 2004-06-15 Apath, Llc Multiple viral replicon culture systems
JP5016305B2 (ja) * 2003-03-20 2012-09-05 アルファヴァックス,インコーポレイテッド 改良されたアルファウイルスレプリコンおよびヘルパー構築物
ES2529736T3 (es) * 2003-04-10 2015-02-25 Novartis Vaccines And Diagnostics, Inc. Composición inmunogénica que comprende una proteína espicular del coronavirus del SARS
CN1212397C (zh) * 2003-06-12 2005-07-27 中国人民解放军第二军医大学 筛选抗SARS冠状病毒药物用非感染性病毒重组基因SARS-CoV-EGFP
EP1508615A1 (en) * 2003-08-18 2005-02-23 Amsterdam Institute of Viral Genomics B.V. Coronavirus, nucleic acid, protein, and methods for the generation of vaccine, medicaments and diagnostics
EP1736539A1 (en) * 2005-06-24 2006-12-27 Consejo Superior De Investigaciones Cientificas Attenuated SARS-CoV vaccines
WO2009151165A1 (en) * 2008-06-13 2009-12-17 Industry-Academic Cooperation Foundation, Yonsei University Recombinant sars-c o v n s p 12 and the use thereof, and the method for producing it
CN102021145B (zh) * 2009-09-10 2013-05-01 中国人民解放军军事医学科学院放射与辐射医学研究所 一种靶向冠状病毒蛋白酶的药物筛选模型及其应用
GB201315785D0 (en) * 2013-09-05 2013-10-23 Univ York Anti-viral agents
CN103555599A (zh) * 2013-11-05 2014-02-05 武汉大学 抗冠状病毒药物高通量筛选方法
GB201413020D0 (en) * 2014-07-23 2014-09-03 Pribright The Inst Coronavirus
WO2017044507A2 (en) * 2015-09-08 2017-03-16 Sirnaomics, Inc. Sirna/nanoparticle formulations for treatment of middle-east respiratory syndrome coronaviral infection
JP7494117B2 (ja) * 2018-01-19 2024-06-03 ヤンセン ファーマシューティカルズ,インコーポレーテッド 組換えレプリコン系を使用する免疫応答の誘導および増強
CN110257357A (zh) * 2019-07-04 2019-09-20 中国人民解放军军事科学院军事医学研究院 MERS-CoV 3CLpro作为去泛素化酶和干扰素抑制剂的用途
CN111996213A (zh) * 2020-02-06 2020-11-27 广西大学 猪繁殖与呼吸综合征病毒双荧光标记基因重组毒株的构建方法
KR20230004508A (ko) * 2020-03-20 2023-01-06 비온테크 에스이 코로나바이러스 백신 및 사용 방법
EP4135847A4 (en) * 2020-04-17 2024-05-15 VLP Therapeutics, Inc. CORONAVIRUS VACCINE
EP4138897A1 (en) * 2020-04-22 2023-03-01 BioNTech SE Coronavirus vaccine
US11103576B1 (en) * 2020-06-15 2021-08-31 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Measles virus vaccine expressing SARS-COV-2 protein(s)

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103184228A (zh) * 2011-12-29 2013-07-03 天津市国际生物医药联合研究院 用于可结晶成熟型SARS冠状病毒非结构蛋白12(sars-nsp12)的外源重组表达及纯化方法
CN110352247A (zh) * 2016-12-05 2019-10-18 杨森制药公司 用于增强基因表达的组合物和方法
CN111217918A (zh) * 2020-03-04 2020-06-02 中山大学 一种基于2,4-二氧四氢喋啶合酶的新型冠状病毒s蛋白双区域亚单位纳米疫苗
CN111991559A (zh) * 2020-09-03 2020-11-27 中山大学 受体酪氨酸激酶抑制剂在制备预防和/或治疗新型冠状病毒感染药物中的应用
CN112076182A (zh) * 2020-09-03 2020-12-15 中山大学 Dna拓扑异构酶抑制剂在制备预防和/或治疗新型冠状病毒感染药物中的应用
CN112301043A (zh) * 2020-10-13 2021-02-02 中国医学科学院病原生物学研究所 一种新型冠状病毒SARS-CoV-2复制子、其构建方法及应用
CN112458064A (zh) * 2020-11-20 2021-03-09 广西大学 盖他病毒全长感染性克隆、复制子系统及其制备和应用
CN113684210A (zh) * 2021-07-19 2021-11-23 武汉大学 抗新型冠状病毒的核酸及其药物组合物与应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SARS-CoV的发现及其基因组研究进展;胡族琼等;《中国人兽共患病杂志》;20050130(第01期);第83-88页 *

Also Published As

Publication number Publication date
WO2022032832A1 (zh) 2022-02-17
CN112029781A (zh) 2020-12-04
US20240192196A1 (en) 2024-06-13

Similar Documents

Publication Publication Date Title
CN112029781B (zh) 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用
AU2019204982B2 (en) Recombinant HCMV and RhCMV Vectors and Uses Thereof
Curtis et al. Heterologous gene expression from transmissible gastroenteritis virus replicon particles
McKNIGHT et al. The rhinovirus type 14 genome contains an internally located RNA structure that is required for viral replication
Lin et al. Deletion mapping of a mouse hepatitis virus defective interfering RNA reveals the requirement of an internal and discontiguous sequence for replication
Serviene et al. Screening of the yeast yTHC collection identifies essential host factors affecting tombusvirus RNA recombination
AU2015289560B2 (en) Human cytomegalovirus comprising exogenous antigens
Joo et al. Mutagenic analysis of the coronavirus intergenic consensus sequence
Yang et al. SHAPE analysis of the RNA secondary structure of the Mouse Hepatitis Virus 5’untranslated region and N-terminal nsp1 coding sequences
Jeong et al. Evidence for coronavirus discontinuous transcription
Zhang et al. Unusual heterogeneity of leader-mRNA fusion in a murine coronavirus: implications for the mechanism of RNA transcription and recombination
CN117413063A (zh) 冠状病毒治疗性干扰颗粒
AU2003267851B2 (en) Novel full-length genomic RNA of Japanese encephalitis virus, infectious JEV CDNA therefrom, and use thereof
Chen et al. An alternate pathway for recruiting template RNA to the brome mosaic virus RNA replication complex
KR20200083540A (ko) 시토메갈로바이러스의 안정한 제형
Teterina et al. Strand-specific RNA synthesis defects in a poliovirus with a mutation in protein 3A
Yu et al. Identification of cis-acting signals in the giardiavirus (GLV) genome required for expression of firefly luciferase in Giardia lamblia.
Garcia-Ruiz et al. Inducible yeast system for viral RNA recombination reveals requirement for an RNA replication signal on both parental RNAs
WO2023015229A2 (en) Sars-cov-2 virus-like particles
Joo et al. Replication of murine coronavirus defective interfering RNA from negative-strand transcripts
CN116018404A (zh) 缺陷干扰病毒基因组
US20240209381A1 (en) Rapid generation of infectious clones
Artificial Pervasive RNA folding is crucial for narnavirus genome maintenance
Banerjee et al. Enhanced accumulation of coronavirus defective interfering RNA from expressed negative-strand transcripts by coexpressed positive-strand RNA transcripts
Miller et al. Pooled PPIseq: screening the SARS-CoV-2 and human interface with a scalable multiplexed protein-protein interaction assay platform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant