[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111373041B - 用于基因组编辑和调节转录的crispr/cas系统和方法 - Google Patents

用于基因组编辑和调节转录的crispr/cas系统和方法 Download PDF

Info

Publication number
CN111373041B
CN111373041B CN201880062677.4A CN201880062677A CN111373041B CN 111373041 B CN111373041 B CN 111373041B CN 201880062677 A CN201880062677 A CN 201880062677A CN 111373041 B CN111373041 B CN 111373041B
Authority
CN
China
Prior art keywords
lys
leu
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880062677.4A
Other languages
English (en)
Other versions
CN111373041A (zh
Inventor
瑞安·E·克拉克
布拉德利·J·梅里尔
马修·S·麦克道格尔
汉娜·M·彭宁顿
布莱恩·R·谢赫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Illinois at Urbana Champaign
Original Assignee
University of Illinois at Urbana Champaign
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Illinois at Urbana Champaign filed Critical University of Illinois at Urbana Champaign
Publication of CN111373041A publication Critical patent/CN111373041A/zh
Application granted granted Critical
Publication of CN111373041B publication Critical patent/CN111373041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02019Ubiquitin-protein ligase (6.3.2.19), i.e. ubiquitin-conjugating enzyme
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/06Fusion polypeptide containing a localisation/targetting motif containing a lysosomal/endosomal localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/95Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/121Hammerhead
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/122Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/123Hepatitis delta
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

提供了一种用于编辑或调节细胞基因组转录的CRISPR/Cas系统和方法,其中所述系统包括与一个或多个降解决定子序列融合的Cas核酸内切酶和至少一个可激活的同源单向导RNA,所述同源单向导RNA在所述同源sgRNA的非必需区域中带有失活序列,其中所述失活序列包含例如核酶的一个或多个核酸内切酶识别位点。

Description

用于基因组编辑和调节转录的CRISPR/CAS系统和方法
引言
本申请要求2017年9月26日提交的美国临时申请号62/563,128;2017年9月26日提交的美国临时申请号62/563,131;和2017年9月26日提交的美国临时申请号62/563,133的优先权权益,这些美国临时申请的内容以引用的方式整体并入本文。
本发明是在政府支持下根据由国家卫生研究院(National Institutes ofHealth)授予的基金号R01 HD081534作出的。政府拥有本发明的某些权利。
背景技术
在使用哺乳动物细胞的早期研究中,发现使用归巢核酸内切酶I-SceI在基因组中的独特位置处引入DNA双链断裂(DSB)会通过同源重组而刺激基因靶向。随后,已经使用人工序列特异性核酸酶(如锌指核酸酶和TALE核酸酶)和最近的RNA引导的成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)(CRISPR/Cas)核酸酶来靶向预定的基因组位点。在CRISPR/Cas9的情况下,具有与靶DNA互补的间隔区序列的单向导RNA(sgRNA或gRNA)引导Cas9核酸内切酶对DNA的切割。在DSB修复期间发生基因组序列的修饰,并且起作用的分子途径决定了序列变化的类型。规范的非同源末端连接(NHEJ)和诸如微同源介导的末端连接(MMEJ)的替代的末端连接途径在DNA末端已经被加工之后通过连接所述DNA末端而进行,并且引起靶向但不精确的插入缺失(一般是小的插入或缺失)。两个或更多个核苷酸的微同源性可以在DNA切割之后通过切除而暴露并且可以在通过MMEJ进行修复期间使用。与末端连接途径相反,使用外源性DNA修复模板的同源性依赖性修复(HDR)支持精确的基因组编辑。通常,可以使用具有与侧接DSB的序列同源的臂的转基因并且所述转基因因此将被精确地整合。
限制基于CRISPR/Cas9的基因组编辑的效率的障碍有非编码区或弱转录基因的存在,它们对于CRISPR/Cas9诱变来说似乎是难处理的;以及相对于NHEJ修复,HDR的频率较低,这使得难以对基因组序列产生精确的变化。为了增强通过HDR进行的基因组编辑,已经开发了不同的策略。例如,当将细胞在S/G2期同步化时,通过同源重组进行DNA修复的细胞周期被限制,并且HDR可以增加到高达五倍。例如在连接酶4失活后的NHEJ抑制也可以增加HDR。另一种方法是将规范的Cdh1或Cdc20降解决定子(如联会蛋白降解决定子)与Cas9融合以诱导它在G1中降解并且将靶DNA切割限制到S/G2期(Gutschner等,(2016)Cell Rep.14:1555-1566;Maji等,(2017)Nat.Chem.Biol.13:9-11;Howden等,(2016)Stem Cell Rep.7:508-517)。还参见WO 2017/024047 A1、US 2016/0376610和CN 105647885 B。类似地,已经将PEST降解决定子与Cas9融合以缩短Cas9的半衰期(CN 201410656081)。
当前的CRISPR方法的另一个限制是当Cas9和它的sgRNA共表达时的组成型核酸内切酶活性。这在靶向在发育上对于活力来说重要的或必要的基因时可特别成问题。此外,已经证实,Cas9的组成型表达可增加脱靶突变的数量并且可触发DNA损伤响应。解决该问题的一种方法是将FKBP12衍生的去稳定化结构域与Cas9融合,这会有条件地调节蛋白质稳定性(Senturk等,(2017)Nat.Commun.8:14370;US 2016/0298096)。
当表达多个sgRNA时,可以引导Cas9以同时操纵多个基因组基因座,这可以通过在单独的构建体中共转染多个sgRNA而实现。尽管这种方法是高效的,但是对于其中载体容量和/或载体数量对于同时产生多个gRNA是有限的某些应用来说,它将是一个挑战。已经开发了几种策略来从单个转录物表达多个gRNA。一种策略使用Csy4核糖核酸内切酶,其可以加工含有与Csy4可切割的RNA融合的gRNA的转录物(Nissim等,(2014)Mol.Cell.54:698-710;Tsai等,(2014)Nat.Biotechnol.32:569-576)。此外,已经使用自切割核酶在U6启动子的控制下从单个表达盒表达多个sgRNA(Xu等,(2017)Nucl.Acids Res.45(5):e28)。
发明内容
本发明提供了一种CRISPR/Cas系统,其包括Cas核酸内切酶和同源单向导RNA(sgRNA),其中:(a)所述Cas核酸内切酶与一个或多个降解决定子序列融合,其中所述降解决定子具有(i)非规范的Cdc20或Chd1识别基序,或(ii)由连接酶靶向的序列,所述连接酶选自EMI1、TRP1、CBL-PTK、CBL-MET、COP1、CRL4-CDT2、Kelch KEAP1、Kelch KLHL3、MDM2-SWIB、ODPH-VHL、SCF-SKP2、SCF-SKP2-CKS1、SCF-CULLIN、SCF-FBW7、SCF-FBX05、SCF-TRCP1、SCF-CUL4、E6-AP、SIAH、HECT结构域家族、环指家族(RING finger family)、U框家族(U boxfamily)和其组合;(b)所述同源sgRNA是可激活的sgRNA,其在所述可激活的sgRNA的非必需区域中带有失活序列,其中所述失活序列包含一个或多个核酸内切酶识别位点;或(c)(a)和(b)的组合。在一些实施方式中,所述系统包括可激活的sgRNA的阵列,其中所述同源sgRNA靶向所述可激活的sgRNA的阵列中的至少一个可激活的sgRNA。
在所述Cas融合蛋白的某些方面,所述Cas核酸内切酶是Cas9核酸内切酶。在所述Cas融合蛋白的一些实施方式中,所述一个或多个降解决定子序列与所述Cas核酸内切酶融合,在它们之间设置有一个或多个接头。在所述Cas融合蛋白的其它实施方式中,所述一个或多个降解决定子序列在所述Cas核酸内切酶的N末端、C末端或N末端和C末端处与所述Cas核酸内切酶融合。
在所述可激活的sgRNA的某些方面,所述可激活的sgRNA靶向核酸分子的转录链。在所述可激活的sgRNA的其它方面,所述失活序列是顺式作用核酶。在一些实施方式中,所述顺式作用核酶由SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的核酸分子编码。在其它实施方式中,所述可激活的sgRNA由SEQ ID NO:14-22的核酸分子编码。还包括一种核酸,所述核酸具有编码序列、5'非翻译区和3'非翻译区,其中所述核酸在5'非翻译区或3'非翻译区中插入有可激活的sgRNA。
还提供了编码所述Cas融合蛋白和/或可激活的sgRNA的多核苷酸和载体,以及一种使用所述CRISPR/Cas系统以通过将所述Cas融合蛋白和/或可激活的sgRNA引入到细胞中来编辑或调节细胞的基因组的转录的方法。当用于本发明的方法中时,可以通过一种或多种可调节的启动子来控制Cas核酸内切酶、可激活的sgRNA或Cas核酸内切酶和可激活的sgRNA的表达。此外,在一些实施方式中,将靶向两个或更多个序列的至少两个同源sgRNA引入到细胞中,其中所述至少两个同源sgRNA任选地是可以被顺序地激活以在基因组中引入两个或更多个编辑或调节所关注的基因的转录的可激活的sgRNA。此外,在其它实施方式中,所述至少一个同源sgRNA插入在编码基因的5'非翻译区或3'非翻译区的核酸中。
附图说明
图1描绘了经验证的Cas9变体构建体和它们的表达/降解特征(顶部)。在靶向Ctnnb1以插入EGFP之后,在7天的过程中,对HDR频率(左下)和插入缺失频率(右下)进行测量。用对应的HDR试剂瞬时转染小鼠胚胎干细胞(mESC)并且将Cas9靶向模板或非模板链以评估链偏好性对精确基因组编辑的影响。通过流式细胞术分析HDR频率并且通过对非HDR等位基因进行深度测序来测量插入缺失频率。当与组成型表达的WT-Cas9相比时,使用细胞周期蛋白E启动子表达Cas9变体基本上增加了HDR频率,同时减少了插入缺失。使用Cdt1变体将Cas9去稳定化增强了非模板sgRNA的插入缺失活性,同时降低了HDR频率,这表明了能够克服非模板sgRNA通常遇到的链偏好性阻碍的动力学的能力。一般,模板sgRNA介导与非模板相似的插入缺失诱变,但是对于HDR是优越的。
图2示出了在HEK293细胞中使用两个混杂的sgRNA由Cas9变体引起的中靶和组合脱靶突变频率。
图3是描绘了未修饰的化脓性链球菌(Streptococcus pyogenes)sgRNA(SEQ IDNO:1)的结构的图示。
图4是描绘了可激活的sgRNA的示意图。将顺式作用核酶序列插入到发夹1中引起在转录时对sgRNA的切割。然后通过Cas9靶向侧接或编码核酶的DNA序列以引入突变而破坏它的顺式切割活性并且恢复sgRNA功能。
图5示出了使用包括核酶作为失活序列的可激活的sgRNA变体的EGFP破坏测定的结果。变体1:SEQ ID NO:5;变体2:SEQ ID NO:7;和变体3:SEQ ID NO:6。所有这三种含有核酶的变体都不能在哺乳动物细胞中的EGFP转基因内介导显著的突变,从而在可激活的sgRNA条件下产生接近100%的EGFP阳性细胞。对于所有条件,n=3个生物学平行测定,通过流式细胞术进行测量。
图6是描绘了通过核酶的诱变将可激活的sgRNA转化成功能性sgRNA的两种策略的示意图。产生带有靶向EGFP转基因的变体1的基因组整合的细胞系,然后仅转染Cas9或转染靶向切除整个核酶(策略1)或使核酶活性位点突变(策略2)的Cas9和sgRNA。图表示出了由直接靶向EGFP的野生型sgRNA(未修饰)或由靶向可激活的sgRNA的DNA的sgRNA通过策略1或策略2介导的EGFP破坏频率。
图7是描绘了在可激活的sgRNA阵列内sgRNA的顺序激活的示意图。每一个sgRNA靶向直接在它下游的sgRNA,从而使得阵列中的每一个sgRNA依赖于它上游的可激活的sgRNA而通过基因组编辑转化成功能状态。该事件顺序最终以顺序方式控制Cas9活性。可以通过深度测序直接分析每一个可激活的sgRNA的DNA,或每一个的RNA可以由寡聚dT结合而转化成cDNA以通过一般RNA测序或单细胞RNA测序来分析。阵列内sgRNA的激活过程是细胞条形编码过程,并且对阵列中诱变事件的分析允许进行谱系树构建。这些sgRNA还可以具有靶向图8中所描绘的“条形码”基因座、靶向如例如图9中的另一个可激活的sgRNA或内源性基因的次要功能。
图8提供了条形码基因座示意图。可以将所述条形码基因座通过PCR扩增并且通过深度测序进行分析,或将它的RNA转化成cDNA以通过单细胞RNA测序进行分析。
图9描绘了可激活的sgRNA的阵列,其中每一个sgRNA靶向下一个sgRNA以进行激活。1号sgRNA具有一个功能:即激活阵列中的下一个sgRNA。
图10描绘了图9中的可激活的sgRNA的阵列,其中所述sgRNA被编程以执行多个功能。其中1号sgRNA1激活2号sgRNA,2号sgRNA具有三个功能并且因此具有三个靶标。功能1是靶向阵列中下一个可激活的sgRNA(3号sgRNA)以继续顺序细胞条形编码,并且功能2和功能3是靶向位于整个基因组中的其它可激活的sgRNA的DNA。在对2号sgRNA的第二靶标和第三靶标进行激活基因组编辑之后,产生功能性的可激活的sgRNA,所述功能性的可激活的sgRNA与dCas9转录激活因子或阻遏因子结合,它们由于PAM序列特异性而具有生物化学特异性。PAM识别中的这种生物化学差异仅使dCas9分子靶向所关注的位点,而阻止核酸酶活性Cas9靶向相同的位点。这些sgRNA结合dCas9并且靶向内源性基因的启动子,其中dCas9募集RNA聚合酶以引发基因的转录。值得注意的是,2号sgRNA同时激活3号sgRNA,所述3号sgRNA可以通过激活4号sgRNA的唯一功能而继续细胞条形编码。
图11描绘了使用细胞周期控制的Cas9核酸酶以调节可激活的sgRNA阵列的激活。如顶部部分中所示,G1-Cas9(PAM:NGG)存在并且与功能性sgRNA结合。在结合后,Cas9:sgRNA靶向阵列中的下一个sgRNA。这去除了它的失活序列并且引起功能性的可激活的sgRNA的表达以及sgRNA DNA阵列中的独特突变。由于PAM特异性要求,因此新功能性可激活的sgRNA不能被G1-Cas9使用,而仅可以被G2-Cas9使用。随着细胞进入G2,G2-Cas9(PAM:NAG)与功能性sgRNA结合。G2-Cas9:sgRNA靶向阵列中的下一个sgRNA,去除它的失活序列,并且引入独特的突变。新功能性sgRNA由于PAM特异性差异而对G1-Cas9具有生物化学特异性并且靶向阵列中新生的sgRNA。这些PAM特异性差异使得阵列由于Cas9变体的细胞周期调节而依赖于细胞周期进程并且使得每个细胞周期激活两个sgRNA。此外,这些激活过程使得每个细胞周期发生两个条形编码事件。
图12是描绘了利用链选择来影响每个细胞周期被激活的可激活的sgRNA的数量的示意图。与非模板链结合的sgRNA将通过DNA复制活动被逐出,从而使得过程动力学取决于细胞周期并且导致每个细胞周期的一个激活基因组编辑。因此,如果在阵列中存在10个可激活的sgRNA,这些sgRNA全部都靶向非模板链,那么为了耗尽所述阵列需要完成10个细胞周期。与模板链结合的sgRNA将具有不同的动力学,这取决于基因的转录水平,通常允许阵列的更快激活和条形编码。
图13提供了示出了将可激活的sgRNA的阵列进行编程以通过将图11或图12中所示的过程与图10中所示的过程组合而在特定的细胞分裂次数之后进行受控的转录调节的示意图。根据图10中所示的策略,采用可激活的sgRNA对转录的控制。为了引入细胞周期调节,所述过程还包括如图11中所描绘的细胞周期控制的可激活的sgRNA阵列。
图14示出了当Cas9靶向模板(转录)链时在存在或不存在T7RNAP的情况下Cas9的动力学。从两次重复实验计算平均动力学值。
图15示出了T7 RNAP介导的Cas9从DSB中的逐出具有模板链和距离依赖性。示出了在模板链取向或非模板取向上带有T7 RNAP启动子的靶DNA的Cas9消化反应的结果。值表示由于添加T7 RNAP而引起的切割DNA倍数变化的平均值±S.D.,n=3。
图16示出了体外模板链偏好性在多个sgRNA(即靶向mCherry和GFP的sgRNA)(n=3)中是一致的。所述示意图描绘了转化成转录模板的mCherry靶DNA,所述转录模板介导sgRNA的模板或非模板碰撞。
图17示出了通过sgRNA与模板链退火而进行转录,从而增强了基因组编辑。所述图表示出了由靶向不同基因的17个模板sgRNA和23个非模板sgRNA引起的插入缺失频率,其中每一个点代表独立转染的突变频率,每一个sgRNA的n=2。
图18示出了通过靶向模板链的sgRNA的主动转录增强了诱变频率。通过T7E1测定测量了靶向多西环素诱导型mCherry的17个sgRNA的诱变频率。值表示平均值±S.D.,n=3。**p<0.01,***p<0.001。
图19示出了当靶向模板链时,间隔区RC1-4介导多周转Cas9活性,如通过分别针对在任一末端上带有T7 RNAP启动子的ΦNM1靶DNA的体外Cas9消化反应所测量。值表示由于添加T7 RNAP而引起的切割DNA倍数变化的平均值±S.D.,n=3。
图20示出了在基因组编辑期间Cas9核酸内切酶的链偏好性引起不同的基因组编辑动力学和差异突变结果。所述图示描绘了在基因组编辑期间模板链与非模板链的偏好性。特别是,上图示出了当Cas9靶向模板链时,易位RNA聚合酶通过与聚合酶的碰撞而被逐出,从而引起非细胞周期依赖性Cas9介导的DSB修复。相比之下,与非模板结合的sgRNA不会被RNA聚合酶逐出(中图)。然而,与非模板结合的sgRNA会在DNA复制期间通过在细胞周期的HDR活跃期的期间内发生的DNA复制复合体的各种活动而从双链断裂(DSB)中被逐出,这潜在地使突变结果具有偏好性。
图21描绘了通过生物处理器技术使细胞行为自动化的方法,所述技术使用可激活的sgRNA的阵列以在一段延长的时间内跟踪细胞历史,即世代条形编码系统。将与单克隆抗体(mAB)的产生相关的细胞活动与世代条形编码系统相关联。一旦已经跟踪了各种细胞历史并且检测到影响mAB产生的特定事件(例如1号事件、4号事件、9号事件等),就将数据用于修改生物处理器以使得对细胞进行预编程以规避所检测到的问题。这通过将指令程序嵌入到细胞的基因组中而产生高性能的产生mAB的细胞。此外,核心生物处理器可以通过可激活的sgRNA进行补充,所述可激活的sgRNA可以通过细胞表面受体-配体相互作用而被激活以执行一系列程序,这些程序各自在细胞培养物的生命周期期间的特定阶段执行,从而优化mAB的产生。
图22示出了将Cas9-VPR与14nt sgRNA和20nt sgRNA组合在诱变和转录激活方面的结果。Cas9-VPR是与转录激活因子VPR融合的核酸酶活性Cas9。通过将sgRNA截短到14nt,消除了Cas9核酸酶活性,但是维持了DNA结合,从而允许募集RNA聚合酶II而不引入DSB。示出了描绘了Cas9-VPR靶向沉默内源性基因TTN以进行转录激活和诱变的示意图。在TTN处通过使用Cas9-VPR构建体合成激活人类TTN基因的转录来测试链偏好性。使用14nt sgRNA,将核酸酶活性Cas9-VPR靶向激活转录,但是不引入DSB。同时,提供靶向模板或非模板链的20nt sgRNA以驱动由14nt-Cas9-VPR介导的通过Cas9切割位点的转录。在转染后48小时收获基因组DNA,并且显示突变频率,如通过T7E1测定所确定。通过RNA的定量实时PCR分析来评估由靶向TTN的14nt sgRNA产生的转录水平并且观测到转录物水平的约5倍变化。
图23示出了嵌入基因的3'-UTR中的一系列sgRNA可以用于调节Cas9活性。sgRNA嵌入于所关注的基因的开放阅读框的下游以允许在表达所述基因时转录所述基因和sgRNA。sgRNA被放置在多聚腺苷酸尾的下游并且由两个顺式作用核酶侧接(被称作RGR,即核酶-向导-核酶)以使得sgRNA被切除并且产生用于Cas9结合的功能性分子。使得编码mRNA的转录物具有功能性,并且由于丧失RGR但维持适当的多聚腺苷酸尾而可以被翻译。使用这种方法,将1个、2个、3个或4个RGR嵌入mCherry的3'-UTR中。RGR靶向HEK293基因组内的EGFP序列。使用流式细胞术测量EGFP荧光的损失作为Cas9活性的读数,并且测量mCherry的存在,所述mCherry是RGR上游的编码序列。EGFP阴性细胞中高水平的mCherry确认了RGR被正确切除的mRNA的翻译。
具体实施方式
Cas9核酸内切酶由于它的通用性和易编程性而已经被用于在许多物种中进行基因组编辑。然而,Cas9在本质上是单周转核酸酶,这是因为它保持与它产生的双链断裂结合,并且基因组的许多区域对于基因组编辑来说是难处理的。现在已经证实,Cas9的难处理性是由于Cas9阻断了在它的核酸酶活性之后的步骤(DNA修复),因此抑制了基因组编辑的完成。在这方面,如果使sgRNA与RNA聚合酶的模板链退火,那么易位的RNA聚合酶将与Cas9-DSB复合物发生碰撞并且将Cas9从DNA末端逐出,最终促进了DNA修复并且为基因组编辑产生了链偏好性。为了减轻链偏好性和对RNA聚合酶的需要,通过去稳定化对Cas9进行修饰还通过增加从DNA中去除Cas9的速率来减轻这种“阻断”现象。此外,通过控制Cas9的表达和降解以对应于细胞周期,可以影响基因组编辑的类型(易错的“NHEJ”或精确的“HDR”)。除了修饰Cas9之外,现在还已经证实,通过专门设计与基因的转录链退火的sgRNA,可以对突变频率产生积极的影响。与模板链退火的sgRNA的设计会显著增加突变频率/动力学,而靶向非模板链由于基因组编辑动力学较慢能导致基本上较低的突变频率/动力学。此外,通过控制特定sgRNA的功能,基因组编辑活动不依赖于Cas蛋白的转录或翻译控制。实际上,现在已经证实,实现一系列可激活的sgRNA,可以从靶位点到靶位点更多地以时间方式调节基因组编辑,可以执行顺序基因组编辑以发挥类似于多米诺效应的功能,并且可以对细胞进行条形编码。
因此,本发明提供了一种CRISPR/Cas系统和其用于编辑细胞,特别是真核细胞的基因组的用途。本发明的CRISPR/Cas系统包括Cas核酸内切酶和可激活的同源sgRNA,其中所述Cas核酸内切酶与一个或多个降解决定子序列融合和/或所述可激活的同源sgRNA在所述可激活的同源sgRNA的非必需区域中带有失活序列。鉴于它的改善的基因编辑能力,本发明的CRISPR/Cas系统可用于基因治疗、药物筛选、遗传记录、遗传回路以及疾病诊断和预后。
术语“CRISPR/Cas”、“CRISPR/Cas系统”和“核酸靶向系统”可以可互换地使用。CRISPR-Cas系统是本领域已知的。参见例如美国专利号8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8,906,616;8,932,814;8,945,839;8,999,641;美国申请号14/704,551;15/192,095;以及PCT公布号WO2016106244和WO2014093622。还参见Komor等,(2017)Cell 168(1-2):20-36。
本发明的CRISPR/Cas系统包括RNA引导的核酸酶(在本文中也被称为Cas核酸内切酶或Cas蛋白)和同源向导RNA。如本领域中常规的那样,向导RNA在本文中也被称为单向导RNA、sgRNA或gRNA,将同源Cas蛋白引导到基因组中的特定位点以进行靶向切割。如本文所用的“同源”指的是能够形成核蛋白复合物的Cas蛋白和sgRNA,所述核蛋白复合物直接结合与sgRNA中存在的核酸序列互补的靶核酸分子。
如本领域中常规的那样,“互补性”指的是核酸分子与另一核酸分子形成氢键的能力(例如通过传统的沃森-克里克碱基配对(Watson-Crick base-pairing))。互补百分比表示在核酸分子中可以与第二核酸序列形成氢键的残基的百分比。当两个多核苷酸序列具有100%互补性时,这两个序列是完全互补的,即第一多核苷酸的所有连续残基与第二多核苷酸中相同数量的连续残基形成氢键。
Cas融合蛋白。如所示,本发明提供了一种CRISPR/Cas系统,所述CRISPR/Cas系统包括与一个或多个降解决定子序列融合的Cas核酸内切酶,其在本文中一般被称为“Cas融合蛋白”或“融合蛋白”。Cas核酸内切酶是本领域已知的并且包括但不限于Cas蛋白,如Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也被称为Csn1和Csx12)、Cas10、Cas12a、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和其同源物或其修饰型式。在一些实施方式中,所述Cas是dCas9蛋白(无核酸内切酶活性的Cas9蛋白,例如具有点突变D10A和H840A)或其融合蛋白。尽管dCas9缺乏核酸内切酶活性,但是它仍然能够与它的向导RNA和靶核酸分子结合。这种结合DNA的能力可以用于通过将dCas9与转录阻遏肽,如KRAB融合来阻断靶向基因的转录或通过将dCas9与激活结构域,如VP64-p65-Rta(VPR)融合来激活转录。这些Cas蛋白的核酸序列和氨基酸序列可容易地从包括基因库(GENBANK)和SwissProt的公共来源获得。作为说明,化脓性链球菌Cas9蛋白质序列可在SwissProt登录号Q99ZW2下获得。同样,猪放线杆菌(Actinobacillus suis)Cas9可在基因库登录号WP_014991277下获得。优选的是,所述CRISPR酶是Cas9蛋白。代表性Cas9蛋白包括但不限于来自包括化脓性链球菌、肺炎链球菌(S.pneumoniae)等的链球菌属(Streptococci)的Cas9以及来自金黄色葡萄球菌(Staphylococcus aureus)、脑膜炎奈瑟氏球菌(Neisseria meningitides)和齿垢密螺旋体(Treponema denticola)的Cas9。另外的RNA引导的核酸酶包括Cas12a核酸酶(“Cas12a”,以前的“Cpf1”),包括来自普罗威登斯菌属(Providicella)、弗朗西斯氏菌属(Francisella)、氨基酸球菌属(Acidaminococcus)和毛螺菌科(Lachnospiracae)的Cas12a。
为了调节Cas蛋白的稳定性并且因此调节从DNA中去除Cas9的速率,本发明包括由与一个或多个降解决定子序列融合的Cas核酸内切酶构成的融合蛋白。如本文所用的“降解决定子”指的是蛋白质中赋予降解的代谢不稳定性的特定氨基酸序列。降解决定子序列可以存在于N末端或C末端区域处,并且这些分别被称作N-降解决定子或C-降解决定子。降解决定子可以是向与它融合的蛋白质赋予降解作用的任何氨基酸序列或序列的组合。
通过细胞周期的有序进展取决于通过泛素介导的蛋白水解来调节几种蛋白质的丰度。降解是精确定时的和特异性的。这样的降解系统的一个实例是后期促进复合物(APC),其是一种泛素蛋白连接酶。APC在有丝分裂期间和有丝分裂/G1后期两者分别由WD重复蛋白Cdc20和Cdh1激活。这些激活因子靶向不同组的底物。APC/C-Cdc20和APC/C-Cdh1共激活因子复合物通过识别以下规范基序来识别它们大部分的底物:D(破坏)框降解决定子(Arg-Xaa-Xaa-Leu-Asp或Arg-Xaa-Xaa-Leu)和KEN框降解决定子(Lys-Glu-Asn的三氨基酸基序)。在这方面,“规范的Cdc20或Chd1识别基序”指的是经典表征的Cdc20和Cdh1识别基序,即D框和KEN框基序。在一些实施方式中,所述降解决定子含有规范的Cdc20或Chd1识别基序。包括D框降解决定子的天然存在的蛋白质的实例是细胞周期依赖性细胞周期蛋白(CDK),如细胞周期蛋白A和细胞周期蛋白B,以及其它细胞周期调节蛋白,如Hsl1、Cdc6、Fin1、p21和联会蛋白。代表性的D框降解决定子氨基酸序列包括RPALSD、RPALS和RLALD。包括KEN框降解决定子的天然存在的蛋白质的实例是Cdc20、Sgo1、Nek2和B99。含有D框或KEN框的其它蛋白质是本领域公知的(Glotzer等,(1991)991,Nature 349:132-138;Pfleger和Kirschner(2000)Genes Dev.14(6):655-665)。
在其它实施方式中,所述降解决定子不是规范的Cdc20或Chd1识别基序。因此,在一些方面,所述降解决定子是非规范的Cdc20或Chd1识别基序。“非规范的Cdc20或Chd1识别基序”指的是作为除D框或KEN框基序以外的基序的Cdc20或Chd1基序。非规范的Cdc20和Chd1识别基序包括LXXK基序、A基序、CRY框和RL尾。
“LXXK”降解决定子是一种非规范的APC/Cdh1靶标,其使得它的蛋白质可靶向蛋白酶体。LXXK降解决定子包括氨基酸序列LXXK,其中X可以是任何氨基酸残基。代表性的LXXK降解决定子序列是LASK。
A基序是增强APC-Cdh1结合以有助于靶向蛋白酶体的序列。A基序降解决定子包括氨基酸序列EET。代表性的A基序降解决定子序列是EETAE。
CRY框基序是由APC/C识别以靶向蛋白酶体的降解决定子。该降解决定子包括氨基酸序列CRYXPS,其中X可以是任何氨基酸残基。代表性的CRY框降解决定子序列是CRYIPS。
Emi1/Emi2的RL尾基序用作APC/C的停泊位点,从而促进APC/C-Chd1的相互作用和抑制。该降解决定子包括氨基酸序列(T/S)KKSKKNL(R/Q)RL(SEQ ID NO:56),其中X可以是任何氨基酸残基。代表性的RL尾降解决定子序列是TKKSKKNLRRL(SEQ ID NO:57)。
在本发明的其它方面,所述降解决定子既不是规范的,也不是非规范的cdc20或Chd1识别基序。根据本发明的这个方面,所述降解决定子可以介导泛素依赖性降解或非泛素依赖性降解(例如通过本文公开的PEST降解决定子)。在一些实施方式中,所述降解决定子具有由连接酶靶向的序列,所述连接酶选自EMI1、TRP1、CBL-PTK、CBL-MET、COP1、CRL4-CDT2、Kelch KEAP1、Kelch KLHL3、MDM2-SWIB、ODPH-VHL、SCF-SKP2、SCF-SKP2-CKS1、SCF-CULLIN、SCF-FBW7、SCF-FBX05、SCF-TRCP1、SCF-CUL4、E6-AP、SIAH、HECT结构域家族、环指家族、U框家族和其组合。不用作Cdc20或Chd1的识别基序的降解决定子的实例包括例如PHD结构域、PIP基序、Cy基序、ABBA基序等(表1)。
表1
***共有序列。X表示任何氨基酸残基。还参见Guharoy等,(2016)Nat.Commun.7:10239。
在一些实施方式中,所述降解决定子是从Cdt1的氨基酸序列中获得的,并且优选地具有如SEQ ID NO:76所示的氨基酸序列。在另一个实施方式中,所述降解决定子是从联会蛋白的氨基酸序列中获得的,并且优选地具有如SEQ ID NO:77所示的氨基酸序列。在其它实施方式中,所述降解决定子是从鸟氨酸脱羧酶的氨基酸序列中获得的,并且优选地具有如SEQ ID NO:78或SEQ ID NO:79所示的氨基酸序列。
尽管任何生物体的蛋白质的降解决定子可以与任何细胞类型中的Cas蛋白融合以向核酸酶赋予降解作用,但是使用宿主细胞内源性蛋白质的降解决定子或与宿主细胞最密切相关的物种的蛋白质的降解决定子是优选的。
可以通过常规的重组蛋白产生方法将降解决定子添加到Cas蛋白的C末端、N末端或两个末端上。在这方面,所述融合蛋白是与至少一个降解决定子序列缔合的非天然存在或工程化的CRISPR酶。所述降解决定子可以作为单个拷贝或多个拷贝插入。此外,Cas融合蛋白可以包括不止一种类型的降解决定子。在某些实施方式中,编码Cas融合蛋白的核酸可以经过密码子优化以在真核细胞中表达。
在一些实施方式中,本发明的Cas9融合蛋白切割DNA的两条链以产生双链断裂(DSB)。在某些实施方式中,所述Cas9融合蛋白是切口酶。在其它实施方式中,所述Cas9融合蛋白是双切口酶。在另外的实施方式中,所述Cas9融合蛋白是无活性Cas9(dCas9),例如基本上没有核酸酶活性,例如与野生型Cas9或没有突变的Cas9相比,不超过5%核酸酶活性的Cas9。此外,所述Cas9融合蛋白可以与一个或多个功能结构域(例如转录阻遏因子或激活因子)缔合。更具体地,所述Cas9融合蛋白是dCas9和/或与一个或多个功能结构域(例如转录调节因子,如VPR或KRAB)缔合。
在一些方面,所述Cas9融合蛋白具有Rec2或HD2截短。在一些实施方式中,所述降解决定子可以例如使用诸如标记系统,如链霉亲和素-生物素系统的系统,通过连接头蛋白与Cas核酸内切酶缔合。因而,提供了Cas核酸内切酶与连接头蛋白的融合体,所述连接头蛋白对该连接头的高亲和力配体具有特异性,而所述降解决定子与所述高亲和力配体结合。例如,链霉亲和素可以是与Cas核酸内切酶融合的连接头,而生物素可以与降解决定子结合。在共定位时,链霉亲和素将与生物素结合,从而将Cas核酸内切酶与降解决定子连接。
优选的是,所述Cas核酸内切酶与降解决定子融合或共价连接。在一些实施方式中,所述融合可以是与Cas核酸内切酶的N末端融合。在一些实施方式中,至少一个降解决定子与Cas核酸内切酶的N末端融合。在其它实施方式中,所述融合可以是与Cas核酸内切酶的C末端融合。在另外的实施方式中,至少一个降解决定子与Cas核酸内切酶的C末端融合。在一些实施方式中,一个降解决定子可以与Cas核酸内切酶的N末端融合,而另一个降解决定子可以与Cas核酸内切酶的C末端融合。在一些实施方式中,所述Cas核酸内切酶与至少两个降解决定子缔合,并且其中第一降解决定子与Cas核酸内切酶的N末端融合并且第二降解决定子与Cas核酸内切酶的C末端融合,所述第一降解决定子和第二降解决定子是相同的或不同的。在一些实施方式中,所述融合可以是与降解决定子的N末端融合。在其它实施方式中,所述融合可以是与降解决定子的C末端融合。在一些实施方式中,所述融合可以在Cas核酸内切酶的C末端与降解决定子的N末端之间。在其它实施方式中,所述融合可以在降解决定子的C末端与Cas核酸内切酶的N末端之间。
在一些实施方式中,一个或两个降解决定子可以与Cas核酸内切酶的N末端融合,而一个或两个降解决定子可以与Cas核酸内切酶的C末端融合。在一些实施方式中,至少两个降解决定子与Cas核酸内切酶缔合并且所述降解决定子是相同的降解决定子,即所述降解决定子是同源的。在一些实施方式中,至少两个降解决定子与Cas核酸内切酶缔合并且所述降解决定子是不同的降解决定子,即所述降解决定子是异源的。具有两个或更多个异源的降解决定子可以是有利的,这是因为它将提供更大水平的降解控制。在N末端或C末端处多于一个降解决定子的串联融合可以增强降解。设想的是,高水平的降解将在不存在任一种稳定化配体的情况下发生,中间水平的降解将在不存在一种稳定化配体而存在另一种(或另外的)稳定化配体的情况下发生,而低水平的降解将在这两种(或两种以上)稳定化配体的两者都存在的情况下发生。
所述融合蛋白可以包括与降解决定子直接融合的Cas蛋白,或可选地,所述Cas蛋白通过接头与降解决定子融合。在一些实施方式中,所述接头是Gly-Ser接头。在其它实施方式中,所述融合蛋白还包括至少一个核输出信号(NES)。在一些实施方式中,所述融合蛋白包括两个或更多个NES。在一些实施方式中,所述融合蛋白包括至少一个核定位信号(NLS)。这可以是除NES之外另加的。在一些实施方式中,所述融合蛋白包含以下各项,由以下各项组成,或基本上由以下各项组成:Cas蛋白、降解决定子和定位(核输入或输出)信号,所述信号作为Cas蛋白与降解决定子之间的接头或作为所述接头的一部分。HA或标签也可以用作接头。在某些方面,所述融合蛋白包括NLS和/或NES和/或Gly-Ser接头,所述Gly-Ser接头具有氨基酸序列GSGGSGS或(GGGGS)3(SEQ ID NO:66)。
融合蛋白的表达可以处在组成型启动子或调节型启动子的控制之下,例如组织特异性启动子、化学诱导型启动子或细胞周期调节的启动子,如受Rb或E2F转录因子控制的细胞周期蛋白B、E、A或D基因的启动子。使融合蛋白的表达处在细胞周期启动子的控制之下将调节融合蛋白的表达时间和随后的活性。
“在调节型启动子的控制之下”或“受调节型启动子的控制”意指编码所关注的产物的DNA序列将在控制它的RNA产物转录的启动子元件的下游。“调节型启动子”是活性受顺式作用因子或反式作用因子影响的任何启动子。本发明的调节型启动子可以通过细胞周期来调节,即通过在细胞周期中的特定时间点,诸如E2F或Rb的内源性转录因子被募集到启动子DNA元件以阻遏或开启RNA聚合酶II对该基因的转录;通过组织特异性诱导;化学诱导,即通过与毒素、生长因子、类固醇、重金属等接触;或环境刺激,例如通过光或温度来调节。
本发明还提供了一种编码所述Cas-降解决定子融合蛋白的多核苷酸。在一些实施方式中,编码的融合蛋白与第一调节元件可操作地连接。在一些实施方式中,降解决定子也被编码并且与第二调节元件可操作地连接。有利的是,这里的降解决定子将“扫除”稳定化配体并且有利地是与和融合蛋白缔合的降解决定子相同的降解决定子(即相同类型的结构域)。如本文所用的术语“扫除”意指在执行以促进或结束活动的意义上。在一些实施方式中,第一调节元件是启动子并且可以任选地包括增强子。在一些实施方式中,第二调节元件是启动子并且可以任选地包括增强子。在一些实施方式中,第一调节元件是早期启动子。在一些实施方式中,第二调节元件是晚期启动子。在一些实施方式中,第二调节元件是以下各项,包含以下各项,或基本上由以下各项组成:诱导型控制元件,任选地是tet系统;或阻遏型控制元件,任选地是tetr系统。诱导型启动子可以是有利的,例如rTTA,以在多西环素存在下诱导tet。
本发明还提供了一种用于递送本发明的Cas-降解决定子融合蛋白或编码所述融合蛋白的多核苷酸的手段。这样的递送手段可以包括例如融合蛋白的粒子、带有编码融合蛋白的多核苷酸的载体;和/或CRISPR/Cas复合物的RNA。载体可以包括DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体或与递送运载体,如脂质体或泊洛沙姆复合的核酸。在一些实施方式中,载体可以是质粒或病毒载体,如AAV或慢病毒。使用质粒瞬时转染到例如HEK细胞中可以是有利的,特别是考虑到AAV的尺寸限制。虽然SpCas9适合AAV,但是在编码一个或多个降解决定子的核酸的情况下可能会达到上限。
可激活的sgRNA。如本领域已知的那样,单向导RNA(“sgRNA”或“gRNA”)指的是嵌合RNA分子,其由CRISPR RNA(crRNA)和反式编码的CRISPR RNA(tracrRNA)构成。常规的sgRNA(图3)具有(i)5'起点(通常是G,鸟苷核苷酸);(ii)DNA引导元件或间隔区序列,其与靶核酸分子互补;(iii)下和上茎、凸起和连结,其与Cas相互作用(即Cas结合元件);和(iv)一个或多个发夹结构(Briner等,(2014)Mol.Cell 56(2):333-339)。
根据本发明,从5'起点到DNA引导元件或间隔区序列的距离的长度可以是0nt(即所述起点是引导元件的一部分)至40nt(核苷酸),优选地是0nt至20nt,或0nt至10nt,或甚至1nt至5nt。DNA引导元件或序列可以具有8nt至50nt的长度,优选地9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、30nt、31nt、32nt、33nt、34nt、35nt、36nt、37nt、38nt、40nt、42nt、44nt、46nt、48nt的长度或之间的任何范围;优选的长度是15nt-30nt,甚至更优选的长度是17nt-19nt,这使脱靶事件减到最低限度(Wiles等,(2015)Mamm.Genome 26:501-510)。DNA引导元件或序列与Cas结合元件或序列之间的距离的长度可以是0nt(直接相邻)至30nt,优选地是0nt至20nt或2nt至10nt。
可以自由选择DNA引导元件或间隔区序列以与靶核酸分子杂交。sgRNA/CRISPR靶向和选择合适的DNA引导序列的方法以及向导RNA的修饰公开于例如WO 2014/093709、WO2014/144761、WO 2015/089486、WO 2015/048577、WO 2015/123339、WO 2015/089486、WO2015/089427和WO 2015/113063中。引导元件或间隔区序列通常与靶序列共有100%的序列同一性,尽管也考虑与靶序列具有至少80%、85%、90%和95%的序列同一性,只要sgRNA为CRISPR/Cas系统提供必要的特异性即可。如本文所用的“靶核酸”、“靶核酸分子”、“靶序列”或“靶DNA分子”指的是待由CRISPR/Cas系统编辑的基因组或线粒体DNA位点。sgRNA的序列允许许多变异,只要它能够结合Cas并且具有与靶核酸结合的互补区即可。
在特定的实施方式中,sgRNA具有与靶核酸分子的模板或转录链互补或特异性杂交的DNA引导元件。本文提供的数据表明可以通过将sgRNA特异性靶向靶核酸分子的模板链来增加诱变频率。更特别是,在基因组编辑期间,通过sgRNA将Cas核酸酶靶向基因组DNA序列。在sgRNA与靶核酸分子进行沃森-克里克碱基配对后,Cas引入双链断裂。Cas:sgRNA-DSB(Cas:DSB)状态是异常稳定的并且保持在复合物中,除非有很大的力,如易位RNA聚合酶(RNAP)与它碰撞。只有当sgRNA与RNAP的模板链退火时,RNAP与Cas-DSB的碰撞才会破坏复合物。破坏Cas-DSB复合物的这种机制基本上增加了诱变频率并且为Cas-DSB复合物的解离是基因组编辑的限速步骤的观测结果提供了解释。因此,靶向转录链的sgRNA的选择可以用于增加基因组编辑的动力学,而非模板的选择可以用于降低基因组编辑的动力学。通过模板或非模板链选择来调节动力学在调节本文所述的条形编码和/或生物处理技术方面是有用的。
为了选择单个基因的模板链,首先确定在基因组内基因的取向。具体地,评估由RNA聚合酶用作模板的链是在基因组的正链还是负链上取向。通常,使用者可以通过从公共数据库中访问所关注的基因的DNA序列来鉴定模板sgRNA。值得注意的是,公共数据库一般会将基因进行取向以使得编码链处于5'->3'取向。可以通过使用在线sgRNA选择工具(例如CRISPOR)或在模板链上找到合适的前间区序列邻近基序(PAM)位点(例如5'-NGG-3'、5'-NNNNGATT-3'、5'-NNAGAAW-3'或5'-NAAAAC-3')来选择用于引入基因敲除的预期sgRNA以与位于起始密码子下游(但是在外显子,优选地外显子1、2或3内)的序列杂交。对于每一个实验都应当对许多潜在的sgRNA进行选择,并且应当检查每一个sgRNA的脱靶活性。此外,使用者应当确认已知所关注的基因被表达并且所述基因是否以封闭的染色质的状态存在(例如通过查看DNA酶超敏感位点数据)。封闭的染色质可对突变频率产生负面影响,并且缺乏通过Cas靶位点的转录将会降低链选择的效果。
sgRNA的Cas结合元件或序列优选地包括茎环或至少双链区。优选的是,茎环具有6nt至50nt的长度,例如7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、30nt、32nt、34nt、36nt、38nt、40nt、45nt、50nt或更长的长度或介于这些值之间的任何范围。茎环可以具有60%至100%的互补核苷酸,包括A-U(由dsDNA的有义链上的T编码)、G-C和G-U(由T编码)碱基对。优选的是,互补核苷酸是70%至95%或80%至90%互补的。环的序列不是必要的并且甚至可以突出Cas结合区,并且仅在Cas结合口袋中留下茎区。在通过sgRNA与特定靶核酸结合后,Cas在靶核酸中在PAM位点处产生断裂(例如双链断裂或单链断裂)。
sgRNA的3'部分可以具有20nt至600nt的长度。通常,可以相对自由地设计该区域。如果太长,那么它甚至可能被天然存在的酶消化,这将自动产生CRISPR/Cas系统的合适尺寸。可能的长度是20nt至400nt、25nt至300nt或30nt至200nt。总体上,sgRNA优选地具有60nt至2000nt长度,优选地70nt至1500nt,或80nt至1000nt、90nt至800nt、100nt至500nt、120nt至300nt长度的尺寸。
对Cas9的结构分析表明尽管同源sgRNA的凸起和连结区是对于Cas9靶向来说最关键的特征,但是发夹1、发夹2以及上和下茎环区相对能耐受序列变异,包括核苷酸取代、插入和缺失以及甚至预测的结构破坏(Briner等,(2014)Mol.Cell 56(2):333-339)。
因此,本发明利用sgRNA的这些非必需区域来插入失活序列,所述失活序列允许产生这样的sgRNA,所述sgRNA是非功能性的直到被激活为止。在这方面,除了Cas-降解决定子融合蛋白之外或作为Cas-降解决定子融合蛋白的替代,本发明还提供了一种可激活的sgRNA。如本文所用的“可激活的sgRNA”指的是修饰的sgRNA分子,其以其中Cas不能与所述修饰的sgRNA结合并且引入DNA断裂的状态存在。在某些实施方式中,将可激活的sgRNA整合或插入到所关注的基因组中。在无活性状态期间,可激活的sgRNA被转录,但是由于位于sgRNA的非必需区域中的失活序列的存在,因此所述RNA分子对于Cas结合/活性是非功能性的。失活序列位于sgRNA内部或外部的可以处理修饰,但是对于Cas功能来说并非可有可无的区域中。在某些实施方式中,非必需区域指的是sgRNA的发夹(例如Cas9 sgRNA的发夹1或发夹2)、上茎环和/或下茎。在特定的实施方式中,sgRNA的非必需区域是发夹。
“失活序列”指的是通过以下方式使sgRNA无活性的核酸序列:(i)通过例如破坏sgRNA折叠、固有RNA结构或募集的蛋白质结合的庞大结构对Cas结合造成空间位阻;(ii)顺式或反式核酶插入;或(iii)细胞(内源性或外源性)RNA酶活性(例如RNA酶P/Z)。可以通过将Cas或特定核酸酶靶向每一个失活序列的DNA来激活无活性的可激活的sgRNA。该靶向引入了破坏失活序列的关键区域的突变,并且恢复了Cas结合新修饰的和功能性的可激活的sgRNA的能力。在某些实施方式中,可激活的sgRNA在sgRNA的非必需区域中带有失活序列,其中所述失活序列包括一个或多个核酸内切酶识别位点。术语“核酸内切酶识别位点”指的是由核酸内切酶识别的核酸序列或结构基序,所述核酸内切酶切割所述结构基序处或附近的核酸。在某些实施方式中,使用一对核酸内切酶识别位点,其被相同或不同的核酸内切酶靶向。理想地,这对核酸内切酶识别位点处于失活序列的末端处(即侧接失活序列)以允许核酸内切酶介导的失活序列的去除。在某些实施方式中,核酸内切酶识别位点被Cas9识别并且切割。值得注意的是,将可激活的sgRNA插入到内源性基因的5'-UTR或3'-UTR中的功能在于通过将sgRNA表达(以及因此对于与Cas9结合的可用性)与其中插入有sgRNA的基因的表达相联系来调节Cas9活性。在这方面,可激活的sgRNA以“关闭状态”表达,RNA引导的核酸酶(例如Cas9)从可激活的sgRNA切除失活序列,从而将可激活的sgRNA转化成“开启状态”,其中它可以与它的同源Cas核酸内切酶结合。
在本发明的某些实施方式中,所述失活序列是顺式作用核酶。“顺式作用核酶”是催化性RNA分子,其可以作用于与它的位置相邻或邻近的靶RNA。核酶切割具有位点特异性并且由靶区域处互补碱基之间的氢键键合来介导。顺式作用核酶是本领域已知的并且包括例如锤头型核酶、丁型肝炎病毒(HDV)核酶、发夹型核酶、Varkud卫星(VS)核酶、I型内含子核酶和II型内含子核酶(Doudna和Cech(2002)Nature 418:222-228)。在某些实施方式中,所述失活序列是由SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的核酸分子编码的顺式作用核酶。
在本发明的特定实施方式中,可激活的sgRNA由如表2中所示的核酸分子编码,其中“n^n”表示核酸内切酶识别位点的核苷酸序列,它们中的每一个可以由相同的或不同的核酸内切酶识别;并且“X”表示失活序列。在某些实施方式中,“X”表示顺式作用核酶并且“n^n”表示Cas9核酸内切酶的核酸内切酶识别位点。
表2
Sp:化脓性链球菌;Sth:嗜热链球菌(Streptococcus thermophilus);Sa:金黄色葡萄球菌。
为了用于本发明的系统和方法中,sgRNA可以作为编码sgRNA的分离的多核苷酸(例如DNA分子)被提供,所述多核苷酸可以任选地被包括在载体(例如质粒)中。在某些实施方式中,优选的是,将可激活的sgRNA整合到基因组中。本发明的可激活的sgRNA可用于多种应用中,包括例如谱系追踪,其中可激活的sgRNA的阵列以时间控制的方式相互靶向;顺序基因敲除,其中随时间推移以受控方式引入突变;使用Cas9-VPR和14nt sgRNA、具有改变的PAM特异性的Cas9核酸酶,或正交RNA引导的核酸酶,使用可激活的sgRNA的阵列进行转录编程,其中一些或所有sgRNA具有结合或激活另一个sgRNA的次要功能,所述另一个sgRNA的功能在于引导dCas9(无核酸酶活性的Cas9)或Cas9-14 nt sgRNA复合物对靶基因的转录活性;和/或生物回路,即“如果基因A开启,则关闭基因B”。因此,在本发明的某些实施方式中,所述系统还提供了可激活的sgRNA的阵列,其中所述可激活的同源sgRNA靶向所述可激活的sgRNA的阵列中的至少一个可激活的sgRNA。参见例如图7、图9和图10。在一些实施方式中,所述阵列的可激活的sgRNA彼此相邻。在其它实施方式中,所述阵列的可激活的sgRNA彼此不相邻。
本发明的CRISPR/Cas系统可以包括使用常规的Cas蛋白与可激活的同源sgRNA的组合;Cas-降解决定子融合蛋白与常规的sgRNA的组合;或Cas-降解决定子融合蛋白和可激活的sgRNA这两者。CRISPR/Cas系统的一个或这两个组分可以在用于基因组编辑的试剂盒中被提供,所述试剂盒包括编码Cas-降解决定子融合蛋白和可激活的sgRNA中的一者或这两者的核酸,所述核酸例如呈质粒的形式;以及关于使用CRISPR/Cas系统进行基因组编辑的说明书。所述试剂盒可以任选地包括例如连接组分、储存缓冲液、反应缓冲液和转化感受态细胞。可以通过插入合适的DNA引导元件将所述系统和试剂盒的sgRNA定制成特异性地靶向所关注的基因。在某些实施方式中,所述sgRNA靶向模板或非模板链,其中模板链增加激活动力学,而非模板降低动力学。
除了CRISPR/Cas系统、Cas-降解决定子融合蛋白、可激活的sgRNA和试剂盒之外,本发明还提供了一种编辑或调节细胞基因组(例如核DNA或线粒体DNA)转录的方法,所述方法是通过向真核细胞中引入或递送至少一种Cas核酸内切酶和靶向基因组的核酸序列的至少一个同源sgRNA而实现的,其中所述Cas核酸内切酶与一个或多个降解决定子序列融合和/或所述同源sgRNA在所述同源sgRNA的非必需区域中带有失活序列。在某些实施方式中,至少一种Cas核酸内切酶和至少一个同源sgRNA(例如可激活的sgRNA)的引入包括将Cas核酸内切酶和/或同源sgRNA整合到正在被编辑或转录调节的细胞基因组中。因此,本发明的系统、试剂盒和方法在操纵内源性基因以及异源性基因方面是有用的。“细胞”意图包括原核细胞和真核细胞,如真菌细胞(如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞。在某些实施方式中,所述细胞是真核细胞。根据所选择的Cas蛋白,基因组编辑和转录调节可以包括靶核酸的插入、缺失、甲基化或转录中的改变(例如通过dCas9或dCas9与转录阻遏因子或激活因子的融合体)。转录中的改变包括转录的抑制、转录的激活或增加,这可以通过选择合适的Cas9蛋白,例如与阻遏因子或激活因子的融合蛋白,或使用顺序激活的可激活的sgRNA来促进(参见例如实施例8、实施例10和实施例12)。在某些实施方式中,本发明的方法的Cas蛋白是Cas9核酸内切酶。在其它实施方式中,通过本文所述的一种或多种调节型启动子,例如细胞周期、组织特异性、化学或环境调节型启动子来控制Cas核酸内切酶、同源sgRNA或Cas核酸内切酶和同源sgRNA的表达。在涉及使用细胞周期调节型启动子来调节sgRNA表达的实施方式中,优选的是,所述sgRNA由两个顺式作用核酶侧接以允许sgRNA的适当合成。
在所述方法的一些方面,同源sgRNA靶向基因组的核酸序列的转录链。在其它实施方式中,同源sgRNA插入或嵌入编码所关注的异源性基因或内源性基因的5'-非翻译区或3'-非翻译区(UTR)的核酸中。当引入5'-UTR或3'-UTR中时,所插入的sgRNA优选地不破坏由所述基因编码的蛋白质的基因表达(即转录)或功能。将可激活的sgRNA插入到异源性基因或内源性基因的UTR中提供了所述基因的表达以及功能性或非功能性的可激活的sgRNA的存在。在这方面,本发明将Cas9活性与其中嵌入有sgRNA的基因的表达相联系。在特定的实施方式中,同源sgRNA的失活序列是顺式作用核酶,例如由SEQ ID NO:2、SEQ ID NO:3或SEQID NO:4的核酸分子编码。在特定的实施方式中,所述同源sgRNA由SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21或SEQ ID NO:22的核酸分子编码。
在所述方法的其它方面,将靶向基因组中的两个或更多个序列的至少两个同源sgRNA引入或递送到细胞中。在一个实施方式中,所述至少两个可激活的sgRNA被顺序激活以在基因组中引入两个或更多个编辑(参见例如实施例7)。在另一个实施方式中,所述至少两个可激活的sgRNA中的第一可激活的sgRNA靶向编码第二可激活的sgRNA的DNA,因此在激活后,第二sgRNA例如通过与启动子结合来调节所关注的基因的转录(参见例如实施例8、实施例10和实施例12)。
出于多种原因,可以使用本发明的方法来编辑或调节细胞基因组内的转录,所述原因包括例如增强真核细胞中生物治疗剂的产生、增强原核细胞或真核细胞中商品化学品的产生、生物体或细胞培养物中的基因驱动、体内或离体基因治疗、用于诊断或研究的离体细胞转染、离体细胞分化以及转基因生物体的产生。在一个优选的实施方式中,从受试者生物体中分离细胞,将所述细胞用sgRNA和Cas蛋白或编码sgRNA和Cas蛋白的核酸(基因或cDNA)转染,并且重新输注回受试者生物体(例如患者)体内。适用于离体转染的各种细胞类型是本领域技术人员公知的。在另一个实施方式中,对分离的细胞进行所述发明的基因组整合(例如Cas9介导的HDR或慢病毒转导),其中经整合的DNA编码程序来控制在生物体外部或在进入生物体内部后的细胞行为。
当用于产生转基因动物时,本发明的方法可以包括产生作为疾病模型的转基因动物以及具有所期望的性状的动物。可以使用本发明的方法和组合物处理胚胎以产生转基因动物。在一些实施方式中,合适的胚胎可以包括来自小型哺乳动物(例如啮齿类动物、兔等)、伴侣动物、牲畜和灵长类动物的胚胎。啮齿类动物的非限制性实例可以包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。伴侣动物的非限制性实例可以包括猫、狗、兔、刺猬和雪貂。牲畜的非限制性实例可以包括马、山羊、绵羊、猪、美洲驼、羊驼和牛。灵长类动物的非限制性实例可以包括卷尾猴、黑猩猩、狐猴、猕猴、狨猴、绢毛猴、蜘蛛猴、松鼠猴和长尾黑颚猴。在其它实施方式中,合适的胚胎可以包括来自鱼类、爬行动物、两栖动物或鸟类的胚胎。可选地,合适的胚胎可以是昆虫胚胎,例如果蝇胚胎或蚊子胚胎。
由本发明的方法和组合物考虑的转基因生物体还包括转基因植物和种子。用于引入的合适的转基因的实例包括编码一种或多种功能性多肽或RNA的外源性核酸分子,其带有或不带有一个或多个启动子,赋予生物体所期望的性状。植物中的这些性状包括但不限于除草剂抗性或耐受性;昆虫抗性或耐受性;疾病抗性或耐受性(病毒、细菌、真菌、线虫);胁迫耐受性和/或抗性,如通过对干旱、高温、寒冷、冰冻、水分过多、盐胁迫的抗性或耐受性来举例说明;氧化胁迫;增加产量;食物含量和组成;物理外观;雄性不育;抗倒伏性;淀粉、油或蛋白质的量和/或质量;氨基酸组成;等。当然,可以根据需要使用任何描述的任何两种或更多种外源性核酸,如赋予除草剂、昆虫、疾病或干旱抗性、雄性不育、多产性、淀粉特性、油的量和质量的那些,或增加产量或营养质量的那些。
提供以下非限制性实施例以进一步说明本发明。
实施例1:Cas9融合蛋白
材料和方法
重组Cas9纯化。根据常规方法,使Cas9(pMJ806,Addgene公司)表达并且通过亲和、离子交换和尺寸排阻色谱步骤的组合对其进行纯化(Anders和Jinek(2014)MethodsEnzymol.546:1-20)。
sgRNA质粒和RNA产生。将所有sgRNA克隆到pSPgRNA(Addgene公司)中。通过PCR介导的T7 RNA聚合酶(RNAP)启动子与sgRNA序列的5'末端的融合产生RNA。将柱纯化的PCR产物在含有5.0μg/ml纯化的重组T7 RNAP和以下1×转录缓冲液的反应中用作转录模板:40mMTris(pH8.0)、2mM亚精胺、10mM MgCl2、5mM DTT和2.5mM rNTP。将反应物用DNA酶I处理并且使用RNA Clean&ConcentratorTM试剂盒(Zymo Research公司)纯化。
Cas9变体构建体和Ctnnb1::EGFP供体DNA的产生。编码Cdt1和联会蛋白的核苷酸序列是以gBlock基因片段(IDT公司)的形式订购的,使用GIBSON(NEB公司)将其与编码Cas9的核苷酸序列(Addgene公司)的3'末端融合。编码所得的Cas9-Cdt1和Cas9-Gem融合蛋白的核酸在本文中分别如SEQ ID NO:67和SEQ ID NO:68所示。将编码Cas9-Cdt1和Cas9-Gem融合蛋白的核酸分别插入到小鼠细胞周期蛋白B启动子和小鼠细胞周期蛋白E启动子(分别参见SEQ ID NO:69和SEQ ID NO:70)的下游。Cas9-Cdt1和Cas9-Gem融合蛋白的氨基酸序列分别如SEQ ID NO:71和SEQ ID NO:72所示。通过对Ctnnb1::EGFP基因座进行PCR扩增(Shy等,(2016)Nucl.Acids Res.44(16):7997-8010)以包括500bp同源臂而产生Ctnnb1::EGFP供体DNA。对PCR产物进行TA克隆并且验证序列。
细胞培养。小鼠胚胎干(ES)细胞:为了使野生型、Rex1:EGFPd2或Rosa26::TetOn-Otx2-mCherry ES细胞正常传代,将1-2×106个C57BL/6小鼠ES细胞的单细胞悬浮液平板接种到先前包被有0.1%明胶的10cm培养皿(密理博公司(Millipore))上。使细胞在补充有以下的KnockOutTM杜氏改良伊格尔氏培养基(Dulbecco's Modified Eagle Medium,DMEM;GIBCO公司)中生长:15%的KnockOutTM血清替代品(GIBCO公司)、2mM的L-谷氨酰胺(GIBCO公司)、1000U/ml的PenStrep(GIBCO公司)、1mM HEPES(Thermo Scientific公司)、1×MEM非必需氨基酸(GIBCO公司)、55μM的2-巯基乙醇(GIBCO公司)、100U/ml的LIF(密理博公司)和3μM的CHIR99021(糖原合酶激酶3抑制剂,西格玛公司(Sigma))。每2天-3天使用0.25%的胰蛋白酶-EDTA(GIBCO公司)将细胞1:10分瓶。HEK293和Neuro2a:HEK293细胞是本领域已知的。将所有细胞维持在补充有10%胎牛血清(FBS;西格玛公司)和100μg/mL青霉素-链霉素的DMEM中。通过深度测序来验证HEK293的细胞系身份。
转染和选择条件。对于ES细胞,在平板接种到12孔培养皿中约18小时之后不久转染1×105个细胞。对于每一个孔,将5μl的LipofectamineTM 2000和相关的DNA在250μl的OPTI-MEMTM(GIBCO公司)中孵育。在适当的情况下,转染包括250ng的pPGKpuro(Addgene公司)以允许消除未转染的细胞。此外,用250ng的pX330 Cas9(野生型或变体)表达质粒和250ng相应的pSPgRNA质粒转染细胞。对于Ctnnb1::EGFP测定,添加另外400ng的Ctnnb1::EGFP质粒并且在48小时之后,将细胞分瓶到2μg/ml嘌呤霉素中并且施加选择48小时。
对于Neuro2a细胞,在转染前一晚将0.5×105个细胞平板接种到6孔培养皿中。对于每一个孔,将6μl的LipofectamineTM 2000和相关的DNA在500μl的OPTI-MEMTM(GIBCO公司)中孵育,之后添加到孔中。Ctnnb1::EGFP测定含有400ng的Cas9表达质粒、400ng相应的pSPgRNA质粒、400ng的pPGKpuro(以允许消除未转染的细胞)和800ng的Ctnnb1::EGFP质粒。在48小时之后,将细胞分瓶到4μg/ml嘌呤霉素中并且施加选择96小时。
对于HEK293细胞,在转染前一晚将0.5×105个细胞平板接种到6孔培养皿中。对于每一个孔,将6μl的LipofectamineTM 2000和相关的DNA在500μl的OPTI-MEMTM(GIBCO公司)中孵育,之后添加到孔中。所有转染都含有1μg的Cas9表达质粒和1μg相应的pSPgRNA质粒。对于深度测序噪音控制,用空的pSPgRNA质粒转染细胞。
T7核酸内切酶I测定。通过T7核酸内切酶I(T7E1)或限制性内切酶消化来监测编辑。简单地说,在转染后36小时收获经编辑的小鼠胚胎干细胞(mESC)并且使用含有蛋白酶K的Bradley裂解缓冲液提取基因组DNA,继而进行EtOH/NaCl介导的沉淀和随后的EtOH洗涤。在使用高GC缓冲液(NEB公司)和标准PCR条件(98℃持续30秒;98℃持续5秒,64℃持续10秒和72℃持续15秒的30个循环;和72℃持续5分钟的1个循环)的PCR反应中,使用基因组DNA(50ng)作为模板。使纯化的PCR DNA的等分试样(200ng)经受T7EI并且在1.5%琼脂糖凝胶上拆分。使用ImageJ对凝胶图像进行定量。
流式细胞术。通过进行胰蛋白酶消化并且重悬在2%FBS/PBS/2mM EDTA中来制备单细胞悬浮液。在LSRFortessaTM流式细胞仪上分析细胞。使用FlowJo v9.3.2进行数据分析。通过前向角散射和侧向角散射面积对活细胞进行门控,通过侧向角散射面积和侧向角散射宽度对单细胞进行门控。对于每一个样品计数至少5×105个单活细胞(计数越高,事件的频率越低)。通过使用荧光阴性细胞作为对照,对适当的通道进行门控来定量绿色荧光事件。在转染后一周,对用于Ctnnb1::EGFP测定的细胞进行流式细胞术。在转染后40小时,对用于Rex1::EGFPd2破坏测定的细胞进行流式细胞术。
蛋白质印迹法和免疫荧光法。对于蛋白质印迹分析,分别用等摩尔浓度的Cas9质粒转染Neuro2a、HEK293和mESC,并且在转染后48小时产生裂解物。使用抗体(西格玛公司)检测标记的Cas9。
对于免疫荧光法,在18mm玻璃盘上将Neuro2a细胞用对应的Cas9和mCherry表达质粒共转染。在转染后48小时,在室温下将细胞用4%多聚甲醛固定并且透化10分钟。然后在室温下用0.3%TRITONTM X-100、2%FBS和1%牛血清白蛋白(BSA)将细胞封闭45分钟。用抗体的1:3000稀释液探测Cas9,用αCdt1抗体(艾博抗公司(Abcam))的1:1000稀释液探测内源性Cdt1,并且用α联会蛋白抗体(Proteintech公司)的1:500稀释液探测内源性联会蛋白。将所有抗体在封闭缓冲液中稀释并且在4℃下孵育过夜。然后在室温下,用α小鼠-FITC缀合的二抗探测细胞以进行Cas9检测,并且用α兔-cy5缀合物探测Cdt1/Gem,持续45分钟。然后将细胞洗涤3次,第二次洗涤含有300nM DAPI。然后将细胞封片并且在ZeissLSM 710共聚焦显微镜上成像。
Cas9-降解决定子融合蛋白的表达和分析
已经提出了降解决定子标记的去稳定化的Cas9变体(Gutschner等,(2016)CellRep.14:1555-1566;Maji等,(2017)Nat.Chem.Biol.13:9-11;Howden等,(2016)Stem CellRep.7:508-517)。然而,已经测试了这些标记的Cas9变体用于灭活Cas9,而不是刺激基因组编辑的用途。为了评估将Cas9蛋白去稳定化是否可以减少基因组编辑的限速解离步骤,使用来自Cdt1(SCFSkp2的靶标)和联会蛋白(APCCdh1的靶标)的降解决定子作为细胞周期传感器(Tada(2007)Front.Biosci.12:1629-41)。除了作为传感器之外,Cdt1和联会蛋白在核中也具有活性,从而使得活性Cas9能够在降解之前进入核中。实际上,Cas9Cdt1和Cas9Gem融合蛋白的表达证实了,当通过免疫荧光法检查时,Cas9融合蛋白的水平在整个细胞周期的不同阶段有波动。此外,蛋白质印迹分析揭示了,由于去稳定化和/或细胞周期调节的启动子,因此在变体之间蛋白质水平是不同的。
为了评估基因组编辑,最初使用小鼠胚胎干(ES)细胞,这是因为它们在整个细胞周期中的振荡快速,而基于细胞周期阶段特异性的影响最小(Ballabeni等,(2011)Proc.Natl.Acad.Sci.USA 108:19252-7)。去稳定化的Cas9融合蛋白的表达水平低于未标记的Cas9。然而,当靶向ES细胞的Rex1:EGFPd2中的EGFP时,去稳定化的Cas9融合蛋白更有效地产生插入缺失突变。在使用靶向mCherry的非模板sgRNA(sgm3)的情况下,将Cas9去稳定化也增加了诱变作用,从而支持了以下结论,即Cas9去稳定化克服了基因组编辑的限速解离步骤。
为了测试在细胞周期的S/G2期中Cas9的细胞周期调节和去稳定化是否可以增加HDR介导的编辑,在产生EGFP在Ctnnb1基因中的中靶插入(Shy等,(2016)Nucl.AcidsRes.44(16):7997-8010)以及中靶突变(插入缺失)方面,将组成型表达(启动子:Cbh)的Cas9Gem、Cas9Cdt1以及细胞周期启动子(细胞周期蛋白E或B)控制的Cas9Gem、Cas9Cdt1和WT-Cas9与组成型表达的WT-Cas9进行比较。用对应的Cas9构建体(图1)和模板或非模板靶向sgRNA转染mESC。在转染后48小时、84小时和156小时,分别通过流式细胞术或靶向深度测序来分析HDR和插入缺失频率(图1)。Cbh-WTCas9表现出模板链偏好性,HDR在所有时间点上都是一致的。这种条件下的互补插入缺失数据显示,模板和非模板的表现相似,这表明了在HDR中观测到的模板链偏好性不是非模板sgRNA表现不佳的结果。Cbh-Cas9Cdt1减轻了HDR模板链偏好性,并且插入缺失数据显示该变体增强了非模板sgRNA的活性。对于细胞周期蛋白B-Cas9Cdt1观测到这种减少的HDR,所述细胞周期蛋白B-Cas9Cdt1被表达并且仅使Cas9去稳定化。这两个发现表明,由于插入缺失频率增加,因此由Cdt1变体而引起的去稳定化可降低HDR频率。有趣的是,细胞周期蛋白E-CasCdt1在它在G1期间被稳定化时表达Cas9,但是随后在S期突然去稳定化,然后停止表达。该特征使得对于非模板sgRNA观测到最高的HDR频率,这表明了表达时间是至关重要的。此外,由细胞周期蛋白E引起的Cas9Gem表达使得模板sgRNA的HDR频率最高,并且大大降低了非模板的HDR频率。该变体的插入缺失数据是变体中最低的,这表明了当Cas9Gem在G1期间被去稳定化,然后在S期短暂稳定化时,它的表达有利于增加HDR:插入缺失的比率。最后,在S/G2期由细胞周期蛋白B启动子引起的CasGem表达增加了非模板sgRNA的HDR频率而胜过WT-Cas9。这些发现证实了,细胞周期调节的转录和Cas9稳定化降低了蛋白质水平并且可以增加HDR水平,同时减少中靶插入缺失的积累。此外,如用Cdt1变体所证实,Cas9的去稳定化增加了非模板sgRNA的活性而减轻模板链偏好性。
增加Cas9 DSB的频率可潜在地导致脱靶突变增加。为了测试这种可能性,使用具有脱靶活性的sgRNA。该分析使用靶向内源性EMX1和ZSCAN2基因中的位点的sgRNA,所述位点先前已经通过GUIDE-seq进行了表征(Kleinstiver等,(2016)Nature 529(7487):490-5)。在HEK293细胞中通过对来自转染细胞的基因组DNA的PCR扩增子进行深度测序来测量中靶和脱靶突变。两种去稳定化的Cas9融合蛋白都显示出EMX1 sgRNA的脱靶突变减少(图2)。对于ZSCAN2 sgRNA,Cbh-Cas9Cdt1显示出中靶和脱靶突变增加,并且Cbh-Cas9Gem显示出脱靶突变减少(图2)。因此,去稳定化显然没有增加脱靶诱变,而实际上,对于所检查的大多数良好表征的位点来说,减少了脱靶诱变。在基因组中的较低亲和力位点处的脱靶核酸酶活性已经与高水平的Cas9表达相关。本文所提供的数据表明,去稳定化的Cas9变体不会增加脱靶活性,这是因为降低细胞中的Cas9水平会降低在低亲和力脱靶位点处的结合频率。
总之,本文的发现证实了基因组在基因组编辑过程中的重要性,并且显示了靶位点处的活性如何能够影响基因组编辑程序中的限速步骤。在这些实验中,Cas9没有从DSB移去的位点发生突变的频率更低,并且可以通过RNA Pol II通过位点的易位来预测。当靶位点存在于用于基因组编辑的细胞中表达的基因内或需要靶向非模板链的sgRNA时,Cas9的去稳定化可以增加基因组编辑的效率。对于需要快速的基因组编辑结果的实验,使用去稳定化的Cas9变体可以缩短重复进行断裂和修复循环所需的时间,从而增加靶位点处的诱变。将细胞周期特异性去稳定化与细胞周期特异性表达相组合提供了将基因组编辑靶向细胞周期中的特定时间点的潜能。
示例性泛素依赖性去稳定化的Cas9融合蛋白包括但不限于Cas9-Cdt1(SEQ IDNO:71)和Cas9-Gem(SEQ ID NO:72)融合蛋白。还考虑的是,也可以使用非泛素依赖性降解决定子,包括例如来自小鼠鸟氨酸脱羧酶(MODC)的PEST序列,已知其通过引入这些另外的蛋白水解信号来缩短GFP的半衰期。Cas9-PEST融合蛋白在本文中如SEQID NO:73、SEQ IDNO:74和SEQ ID NO:75所示。
实施例2:核酶介导的CRISPR sgRNA失活
化脓性链球菌Cas9的sgRNA(图3)已经被广泛表征以了解所述RNA的哪些区域可以突变。该分析已经表明,尽管sgRNA的凸起和连结区是对于Cas9靶向来说最关键的特征,但是发夹1、发夹2以及上和下茎环区相对能耐受序列变异,包括核苷酸取代、插入和缺失以及甚至预测的结构破坏(Briner等,(2014)Mol.Cell 56(2):333-339)。为了证实sgRNA可以被顺式作用核酶激活,选择了用于Cas9的sgRNA的发夹1模块。sgRNA的发夹1出于以下两个原因对于产生可激活的sgRNA是特别令人关注的:(1)发夹1对于Cas9功能来说不是可有可无的并且因此可以被修饰以破坏Cas9活性;和(2)发夹1可以处理广泛的突变,只要保留发夹二级结构的碱基即可。鉴于发夹1的这些特征,将核酶插入发夹1的中间(图4)。核酶基本上在转录后将sgRNA切割成两半。为了在维持功能性发夹1的同时破坏核酶的切割活性,将突变引入到核酶的DNA序列中。使用这种方法,产生了三种不同的顺式作用核酶-sgRNA变体。具体地,将编码锤头型核酶(Hammann等,(2012)RNA 18(5):871-85;SEQ ID NO:2)、扭转核酶(Liu等,(2014)Nat.Chem.Biol.10:739-744;SEQ ID NO:3)或丁型肝炎病毒融合核酶序列(SEQ ID NO:4)的核酸插入到化脓性链球菌sgRNA的发夹1中(分别参见SEQ ID NO:5、SEQID NO:6和SEQ ID NO:7)。在体外转录后,证实了这些分子中的每一个都有效地自我切割。
随后通过将所述变体靶向小鼠67N细胞中的GFP来测试这些核酶-sgRNA变体促进活细胞中Cas9介导的突变的能力。所有三种变体均靶向GFP内六个不同的序列,并且均未介导基因的显著破坏,如通过GFP荧光的流式细胞术检测所测量(图5)。
随后确定了侧接核酶序列或在核酶序列内部的Cas9识别位点是否可以通过对核酶进行诱变而将可激活的sgRNA转化成功能性sgRNA(图6)。进行了靶向切除整个核酶(策略1)或使核酶活性位点突变(策略2)的Cas9和sgRNA的转染。该分析比较了由野生型sgRNA或策略1或策略2介导的EGFP破坏频率(图6)。
鉴于这些结果,可以将编码顺式作用核酶的序列插入到sgRNA内的任何位置,只要核酶起到在转录期间正确折叠成它的二级结构后立即(在Mg2+存在下几秒内)切割sgRNA的功能即可。更具体地,可以将编码顺式作用核酶的核苷酸序列克隆到sgRNA分子的非必需区域(例如茎环和发夹)中,从而用作在其转录后激活sgRNA分子的手段。可激活的sgRNA可以是结合来自例如化脓性链球菌、嗜热链球菌、金黄色葡萄球菌、新凶手弗朗西斯氏菌(Francisella novicida)、脑膜炎奈瑟氏球菌或侧孢短芽孢杆菌(Brevibacilluslaterosporus)、毛螺菌科细菌或氨基酸球菌属菌种的任何RNA引导的核酸酶的RNA。像顺式作用核酶一样,假定反式作用核酶可以异源表达并且被设计成靶向sgRNA的任何区域以介导sgRNA的切割。
编码包括插入非必需区域中的核酶的sgRNA变体的核酸分子的实例示于表3中。
表3
Sp:化脓性链球菌;Sth:嗜热链球菌;Sa:金黄色葡萄球菌。
与核酶序列相似,可以将其它类型的失活靶位点引入sgRNA序列中以使sgRNA失活。例如,可以将空间位阻策略放置在sgRNA内部或外部的任何位置,如添加核苷酸序列,所述核苷酸序列引起sgRNARNA分子内抑制Cas9结合的二级RNA结构。此外,也可以将募集阻断Cas9结合的RNA结合蛋白、募集RNA酶或结合内源性/外源性配体/化学物质的序列放置在sgRNA内部或外部的任何位置。此外,将RNA酶活性靶向sgRNA的外在RNA酶募集序列可以放置在sgRNA内部或外部的任何位置。具体地,可以将tRNA分子放置在sgRNA内,以使得RNA酶P/Z作用于sgRNA以将它降解并且使它对于Cas9是非功能性的。
含有一个或多个可激活的sgRNA的细胞系可以通过慢病毒转导,或对小鼠(Rosa26)或人类细胞(AAVS1)中的安全港基因座进行靶向同源定向修复而产生。通过对应试剂的合子注射或将小鼠胚胎干细胞注射到胚泡中而建立小鼠模型。
实施例3:可激活的sgRNA阵列
产生了一系列可激活的sgRNA以含有一个或多个sgRNA,所述sgRNA的功能在于彼此靶向并且彼此激活(图7、图9);靶向“条形码”基因座以用于遗传谱系记录;和/或靶向不同的sgRNA进行激活,所述不同的sgRNA用来结合具有转录目的或靶向核酸酶活性的RNA引导的核酸酶(图8、图10)。可以将一系列可激活的sgRNA构建成多顺反子阵列,其由tRNA侧接并且通过RNA酶P/Z活性分离或由在转录后切割的核酶侧接。一系列可激活的sgRNA也可以是受单个启动子,如U6、CMV、四环素响应元件或细胞周期调节的启动子控制的不同基因。此外,sgRNA可以位于内源性基因内并且由两个顺式作用核酶侧接,以使得它们的表达受到细胞活动的控制(图23)。可激活的sgRNA的表达可以在异源性基因或内源性基因内的任何RNAPol II或RNA pol III启动子的控制之下。
使用可激活的sgRNA对细胞进行的一般条形编码。条形编码以给予每一个可激活的sgRNA至少两个靶位点的方式使用可激活的sgRNA阵列。靶位点1是可激活的sgRNA阵列中的后续和失活的sgRNA,靶位点2(和之后的靶位点)是相同的确切靶序列,但是在基因组中的不同位点处(图10)。所述不同位点可以带有许多可激活的sgRNA的靶位点,并且用作条形码区。条形码显著小于可激活的sgRNA的阵列,从而允许进行下一代测序。所述条形码也可以被设计成使得可以通过本文所述的链选择来影响突变结果。此外,条形码可以位于内源性基因或异源性转录基因的3'非翻译区内,并且该条形码可以并入单细胞RNA测序中以同时进行谱系追踪和转录谱分析(图8)。
细胞周期控制的细胞条形编码。来自一个或多个物种的可激活的sgRNA构建体可以在由Cas9(或任何RNA引导的核酸酶)驱动的多调节盒中发挥功能,其中所述核酸酶活性受细胞周期的调节(例如受细胞周期启动子元件控制的去稳定化的Cas9)。例如,可以在细胞基因组中编码来自两个不同物种(例如化脓性链球菌和嗜热链球菌)的两个可激活sgRNA阵列,所述细胞基因组还带有两种不同的细胞周期调节的核酸酶。这些核酸酶可以在细胞周期的相反阶段存在,以使得它们的核酸酶活性不重叠。每一种核酸酶只能使用已经被激活的来自它的物种的sgRNA,并且每一个激活的sgRNA将靶向另一物种的sgRNA。使用相似的策略,受细胞周期调节的两种Cas9核酸酶可以激活单个阵列中可激活的sgRNA(图11)。再次,这些核酸酶可以在细胞周期的相反阶段发挥功能,以使得它们的核酸酶活性不重叠。
可选地,阵列内的每一个可激活的sgRNA可以靶向阵列中另一个无活性sgRNA的非模板链(图12)。该靶向策略引起Cas9与DSB结合直到发生DNA复制为止,然后允许修复断裂。由于修复仅在DNA复制期间才开始发生,因此每个细胞周期被激活的sgRNA的数量显著降低并且最有可能将是一个。相反,靶向模板链将允许sgRNA阵列的连续的不受细胞周期影响的激活。
使用可激活的sgRNA的转录编程。与为了在同时条形编码的同时作用于阵列上而具有双重功能相似,可激活的sgRNA可以用于结合和/或激活另一个sgRNA,所述另一个sgRNA的功能在于通过dCas9激活因子/阻遏因子调节转录活性(图13)。该双重功能用于在时间上调节转录程序,并且掺入来自其它物种的RNA引导的核酸酶(例如dCas12a)以严格区分转录调节与基因组编辑调节。
实施例4:Cas9核酸内切酶的链偏好性
材料和方法
重组Cas9纯化。通过常规方法,使Cas9(pMJ806)表达并且通过亲和、离子交换和尺寸排阻色谱步骤的组合对其进行纯化(Anders等,(2015)Meth.Enzymol.558:515-537)。
用于体外Cas9-RNP的sgRNA合成。遵循针对pX330基础质粒优化的方案,将所有sgRNA克隆到pSPgRNA(Addgene公司)中(Cong等,(2013)Science 339:819-823)。使用适当的pSPgRNA作为反应模板DNA,通过PCR介导的T7 RNAP启动子与sgRNA序列的5'末端的融合而产生用于体外转录的模板。使用高GC缓冲液(NEB公司)和标准PCR条件(98℃持续30秒;98℃持续5秒,64℃持续10秒和72℃持续15秒的30个循环;和72℃持续5分钟的1个循环)进行PCR反应。然后将PCR产物进行柱纯化(快而精公司(Qiagen))并且在TE(10mMTris-HCl(pH 8.0)、1mM EDTA)中洗脱。使用NanodropTM 2000(赛默飞世尔科技公司(ThermoFisher Scientific))确定DNA浓度,然后当用作体外转录反应的模板时将其稀释到200nM。转录反应含有5.0μg/ml纯化的重组T7 RNAP和1×转录缓冲液(40mM Tris-HCl(pH8.0)、2mM亚精胺、10mM MgCl2、5mM DTT、2.5mM rNTP)。在37℃下孵育1小时后,将反应物用不含RNA酶的DNA酶I(赛默飞世尔科技公司)处理并且使用RNA Clean&ConcentratorTM试剂盒(Zymo Research公司)遵循制造商的方案进行柱纯化。将纯化的RNA产物在15μl水中从柱中洗脱。
用于体外Cas9核酸酶反应的DNA模板。用于杂合体消化和转录测定的线性靶DNA包括小鼠Lef1、mCherry和GFP靶DNA,它们是在使用高GC缓冲液(NEB公司)和标准PCR条件(98℃持续30秒;98℃持续5秒,64℃持续10秒和72℃持续15秒的30个循环;和72℃持续5分钟的1个循环)的反应中,使用来自mESC Rosa26::TetON-Otx2-mCherry细胞的50ng基因组DNA,通过PCR扩增而产生的。除了使用HF缓冲液之外,使用相同的参数扩增ΦNM1基因组DNA。将所有PCR产物进行柱纯化(快而精公司),在TE中洗脱,并且使用NanodropTM 2000(赛默飞世尔科技公司)确定浓度。将小鼠Lef1基因的不同片段用于测试T7 RNAP对Cas9的滴定、模板DNA的滴定、DSB产生的动力学、TSS与Cas9切割位点之间的距离、模板链碰撞和非模板链碰撞的影响的实验中。
对于需要环状dsDNA模板的反应(测试核酸内切酶或连接酶的可及性的实验),使用TA克隆制备质粒靶DNA。将先前描述的Lef1::PGK-neo和Ctnnb1::EGFP DNA序列(Shy等,(2016)Nucl.Acids.Res.44:7997-8010)的PCR产物克隆到载体(赛默飞世尔科技公司)中。
体外Cas9 DSB形成测定。在含有最终浓度100nM的Cas9的1×Cas9消化缓冲液(40mM Tris(pH 8.0)、10mM MgCl2、5mM DTT)中准备基本Cas9 DSB形成测定。在添加DNA模板之前,以摩尔过量添加sgRNA,并且在室温下孵育10分钟以确保形成Cas9-RNP。添加靶DNA达到200nM的最终浓度和50μl的最终反应体积。将反应物在37℃下孵育25分钟,然后在75℃下热失活10分钟或在37℃下用蛋白酶K处理15分钟。将来自每一个反应物的一部分(约15μl)的DNA片段通过在1.5%琼脂糖凝胶上电泳而分离,并且通过溴化乙锭染色而可视化。通过在ImageJ中测量单个DNA条带的光密度测定,然后将总切割DNA除以总DNA来确定切割百分比值。
除非另有说明,否则对于涉及T7 RNAP转录的反应,除了使用1×转录缓冲液之外,应用基本Cas9消化条件。在添加靶DNA后,添加T7 RNAP达到5.0μg/ml的最终浓度。除非另有说明,否则将反应物在37℃下放置25分钟,然后在75℃下热失活10分钟。将不含DNA酶的RNA酶A(NEB公司)添加到所有反应中并且在37℃下孵育30分钟,之后在1.5%琼脂糖凝胶上分离DNA片段。
除非另有说明,否则在1×Cas9消化缓冲液中进行T7和T5核酸外切酶测定。使用Lef1::PGK-Neo质粒进行T7核酸外切酶测定并且使用sgLef1消化。使用Ctnnb1::EGFP质粒进行T5核酸外切酶测定并且使用sgG2消化。在1×转录缓冲液中进行含有T7 RNAP的T5核酸外切酶测定。所有反应均含有100nM的Cas9:RNP、200nM的靶DNA和10U的适当核酸外切酶。对反应物进行蛋白酶K处理,之后上样到1%琼脂糖凝胶上。
在含有ATP的T4 DNA连接酶缓冲液中进行T4 DNA连接酶和Cas9消化测定。使用200nM的Cas9:RNP(sgLef1)和100nM的Lef1:PGK-Neo质粒进行含有Cas9的反应。将含有Cas9的反应物在37℃下孵育30分钟,然后将温度降低到16℃并且添加40U的T4 DNA连接酶。将反应进行30分钟并且随后在3次连续稀释中转化成感受态DH5a。在37℃下过夜孵育后,确定氨苄西林(ampicillin)抗性菌落形成单位。
使用sgm2并且通过滴定mCherry靶DNA来进行Cas9杂合体消化和转录反应。使用ImageJ测量切割频率。计算速率(v)并且绘制与底物浓度的关系图以产生米-曼氏常数(Michaelis-Menten constant)。
Ku70/80竞争测定。通过常规方法纯化重组人类Ku70/80(Hanakahi(2007)ProteinExpr.Purif.52:139-145)。使用生物素化的引物(5'-GCCTCACACGGAATCT-3';SEQ ID NO:23)和FITC缀合的引物(5'-GAGAGCCCTCTCCCAATCTTC-3';SEQ ID NO:24)(集成DNA技术公司(Integrated DNA Technologies))来扩增650bp的Lef1靶DNA,将PCR产物进行柱纯化(快而精公司)并且在TE中洗脱。如制造商所述来准备MyOneTM (赛默飞世尔公司)以将750ng的靶DNA固定到约4μl的珠粒上。将Cas9和sgRNA在1×Cas9消化缓冲液(40mM Tris(pH 8.0)、10mM MgCl2、5mM DTT)中在室温下预孵育30分钟,以5:1摩尔比添加到固定的DNA中,并且在37℃下孵育25分钟。同时准备没有Cas9,但是含有DNA酶、PmeI和/或Ku70/80的对照反应,并且在37℃下孵育25分钟。然后对含有Cas9的反应物进行蛋白酶K处理或添加过量的Ku70/80,并且在37℃下孵育15分钟。然后通过将反应管放置在磁体上来收集与珠粒结合的DNA片段,并且将10μl的可溶性级分在技术上按一式三份转移到384孔板中。使用TecanPro200测量FITC荧光水平。在减去缺乏FITC标记的DNA的反应的背景荧光水平之后进行计算。对于每一个反应条件进行三次独立设置的反应。
细胞培养。将带有Rex1:EGFPd2插入(Kalkan和Smith(2014)Philos.Trans.R.Soc.Lond.B Biol.Sci.369(1657))或Rosa26::TetOn-Otx2-mCherry插入(Yang等,(2014)Cell Rep.7:1968-1981)的小鼠胚胎干(ES)细胞在先前包被有0.1%明胶的10cm培养皿(密理博公司)中维持在补充有15%KnockOutTM血清替代品(GIBCO公司)、2mML-谷氨酰胺(GIBCO公司)、1000U/ml Pen Strep(GIBCO公司)、1mM HEPES(赛默科技公司(Thermo Scientific))、1×MEM非必需氨基酸(GIBCO公司)、55μM 2-巯基乙醇(GIBCO公司)、100U/ml LIF(密理博公司)和3μM CHIR99021(西格玛公司)的KnockOutTM DMEM(GIBCO公司)培养基中。通常每2天-3天将细胞培养物用0.25%胰蛋白酶-EDTA(GIBCO公司)1:10分瓶。
转染和选择条件。在转染2小时内,将0.25×105个ES细胞新鲜平板接种到24孔培养皿的每一个孔中。对于每一个孔,将2.5μl的LipofectamineTM 2000和相关的DNA在125μl的OPTI-MEMTM(GIBCO公司)中孵育,之后添加到孔中。对于ES细胞中40个不同基因的Cas9诱变,转染包括150ng的pPGKpuro(Addgene公司)、150ng的pX330(缺乏sgRNA插入序列)和150ng相关的pSPgRNA质粒。为了评估由于可能的深度测序或扩增错误而导致的背景突变率,将含有具有空sgRNA位点的pSPgRNA的转染与其它含有sgRNA的转染一起评估。在转染后两天,将细胞分瓶到2μg/ml嘌呤霉素中并且施加选择48小时,之后通过用含有1mg/ml蛋白酶K的Bradley裂解缓冲液(10mM Tris-HCl、10mM EDTA、0.5%SDS、10mM NaCl)过夜裂解来分离基因组DNA,继而进行EtOH/NaCl沉淀,2次EtOH洗涤,并且在50μl的TE中洗脱。对于mCherry靶向,转染含有相同的DNA,不同的是pSPgRNA靶向mCherry基因组插入,在转染后48小时在50μl的QuickExtractTM溶液(Epicentre公司)中分离基因组DNA以用于T7核酸内切酶1测定。表4提供了sgRNA序列、距四环素响应元件(TRE)的预测转录起始位点(TSS)的近似距离和计算预测的sgRNA中靶分数的列表(Doench等,(2015)Nat.Biotech.34(2):184-191)。
表4
T7核酸内切酶1(T7E1)测定。在使用聚合酶(NEB公司)和标准PCR条件(98℃持续30秒;98℃持续5秒,55℃持续10秒和72℃持续25秒的30个循环;和72℃持续5分钟的1个循环)的PCR反应中,使用基因组DNA作为模板。将柱纯化(快而精公司)的PCR产物制备成于20μl的1×NEBuffer 2(NEB公司)中200ng的DNA,在95℃下变性10分钟,然后通过每秒降低1℃的温度使其降到室温。将半微升的T7E1(NEB公司)添加到每一个反应中,并且将其在37℃下孵育25分钟。通过1.5%琼脂糖凝胶进行电泳来分离DNA片段。分析凝胶图像并且使用ImageJ定量插入缺失频率。通过使用两样本t检验产生每一个sgRNA的p值以比较加上多西环素和减去多西环素来进行统计分析,然后在RStudio 1.0.136版中通过邦费罗尼校正(Bonferroni correction)来调整所有p值。
RNA Seq与插入缺失频率的生物信息学分析。大规模插入缺失诱变和RNA-seq数据的来源是来自先前公开的报道(Chari等,(2015)Nat.Methods 12:823-826;Chavez等,(2016)Nat.Methods 13:563-567)。将Blat和bedtools命令行工具(Quinlan和Hall(2010)Bioinformatics 26:841-842)用于将由Chari等((2015)Nat.Methods 12:823-826)使用的sgRNA中的每一个分类为靶向模板或非模板基因链。使用RStudio 1.0.136版(软件包:ggplot2)将所有数据合并并且可视化,从而允许确定FPKM和链取向对插入缺失频率的影响。使用平均值的多重比较和图凯对比(Tukey contrast)(软件包:multcomp)确定统计分析和显著性。
流式细胞术。通过进行胰蛋白酶消化并且重悬在2%FBS/PBS/2mM EDTA中来制备单细胞悬浮液。在LSRFortessaTM流式细胞仪上分析细胞。使用FlowJo v9.3.2进行数据分析。通过前向角散射和侧向角散射面积对活细胞进行门控。通过侧向角散射面积和侧向角散射宽度对单细胞进行门控。对于每一个样品计数至少5×105个单活细胞。通过使用荧光阴性细胞作为对照,对适当的通道进行门控来定量mCherry荧光事件。
靶向深度测序准备和分析。在转染后四天收获基因组DNA并且在PCR中使用约100ng的DNA来扩增对应的靶位点,同时连接衔接子序列以进行后续的条形编码步骤。通过琼脂糖凝胶分析PCR产物,然后基于ImageJ定量,分别以等量为每一个平行测定汇集不同的扩增子。使用AMPure珠粒(安捷伦公司(Agilent))纯化汇集的PCR产物,并且使用AccuPrimeTM II(赛默飞世尔科技公司)PCR混合物(95℃持续5分钟;95℃持续30秒,60℃持续30秒和72℃持续30秒的8个循环;和72℃持续7分钟的1个循环),用Fluidigm AccessArrayTM条形码对5ng的纯化池进行条形编码。在2轮0.6×固相可逆固定珠粒纯化以排除引物二聚体之前和之后,在2200TapeStation(安捷伦公司)上分析条形编码的PCR产物。产生最终的扩增子池并且将其加到Illumina MiniSeq上,从而产生150bp的配对末端读段。
插入缺失频率的确定利用在适当情况下通过扩增子解复用的CRISPResso命令行工具,然后通过与参考扩增子文件进行比对来确定插入缺失频率(Pinello等,(2016)Nat.Biotechnol.34:695-697)。使用自定义命令行、python和R脚本对输出进行组装和分析。
靶向ΦNM1的间隔区的产生。如先前所述(Heler等,(2015)Nature 519:199-202),通过BsaI克隆到pDB114上来构建带有Cas9、tracrRNA和靶向ΦNM1的单间隔区阵列的质粒。具体地,构建了间隔区RC1(质粒pRH320)、RC2(pRH322)、RC3(pRH324)和RC4(pRH326)。
ΦNM1感染测定。将噬菌体ΦNM1h1分离为用间隔区4B对ΦNM1进行III型CRISPR靶向的逃避者(Goldberg等,(2014)Nature 514:633-637)。受噬菌体感染的细菌的板读数器生长曲线如先前所述进行(Goldberg等,(2014)Nature 514:633-637),但稍有改动。将过夜培养物1:100稀释到2ml补充有适当抗生素和5mM CaCl2的新鲜BHI肉汤中并且生长到约0.2的OD600。将携带靶向间隔区的免疫细胞用缺乏CRISPR-Cas的细胞以1:10,000的比例稀释并且用ΦNM1h1或ΦNM1g6以MOI 1感染。为了产生板读数器生长曲线,将针对OD600归一化的200μl受感染的培养物按一式三份转移到96孔板中。每10分钟收集一次OD600测量值,持续24小时。
基因组链选择影响突变频率
对Cas9的生物化学和生物物理学表征已经鉴定出这种核酸酶的独特特性。Cas9与DNA结合的酶产物复合物是非常稳定的,据报道其在体外的寿命是5.5小时(Richardson等,(2016)Nat.Biotechnol.34:339-344)。考虑到二倍体哺乳动物基因组通常仅具有Cas9的两个(在DNA复制之前)至四个(在DNA复制之后)中靶底物,有理由认为,Cas9解离速率可以是基因组编辑中的限速步骤并且Cas9结合会阻止DSB修复。使用纯化的蛋白质,除非通过热变性去除Cas9,否则Cas9产生的DSB不能用作噬菌体修复酶、T4 DNA连接酶和T7核酸外切酶的底物。通过测量3'-荧光标签从通过5'-生物素与珠粒连接的dsDNA分子中的释放,Cas9产生的DSB没有从所述珠粒释放DNA末端。当将纯化的哺乳动物DNA末端结合蛋白(复合的人类Ku70/80)添加到固定的DNA中时,Ku70/80结合可用的DNA末端并且用珠粒沉淀。相反,添加Ku70/80没有增加由Cas9切割的DNA的可溶性荧光,这表明Ku70/80不能从DSB置换Cas9。因此,Cas9与DNA的持久结合使得DSB无法由其它DNA末端结合蛋白触及。
鉴于该分析,假定在切割后Cas9的解离速率的增加可以增加基因组编辑效率。为了证实这一点,需要一种方法以实验方式在体内操纵Cas9的解离速率。因此,测试了几种体外条件以找到从DSB去除Cas9的方式。通过4nM至250mM NaCl的盐浓度或通过4℃至59℃的温度没有消除对DSB的保护。相比之下,使T7 RNAP与Cas9碰撞使得DSB可由核酸外切酶活性触及。
对DNA末端的可及性表明了,随着聚合酶通过sgRNA靶位点易位,与Cas9的碰撞会将所述核酸酶从DSB移去。有趣的是,通过T7RNAP置换Cas9没有消除被移去的Cas9 RNP分子的核酸酶活性。从它的DSB置换Cas9似乎也没有刺激sgRNA从Cas9 RNP中的交换或丧失。实际上,被移去的Cas9 RNP的保留的核酸酶活性使得能够在体外切割另外的DNA分子(图14)。由T7 RNAP引起的多周转效应对rNTP浓度(0.125μM至2.5μM)相对不敏感,但是它的有效性在高底物浓度下以及在T7启动子与DSB之间的距离小于150bp时降低(图15)。
Cas9识别被称为PAM或前间区序列邻近基序的短基序以便将自身与非自身区分开。先前的生物化学分析证实了与Cas9缔合的DNA链的自由度的不对称性(Richardson等,(2016)Nat.Biotechnol.34:339-344);来自Cas9的PAM近侧的dsDNA保持与Cas9稳定结合,而非靶向DNA链从PAM远侧释放。为了确定T7 RNAP刺激多周转核酸酶活性的能力是否取决于它撞击Cas9的哪个表面,将T7启动子移动到线性DNA底物的相对端。使用这些底物的反应表明了Cas9对于T7 RNAP从PAM近端方向的易位来说是难处理的(图15)。T7 RNAP的不对称效应在不同的sgRNA之间是一致的(图16)并且与sgRNA靶位点的GC含量或与PAM相邻的GC含量无关。实际上,所测试的sgRNA序列的GC含量百分比与多周转Cas9效率水平没有强相关性(表5;皮尔森相关系数(Pearson correlation):0.36)。因此,使得能够实现多周转活性的取向在本文中被称作“模板”取向,这是因为只有当sgRNA与由RNAP用作模板的DNA链退火时Cas9才被置换。
表5
*当可处理时。
在细胞中,单个sgRNA对基因组编辑显示出可变的效率。一些可变性已经归因于Cas9 RNP本身的形成和功能(Wang等,(2014)Science 343:80-84)。一些染色质特征,如核小体的存在或低水平的靶基因转录,与低sgRNA活性相关(Chari等,(2014)Nat Methods12:823-826;Hinz等,(2015)Biochemistry 54:7063-7066;Horlbeck等,(2016)Elife 5,pii:e12677)。假定模板链偏好性也影响了Cas9介导的基因组编辑的效率,这是因为Cas9的解离速率可以是基因组编辑中的限速步骤。如果是这样,则与转录基因的模板链退火的sgRNA将比与非模板链退火的sgRNA更有效。这通过三种不同的方式得到证实。首先,通过为sgRNA分配模板/非模板链状态并且基于靶基因的相对mRNA水平对sgRNA进行分箱,分析了先前报道的在HEK293细胞中由975个sgRNA引起的插入缺失突变率(Chari等,(2014)NatMethods 12:823-826)。当由模板链sgRNA靶向时,mRNA水平的前两个四分位数中的基因突变的频率更高。其次,单独地靶向小鼠ES细胞中表达的40个基因(17个模板sgRNA、23个非模板sgRNA)并且通过靶向深度测序来测量每一个靶标的插入缺失频率。与非模板链sgRNA相比,模板链sgRNA的插入缺失频率百分比显著更高(图17)。再次,通过使用10个模板sgRNA和7个非模板sgRNA靶向单个多西环素诱导型转基因mCherry,消除了基因之间的可变性(表6)。
表6
SgRNA名称 插入缺失%-Dox 插入缺失%+Dox
sgm1 模板 14.5 39.1
sgm2 模板 16.7 52.3
sgm3 非模板 19.7 26.7
sgm4 模板 11.0 23.1
sgm5 模板 7.2 19.9
sgm6 模板 6.7 13.2
sgm7 非模板 4.3 5.5
sgm8 模板 6.5 17.5
sgm9 非模板 3.6 2.5
sgm10 模板 11.5 19.6
sgm11 非模板 21.0 25.2
sgm12 模板 19.2 39.5
sgm13 非模板 27.0 17.6
sgm14 非模板 12.6 15.5
sgm15 模板 20.3 58.6
sgm16 模板 11.0 20.1
sgm17 非模板 6.7 4.9
sgm18 非模板 8.3 6.9
sgm19 模板 15.5 14.7
sgm20 模板 18.0 46.8
通过T7核酸内切酶1测定来测量插入缺失形成显示,刺激转录仅显著增加模板链sgRNA的插入缺失形成(图18)。对于用于测试T7 RNAP的体外效应的三个mCherry sgRNA观测到相同的链偏好性(图16)。总之,这些数据证实,当RNA Pol II与Cas9的PAM远端表面碰撞时,RNA Pol II通过靶位点的转录可以刺激基因组编辑效率。
用作多周转核酸酶的Cas9可以显著增强细菌中的噬菌体免疫力,在存在许多噬菌体基因组时,所述细菌可需要在感染后存活下来。有趣的是,噬菌体基因组的核苷酸组成在正链和负链中有所不同(Jin等,(2014)BMC Genomics 15:793;Kwan等,(2005)Proc.Natl.Acad.Sci.USA 102:5174-5179;Lobry(1996)Mol.Biol.Evol.13:660-665;Uchiyama等,(2008)Appl.Environ.Microbiol.74:4149-4163),这通过在感染化脓性链球菌和嗜热链球菌的链球菌噬菌体的正链中朝向腺嘌呤和鸟嘌呤偏移(34%腺嘌呤:27%苏氨酸,和22%鸟嘌呤:17%胞嘧啶)来说明(表7)。因此,SpCas9(NGG)和StCas9(NNAGAAW)的PAM位点以约2:1的比例优先靶向模板链,这类似于在噬菌体不敏感性突变株中靶向噬菌体的模板链的crRNA的高频率(Achigar等,(2017)Sci.Rep.7:43438;Levin等,(2013)PLoSGenet.9:e1003312)。
表7
数据表明,StCas9和SpCas9的链偏好的PAM序列进化为靶向噬菌体基因组的正链,这是因为它为细菌提供了针对噬菌体的选择性优势。与改变噬菌体中全基因组GC偏移的进化挑战性障碍相比,改变由Cas9使用的PAM序列相对更简单并且仅需要少量突变(Kleinstiver等,(2015)Nature 523:481-485)。靶向噬菌体正链提供了优势,这是因为它将在裂解基因转录后更频繁地产生多周转核酸酶。
为了直接测试链偏好性对细菌免疫力的影响,使用了ΦNM1噬菌体的两种毒性型式。一种含有使溶源性盒的转录所需的启动子失活的突变(ΦNM1γ6;Goldberg等,(2014)Nature 514:633-637),而另一种表达溶源性盒,但是在cI阻遏基因内带有失活性缺失(ΦNM1h1)。因此,这两种噬菌体都不能建立溶源性,但是它们在溶源性盒的转录上不同。产生了不同的细菌菌株,这些菌株带有靶向在ΦNM1γ6和ΦNM1h1这两者中均存在的阻遏基因内的模板或非模板链序列的间隔区。用每一种噬菌体感染每一种菌株并且通过随时间推移而测量OD600来确定它们的存活率。从受感染的细菌培养物的板读数器生长曲线来解释每一个间隔区对这两种噬菌体的干扰效率。靶向非模板链的两个间隔区(RC2和RC4)对任一种噬菌体均显示出相似的干扰。相反,靶向模板链的间隔区(RC1或RC3)在切割ΦNM1h1的转录靶标时显著更为有效。针对T7 RNAP易位在体外将Cas9转变成多周转核酸酶的能力,测试了ΦNM1内相同的四个靶位点(图19),证实了模板链偏好性对噬菌体基因组的影响。这些结果表明,跨越Cas9的主动转录通过将Cas9转变为多周转酶来改善CRISPR免疫力。
综上所述,从它的DSB置换Cas9刺激了基因组编辑效率并且增加了CRISPR免疫力。数据表明,RNAP对Cas9的取向依赖性置换提供了一种测量链偏好性对基因组的影响的方法。除了RNAP通过Cas9的易位之外,包括复制和修复活动的其它DNA代谢过程也可能会产生足够的力以移去Cas9(图20)。与RNAP沿它的模板的模式化易位相反,在基因组内那些其它活动的位置和时间不太可预测。开发修饰的Cas9酶或刺激Cas9从DSB中的去除的处理可以增加基因组编辑过程的速率并且降低sgRNA有效性的可变性。这在非转录位点处和在具有低DNA代谢活性的细胞中应当特别有用。
实施例5:另外的方法
合成引导通过Cas9靶位点的转录。转录因子Cas9s:将无核酸酶活性(例如dCas9)的RNA引导的核酸酶(例如Cas9或Cas12a)与转录激活结构域融合或它的sgRNA含有转录激活结构域(例如dCas9-VP64),并且功能在于将RNA聚合酶募集到基因组中的特定区域。
将RNA聚合酶引导到Cas9靶位点:转录因子Cas9s靶向实际的基因组编辑靶位点(核酸酶活性Cas9所针对的序列)的上游。转录因子Cas9和核酸酶活性Cas9这两者都同时存在于细胞中,并且转录因子Cas9通过与模板结合的核酸酶活性Cas9引导RNA聚合酶活性。转录因子Cas9s与核酸酶活性Cas9是不同的物种以避免sgRNA的共用。例如,来自嗜热链球菌的转录因子Cas9具有化脓性链球菌不能利用的sgRNA。因此,化脓性链球菌Cas9可以是核酸酶活性Cas9并且这两者可以在该系统内协作。
小分子影响Cas9从DSB的解离。可以通过高通量筛选来鉴定破坏Cas9-DSB复合物的小分子,所述高通量筛选包括其中对该复合物的破坏介导了从Cas9释放DSB而解离的Cas9是非功能性的,或介导了从DSB释放Cas9以使得Cas9是功能性的并且是多周转酶的测定。合适的测定包括来自所期望的物种的重组Cas9、纯化的sgRNA和发荧光的靶DNA。当荧光靶DNA处于Cas9-DSB状态或在未切割状态下游离时,它以非荧光形式存在。与Cas9解离的经切割的DNA将发荧光作为破坏Cas9-DSB复合物的读数。该测定是可以用于检测合适的小分子的许多荧光测定的实例。
可选地,可以设计以引起Cas9从DSB解离而不会完全抑制Cas9与靶DNA缔合的能量破坏Cas9-DSB复合物的小分子。更特别是,小分子被设计成与一般的Cas9-DSB复合物特异性相互作用,以使得它们破坏性地结合:
i)在靶DNA R环内(插入DNA链之间);
ii)在sgRNA:DNA杂合体内(插入RNA链与DNA链之间);
iii)在RuvC结构域内和非靶链相互作用(插入氨基酸残基与DNA之间);
iv)在HNH结构域内和靶链相互作用(插入氨基酸残基与DNA之间);
v)PAM序列和PAM相互作用结构域(插入氨基酸残基与DNA之间);
vi)在sgRNA的支架区(不可编程区域)内以引起sgRNA或Cas9去折叠;
vii)在RuvC或HNH核酸酶结构域内或外表面上以破坏sgRNA或Cas9折叠;或
viii)在Cas9或sgRNA的任何区域内部或外部而破坏其折叠和/或结合DSB的能力。
sgRNA:DNA杂合体的酶促破坏。与具有RNA:DNA降解活性的RNA酶H酶、结构域或任何RNA:DNA结合酶融合的Cas9核酸酶用于通过破坏sgRNA:DNA杂合体来解离Cas9-DSB复合物。一旦Cas9与DSB形成复合物,所述RNA酶就会将其识别为底物并且将它降解,从而引起Cas9从DSB释放。RNA酶通过以长形式或短形式存在的接头(甘氨酸-丝氨酸型)与Cas9的N末端或C末端连接。根据所使用的Cas9的物种,所述长度可由于酶接触到它的底物所需的“到达”量而变化。
周围DNA序列的酶促破坏。将Cas9核酸酶与具有特异性或非特异性活性的一个或多个核酸酶融合。所述另外的核酸酶的功能在于切割紧邻的基因组序列以使得Cas9-DSB复合物被完全去除并且真正地漂走。这些另外的核酸酶可以使用短或长接头(甘氨酸-丝氨酸)与Cas9的N末端或C末端融合并且是具有小的共有序列(少于5个或6个核苷酸)的限制性内切酶。
Cas9核酸酶的突变修饰。通过改变/缺失/插入一个或多个氨基酸残基来使Cas9核酸酶突变以使得所述酶的功能在于释放DSB而不是保持结合,并且所述核酸酶也可具有新发现的多周转酶活性。这样的突变可以存在于PAM相互作用结构域、RuvC核酸酶结构域和/或HNH核酸酶结构域内或周围。这些突变可以通过PCR或Gibson组装产生,或可以通过易错PCR产生Cas9突变体的文库,然后针对多周转核酸酶活性和/或与DSB的快速解离来筛选突变体。
实施例6:通过生物处理器介导的遗传记录和细胞编程来实现时间调节的、顺序作用的、预定的细胞行为
细胞过程的遗传记录。可以使用本文所述的模块,即Cas融合蛋白、可激活的sgRNA和链偏好性的组合将在细胞的生命周期中发生的动态事件记录到它的基因组中。引起转录的所关注的细胞事件(天然或合成)可以与模块关联以用作所述事件的直接或间接遗传记录的输入。例如,在它的3'-UTR内含有嵌入的正常sgRNA的基因一旦被转录,所述基因就将在不同的基因组位点处通过所述sgRNA引起诱变活动,从而最终形成所述事件的遗传记录。在同时记录所关注的事件的同时,与细胞周期进程相关的遗传记录器将记录产生特定基因组条形码的每一次细胞分裂,这在下文中被称作“世代条形编码”(图11和图12)。该条形码允许重建基于世代的谱系树,并且与其它细胞事件相关联的记录数据可以在所述谱系树的范围内被映射以确定事件发生的时间和持续时间。遗传记录事件的过程发挥了对细胞群体进行被动条形编码的功能并且引起了预编程的生物处理器的活动。
生物处理器和生物处理。生物处理器由与本文所述的一个或多个其它模块相关联的一个或多个可激活的sgRNA构成,目的在于执行一系列顺序的遗传事件。可激活的sgRNA用作“程序”,并且由这些sgRNA引导的对Cas9活动的调节用作中心代码。Cas9活动直接受以“开启”状态存在的可激活的sgRNA或存在的正常sgRNA以及sgRNA靶位点的控制。生物处理器程序的性质提供了Cas9活动的顺序调节,从而使得特定的Cas9活动依赖于另一Cas9活动的完成,如生物处理器内可激活的sgRNA的转化(图7)。所述依赖性允许通过世代条形编码系统来调节生物处理器的编程(图13),这使得编程的Cas9活动视细胞完成特定数量的细胞周期而定。
生物处理器活动的启动取决于生物处理器被编程为对其作出响应的细胞事件。启动生物处理器活动的一般直接输入需要正常或开启状态的可激活的sgRNA的转录。这些sgRNA可以嵌入内源性或合成基因本身,或可以由它们自身的启动子控制。引起活性sgRNA转录的细胞事件的存在将引起直接遗传记录事件,其中所述细胞事件引起sgRNA的活性;或间接遗传记录事件,其中所述细胞事件引起sgRNA活性的下游控制,如信号传导级联。该遗传记录事件将可激活的sgRNA从“关闭”状态转变成“开启”状态,从而允许在生物处理器内编程的下一个事件开始。
生物处理的作用是通过所需的模块顺序完成预编程的事件,并且生物处理器的中心程序是可激活的sgRNA的阵列(图7和图9)。每一个生物处理器的输出通常需要其它模块来影响可激活的sgRNA从“关闭”状态转变成“开启”状态的速率。所述速率受链偏好性Cas9活性(图12)和细胞周期Cas9(图11)的影响。
输出。生物处理器的直接输出是Cas9介导的诱变(遗传变化和条形编码)或转录激活或阻遏(表观遗传调节)。这些活动引起细胞行为的改变,并且可以通过生物处理器的设计而多重化。重要的是,每一个输出可以通过细胞周期完成的数量来调节,如在细胞生命周期中特定或多个时间点使内源性基因表达或突变。输出可以通过生物处理器对内源性转录的依赖性来进一步调节。例如,当所关注的基因表达时,嵌入3'-UTR的sgRNA介导了对细胞进行条形编码或突变/转录调节一系列靶基因的过程。对特定输出的依赖性可以涵盖很少或许多细胞活动并且唯一的主要要求是在所关注的物种中验证的Cas9活性。
实施例7:在特定数量的细胞周期完成后进行基因敲除以诱导细胞凋亡
世代条形编码。跟踪的细胞过程是细胞周期进程。世代条形编码生物处理器使用一系列可激活的sgRNA与通过靶向非模板链而获得的链偏好性(图12、图20)或细胞周期Cas9(图11)的组合。
链偏好性。将10个可激活的sgRNA放置在阵列中以计数10次细胞分裂,其中每一个都含有它们自身的用于哺乳动物细胞的人类U6启动子或用于酵母的SNR52启动子。每一个可激活的sgRNA都靶向它自身的DNA直接相邻和下游的可激活的sgRNA的DNA。每一个sgRNA都与非模板链结合,从而允许每个细胞周期将一个可激活的sgRNA从“关闭”状态转变成“开启”状态。阵列中第一个可激活的sgRNA将通过激活性sgRNA的转染而被激活,或它将是正常的sgRNA并且将通过诱导型启动子来控制转录。由第一个sgRNA引起的活动将开始启动记录10次细胞分裂的过程。
细胞周期Cas9。将20个sgRNA放置在阵列中,其中奇数编号的sgRNA对应于G1期特异性Cas9(PAM=NGG),而偶数编号对应于G2期特异性Cas9(PAM=NAG)。如图11中所示,阵列中的每一个sgRNA都将靶向新生sgRNA的DNA,并且遵循图11中所述的机制,每个细胞周期两个sgRNA将从“关闭”状态转变成“开启”状态。
生物处理。在从“关闭”状态转变成“开启”状态后,阵列中的最后一个sgRNA(sgRNAKS1)靶向在另一个位置处另一个sgRNA的基因组整合DNA。第二位置处的sgRNA(sgRNA KS2)被转变成“开启”状态并且将Cas9活性靶向位于基因组中的其它三个位置的三个不同的sgRNA(sgRNA KS3、sgRNA KS4和sgRNA KS5)。与sgRNA KS2结合的Cas9将sgRNA KS3、sgRNAKS4和sgRNA KS5转变成“开启”状态。
输出。sgRNA KS3靶向Bcl2开放阅读框(ORF)的模板链,sgRNAKS4靶向MDM2 ORF的模板链,并且sgRNA KS5靶向AKT ORF的模板链。模板链靶向确保了快速的基因组编辑动力学以使对这些蛋白质的遗传破坏速率达到最大。Bcl2、MDM2和AKT都通过不同的机制促进细胞存活。破坏所有这些基因会引起内在凋亡途径的有效激活。在酵母中,这些蛋白的同源物是Bcl2(Bcl2)和Sch9p(AKT),并且MDM2被靶向Tps1的sgRNA替代。此外,可以对世代条形编码基因座进行测序以从存活的细胞重建谱系树。
实施例8:在特定数量的细胞周期完成后进行基因敲除和转录激活以诱导细胞静止
细胞过程的遗传记录。跟踪的过程是细胞周期进程,并且所使用的世代条形编码系统基本上与实施例7中所述的系统相似,不同的是在本实施例中仅使用链偏好性。在该系统中,所利用的Cas9核酸酶是与转录激活结构域“VPR”融合的核酸酶活性Cas9(Kiani等,(2015)Nature Meth.12(11):1051-4)。通过改变sgRNA的长度来调节核酸酶活性和RNA聚合酶II(RNAP)的募集。20nt sgRNA允许Cas9切割DNA并且介导诱变,而14nt sgRNA消除了Cas9活性,但是核酸酶仍然与DNA结合并且可以募集RNAP以转录靶基因座(参见例如图22)。
生物处理。世代条形编码系统中的最后一个sgRNA(sgRNA QT2)靶向另一个sgRNA的DNA(sgRNA QT2),并且激活的QT2随后靶向三个不同sgRNA的DNA(sgRNA QT3、sgRNA QT4和sgRNA QT5)。在本实施例中,sgRNA QT3是靶向E2F的20nt sgRNA,sgRNA QT4是靶向P16ink4a的启动子的14nt sgRNA,并且sgRNA QT5是靶向P21的启动子的14nt sgRNA。14ntsgRNA靶向距转录起始位点(TSS)200bp之内的启动子以有效激活转录。
输出。sgRNA QT3靶向E2F的模板链以诱导遗传破坏性突变。E2F的丧失会引起永久性细胞周期停滞在G1期或进入G0期。sgRNA QT4介导的P16ink4a表达和sgRNA QT5介导的P21表达诱导进入G0期,从而造成细胞生长抑制和有效的静止。对于酵母同源物,E2F(E2F)、P16ink4a和P21的转录激活被成视网膜细胞瘤蛋白RB替代。此外,可以对世代条形编码基因座进行测序以重建谱系树。
实施例9:检测细胞应激并且诱导细胞凋亡的生物处理器
细胞过程的遗传记录。在该系统中记录的细胞过程是代谢应激后果,即活性氧簇(ROS)。为了监测该过程,将正常的sgRNA嵌入到3个对应的ROS诱导的基因NF-κB、ATF和AP-1中的3'非翻译区(3'-UTR)中。嵌入的sgRNA由两个顺式切割核酶(RGR)侧接,从而使得在基因完全转录时产生功能性sgRNA(参见例如图23)。然而,这些基因是沉默的直到发生ROS的积累为止。整合了该处理器的细胞表达两种Cas9变体:野生型Cas9(WT-Cas9,PAM=NGG)和dCas9-KRAB(PAM=NAG)。dCas9-KRAB是募集内源性转录阻遏机制的无核酸酶活性的Cas9。
生物处理。在这三个基因中的任一个转录时,产生功能性sgRNA。该sgRNA(sgRNANF1)靶向三个不同的可激活的sgRNA(NF2、NF3和NF4)的DNA。sgRNA NF1、sgRNA NF2和sgRNANF3均与含有NGG PAM序列的DNA互补,从而使得它们能够介导WT-Cas9特异性诱变。sgRNANF4结合含有NAG PAM的DNA,从而使它的活性对dCas9-KRAB具有特异性。sgRNA NF2成功转变成“开启”状态可将Cas9诱变活性靶向Bcl2,sgRNA NF3的转变将活性靶向MDM2,并且sgRNA NF4的转变通过在TSS后50bp之内结合而阻遏TNFα的转录。这些活动也可以在世代条形编码存在下进行以确定ROS积累相对于细胞老化的时间,只要对sgRNA NF2、sgRNA NF3和sgRNA NF4的DNA进行测序即可。
输出。Bcl2和MDM2的诱变将引起内在凋亡途径的诱导。TNFα基因座的阻遏将排除TNFα的分泌,从而最终减少附近细胞的炎症反应和坏死。在酵母中,这些蛋白的同源物是Bcl2(Bcl2),MDM2被靶向Tps1的sgRNA替代,并且TNFα没有替代。
实施例10:赋予细胞存活基因的转录和炎症基因的阻遏的所关注的异源性基因的时间编码诱导
细胞过程的遗传记录。被记录并且用作生物处理器的主要输入的主要过程是细胞周期进程。在该系统中,世代条形编码过程通过使用链偏好性记录了10次细胞分裂。条形编码和转录激活事件由Cas9-VPR(PAM=NGG)介导,并且细胞还表达dCas9-KRAB(PAM=NAG)。
生物处理1。在完成10个细胞周期后,世代条形编码阵列中的最后一个sgRNA(sgRNA H1)是靶向14nt sgRNA(sgRNA H2)的DNA的20nt sgRNA。sgRNA H2靶向转录沉默的异源性的所关注基因(GOI)的启动子。14nt sgRNA H2结合具有NGG PAM的序列,从而使得Cas9-VPR靶向该位点并且对异源性基因产物进行转录激活。
输出1。发生异源性基因的表达,所述基因在3'-UTR中编码两个正常的sgRNA,即RGR(RGR H3和RGR H4)。
生物处理2。所述RGR在转录后变成功能性sgRNA,从而转变成sgRNA H3和sgRNAH4。sgRNA H3将Cas9-VPR靶向Bcl2启动子,并且sgRNA H5将dCas9-KRAB靶向干扰素α的TSS附近。
输出2。sgRNA H4的活性引起Bcl2的转录,从而通过抑制细胞凋亡而促进细胞存活。sgRNA H5阻遏干扰素α,从而减少潜在的细胞应激反应和炎性细胞因子向周围细胞的分泌。
实施例11:生物处理器介导的两个独立的内源性途径的关联以产生新的细胞行为
细胞过程的遗传记录。所记录的过程是一个途径的受体介导的信号传导,以及第二途径的转录活动,其中第二途径依赖于第一途径。所述记录是由Cas9-VPR活性介导的,所述活性是由受到受体信号传导级联调节的基因(基因1)中的3'-UTR正常sgRNA以及基因2中嵌入3'-UTR的可激活的sgRNA转变成“开启”状态而引导的。
生物处理。基因2被不断转录并且在它的3'-UTR中含有无活性的可激活的RGR(sgRNA 2)。sgRNA 2向“开启”状态的转变取决于sgRNA 1的表达,所述sgRNA 1是嵌入基因1的3'-UTR中的正常sgRNA。在受体-配体结合后,所关注的信号传导级联诱导基因1的转录,从而引起sgRNA 1的表达。sgRNA 1将sgRNA 2转变成“开启”状态。sgRNA 2靶向可激活的sgRNA 3的DNA,从而将它转变成“开启”状态。sgRNA 3是14nt sgRNA并且靶向所关注的靶基因的启动子。
输出。sgRNA 3引起某个靶基因表达的活性完全取决于这两个途径同时表达,从而允许将两个通常无关的途径相关联。如果在世代条形编码的背景下进行,那么可以对可激活的sgRNA的DNA进行测序以确定过程的动力学和时间。
实施例12:在完成特定数量的细胞周期时诱导基因以操纵细胞适应性
细胞过程的遗传记录。利用链偏好性,通过Cas9-VPR介导的世代条形编码在10个细胞周期内记录细胞周期进程。在完成5次(sgRNA C1)、7次(sgRNA C2)和10次(sgRNA C3)细胞分裂之后被转变成“开启”状态的可激活的sgRNA具有在不同的内源性基因处介导转录或突变的次要靶标。
生物处理。在完成5次细胞分裂后,sgRNA C1被激活并且靶向sgRNA F1的DNA。sgRNA F1是14nt sgRNA并且靶向所关注的异源性基因的启动子以促进转录。在完成7个细胞周期后,sgRNA C2被转变成“开启”状态并且靶向sgRNA F2的DNA。sgRNA F2是20ntsgRNA,其靶向三个不同的14nt可激活的sgRNA(sgRNA E1、E2和E3)的DNA。该靶向将这些sgRNA转变成“开启”状态,并且它们结合苹果酸酶(sgRNA E1)、过氧化氢酶(sgRNA E2)和超氧化物歧化酶(sgRNA E3)的启动子来激活转录。在第10次且最后一次记录的细胞分裂后,sgRNA C3被激活并且靶向sgRNA F3(20nt)的DNA。sgRNA F3通过在相关DNA处进行基因组编辑而将sgRNA E4、E5和E6转变成“开启”状态。sgRNA E4靶向Bcl2的ORF,sgRNA E5靶向MDM2的ORF,并且sgRNA E6靶向AKT的ORF。
输出。在第5次细胞分裂时,所关注的异源性基因在细胞存活期的整个其余部分中连续表达。在第7个细胞周期之后,靶向产生NAPDH的苹果酸酶以与过氧化氢酶和超氧化物歧化酶同时增加表达水平。这些靶向努力试图减少在产生异源性基因产物时由ROS积累而引起的细胞应激。在10个细胞周期之后,诱导细胞凋亡。
实施例13:通过生物处理器技术跟踪产生生物治疗剂的细胞的细胞历史以使细胞行为自动化
已知的是,在7天内,产生单克隆抗体(mAB)的CHO细胞培养物的活力和生产力会在约第5天-第6天达到最高的mAB滴度时降低。本发明的系统在细胞分裂之前对细胞进行条形编码并且将细胞分裂与其它细胞行为,如mAB表达和毒性水平相结合。通过说明的方式,尽管第1次-第9次细胞分裂没有表现出任何毒性迹象并且维持高mAB表达,但是在第13次细胞分裂时,检测到中等量的毒性、mAB表达减少和抗体聚集,并且在第17次细胞分裂时,检测到高水平的毒性、没有产物分泌和开始细胞死亡(图21)。根据该分析,可以推断的是,由于代谢应激,因此连续的产物表达随时间推移而具有毒性;在整个细胞群体中生长速率由于生物反应器而不同;使产物基因沉默的细胞获得适应性优势并且生长更快;中等细胞培养密度提供最佳的收率,但是以细胞健康为代价;并且在第9次细胞分裂时诱导产物表达降低了毒性并且使收率达到最大。因此,使用从遗传记录产生的数据,可以通过使用可激活的sgRNA将指令程序嵌入到细胞的基因组中而产生高性能的mAB产生细胞。例如,在第1次细胞分裂时,可以执行程序1,其促进细胞繁殖。在第9次细胞分裂时,可以执行程序2,其促进基因产物的诱导。在第10次细胞分裂时,可以执行程序3,其中诱导细胞周期停滞,伴随有细胞存活基因的表达和基因产物的表达。在第11次细胞分裂时,执行程序4以使得分泌所有产物并且诱导细胞死亡。参见图21。
序列表
<110> 伊利诺伊大学理事会(The Board of Trustees of the University ofIllinois)
<120> 用于基因组编辑和调节转录的CRISPR/CAS系统和方法
<130> UIC0076WO
<150> US 62/563,128
<151> 2017-09-26
<150> US 62/563,131
<151> 2017-09-26
<150> US 62/563,133
<151> 2017-09-26
<160> 79
<170> PatentIn version 3.5
<210> 1
<211> 100
<212> RNA
<213> 化脓性链球菌(Streptococcus pyogenes)
<400> 1
ggggccacua gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 2
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 2
ggggtgcttc ggatgctgat gagtccgtga ggacgaaaca gggcaacctg tccatccggt 60
atccc 65
<210> 3
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 3
ggtgcctaac actgccaatg ccggtcccaa gcccggataa aagtggaggg ggca 54
<210> 4
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 4
cctgtcaccg gatgtgcttt ccggtctgat gagtccgtga ggacgaaaca gg 52
<210> 5
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 5
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttcgggcgcc 60
tcagatacgg tcgcctgtca ccggatgtgc tttccggtct gatgagtccg tgaggacgaa 120
acaggcgatt ttttaacttc gggcgcctca gatacgggcc cgaagtggca ccgagtcggt 180
gctttt 186
<210> 6
<211> 182
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 6
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttcgggcgcc 60
tcagatacgg ggtgcctaac actgccaatg ccggtcccaa gcccggataa aagtggaggg 120
ggcatttttt aacttcgggc gcctcagata cgggcccgaa gtggcaccga gtcggtgctt 180
tt 182
<210> 7
<211> 192
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 7
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttcgggcgcc 60
tcagatacgg ggggtgcttc ggatgctgat gagtccgtga ggacgaaaca gggcaacctg 120
tccatccggt atcccttttt taacttcggg cgcctcagat acgggcccga agtggcaccg 180
agtcggtgct tt 192
<210> 8
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 8
gttttagagc tgggtcgggc gcctcagata cggggggtgc ttcggatgct gatgagtccg 60
tgaggacgaa acagggcaac ctgtccatcc ggtatcccaa cttcgggcgc ctcagatacg 120
ggcccgaccc agcgagttaa aataaggctt agtccgtact caacttgaaa aggtggcacc 180
gattcggtgt tttt 194
<210> 9
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 9
gttttagagc tgggtaccca gcgagttaaa ataaggctta gtccgtactc aacttgaacg 60
ggcgcctcag atacgggggg tgcttcggat gctgatgagt ccgtgaggac gaaacagggc 120
aacctgtcca tccggtatcc caacttcggg cgcctcagat acgggcccga aggtggcacc 180
gattcggtgt tttt 194
<210> 10
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 10
gtttttgtac tctggtcggg cgcctcagat acggggggtg cttcggatgc tgatgagtcc 60
gtgaggacga aacagggcaa cctgtccatc cggtatccca acttcgggcg cctcagatac 120
gggcccgacc agaagctaca aagataaggc ttcatgccga aatcaacacc ctgtcatttt 180
atggcaggtg tttt 194
<210> 11
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 11
gtttttgtac tctggtacca gaagctacaa agataaggct tcatgccgaa atcaacaccc 60
tgtcattcgg gcgcctcaga tacggggggt gcttcggatg ctgatgagtc cgtgaggacg 120
aaacagggca acctgtccat ccggtatccc aacttcgggc gcctcagata cgggcccgtt 180
atggcaggtg tttt 194
<210> 12
<211> 215
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 12
gttttagtac tctggaaaca gaatctacta aaacaaggca acgggcgcct cagatacggt 60
cgcctgtcac cggatgtgct ttccggtctg atgagtccgt gaggacgaaa caggcgaaac 120
ttcgggcgcc tcagatacgg gcccgaagtg gcaccgagtc ggtgcttttg acgaatgccg 180
tgtttatctc gtcaacttgt tggcgagatt ttttt 215
<210> 13
<211> 215
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 13
gttttagtac tctggaaaca gaatctacta aaacaaggca agacgaatgc cgtgtttatc 60
tcgtcaactc gggcgcctca gatacggtcg cctgtcaccg gatgtgcttt ccggtctgat 120
gagtccgtga ggacgaaaca ggcgaaactt cgggcgcctc agatacgggc ccgaagtggc 180
accgagtcgg tgctttttgt tggcgagatt ttttt 215
<210> 14
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (53)..(57)
<223> n是a、c、g或t
<400> 14
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttnnnnnaag 60
tggcaccgag tcggtgcttt t 81
<210> 15
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (16)..(20)
<223> n是a、c、g或t
<400> 15
gttttagagc tgggtnnnnn acccagcgag ttaaaataag gcttagtccg tactcaactt 60
gaaaaggtgg caccgattcg gtgttttt 88
<210> 16
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (59)..(63)
<223> n是a、c、g或t
<400> 16
gttttagagc tgggtaccca gcgagttaaa ataaggctta gtccgtactc aacttgaann 60
nnnaaggtgg caccgattcg gtgttttt 88
<210> 17
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (17)..(21)
<223> n是a、c、g或t
<400> 17
gtttttgtac tctggtnnnn naccagaagc tacaaagata aggcttcatg ccgaaatcaa 60
caccctgtca ttttatggca ggtgtttt 88
<210> 18
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (68)..(72)
<223> n是a、c、g或t
<400> 18
gtttttgtac tctggtacca gaagctacaa agataaggct tcatgccgaa atcaacaccc 60
tgtcattnnn nnttatggca ggtgtttt 88
<210> 19
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (20)..(24)
<223> n是a、c、g或t
<400> 19
tagatgttgt catctttaan nnnn 24
<210> 20
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (15)..(19)
<223> n是a、c、g或t
<400> 20
tagatgttgt catcnnnnnt ttaa 24
<210> 21
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (42)..(46)
<223> n是a、c、g或t
<400> 21
gttttagtac tctggaaaca gaatctacta aaacaaggca annnnngacg aatgccgtgt 60
ttatctcgtc aacttgttgg cgagattttt tt 92
<210> 22
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<220>
<221> misc_feature
<222> (70)..(74)
<223> n是a、c、g或t
<400> 22
gttttagtac tctggaaaca gaatctacta aaacaaggca agacgaatgc cgtgtttatc 60
tcgtcaactn nnnntgttgg cgagattttt tt 92
<210> 23
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 23
gcctcacacg gaatct 16
<210> 24
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 24
gagagccctc tcccaatctt c 21
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 25
ggagccgtac atgaactgag 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 26
ggcaccaact tcccctccga 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 27
gtaatgcaga agaagaccat 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 28
gccgagggcc gccactccac 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 29
ccatgccgcc ggtggagtgg 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 30
ctacaacgtc aacatcaagt 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 31
caacttgatg ttgacgttgt 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 32
tgaagggcga gatcaagcag 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 33
tctgcttgat ctcgcccttc 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 34
gacccaggac tcctccctgc 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 35
gaactcgccg tcctgcaggg 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 36
cttgaagctg tccttccccg 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 37
ccacttgaag ccctcgggga 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 38
gaagggcagg gggccaccct 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 39
aagctgaagg tgaccaaggg 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 40
gggcgagggc cgcccctacg 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 41
tctgggtgcc ctcgtagggg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 42
ctcgaactcg tggccgttca 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 43
catgcgcttc aaggtgcaca 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 44
ggataacatg gccatcatca 20
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 45
gttcaatctg atttctttta tgg 23
<210> 46
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 46
tagattgtct aaagttgaga tgg 23
<210> 47
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 47
gtttctaaag gttatctctt agg 23
<210> 48
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 48
tcgatttcgc tatcaaattc tgg 23
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 49
gtaatgcaga agaagaccat ggg 23
<210> 50
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 50
tgtcccctca gttcatgtac gg 22
<210> 51
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 51
gcctcaacac gaacagagaa agg 23
<210> 52
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 52
ggagccgtac atgaactgag gg 22
<210> 53
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 53
tcgtgaccac cctgacctac gg 22
<210> 54
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 54
gtgaaccgca tcgagctgaa ggg 23
<210> 55
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 55
ctgaagcact gcacgccgta gg 22
<210> 56
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa表示Thr或Ser。
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa表示Arg或Gln。
<400> 56
Xaa Lys Lys Ser Lys Lys Asn Leu Xaa Arg Leu
1 5 10
<210> 57
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 57
Thr Lys Lys Ser Lys Lys Asn Leu Arg Arg Leu
1 5 10
<210> 58
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 58
Thr Ser Met Thr Asp Phe Tyr His Ser Lys Arg Arg Leu
1 5 10
<210> 59
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 59
Pro Leu Ile Ser Asp Phe Phe Ala Lys Arg Lys Arg Ser
1 5 10
<210> 60
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 60
Arg Arg Val Thr Asp Phe Phe Ala Arg Arg Arg Pro
1 5 10
<210> 61
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 61
Arg Lys Leu Thr Asp Phe Tyr Pro Val Arg Arg Ser
1 5 10
<210> 62
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 62
Glu Pro Glu Glu Pro Glu Ala Asp Gln His
1 5 10
<210> 63
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 63
Glu Cys Glu Glu Thr Glu Val Asp Gln His
1 5 10
<210> 64
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 64
Leu Ala Pro Tyr Ile Pro Met Asp Gly Glu Asp Phe Gln Leu
1 5 10
<210> 65
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 65
Leu Ala Pro Ala Ala Gly Asp Thr Ile Ile Ser Leu Asp Phe
1 5 10
<210> 66
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 66
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 67
<211> 4494
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 67
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagatac agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac 180
cgacgagtac aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg accggcacag 240
catcaagaag aactatcgga gccctgctgt tcgacagcgg cgaaacagcc gaggccaccc 300
ggctgaagag aaccgccaga agaagataca ccagacggaa gaaccggatc tgctatctgc 360
aagagatctt cagcaacgaa tgccaaggtg gacgacagct tcttccacag actggaagag 420
tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 480
gacgaggtgg cctaccacga gaagtcccac catctaccac ctgagaaaga aactggtgga 540
cagcaccgac aaggccgacc tgcggctgat ctatctggcc ctggcccaca tgatcaagtt 600
ccggggccac ttcctgatcg agggcgacct gacccgacaa cagcgacgtg gacaagctgt 660
tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg 720
gcgtggacgc caaggccatc ctgtctgcca gactgagaag agagacggct ggaaaatctg 780
atcgcccagc tgcccggcga gaagaagaat ggcctgttcg gaaacctgat tgccctgagc 840
ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgggatgca aactgcagct 900
gagcaaggac acctacgacg acgacctgga caacctgctg gcccagatcg gcgaccagta 960
cgccgacctg tttctggccg ccaagaacct gtccgacgcc atcctgctgg cgacatctga 1020
gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag agatacgacg 1080
agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg cctgaaagta 1140
caagagattt tcttcgacca gagcaagaac ggctacgccg gctacattga cggcggagcc 1200
agccaggaag agttctacaa gttcatcaag cccatcctgg aaaagatgga cggcaccgag 1260
gactgctcgt aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg 1320
cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga 1380
tttttaccat tcctgaagac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc 1440
cctactacgt gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga 1500
gcgaggaaac cataccccct ggaattcgag gaagtggtgg acaagggcgc ttccgcccag 1560
agcttcatcg agcggatgac caacttcgat aagaacctgc ccaacgagaa ggtgctgccc 1620
aagcacagcc tgctgtacgg tacttcaccg ttataacgag ctgaccaaag tgaaatacgt 1680
gaccgaggga atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga 1740
cctgctgttc aagaccaacc ggaaatgacc gtgaagcact gaaagaggac tacttcaaga 1800
aaatcgagtg cttcgactcc gtggaaatct ccggcgtgga agatcggttc aacgcctccc 1860
tgggcacata ccacgatctg ctgaaaatta tcaaggacaa ggacttcctg gacaatgagg 1920
aaaacgagga cattctggaa gatatcgtgc tgaccctgac actgtttgga cagagagatg 1980
atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat gaagcagctg 2040
aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa cggaccggga 2100
caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 2160
cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagcccg 2220
ggtccggcca gggcgatagc ctgcacgagc acattgccaa tctggccggc agccccgcca 2280
ttaagaaggg catcctgcag acagtgaagg tggtggacga gctcgtgaaa gtgatgggcc 2340
ggcacagccg agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga 2400
cagaagaaca gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc 2460
cagatcctga agaacccccg tggaaaacac ccagctgcag aacgagaagc tgtacctgta 2520
ctacctgcag aatgggcggg atatgtacgt ggaccaggaa ctggacatca accggctgtc 2580
cgactacgat gtggacctat cggcctcaga gctttctgaa ggacgactcc atcgacaaca 2640
aggtgctgac cagaagcgac aagaaccggg gcaagagcga caacgtgccc tccgaagagg 2700
tcgtgaagaa gatgaagaac tacggcggcg ctgctgaacg ccaagctgat tacccagaga 2760
aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga taaggccggc 2820
ttcatcaaga gacagctggt ggaaacccgc agatcaaaag cacgtggcac agatcctgga 2880
ctcccggatg aacactaagt acgacgagaa tgacaagctg atccgggaag tgaaagtgat 2940
caccctgaag tccaagctgg tgtccgattt ccggaggatt tccgttttac aaagtgcgcg 3000
agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3060
tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cgcgactaca ggtgtacgac 3120
gtgcggaaga tgatcgccaa gagcgagcag gaaatcggca aggctaccgc caagtacttc 3180
ttctacagca acatcatgaa ctttttcaag accgagatta ccctggcaac ggcgagaccg 3240
gaagcggcct ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg 3300
ggattttgcc accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaagacc 3360
gagggcagac aggcggcttc agcaaagagt ctatcctgcc caagaggaac agcgataagc 3420
tgatcgccag aaagaaggac tgggacccta agaagtacgg cggcttcgac agccccacct 3480
ggcctattct ggctggtggt ggccaaagtg gaaaagggca agtccaagaa actgaagagt 3540
gtgaaagagc tgctggggat caccatcatg gaaagaagca gcttcgagaa gaatcccatc 3600
gacttctgga agccaaggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa 3660
gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact 3720
gcagaaggga acgaactggc cctgcctcca aatatgtgaa cttcctgtac ctggccagcc 3780
actatgagaa gctgaagggc tcccccgagg ataatgagca gaaacagctg tttgtggaac 3840
agcacaagca ctacctgacg agatcatcga gcgatcagcg agttctccaa gagagtgatc 3900
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3960
atcagagagc aggccgagaa tatatccacc tgtttacccg accaatctgg gagcccctgc 4020
cgccttcaag tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt 4080
gctggacgcc accctgatcc accagagcac accggcctgt acgagaacgg atcgacctgt 4140
ctcagctggg aggcgacaaa aggccggcgg ccacgaaaaa ggccggccag gcaaaaaaga 4200
aaaaggggag tggcggttct ggaccttccc ctgctggcct gctctgcgcg ctcagcttct 4260
gccacatctg ggagtcgaaa acgcgctcga cctcccgccg ctccgggacg cgaccaggcc 4320
aggcctcccg ccagacggcg gctgcgactg tccgtggacg agtgagctca ccctccacac 4380
tgaagcccct gatatccccg cttgtccatc tcctgggcag aaaatcaaaa agagcacccc 4440
ggctgcaggg cagcctccac accttacttc tgcccaagat caggatacat ctaa 4494
<210> 68
<211> 5357
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 68
acccacgcgc cggactcggc ccggaactct gcgtctcagg ggcggggagg acgagtcagg 60
agggacagtg cgcgcgcgcg ggagaccggc ggatgacggg ttcttaactc cgggccctcc 120
cgtgcctctc cagtcaagcc cggccgccga tcattgcgat ctgccctgct gacattccac 180
ttgggcggcc catgccgctc ctcccggccc cgcacgctca gaatccttca ggcgctcgcg 240
ccaagattct cccctcagcg agcccgcccc gcagccgcgc gcgccagacg actctcccgc 300
gtcccgcccc gcgcaggccc cgcctaccac gtccgcaccc cgcccccggc gcgcaggccc 360
tgacatctag ccccacccct tgtgcatgcc acgcccgtaa aagaacacgc cccccgggag 420
gccacgcccc caccagagct cctcgctggt ccgcgcggcg acggggcggg ccccgggcct 480
gcggcggccg ctgaggggct cgcagccctc ggggcggggc gcgagggcgg gacggggccg 540
gtgccgcgcg ctgggatttt taaatgtccc gctcgaagcc gggcgcagga gcagccggct 600
cgacagccag cggtgtaggg ggcaggcgcg gatcccgcca gcgccgcgcg ctcggccgcc 660
gcctcccgcc tcctgcttcc cgctcgccgt cggcctcctg cccgctcgag cgcgcctgcc 720
tgcggcggac acagctgggt acgggctgcc tggactcccg ggactcccgg gactcccacg 780
actcccaggc gtccggatgg actataagga ccacgacgga gactacaagg atcatgatat 840
tgattacaaa gacgatgacg aaaatggccc caaagaagaa gcggaaggtc ggtatccacg 900
gagtcccagc agccgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 960
gctgggccgt gatcaccgac gagtacaggt cccagcaaga aattcaaggt gctgggcaac 1020
accgaccggc acagcatcaa gaagaacctg atcggagccc tgctgttcga cagcggcgaa 1080
acagccgagg ccacccggct gaagagaacc gccgaagaga tacaccagac ggaagaaccg 1140
gatctgctat ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt 1200
ccacagactg gaagagtcct tcctggtgga agaggataaa agcagagcgg caccccatct 1260
tcggcaacat cgtggacgag gtggcctacc acgagaagta ccccaccatc taccacctga 1320
gaaagaaact ggtggacagc accgacaagg ccgacctgcg gctgactatc tgccctggcc 1380
cacatgatca agttccgggg ccacttcctg atcgagggcg acctgaaccc cgacaacagc 1440
gacgtggaca agctgttcat ccagctggtg cagacctaca accagctgtt caggaaaacc 1500
catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag 1560
acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggaac 1620
ctgatgccct gagcctgggc ctgaccccca acttcaagag caacttcgac ctggccgagg 1680
atgccaaact gcagctgagc aaggacacct acgacgacga cctggacaac ctgctggccc 1740
agacggcgac catacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1800
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1860
atcaagagaa cgacgagcac accaggacct gaccctgctg aaagctctcg tgcggcagca 1920
gctgcctgag aagtacaaag agattttctt cgaccagagc aagaacggct acgccggcta 1980
cattgacggc ggagcagcca ggaagattct acaagttcat caagcccatc ctggaaaaga 2040
tggacggcac cgaggaactg ctcgtgaagc tgaacagaga ggacctgctg cggaagcagc 2100
ggaccttcga caacggcagc acccccacca gatcacctgg gagagctgca cgccattctg 2160
cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2220
ctgaccttcc gcatccccta ctacgtggcc ctctggccag ggaaacagca gattcgcctg 2280
gatgaccaga aagagcgagg aaaccatcac cccctggaac ttcgaggaag tggtggacaa 2340
gggcgcttcc gcccagagct tcatcgagcg gataccaact tcgataaaac ctgcccaacg 2400
agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga 2460
ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc ttcctgagcg gcgacagaaa 2520
aaggccatcg tggacctgct gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa 2580
gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatcccggc gtggaagatc 2640
gttcaacgcc tccctgggca cataccacga tctgctgaaa attatcaagg acaaggactt 2700
cctggacaat gaggaaaacg aggacattct ggaagatatc gtgctgaccc tacactgttt 2760
gaggacagga gatgatcgag gaacggctga aaacctatgc ccacctgttc gacgacaaag 2820
tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc cggaagcgat 2880
caacggcatc cgggaaagca gtccggcaag acaatcctgg atttcctgaa gtccgacggc 2940
ttcgccaaca gaaacttcat gcagctgatc cacgacgaca gcctgacctt taaagaggac 3000
atcagaaagc ccaggtgtcc ggcagggcga tagcctgcac gagcacattg ccaatctggc 3060
cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 3120
gaaagtgatg gccggcacaa gcccgagaaa tcgtgatcga aatggccaga gagaaccaga 3180
ccacccagaa gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca 3240
aagagctggg cagccgatcc tgaaagaaca ccccgtgaaa acacccagct gcagaacgag 3300
aagctgtacc tgtactacct gcagaatggg cgggatatgt acgtggacca ggaactggac 3360
atcaaccggc tgtccgacta catgtggacc atatcgtgcc tcaagctttc tgaaggacga 3420
ctccatcgac aacaaggtgc tgaccagaag cgacaagaac cggggcaaga gcgacaacgt 3480
gccctccgaa gaggtcgtga agaagataag aactactggc ggcagctgct aacgccaagc 3540
tgattaccca gagaaagttc gacaatctga ccaaggccga gagaggcggc ctgagcgaac 3600
tggataaggc cggcttcatc aagagacagc tggggaaacc cggcagatca caaagcagtg 3660
gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa gctgatccgg 3720
gaagtgaaag tgatcaccct gaagtccaag ctggtgtcca tttccggaag gatttccagt 3780
tttacaaagt gcgcgagatc aacaactacc accacgccca cgacgcctac ctgaacgccg 3840
tcgtgggaac cgccctgatc aaaaagtacc ctaagctgga aagcgagttc gtgtacggcg 3900
actacaaggt gtcgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 3960
taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4020
ggccaacggc gagatccgga gcggcctctg atcgagacaa acggcgaaac cggggagatc 4080
gtgtgggata agggccggga ttttgccacc gtgcggaaag tgctgagcat gccccaagtg 4140
aatatcgtga aaaagaccga ggtgcaacag gcggcttcag caaagagtct atcctgccca 4200
agaggaacag cgataagctg atcgccagaa agaaggactg ggaccctaag aagtacggcg 4260
gcttcgacag ccccaccgtg gcctattctg tgcggtggtg gccaaagtgg aaaagggcaa 4320
gtccaagaaa ctgaagagtg tgaaagagct gctggggatc accatcatgg aaagaagcag 4380
cttcgagaag aatcccatcg actttctgga agccaagggc acaaagaagt gaaaaaggac 4440
ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg 4500
ctggcctctg ccggcgaact gcagaaggga aacgaactgg ccctgcctcc aaatatgtga 4560
acttcctgta cctggccagc cactatgaga agctgaaggg ctcccccgag gataatgagc 4620
agaaacagct gtttgtggaa cagcacaagc actacctgga cgagatcatc gagcgatcag 4680
cgagttctcc aagagagtga tcctggccga cgctaatctg gacaaagtgc tgtccgccta 4740
caacaagcac cgggataagc ccatcagaga gcaggccgag aatatcatcc acctgtttac 4800
ctgaccaatc tgggagcccc tgccgccttc aagtactttg acaccaccat cgaccggaag 4860
aggtacacca gcaccaaaga ggtgctggac gccaccctga tccaccagag catcaccggc 4920
ctgtacgaac acggatcgac ctgtctcagc tgggaggcga caaaaggccg gcggccacga 4980
aaaaggccgg ccaggcaaaa aagaaaaagg ggagtggcgg ttctggaatg aatcccagta 5040
tgaagcagaa acaagagaaa tcaaagagaa tataaagaat agttctgtcc caagaagaac 5100
tctgaagatg attcagcctt ctgcatctgg atctcttgtt ggaagagaaa atgagctgtc 5160
cgcaggcttg tccaaaagga aaatcggaat gaccacttaa catctacaac ttccagccct 5220
ggggttattg tcccagaatc tagtgaaaat aaaaatcttg gaggagtcac ccaggagtca 5280
tttgatctta tgattaaaga aaatccatct ctcagtattg gaaggaagtg gcagaaaaac 5340
ggagaaaggc gctgtaa 5357
<210> 69
<211> 5479
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 69
taaggagttt gacatagaaa gatagagagt tgcaatagag atctttgtta aataagattt 60
tacaaaacta tatttttgga gtaatcttaa acttagagca aaattaagca taaggcacat 120
tttcttttca ctggggcagt cgctattggg gagcttggta tgttaatcta tttgcttata 180
ataaccattt acagctgggc ggtggtggca cacgccttta atcccagcac ttgggaggca 240
gaggcaggtg gatttgagtt cgaggccagc ctggtataca gagtgagttt caggacagcc 300
aggcctatac agagaaaccc tgtctcgaaa aaacaaaaag caaaaacaaa acaaaaaaca 360
tttactatgt gtatgtgtgt aaacttcatg ctatcaacct caaaatccat cccagatagc 420
tgttggaaca gtcatattaa agaccgtctc tgcaacaaag ctttcgggaa ctcttaagat 480
agtattggca cttctataga agaggtgaaa acaataaata ggacaacagc aaaactgata 540
tgcgtactcc ccacagtcat tttcctaaag tccaacggag tcgcctgggc tagcttggac 600
agcacacaag tgagcactgc acgccatgcc tcctaggcag gtggcagcaa tgcgacttgt 660
gcgcaggcat agagcctgac ctcgcgaggg gtgggcggtg ctgccagcgg cagcctcgct 720
ctggccccgc ccccgcccca cccccgccga acttgggtcg cggatcgccc aggaaacgca 780
ttctacggga acccgcggcg ccaatgggaa gagagcgagt gccacgaact ggccaatgag 840
gagcgagcgg cccggggttt aaacctaagc ccggcagact cctccggcgg ctgcggagga 900
acggctgtta gtgtttagct gtggatagcc agaggttagg gtgtcttctc gaatcgggga 960
acctctgatt ttggaggagc catggactat aaggaccacg acggagactc aaggatatga 1020
tattgattac aaagacgatg acgataagat ggccccaaag aagaagcgga aggtcggtat 1080
ccacggagtc ccagcagccg acaagaagta cagcatcggc ctggacatcg gcaccactct 1140
gtggctgggc cgtgatcacc gacgagtaca aggtgcccag caagaaattc aaggtgctgg 1200
gcaacaccga ccggcacagc atcaagaaga acctgatcgg agccctgctg ttcgacagcg 1260
ggaaacagcc aggccacccg gctgaagaga accgccagaa gaagatacac cagacggaag 1320
aaccggatct gctatctgca agagatcttc agcaacgaga tggccaaggt ggacgacagc 1380
ttcttcccag actggaaagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc 1440
catcttcggc aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca 1500
cctgagaaag aaatggtgga cagcccgaca aggccgacct gcggctgatc tatctggccc 1560
tggcccacat gatcaagttc cggggccact tcctgatcga gggcgacctg aaccccgaca 1620
acagcgacgt ggacaagctg ttcatccagc tggtgcagac ctacaaccag ctgttcgagg 1680
aaaaccatca acgccagcgg cgtggacgcc aaggccatcc tgtctgccag actgagcaag 1740
agcagacggc tggaaaatct gatcgcccag ctgcccggcg agaagaagaa tggcctgttc 1800
ggaaacctga tccctgagcc tgggcctgac ccccaacttc aagagcaact tcgacctggc 1860
cgaggatgcc aaactgcagc tgagcaagga cacctacgac gacgacctgg acaacctgct 1920
ggcccagatc ggcgacagac gccgacctgt ttctggccgc caagaacctg tccgacgcca 1980
tcctgctgag cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct 2040
ctatgatcaa gagatacgac gacacaccag gacctgaccc tgctgaaagc tctcgtgcgg 2100
cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 2160
ggctacattg acggcggagc cagccaggag agtctacaag ttcatcaagc ccatcctgga 2220
aaagatggac ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa 2280
gcagcggacc ttcgacaacg gcagcatccc ccacagatca cctgggagag ctgcacgcca 2340
ttctgcggcg gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga 2400
agatcctgac cttccgcatc ccctactacg tgggccctct gccagggaaa cagcagattc 2460
gcctggatga ccagaaagag cgaggaaacc atcaccccct ggaacttcga ggaagtggtg 2520
gacaagggcg cttccgccca gagcttcatc gagcggatga ccaactcgat aagacctgcc 2580
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2640
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tggcggcgag 2700
agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc 2760
tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc tccggcgtga 2820
agatcggtca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 2880
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 2940
ctgttgagga cagaagatga tcgaggaacg gctgaaaacc tatgcccacc tgttcgacga 3000
caaagtgatg aagcagctga agcggcggag atacaccggc tggggcaggc tgagccggaa 3060
gctgatcaac gcatccggga cagcagtccg gcaagacaat cctggatttc ctgaagtccg 3120
acggcttcgc caacagaaac ttcatgcagc tgatccacga cgacagcctg acctttaaag 3180
aggacatcca gaaagccagg tgtccggcag ggcgatagcc tgcacgagca cattgccaat 3240
ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt ggtggacgag 3300
ctcgtgaaag tgatgggccg gccaagcccg agaactcgtg atcgaaatgg ccagagagaa 3360
ccagaccacc cagaagggac agaagaacag ccgcgagaga atgaagcgga tcgaagaggg 3420
catcaaagag ctgggcagcc agatcctgaa gaacaccccg tgaaaacacc cagctgcaga 3480
acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg gaccaggaac 3540
tggacatcaa ccggctgtcc gactacgatg tggacatatc gtgcctcagg ctttctgaag 3600
gacgactcca tcgacaacaa ggtgctgacc agaagcgaca agaaccgggg caagagcgac 3660
aacgtgccct ccgaagaggt cgtgaagaag atgaagaact ctggcggcag ctgctgacgc 3720
caagctgatt acccagagaa agttcgacaa tctgaccaag gccgagagag gcggcctgag 3780
cgaactggat aaggccggct tcatcaagag acagctggtg gaaaccggca gatcacaaag 3840
cactggcaca gatcctggac tcccggatga acactaagta cgacgagaat gacaagctga 3900
tccgggaagt gaaagtgatc accctgaagt ccaagctggt gtccgatttc cgaaggattt 3960
ccagttttac aagtgcgcga gatcaacaac taccaccacg cccacgacgc ctacctgaac 4020
gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc tggaaagcga gttcgtgtcg 4080
gcgactacaa ggtgtacacg tgcggaagat gatcgccaag agcgagcagg aaatcggcaa 4140
ggctaccgcc aagtacttct tctacagcaa catcatgaac tttttcaaga ccgagattac 4200
cctgccaacg gcgagatccg gaagggcctc tgatcgagac aaacggcgaa accggggaga 4260
tcgtgtggga taagggccgg gattttgcca ccgtgcggaa agtgctgagc atgccccaag 4320
tgaatatcgt aaaaagaccg aggtgcagac agcggcttca gcaaagagtc tatcctgccc 4380
aagaggaaca gcgataagct gatcgccaga aagaaggact gggaccctaa gaagtacggc 4440
ggcttcgaca gccccacgtg gcctattctg tgctggtgtg gccaaagtgg aaaagggcaa 4500
gtccaagaaa ctgaagagtg tgaaagagct gctggggatc accatcatgg aaagaagcag 4560
cttcgagaag aatcccatcg acttctggaa gccaagggct acaaaaagtg aaaaaggacc 4620
tgatcatcaa gctgcctaag tactccctgt tcgagctgga aaacggccgg aagagaatgc 4680
tggcctctgc cggcgaactg cagaagggaa cgaactggcc ctgccctcca aaatgtgaac 4740
ttcctgtacc tggccagcca ctatgagaag ctgaagggct cccccgagga taatgagcag 4800
aaacagctgt ttgtggaaca gcacaagcac tacctggacg agatcatcga gcagatcagc 4860
gagttctcca agagagtgat cctggccgac gctaatctgg acaaagtgct gtccgccaca 4920
acaagcaccg ggataagccc atcagagagc aggccgagaa tatcatccac ctgtttaccc 4980
tgaccaatct gggagcccct gccgccttca agtactttga caccaccatc gaccggaaga 5040
ggtaaccagc accaaagagg tgctggacgc caccctgatc caccagagca tcaccggcct 5100
gtacgagaca cggatcgacc tgtctcagct gggaggcgac aaaaggccgg cggccacgaa 5160
aaaggccggc cggcaaaaaa gaaaaagggg agtggcggtt ctggaccttc ccctgctagg 5220
cctgctctgc gcgctccagc ttctgccaca tctgggagtc gaaaacgcgc tcgacctccc 5280
gccgctccgg gacgcgacag gccaggcctc ccgccagacg gcggctgcga ctgtccgtgg 5340
acgaggtgag ctcaccctcc acacctgaag cccctgatat ccccgcttgt ccatctcctg 5400
ggcagaaaat caaaaagagc accccgctgc agggcagcct ccacacctta cttctgccca 5460
agatcaggat accatctaa 5479
<210> 70
<211> 5343
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 70
acccacgcgc cggactcggc ccggaactct gcgtctcagg ggcggggagg acgagtcagg 60
agggacagtg cgcgcgcgcg ggagaccggc ggatgacggg ttcttaactc cgggccctcc 120
cgtgcctctc cagtcaagcc cggccgccga tcattgcgat ctgccctgct gacattccac 180
ttgggcggcc catgccgctc ctcccggccc cgcacgctca gaatccttca ggcgctcgcg 240
ccaagattct cccctcagcg agcccgcccc gcagccgcgc gcgccagacg actctcccgc 300
gtcccgcccc gcgcaggccc cgcctaccac gtccgcaccc cgcccccggc gcgcaggccc 360
tgacatctag ccccacccct tgtgcatgcc acgcccgtaa aagaacacgc cccccgggag 420
gccacgcccc caccagagct cctcgctggt ccgcgcggcg acggggcggg ccccgggcct 480
gcggcggccg ctgaggggct cgcagcctgg ggcggggcgc gagggcggga cggggccggt 540
gccgcgcgct gggattttta aatgtcccgc tcgaagccgg gcgcaggagc agccggctcg 600
acagccagcg cggtgtaggg ggcaggcgcg gtcccccagc gccgcgcgct cggccgccgc 660
ctcccgcctc ctgcttcccg ctcgccgtcg gcctcctgcc cgctcgagcg cgcctgcctg 720
cggcggacac agcttcgggt acgggctgcc tggactccgg gatcccggga ctcccacgac 780
tcccaggcgt ccggatggac tataaggacc acgacggaga ctacaaggat catgatattg 840
attacaaaga cgatgacgat aagatggccc caaagaagaa gcgaaggtcg tatccacgga 900
gtcccagcag ccgacaagaa gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc 960
tgggccgtga tcaccgacga gtacaaggtg cccagcaaga aattcaaggg ctgggcacac 1020
cgaccggcac agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac 1080
agccgaggcc acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaccgg 1140
atcgctatct gcaagagatc ttcagcaacg agatggccaa ggtggacgac agcttcttcc 1200
acagactgga agagtccttc ctggtggaag aggataagaa gcacgagcgg caccccatct 1260
tggcaacatc tggacgaggt ggcctaccac gagaagtacc ccaccatcta ccacctgaga 1320
aagaaactgg tggacagcac cgacaaggcc gacctgcggc tgatctatct ggccctggcc 1380
cacatgacaa gttccgggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga 1440
cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc 1500
catcaacgcc agcgcgtgga cgccaggcca tcctgtctgc cagactgagc aagagcagac 1560
ggctggaaaa tctgatcgcc cagctgcccg gcgagaagaa gaatggcctg ttcggaaacc 1620
tgattgccct gagcctgggc tgacccccaa ctcaagagca acttcgacct ggccgaggat 1680
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 1740
atcggcgacc agtacgccga cctgttctgg ccgccaagac ctgtccgacg ccatcctgct 1800
gagcgacatc ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat 1860
caagagatac gacgagcacc accaggacct gccctgctga aagcttcgtg cggcagcagc 1920
tgcctgagaa gtacaaagag attttcttcg accagagcaa gaacggctac gccggctaca 1980
ttgacggcgg agccagccag gaagagttct acaagttatc aagcccatcc tgaaaagatg 2040
gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2100
accttcgaca acggcagcat cccccaccag atccacctgg gaggctgcac gccattctgg 2160
gcggcaggaa gatttttacc cattcctgaa ggacaaccgg gaaaagatcg agaagatcct 2220
gaccttccgc atcccctact acgtgggccc tctggccagg ggaaacagcg attcgcctgg 2280
atgaccgaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg 2340
gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgccaacga 2400
gaaggtgctg cccagcacag cctgctgtac gagtacttca ccgtgtataa cgagctgacc 2460
aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 2520
aggccatcgt ggacctgctg ttcaagacca accggaaagt gaccgtgaag cagctgaaag 2580
aggactactt caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagatc 2640
ggttcaacgc ctccctgggc acataacgat ctgctgaaaa ttatcaagga caaggacttc 2700
ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct gacactgttt 2760
gaggacagag agatgatcga ggaacggctg aacctatgcc cacctgttcg acgacaaagt 2820
gatgaagcag ctgaagcggc ggagatacac cggctggggc aggctgagcc ggaagctgat 2880
caacggcatc cgggacaagc agtccggcaa gacaatctga tttcctgaag tccgacggct 2940
tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt aaagaggaca 3000
tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgacacttgc caatctggcc 3060
ggcagccccg ccattaagaa gggcatcctg cagacagtga aggtggtgga cgagctcgtg 3120
aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg aaatggccaa gagaccagac 3180
cacccagaag ggacagaaga acagccgcga gagaatgaag cggatcgaag agggcatcaa 3240
agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc tgcagacgag 3300
agctgtacct gtactacctg cagaatgggc gggatatgta cgtggaccag gaactggaca 3360
tcaaccggct gtccgactac gatgtggacc atatcgtgcc tcagagcttt ctgaaggacg 3420
atccatcaca acaaggtgct gaccagaagc gacaagaacc ggggcaagag cgacaacgtg 3480
ccctccgaag aggtcgtgaa gaagatgaag aactactggc ggcagctgct gaacgccaag 3540
ctgattacca gagaagttcg acaatctgac caaggccgag agaggcggcc tgagcgaact 3600
ggataaggcc ggcttcatca agagacagct ggtggaaacc cggcagatca caaagcacgt 3660
ggcacagatc ctgactcccg gtgaacacta agtacgacga gaatgacaag ctgatccggg 3720
aagtgaaagt gatcaccctg aagtccaagc tggtgtccga tttccggaag gatttccagt 3780
tttacaaagt gcgcgagata acaactacac cacgcccacg acgcctacct gaacgccgtc 3840
gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa gcgagttcgt gtacggcgac 3900
tacaaggtgt acgacgtgcg gaagagatcg ccaaggcgag caggaaatcg gcaaggctac 3960
cgccaagtac ttcttctaca gcaacatcat gaactttttc aagaccgaga ttaccctggc 4020
caacggcgag atccggaagc ggcctctgat cagacaaacg gcaaaccggg gagatcgtgt 4080
gggataaggg ccgggatttt gccaccgtgc ggaaagtgct gagcatgccc caagtgaata 4140
tcgtgaaaaa gaccgaggtg cagacaggcg gcttcagaaa gagtctatct gcccaagagg 4200
aacagcgata agctgatcgc cagaaagaag gactgggacc ctaagaagta cggcggcttc 4260
gacagcccca ccgtggccta ttctgtgctg gtggtggcca aagggaaaag ggcaagccaa 4320
gaaactgaag agtgtgaaag agctgctggg gatcaccatc atggaaagaa gcagcttcga 4380
gaagaatccc atcgactttc tggaagccaa gggctacaaa gaagtgaaaa ggacctgatc 4440
atcagctgcc taagtactcc ctgttcgagc tggaaaacgg ccggaagaga atgctggcct 4500
ctgccggcga actgcagaag ggaaacgaac tggccctgcc ctccaaatat gtgaattcct 4560
gtacctggcc gccactatga gaagctgaag ggctcccccg aggataatga gcagaaacag 4620
ctgtttgtgg aacagcacaa gcactacctg gacgagatca tcgagcagat cagcgagttc 4680
tcaagagagt gatcctgccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca 4740
ccgggataag cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa 4800
tctgggaccc ctgccgcctt caagactttg acaccaccat cgaccggaag aggtacacca 4860
gcaccaaaga ggtgctggac gccaccctga tccaccagag catcaccggc ctgtacgaga 4920
cacggatcga ccttctcagc tgggaggcga caaaggccgg cggccacgaa aaaggccggc 4980
caggcaaaaa agaaaaaggg gagtggcggt tctggaatga atcccagtat gaagcagaaa 5040
caagaagaaa tcaaagagat ataaagaata gttctgtcca agaagaactc tgaagatgat 5100
tcagccttct gcatctggat ctcttgttgg aagagaaaat gagctgtccg caggcttgtc 5160
caaaaggaaa catcggaatg accactaaca tctacaactt ccagcctggg gttattgtcc 5220
cagaatctag tgaaaataaa aatcttggag gagtcaccca ggagtcattt gatcttatga 5280
ttaaagaaaa tccatcctct cagtattgga agaagtggca gaaaaacgga gaaggcgctg 5340
taa 5343
<210> 71
<211> 1520
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 71
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly Gly Ser
1415 1420 1425
Gly Pro Ser Pro Ala Arg Pro Ala Leu Arg Ala Pro Ala Ser Ala
1430 1435 1440
Thr Ser Gly Ser Arg Lys Arg Ala Arg Pro Pro Ala Ala Pro Gly
1445 1450 1455
Arg Asp Gln Ala Arg Pro Pro Ala Arg Arg Arg Leu Arg Leu Ser
1460 1465 1470
Val Asp Glu Val Ser Ser Pro Ser Thr Pro Glu Ala Pro Asp Ile
1475 1480 1485
Pro Ala Cys Pro Ser Pro Gly Gln Lys Ile Lys Lys Ser Thr Pro
1490 1495 1500
Ala Ala Gly Gln Pro Pro His Leu Thr Ser Ala Gln Asp Gln Asp
1505 1510 1515
Thr Ile
1520
<210> 72
<211> 1380
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 72
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1370 1375 1380
<210> 73
<211> 1469
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 73
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly Gly Ser
1415 1420 1425
Gly Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly
1430 1435 1440
Thr Leu Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His
1445 1450 1455
Pro Ala Ala Cys Ala Ser Ala Arg Ile Asn Val
1460 1465
<210> 74
<211> 1471
<212> PRT
<213> 人工序列
<220>
<223> `合成多肽
<400> 74
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly Gly Ser
1415 1420 1425
Gly Lys Leu Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp
1430 1435 1440
Asp Gly Thr Leu Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp
1445 1450 1455
Arg His Pro Ala Ala Cys Ala Ser Ala Arg Ile Asn Val
1460 1465 1470
<210> 75
<211> 1624
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 75
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Lys Leu Ser His Gly
1415 1420 1425
Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly Thr Leu Pro Met
1430 1435 1440
Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala Ala Cys
1445 1450 1455
Ala Ser Ala Arg Ile Asn Val Val Leu Asp Ala Thr Leu Ile His
1460 1465 1470
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1475 1480 1485
Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1490 1495 1500
Ala Lys Lys Lys Lys Gly Ser Gly Gly Ser Gly Met Asn Pro Ser
1505 1510 1515
Met Lys Gln Lys Gln Glu Glu Ile Lys Glu Asn Ile Lys Asn Ser
1520 1525 1530
Ser Val Pro Arg Arg Thr Leu Lys Met Ile Gln Pro Ser Ala Ser
1535 1540 1545
Gly Ser Leu Val Gly Arg Glu Asn Glu Leu Ser Ala Gly Leu Ser
1550 1555 1560
Lys Arg Lys His Arg Asn Asp His Leu Thr Ser Thr Thr Ser Ser
1565 1570 1575
Pro Gly Val Ile Val Pro Glu Ser Ser Glu Asn Lys Asn Leu Gly
1580 1585 1590
Gly Val Thr Gln Glu Ser Phe Asp Leu Met Ile Lys Glu Asn Pro
1595 1600 1605
Ser Ser Gln Tyr Trp Lys Glu Val Ala Glu Lys Arg Arg Lys Ala
1610 1615 1620
Leu
<210> 76
<211> 91
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 76
Pro Ser Pro Ala Arg Pro Ala Leu Arg Ala Pro Ala Ser Ala Thr Ser
1 5 10 15
Gly Ser Arg Lys Arg Ala Arg Pro Pro Ala Ala Pro Gly Arg Asp Gln
20 25 30
Ala Arg Pro Pro Ala Arg Arg Arg Leu Arg Leu Ser Val Asp Glu Val
35 40 45
Ser Ser Pro Ser Thr Pro Glu Ala Pro Asp Ile Pro Ala Cys Pro Ser
50 55 60
Pro Gly Gln Lys Ile Lys Lys Ser Thr Pro Ala Ala Gly Gln Pro Pro
65 70 75 80
His Leu Thr Ser Ala Gln Asp Gln Asp Thr Ile
85 90
<210> 77
<211> 110
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 77
Met Asn Pro Ser Met Lys Gln Lys Gln Glu Glu Ile Lys Glu Asn Ile
1 5 10 15
Lys Asn Ser Ser Val Pro Arg Arg Thr Leu Lys Met Ile Gln Pro Ser
20 25 30
Ala Ser Gly Ser Leu Val Gly Arg Glu Asn Glu Leu Ser Ala Gly Leu
35 40 45
Ser Lys Arg Lys His Arg Asn Asp His Leu Thr Ser Thr Thr Ser Ser
50 55 60
Pro Gly Val Ile Val Pro Glu Ser Ser Glu Asn Lys Asn Leu Gly Gly
65 70 75 80
Val Thr Gln Glu Ser Phe Asp Leu Met Ile Lys Glu Asn Pro Ser Ser
85 90 95
Gln Tyr Trp Lys Glu Val Ala Glu Lys Arg Arg Lys Ala Leu
100 105 110
<210> 78
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 78
Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly Thr Leu
1 5 10 15
Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala Ala
20 25 30
Cys Ala Ser Ala Arg Ile Asn Val
35 40
<210> 79
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 79
Lys Leu Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly
1 5 10 15
Thr Leu Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro
20 25 30
Ala Ala Cys Ala Ser Ala Arg Ile Asn Val
35 40

Claims (14)

1.一种可激活的sgRNA,其在所述sgRNA的非必需区域中带有失活序列,其中所述失活序列侧接一对Cas9核酸内切酶识别位点,其中所述可激活的sgRNA由SEQ ID NO:14的核酸分子编码,并且其中所述失活序列是由SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的核酸分子编码的顺式作用核酶。
2.根据权利要求1所述的可激活的sgRNA,其中所述可激活的sgRNA结合靶核酸分子的转录链。
3.一种多核苷酸,其编码根据权利要求1或2所述的可激活的sgRNA。
4.一种载体,其包含根据权利要求3所述的多核苷酸。
5.一种CRISPR/Cas系统,其包含Cas核酸内切酶和同源sgRNA,其中所述同源sgRNA是根据权利要求1或2所述的可激活的sgRNA。
6.根据权利要求5所述的CRISPR/Cas系统,其中所述Cas核酸内切酶是Cas9核酸内切酶。
7.一种在细胞中编辑或调节基因组转录的方法,所述方法包括向所述细胞中引入至少一种Cas核酸内切酶和靶向所述基因组的核酸序列的至少一个同源sgRNA,其中所述同源sgRNA是根据权利要求1或2所述的可激活的sgRNA,
从而编辑或调节所述细胞的基因组的转录,
其中所述方法不是疾病的诊断或治疗方法。
8.根据权利要求7所述的方法,其中所述Cas核酸内切酶是Cas9核酸内切酶。
9.根据权利要求7所述的方法,其中通过一种或多种调节型启动子来控制所述Cas核酸内切酶、可激活的sgRNA或Cas核酸内切酶和可激活的sgRNA的表达。
10.根据权利要求7所述的方法,其中将靶向所述基因组中的两个或更多个序列的至少两个同源sgRNA引入所述细胞中。
11.根据权利要求10所述的方法,其中所述至少两个同源sgRNA是可激活的sgRNA,其被顺序激活以在所述基因组中引入两个或更多个编辑。
12.根据权利要求10所述的方法,其中所述至少两个同源sgRNA是可激活的sgRNA,其被顺序激活并且包含:
(i)靶向编码第二可激活的sgRNA的核酸的第一可激活的sgRNA,和
(ii)靶向所述基因组中的启动子的所述第二可激活的sgRNA。
13.根据权利要求7所述的方法,其中将所述至少一个同源sgRNA插入编码基因的5'非翻译区或3'非翻译区的核酸中。
14.一种核酸,其包含编码序列、5'非翻译区和3'非翻译区,其中所述核酸在所述5'非翻译区或3'非翻译区中插入有根据权利要求1或2所述的可激活的sgRNA。
CN201880062677.4A 2017-09-26 2018-09-21 用于基因组编辑和调节转录的crispr/cas系统和方法 Active CN111373041B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762563128P 2017-09-26 2017-09-26
US201762563133P 2017-09-26 2017-09-26
US201762563131P 2017-09-26 2017-09-26
US62/563,133 2017-09-26
US62/563,131 2017-09-26
US62/563,128 2017-09-26
PCT/US2018/052211 WO2019067322A1 (en) 2017-09-26 2018-09-21 CRISPR / CAS SYSTEM AND METHOD FOR GENOME EDITING AND TRANSCRIPTION MODULATION

Publications (2)

Publication Number Publication Date
CN111373041A CN111373041A (zh) 2020-07-03
CN111373041B true CN111373041B (zh) 2024-10-11

Family

ID=65903137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880062677.4A Active CN111373041B (zh) 2017-09-26 2018-09-21 用于基因组编辑和调节转录的crispr/cas系统和方法

Country Status (6)

Country Link
US (2) US11788088B2 (zh)
EP (1) EP3688159A4 (zh)
CN (1) CN111373041B (zh)
AU (1) AU2018341985A1 (zh)
CA (1) CA3111479A1 (zh)
WO (1) WO2019067322A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3565907B1 (en) 2017-01-06 2022-05-04 Editas Medicine, Inc. Methods of assessing nuclease cleavage
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
MX2019014640A (es) 2017-06-09 2020-10-05 Editas Medicine Inc Nucleasas de repeticiones palíndromicas agrupadas y regularmente interespaciadas de proteina asociada 9 (cas9) genomanipuladas.
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
BR112021020608A8 (pt) 2019-04-15 2023-03-21 Univ Beijing Rna recrutador de desaminase, construção, método para editar um rna alvo em uma célula hospedeira, e, construção, composição, célula, biblioteca ou kit
EP3997229A4 (en) * 2019-07-12 2024-07-03 Univ Beijing TARGETED RNA EDITING BY HARNESSING ENDOGENOUS ADAR USING MODIFIED RNA
US20220290132A1 (en) * 2019-08-06 2022-09-15 The Penn State Research Foundation Engineered CRISPR/Cas9 Systems for Simultaneous Long-term Regulation of Multiple Targets
JP2022554347A (ja) * 2019-11-06 2022-12-28 ローカス バイオサイエンシーズ,インク. Crispr casシステムを含むファージ組成物および溶原性モジュール
CN113403208A (zh) * 2021-06-15 2021-09-17 江西科技师范大学 高效鉴定米曲霉CRISPR/Cas9突变体的方法
CN113667017A (zh) * 2021-07-28 2021-11-19 上海南方模式生物科技股份有限公司 一种可提高CRISPR/Cas9系统同源重组效率的方法和应用
CN114438055B (zh) * 2021-10-26 2022-08-26 山东舜丰生物科技有限公司 新型的crispr酶和系统以及应用
CN114686456B (zh) * 2022-05-10 2023-02-17 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN117402855B (zh) * 2023-12-14 2024-03-19 中国农业科学院植物保护研究所 一种Cas蛋白、基因编辑系统及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017024047A1 (en) * 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
WO2017158153A1 (en) * 2016-03-17 2017-09-21 Imba - Institut Für Molekulare Biotechnologie Gmbh Conditional crispr sgrna expression

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050257277A1 (en) * 2004-05-17 2005-11-17 Xiaobin Lu Regulation of transcription with a cis-acting ribozyme
WO2012024625A2 (en) * 2010-08-20 2012-02-23 Sena Research, Incorporated Novel synthesis of nucleoside 5'-triphosphates and their derivatives
EP2931899A1 (en) * 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
KR102523466B1 (ko) * 2013-11-07 2023-04-20 에디타스 메디신, 인코포레이티드 지배적인 gRNA를 이용하는 CRISPR-관련 방법 및 조성물
WO2015071474A2 (en) 2013-11-18 2015-05-21 Crispr Therapeutics Ag Crispr-cas system materials and methods
JP2017509350A (ja) * 2014-04-03 2017-04-06 マサチューセッツ インスティテュート オブ テクノロジー ガイドrnaの生成のための方法および組成物
WO2015168404A1 (en) * 2014-04-30 2015-11-05 Massachusetts Institute Of Technology Toehold-gated guide rna for programmable cas9 circuitry with rna input
CN104531632A (zh) 2014-11-18 2015-04-22 李云英 快速降解的Cas9-ODC422-461融合蛋白及其应用
AU2015369725A1 (en) 2014-12-24 2017-06-29 Massachusetts Institute Of Technology CRISPR having or associated with destabilization domains
KR20230110368A (ko) * 2015-06-01 2023-07-21 템플 유니버시티-오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 Hiv 감염의 rna-가이드된 치료를 위한 방법 및 조성물
EP3303634B1 (en) * 2015-06-03 2023-08-30 The Regents of The University of California Cas9 variants and methods of use thereof
CN107949400A (zh) 2015-06-24 2018-04-20 西格马-奥尔德里奇有限责任公司 细胞周期依赖性基因组调控和修饰
US20170166875A1 (en) * 2015-12-14 2017-06-15 University Of Washington Methods relating to nucleic acid sequence editing
WO2017106616A1 (en) * 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
CN105647885B (zh) 2016-01-20 2017-08-18 广州元曦生物科技有限公司 Cas9融合蛋白及其编码序列
WO2017160752A1 (en) 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
EP3445852A1 (en) * 2016-04-18 2019-02-27 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
US20190233806A1 (en) * 2016-06-23 2019-08-01 President And Fellows Of Harvard College Conditional activation of nucleic acid-guided endonucleases
CN109844116A (zh) * 2016-07-05 2019-06-04 约翰霍普金斯大学 包括使用h1启动子对crispr指导rna的改进的组合物和方法
US20190352634A1 (en) * 2017-01-11 2019-11-21 Oxford University Innovation Limited Crispr rna
WO2018231730A2 (en) * 2017-06-12 2018-12-20 California Institute Of Technology Conditional guide rnas

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017024047A1 (en) * 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
WO2017158153A1 (en) * 2016-03-17 2017-09-21 Imba - Institut Für Molekulare Biotechnologie Gmbh Conditional crispr sgrna expression

Also Published As

Publication number Publication date
CA3111479A1 (en) 2019-04-04
EP3688159A1 (en) 2020-08-05
CN111373041A (zh) 2020-07-03
US11788088B2 (en) 2023-10-17
US20240247262A1 (en) 2024-07-25
US20200308581A1 (en) 2020-10-01
AU2018341985A1 (en) 2020-04-23
EP3688159A4 (en) 2021-10-20
WO2019067322A1 (en) 2019-04-04

Similar Documents

Publication Publication Date Title
CN111373041B (zh) 用于基因组编辑和调节转录的crispr/cas系统和方法
JP7083364B2 (ja) 配列操作のための最適化されたCRISPR-Cas二重ニッカーゼ系、方法および組成物
JP6896786B2 (ja) 配列操作のためのCRISPR−Cas成分系、方法および組成物
AU2017225060B2 (en) Methods and compositions for RNA-directed target DNA modification and for RNA-directed modulation of transcription
JP6870015B2 (ja) 遺伝子産物の発現を変更するためのCRISPR−Cas系および方法
JP2024123232A (ja) 変更PAM特異性を有する遺伝子操作CRISPR-Cas9ヌクレアーゼ
KR102613296B1 (ko) 신규한 crispr 효소 및 시스템
CA2913869C (en) New compact scaffold of cas9 in the type ii crispr system
KR102210322B1 (ko) Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도
JP6625971B2 (ja) 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化
JP2022512982A (ja) 新規なCRISPR/Cas12f酵素およびシステム
CA3111432A1 (en) Novel crispr enzymes and systems
CA2989830A1 (en) Crispr enzyme mutations reducing off-target effects
EP3464587B1 (en) Compositions and methods for enhancing homologous recombination
JP7138712B2 (ja) ゲノム編集のためのシステム及び方法
KR20220054434A (ko) 신규한 crispr dna 표적화 효소 및 시스템
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
AU2021254373A1 (en) Genome engineering method and genome engineering kit
JP7585373B2 (ja) 変更PAM特異性を有する遺伝子操作CRISPR-Cas9ヌクレアーゼ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant