本申请要求于2019年4月15日提交的国际申请号为PCT/CN2019/082713的国际申请,和于2019年12月30日提交的国际申请号为PCT/CN2019/129952的国际申请的优先权。
前述申请,及其中或在其审查期间引用的所有文件(“申请引用的文件”)和申请引用的文件中引用的或提及的所有文件,以及本文中引用的或提及的所有文件(“本文引用的文件”),以及本文引用的文件中引用的或提及的所有文件,连同本文中或通过提及并入本文的任何文件中提及的任何产品的任何制造商的说明、描述、产品规格和产品表,在此通过提及并入本文,并且可以在本发明的实践中使用。更具体地,所有参考文献以相同的程度通过提及并入,就好像每个单独的文件被具体地和单独地指示通过提及并入一样。
以下以ASCII文本文件提交的内容在此通过提及以其整体并入:序列表的计算机可读形式(CRF)(文件名:FD0020PCT-sequence listing.TXT,记录日期:2020年4月13日,大小:133KB)。
示例性实施方案
在本文提供的实施方案中是:
1.一种用于在宿主细胞中编辑靶标RNA的方法,包括将脱氨酶招募RNA(dRNA)或编码所述dRNA的构建体引入宿主细胞,其中所述dRNA包含与所述靶标RNA杂交的互补RNA序列,并且其中所述脱氨酶招募RNA能够招募作用于RNA的腺苷脱氨酶(ADAR)以使所述靶标RNA中的靶标腺苷脱氨基。
2.如实施方案1所述的方法,其中所述RNA序列包含与所述靶标RNA中的所述靶腺苷直接相对的胞苷,腺苷或尿苷。
3.如实施方案2所述的方法,其中所述RNA序列包含与所述靶标RNA中的所述靶腺苷直接相对的胞苷错配。
4.如实施方案3所述的方法,其中所述胞苷错配位于所述dRNA中距所述互补序列的3'端至少20个核苷酸,并且距所述互补序列的5'端至少5个核苷酸。
5.如实施方案4所述的方法,其中所述胞苷错配位于距所述dRNA中所述互补序列中心(例如,在中心)的10个核苷酸内。
6.如实施方案1-5中任一项所述的方法,其中所述RNA序列进一步包含一个或多个鸟苷,其各自与所述靶标RNA中的非靶腺苷相对。
7.如实施方案1-6中任一项所述的方法,其中所述互补序列包含与所述靶标RNA中的非靶腺苷相对的两个或更多个连续错配核苷酸。
8.如实施方案1-7中任一项所述的方法,其中所述靶标RNA中所述靶标腺苷的5'最近邻位是选自U,C,A和G的核苷酸,优先度U>C≈A>G,而所述靶标RNA中所述靶标腺苷的3'最近邻位是选自G,C,A和U的核苷酸,优先度G>C>A≈U。
9.如实施方案1至8中任一项所述的方法,其中所述靶标RNA中,所述靶标腺苷位于选自下组的三碱基基序中:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。
10.如实施方案9所述的方法,其中所述三碱基基序是UAG,并且其中所述脱氨酶招募RNA包含与所述三碱基基序中的尿苷直接相对的A,与所述靶标腺苷直接相对的胞苷,以及与所述三碱基基序中的鸟苷直接相对胞苷,鸟苷或尿苷。
11.如实施方案1-10中任一项所述的方法,其中所述脱氨酶招募RNA的长度为约40-260个核苷酸。
12.如实施方案11所述的方法,其中所述脱氨酶招募RNA的长度为约60-230个核苷酸。
13.如实施方案11或12所述的方法,其中所述dRNA的长度大于约60个核苷酸。
14.如实施方案11-13中任一项所述的方法,其中所述dRNA的长度为约100至约150(例如,约110-150)个核苷酸。
15.如实施方案1-14中任一项所述的方法,其中所述靶标RNA是选自下组的RNA:前信使RNA,信使RNA,核糖体RNA,转移RNA,长非编码RNA和小RNA。
16.如实施方案15所述的方法,其中所述靶标RNA是前信使RNA。
17.如实施方案1-16中任一项所述的方法,其中所述ADAR由所述宿主细胞内源表达。
18.如实施方案1-16中任一项所述的方法,其中所述ADAR对于所述宿主细胞是外源的。
19.如实施方案18所述的方法,其进一步包括将所述ADAR引入所述宿主细胞。
20.如实施方案18或19所述的方法,其中所述ADAR包含E1008突变。
21.如实施方案1-20中任一项所述的方法,其中所述脱氨酶招募RNA是单链RNA。
22.如实施方案1-20中任一项所述的方法,其中所述互补RNA序列是单链的,并且其中所述脱氨酶招募RNA还包含一个或多个双链区。
23.如实施方案1-22中任一项所述的方法,其中所述dRNA不包含ADAR-招募结构域(例如,DSB结合结构域,GluR2结构域或MS2结构域)。
24.如实施方案1-23中任一项所述的方法,其中所述dRNA不包含化学修饰的核苷酸(例如,2’-O-甲基化或硫代磷酸酯化)。
25.如实施方案26所述的方法,其中所述靶标RNA中的靶标腺苷的脱氨基作用导致所述靶标RNA编码的蛋白质的点突变、截短、延伸和/或错误折叠;或者凭借所述靶标RNA中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复导致有功能的、全长的、正确折叠的和/或野生型的蛋白。
26.如实施方案1-27中任一项所述的方法,其中所述宿主细胞是真核细胞。
27.如实施方案28所述的方法,其中所述宿主细胞是哺乳动物细胞。
28.如实施方案29所述的方法,其中所述宿主细胞是人或小鼠细胞。
29.如实施方案29或30所述的方法,其中所述ADAR是ADAR1和/或ADAR2。
30.如实施方案1-31中任一项所述的方法,其中所述宿主细胞是原代细胞。
31.如实施方案32所述的方法,其中所述宿主细胞是T细胞。
32.如实施方案32所述的方法,其中所述宿主细胞是有丝分裂后细胞。
33.如实施方案1-34中任一项所述的方法,其进一步包括将ADAR3的抑制剂引入所述宿主细胞。
34.如实施方案1-35中任一项所述的方法,其进一步包括将干扰素的刺激剂引入所述宿主细胞。
35.如实施方案1-36中任一项所述的方法,包括引入各自靶向不同靶标RNA的多个dRNA。
36.如实施方案1-37中任一项所述的方法,其中所述编辑靶标RNA的效率为至少约30%(例如,至少约为30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%或更高)。
37.如实施方案1-38中任一项所述的方法,其中所述dRNA不诱导免疫应答。
38.凭借如实施方案1-39中任一项所述的方法产生的经编辑的RNA或具有经编辑的RNA的宿主细胞。
39.一种用于治疗或预防个体的疾病或病况的方法,其包括根据实施方案1-39中任一项的方法编辑与个体细胞中的疾病或病况相关的靶标RNA。
40.如实施方案41所述的方法,其中所述疾病或病况是遗传性基因疾病或与一种或多种获得性基因突变相关的疾病或病况。
41.如实施方案41或42所述的方法,其中所述靶标RNA具有G至A突变。
42.如实施方案41-43中任一项所述的方法,其中所述疾病或病况是单基因疾病或病况。
43.如实施方案41-44中任一项所述的方法,其中所述疾病或病况是多基因疾病或病况。
44.如实施方案41-45中任一项所述的方法,其中:
(i)所述靶标RNA是TP53,并且所述疾病或病况是癌症;
(ii)所述靶标RNA是IDUA,并且所述疾病或病况是I型粘多糖贮积病(MPS I);
(iii)所述靶标RNA是COL3A1,并且所述疾病或病况是埃勒斯-当洛斯综合征;
(iv)所述靶标RNA是BMPR2,并且所述疾病或病况是朱伯特综合征;
(v)所述靶标RNA是FANCC,并且所述疾病或病况是范科尼贫血;
(vi)所述靶标RNA是MYBPC3,并且所述疾病或病况是原发性家族性肥厚性心肌病;或
(vii)所述靶标RNA是IL2RG,并且所述疾病或病况是X染色体连锁性严重联合免疫缺陷。
45.一种通过招募作用于RNA的腺苷脱氨酶(ADAR)使靶标RNA中的靶标腺苷脱氨基作用的脱氨酶招募RNA(dRNA),其包含与所述靶标RNA杂交的互补RNA序列。
46.如实施方案47所述的脱氨酶招募RNA,其中所述RNA序列包含与所述靶标RNA中的所述靶标腺苷直接相对的胞苷,腺苷或U。
47.如实施方案48所述的dRNA,其中所述RNA序列包含与所述靶标RNA中的靶标腺苷直接相对的胞苷错配。
48.如实施方案49所述的dRNA,其中所述胞苷错配位于所述dRNA中距所述互补序列的3'端至少20个核苷酸,和距所述互补序列的5'端至少5个核苷酸。
49.如实施方案50所述的dRNA,其中所述胞苷错配位于距所述dRNA中互补序列中心(例如,在中心)的10个核苷酸内。
50.如实施方案47-51中任一项所述的脱氨酶招募RNA,其中所述RNA序列进一步包含一个或多个鸟苷,其各自与所述靶标RNA中的非靶标腺苷直接相对。
51.如实施方案47-51中任一项所述的dRNA,其中所述互补序列包含与所述靶标RNA中的非靶标腺苷相对的两个或更多个连续错配核苷酸。
52.如实施方案47-53中任一项所述的脱氨酶招募RNA,其中所述靶标RNA中的所述靶标腺苷位于选自下组的三碱基基序中:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。
53.如实施方案54所述的脱氨酶招募RNA,其中所述三碱基基序是UAG,并且其中所述dRNA包含与所述三碱基基序中的尿苷直接相对的腺苷,与所述靶标腺苷直接相对的胞嘧啶,以及与所述三碱基基序中的鸟苷直接相对的胞苷、鸟苷或尿苷。
54.如实施方案55所述的脱氨酶招募RNA,其中所述三碱基基序是所述靶标RNA中的UAG,并且其中所述脱氨酶招募RNA包括与所述靶标RNA的UAG相对的ACC,ACG或ACU。
55.如实施方案47-56中任一项所述的脱氨酶招募RNA,其中脱氨酶招募RNA的长度为约40-260个核苷酸。
56.如实施方案57所述的dRNA,其中所述dRNA的长度为约70个核苷酸。
57.如实施方案57或58所述的dRNA,其中所述dRNA的长度为约100至约150个核苷酸(例如,约110-150个)。
58.如实施方案47-59中任一项所述的dRNA,其中所述dRNA不包含ADAR招募结构域(例如,DSB结合结构域,GluR2结构域或MS2结构域)。
59.如实施方案47-60中任一项所述的dRNA,其中所述dRNA不包含化学修饰的核苷酸(例如,2'-O-甲基化或硫代磷酸酯化)。
60.一种编码实施方案47-61中任一项所述的脱氨酶招募RNA的构建体。
61.如实施方案62所述的构建体,其中所述构建体是病毒载体(例如,慢病毒载体)或质粒。
62.一种文库,其包含实施方案47-61中任一项所述的多个脱氨酶招募RNA或实施方案62或63所述的构建体。
63.一种组合物,其包含实施方案47-61中任一项所述的脱氨酶招募RNA,实施方案62或63所述的构建体,或实施方案64所述的文库。
64.一种宿主细胞,其包含实施方案47-61中任一项所述的脱氨酶招募RNA或实施方案62或63所述的构建体。
65.如实施方案66所述的宿主细胞,其中所述宿主细胞是真核细胞。
66.如实施方案66或67所述的宿主细胞,其中所述宿主细胞是原代细胞。
67.一种用于在宿主细胞中编辑靶标RNA的试剂盒,其包含脱氨酶招募RNA,其中所述脱氨酶招募RNA包含与所述靶标RNA杂交的互补RNA序列,其中所述脱氨酶招募RNA能够招募ADAR以使所述靶标RNA中的靶标腺苷脱氨基。
68.60-200个核苷酸的脱氨酶招募RNA(dRNA),其中:
1)所述dRNA包含能够与靶标RNA杂交的互补RNA序列;
2)所述dRNA能够招募脱氨酶或包含脱氨酶的构建体或包含脱氨酶催化结构域的构建体以使所述靶标RNA中的靶标腺苷脱氨基。
3)所述dRNA包含一种或多种化学修饰。
69.如实施方案68所述的dRNA,其中所述dRNA长于约60nt,65nt,70nt,80nt,90nt,100nt或110nt中的任何一个。
70.如实施方案1或实施方案69所述的dRNA,其包含与互补靶标RNA区域的一个或多个错配,摆动配对(Wobble)和/或单侧突起(Bulge)。
71.如实施方案68-70中任一项所述的dRNA,其中所述互补RNA序列包含与靶标RNA中的靶标腺苷直接相对的胞苷,腺苷或尿苷。
72.如实施方案71所述的dRNA,其中与所述靶标腺苷直接相对的所述胞苷,腺苷或尿苷位于距3'端至少约7个核苷酸,例如距3'端至少约8、9、10或更多个核苷酸,或距3'端约7-25nt。
73.如实施方案71-72中任一项所述的dRNA,其中与所述靶标腺苷直接相对的所述胞苷,腺苷或尿苷位于距5'端至少约25个核苷酸,例如距5'端至少约30、35、40、45、50或55个核苷酸,或距5'端约45-55nt。
74.如实施方案71-73中任一项所述的dRNA,其中与所述靶标腺苷直接相对的所述胞苷,腺苷或尿苷侧翼的5'和3'序列的长度不相等。
75.如实施方案71-74中任一项所述的dRNA,其中与所述靶标腺苷直接相对的所述胞苷,腺苷或尿苷侧翼的5'序列的长度长于3'序列。
76.如实施方案68-75中任一项所述的dRNA,其包含与所述靶标RNA中的所述靶标腺苷直接相对的胞苷。
77.如实施方案68-76中任一项所述的dRNA,其中所述互补RNA序列包含一个或多个鸟苷,各自与所述靶标RNA中的非靶标腺苷相对。
78.如实施方案68-77中任一项所述的dRNA,其中所述互补序列包含与所述靶标RNA中的非靶标腺苷相对的两个或更多个连续错配的核苷酸。
79.如实施方案68-78中任一项所述的dRNA,其中靶标RNA中的所述靶标腺苷的5'最近邻位是选自U,C,A和G的核苷酸,优选U>C≈A>G,且所述靶标RNA中的所述靶标腺苷的3'最近邻位是选自G,C,A和U的核苷酸,优选G>C>A≈U。
80.如实施方案68-79中任一项所述的dRNA,其中所述靶标腺苷是位于靶标RNA中的一个三碱基基序,所述三碱基基序选自下组:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。
81.如实施方案80所述的dRNA,其中所述三碱基基序是UAG,并且其中所述dRNA包含与所述三碱基基序中的尿苷直接相对的A,与所述靶标腺苷直接相对的胞苷,以及与所述三碱基基序中的鸟苷直接相对的胞苷、鸟苷或尿苷。
82.如实施方案81所述的dRNA,其包含与UAG的三碱基基序直接相对的5'-CCA-3'。
83.如实施方案68-82中任一项所述的dRNA,其中所述化学修饰是甲基化和/或硫代磷酸酯化,例如2'-O-甲基化和/或核苷酸间硫代磷酸酯连接。
84.如实施方案83所述的dRNA,其中所述化学修饰包括在首尾各1-5、2-5、3-5或4-5个核苷酸的2'-O-甲基化和/或在首尾各1-5、2-5、3-5或4-5个核苷酸间连接的硫代磷酸酯化。
85.如实施方案83或实施方案84所述的dRNA,其中所述化学修饰包括在与所述靶标腺苷相对的核苷酸和/或其5'和/或3'最邻近的核苷酸的2'-O-甲基化和/或3'-硫代磷酸酯化。
86.如实施方案1-85中任一项所述的dRNA,所述化学修饰选自下组:
1)首尾各3个核苷酸的2'-O-甲基化和/或首尾各3个核苷酸间连接的硫代磷酸酯化;
2)首尾各3个核苷酸的2'-O-甲基化,首尾各3个核苷酸间连接的硫代磷酸酯化,单个或多个尿苷(例如,所有尿苷)的2'-O-甲基化;
3)首尾各3个核苷酸的2'-O-甲基化,首尾各3个核苷酸间连接的硫代磷酸酯化,单个或多个或所有尿苷的2'-O-甲基化,以及与所述靶标腺苷相对的所述核苷酸和/或其5'和/或3'最邻近的核苷酸的修饰;
4)首尾各3个核苷酸的2'-O-甲基化,首尾各3个核苷酸间连接的硫代磷酸酯化,所有尿苷的2'-O-甲基化,和与所述靶标腺苷相对的所述核苷酸的3'端和/或5'端最邻近的核苷酸的2'-O-甲基化;
5)首尾各3个核苷酸的2'-O-甲基化,首尾各3个核苷酸间连接的硫代磷酸酯化,所有尿苷的2'-O-甲基化,以及与所述靶标腺苷相对的所述核苷酸和/或其5'和/或3'最邻近的核苷酸的3'硫代磷酸酯化;和
6)首尾各5个核苷酸的2'-O-甲基化和首尾各5个核苷酸间连接的硫代磷酸酯化。
87.如实施方案86所述的dRNA,其中与所述靶标腺苷相对的所述核苷酸和/或与所述靶标腺苷相对的所述核苷酸最邻近的一个或两个核苷酸的修饰是2'-O-甲基化或硫代磷酸酯化连接,例如3'-硫代磷酸酯化连接。
88.如实施方案68-87中任一项所述的dRNA,其不包含能够形成用于结合ADAR酶的分子内茎环结构的ADAR招募结构域。
89.一种构建体,其包含或编码如68-88中任一项所述的dRNA。
90.一种用于在宿主细胞中编辑靶标RNA的方法,其包括将如实施方案68-89中任一项所述的dRNA通过感染,电转染,脂质转染,胞吞作用,脂质体或脂质纳米颗粒递送等引入宿主细胞,所述宿主细胞包括但不限于真核细胞,原代细胞,T细胞,哺乳动物细胞,人类细胞,鼠科细胞等。
91.如实施方案90所述的方法,其进一步包括将ADAR3的抑制剂引入所述宿主细胞。
92.如实施方案90或实施方案91所述的方法,其进一步包括将干扰素的刺激物引入所述宿主细胞。
93.如实施方案90-92中任一项所述的方法,其包括引入各自靶向不同靶标RNA的多个dRNA。
94.如实施方案90-93中任一项所述的方法,其中所述dRNA不诱导免疫应答。
95.如实施方案90-94中任一项所述的方法,其还包括将外源ADAR引入所述宿主细胞。
96.如实施方案95所述的方法,其中所述ADAR是包含E1008突变的ADAR1。
97.包含如实施方案68-89中任一项所述dRNA的组合物,细胞,文库或试剂盒。
实施例
下面的实施例旨在纯粹作为本申请的示例,因此不应以任何方式被认为限制本发明。通过示例说明而非限制的方式提供以下实施例和详细描述。
材料和方法
质粒构建
通过PCR扩增编码mCherry和EGFP(EGFP第一密码子ATG缺失)的DNA来克隆双荧光报道分子,在PCR期间经由引物添加3×GS接头和靶向DNA序列。然后通过II型限制酶BsmB1(Thermo)和T4 DNA连接酶(NEB)切割和连接PCR产物,然后将其插入pLenti骨架中(pLenti-CMV-MCS-SV-Bsd,Stanley Cohen Lab,Stanford University)。
从Lbu质粒(Addgene#83485)PCR扩增dLbuCas13 DNA。ADAR1DD和ADAR2DD从ADAR1(p150)cDNA和ADAR2 cDNA中扩增,这两种cDNA都来自厦门大学的Han的实验室的赠予。通过重叠PCR将ADAR1DD或ADAR2DD与dLbuCas13DNA融合,并将融合的PCR产物插入pLenti骨架中。
为了在哺乳动物细胞中表达dRNA,直接合成dRNA序列(针对短dRNA)并通过合成重叠的ssDNA进行退火或PCR扩增,并通过Golden-gate克隆将产物克隆到U6表达下的相应载体中。
从ADAR1(p150)cDNA中PCR扩增全长ADAR1(p110)和ADAR1(p150),并从ADAR2 cDNA中PCR扩增全长ADAR2,然后将其分别克隆到pLenti骨架中。
对于三种版本的双荧光报道分子(报道分子-1,-2和-3),mCherry和EGFP(EGFP的起始密码子ATG是缺失的)编码序列进行PCR扩增,使用BsmBI(Thermo Fisher Scientific,ER0452)消化,然后用T4 DNA连接酶(NEB,M0202L)介导的与GGGGS接头的连接。随后将连接产物插入pLenti-CMV-MCS-PURO骨架。
对于表达dLbuCas13-ADAR DD(E1008Q)的构建体,从ADAR1p150构建体(来自厦门大学韩家淮(Jiahuai Han)的实验室的赠予)扩增了ADAR1DD基因。通过PCR从Lbu_C2c2_R472A_H477A_R1048A_H1053A质粒(Addgene#83485)扩增了dLbuCas13基因。通过重叠PCR生成ADAR1DD(高活性E1008Q变体),然后融合至dLbuCas13。将连接产物插入pLenti-CMV-MCS-BSD骨架。
对于表达arRNA的构建体,合成arRNA的序列并且金门(golden-gate)克隆到pLenti-sgRNA-lib 2.0(Addgene#89638)骨架中,并且由hU6启动子驱动arRNA的转录。对于表达ADAR的构建体,从ADAR1p150构建体中扩增出全长ADAR1p110和ADAR1p150,并从ADAR2构建体中PCR扩增出全长ADAR2(来自厦门大学韩家淮的实验室的赠予)。然后将扩增的产物克隆到pLenti-CMV-MCS-BSD骨架中。
对于表达具有致病性突变的基因的构建体,TP53的全长编码序列(从Vigenebio订购)和其他6种与疾病相关的基因(COL3A1,BMPR2,AHI1,FANCC,MYBPC3和IL2RG,来自中国医学科学院病原生物学研究所的王建伟(Jianwei Wang)的实验室的赠予)通过诱变PCR从编码具有引入G>A突变的相应基因的构建体中扩增出。通过Gibson克隆方法59将扩增的产物克隆到pLenti-CMV-MCS-mCherry骨架中。
哺乳动物细胞系和细胞培养
哺乳动物细胞系在37℃、在5%CO2下,在达尔伯克改良伊格尔培养基(Dulbecco'sModified Eagle Medium,10-013-CV,Corning,Tewksbury,MA,USA)中培养,所述培养基加入10%胎牛血清(兰州百灵生物技术有限公司,兰州,中国,Lanzhou BailingBiotechnology Co.,Ltd.,Lanzhou,China),补充有1%青霉素-链霉素。所述ADAR1-KO细胞系购自EdiGene China,基因分型结果也由EdiGene China提供。
HeLa和B16细胞系来自Z.Jiang的实验室(北京大学)。并且,HEK293T细胞系来自C.Zhang的实验室(北京大学)。RD细胞系来自J Wang的实验室(北京协和医学院和中国医学科学院,病原生物学研究所)。SF268细胞系来自中国医学科学院,基础医学研究所,细胞中心。A549和SW13细胞系来自EdiGene Inc.HepG2,HT29,NIH3T3和MEF细胞系在我们北京大学的实验室中维护。将这些哺乳动物细胞系在37℃于5%CO2下,在含10%胎牛血清(CellMax,SA201.02)的达尔伯克改良伊格尔培养基(Corning,10-013-CV)中培养,所述培养基,另外补充有1%青霉素-链霉素。除非另有说明,否则按照制造商的说明用X-tremeGENE HP DNA转染试剂(Roche,06366546001)转染细胞。
人原代肺成纤维细胞(#3300)和人原代支气管上皮细胞(#3210)购自ScienCellResearch Laboratories,Inc.,并分别在成纤维细胞培养基(ScienCell,#2301)和支气管上皮细胞培养基(ScienCell,#3211)中培养。两种培养基均补充有15%的胎牛血清(BI)和1%的青霉素-链霉素。原代GM06214(Hurler综合征患者来源的成纤维细胞;IDUA基因的外显子9中1293位核苷酸处的TGG>TAG突变[Trp402Ter(W402X)]的纯合子)和GM01323(Scheie综合征患者来源的成纤维细胞;拥有相较于WT细胞0.3%的IDUA活性。症状比Hurler综合征轻很多。复合杂合子:内含子5中,即外显子6的-7位中的G>A转变(IVS5AS-7G>A),及在IDUA基因的外显子9中1293位核苷酸处的TGG>TAG[Trp402Ter(W402X)]。在本发明的实施例中作为阳性对照)细胞是从卡瑞尔医学研究所(Coriell Institute for Medical Research)订购的,并在含15%胎牛血清(BI)和1%青霉素-链霉素的达尔伯克改良伊格尔培养基(Corning,10-013-CV)中培养。将所有细胞在37℃在5%CO2下培养。
报道系统的转染,FACS分析和Sanger测序
对于双荧光报道编辑实验,将293T-WT细胞或293T-ADAR1-KO细胞接种在6孔板(6×105个细胞/孔)中,24小时后,根据供应商的方案,使用X-tremeGENE HP DNA转染试剂(06366546001;Roche,Mannheim,德国)共转染1.5μg报道分子质粒和1.5μgdRNA质粒。48至72小时后,收集细胞并进行FACS分析。为了进一步确认报道分子mRNA编辑,我们使用FACSAria流式细胞仪(BD Biosciences)分选来自用报道分子和dRNA质粒转染的293T-WT细胞的EGFP阳性细胞,然后进行总RNA分离(TIANGEN,DP430)。然后经由RT-PCR(TIANGEN,KR103-04)将RNA逆转录成cDNA,并用相应的引物对(23个PCR循环)PCR扩增靶向的基因座,并纯化PCR产物用于Sanger测序。
对于ADAR1(p110),ADAR1(p150)或ADAR2的回复和过表达实验,将293T-WT细胞或293T-ADAR1-KO细胞接种于12孔板(2.5×105个细胞/孔)中,24小时后,使用X-tremeGENEHP DNA转染试剂(06366546001,Roche,Mannheim,德国)共转染0.5μg的报道分子质粒,0.5μg的dRNA质粒和0.5μg的ADAR1/2质粒(pLenti骨架作为对照)。48至72小时后,收集细胞并进行FACS分析。
对于内源mRNA实验,将293T-WT细胞接种在6孔板(6×105个细胞/孔)中,当约70%汇合时,使用X-tremeGENE HP DNA转染试剂(06366546001,Roche,Mannheim,德国)转染3μg的dRNA质粒。72小时后,经由FACS收集细胞和分选GFP阳性或BFP阳性细胞(根据相应的荧光标记物)用于以下的RNA分离。
人原代T细胞的分离与培养
从健康人供体的白细胞分离产物中分离出原代人T细胞。简而言之,通过Ficoll离心(Dakewei,AS1114546)分离外周血单核细胞(PBMC),并使用EasySep人T细胞分离试剂盒(STEMCELL,17951)从PBMC通过磁阴性选择分离T细胞。分离后,将T细胞在X-vivo15培养基,10%FBS和IL2(1000U/ml)中培养,并用CD3/CD28DynaBeads(ThermoFisher,11131D)刺激2天。来自健康供体的白细胞分离产品获自AllCells LLC中国。所有健康供体均提供了知情同意。
Lenti病毒包装和报道分子细胞系构建
经由X-tremeGENE HP DNA转染试剂将表达质粒与两种病毒包装质粒pR8.74和pVSVG(Addgene)一起共转染到HEK293T-WT细胞中。72小时后,收集上清液病毒并储存在-80℃。用慢病毒感染HEK293T-WT细胞,72小时后,经由FACS分选mCherry阳性细胞并培养以通过有限稀释方法选择稳定表达具有低EGFP背景的双荧光报道系统的单克隆细胞系。
对于稳定的报道分子细胞系,将报道分子构建体(pLenti-CMV-MCS-PURO骨架)与两个病毒包装质粒pR8.74和pVSVG一起共转染到HEK293T细胞中。72小时后,收集上清液病毒并保存在-80℃。用慢病毒感染HEK293T细胞,然后经由FACS分选mCherry阳性细胞并培养以选择稳定表达无可检测EGFP背景的双荧光报道系统的单克隆细胞系。HEK293T ADAR1–/–和TP53–/–细胞系是根据以前报道的方法60生成的。将靶向ADAR1的sgRNA和含有CMV驱动的嘌呤霉素抗性基因的PCR扩增供体DNA共转染到HEK293T细胞中。然后在转染后7天用嘌呤霉素处理细胞。从嘌呤霉素抗性细胞中分离出单个克隆,然后通过测序和蛋白质印迹进行验证。
内源或外源表达的转录物的RNA编辑
为了评估在双荧光报道分子上的RNA编辑,将HEK293T细胞或HEK293TADAR1-/-细胞接种在6孔板中(6×105个细胞/孔)。24小时后,将细胞用1.5μg报道分子质粒和1.5μgarRNA质粒共转染。为了检查ADAR1p110,ADAR1p150或ADAR2蛋白表达的影响,通过EGFP阳性比率和深度测序来测定编辑效率。
将HEK293T ADAR1-/-细胞接种在12孔板中(2.5×105个细胞/孔)。24小时后,将细胞与0.5μg报道分子质粒,0.5μg arRNA质粒和0.5μg ADAR1/2质粒(pLenti骨架作为对照)共转染。通过EGFP阳性比率和深度测序测定编辑效率。
为了评估内源mRNA转录物上的RNA编辑,将HEK293T细胞接种在6孔板中(6×105个细胞/孔)。二十四小时后,将细胞用3μg arRNA质粒转染。通过深度测序测定编辑效率。
为了评估多个细胞系中的RNA编辑效率,将8-9×104(RD,SF268,HeLa)或1.5×105(HEK293T)个细胞接种在12孔板中。对于难以转染的细胞,例如HT29,A549,HepG2,SW13,NIH3T3,MEF和B16,将2-2.5×105个细胞接种在6孔板中。24小时后,将报道分子和arRNA质粒共转染到这些细胞中。通过EGFP阳性比率测定编辑效率。
为了评价EGFP阳性比率,在转染后48至72小时,通过荧光激活细胞分选(FACS)分析分选并收集细胞。mCherry信号用作报道分子/表达arRNA的细胞的荧光选择标记,计算EGFP+/mCherry+细胞的百分比作为编辑效率的读数。
为了NGS定量A至I编辑率,在转染后48至72小时,通过FACS测定分选和收集细胞,然后进行RNA分离(TIANGEN,DP420)。然后,经由RT-PCR(TIANGEN,KR103-04)将总RNA逆转录为cDNA,并使用如表1中列出的相应引物PCR扩增靶向的基因座。
表1.
将PCR产物纯化用于Sanger测序或NGS(Illumina HiSeq X Ten)。
深度测序
对于内源mRNA编辑实验,将293T-WT细胞接种在6孔板上(6×105个细胞/孔),当约70%汇合时,使用X-tremeGENE HP DNA转染试剂(Roche)以3μg的dRNA转染HEK293细胞。72小时后,经由FACS分选GFP阳性或BFP阳性细胞(根据相应的荧光标记),然后进行RNA分离。然后经由RT-PCR将分离的RNA逆转录成cDNA,并用相应的引物对扩增特异性靶向的基因座(23个PCR循环),并在Illumina NextSeq上测序。
在多个细胞系中进行测试
除了HEK293T(阳性对照)和HEK293T ADAR1-/-(阴性对照)细胞,选择一种小鼠细胞系(NIH3T3)以及源自不同组织和器官的七种人细胞系(RD,HeLa,SF268,A549,HepG2,HT-29,SW13)进行实验。对于具有较高转染效率的细胞系,将约8-9×104个细胞(RD,HeLa,SF268)或1.5×105个(HEK293T)铺板到12孔板的每个孔上,至于难以转染的那些(A549,HepG2,HT-29,SW13,NIH3T3),把2-2.5×105个细胞铺板在6孔板中。并且将所有这些细胞维持在37℃在达尔伯克改良伊格尔培养基(DMEM,Corning)中,该培养基补充有10%胎牛血清(FBS,CellMax)和5%CO2。24小时后,用X-tremeGENE HP DNA转染试剂(Roche)将CG2报道分子和71nt dRNA(35-C-35)质粒共转染到不同类型的细胞中。转染后48小时,用胰蛋白酶处理细胞并通过FACS(BD)来分析。因为具有低转染效率的细胞具有相当少的mCherry和BFP阳性细胞,对于那些铺在6孔板上的细胞,我们将用于FACS分析的总细胞数量增加至1×105个。
针对靶向的位点的RNA编辑分析
对于深度测序分析,使用arRNA覆盖序列的靶向的位点序列(上游和下游20-nt)产生索引。使用BWA版本0.7.10-r789对读段进行比对和定量。然后通过Samtools对比对BAM进行分选,并使用REDitools 1.0.4版分析RNA编辑位点。参数如下:-U[AG或TC]-t 8 -n 0.0-T 6-6 -e -d -u。通过费舍尔精确检验(Fisher’s exact test)(p值<0.05)计算出的arRNA靶向区域内所有显著的A>G转化(p值<0.05)都被arRNA视为编辑。除靶向的腺苷外的转化均为脱靶编辑。同时出现在对照组和实验组中的突变被认为是SNP。
转录组范围的RNA测序分析
将具有BFP表达盒的表达Ctrl RNA151或arRNA151-PPIB的质粒转染到HEK293T细胞中。转染后48小时,通过FACS富集BFP+细胞,并用RNAprep Pure Micro试剂盒(TIANGEN,DP420)纯化RNA。然后使用NEBNext聚(A)mRNA磁性分离模块(New England Biolabs,E7490)纯化mRNA,并用用于Illumina的NEBNext Ultra II RNA文库制备试剂盒(New EnglandBiolabs,E7770)处理,然后使用Illumina HiSeq X Ten平台(2×150-bp配对末端;每个样品30G)进行深度测序分析。为了排除转染引起的非特异性作用,我们把模拟组包括在内,其中仅用转染试剂处理细胞。每个组包含四个重复。
生物信息学分析流程参考了Vogel等人22的工作。使用FastQC进行分析的质量控制,质量修整基于Cutadapt(每个读段的前6-bp被修整,最高20-bp被质量修整)。使用AWK脚本过滤掉引入的arRNA。修整后,将长度小于90-nt的读段过滤掉。随后,通过STAR软件61将过滤的读段映射到参考基因组(GRCh38-hg38)。我们使用GATK Haplotypcaller62来调用变体。GATK生成的原始VCF文件已通过GATK VariantFiltration,bcftools和ANNOVAR63进行了过滤和注释。在dbSNP,1000Genome64的变体中,过滤出EVS。然后选择每组四个重复的共享变体作为RNA编辑位点。将模拟组的RNA编辑水平视为背景,通过减去模拟组的变体获得CtrlRNA151和arRNA151-PPIB的整体靶标。
为了评估LEAPER是否干扰自然的编辑稳态,我们分析了由模拟组和arRNA151-PPIB组(或Ctrl RNA151组)共享的全局编辑位点。使用Pearson相关系数分析评估了天生A-至-I编辑位点的差异RNA编辑率。计算了模拟组和arRNA151-PPIB组(或Ctrl RNA151组)之间编辑率的皮尔森相关性,并在图6中进行了注释。
X意指模拟组中每个位点的编辑率;Y意指Ctrl RNA151组(图6A)或arRNA151-PPIB组(图6B)中每个位点的编辑率;σx是X的标准偏差;σY是Y的标准偏差;μXi是X的平均值;μY是Y的平均值;E是期望值。
分析RNA-Seq数据以询问由RNA编辑事件诱导的可能的转录变化。使用HISAT2和STRINGTIE软件进行了转录组范围的基因表达的分析65。我们使用Cutadapt和FastQC进行测序数据的质量控制。然后使用HISAT2将测序读段映射到参考基因组(GRCh38-hg38),然后如上所述进行Pearson相关系数分析。
蛋白质印迹
我们分别使用了针对ADAR1(Santa Cruz,sc-271854),ADAR2(Santa Cruz,sc-390995),ADAR3(Santa Cruz,sc-73410),p53(Santa Cruz,sc-99),KRAS(Sigma,SAB1404011);GAPDH(Santa Cruz,sc-47724)和β-微管蛋白(CWBiotech,CW0098)的小鼠单克隆一抗。HRP偶联的山羊抗小鼠IgG(H+L,115-035-003)二抗购自JacksonImmunoResearch。分选2×106个细胞进行裂解,并上样等量的每种裂解物进行SDS-PAGE。然后,将样品蛋白质转移到PVDF膜(Bio-Rad实验室)上,并用针对ADAR酶(抗ADAR1,1:500;抗ADAR2,1:100;抗ADAR3,1:800)之一的一抗进行免疫印迹,然后进行二抗温育(1:10,000)和暴露。用剥离缓冲液(CWBiotech,CW0056)剥离ADAR蛋白后,在同一PVDF膜上重新探测β-微管蛋白。重复实验三遍。使用Image Lab软件进行半定量分析。
细胞因子表达测定
将HEK293T细胞接种在12孔板(2×105个细胞/孔)上。当约70%汇合时,将细胞用1.5μg的arRNA转染。作为阳性对照,转染了1μg的聚(I:C)(Invitrogen,tlrl-picw)。48小时后,收集细胞并进行RNA分离(TIANGEN,DP430)。然后,经由RT-PCR(TIANGEN,KR103-04)将总RNA逆转录成cDNA,并通过定量PCR(TAKARA,RR820A)测量IFN-β和IL-6的表达。引物的序列在表1中列出。
p53的转录调控活性测定
将表达TP53W53X cDNA的质粒和表达arRNA的质粒与p53-萤火虫-荧光素酶顺式报道质粒(YRGene,VXS0446)和海肾-荧光素酶质粒(来自北京大学Z.Jiang实验室的赠予)一起共转染到HEK293T TP53-/-细胞中用于检测p53的转录调控活性。48小时后,收获细胞并根据制造商的方案用Promega Dual-Glo荧光素酶测定系统(Promega,E4030)测定。简而言之,将150μL Dual-Glo荧光素酶试剂添加到收获的细胞离心沉淀中,并在30分钟后,通过Infinite M200读取器(TECAN)将100μL Dual-Glo荧光素酶试剂(细胞裂解)添加到96孔白板中,测量萤火虫的发光。30分钟后,依次向每个孔中添加100μL Dual-Glo终止剂和Glo试剂,以测量海肾发光,并计算萤火虫发光与海肾发光的比。
原代细胞中的电穿孔
对于在人原代肺成纤维细胞或人原代支气管上皮细胞中表达arRNA的质粒进行电穿孔,将20μg质粒用NucleofectorTM 2b装置(Lonza)和Basic NucleofectorTM试剂盒(Lonza,VPI-1002)电穿孔,并且电穿孔程序是U-023。对于在人原代T细胞中表达arRNA的质粒电穿孔,将20μg质粒通过NucleofectorTM 2b装置(Lonza)和人T细胞NucleofectorTM试剂盒(Lonza,VPA-1002)电穿孔到人原代T中,电穿孔程序是T-024。电穿孔后48小时,通过FACS测定分选和收集细胞,然后进行以下深度测序以用于靶向的RNA编辑测定。电穿孔效率根据荧光标记进行归一化。
为了在人原代T细胞或原代GM06214细胞中进行化学合成arRNA或对照RNA电穿孔,将RNA寡核苷酸于终浓度为2μM的100μL opti-MEM培养基(Gbico,31985070)中溶解。然后用上述电穿孔混合物重悬1×10E6个GM06214细胞或3×10E6个T细胞,并用Agile Pulse InVivo装置(BTX)在450V电穿孔1ms。然后将细胞转移到温暖的培养基中用于以下测定。
α-L-艾杜糖醛酸酶(IDUA)催化活性测定
将收获的细胞离心沉淀重悬并在冰上用在1×PBS缓冲液中的28μL 0.5%TritonX-100裂解30分钟。然后将25μL细胞裂解液加入25μL 190μM4-甲基伞形酮-α-L-艾杜糖醛酸酶底物(Cayman,2A-19543-500)中,将其溶解在0.4M含0.2%Triton X-100的甲酸钠缓冲液中,pH 3.5,并在黑暗中在37℃温育90分钟。加入200μL 0.5M NaOH/甘氨酸缓冲液,pH10.3,淬灭催化反应,然后在4℃离心2分钟。将上清液转移至96孔板,并使用Infinite M200读取器(TECAN)在365nm激发波长和450nm发射波长测量荧光。
实施例1.在报道分子上测试本发明的RNA编辑方法
据报道,Cas13家族蛋白(C2c2)可以编辑哺乳动物细胞中的RNA。我们在多种条件下进一步测试了该系统。首先,我们通过在mCherry和EGFP基因之间引入含有终止密码子的3×GS接头靶向序列,构建了基于mCherry和EGFP荧光的双荧光报道分子系统。此外,我们删除了EGFP的起始密码子ATG,以减少EGFP翻译的遗漏。
双荧光报道分子-1包含mCherry的序列(SEQ ID NO:1),含有3×GS接头和靶向的A(SEQ ID NO:2)的序列,以及eGFP的序列(SEQ ID NO:3)。
atggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaag(mCherry的序列)(SEQ ID NO:1)
(含有3×GS接头(以斜体且加粗的字符示出)以及靶向的A(以加大且加粗的A示出)的序列(SEQ ID NO:2)
gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa(eGFP的序列)(SEQ ID NO:3)
双荧光报道分子-2包含mCherry的序列(SEQ ID NO:1),含有3×GS接头(显示为斜体且加粗的字符)和靶向的A(显示为加大且加粗的A)的序列(SEQ ID NO:4),以及eGFP的序列(SEQ ID NO:3)。
(含有3×GS接头(显示为斜体且加粗的字符)和靶向的A(显示为加大且加粗的字符)的序列(SEQ ID NO:4)
双荧光报道分子-3包含mCherry的序列(SEQ ID NO:1),含有1×GS接头(显示为斜体且加粗的字符)和靶向的A(SEQ ID NO:5)的序列,以及eGFP的序列(SEQ ID NO:3)。
(含有1×GS接头(显示为斜体且加粗的字符)和靶向的A(显示为加大且加粗的A)的序列(SEQ ID NO:5)
我们将mCherry-3×GS接头-TAG-EGFP克隆到pLenti-骨架中,并将报道分子质粒包装入慢病毒中,感染293T细胞,其构建表达双荧光报道基因的稳定细胞系。然后,我们选择具有低EGFP荧光背景的单个克隆作为报道分子系统。我们将LbucC2c2 crRNA指导分子与横跨靶向腺苷的28到78个核苷酸长的间隔区平铺在一起,以测试最佳的crRNA设计。我们发现更长的crRNA向导赋予更高的EGFP阳性效率。引人注目的是,当我们转染靶向crRNA质粒而不共转染任何表达dC2c2-ADARDD的质粒时,EGFP蛋白大量表达。例如,带有下述序列的crRNA指导分子:ggaccaccccaaaaaugaauauaaccaaaacugaacagcuccucgcccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugccuccuccgcc(SEQ ID NO:6)被赋予了超过25%的EGFP阳性效率。这表明终止密码子UAG中的腺嘌呤在很大程度上被编辑。相反,随机crRNA不能使EGFP阴性细胞呈阳性(图6A,6B和6C)。基于这些结果,我们推断:单独过表达RNA转录物就可以利用内源ADAR酶来编辑RNA。
此外,我们删除了RNA指导分子上的支架RNA序列,创造了线性指导RNA。我们发现:70核苷酸长的、与带有A-C错配的靶向RNA互补的RNA(aaaccgagggaucauaggggacugaauccaccauucuucucccaaucccugcaacuccuucuuccccugc(SEQ ID NO:7)可以有效地使EGFP阴性细胞转化为EGFP阳性细胞,而70-nt的随机RNA(ugaacagcuccucgcccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugccuccuccgcc(SEQ ID NO:8)不能(图1A,1B,1C和1D)。因此,我们将该RNA指定为dRNA(脱氨酶招募RNA)。为了验证细胞内源性ADAR可被招募以通过dRNA进行腺嘌呤脱氨基作用,我们在ADAR1 p110和ADAR1 p150双敲除293T细胞系中进行了实验(图6E和6F)。因为ADAR1广泛表达,而ADAR2主要在脑中以高水平表达。因此我们提出:通过dRNA的靶向腺嘌呤脱氨基作用主要由ADAR1而不是ADAR2介导。正如预期的那样,靶向dRNA不能在293T-ADAR1-/-细胞中触发EGFP表达,但是过表达外源ADAR1 p110,p150或ADAR2可以回复293T-ADAR1-/-细胞中的EGFP表达(图1E和1F),这表明在293T细胞中,dRNA可以招募ADAR1或ADAR2来介导靶标RNA上的腺嘌呤脱氨基作用。此外,我们发现:ADAR1-p110和ADAR2具有比ADAR1-p150更高的编辑活性(图1G和图6G),这可能是由于ADAR1-p110和ADAR1-p150的不同细胞定位。
为了确定EGFP荧光的恢复是由于靶向RNA编辑事件引起的,我们通过RT-PCR直接测量dRNA介导的报道分子2转录物的编辑,然后进行靶向的Sanger测序和二代测序。测序结果显示:靶向的腺嘌呤(A-C错配位点)中的A至G碱基转化,并且,编辑率可达到13%(图6H和图1H)。此外,我们还在靶向的腺嘌呤附近的序列窗口期间观察到略微的A到G编辑,这很可能是由于双链RNA区域增加,之后,我们将尝试用几种策略去除非预期的编辑。
实施例2.优化设计dRNA的因素
接下来,我们开始优化dRNA以实现更高的编辑效率。首先,我们的目的是确定在靶向的腺嘌呤相对位置中哪个碱基更有利于编辑。以前的研究表明,靶向的腺苷的相对的碱基会有效地影响编辑效率。因此,我们在与靶向的A相对的中间位置设计了具有错配N(A,U,C和G)的71nt dRNA。基于FACS结果,我们发现,四种不同的dRNA有效编辑如下:C>A>U>G(图2A和2B)。最近,据报道,靶标UAG位置中的小泡可能有利于编辑效率。因此,我们设计了含有两个或三个与靶标UAG位点错配碱基的dRNA来测试我们的假设。使用Golden Gate克隆方法,在具有BFP标记的dRNA载体上设计和构建16种不同的71nt dRNA。我们发现,具有CCA和GCA序列的dRNA具有最高的效率,这意味着,小泡对A-I编辑几乎没有贡献,至少在UAG靶标位点的情况下。此外,NCA序列的四个dRNA具有较高百分比的GFP阳性细胞,从而得出结论,互补的U-A碱基对可能对ADAR编辑很重要(图2C和2D)。随后,我们基于报道分子测试不同长度的dRNA的效率。dRNA设计为中间位置的错配C,长度范围为31nt至221nt。我们发现,编辑效率随着dRNA的增加而增加。报道分子系统的编辑高峰位于171nt dRNA。51nt dRNA可以以良好的效率(18%)激活报道分子系统(图2E和2F)。最后,我们检查了dRNA的错配C的位置是否影响编辑效率。dRNA保持相同的71nt长度,设计了与转录起始位置不同的错配C。基于FACS结果,我们发现,其相对的错配C的位置可能影响编辑效率,并且,位于dRNA的5'或3'的错配C具有较低的效率(图2G和2H)。
通过Gibson克隆构建出16种不同的包含靶标序列的报道分子,其含有所有可能的3种碱基基序,然后将其克隆到pLenti骨架(pLenti-CMV-MCS-SV-Bsd,Stanley Cohen Lab,Stanford University)中。所述靶标序列如下所示。
含有所有可能的3碱基基序的靶标序列:
TAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:9)
TAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:10)
TAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:11)
TAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:12)
AAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:13)
AAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:14)
AAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:15)
AAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:16)
CAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:17)
CAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:18)
CAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:19)
CAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:20)
GAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:21)
GAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:22)
GAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:23)
GAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO:24)
dRNA保持相同的111bp长度,并且,在中心处朝向靶标A设计了错配C。
在12孔细胞培养集簇(cluster)中,将2×105个细胞HEK293T铺板到每个孔中,并进行每个实验三次重复。24小时后,使用X-tremeGENE HP DNA转染试剂(Roche)将0.5μg的dRNA质粒和0.5μg的报道分子靶标质粒共转染至细胞。48小时后,用胰蛋白酶处理细胞并通过FACS(BD)选择mCherry阳性细胞。收获总共4×105个细胞,并使用RNAprep纯细胞/细菌试剂盒(TIANGEN DP430)提取总RNA。使用Quantscript RT试剂盒(TIANGEN KR103-04)从2μg的总RNA合成cDNA。并通过PCR扩增111个靶标区域并进行深度测序。
我们发现,所有16种不同的3碱基基序都可以通过本申请的示例性RNA编辑方法进行编辑,尽管效率可变。总之,结果表明,要编辑的A的5'最近邻位具有优先度U>C≈A>G并且要编辑的A的3'最近邻位具有优先度G>C>A≈U。数据以图3A中的条形图或者图3B中的热图表示。
实施例3.编辑从内源基因转录的RNA
接下来,我们测试了dRNA是否可以介导从内源基因转录的mRNA。我们设计了靶向四种基因KRAS,PPIB,β-肌动蛋白和GAPDH的dRNA。对于KRAS mRNA,我们设计了91、111、131、151、171和191个核苷酸长度的dRNA(图4A),其序列如下所示。
91-nt KRAS-dRNA
uagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgc(SEQ ID NO:25)
111-nt KRAS-dRNA
gauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacuaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagc(SEQ ID NO:26)
131-nt KRAS-dRNA
uccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacuaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccu(SEQ ID NO:27)
151-nt KRAS-dRNA
aucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgc(SEQ ID NO:28)
171-nt KRAS-dRNA
cuauuguuggaucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgccgccgccuuc(SEQ ID NO:29)
191-nt KRAS-dRNA
uaggaauccucuauuguuggaucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgccgccgccuucagugccugcg(SEQ ID NO:30)
二代测序结果显示:dRNA可编辑靶向的KRAS mRNA,编辑效率高达11.7%(图4B)。对于内源性PPIB mRNA,靶向的三个位点:位点1,位点2和位点3。我们为每个位点设计了151个核苷酸长度的dRNA(图4C),其序列如下所示。
151-nt PPIB-dRNA(位点1)
gaggcgcagcauccacaggcggaggcgaaagcagcccggacagcugaggccggaagaggguggggccgcgguggccagggagccggcgccgccacgcgcgggugggggggacugggguugcucgcgggcuccgggcgggcggcgggcgccg(SEQ ID NO:31)
151-nt PPIB-dRNA(位点2)
uccuguagcuaaggccacaaaauuauccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccggcccacaucuucaucuccaauucguaggucaaaauacaccuugacggugacuuugggccccuucuucuucucaucggcc(SEQ ID NO:32)
151-nt PPIB-dRNA(位点3)
gcccuggaucaugaaguccuugauuacacgauggaauuugcuguuuuuguagccaaauccuuucucuccuguagccaaggccacaaaauuauccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccggccuacaucuuca(SEQ ID NO:33)
二代测序的结果显示:dRNA可以以高达14%的编辑效率有效地编辑PPIB mRNA位点1(图4D)。对于PPIB mRNA位点2和位点3,编辑效率为1.5%和0.6%(图4E和4F)。对于内源性β-肌动蛋白mRNA,我们为每个位点选择了两个靶向的位点和经设计的dRNA(图4G),其序列如下所示。
72-ntβ-肌动蛋白-dRNA(位点1)
gcgcaaguuagguuuugucaagaaaggguguaacgcaaccaagucauaguccgccuagaagcauuugcggug(SEQ ID NO:34)
131-ntβ-肌动蛋白-dRNA(位点1)
gccaugccaaucucaucuuguuuucugcgcaaguuagguuuugucaagaaaggguguaacgcaaccaagucauaguccgccuagaagcauuugcgguggacgauggaggggccggacucgucauacuccug(SEQ ID NO:35)
70-ntβ-肌动蛋白-dRNA(位点2)
ggacuuccuguaacaacgcaucucauauuuggaaugaccauuaaaaaaacaacaaugugcaaucaaaguc(SEQ ID NO:36)
我们发现,dRNA可以编辑位点1和位点2的β-肌动蛋白mRNA,每个位点的编辑效率高达1.4%(图4H和图8A)。我们还观察到更长的dRNA被赋予更高的编辑效率,dRNA-71nt为0.6%,dRNA-131nt为1.4%(图3H)。对于另一个管家基因GAPDH,我们使用71nt dRNA(CAAGGUGCGGCUCCGGCCCCUCCCCUCUUCAAGGGGUCCACAUGGCAACUGUGAGGAGGGGAGAUUCAGUG(SEQ IDNO:37)),编辑效率为0.3%,可能是由于dRNA的长度短(图8B)。
实施例4.对示例性LEAPER方法的脱靶分析
对于治疗应用,编辑的精确度是关键的。接下来,我们试图表征本申请的示例性RNA编辑系统的特异性。我们选择内源性PPIB位点1和KRAS位点进行分析。对于PPIB位点1,我们可以看到,在dRNA覆盖区域之间,在靶向的A76的侧翼存在几个A碱基,例如A22,A30,A33,A34,A39,A49,A80,A91,A107和A140。这揭示了,那些侧翼的A碱基几乎没有受到编辑,而靶向的A76碱基(A-C错配)显示高达14%的编辑效率(图5A和5B)。
对于KRAS位点,我们可以在dRNA覆盖区域中看到,在靶向的A56碱基的侧翼存在许多腺嘌呤,多达29个侧翼A碱基。根据KRAS mRNA编辑结果,我们发现虽然靶向的A56碱基(A-C错配)显示高达11.7%的编辑效率,但是可以编辑侧翼腺嘌呤(图5C和5D)。编辑了多种脱靶的腺嘌呤,而诸如A41,A43,A45,A46,A74,A79的腺嘌呤显示出更多的编辑。我们发现那些未经编辑的A碱基的5'最近邻位是G或C,而那些有效编辑的腺嘌呤的5'最近邻位是T或A。基于这一观察,我们开始设计dRNA以最大程度减小对那些易于编辑的腺嘌呤的脱靶编辑。在我们的研究中,我们发现ADAR比A-A,A-U错配更优选A-C错配,并且A-G错配是最不优选的。因此,我们提出,对于5'最近邻位为U或A的脱靶A碱基,A-G错配可能会减少或消除脱靶效应。之前的研究报道了A-G错配可能会阻碍ADAR的脱氨基编辑。
接下来,基于图5D中的统计结果和现有知识,我们设计了三种91-nt dRNA变体和四种111-nt dRNA变体(具有如下所示的序列),其含有不同的A-G错配组合:dRNA-AG1(A41,A46,A74);dRNA-AG2(A41,A43,A45,A46,A74,A79);dRNA-AG3(A31,A32,A33,A41,A43,A45,A46,A47,A74,A79);dRNA-AG4(A7,A31,A32,A33,A40,A41,A43,A45,A46,A47,A74,A79,A95)(图4E)。KRAS-dRNA-91-AG2
UAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGC(SEQ ID NO:38)
KRAS-dRNA-91-AG3
UAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGC(SEQ ID NO:39)
KRAS-dRNA-91-AG4
UAGCUGGAUCGUCAAGGCACUCGUGCCGACGCCACCAGCUCCAACCACCACAAGGGGAGAGGCAGUCAGGGUCAGCAGGCCUCUCUCCCGC(SEQ ID NO:40)
KRAS-dRNA-111-AG1
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGC(SEQ ID NO:41)
KRAS-dRNA-111-AG2
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGUggAgAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGC(SEQ ID NO:42)
KRAS-dRNA-111-AG3
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGCACCUGGGAGC(SEQ ID NO:43)
KRAS-dRNA-111-AG4
GCUCCCCGGUGCGGGAGAGAGGCCUGCUGACCCUGACUGCCUCUCCCCUUGUGGUGGUUGGAGCUGGUGGCGUCGGCACGAGUGCCUUGACGAUCCAGCUAAUUCAGAAUC(SEQ ID NO:44)
然后将这些dRNA转染到HEK293T细胞中,并将空白载体和71-nt非靶向dRNA对照:(tctcagtccaatgtatggtccgagcacaagctctaatcaaagtccgcgggtgtagaccggttgccatagga(SEQID NO:45))用作阴性对照。对于91-nt dRNA,深度测序结果显示,dRNA-91-AG2的中靶(on-target)编辑(A56)降至2.8%,dRNA-91-AG3的降至2.3%,dRNA-91-AG4的降至0.7%,这是与没有A-G错配的dRNA-91的中靶编辑(A56)效率7.9%相比(图4F)。对于91-nt dRNA,dRNA-111-AG2的中靶编辑(A56)降低至5.1%,而dRNA-111-AG3的降低至4.9%,这是与没有A-G错配的dRNA-111的中靶编辑(A56)效率15.1%相比(图4F),这表明较长的dRNA可以具有更多的A-G错配。接下来我们选择111-nt dRNA进行详细的脱靶分析。除A7和A79外,显著消除了侧翼的A碱基编辑(图4G)。对于A7碱基,可以通过该位点的进一步A-G错配设计来防止脱靶效应,这在当前的dRNA设计中是不存在的。对于A79碱基,引入相邻的两个A-G错配A78/A79可能有助于消除脱靶效应。基于这样的结果,应用本申请的RNA编辑系统治愈基因疾病是非常有希望和鼓舞人心的。
实施例5.在多个细胞系中测试示例性LEAPER方法
通过HEK293T细胞中的结果,我们认为,由线性dRNA及其靶标RNA形成的双链RNA可以招募内源ADAR蛋白用于A-I编辑。为了证实这一假设,我们选择了更多的细胞系来测试我们的RNA编辑方法。结果如图9所示。多个细胞系的结果证明了我们RNA编辑方法有普遍性。首先,尽管具有多种编辑效率,但使用dRNA招募内源性ADAR适合于多种人类细胞系(其源自7种不同的组织和器官)。此外,该方法不仅可以在人类细胞中起作用,而且可以在小鼠细胞中起作用,提供了在小鼠上进行实验的可能性。
实施例6.利用内源性ADAR进行RNA编辑
试图探索一种有效的RNA编辑平台,我们将高活性E1008Q突变体ADAR1(ADAR1DD)40的脱氨酶结构域与催化失活的LbuCas13(dCas13a),一种RNA指导的靶向RNA的CRISPR效应子41融合(图10A)。为了评估RNA编辑效率,我们构建了一个包含通过包含3x GGGGS编码区和框内UAG终止密码子的序列连接mCherry和EGFP基因的替代报道分子(报道分子-1,图10B)。报道分子转染的细胞仅表达mCherry蛋白,而在报道分子转录物的UAG上进行靶向的编辑可以将终止密码子转换为UIG,因此允许下游EGFP表达。这样的报道分子允许我们通过监测EGFP水平来测量A-至-I编辑效率。然后,我们设计了hU6启动子驱动的crRNA(CRISPR RNA),其包含进行Cas13a识别的5'支架和可变长度的间隔区序列以用于靶向(crRNACas13a,紧随LbuCas13 crRNA序列)。
表2.LbuCas13 crRNA序列
与靶转录物互补的序列均包含与UAG密码子相对的CCA,从而引入与腺苷(A)错配的胞苷(C)(图10B),因为腺苷脱氨作用优先发生在A-C错配位点13,14。为了测试crRNA的最佳长度,在稳定表达报道分子-1的HEK293T细胞中,将不同长度的非靶向或靶向crRNA与dCas13a-ADAR1DD蛋白共表达。用含有至少40-nt长的匹配序列的crRNA观察到了由EGFP表达出现所示的明显的RNA编辑作用,crRNA越长,EGFP阳性百分比就越高(图10C)。令人惊讶地,单独的长crRNACas13a的表达似乎足以激活EGFP表达,并且dCas13a-ADAR1DD的共表达反而降低了crRNA活性(图10C,10D)。EGFP表达显然是序列依赖性的,因为70-nt(针对长度计算不包括5'支架)对照RNA不能激活EGFP的表达(图10C,10D)。
令人惊讶的发现是,某些长期工程化的crRNACas13a能够独立于dCas13a-ADAR1DD进行RNA编辑,我们决定从crRNA中除去Cas13a招募的支架序列。因为crRNA70具有触发EGFP表达的最高活性(图10C,10D),所以我们选择了表3中的相同的70-nt长的指导RNA,而没有Cas13a招募支架进行进一步测试(图11A和以下在实施例中使用的arRNA的和对照RNA的序列)。
表3.
结果证明,这种线性指导RNA在接近40%携带报道分子-1的总细胞中诱导了强的EGFP表达(图11B,上图)。由于内源性ADAR蛋白可以编辑双链RNA(dsRNA)底物12,因此我们认为长指导RNA可以与靶标转录物退火形成dsRNA底物,转而招募内源性ADAR蛋白用于靶向的编辑。因此,我们将这样的指导RNA称为arRNA(ADAR招募RNA)。
为了验证内源性ADAR蛋白是否确实对上述观察负有责任,我们着手研究在ADAR缺陷细胞中arRNA介导的RNA编辑。由于在HEK293T细胞中几乎检测不到ADAR2 mRNA(图12A),因此我们生成了HEK293T ADAR1-/-细胞,使该细胞系在ADAR1和ADAR2中均缺乏(图11C,D)。实际上,ADAR1的消耗消除了arRNA70诱导的EGFP信号(图11B,下图)。此外,HEK293T ADAR1-/-细胞中ADAR1p110,ADAR1p150或ADAR2的外源表达(图11C,d)成功地挽救了通过arRNA70诱导EGFP的丢失(图11E,图12B),证明了arRNA诱导的EGFP报道分子表达仅仅取决于天然的ADAR1,其活性可以通过其同种型(p110和p150)或ADAR2重建。对arRNA70靶向区域的Sanger测序分析显示,UAG中预测的腺苷位点有一个A/G重叠峰,表明明显的A至I(G)转化(图11F)。下一代测序(NGS)进一步证实了A至I的转化率约为全部报道分子转录物的13%(图11G)。定量PCR分析表明arRNA70不会减少靶向的转录物的表达(图13),排除了arRNA可能的RNAi效应。总体而言,我们的数据表明,arRNA能够通过工程化的A-C错配对靶向的转录物产生显著水平的编辑。
实施例7.LEAPER可以在多个细胞系中进行RNA编辑
因为内源性ADAR蛋白的表达是LEAPER介导的RNA编辑的前提,所以我们测试了LEAPER在一组来自不同组织的细胞系中的性能,这些细胞系包括HT29,A549,HepG2,RD,SF268,SW13和HeLa。我们首先使用蛋白质印迹分析检查了所有三种ADAR蛋白的内源表达。ADAR1在所有测试的细胞系中都高度表达,其在蛋白质印迹中的身份已通过阴性对照HEK293T ADAR1–/–系得到证实(图14A,B)。仅在HepG2和HeLa细胞中检测到ADAR3(图14A,B)。在任何细胞中均未检测到ADAR2,其结果并非由于蛋白质印迹的失败,因为可以从过表达ADAR2的HEK293T细胞中检测到ADAR2蛋白(图14A,b)。这些发现与先前报道的一致,即ADAR1广泛表达,而ADAR2和ADAR3的表达仅限于某些组织11。
然后我们着手在这些细胞系中测试靶向报道分子-1的重新设计的71-nt arRNA(arRNA71)的编辑效率(图15A和上面列出的这项研究中使用的arRNA和对照RNA的序列)。
LEAPER在该arRNA71的所有测试的细胞中都工作,尽管效率有所不同(图14C)。这些结果与先前的报道一致,即除了HepG2和HeLa细胞外,ADAR1/2蛋白水平与RNA编辑产率相关42。编辑效率与ADAR1水平的次优相关性可能是由于这两个系中都有大量的ADAR3表达(图14A,B),因为据报道ADAR3在RNA编辑中起抑制作用。重要的是,LEAPER还在小鼠起源的三种不同细胞系(NIH3T3,小鼠胚胎成纤维细胞(MEF)和B16)中起作用(图14D),为通过动物和疾病模型测试其治疗潜力铺平了道路。总体而言,我们得出的结论是,LEAPER是一种用于广谱细胞类型以及不同生物体的多用途工具。
实施例8.LEAPER的表征和优化
为了更好地表征和优化LEAPER,我们研究了靶向的转录物的UAG三联体内与腺苷相对的核苷酸的选择。在HEK293T细胞中,靶向报道分子-1的arRNA71显示出可变的编辑效率,具有与靶向的UAG相对的变化的三联体(5’-CNA,N表示A/U/C/G之一)(上面列出的在这项研究中使用的arRNA和对照RNA的序列)。A-C错配导致最高的编辑效率,而A-G错配产生最少但明显的编辑(图16A)。然后,我们研究了arRNA中A-C错配侧翼核苷酸的优先度。我们测试了胞苷(5'-N1CN2)周围的5'和3'相邻位点的所有16个组合(上面列出的在这项研究中使用的arRNA和对照RNA的序列),发现3'相邻腺苷是有效编辑所必需的,而腺苷是5'位点上最不利的核苷酸(图16B,c)。因此,我们得出结论,arRNA上的CCA基序赋予了靶向UAG位点的最高编辑效率。值得注意的是,arRNA中的3'相邻鸟苷(5'-N1CG)表现出戏剧性的抑制作用(图16B,c)。
RNA的长度似乎在指导对靶向的转录物的编辑中与arRNA效率有关(图10C),与先前的报道一致42。为了完全理解这种效果,我们测试了可变长度的arRNA,它们靶向两种不同的报道分子转录物-报道分子-1和报道分子-2(图15A,b)。对于任一报道分子靶向,设计和测试了10种不同大小的arRNA,范围从31-nt到211-nt,CCA三联体(用于UAG靶向)正好位于中间(上面列出的这项研究中使用的arRNA和对照RNA的序列)。基于报道分子EGFP活性,对于两个报道分子,arRNA的长度与编辑效率正相关,在111-191-nt处达到峰值(图16D)。尽管一个arRNA51似乎起作用,但71-nt是arRNA对两个报道分子均起作用的最短长度(图16D)。
接下来,我们研究了arRNA内A-C错配位置对编辑效率的影响。我们将所有要测试的arRNA的长度固定为71-nt,并将靶向UAG的ACC三联体从arRNA中的5'滑到3'(上面列出的这项研究中使用的arRNA和对照RNA的序列)。事实证明,将A-C错配放在中间区域会导致高编辑产率,并且在两个报道分子中靠近3'端错配位点的arRNA优于靠近5'端的那些(图16E)。为方便起见,对所有我们的后续研究,我们都将A-C错配置于arRNA的中心。
我们还测试了LEAPER的靶向灵活性,并试图确定靶标上的UAG是否是进行RNA编辑的唯一基序。对于报道分子-3上的所有16个三联体组合(5'-N1AN2)(图15C),我们使用了固定长度(111-nt)的相应arRNA,并确保了除了编辑位点(A-C错配)外,arRNA和报道分子的完美序列匹配(图16F和上面列出的这项研究中使用的arRNA和对照RNA的序列)。NGS结果表明,所有N1AN2基序均可编辑。UAN2和GAN2分别是最优选和最不优选的基序(图16F,g)。总体而言,靶标腺苷的最近邻位优先度为5'U>C≈A>G和3'G>C>A≈U(图16G)。
实施例9.使用LEAPER编辑内源转录物
接下来,我们检查了LEAPER是否可以对内源转录物进行有效的编辑。使用不同长度的arRNA,我们靶向PPIB,KRAS和SMAD4基因转录物中的UAG基序,以及FANCC基因转录物中的UAC基序(图17A,上面列出的这项研究中使用的arRNA和对照RNA序列)。令人鼓舞的是,所有四种转录物中的靶向的腺苷位点均由其相应的所有四种大小的arRNA编辑,尽管根据NGS结果的效率有所不同(图17B)。与我们先前的观察一致,更长的arRNA倾向于产生更高的编辑率。值得注意的是,151-nt的arRNAPPIB编辑了PPIB基因总转录物的~50%(图17B)。没有arRNA在其靶向的转录物(图18A)或最终蛋白质水平(例如KRAS,图18B)上显示出RNAi作用。此外,LEAPER能够在非UAN位点上达到理想的编辑率(图17C和上面列出的这项研究中使用的arRNA和对照RNA的序列),显示LEAPER在编辑内源转录物上的灵活性。为了进一步探索LEAPER的功能,我们测试了LEAPER是否可以同时靶向多个位点。我们通过共表达两个arRNA(上面列出的这项研究中使用的arRNA和对照RNA的序列)观察到TARDBP和FANCC转录物的多重编辑,其效率甚至高于单个arRNA(图17D)的那些,表明LEAPER非常适合平行编辑多个靶标。
值得注意的是,ADAR1/2倾向于使RNA双链体中的多个腺苷杂乱地脱氨基44,并且A-C错配不是指导A至I转换的唯一基序(图16A)。因此,可以合理地假设,arRNA覆盖范围内靶标转录物上的所有腺苷均受到可变水平的编辑,这是不想要的修饰的主要来源。arRNA越长,这样的脱靶的可能性就越高。因此,我们检查了这些靶向的转录物中arRNA覆盖区域内的所有腺苷位点。对于PPIB转录物,在整个测序窗口中,对于可变大小的arRNA,观察到很少的脱靶编辑(图17E,f)。但是,在靶向KRAS,SMAD4和FANCC基因的情况下,检测到多个脱靶编辑(图19A-F)。特别是对于KRAS,在arRNA111的测序窗口中,30个腺苷中有11个进行了大量的A至I转化(图19A,b)。
我们接下来尝试开发策略以最小化这样的不想要的脱靶效应。因为A-G错配抑制了UAG靶向的编辑(图16A),所以我们假设将鸟苷与非靶向腺苷配对可能会减少不希望的编辑。然后,我们测试了报道分子-3中所有可能的三联体组合(5'-N1AN2)中A-G错配对腺苷的影响(图15C和上面列出的这项研究中使用的arRNA和对照RNA序列)。与A-C错配(图16F)相比,除了UAG或AAG靶向(~2%)(图17G),A-G错配确实降低了所有测试的靶标中对腺苷的编辑。为了进一步降低不想要的位点的编辑率,我们继续测试了两个连续错配的影响。结果表明,与UAG或AAG相对的三联体的3'端核苷酸处的额外错配消除了其相应的腺苷编辑(图17H以及上面列出的这项研究中使用的arRNA和对照RNA的序列)。根据这些发现,我们尝试应用此规则以减少KRAS转录物中的脱靶(图19A)。我们首先设计了一个arRNA(arRNA111-AG6),其在arRNA111覆盖的所有“易编辑”基序上产生了A-G错配(图17I,图19A和上面列出的研究中使用的arRNA和对照RNA的序列),包括AAU(第61位),UAU(第63位),UAA(第65位),AAA(第66位),UAG(第94位)和AAG(第99位)。该arRNA111-AG6消除了大部分脱靶编辑,同时保持了约5%的中靶编辑率。与图17G中的发现一致,单个A-G错配不能完全最大程度的减小AAG基序(第99位)的编辑(图17I和图19A)。然后,我们在arRNA111-AG6上添加了更多错配,包括双重错配(与靶向的基序5'-AAG相对的5'-CGG),以及三个另外的A-G错配以减轻第27、98和115位腺苷的编辑(arRNA111-AG9)(上面列出的这项研究中使用的arRNA和对照RNA的序列)。因此,我们实现了大大提高的编辑的特异性,而又没有在靶标位点(A76)上额外损失编辑率(图17I)。总之,结合其他规则的工程化的LEAPER可以对内源转录物进行有效和更精确的RNA编辑。
实施例10.LEAPER的RNA编辑特异性
除了在arRNA覆盖的dsRNA区域内可能的脱靶效应外,我们还担心通过arRNA的部分碱基配对对其他转录物的潜在脱靶效应。然后,我们进行了转录组范围的RNA测序分析,以评价LEAPER的全局脱靶效应。在进行RNA-seq分析之前,先用Ctrl RNA151或PPIB特异性arRNA(arRNA151-PPIB)表达质粒转染细胞。我们在Ctrl RNA151组中确定了六个潜在脱靶(图20A),在arRNA151-PPIB中确定了五个潜在脱靶(图20B),基于NGS分析的PPIB中靶率为~37%(图20B)。进一步的分析表明,除来自EIF2AK2转录物的两个位点外,所有位点均位于SINE(Alu)或LINE区域(图20A,B),均易于受到ADAR介导的编辑45,表明这些脱靶可能不是从靶标转录物和arRNA或Ctrl RNA的配对中得出的。值得注意的是,两组中出现了两种脱靶转录物,WDR73和SMYD4,表明它们不太可能是序列依赖性RNA编辑。实际上,最小自由能分析表明,所有这些可能的脱靶转录物均不能与Ctrl RNA151或arRNA151-PPIB形成稳定的双链体(图20C)。为了进一步测试arRNA是否产生序列依赖性脱靶,我们通过使用NCBI BLAST比较arRNA151-PPIB和arRNA111-FANCC的序列相似性来选择潜在的脱靶位点。arRNA151-PPIB的TRAPPC12转录物以及arRNA111-FANCC的ST3GAL1,OSTM1-AS1和EHD2转录物中的三个位点是最佳候选者(图20D和图21A)。NGS分析表明,在这些预测的脱靶位点中均不能检测到编辑(图20D和图21B)。这些结果表明,LEAPER允许在靶向的位点进行有效编辑,同时保持转录组范围的特异性,而没有可检测的序列依赖性脱靶编辑。
实施例11.LEAPER在哺乳动物细胞中的安全性评估
因为arRNA依赖于内源性ADAR蛋白来编辑靶标转录物,所以我们想知道外源性arRNA的添加是否通过占用过多的ADAR1或ADAR2蛋白来影响天然RNA编辑事件。因此,我们从转录组范围的RNA测序结果中分析了模拟组和arRNA151-PPIB组共享的A-至-I RNA编辑位点,并且还分析了模拟组和Ctrl RNA151组之间的比较。与模拟组相比,Ctrl RNA151组和arRNA151-PPIB组均未显示出显著差异(图22A,B),这表明LEAPER对内源ADAR1催化天然A-至-I编辑事件的正常功能影响很小。
同时,我们使用RNA-seq数据进行了差异基因表达分析,以验证arRNA是否影响全局基因表达。我们发现,与模拟组相比,Ctrl RNA151和arRNA151-PPIB均不影响全局基因表达(图22C,D)。与我们先前的观察一致(图18A),arRNA对PPIB的表达未显示任何RNAi作用(图22C,D)。
考虑到arRNA与靶标转录物形成RNA双链体并且RNA双链体可引起先天免疫应答,我们研究了arRNA的引入是否具有这样的作用。为了测试这一点,我们选择了靶向已证明有效的四个基因转录物的arRNA。我们没有观察到干扰素-β(IFN-β)(图22E)或白介素6(IL-6)(图22F)的任何mRNA诱导,这是先天免疫激活的两个标志。作为阳性对照,双链RNA的合成类似物-聚(I:C)诱导了强烈的IFN-β和IL-6表达(图22E,f)。LEAPER似乎不会在靶细胞中诱导免疫原性,一种对安全治疗很重要的特征。
实施例12.通过LEAPER恢复p53的转录调节活性
现在我们已经建立了无需引入外源蛋白质就可以进行RNA编辑的新方法,我们试图证明其治疗实用性。我们首先靶向了肿瘤抑制基因TP53,已知该基因在维持细胞稳态中起着至关重要的作用,但在>50%的人类癌症中经历频繁突变46。TP53中的c.158G>A突变是临床相关的无意义突变(Trp53Ter),导致无功能的截短蛋白46。我们设计了一个arRNA111和两个替代性arRNA(arRNA111-AG1和arRNA111-AG4)(上面列出的本研究中使用的arRNA和对照RNA的序列),它们均靶向TP53W53X转录物(图23A),后两个被设计为最大程度低减小潜在脱靶。我们产生了HEK293T TP53–/–细胞系,以消除天然p53蛋白的作用。靶向TP53W53X的所有三种形式的arRNA都在突变的腺苷位点上转化了TP53W53X转录物的~25-35%(图23B),可变减少arRNA111-AG1和arRNA111-AG4的不想要的编辑(图24)。蛋白质印迹表明,基于HEK293TTP53–/–细胞中的TP53W53X转录物,arRNA111,arRNA111-AG1和arRNA111-AG4均可挽救全长p53蛋白的产生,而Ctrl RNA111则不能(图23C)。
为了验证修复的p53蛋白是否完全起作用,我们用p53-荧光素酶顺式报道系统测试了p53的转录调节活性47,48。所有三个版本的arRNA均可恢复p53活性,而优化版本的arRNA111-AG1表现最佳(图23D)。总之,我们证明了LEAPER能够修复与癌症相关的TP53的提前终止密码子(pre-mature stop codon)并恢复其功能。
实施例13.LEAPER对致病性突变的校正
接下来,我们调查了LEAPER是否可用于校正更多的致病突变。针对六个致病基因的临床相关突变:埃勒斯-当洛斯综合征(Ehlers-Danlos syndrome)的COL3A1,原发性肺动脉高压的BMPR2,朱伯特综合征(Joubert syndrome)的AHI1,范科尼贫血(Fanconi anemia)的FANCC,原发性家族性肥厚性心肌病的MYBPC3和X染色体连锁性严重联合免疫缺陷病的IL2RG,我们为携带相应致病性G>A突变的这些基因的每个设计了111-nt arRNA(图25和上面列出的这项研究中使用的arRNA和对照RNA的序列,以及表4中示出的这项研究中使用的与疾病相关的cDNA)。
表4.这项研究中使用的与疾病相关的cDNA
通过在HEK293T细胞中共表达arRNA/cDNA对,我们在所有测试中鉴定了大量的具有A>G校正的靶标转录物(图24)。由于G>A突变占人类已知致病点突变的近一半10,49,因此LEAPER进行的A>G转化可为治疗提供巨大的机会。
实施例14.LEAPER在多个人类原代细胞中进行RNA编辑
为了进一步探索LEAPER的临床实用性,我们着手在多个人类原代细胞中测试该方法。首先,我们在人原代肺成纤维细胞和人原代支气管上皮细胞中用151-nt arRNA(上面列出的这项研究中使用的arRNA和对照RNA的序列)测试了LEAPER,以编辑报道分子-1(图15A)。在两个人原代细胞中,LEAPER均可获得35-45%的EGFP阳性细胞(图27A)。然后,我们测试了LEAPER在这两个原代细胞和人类原代T细胞中编辑内源性基因PPIB的结果,发现arRNA151-PPIB在人类原代肺成纤维细胞,原代支气管上皮细胞(图27B)和原代T细胞(图27C)中的编辑率可分别达到>40%,>80%和>30%。LEAPER在人原代细胞中的高编辑效率因其在治疗中的潜在应用而特别令人鼓舞。
实施例15.通过慢病毒表达和arRNA的化学合成的有效编辑
然后我们研究了是否可以通过临床上更相关的方法来递送LEAPER。我们首先通过基于慢病毒的表达测试了arRNA的作用。感染后2天(dpi),靶向报道分子-1的arRNA151在HEK293T细胞中的40%以上带有报道分子-1的总细胞中诱导了强EGFP表达。在8dpi时,EGFP比率保持在~38%的可比水平(图28A和上面列出的这项研究中使用的arRNA和对照RNA序列),表明LEAPER可以适合需要连续施用的疗法。对于天然基因编辑,我们通过慢病毒转导在HEK293T细胞中递送了靶向PPIB的arRNA151,并在6dpi时观察到超过6%的靶标编辑(图28B)。
我们接下来测试了用于LEAPER的合成的arRNA寡核苷酸和电穿孔递送方法。化学合成具有111-nt的靶向PPIB转录物的arRNA和Ctrl RNA,并在arRNA的首尾各3个核苷酸处进行2'-O-甲基化和硫代磷酸酯连接修饰(图28C)。通过电穿孔引入T细胞后,arRNA111-PPIB寡核苷酸在PPIB转录物上实现了~20%的编辑(图28D),这表明LEAPER有望开发出寡核苷酸药物。
实施例16.通过LEAPER恢复源自Hurler综合征患者的原代成纤维细胞中的α-L-艾杜糖醛酸酶活性
最后,我们检查了LEAPER在治疗单基因疾病-Hurler综合征方面的潜力,该疾病是由于α-L-艾杜糖醛酸酶(IDUA),一种负责粘多糖的降解的溶酶体代谢酶的缺乏而导致的I型粘多糖贮积病(MPS I)最严重的亚型50。我们选择了从Hurler综合征患者最初分离的原代成纤维细胞GM06214。GM06214细胞在IDUA基因的外显子9中含有纯合的TGG>TAG突变,导致蛋白质中的Trp402Ter突变。我们通过具有化学修饰的合成RNA寡核苷酸设计了两个版本的arRNA,所述化学修饰是序列首尾3个核苷酸中的2’-O-甲基化和核苷酸间硫代磷酸酯键,分别是靶向IDUA的成熟mRNA和pre-mRNA的arRNA111-IDUA-V1和arRNA111-IDUA-V2(图29A以及在上面列出的这项研究中使用arRNA和对照RNA的序列)。经由电穿孔将arRNA111-IDUA-V1或arRNA111-IDUA-V2引入GM06214细胞后,我们通过NGS分析测量了靶向的RNA编辑率,并在不同的时间点用4-MU-α-L-艾杜糖醛酸酶底物测量了α-L-艾杜糖醛酸酶的催化活性。在电穿孔后,arRNA111-IDUA-V1和arRNA111-IDUA-V2均可随着时间的推移逐渐地显著恢复IDUA-缺失的GM06214细胞中IDUA催化活性,而arRNA111-IDUA-V2的性能要比arRNA111-IDUA-V1好得多,而在三个对照组中无α-L-艾杜糖醛酸酶活性可以检测到(图29B)。
为了进一步评价LEAPER在GM06214中恢复的IDUA活性减轻Hurler综合征的程度,我们检查了GM01323细胞中的IDUA活性,GM01323细胞是来自患有Scheie综合征的患者的另一种原代成纤维细胞,该综合征是一种比Hurler轻得多的MPS I亚型,由于IDUA基因上杂合基因型导致残留IDUA活性而引起的。我们发现电穿孔后48小时,在具有arRNA111-IDUA-V2的GM06214细胞中IDUA的催化活性高于GM01323细胞(图29B)。与这些结果一致,NGS分析表明arRNA111-IDUA-V2将近30%的A转换为I编辑,比arRNA111-IDUA-V1的转化率高得多(图29C)。进一步的分析表明,在IDUA转录物的arRNA覆盖区域内检测到最少的不想要的编辑(图29D)。重要的是,LEAPER不会在原代细胞中触发免疫反应,如我们证明的,与RNA双链体聚(I:C)用作阳性对照不同,arRNA111-IDUA-V1和arRNA111-IDUA-V2均未诱导一组涉及I型干扰素和促炎反应的基因的表达(图29E)。这些结果表明LEAPER在靶向某些单基因疾病方面的治疗潜力。
实施例17.GM06214突变基因型的检测
将GM06214细胞培养于含有15%血清和1%成纤维细胞生长添加物(ScienCell,GFS,目录号2301)的成纤维细胞培养基(ScienCell,FM培养基,目录号2301)中,培养箱为37℃及5%CO
2,持续2-3天。当细胞为90%汇合时,将其用0.25%的胰蛋白酶消化,然后用含有15%血清的成纤维细胞培养基终止消化。根据操作说明书,使用
(天根生化科技(北京)有限公司,TIANGEN Biotech(Beijing)Co.,Ltd.)细胞DNA提取试剂盒(目录号DP304-03)进行DNA提取。
使用NCBI-Primer blast(网站:https://www.ncbi.nlm.nih.gov/tools/primer-blast/)设计IDUA突变位点上游和下游序列的引物。SEQ ID NO:304:CGCTTCCAGGTCAACAACAC(正向引物hIDUA-F1);SEQ ID NO:305:CTCGCGTAGATCAGCACCG(反向引物hIDUA-R1)。进行PCR,并对PCR产物进行Sanger测序。如图34所示,经确认该细胞的突变是导致该疾病的G至A突变。
实施例18.GM06214细胞的转染条件测试
当GM06214达到90%汇合度时消化GM06214细胞,并在消化终止后计数。对于电转染,将600万个细胞用400μl预混合的电转染溶液(Lonza,目录号:V4XP-3024)重悬,并加入20μg GFP质粒(Lonza,目录号:V4XP-3024)。混合后,取20μl悬浮液作为电转染体系,以使用Lonza NucleofectorTM仪器测试8种条件中的每一种,所述8种条件包括7种测试电转染条件(参见图35)和一个阴性对照。每种条件的测试做一个重复。电转染后,将细胞迅速转移到含有15%血清的2ml成纤维细胞培养基(ScienCell,FM培养基,目录号:2301)中。将每种条件的细胞铺板至2个孔(6孔培养板)中,并在5%CO2和37℃的培养箱中进行培养。电转染后24小时,消化每种电转染条件的2个孔其中一孔的细胞,通过流式细胞仪测量GFP阳性细胞的比例。电转染后48小时,消化每种电转染条件的2个孔中的另一孔中的细胞,并通过流式细胞仪测量GFP阳性细胞的比例。如图35所示,细胞的最佳电转染条件是CA-137条件。
实施例19.IDUA酶活性和A至G突变率的检测
设计和合成寡聚dRNA,用于靶向由IDUA基因转录的具有pre-mRNA和成熟RNA的突变位点的序列。dRNA的序列如下所示。所有的dRNA序列都以CM0模式进行了修饰(2'-O-甲基化位于序列首尾各3个核苷酸,序列的首尾各3个核苷酸间连接是硫代磷酸酯化的)。
SEQ ID NO 204:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauccagcagcgccagcagcgcaccccuggggugagcaccggcuu(Pre-55nt-c-55nt);
SEQ ID NO 205:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug(m-55nt-c-55nt);
SEQ ID NO 341:uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccggauguucuccgcggggauaucgcgauauucaggauuaaaagaagugc(随机-111nt)。
其中,合成的dRNA中与突变的碱基相对应的碱基是C,其在结合时与突变的碱基形成A-C错配。合成的dRNA的长度优选为111nt。使用实施例2中获得的最佳电转染条件电转染细胞。电转染后48小时,收集细胞用于酶活性测定和A至G突变率检测。
测定A至G突变率:
将设计的dRNA溶解在无RNA酶的水中(TransGene Biotech,目录号:GI201-01)至所需浓度,并储存在-80℃。当GM06214细胞生长至约90%汇合度时,将细胞消化,并在消化终止后计数。将100万个细胞和200pmol的dRNA混合并稀释至100μl,然后在CA-137的条件下进行电转染。电转染后48小时,对细胞计数并测量其生活力。将细胞转移至无RNA酶的离心管中并进行离心。丢弃上清液。使用QIAGEN RNA提取试剂盒(QIAGEN,目录号74134)提取RNA。根据说明,通过吸液将0.35ml缓冲液RLT Plus与5×105个细胞混合(如果直接从冷冻细胞中提取RNA,建议细胞用PBS洗涤一次)。将细胞裂解液转移至gDNA Eliminator旋转柱(spin column),并在≥8000g离心30s。丢弃柱子并保留液体。加入与液体相同体积的70%乙醇。混合后,立即将混合物转移到RNeasyMinElute旋转柱中,并在≥8000g离心15s,并丢弃废液。将700μl的缓冲液RW1添加到RNeasyMinElute旋转柱中,并在≥8000g离心15s。丢弃废液,加入500μl缓冲液RPE,然后将RNeasyMinElute旋转柱在≥8000g离心15s。丢弃废液,加入500μl的80%乙醇,然后将RNeasyMinElute旋转柱在≥8000g离心2分钟。丢弃废液。将RNeasyMinElute丢柱放入新的2ml收集柱中,并盖上盖在最大速度离心5分钟以干燥柱子。将RNeasyMinElute旋转柱放入新的1.5ml收集柱中,并将14μl无RNA酶的水滴加到柱膜的中央,然后将柱子以最大速度离心1分钟以洗脱RNA。
通过Nanodrop(Thermo,Nanodrop2000)测定提取的RNA的浓度,并将1μg RNA进行逆转录(Thermo,逆转录酶,目录号28025013)。逆转录体系如表5-6所示。在65℃温育5分钟后,立即在冰浴中冷却逆转录体系。在37℃继续温育50分钟。逆转录酶在70℃灭活15分钟。在表7所示的条件下进行PCR。PCR后,取2μl PCR产物用于琼脂糖凝胶电泳。根据电泳结果,确定PCR产物的浓度,以及条带大小是否正确。纯化后,用PCR产物制备文库以用于二代测序。
表5.逆转录体系-1
65℃,5分钟,并立即转移到冰上
表6.逆转录体系-2
|
体积(ul) |
表5的产物 |
12μl |
5X First-Strand缓冲液 |
4 |
0.1M DTT |
2 |
RNaseOUT<sup>TM</sup>重组核糖核酸酶抑制剂 |
1 |
M-MLV |
1 |
总体积 |
20 |
表7.PCR条件
本实施例中的酶活性测定:
将GM06214细胞消化,离心并重悬于28μl含有0.1%Triton X-100的1×PBS中,并在冰上裂解30分钟。然后将25μl细胞裂解液添加到25μl含190μm 4-甲基伞形酮-α-L-艾杜糖醛酸酶(4-methylumbelliferyl-α-L-iduronidase,Cayman,2A-19543-500,溶于含有0.2%Triton X-100,pH 3.5的0.4M甲酸钠缓冲液)中,在暗处于37℃温育90分钟。加入pH为10.3的200μl 0.5M NaOH/甘氨酸溶液(北京化工(Beijing Chemical Works),NAOH,目录号:AR500G;Solarbio,甘氨酸,目录号G8200)灭活催化反应。在4℃离心2分钟后,将其上清液转移至96孔板,使用Infinite M200仪器(TECAN)测定荧光值。激发光的波长为365nm和450nm。荧光表示酶活性,在图中表示为GM01323中酶活性的倍数。
如图36所示,结果是靶向pre-mRNA的dRNA引起的酶活性和A至G突变率显著高于靶向成熟mRNA的那些。因此,以下实施例中使用的dRNA均靶向(pre-mRNA。
实施例20.电转染化学修饰的dRNA后IDUA-报道分子细胞系中编辑效率的检测
如图37A所示,将侧翼分别具有约100bp的IDUA突变位点的序列插入慢病毒质粒上表达mcherry和GFP蛋白的序列之间来构建质粒。将构建的质粒包装到病毒中,之后用于感染293T细胞。整合到基因组后,选择IDUA报道分子单克隆细胞。因为单克隆细胞受到插入序列中IDUA突变位点的TAG终止密码子的影响,所以它们仅表达mcherry蛋白。当细胞被dRNA编辑时,TAG(然后突变为TGG)后的GFP可正常表达。因此,GFP的表达被视为细胞中dRNA的编辑效率。如下表8所示,设计了4种优选的具有从51nt至111nt的不同长度的dRNA。所有的dRNA序列都以CM0模式修饰。在实施例18的电转染条件下,用不同长度的dRNA电转染细胞。在转染后第1天至第7天的每一天,通过确定细胞中GFP的比例初步地评价编辑效率。如图37B所示,编辑效率的峰值出现在第二天(48h)。最高编辑效率的序列是91nt:45-c-45,其高于111nt:55-c-55的编辑效率。因此,并非在所有情况下dRNA越长,编辑效率越高。此外,51nt dRNA的编辑效率很低。
表8.
实施例21.在用化学修饰的不同长度的dRNA转染后在不同时间点,测定GM06214细胞中细胞内IDUA酶活性和RNA编辑效率
使用实施例18(参见表7)中用于将不同长度的dRNA电转染至GM06214细胞中的条件,和使用实施例19中测定酶活性和编辑效率的方法。在电转染后的第2、4、6、8、10、12和14日,测试细胞内酶活性。在第2天和第4天,测试细胞中RNA编辑的效率。如图38A所示,91nt:45-c-45引起最高的酶活性,并且IDUA酶活性一直保持高水平直至电转染后第6天。在图38B中,91nt的dRNA和111nt的dRNA呈现大致相同的编辑效率。同样,51nt的dRNA显示低的编辑效率。
实施例22.筛选化学修饰的dRNA的优选序列
通过研究文献,我们认为电转染不适合将来的疾病治疗。因此,我们将电转染换成了Lipofectamine RNAiMAX(Invitrogen,目录号13778-150),用于将dRNA转染到细胞中。结果表明,Lipofectamine RNAiMAX具有比电转染更高的转染效率。首先将序列在两个末端同时截短,然后固定该序列的一个端,截短另一端。以这种方式,获得了14个dRNA和等长的4个随机序列,如下表9所示。所有的dRNA序列都以CM0模式修饰。如图39所示,在转染后48小时测定IDUA酶活性(图39A,使用实施例19中所述的方法)和RNA编辑效率(图39B,使用NGS)。事实证明,由81nt:55-c-25(SEQ ID NO 24)和71nt:55-c-15(SEQ ID NO 25)引起的IDUA酶活性和RNA编辑效率高于其他dRNA引起的IDUA酶活性和RNA编辑效率。具有较短3'端和较长5'端的dRNA总是具有较高的效率。此外,无论3'或5'端如何变化,当dRNA的长度减少至61nt或更少时,其编辑效率似乎都戏剧性地下降。
表9.
实施例23.确定化学修饰的dRNA的3'末端的任选长度
在实施例22中,在由具有81nt:55-c-25和71nt:55-c-15序列的dRNA编辑的细胞中检测到较高的IDUA酶活性和编辑效率。为了找出3'端的最短和最佳长度,将3'端的序列从25nt(81nt:55-c-25)截短至5nt(61nt:55-c-5),如表10所示。所有dRNA序列均以CM0模式修饰。在分别用81nt:55-c-25至66nt:55-c-10的dRNA转染的细胞(图40A)和分别用72nt:55-c-16至61nt:55-c-5的dRNA转染的细胞上(图40B)进行了两次IDUA酶活性测定。3'端长度从25nt到9nt的dRNA轻易地将GM06214细胞中的酶促活性提高到GM0123细胞的20倍以上。因此,3'端的最佳长度为25nt-7nt。此外,与具有3'和5'端的长度相等的45nt-c-45nt相比,具有较短3'端的dRNA总是具有更高的编辑效率。
本文使用的IDUA酶活性测定描述如下。转染前一天,将每孔3×105个细胞铺板在6孔板中。转染当天换上新的培养基。使用20nM Lipofectamine RNAiMAX试剂转染后48小时,将GM06214细胞消化,离心并重悬于33μl的含0.1%Triton X-100的1×PBS中,并在冰上裂解30分钟。然后将裂解液在4℃离心2分钟。将25μl细胞裂解液添加到25μl的含190μM 4-甲基伞形甲酰基-α-L-艾杜糖苷酸酶(4-methylumbelliferyl-α-L-iduronidase,Glycosynth,44076)的底物中,该底物溶解于0.4M含有0.2%Triton X-100(pH 3.5)的甲酸钠缓冲液,并在黑暗中于37℃温育30分钟。加入pH为10.3的200μl 0.5M NaOH/甘氨酸溶液(北京化工,NAOH,目录号:AR500G;Solarbio,甘氨酸,目录号:G8200)以灭活催化反应。将其全部上清液用Infinite M200仪器(TECAN)进行检测。激发光的波长为365nm和450nm。酶活性表示为GM01323中酶活性的倍数。
表10.
实施例24.在3'端长度固定时确定化学修饰的dRNA的5'端任选长度
在两种不同长度(76nt:55-c-20和71nt:55-c-15)的dRNA上分别进行5'端截短。如表11所示,其3'端长度固定,5'端逐渐被截短。所有dRNA序列均以CM0模式修饰。如图41所示,根据IDUA酶活性测定的结果可知,5'端在55nt和45nt之间的dRNA转染的细胞具有较高的IDUA酶活性。转染使用Lipofectamine RNAiMAX。根据图39,当长度减少到小于61nt时,即使是3'和5'末端长度不等的dRNA的编辑效率都戏剧性地降低。
表11.
实施例27.确定靶向核苷酸位置与化学修饰的dRNA对IDUA突变位点的编辑效率之间的关系
根据以上数据,dRNA的编辑效率与靶向核苷酸在dRNA上的长度和位置有关。通常,靶向核苷酸越靠近5'端,编辑效率越低。因此,在本实施例中,设计了具有3种固定长度的3组dRNA。每组中的dRNA都是通过将靶向核苷酸从序列中间逐渐移向5'末端设计而成的。避开了不容易合成的结构。序列如表12所示。所有dRNA序列均以CM0模式修饰。使用Lipofectamine RNAiMAX将dRNA转染到GM06214细胞中。48小时后,收获细胞并根据实施例23中所述的方法测试酶活性。根据如图42所示的数据,至少当dRNA的总长度固定为67nt,70nt或72nt时,靶向核苷酸的位置变化似乎并不影响代表编辑效率的酶活性。
表12.
实施例28.化学修饰对dRNA编辑效率的影响
合成RNA的化学修饰增加了RNA稳定性并降低了脱靶的可能性。RNA相对常见的化学修饰是2'-O-甲基化(2'-O-Me)和硫代磷酸酯连接。具有不同长度:71nt或76nt以及化学修饰的组合的dRNA如表13所示。使用Lipofectamine RNAiMAX用不同的dRNA转染GM06214细胞,以编辑细胞内IDUA。转染48小时后收集细胞,并使用实施例23中所示的方法测定IDUA酶活性。根据在图42A中所示的结果,除CM5外(第五种修饰:除靶向核苷酸和其两侧各5nt外,所有核苷酸均被2'-O-Me修饰),所有修饰均引起良好的酶活性。对靶向核苷酸或与其最邻近的两个核苷酸进行的修饰不会降低编辑效率。
通过计算A到G的取代率来进一步测定编辑效率。该方法描述如下:在GM06214细胞的IDUA基因中包含靶标腺苷的序列是CTAG,其在使用dRNA进行RNA编辑后被突变为CTGG。CTAG是限制性内切酶BfaI的识别位点。因此,成功的A到G取代不导致被BfaI消化,而野生型被BfaI消化。编辑后,提取GM06214细胞的RNA并逆转录为cDNA。使用cDNA进行PCR。引物是hIDUA-62F:CCTTCCTGAGCTACCACCCG(SEQ ID NO:415)和hIDUA-62R:CCAGGGCTCGAACTCGGTAG(SEQ ID NO:416)。PCR后,将产物纯化并与BfaI(NEB,目录号:R0568L)一起温育。使用琼脂糖凝胶电泳确定A到G的取代率或编辑效率。结果表示为未切割部分(有A到G取代)相对PCR产物中总核酸的百分比,其使用凝胶电泳图像的灰度值计算。结果如图42B所示。这与图42A中酶活性测定的结果相似。
表13.
注:“m”指核苷酸核糖上的2'-O-Me,“*”是指硫代磷酸酯化连接。
实施例29.对修饰模式的进一步验证
在另一序列上对CM1的修饰模式进行了测试。使用现有技术中优选的修饰模式作为对照。如表14所示,测试序列为55nt-c-15nt-CM1,36nt-c-13nt-CM11为阳性对照,其中,除编辑三联体“CCA”外,所有核苷酸均用2'-O-Me修饰,并且首尾各四个核苷酸间连接被硫代磷酸酯化。另外,36nt-c-13nt-CM11仅为51nt,这在本发明中不是优选的长度,而在现有技术中是一种优选的长度。使用Lipofectamine RNAiMAX将dRNA转染至GM06214细胞后48小时,使用实施例23所示的方法检测IDUA酶活性。如图44所示,55nt-c-15nt-CM1具有比36nt-c-13nt-CM11显著更高的编辑效率。
表14.
注:“m”指核苷酸核糖上的2-O'-Me,“*”是指硫代磷酸酯化连接。
实施例30.在其它细胞中进一步测试dRNA
该实施例集中于使用LEAPER技术修复USH2A c.11864G>A(p.Trp3955*)突变。在此实施例中设计的报道分子系统如图45A所示。在USH2A c.11864G>A(p.Trp3955*)的情况下,正常的TGG序列被突变为中止密码子TAG。因此,突变的mRNA的翻译会在该TAG处提前终止。293T(293T细胞来自北京大学C.Zhang的实验室)报道分子系统是一种慢病毒载体,如上图45A所示的mRNA由CMV启动子驱动。该系统包括以下部分:1)可稳定表达的mCherry红色荧光蛋白,2)USH2A基因的突变位点及其两侧相邻的100个碱基对,3)GFP绿色荧光蛋白。成功编辑突变位点时,TAG密码子将转换为TIG,从而允许翻译继续进行,并且USH2A序列后的GFP可以正常翻译。因此,GFP的表达代表了编辑效率。
dRNA在体外合成。该实施例中使用的所有dRNA序列如表15所示。所有dRNA序列均以CM0模式修饰。测试的具体步骤如下:
293T报告分子细胞在含10%FBS(Vistech,SE100-011)的DMEM(HycloneSH30243.01)中培养。汇合时,将细胞以15,000个细胞/孔转移到12孔板中。时间记录为0小时。
在24小时,使用Lipofectamine RNAiMAX试剂(Invitrogen 13778150)用12.5pmol的dRNA转染各孔中的293T细胞。转染方案由产品手册提供。
在72小时,用胰蛋白酶(Invitrogen,13778-150)消化每个孔中的细胞,并使用流式细胞仪检测FITC(异硫氰酸荧光素)的强度。
如图45B所示,为3'和5'端长度相等的dRNA在细胞中的编辑效率。NC代表没有dRNA转染的对照细胞。根据上述实施例,用111nt,91nt和71nt的dRNA转染的细胞的GFP阳性率超过90%,而用51nt dRNA转染的细胞导致GFP阳性率非常低。由左侧的MFI(平均荧光强度)的数据,111nt dRNA导致荧光强度最高。
如图45C所示,分别将3'和5'端长度不同的dRNA和3'和5'端相等的111nt dRNA分别转染到细胞中。如本实施例中所使用的,具有55nt 5'端的dRNA,其3'端为55nt,45nt,35nt,25nt或5nt。类似地,具有55nt 3'末端的dRNA,其5'端为55nt,45nt,35nt,25nt或5nt。根据图45C的结果,当dRNA的长度减少到61nt时,编辑效率戏剧性地下降,而较长的dRNA具有明显更高的编辑效率。其中,55nt-c-25nt的dRNA具有最高的编辑效率。因此,将dRNA的3'端固定为25nt,而5'端的长度从55nt到25nt不等。用这些dRNA转染的细胞的结果显示在图45D中。有来自两个不同批次的两个55nt-c-25nt的dRNA。显然5'端越短,编辑效率越低。另外,图45D中的结果再次表明,为了确保编辑效率,dRNA的长度优选地不小于61nt。
表15.
ADAR1(p110)cDNA
5’-atggccgagatcaaggagaaaatctgcgactatctcttcaatgtgtctgactcctctgccctgaatttggctaaaaatattggccttaccaaggcccgagatataaatgctgtgctaattgacatggaaaggcagggggatgtctatagacaagggacaacccctcccatatggcatttgacagacaagaagcgagagaggatgcaaatcaagagaaatacgaacagtgttcctgaaaccgctccagctgcaatccctgagaccaaaagaaacgcagagttcctcacctgtaatatacccacatcaaatgcctcaaataacatggtaaccacagaaaaagtggagaatgggcaggaacctgtcataaagttagaaaacaggcaagaggccagaccagaaccagcaagactgaaaccacctgttcattacaatggcccctcaaaagcagggtatgttgactttgaaaatggccagtgggccacagatgacatcccagatgacttgaatagtatccgcgcagcaccaggtgagtttcgagccatcatggagatgccctccttctacagtcatggcttgccacggtgttcaccctacaagaaactgacagagtgccagctgaagaaccccatcagcgggctgttagaatatgcccagttcgctagtcaaacctgtgagttcaacatgatagagcagagtggaccaccccatgaacctcgatttaaattccaggttgtcatcaatggccgagagtttcccccagctgaagctggaagcaagaaagtggccaagcaggatgcagctatgaaagccatgacaattctgctagaggaagccaaagccaaggacagtggaaaatcagaagaatcatcccactattccacagagaaagaatcagagaagactgcagagtcccagacccccaccccttcagccacatccttcttttctgggaagagccccgtcaccacactgcttgagtgtatgcacaaattggggaactcctgcgaattccgtctcctgtccaaagaaggccctgcccatgaacccaagttccaatactgtgttgcagtgggagcccaaactttccccagtgtgagtgctcccagcaagaaagtggcaaagcagatggccgcagaggaagccatgaaggccctgcatggggaggcgaccaactccatggcttctgataaccagcctgaaggtatgatctcagagtcacttgataacttggaatccatgatgcccaacaaggtcaggaagattggcgagctcgtgagatacctgaacaccaaccctgtgggtggccttttggagtacgcccgctcccatggctttgctgctgaattcaagttggtcgaccagtccggacctcctcacgagcccaagttcgtttaccaagcaaaagttgggggtcgctggttcccagccgtctgcgcacacagcaagaagcaaggcaagcaggaagcagcagatgcggctctccgtgtcttgattggggagaacgagaaggcagaacgcatgggtttcacagaggtaaccccagtgacaggggccagtctcagaagaactatgctcctcctctcaaggtccccagaagcacagccaaagacactccctctcactggcagcaccttccatgaccagatagccatgctgagccaccggtgcttcaacactctgactaacagcttccagccctccttgctcggccgcaagattctggccgccatcattatgaaaaaagactctgaggacatgggtgtcgtcgtcagcttgggaacagggaatcgctgtgtaaaaggagattctctcagcctaaaaggagaaactgtcaatgactgccatgcagaaataatctcccggagaggcttcatcaggtttctctacagtgagttaatgaaatacaactcccagactgcgaaggatagtatatttgaacctgctaagggaggagaaaagctccaaataaaaaagactgtgtcattccatctgtatatcagcactgctccgtgtggagatggcgccctctttgacaagtcctgcagcgaccgtgctatggaaagcacagaatcccgccactaccctgtcttcgagaatcccaaacaaggaaagctccgcaccaaggtggagaacggagaaggcacaatccctgtggaatccagtgacattgtgcctacgtgggatggcattcggctcggggagagactccgtaccatgtcctgtagtgacaaaatcctacgctggaacgtgctgggcctgcaaggggcactgttgacccacttcctgcagcccatttatctcaaatctgtcacattgggttaccttttcagccaagggcatctgacccgtgctatttgctgtcgtgtgacaagagatgggagtgcatttgaggatggactacgacatccctttattgtcaaccaccccaaggttggcagagtcagcatatatgattccaaaaggcaatccgggaagactaaggagacaagcgtcaactggtgtctggctgatggctatgacctggagatcctggacggtaccagaggcactgtggatgggccacggaatgaattgtcccgggtctccaaaaagaacatttttcttctatttaagaagctctgctccttccgttaccgcagggatctactgagactctcctatggtgaggccaagaaagctgcccgtgactacgagacggccaagaactacttcaaaaaaggcctgaaggatatgggctatgggaactggattagcaaaccccaggaggaaaagaacttttatctctgcccagtagattacaaggatgacgacgataag(标记标签)TAG-3’(SEQ ID NO:332)
ADAR1(p150)cDNA
5’atgaatccgcggcaggggtattccctcagcggatactacacccatccatttcaaggctatgagcacagacagctcagataccagcagcctgggccaggatcttcccccagtagtttcctgcttaagcaaatagaatttctcaaggggcagctcccagaagcaccggtgattggaaagcagacaccgtcactgccaccttccctcccaggactccggccaaggtttccagtactacttgcctccagtaccagaggcaggcaagtggacatcaggggtgtccccaggggcgtgcatctcggaagtcaggggctccagagagggttccagcatccttcaccacgtggcaggagtctgccacagagaggtgttgattgcctttcctcacatttccaggaactgagtatctaccaagatcaggaacaaaggatcttaaagttcctggaagagcttggggaagggaaggccaccacagcacatgatctgtctgggaaacttgggactccgaagaaagaaatcaatcgagttttatactccctggcaaagaagggcaagctacagaaagaggcaggaacaccccctttgtggaaaatcgcggtctccactcaggcttggaaccagcacagcggagtggtaagaccagacggtcatagccaaggagccccaaactcagacccgagtttggaaccggaagacagaaactccacatctgtctcagaagatcttcttgagccttttattgcagtctcagctcaggcttggaaccagcacagcggagtggtaagaccagacagtcatagccaaggatccccaaactcagacccaggtttggaacctgaagacagcaactccacatctgccttggaagatcctcttgagtttttagacatggccgagatcaaggagaaaatctgcgactatctcttcaatgtgtctgactcctctgccctgaatttggctaaaaatattggccttaccaaggcccgagatataaatgctgtgctaattgacatggaaaggcagggggatgtctatagacaagggacaacccctcccatatggcatttgacagacaagaagcgagagaggatgcaaatcaagagaaatacgaacagtgttcctgaaaccgctccagctgcaatccctgagaccaaaagaaacgcagagttcctcacctgtaatatacccacatcaaatgcctcaaataacatggtaaccacagaaaaagtggagaatgggcaggaacctgtcataaagttagaaaacaggcaagaggccagaccagaaccagcaagactgaaaccacctgttcattacaatggcccctcaaaagcagggtatgttgactttgaaaatggccagtgggccacagatgacatcccagatgacttgaatagtatccgcgcagcaccaggtgagtttcgagccatcatggagatgccctccttctacagtcatggcttgccacggtgttcaccctacaagaaactgacagagtgccagctgaagaaccccatcagcgggctgttagaatatgcccagttcgctagtcaaacctgtgagttcaacatgatagagcagagtggaccaccccatgaacctcgatttaaattccaggttgtcatcaatggccgagagtttcccccagctgaagctggaagcaagaaagtggccaagcaggatgcagctatgaaagccatgacaattctgctagaggaagccaaagccaaggacagtggaaaatcagaagaatcatcccactattccacagagaaagaatcagagaagactgcagagtcccagacccccaccccttcagccacatccttcttttctgggaagagccccgtcaccacactgcttgagtgtatgcacaaattggggaactcctgcgaattccgtctcctgtccaaagaaggccctgcccatgaacccaagttccaatactgtgttgcagtgggagcccaaactttccccagtgtgagtgctcccagcaagaaagtggcaaagcagatggccgcagaggaagccatgaaggccctgcatggggaggcgaccaactccatggcttctgataaccagcctgaaggtatgatctcagagtcacttgataacttggaatccatgatgcccaacaaggtcaggaagattggcgagctcgtgagatacctgaacaccaaccctgtgggtggccttttggagtacgcccgctcccatggctttgctgctgaattcaagttggtcgaccagtccggacctcctcacgagcccaagttcgtttaccaagcaaaagttgggggtcgctggttcccagccgtctgcgcacacagcaagaagcaaggcaagcaggaagcagcagatgcggctctccgtgtcttgattggggagaacgagaaggcagaacgcatgggtttcacagaggtaaccccagtgacaggggccagtctcagaagaactatgctcctcctctcaaggtccccagaagcacagccaaagacactccctctcactggcagcaccttccatgaccagatagccatgctgagccaccggtgcttcaacactctgactaacagcttccagccctccttgctcggccgcaagattctggccgccatcattatgaaaaaagactctgaggacatgggtgtcgtcgtcagcttgggaacagggaatcgctgtgtaaaaggagattctctcagcctaaaaggagaaactgtcaatgactgccatgcagaaataatctcccggagaggcttcatcaggtttctctacagtgagttaatgaaatacaactcccagactgcgaaggatagtatatttgaacctgctaagggaggagaaaagctccaaataaaaaagactgtgtcattccatctgtatatcagcactgctccgtgtggagatggcgccctctttgacaagtcctgcagcgaccgtgctatggaaagcacagaatcccgccactaccctgtcttcgagaatcccaaacaaggaaagctccgcaccaaggtggagaacggagaaggcacaatccctgtggaatccagtgacattgtgcctacgtgggatggcattcggctcggggagagactccgtaccatgtcctgtagtgacaaaatcctacgctggaacgtgctgggcctgcaaggggcactgttgacccacttcctgcagcccatttatctcaaatctgtcacattgggttaccttttcagccaagggcatctgacccgtgctatttgctgtcgtgtgacaagagatgggagtgcatttgaggatggactacgacatccctttattgtcaaccaccccaaggttggcagagtcagcatatatgattccaaaaggcaatccgggaagactaaggagacaagcgtcaactggtgtctggctgatggctatgacctggagatcctggacggtaccagaggcactgtggatgggccacggaatgaattgtcccgggtctccaaaaagaacatttttcttctatttaagaagctctgctccttccgttaccgcagggatctactgagactctcctatggtgaggccaagaaagctgcccgtgactacgagacggccaagaactacttcaaaaaaggcctgaaggatatgggctatgggaactggattagcaaaccccaggaggaaaagaacttttatctctgcccagtagattacaaggatgacgacgataaG(标记标签)TAG-3’(SEQ ID NO:333)
ADAR2 cDNA
5’-atggatatagaagatgaagaaaacatgagttccagcagcactgatgtgaaggaaaaccgcaatctggacaacgtgtcccccaaggatggcagcacacctgggcctggcgagggctctcagctctccaatgggggtggtggtggccccggcagaaagcggcccctggaggagggcagcaatggccactccaagtaccgcctgaagaaaaggaggaaaacaccagggcccgtcctccccaagaacgccctgatgcagctgaatgagatcaagcctggtttgcagtacacactcctgtcccagactgggcccgtgcacgcgcctttgtttgtcatgtctgtggaggtgaatggccaggtttttgagggctctggtcccacaaagaaaaaggcaaaactccatgctgctgagaaggccttgaggtctttcgttcagtttcctaatgcctctgaggcccacctggccatggggaggaccctgtctgtcaacacggacttcacatctgaccaggccgacttccctgacacgctcttcaatggttttgaaactcctgacaaggcggagcctcccttttacgtgggctccaatggggatgactccttcagttccagcggggacctcagcttgtctgcttccccggtgcctgccagcctagcccagcctcctctccctgccttaccaccattcccacccccgagtgggaagaatcccgtgatgatcttgaacgaactgcgcccaggactcaagtatgacttcctctccgagagcggggagagccatgccaagagcttcgtcatgtctgtggtcgtggatggtcagttctttgaaggctcggggagaaacaagaagcttgccaaggcccgggctgcgcagtctgccctggccgccatttttaacttgcacttggatcagacgccatctcgccagcctattcccagtgagggtcttcagctgcatttaccgcaggttttagctgacgctgtctcacgcctggtcctgggtaagtttggtgacctgaccgacaacttctcctcccctcacgctcgcagaaaagtgctggctggagtcgtcatgacaacaggcacagatgttaaagatgccaaggtgataagtgtttctacaggaacaaaatgtattaatggtgaatacatgagtgatcgtggccttgcattaaatgactgccatgcagaaataatatctcggagatccttgctcagatttctttatacacaacttgagctttacttaaataacaaagatgatcaaaaaagatccatctttcagaaatcagagcgaggggggtttaggctgaaggagaatgtccagtttcatctgtacatcagcacctctccctgtggagatgccagaatcttctcaccacatgagccaatcctggaagaaccagcagatagacacccaaatcgtaaagcaagaggacagctacggaccaaaatagagtctggtgaggggacgattccagtgcgctccaatgcgagcatccaaacgtgggacggggtgctgcaaggggagcggctgctcaccatgtcctgcagtgacaagattgcacgctggaacgtggtgggcatccagggatccctgctcagcattttcgtggagcccatttacttctcgagcatcatcctgggcagcctttaccacggggaccacctttccagggccatgtaccagcggatctccaacatagaggacctgccacctctctacaccctcaacaagcctttgctcagtggcatcagcaatgcagaagcacggcagccagggaaggcccccaacttcagtgtcaactggacggtaggcgactccgctattgaggtcatcaacgccacgactgggaaggatgagctgggccgcgcgtcccgcctgtgtaagcacgcgttgtactgtcgctggatgcgtgtgcacggcaaggttccctcccacttactacgctccaagattaccaaacccaacgtgtaccatgagtccaagctggcggcaaaggagtaccaggccgccaaggcgcgtctgttcacagccttcatcaaggcggggctgggggcctgggtggagaagcccaccgagcaggaccagttctcactcacgcccgattacaaggatgacgacgataag(标记标签)TAG-3’(SEQ ID NO:334)
疾病相关基因的编码序列(CDS)
COL3A1
5’-atgatgagctttgtgcaaaaggggagctggctacttctcgctctgcttcatcccactattattttggcacaacaggaagctgttgaaggaggatgttcccatcttggtcagtcctatgcggatagagatgtctggaagccagaaccatgccaaatatgtgtctgtgactcaggatccgttctctgcgatgacataatatgtgacgatcaagaattagactgccccaacccagaaattccatttggagaatgttgtgcagtttgcccacagcctccaactgctcctactcgccctcctaatggtcaaggacctcaaggccccaagggagatccaggccctcctggtattcctgggagaaatggtgaccctggtattccaggacaaccagggtcccctggttctcctggcccccctggaatctgtgaatcatgccctactggtcctcagaactattctccccagtatgattcatatgatgtcaagtctggagtagcagtaggaggactcgcaggctatcctggaccagctggccccccaggccctcccggtccccctggtacatctggtcatcctggttcccctggatctccaggataccaaggaccccctggtgaacctgggcaagctggtccttcaggccctccaggacctcctggtgctataggtccatctggtcctgctggaaaagatggagaatcaggtagacccggacgacctggagagcgaggattgcctggacctccaggtatcaaaggtccagctgggatacctggattccctggtatgaaaggacacagaggcttcgatggacgaaatggagaaaagggtgaaacaggtgctcctggattaaagggtgaaaatggtcttccaggcgaaaatggagctcctggacccatgggtccaagaggggctcctggtgagcgaggacggccaggacttcctggggctgcaggtgctcggggtaatgacggtgctcgaggcagtgatggtcaaccaggccctcctggtcctcctggaactgccggattccctggatcccctggtgctaagggtgaagttggacctgcagggtctcctggttcaaatggtgcccctggacaaagaggagaacctggacctcagggacacgctggtgctcaaggtcctcctggccctcctgggattaatggtagtcctggtggtaaaggcgaaatgggtcccgctggcattcctggagctcctggactgatgggagcccggggtcctccaggaccagccggtgctaatggtgctcctggactgcgaggtggtgcaggtgagcctggtaagaatggtgccaaaggagagcccggaccacgtggtgaacgcggtgaggctggtattccaggtgttccaggagctaaaggcgaagatggcaaggatggatcacctggagaacctggtgcaaatgggcttccaggagctgcaggagaaaggggtgcccctgggttccgaggacctgctggaccaaatggcatcccaggagaaaagggtcctgctggagagcgtggtgctccaggccctgcagggcccagaggagctgctggagaacctggcagagatggcgtccctggaggtccaggaatgaggggcatgcccggaagtccaggaggaccaggaagtgatgggaaaccagggcctcccggaagtcaaggagaaagtggtcgaccaggtcctcctgggccatctggtccccgaggtcagcctggtgtcatgggcttccccggtcctaaaggaaatgatggtgctcctggtaagaatggagaacgaggtggccctggaggacctggccctcagggtcctcctggaaagaatggtgaaactggacctcagggacccccagggcctactgggcctggtggtgacaaaggagacacaggaccccctggtccacaaggattacaaggcttgcctggtacaggtggtcctccaggagaaaatggaaaacctggggaaccaggtccaaagggtgatgccggtgcacctggagctccaggaggcaagggtgatgctggtgcccctggtgaacgtggacctcctggattggcaggggccccaggacttagaggtggagctggtccccctggtcccgaaggaggaaagggtgctgctggtcctcctgggccacctggtgctgctggtactcctggtctgcaaggaatgcctggagaaagaggaggtcttggaagtcctggtccaaagggtgacaagggtgaaccaggcggtccaggtgctgatggtgtcccagggaaagatggcccaaggggtcctactggtcctattggtcctcctggcccagctggccagcctggagataagggtgaaggtggtgcccccggacttccaggtatagctggacctcgtggtagccctggtgagagaggtgaaactggccctccaggacctgctggtttccctggtgctcctggacagaatggtgaacctggtggtaaaggagaaagaggggctccgggtgagaaaggtgaaggaggccctcctggagttgcaggaccccctggaggttctggacctgctggtcctcctggtccccaaggtgtcaaaggtgaacgtggcagtcctggtggacctggtgctgctggcttccctggtgctcgtggtcttcctggtcctcctggtagtaatggtaacccaggacccccaggtcccagcggttctccaggcaaggatgggcccccaggtcctgcgggtaacactggtgctcctggcagccctggagtgtctggaccaaaaggtgatgctggccaaccaggagagaagggatcgcctggtgcccagggcccaccaggagctccaggcccacttgggattgctgggatcactggagcacggggtcttgcaggaccaccaggcatgccaggtcctaggggaagccctggccctcagggtgtcaagggtgaaagtgggaaaccaggagctaacggtctcagtggagaacgtggtccccctggaccccagggtcttcctggtctggctggtacagctggtgaacctggaagagatggaaaccctggatcagatggtcttccaggccgagatggatctcctggtggcaagggtgatcgtggtgaaaatggctctcctggtgcccctggcgctcctggtcatccaggcccacctggtcctgtcggtccagctggaaagagtggtgacagaggagaaagtggccctgctggccctgctggtgctcccggtcctgctggttcccgaggtgctcctggtcctcaaggcccacgtggtgacaaaggtgaaacaggtgaacgtggagctgctggcatcaaaggacatcgaggattccctggtaatccaggtgccccaggttctccaggccctgctggtcagcagggtgcaatcggcagtccaggacctgcaggccccagaggacctgttggacccagtggacctcctggcaaagatggaaccagtggacatccaggtcccattggaccaccagggcctcgaggtaacagaggtgaaagaggatctgagggctccccaggccacccagggcaaccaggccctcctggacctcctggtgcccctggtccttgctgtggtggtgttggagccgctgccattgctgggattggaggtgaaaaagctggcggttttgccccgtattatggagatgaaccaatggatttcaaaatcaacaccgatgagattatgacttcactcaagtctgttaatggacaaatagaaagcctcattagtcctgatggttctcgtaaaaaccccgctagaaactgcagagacctgaaattctgccatcctgaactcaagagtggagaatactgggttgaccctaaccaaggatgcaaattggatgctatcaaggtattctgtaatatggaaactggggaaacatgcataagtgccaatcctttgaatgttccacggaaacactggtggacagattctagtgctgagaagaaacacgtttggtttggagagtccatggatggtggttttcagtttagctacggcaatcctgaacttcctgaagatgtccttgatgtgcagctggcattccttcgacttctctccagccgagcttcccagaacatcacatatcactgcaaaaatagcattgcatacatggatcaggccagtggaaatgtaaagaaggccctgaagctgatggggtcaaatgaaggtgaattcaaggctgaaggaaatagcaaattcacctacacagttctggaggatggttgcacgaaacacactggggaatggagcaaaacagtctttgaatatcgaacacgcaaggctgtgagactacctattgtagatattgcaccctatgacattggtggtcctgatcaagaatttggtgtggacgttggccctgtttgctttttataa-3’(SEQ ID NO:335)
BMPR2
5’-atgacttcctcgctgcagcggccctggcgggtgccctggctaccatggaccatcctgctggtcagcgctgcggctgcttcgcagaatcaagaacggctatgtgcgtttaaagatccgtatcagcaagaccttgggataggtgagagtagaatctctcatgaaaatgggacaatattatgctcgaaaggtagcacctgctatggcctttgggagaaatcaaaaggggacataaatcttgtaaaacaaggatgttggtctcacattggagatccccaagagtgtcactatgaagaatgtgtagtaactaccactcctccctcaattcagaatggaacataccgtttctgctgttgtagcacagatttatgtaatgtcaactttactgagaattttccacctcctgacacaacaccactcagtccacctcattcatttaaccgagatgagacaataatcattgctttggcatcagtctctgtattagctgttttgatagttgccttatgctttggatacagaatgttgacaggagaccgtaaacaaggtcttcacagtatgaacatgatggaggcagcagcatccgaaccctctcttgatctagataatctgaaactgttggagctgattggccgaggtcgatatggagcagtatataaaggctccttggatgagcgtccagttgctgtaaaagtgttttcctttgcaaaccgtcagaattttatcaacgaaaagaacatttacagagtgcctttgatggaacatgacaacattgcccgctttatagttggagatgagagagtcactgcagatggacgcatggaatatttgcttgtgatggagtactatcccaatggatctttatgcaagtatttaagtctccacacaagtgactgggtaagctcttgccgtcttgctcattctgttactagaggactggcttatcttcacacagaattaccacgaggagatcattataaacctgcaatttcccatcgagatttaaacagcagaaatgtcctagtgaaaaatgatggaacctgtgttattagtgactttggactgtccatgaggctgactggaaatagactggtgcgcccaggggaggaagataatgcagccataagcgaggttggcactatcagatatatggcaccagaagtgctagaaggagctgtgaacttgagggactgtgaatcagctttgaaacaagtagacatgtatgctcttggactaatctattgggagatatttatgagatgtacagacctcttcccaggggaatccgtaccagagtaccagatggcttttcagacagaggttggaaaccatcccacttttgaggatatgcaggttctcgtgtctagggaaaaacagagacccaagttcccagaagcctggaaagaaaatagcctggcagtgaggtcactcaaggagacaatcgaagactgttgggaccaggatgcagaggctcggcttactgcacagtgtgctgaggaaaggatggctgaacttatgatgatttgggaaagaaacaaatctgtgagcccaacagtcaatccaatgtctactgctatgcagaatgaacgcaacctgtcacataataggcgtgtgccaaaaattggtccttatccagattattcttcctcctcatacattgaagactctatccatcatactgacagcatcgtgaagaatatttcctctgagcattctatgtccagcacacctttgactataggggaaaaaaaccgaaattcaattaactatgaacgacagcaagcacaagctcgaatccccagccctgaaacaagtgtcaccagcctctccaccaacacaacaaccacaaacaccacaggactcacgccaagtactggcatgactactatatctgagatgccatacccagatgaaacaaatctgcataccacaaatgttgcacagtcaattgggccaacccctgtctgcttacagctgacagaagaagacttggaaaccaacaagctagacccaaaagaagttgataagaacctcaaggaaagctctgatgagaatctcatggagcactctcttaaacagttcagtggcccagacccactgagcagtactagttctagcttgctttacccactcataaaacttgcagtagaagcaactggacagcaggacttcacacagactgcaaatggccaagcatgtttgattcctgatgttctgcctactcagatctatcctctccccaagcagcagaaccttcccaagagacctactagtttgcctttgaacaccaaaaattcaacaaaagagccccggctaaaatttggcagcaagcacaaatcaaacttgaaacaagtcgaaactggagttgccaagatgaatacaatcaatgcagcagaacctcatgtggtgacagtcaccatgaatggtgtggcaggtagaaaccacagtgttaactcccatgctgccacaacccaatatgccaatgggacagtactatctggccaaacaaccaacatagtgacacatagggcccaagaaatgttgcagaatcagtttattggtgaggacacccggctgaatattaattccagtcctgatgagcatgagcctttactgagacgagagcaacaagctggccatgatgaaggtgttctggatcgtcttgtggacaggagggaacggccactagaaggtggccgaactaattccaataacaacaacagcaatccatgttcagaacaagatgttcttgcacagggtgttccaagcacagcagcagatcctgggccatcaaagcccagaagagcacagaggcctaattctctggatctttcagccacaaatgtcctggatggcagcagtatacagataggtgagtcaacacaagatggcaaatcaggatcaggtgaaaagatcaagaaacgtgtgaaaactccctattctcttaagcggtggcgcccctccacctgggtcatctccactgaatcgctggactgtgaagtcaacaataatggcagtaacagggcagttcattccaaatccagcactgctgtttaccttgcagaaggaggcactgctacaaccatggtgtctaaagatataggaatgaactgtctgtga-3’(SEQID NO:336)
AHI1
5’-atgcctacagctgagagtgaagcaaaagtaaaaaccaaagttcgctttgaagaattgcttaagacccacagtgatctaatgcgtgaaaagaaaaaactgaagaaaaaacttgtcaggtctgaagaaaacatctcacctgacactattagaagcaatcttcactatatgaaagaaactacaagtgatgatcccgacactattagaagcaatcttccccatattaaagaaactacaagtgatgatgtaagtgctgctaacactaacaacctgaagaagagcacgagagtcactaaaaacaaattgaggaacacacagttagcaactgaaaatcctaatggtgatgctagtgtagaggaagacaaacaaggaaagccaaataaaaaggtgataaagacggtgccccagttgactacacaagacctgaaaccggaaactcctgagaataaggttgattctacacaccagaaaacacatacaaagccacagccaggcgttgatcatcagaaaagtgagaaggcaaatgagggaagagaagagactgatttagaagaggatgaagaattgatgcaagcatatcagtgccatgtaactgaagaaatggcaaaggagattaagaggaaaataagaaagaaactgaaagaacagttgacttactttccctcagatactttattccatgatgacaaactaagcagtgaaaaaaggaaaaagaaaaaggaagttccagtcttctctaaagctgaaacaagtacattgaccatctctggtgacacagttgaaggtgaacaaaagaaagaatcttcagttagatcagtttcttcagattctcatcaagatgatgaaataagctcaatggaacaaagcacagaagacagcatgcaagatgatacaaaacctaaaccaaaaaaaacaaaaaagaagactaaagcagttgcagataataatgaagatgttgatggtgatggtgttcatgaaataacaagccgagatagcccggtttatcccaaatgtttgcttgatgatgaccttgtcttgggagtttacattcaccgaactgatagacttaagtcagattttatgatttctcacccaatggtaaaaattcatgtggttgatgagcatactggtcaatatgtcaagaaagatgatagtggacggcctgtttcatcttactatgaaaaagagaatgtggattatattcttcctattatgacccagccatatgattttaaacagttaaaatcaagacttccagagtgggaagaacaaattgtatttaatgaaaattttccctatttgcttcgaggctctgatgagagtcctaaagtcatcctgttctttgagattcttgatttcttaagcgtggatgaaattaagaataattctgaggttcaaaaccaagaatgtggctttcggaaaattgcctgggcatttcttaagcttctgggagccaatggaaatgcaaacatcaactcaaaacttcgcttgcagctatattacccacctactaagcctcgatccccattaagtgttgttgaggcatttgaatggtggtcaaaatgtccaagaaatcattacccatcaacactgtacgtaactgtaagaggactgaaagttccagactgtataaagccatcttaccgctctatgatggctcttcaggaggaaaaaggtaaaccagtgcattgtgaacgtcaccatgagtcaagctcagtagacacagaacctggattagaagagtcaaaggaagtaataaagtggaaacgactccctgggcaggcttgccgtatcccaaacaaacacctcttctcactaaatgcaggagaacgaggatgtttttgtcttgatttctcccacaatggaagaatattagcagcagcttgtgccagccgggatggatatccaattattttatatgaaattccttctggacgtttcatgagagaattgtgtggccacctcaatatcatttatgatctttcctggtcaaaagatgatcactacatccttacttcatcatctgatggcactgccaggatatggaaaaatgaaataaacaatacaaatactttcagagttttacctcatccttcttttgtttacacggctaaattccatccagctgtaagagagctagtagttacaggatgctatgattccatgatacggatatggaaagttgagatgagagaagattctgccatattggtccgacagtttgacgttcacaaaagttttatcaactcactttgttttgatactgaaggtcatcatatgtattcaggagattgtacaggggtgattgttgtttggaatacctatgtcaagattaatgatttggaacattcagtgcaccactggactataaataaggaaattaaagaaactgagtttaagggaattccaataagttatttggagattcatcccaatggaaaacgtttgttaatccataccaaagacagtactttgagaattatggatctccggatattagtagcaaggaagtttgtaggagcagcaaattatcgggagaagattcatagtactttgactccatgtgggacttttctgtttgctggaagtgaggatggtatagtgtatgtttggaacccagaaacaggagaacaagtagccatgtattctgacttgccattcaagtcacccattcgagacatttcttatcatccatttgaaaatatggttgcattctgtgcatttgggcaaaatgagccaattcttctgtatatttacgatttccatgttgcccagcaggaggctgaaatgttcaaacgctacaatggaacatttccattacctggaatacaccaaagtcaagatgccctatgtacctgtccaaaactaccccatcaaggctcttttcagattgatgaatttgtccacactgaaagttcttcaacgaagatgcagctagtaaaacagaggcttgaaactgtcacagaggtgatacgttcctgtgctgcaaaagtcaacaaaaatctctcatttacttcaccaccagcagtttcctcacaacagtctaagttaaagcagtcaaacatgctgaccgctcaagagattctacatcagtttggtttcactcagaccgggattatcagcatagaaagaaagccttgtaaccatcaggtagatacagcaccaacggtagtggctctttatgactacacagcgaatcgatcagatgaactaaccatccatcgcggagacattatccgagtgtttttcaaagataatgaagactggtggtatggcagcataggaaagggacaggaaggttattttccagctaatcatgtggctagtgaaacactgtatcaagaactgcctcctgagataaaggagcgatcccctcctttaagccctgaggaaaaaactaaaatagaaaaatctccagctcctcaaaagcaatcaatcaataagaacaagtcccaggacttcagactaggctcagaatctatgacacattctgaaatgagaaaagaacagagccatgaggaccaaggacacataatggatacacggatgaggaagaacaagcaagcaggcagaaaagtcactctaatagagta-3’(SEQ ID NO:337)
FANCC
5’-atggctcaagattcagtagatctttcttgtgattatcagttttggatgcagaagctttctgtatgggatcaggcttccactttggaaacccagcaagacacctgtcttcacgtggctcagttccaggagttcctaaggaagatgtatgaagccttgaaagagatggattctaatacagtcattgaaagattccccacaattggtcaactgttggcaaaagcttgttggaatccttttattttagcatatgatgaaagccaaaaaattctaatatggtgcttatgttgtctaattaacaaagaaccacagaattctggacaatcaaaacttaactcctggatacagggtgtattatctcatatactttcagcactcagatttgataaagaagttgctcttttcactcaaggtcttgggtatgcacctatagattactatcctggtttgcttaaaaatatggttttatcattagcgtctgaactcagagagaatcatcttaatggatttaacactcaaaggcgaatggctcccgagcgagtggcgtccctgtcacgagtttgtgtcccacttattaccctgacagatgttgaccccctggtggaggctctcctcatctgtcatggacgtgaacctcaggaaatcctccagccagagttctttgaggctgtaaacgaggccattttgctgaagaagatttctctccccatgtcagctgtagtctgcctctggcttcggcaccttcccagccttgaaaaagcaatgctgcatctttttgaaaagctaatctccagtgagagaaattgtctgagaaggatcgaatgctttataaaagattcatcgctgcctcaagcagcctgccaccctgccatattccgggttgttgatgagatgttcaggtgtgcactcctggaaaccgatggggccctggaaatcatagccactattcaggtgtttacgcagtgctttgtagaagctctggagaaagcaagcaagcagctgcggtttgcactcaagacctactttccttacacttctccatctcttgccatggtgctgctgcaagaccctcaagatatccctcggggacactggctccagacactgaagcatatttctgaactgctcagagaagcagttgaagaccagactcatgggtcctgcggaggtccctttgagagctggttcctgttcattcacttcggaggatgggctgagatggtggcagagcaattactgatgtcggcagccgaaccccccacggccctgctgtggctcttggccttctactacggcccccgtgatgggaggcagcagagagcacagactatggtccaggtgaaggccgtgctgggccacctcctggcaatgtccagaagcagcagcctctcagcccaggacctgcagacggtagcaggacagggcacagacacagacctcagagctcctgcacaacagctgatcaggcaccttctcctcaacttcctgctctgggctcctggaggccacacgatcgcctgggatgtcatcaccctgatggctcacactgctgagataactcacgagatcattggctttcttgaccagaccttgtacagatggaatcgtcttggcattgaaagccctagatcagaaaaactggcccgagagctccttaaagagctgcgaactcaagtctag-3’(SEQ ID NO:338)
MYBPC3
5’-atgcctgagccggggaagaagccagtctcagcttttagcaagaagccacggtcagtggaagtggccgcaggcagccctgccgtgttcgaggccgagacagagcgggcaggagtgaaggtgcgctggcagcgcggaggcagtgacatcagcgccagcaacaagtacggcctggccacagagggcacacggcatacgctgacagtgcgggaagtgggccctgccgaccagggatcttacgcagtcattgctggctcctccaaggtcaagttcgacctcaaggtcatagaggcagagaaggcagagcccatgctggcccctgcccctgcccctgctgaggccactggagcccctggagaagccccggccccagccgctgagctgggagaaagtgccccaagtcccaaagggtcaagctcagcagctctcaatggtcctacccctggagcccccgatgaccccattggcctcttcgtgatgcggccacaggatggcgaggtgaccgtgggtggcagcatcaccttctcagcccgcgtggccggcgccagcctcctgaagccgcctgtggtcaagtggttcaagggcaaatgggtggacctgagcagcaaggtgggccagcacctgcagctgcacgacagctacgaccgcgccagcaaggtctatctgttcgagctgcacatcaccgatgcccagcctgccttcactggcagctaccgctgtgaggtgtccaccaaggacaaatttgactgctccaacttcaatctcactgtccacgaggccatgggcaccggagacctggacctcctatcagccttccgccgcacgagcctggctggaggtggtcggcggatcagtgatagccatgaggacactgggattctggacttcagctcactgctgaaaaagagagacagtttccggaccccgagggactcgaagctggaggcaccagcagaggaggacgtgtgggagatcctacggcaggcacccccatctgagtacgagcgcatcgccttccagtacggcgtcactgacctgcgcggcatgctaaagaggctcaagggcatgaggcgcgatgagaagaagagcacagcctttcagaagaagctggagccggcctaccaggtgagcaaaggccacaagatccggctgaccgtggaactggctgaccatgacgctgaggtcaaatggctcaagaatggccaggagatccagatgagcggcagcaagtacatctttgagtccatcggtgccaagcgtaccctgaccatcagccagtgctcattggcggacgacgcagcctaccagtgcgtggtgggtggcgagaagtgtagcacggagctctttgtgaaagagccccctgtgctcatcacgcgccccttggaggaccagctggtgatggtggggcagcgggtggagtttgagtgtgaagtatcggaggagggggcgcaagtcaaatggctgaaggacggggtggagctgacccgggaggagaccttcaaataccggttcaagaaggacgggcagagacaccacctgatcatcaacgaggccatgctggaggacgcggggcactatgcactgtgcactagcgggggccaggcgctggctgagctcattgtgcaggaaaagaagctggaggtgtaccagagcatcgcagacctgatggtgggcgcaaaggaccaggcggtgttcaaatgtgaggtctcagatgagaatgttcggggtgtgtggctgaagaatgggaaggagctggtgcccgacagccgcataaaggtgtcccacatcgggcgggtccacaaactgaccattgacgacgtcacacctgccgacgaggctgactacagctttgtgcccgagggcttcgcctgcaacctgtcagccaagctccacttcatggaggtcaagattgacttcgtacccaggcaggaacctcccaagatccacctggactgcccaggccgcataccagacaccattgtggttgtagctggaaataagctacgtctggacgtccctatctctggggaccctgctcccactgtgatctggcagaaggctatcacgcaggggaataaggccccagccaggccagccccagatgccccagaggacacaggtgacagcgatgagtgggtgtttgacaagaagctgctgtgtgagaccgagggccgggtccgcgtggagaccaccaaggaccgcagcatcttcacggtcgagggggcagagaaggaagatgagggcgtctacacggtcacagtgaagaaccctgtgggcgaggaccaggtcaacctcacagtcaaggtcatcgacgtgccagacgcacctgcggcccccaagatcagcaacgtgggagaggactcctgcacagtacagtgggagccgcctgcctacgatggcgggcagcccatcctgggctacatcctggagcgcaagaagaagaagagctaccggtggatgcggctgaacttcgacctgattcaggagctgagtcatgaagcgcggcgcatgatcgagggcgtggtgtacgagatgcgcgtctacgcggtcaacgccatcggcatgtccaggcccagccctgcctcccagcccttcatgcctatcggtccccccagcgaacccacccacctggcagtagaggacgtctctgacaccacggtctccctcaagtggcggcccccagagcgcgtgggagcaggaggcctggatggctacagcgtggagtactgcccagagggctgctcagagtgggtggctgccctgcaggggctgacagagcacacatcgatactggtgaaggacctgcccacgggggcccggctgcttttccgagtgcgggcacacaatatggcagggcctggagcccctgttaccaccacggagccggtgacagtgcaggagatcctgcaacggccacggcttcagctgcccaggcacctgcgccagaccattcagaagaaggtcggggagcctgtgaaccttctcatccctttccagggcaagccccggcctcaggtgacctggaccaaagaggggcagcccctggcaggcgaggaggtgagcatccgcaacagccccacagacaccatcctgttcatccgggccgctcgccgcgtgcattcaggcacttaccaggtgacggtgcgcattgagaacatggaggacaaggccacgctggtgctgcaggttgttgacaagccaagtcctccccaggatctccgggtgactgacgcctggggtcttaatgtggctctggagtggaagccaccccaggatgtcggcaacacggagctctgggggtacacagtgcagaaagccgacaagaagaccatggagtggttcaccgtcttggagcattaccgccgcacccactgcgtggtgccagagctcatcattggcaatggctactacttccgcgtcttcagccagaatatggttggctttagtgacagagcggccaccaccaaggagcccgtctttatccccagaccaggcatcacctatgagccacccaactataaggccctggacttctccgaggccccaagcttcacccagcccctggtgaaccgctcggtcatcgcgggctacactgctatgctctgctgtgctgtccggggtagccccaagcccaagatttcctggttcaagaatggcctggacctgggagaagacgcccgcttccgcatgttcagcaagcagggagtgttgactctggagattagaaagccctgcccctttgacgggggcatctatgtctgcagggccaccaacttacagggcgaggcacggtgtgagtgccgcctggaggtgcgagtgcctcagtga-3’(SEQ ID NO:339)
IL2RG
5’-atgttgaagccatcattaccattcacatccctcttattcctgcagctgcccctgctgggagtggggctgaacacgacaattctgacgcccaatgggaatgaagacaccacagctgatttcttcctgaccactatgcccactgactccctcagtgtttccactctgcccctcccagaggttcagtgttttgtgttcaatgtcgagtacatgaattgcacttggaacagcagctctgagccccagcctaccaacctcactctgcattattggtacaagaactcggataatgataaagtccagaagtgcagccactatctattctctgaagaaatcacttctggctgtcagttgcaaaaaaaggagatccacctctaccaaacatttgttgttcagctccaggacccacgggaacccaggagacaggccacacagatgctaaaactgcagaatctggtgatcccctgggctccagagaacctaacacttcacaaactgagtgaatcccagctagaactgaactggaacaacagattcttgaaccactgtttggagcacttggtgcagtaccggactgactgggaccacagctggactgaacaatcagtggattatagacataagttctccttgcctagtgtggatgggcagaaacgctacacgtttcgtgttcggagccgctttaacccactctgtggaagtgctcagcattggagtgaatggagccacccaatccactgggggagcaatacttcaaaagagaatcctttcctgtttgcattggaagccgtggttatctctgttggctccatgggattgattatcagccttctctgtgtgtatttctggctggaacggacgatgccccgaattcccaccctgaagaacctagaggatcttgttactgaataccacgggaacttttcggcctggagtggtgtgtctaagggactggctgagagtctgcagccagactacagtgaacgactctgcctcgtcagtgagattcccccaaaaggaggggcccttggggaggggcctggggcctccccatgcaaccagcatagcccctactgggcccccccatgttacaccctaaagcctgaaacctga-3’(SEQ ID NO:340)
讨论
基因组编辑技术正在彻底改变生物医学研究。高活性核酸酶,诸如锌指核酸酶(ZFN)1,转录激活因子样效应子核酸酶(TALEN)2-4和CRISPR的Cas蛋白(聚簇规则间隔短回文重复序列)系统5-7已成功工程化成可操纵无数生物体中的基因组。最近,已经利用脱氨基酶精确地改变了基因密码而不破坏双链DNA。通过将胞苷或腺苷脱氨酶与CRISPR-Cas9系统联合,研究人员创建了可编程的碱基编辑器,使基因组DNA中的C·G转化为T·A或A·T转化为G·C8-10,为纠正致病突变提供新的机会。
除了DNA之外,RNA是用于基因校正的引人注目的靶标,因为RNA修饰可以改变蛋白质功能而不会对基因组产生任何永久性变化。目前已利用ADAR腺苷脱氨酶对RNA实现精确的碱基编辑。在哺乳动物中已鉴定出三种ADAR蛋白,即ADAR1(亚型p110和p150),ADAR2和ADAR3(催化失活)11,12,其底物是双链RNA,其中与胞嘧啶(C)错配的腺苷(A)优先被脱氨基为肌苷(I)。肌苷被认为在翻译过程中可模拟鸟苷(G)13,14。为了实现靶向RNA编辑,将ADAR蛋白或其催化结构域与λN肽15-17,SNAP-tag18-22或Cas蛋白(dCas13b)23融合,并设计了一个指导RNA来招募嵌合的ADAR蛋白至特定位点。或者,也有报道称过表达的ADAR1或ADAR2蛋白与带有R/G基序的指导RNA一起可以使靶向RNA编辑24-27成为可能。
在哺乳动物系统中所有这些已报道的核酸编辑方法都依赖于两种成分的异位表达:一种酶和一种指导RNA。尽管这些二进制系统在大多数研究中都能有效地工作,但是一些固有的障碍限制了它们的广泛应用,尤其是在治疗中。因为基因治疗最有效的体内递送是通过病毒载体28,并且高度理想的腺相关病毒(AAV)载体受到负荷大小(~4.5kb)的限制,因此使同时容纳蛋白质和指导RNA成为挑战29,30。最近有报道称,由于RNA的异常过度编辑31,ADAR1的过表达赋予多发性骨髓瘤的致癌性,并产生大量的全局脱靶编辑32。此外,异位表达蛋白质或其非人类来源的结构域具有引发免疫原性的潜在风险30,33。此外,预先存在的适应性免疫和p53介导的DNA损伤反应可能会损害治疗性蛋白质(诸如Cas934-38)的功效。尽管已经尝试利用内源性机制进行RNA编辑,但是仅通过将预组装的靶标转录物:RNA双链体注射入非洲爪蟾(Xenopus)胚胎中进行尝试。非常需要不依赖蛋白质异位表达的强健的核酸编辑替代技术。在这里,我们开发了一种利用内源性ADAR进行RNA编辑的新方法。我们表明,表达经过精心设计的指导RNA可以对内源RNA进行高效且精确的编辑,并纠正致病突变。该一元核酸编辑平台可以为治疗和研究开辟新的途径。
特别地,我们表明具有足够长度的线性arRNA的表达能够引导内源ADAR蛋白在靶向转录物上将腺苷编辑成肌苷。该系统称为LEAPER,它利用内源性ADAR蛋白来实现可编程的核酸编辑,因此比现有方法具有优势。
LEAPER的罕见品质是其简单性,因为它仅依赖于小分子RNA来指导内源蛋白质进行RNA编辑。这使人想起RNAi,其中小的dsRNA可以调用靶向RNA降解的天然机制51。由于尺寸小,arRNA可以很容易地通过多种病毒和非病毒载体递送。与RNAi不同,LEAPER催化精确的A至I转换,而不会产生靶向转录物的切割或降解(图18A)。尽管arRNA的长度要求比RNAi长,但它既不诱导细胞水平的免疫刺激作用(图22E,f和图29E),也不影响内源性ADAR蛋白的功能(图22A,B),使其为RNA靶向的安全策略。引人注目的是,据报道,ADAR蛋白或其催化结构域的异位表达会诱导大量全局脱靶编辑32,并可能引发癌症31。
最近,几个研究小组报道,由于效应蛋白的表达,胞嘧啶碱基编辑器可在小鼠胚胎,水稻或人类细胞系中产生大量脱靶的单核苷酸变体,这示例说明了LEAPER针对潜在治疗应用的优势52-54。令人欣慰的是,LEAPER能够进行有效的编辑,同时又引起罕见的全局脱靶编辑(图20和图21)。此外,LEAPER可以最大程度地减少潜在的免疫原性或克服其他需要引入外源蛋白质的方法通常共有的递送障碍。
对于LEAPER,我们建议使用最小大小高于70-nt的arRNA以实现所希望的活性。在天然环境中,ADAR蛋白非特异性编辑具有300-nt以上双链体的Alu重复序列55。值得注意的是,Alu重复序列形成稳定的分子内双链体,而LEAPER导致arRNA与mRNA或pre-mRNA之间的分子间双链体,这应该是不稳定的,更难以形成。因此,我们假设长于70nt的RNA双链体在化学计量上对于招募或船坞ADAR蛋白进行有效编辑很重要。实际上,更长的arRNA导致异位表达的报道分子和内源转录物的更高编辑产率(图16D和图17B)。但是,由于ADAR蛋白混杂地使RNA双链体中的腺苷碱基脱氨基,因此更长的arRNA可在靶向窗口内引起更多的脱靶。
虽然LEAPER可以有效地打靶天然转录物,但是它们的编辑效率和脱靶率却有所不同。对于PPIB转录物靶向,我们可以将50%的靶向腺苷转化为肌苷,而在覆盖窗口内没有明显的脱靶(图17B,F)。对于其他转录物,脱靶变得更加严重。我们已经设法减少了脱靶,诸如引入A-G错配或连续错配以抑制不希望的编辑。但是,太多的错配会降低中靶效率。考虑到效率和潜在的脱靶,我们会建议使用长度在100到150-nt之间的arRNA对内源转录物进行编辑。如果有选择,最好选择腺苷较少的区域,以最大程度地减少不想要的编辑的机会。令人鼓舞的是,我们没有在arRNA靶向的转录双链体之外检测到任何脱靶(图20)。
我们已经优化了arRNA的设计以实现提高的编辑效率,并证明了可以利用LEAPER来操纵基因功能或纠正致病突变。我们还表明,LEAPER不仅限于在UAG上起作用,替代的,它还与可能的任何腺苷一起起作用,而不管其侧翼核苷酸如何(图16F,G和图17C)。这样的灵活性对于由某些单点突变引起的遗传疾病的潜在治疗校正是有利的。有趣的是,在编辑IDUA转录物时,靶向pre-mRNA的arRNA比靶向成熟RNA的更有效,这表明核是ADAR蛋白的主要作用位点,并且LEAPER可通过修饰pre-mRNA中的剪接位点来操纵剪接。更重要的是,LEAPER证明了同时靶向多个基因转录物的高效性(图17D)。LEAPER的这种多路复用能力可能在将来被开发用于治疗某些多基因疾病。
在RNA水平上进行遗传校正是有益的。首先,在靶向转录物上进行编辑不会永久改变基因组或全套转录组(transcriptome repertoire),从而使RNA编辑方法比基因组编辑方法更安全地用于治疗。此外,暂时编辑非常适合于临时控制治疗由在特定状态中的偶尔改变导致的疾病。其次,LEAPER和其他RNA编辑方法不会在基因组上引入DSB,从而避免了产生不希望的大DNA片段缺失的风险37。采用切口酶Cas9的DNA碱基编辑方法仍可在基因组中产生插入缺失8。此外,独立于天然DNA修复机制,LEAPER也应在有丝分裂后的细胞中起作用,诸如ADAR2高表达的小脑细胞11。
我们已经证明,LEAPER可以应用于广泛的细胞类型,诸如人类细胞系(图14C),小鼠细胞系(图14D)和包括原代T细胞的人类原代细胞(图27和图28D)。通过慢病毒递送或合成的寡核苷酸进行的有效编辑为治疗发展提供了更大的潜力(图28)。此外,LEAPER可以在多种应用中产生表型或生理变化,包括恢复p53的转录调控活性(图7),纠正致病突变(图26)以及恢复源自Hurler综合征患者原代成纤维细胞的α-L-艾杜糖醛酸酶活性(图29)。因此可以设想,LEAPER在疾病治疗方面具有巨大潜力。
Stafforst及其同事报道了一种新的,看似相似的RNA编辑方法,称为RESTORE,其通过使用合成的反义寡核苷酸招募内源性ADAR而起作用56。RESTORE和LEAPER之间的根本区别在于用于招募内源性ADAR的指导RNA的独特性质。RESTORE的指导RNA限于化学合成反义寡核苷酸(ASO),取决于复杂的化学修饰,而LEAPER的arRNA可以多种方式生成,化学合成和表达来自病毒的或非病毒的载体(图28和图29)。重要的是,经过大量化学修饰,ASO只能在疾病治疗中短暂起作用。相比之下,arRNA可以通过表达产生,一种对于不断编辑的目的而言尤其重要的特征。
关于LEAPER的效率和特异性,仍有改进的余地。由于LEAPER依赖于内源性ADAR,因此靶细胞中ADAR蛋白的表达水平是成功编辑的决定因素之一。根据先前的报道57和我们的观察(图14A,b),ADAR1p110在组织中广泛表达,确保了LEAPER的广泛适用性。ADAR1p150是干扰素诱导的同种型58,并已证明在LEAPER中具有功能(图11E,图12B)。因此,在某些情况下,干扰素刺激性RNA与arRNA的共转染可进一步提高编辑效率。或者,由于ADAR3发挥抑制作用,因此抑制ADAR3可增强表达ADAR3的细胞的编辑效率。此外,arRNA的其他修饰可提高其编辑效率。例如,与某些ADAR招募支架融合的arRNA可增加局部ADAR蛋白浓度,从而提高编辑产率。到目前为止,我们只能利用内源性ADAR1/2蛋白进行A至I碱基的转化。探索是否可以类似地利用更多的天然机制来修饰遗传元件,特别是实现有效的核酸编辑,是令人兴奋的。
总体上,我们提供了原理证明,可以共同选择细胞中的内源性机制来编辑RNA转录物。我们证明了LEAPER是一个简单,有效和安全的系统,为基于基因编辑的疗法和研究开辟了一条新途径。
参考文献
1 Porteus,M.H.&Carroll,D.Gene targeting using zinc fingernucleases.Nat Biotechnol 23,967-973(2005).
2 Boch,J.et al.Breaking the code of DNA binding specificity of TAL-type III effectors.Science 326,1509-1512(2009).
3 Moscou,M.J.&Bogdanove,A.J.A simple cipher governs DNA recognitionby TAL effectors.Science 326,1501(2009).
4 Miller,J.C.et al.A TALE nuclease architecture for efficient genomeediting.Nat Biotechnol 29,143-148(2011).
5 Jinek,M.et al.A programmable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity.Science 337,816-821(2012).
6 Cong,L.et al.Multiplex genome engineering using CRISPR/Cassystems.Science 339,819-823(2013).
7 Mali,P.et al.RNA-guided human genome engineering via Cas9.Science339,823-826(2013).
8 Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.&Liu,D.R.Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424(2016).
9 Ma,Y.et al.Targeted AID-mediated mutagenesis(TAM)enables efficientgenomic diversification in mammalian cells.Nat Methods 13,1029-1035(2016).
10 Gaudelli,N.M.et al.Programmable base editing of A*T to G*C ingenomic DNA without DNA cleavage.Nature 551,464-471(2017).
11 Tan,M.H.et al.Dynamic landscape and regulation of RNA editing inmammals.Nature 550,249-254(2017).
12 Nishikura,K.Functions and regulation of RNA editing by ADARdeaminases.Annu Rev Biochem 79,321-349(2010).
13 Bass,B.L.&Weintraub,H.An unwinding activity that covalentlymodifies its double-stranded RNA substrate.Cell 55,1089-1098(1988).
14 Wong,S.K.,Sato,S.&Lazinski,D.W.Substrate recognition by ADAR1 andADAR2.RNA 7,846-858(2001).
15 Montiel-Gonzalez,M.F.,Vallecillo-Viejo,I.,Yudowski,G.A.&Rosenthal,J.J.Correction of mutations within the cystic fibrosis transmembraneconductance regulator by site-directed RNA editing.Proc Natl Acad Sci U S A110,18285-18290(2013).
16 Sinnamon,J.R.et al.Site-directed RNA repair of endogenous Mecp2RNA in neurons.Proc Natl Acad Sci U S A 114,E9395-E9402(2017).
17 Montiel-Gonzalez,M.F.,Vallecillo-Viejo,I.C.&Rosenthal,J.J.Anefficient system for selectively altering genetic information withinmRNAs.Nucleic Acids Res 44,e157(2016).
18 Hanswillemenke,A.,Kuzdere,T.,Vogel,P.,Jekely,G.&Stafforst,T.Site-Directed RNA Editing in Vivo Can Be Triggered by the Light-Driven Assembly ofan Artificial Riboprotein.J Am Chem Soc 137,15875-15881(2015).
19 Schneider,M.F.,Wettengel,J.,Hoffmann,P.C.&Stafforst,T.OptimalguideRNAs for re-directing deaminase activity of hADAR1 and hADAR2 intrans.Nucleic Acids Res 42,e87(2014).
20 Vogel,P.,Hanswillemenke,A.&Stafforst,T.Switching ProteinLocalization by Site-Directed RNA Editing under Control of Light.ACSsynthetic biology 6,1642-1649(2017).
21 Vogel,P.,Schneider,M.F.,Wettengel,J.&Stafforst,T.Improving site-directed RNA editing in vitro and in cell culture by chemical modification ofthe guideRNA.Angewandte Chemie 53,6267-6271(2014).22 Vogel,P.et al.Efficientand precise editing of endogenous transcripts with SNAP-tagged ADARs.NatMethods 15,535-538(2018).
23 Cox,D.B.T.et al.RNA editing with CRISPR-Cas13.Science 358,1019-1027(2017).
24 Fukuda,M.et al.Construction of a guide-RNA for site-directed RNAmutagenesis utilising intracellular A-to-I RNA editing.Scientific reports 7,41478(2017).
25 Wettengel,J.,Reautschnig,P.,Geisler,S.,Kahle,P.J.&Stafforst,T.Harnessing human ADAR2 for RNA repair-Recoding a PINK1 mutation rescuesmitophagy.Nucleic Acids Res 45,2797-2808(2017).
26 Heep,M.,Mach,P.,Reautschnig,P.,Wettengel,J.&Stafforst,T.ApplyingHuman ADAR1p110 and ADAR1p150 for Site-Directed RNA Editing-G/C SubstitutionStabilizes GuideRNAs against Editing.Genes(Basel)8(2017).
27 Katrekar,D.et al.In vivo RNA editing of point mutations via RNA-guided adenosine deaminases.Nat Methods 16,239-242(2019).
28 Yin,H.,Kauffman,K.J.&Anderson,D.G.Delivery technologies for genomeediting.Nat Rev Drug Discov 16,387-399(2017).
29 Platt,R.J.et al.CRISPR-Cas9 knockin mice for genome editing andcancer modeling.Cell 159,440-455(2014).
30 Chew,W.L.et al.A multifunctional AAV-CRISPR-Cas9 and its hostresponse.Nat Methods 13,868-874(2016).
31 Teoh,P.J.et al.Aberrant hyperediting of the myeloma transcriptomeby ADAR1 confers oncogenicity and is a marker of poor prognosis.Blood 132,1304-1317(2018).
32 Vallecillo-Viejo,I.C.,Liscovitch-Brauer,N.,Montiel-Gonzalez,M.F.,Eisenberg,E.&Rosenthal,J.J.C.Abundant off-target edits from site-directed RNAediting can be reduced by nuclear localization of the editing enzyme.RNAbiology 15,104-114(2018).
33 Mays,L.E.&Wilson,J.M.The complex and evolving story of T cellactivation to AAV vector-encoded transgene products.Mol Ther 19,16-27(2011).
34 Wagner,D.L.et al.High prevalence of Streptococcus pyogenes Cas9-reactive T cells within the adult human population.Nat Med 25,242-248(2019).
35 Simhadri,V.L.et al.Prevalence of Pre-existing Antibodies toCRISPR-Associated Nuclease Cas9 in the USA Population.Mol Ther Methods ClinDev 10,105-112(2018).
36 Charlesworth,C.T.et al.Identification of preexisting adaptiveimmunity to Cas9 proteins in humans.Nat Med 25,249-254(2019).
37 Haapaniemi,E.,Botla,S.,Persson,J.,Schmierer,B.&Taipale,J.CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response.Nat Med 24,927-930(2018).
38 Ihry,R.J.et al.p53 inhibits CRISPR-Cas9 engineering in humanpluripotent stem cells.Nat Med 24,939-946(2018).
39 Woolf,T.M.,Chase,J.M.&Stinchcomb,D.T.Toward the therapeuticediting of mutated RNA sequences.Proc Natl Acad Sci U S A 92,8298-8302(1995).
40 Zheng,Y.,Lorenzo,C.&Beal,P.A.DNA editing in DNA/RNA hybrids byadenosine deaminases that act on RNA.Nucleic Acids Res 45,3369-3377(2017).
41 Abudayyeh,O.O.et al.C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Science 353,aaf5573(2016).
42 Daniel,C.,Widmark,A.,Rigardt,D.&Ohman,M.Editing inducer elementsincreases A-to-I editing efficiency in the mammalian transcriptome.GenomeBiol 18,195(2017).
43 Chen,C.X.et al.A third member of the RNA-specific adenosinedeaminase gene family,ADAR3,contains both single-and double-stranded RNAbinding domains.RNA 6,755-767(2000).
44 Savva,Y.A.,Rieder,L.E.&Reenan,R.A.The ADAR protein family.GenomeBiol 13,252(2012).45 Nishikura,K.A-to-I editing of coding and non-coding RNAsby ADARs.Nat Rev Mol Cell Biol 17,83-96(2016).
46 Floquet,C.,Deforges,J.,Rousset,J.P.&Bidou,L.Rescue of non-sensemutated p53 tumor suppressor gene by aminoglycosides.Nucleic Acids Res 39,3350-3362(2011).
47 Kern,S.E.et al.Identification of p53 as a sequence-specific DNA-binding protein.Science 252,1708-1711(1991).
48 Doubrovin,M.et al.Imaging transcriptional regulation of p53-dependent genes with positron emission tomography in vivo.Proc Natl Acad SciU S A 98,9300-9305(2001).
49 Landrum,M.J.et al.ClinVar:public archive of interpretations ofclinically relevant variants.Nucleic Acids Res 44,D862-868(2016).
50 Ou,L.et al.ZFN-Mediated In Vivo Genome Editing Corrects MurineHurler Syndrome.Mol Ther 27,178-187(2019).
51 Fire,A.et al.Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans.Nature 391,806-811(1998).
52 Zuo,E.et al.Cytosine base editor generates substantial off-targetsingle-nucleotide variants in mouse embryos.Science(2019).
53 Jin,S.et al.Cytosine,but not adenine,base editors induce genome-wide off-target mutations in rice.Science(2019).
54 Kim,D.,Kim,D.E.,Lee,G.,Cho,S.I.&Kim,J.S.Genome-wide targetspecificity of CRISPR RNA-guided adenine base editors.Nat Biotechnol 37,430-435(2019).
55 Levanon,E.Y.et al.Systematic identification of abundant A-to-Iediting sites in the human transcriptome.Nat Biotechnol 22,1001-1005(2004).
56 Merkle,T.et al.Precise RNA editing by recruiting endogenous ADARswith antisense oligonucleotides.Nat Biotechnol 37,133-138(2019).
57 Wagner,R.W.et al.Double-stranded RNA unwinding and modifyingactivity is detected ubiquitously in primary tissues and cell lines.Mol CellBiol 10,5586-5590(1990).
58 Patterson,J.B.&Samuel,C.E.Expression and regulation by interferonof a double-stranded-RNA-specific adenosine deaminase from human cells:evidence for two forms of the deaminase.Mol Cell Biol 15,5376-5388(1995).
59 Gibson,D.G.et al.Enzymatic assembly of DNA molecules up to severalhundred kilobases.Nat Methods 6,343-345(2009).
60 Zhou,Y.,Zhang,H.&Wei,W.Simultaneous generation of multi-geneknockouts in human cells.FEBS Lett 590,4343-4353(2016).
61 Dobin,A.et al.STAR:ultrafast universal RNA-seqaligner.Bioinformatics 29,15-21(2013).
62 Van der Auwera,G.A.et al.From FastQ data to high confidencevariant calls:the Genome Analysis Toolkit best practices pipeline.Curr ProtocBioinformatics 43,11 10 11-33(2013).
63 Wang,K.,Li,M.&Hakonarson,H.ANNOVAR:functional annotation ofgenetic variants from high-throughput sequencing data.Nucleic Acids Res 38,e164(2010).
64 Genomes Project,C.et al.An integrated map of genetic variationfrom 1,092 human genomes.Nature 491,56-65(2012).
65 Pertea,M.,Kim,D.,Pertea,G.M.,Leek,J.T.&Salzberg,S.L.Transcript-level expression analysis of RNA-seq experiments with HISAT,StringTie andBallgown.Nat Protoc 11,1650-1667(2016).
序列表
<110> 博雅辑因(北京)生物科技有限公司
北京大学
<120> 编辑RNA的方法和组合物
<130> PE01705A
<150> PCT/CN2019/082713
<151> 2019-04-15
<150> PCT/CN2019/129952
<151> 2019-12-30
<160> 416
<170> PatentIn version 3.5
<210> 1
<211> 708
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 1
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaag 708
<210> 2
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 2
ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cagaaggtat 60
acacgccgga agaatctgta gagatccccg gtcgccacc 99
<210> 3
<211> 717
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 3
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180
gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420
ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480
atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600
ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaa 717
<210> 4
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 4
ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cgcctgctcg 60
cgatgctaga gggctctgcc a 81
<210> 5
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 5
ctgcagggcg gaggaggcag cgcctgctcg cgatgctaga gggctctgcc 50
<210> 6
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 6
ggaccacccc aaaaaugaau auaaccaaaa cugaacagcu ccucgcccuu gcucacuggc 60
agagcccucc agcaucgcga gcaggcgcug ccuccuccgc c 101
<210> 7
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 7
aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60
cuuccccugc 70
<210> 8
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 8
ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60
cuccuccgcc 70
<210> 9
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 9
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 10
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 10
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 11
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 11
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 12
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 12
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 13
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 13
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 14
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 14
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 15
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 15
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 16
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 16
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 17
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 17
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 18
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 18
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 19
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 19
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 20
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 20
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 21
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 21
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 22
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 22
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 23
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 23
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 24
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 24
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 25
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 25
uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua 60
uucagucauu uucagcaggc cucucucccg c 91
<210> 26
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 26
gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaacuacca 60
caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 27
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 27
uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu 60
ccaacuacca caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag 120
ccgcugagcc u 131
<210> 28
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 28
aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60
gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120
caccugggag ccgcugagcc ucuggccccg c 151
<210> 29
<211> 171
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 29
cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac 60
ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc 120
cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu c 171
<210> 30
<211> 191
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 30
uaggaauccu cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc 60
gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu 120
uucagcaggc cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu 180
cagugccugc g 191
<210> 31
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 31
gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60
uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120
cucgcgggcu ccgggcgggc ggcgggcgcc g 151
<210> 32
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 32
uccuguagcu aaggccacaa aauuauccac uguuuuugga acagucuuuc cgaagagacc 60
aaagaucacc cggcccacau cuucaucucc aauucguagg ucaaaauaca ccuugacggu 120
gacuuugggc cccuucuucu ucucaucggc c 151
<210> 33
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 33
gcccuggauc augaaguccu ugauuacacg auggaauuug cuguuuuugu agccaaaucc 60
uuucucuccu guagccaagg ccacaaaauu auccacuguu uuuggaacag ucuuuccgaa 120
gagaccaaag aucacccggc cuacaucuuc a 151
<210> 34
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 34
gcgcaaguua gguuuuguca agaaagggug uaacgcaacc aagucauagu ccgccuagaa 60
gcauuugcgg ug 72
<210> 35
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 35
gccaugccaa ucucaucuug uuuucugcgc aaguuagguu uugucaagaa aggguguaac 60
gcaaccaagu cauaguccgc cuagaagcau uugcggugga cgauggaggg gccggacucg 120
ucauacuccu g 131
<210> 36
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 36
ggacuuccug uaacaacgca ucucauauuu ggaaugacca uuaaaaaaac aacaaugugc 60
aaucaaaguc 70
<210> 37
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 37
caaggugcgg cuccggcccc uccccucuuc aaggggucca cauggcaacu gugaggaggg 60
gagauucagu g 71
<210> 38
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 38
uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60
gucagucagg gucagcaggc cucucucccg c 91
<210> 39
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 39
uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca caaguguaua 60
gucagucauu uucagcaggc cucucucccg c 91
<210> 40
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 40
uagcuggauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60
ggcagucagg gucagcaggc cucucucccg c 91
<210> 41
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 41
gauucugaau uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca 60
caaguguaua gucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 42
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 42
gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60
caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 43
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 43
gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60
caaggggaga gucagucagg gucagcaggc cucucucccg caccugggag c 111
<210> 44
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 44
gcuccccggu gcgggagaga ggccugcuga cccugacugc cucuccccuu guggugguug 60
gagcuggugg cgucggcacg agugccuuga cgauccagcu aauucagaau c 111
<210> 45
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 45
tctcagtcca atgtatggtc cgagcacaag ctctaatcaa agtccgcggg tgtagaccgg 60
ttgccatagg a 71
<210> 46
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 46
ggaccacccc aaaaaugaag gggacuaaaa c 31
<210> 47
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 47
aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60
cuuccccugc 70
<210> 48
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 48
gcagagccuc cagc 14
<210> 49
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 49
cucacuggca gagccuccag c 21
<210> 50
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 50
cccuugcuca cuggcagagc cuccagc 27
<210> 51
<211> 33
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 51
cucucgcccu ugcucacugg cagagccucc agc 33
<210> 52
<211> 38
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 52
cucucgcccu ugcucacugg cagagccucc agcaucgc 38
<210> 53
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 53
ugaacagcuc ucgcccuugc ucacuggcag agccuccagc aucgc 45
<210> 54
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 54
ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60
cuccuccgcc 70
<210> 55
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 55
aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60
cuuccccugc 70
<210> 56
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 56
ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60
cuccuccgcc 70
<210> 57
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 57
ucucagucca auguaugguc cgagcacaag cucuaaucaa aguccgcggg uguagaccgg 60
uugccauagg a 71
<210> 58
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 58
acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 59
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 59
acagcuccuc gcccuugcuc acuggcagag cccucaagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 60
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 60
acagcuccuc gcccuugcuc acuggcagag cccucuagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 61
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 61
acagcuccuc gcccuugcuc acuggcagag cccucgagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 62
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 62
acagcuccuc gcccuugcuc acuggcagag cccugcagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 63
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 63
acagcuccuc gcccuugcuc acuggcagag cccuucagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 64
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 64
acagcuccuc gcccuugcuc acuggcagag cccuacagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 65
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 65
acagcuccuc gcccuugcuc acuggcagag cccuccugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 66
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 66
acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 67
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 67
acagcuccuc gcccuugcuc acuggcagag cccuucugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 68
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 68
acagcuccuc gcccuugcuc acuggcagag cccuacugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 69
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 69
acagcuccuc gcccuugcuc acuggcagag cccucccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 70
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 70
acagcuccuc gcccuugcuc acuggcagag cccugccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 71
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 71
acagcuccuc gcccuugcuc acuggcagag cccuuccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 72
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 72
acagcuccuc gcccuugcuc acuggcagag cccuaccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 73
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 73
acagcuccuc gcccuugcuc acuggcagag cccuccggca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 74
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 74
acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 75
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 75
acagcuccuc gcccuugcuc acuggcagag cccuucggca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 76
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 76
acagcuccuc gcccuugcuc acuggcagag cccuacggca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 77
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 77
acuggcagag cccuccagca ucgcgagcag g 31
<210> 78
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 78
gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc c 51
<210> 79
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 79
acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 80
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 80
accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60
gcgcugccuc cuccgccgcu gccuccuccg c 91
<210> 81
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 81
gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60
cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 120
cuccgcccug c 131
<210> 82
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 82
ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc 60
acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg 120
ccgcugccuc cuccgcccug cagcuuguac a 151
<210> 83
<211> 171
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 83
gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc 60
gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 120
gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca u 171
<210> 84
<211> 191
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 84
ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga 60
acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 120
cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca 180
ugccgccggu g 191
<210> 85
<211> 211
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 85
ccggacacgc ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc 60
accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 120
gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac 180
agcucgucca ugccgccggu ggaguggcgg c 211
<210> 86
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 86
gcgaccgggg aucuccacag auucuuccgg c 31
<210> 87
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 87
gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc u 51
<210> 88
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 88
ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 60
uucugcugcc u 71
<210> 89
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 89
gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60
cguguauacc uucugcugcc uccuccgccg c 91
<210> 90
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 90
caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60
auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc c 111
<210> 91
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 91
ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60
aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 120
cgccgcugcc u 131
<210> 92
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 92
uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug 60
gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 120
cugccuccuc cgccgcugcc uccuccgccc u 151
<210> 93
<211> 171
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 93
cggcgacgua uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu 60
gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 120
uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu a 171
<210> 94
<211> 191
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 94
uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg gugaacagcu 60
ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 120
uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu 180
acagcucguc c 191
<210> 95
<211> 211
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 95
acgcugaacu uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg 60
gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 120
cguguauacc uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc 180
ugcagcuugu acagcucguc caugccgccg g 211
<210> 96
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 96
cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu gccuccuccg 60
cccugcagcu u 71
<210> 97
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 97
cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 60
cuccgcccug c 71
<210> 98
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 98
cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu 60
gccuccuccg c 71
<210> 99
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 99
acuggcagag cccucccagc aucgcgagca ggcgcugccu ccuccgccgc ugccuccucc 60
gccgcugccu cc 72
<210> 100
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 100
ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc 60
cuccgccgcu g 71
<210> 101
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 101
gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 60
gccuccuccg c 71
<210> 102
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 102
uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg 60
ccgcugccuc c 71
<210> 103
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 103
ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu 60
gccuccuccg c 71
<210> 104
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 104
accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60
gcgcugccuc c 71
<210> 105
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 105
gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg 60
agcaggcgcu g 71
<210> 106
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 106
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60
ucgcgagcag g 71
<210> 107
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 107
accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc 60
cagcaucgcg a 71
<210> 108
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 108
gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60
cccuccagca u 71
<210> 109
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 109
guccagcucg accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg 60
cagagcccuc c 71
<210> 110
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 110
cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc uccuccgccg 60
cugccuccuc c 71
<210> 111
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 111
aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 60
cgccgcugcc u 71
<210> 112
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 112
cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc 60
uccuccgccg c 71
<210> 113
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 113
gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 60
cugccuccuc c 71
<210> 114
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 114
cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc 60
cgccgcugcc u 71
<210> 115
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 115
gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 60
uccuccgccg c 71
<210> 116
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 116
cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug 60
cugccuccuc c 71
<210> 117
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 117
cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu 60
auaccuucug c 71
<210> 118
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 118
gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60
cguguauacc u 71
<210> 119
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 119
ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu 60
uccggcgugu a 71
<210> 120
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 120
caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60
auucuuccgg c 71
<210> 121
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 121
augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc 60
cacagauucu u 71
<210> 122
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 122
ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60
aucuccacag a 71
<210> 123
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 123
cucgaccagg augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac 60
cggggaucuc c 71
<210> 124
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 124
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 125
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 125
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 126
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 126
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 127
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 127
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 128
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 128
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 129
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 129
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 130
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 130
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 131
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 131
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 132
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 132
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 133
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 133
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 134
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 134
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 135
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 135
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 136
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 136
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 137
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 137
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 138
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 138
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuuccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 139
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 139
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuaccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 140
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 140
uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60
gcgauguucu cugcugggga auugcgcgau auucaggauu aaaagaagug c 111
<210> 141
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 141
acuacaguug cuccgauauu uaggcuacgu caauaggcac uaacuuauug gcgcugguga 60
acggacuucc ucucgaguac cagaagauga cuacaaaacu ccuuuccauu gcgaguaucg 120
gagucuggcu caguuuggcc agggaggcac u 151
<210> 142
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 142
cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg g 51
<210> 143
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 143
cagcugaggc cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg 60
gguggggggg a 71
<210> 144
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 144
ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg uggggccgcg guggccaggg 60
agccggcgcc gccacgcgcg gguggggggg acugggguug cucgcgggcu c 111
<210> 145
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 145
gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60
uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120
cucgcgggcu ccgggcgggc ggcgggcgcc g 151
<210> 146
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 146
ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu u 51
<210> 147
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 147
gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca 60
caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 148
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 148
aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60
gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120
caccugggag ccgcugagcc ucuggccccg c 151
<210> 149
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 149
ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag u 51
<210> 150
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 150
gggucugcaa ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag 60
ugaauuucaa u 71
<210> 151
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 151
gaccucaguc uaaagguugu gggucugcaa ucggcauggu augaaguacu ucguccagga 60
gcuggagggc ccgguguaag ugaauuucaa uccagcaagg uguuucuuug a 111
<210> 152
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 152
uaagggcccc aacgguaaaa gaccucaguc uaaagguugu gggucugcaa ucggcauggu 60
augaaguacu ucguccagga gcuggagggc ccgguguaag ugaauuucaa uccagcaagg 120
uguuucuuug augcucuguc uuggguaauc c 151
<210> 153
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 153
ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc c 51
<210> 154
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 154
agcagggccg ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc 60
cauccuccga a 71
<210> 155
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 155
aguagaaggc caagagccac agcagggccg ugggggguuc ggcugccgac aucagcaauu 60
gcucugccac caucucagcc cauccuccga agugaaugaa caggaaccag c 111
<210> 156
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 156
ccucccauca cgggggccgu aguagaaggc caagagccac agcagggccg ugggggguuc 60
ggcugccgac aucagcaauu gcucugccac caucucagcc cauccuccga agugaaugaa 120
caggaaccag cucucaaagg gaccuccgca g 151
<210> 157
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 157
gccaaacacc acatgcttgc catctagcca ggctgtcttg actgtcgtga tgaagaactg 60
ggagccgttg gtgtccttgc ctgcgttggc catgctcacc cagccaggcc cgtagtgctt 120
cagtttgaag ttctcatcgg ggaagcgctc a 151
<210> 158
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 158
gggagtgggt ccgctccacc agatgccagc accggggcca gtgcagctca gagccctgtg 60
gcggactaca gggcccgcac agacggtcac tcaaagaaag atgtccctgt gccctactcc 120
ttggcgatgg caaagggctt ctccacctcg a 151
<210> 159
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 159
tgcattttgt aaaatagata ctagcagatt gtcccaagat gtgtacagct cattctcaca 60
gcccagcgag ggcacctact ccacaaatgc gtggccacag gtcatcacct gtcctgtggc 120
cctggcgagc ctgatccctc acgccgggca c 151
<210> 160
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 160
gctcattctc acagcccagc gagggcactt actccacaaa tgcgtggcca caggtcatca 60
cctgtcctgt ggccccggcg agcctgatcc ctcacgccgg gcacccacac ggcctgcgtg 120
ccttctagac ttgagttcgc agctctttaa g 151
<210> 161
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 161
tcggccgggc cctgggggcg gtgggcgctg gccaggacgc ccaccgtgtg gttgctgtcc 60
aggacggtcc cggcccgcga cacttcggcc cagagctgct cctcatccag cagcgccagc 120
agccccatgg ccgtgagcac cggcttgcgc a 151
<210> 162
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 162
ugaccagucu uaagaucuuu cuugaccugc accauaagaa cuucuccaaa gguaccaaaa 60
uacucuuuca gguccuguuc gguuguuuuc caugggagac ccaacacuau u 111
<210> 163
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 163
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 164
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 164
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 165
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 165
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 166
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 166
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 167
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 167
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 168
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 168
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 169
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 169
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 170
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 170
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 171
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 171
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 172
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 172
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 173
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 173
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 174
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 174
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 175
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 175
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 176
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 176
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 177
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 177
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 178
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 178
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 179
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 179
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 180
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 180
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 181
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 181
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 182
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 182
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 183
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 183
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 184
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 184
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 185
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 185
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 186
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 186
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 187
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 187
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 188
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 188
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 189
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 189
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 190
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 190
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 191
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 191
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 192
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 192
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 193
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 193
gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60
caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 194
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 194
gauucugaau uagcuggauc gucaaggcac ucgggccgac gccaccagcu ccaaccacca 60
caaguggaga gucagucauu uucagcaggc cucucucccg caccggggag c 111
<210> 195
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 195
gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60
uucaauaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111
<210> 196
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 196
gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60
uucaagaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111
<210> 197
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 197
gggagcagcc ucuggcaguc ggggagcuuc aucuggaccu gggucuucag ugaaccauug 60
uucaagaucg uccggggaca gcaucaaauc auccagugcu ugggacggca a 111
<210> 198
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 198
cauauuacag aauaccuuga uagcauccaa uuugcauccu ugguuagggu caacccagua 60
uucuccacuc uugaguucag gauggcagaa uuucaggucu cugcaguuuc u 111
<210> 199
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 199
gugaagauaa gccaguccuc uaguaacaga augagcaaga cggcaagagc uuacccaguc 60
acuugugugg agacuuaaau acuugcauaa agauccauug ggauaguacu c 111
<210> 200
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 200
gugaacguca aacugucgga ccaauauggc agaaucuucu cucaucucaa cuuuccauau 60
ccguaucaug gaaucauagc auccuguaac uacuagcucu cuuacagcug g 111
<210> 201
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 201
gccaaugauc ucgugaguua ucucagcagu gugagccauc agggugauga caucccaggc 60
gaucgugugg ccuccaggag cccagagcag gaaguugagg agaaggugcc u 111
<210> 202
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 202
caagacggug aaccacucca uggucuucuu gucggcuuuc ugcacugugu acccccagag 60
cuccguguug ccgacauccu gggguggcuu ccacuccaga gccacauuaa g 111
<210> 203
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 203
aggauucucu uuugaaguau ugcuccccca guggauuggg uggcuccauu cacuccaaug 60
cugagcacuu ccacagagug gguuaaagcg gcuccgaaca cgaaacgugu a 111
<210> 204
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 204
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca uccagcagcg ccagcagccc cauggccgug agcaccggcu u 111
<210> 205
<211> 111
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 205
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggggc gggggggggc cgucgccgcg uggggucguu g 111
<210> 206
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 206
tataactagt atggtgagca agggcgagga g 31
<210> 207
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 207
tatacgtctc atctacagat tcttccggcg tgtatacctt c 41
<210> 208
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 208
tatacgtctc atagagatcc ccggtcgcca ccgtgagcaa gggcgaggag ctg 53
<210> 209
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 209
tataggcgcg ccttacttgt acagctcgtc catgcc 36
<210> 210
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 210
tatacgtctc aaggcgctgc ctcctccgcc gctgcctcct ccgccgctgc ctcctccgcc 60
ctgcagcttg tacagctcgt ccatgccgcc ggtg 94
<210> 211
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 211
tatacgtctc agcctgctcg cgatgctaga gggctctgcc agtgagcaag ggcgaggagc 60
tg 62
<210> 212
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 212
tataactagt atggtggatt acaaggatga cgacgataag atgaaagtga cgaaggtagg 60
aggcatttcg 70
<210> 213
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 213
atatggcgcg ccgttttcag actttttctc ttccattttg tattcaaaca taatcttcac 60
<210> 214
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 214
tataggcgcg ccaggcggag gaggcagcgg cggaggaggc agcctcctcc tctcaaggtc 60
cccagaagc 69
<210> 215
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 215
tatacctgca ggctacacct tgcgtttttt cttgggtact gggcagagat aaaagttctt 60
ttcc 64
<210> 216
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 216
cactccaccg gcggcatgga cgag 24
<210> 217
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 217
cacgctgaac ttgtggccgt ttacgtcg 28
<210> 218
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 218
tataactagt atgaatccgc ggcaggggta ttccctcagc 40
<210> 219
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 219
tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60
cttttcctcc tgg 73
<210> 220
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 220
tataactagt atggatatag aagatgaaga aaacatgagt tc 42
<210> 221
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 221
tataggcgcg ccctacttat cgtcgtcatc cttgtaatcg ggcgtgagtg agaactggtc 60
ctgctcg 67
<210> 222
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 222
tataactagt atggccgaga tcaaggagaa aatctgc 37
<210> 223
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 223
tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60
cttttcctcc tgg 73
<210> 224
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 224
cgccatttcg gactgggag 19
<210> 225
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 225
agagacaggt ttctccatca attac 25
<210> 226
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 226
gagcccgcga gcaacc 16
<210> 227
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 227
gcagcaggaa gaagacggac 20
<210> 228
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 228
agaagcagtt gaagaccaga ctc 23
<210> 229
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 229
ggccttcacc tggaccatag 20
<210> 230
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 230
agagaagcag ttgaagacca ga 22
<210> 231
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 231
cggccttcac ctggaccata 20
<210> 232
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 232
cagagaagca gttgaagacc aga 23
<210> 233
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 233
cggccttcac ctggaccata 20
<210> 234
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 234
tttgtgaaag gctggggacc 20
<210> 235
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 235
acaggattgt attttgtagt ccacc 25
<210> 236
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 236
aggatgagtt ttgtgaaagg ctg 23
<210> 237
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 237
attttgtagt ccaccatcct gata 24
<210> 238
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 238
gatgagtttt gtgaaaggct gg 22
<210> 239
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 239
attttgtagt ccaccatcct gataa 25
<210> 240
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 240
cgaagagaac gagaccgcat 20
<210> 241
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 241
gaagatggtg cacaccggg 19
<210> 242
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 242
gacagatgct tcatcagcag tg 22
<210> 243
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 243
cgaacaaagc caaacccctt t 21
<210> 244
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 244
tctgttaatg gacaaataga aagcc 25
<210> 245
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 245
ggaacattca aaggattggc act 23
<210> 246
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 246
agtcactgca gatggacgca 20
<210> 247
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 247
atctcgatgg gaaattgcag gt 22
<210> 248
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 248
tcagagtttt acctcatcct tcttt 25
<210> 249
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 249
cctgaataca tatgatgacc ttcag 25
<210> 250
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 250
agggcacaga cacagacctc 20
<210> 251
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 251
agggctttca atgccaagac g 21
<210> 252
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 252
tgacaagcca agtcctccc 19
<210> 253
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 253
attgccaatg atgagctctg g 21
<210> 254
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 254
ttatagacat aagttctcct tgcct 25
<210> 255
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 255
tcaatcccat ggagccaaca 20
<210> 256
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 256
tacacgacgc tcttccgatc ttaagtagag gccgccactc caccggcggc 50
<210> 257
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 257
tacacgacgc tcttccgatc tatcatgctt agccgccact ccaccggcgg c 51
<210> 258
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 258
tacacgacgc tcttccgatc tgatgcacat ctgccgccac tccaccggcg gc 52
<210> 259
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 259
tacacgacgc tcttccgatc tcgattgctc gacgccgcca ctccaccggc ggc 53
<210> 260
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 260
tacacgacgc tcttccgatc ttcgatagca attcgccgcc actccaccgg cggc 54
<210> 261
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 261
tacacgacgc tcttccgatc tatcgatagt tgcttgccgc cactccaccg gcggc 55
<210> 262
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 262
tacacgacgc tcttccgatc tgatcgatcc agttaggccg ccactccacc ggcggc 56
<210> 263
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 263
tacacgacgc tcttccgatc tcgatcgatt tgagcctgcc gccactccac cggcggc 57
<210> 264
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 264
tacacgacgc tcttccgatc tacgatcgat acacgatcgc cgccactcca ccggcggc 58
<210> 265
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 265
tacacgacgc tcttccgatc ttacgatcga tggtccagag ccgccactcc accggcggc 59
<210> 266
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 266
agacgtgtgc tcttccgatc ttaagtagag tcgccgtcca gctcgaccag 50
<210> 267
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 267
agacgtgtgc tcttccgatc tatcatgctt atcgccgtcc agctcgacca g 51
<210> 268
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 268
agacgtgtgc tcttccgatc tgatgcacat cttcgccgtc cagctcgacc ag 52
<210> 269
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 269
agacgtgtgc tcttccgatc tcgattgctc gactcgccgt ccagctcgac cag 53
<210> 270
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 270
agacgtgtgc tcttccgatc ttcgatagca attctcgccg tccagctcga ccag 54
<210> 271
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 271
agacgtgtgc tcttccgatc tatcgatagt tgctttcgcc gtccagctcg accag 55
<210> 272
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 272
agacgtgtgc tcttccgatc tgatcgatcc agttagtcgc cgtccagctc gaccag 56
<210> 273
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 273
agacgtgtgc tcttccgatc tcgatcgatt tgagccttcg ccgtccagct cgaccag 57
<210> 274
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 274
agacgtgtgc tcttccgatc tacgatcgat acacgatctc gccgtccagc tcgaccag 58
<210> 275
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 275
agacgtgtgc tcttccgatc ttacgatcga tggtccagat cgccgtccag ctcgaccag 59
<210> 276
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 276
ggggaactcg ggcaacct 18
<210> 277
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 277
gaatcggatc tgccccgtg 19
<210> 278
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 278
catcgaggcc aagctggaa 19
<210> 279
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 279
gtagtgagga gggagacccc 20
<210> 280
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 280
aagcctcctt ccttccccaa 20
<210> 281
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 281
atcgatacac tccctagccc a 21
<210> 282
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 282
acaaattcgg tacatcctcg ac 22
<210> 283
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 283
ttcagccatc tttggaaggt t 21
<210> 284
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 284
acgccgcatt gaccatctat 20
<210> 285
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 285
tagccaggag gttctcaaca 20
<210> 286
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 286
ggcatggact gtggtcatga g 21
<210> 287
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 287
tgcaccacca actgcttagc 20
<210> 288
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 288
ccccgtaatg cagaagaaga cc 22
<210> 289
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 289
gtccttcagc ttcagcctct g 21
<210> 290
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 290
aacgcaacat gaaggtgctc 20
<210> 291
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 291
accttgacgg tgactttggg 20
<210> 292
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 292
cagtgcaatg agggaccagt 20
<210> 293
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 293
aggaccatag gtacatcttc agag 24
<210> 294
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 294
cgaacgagtt gtatcacctg ga 22
<210> 295
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 295
cgatggctgt ccctcaaagt 20
<210> 296
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 296
agttgctctt ttcactcaag gtc 23
<210> 297
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 297
ttctctctga gttcagacgc t 21
<210> 298
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 298
tacacgacgc tcttccgatc ttaagtagag tggcacagga ggaaagagca tc 52
<210> 299
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 299
agacgtgtgc tcttccgatc ttaagtagag gcaccacctc catgccctc 49
<210> 300
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 300
tacacgacgc tcttccgatc ttaagtagag catcgcagac tgcggcaag 49
<210> 301
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 301
agacgtgtgc tcttccgatc ttaagtagag agtccatggg cctgtggaat gt 52
<210> 302
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 302
gaaaaactgg cccgagagc 19
<210> 303
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 303
ctgagtctgg gctgagggac 20
<210> 304
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 304
cgcttccagg tcaacaacac 20
<210> 305
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 305
ctcgcgtaga tcagcaccg 19
<210> 306
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 306
cccctctgag tcaggaaaca t 21
<210> 307
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 307
gaagatgaca ggggccagg 19
<210> 308
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 308
tagcactggc tggaatgag 19
<210> 309
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 309
gtttcggagg taacctgtaa g 21
<210> 310
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 310
tacagcaacc atgagtacaa 20
<210> 311
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 311
tcaggtgttt cacataggc 19
<210> 312
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 312
ctgcaaccat gagtgagaa 19
<210> 313
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 313
cctttgaggt gctttagata g 21
<210> 314
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 314
gccctgagaa aggagacat 19
<210> 315
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 315
ctgttctgga ggtactctag gtat 24
<210> 316
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 316
tttgaagagg gctgagaa 18
<210> 317
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 317
tgttctggat atttcatgg 19
<210> 318
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 318
catctgcctc cccatattcc 20
<210> 319
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 319
tccatcctag ctcatctcca aa 22
<210> 320
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 320
tgctccagaa ggccagac 18
<210> 321
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 321
ttcataaata ctactaaggc acagg 25
<210> 322
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 322
acagatgaag tgctccttcc a 21
<210> 323
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 323
gtcggagatt cgtagctgga t 21
<210> 324
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 324
cattgtggcc aaggagatct g 21
<210> 325
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 325
cttcggagtt tgggtttgct t 21
<210> 326
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 326
catcacttgc tgctgacacg 20
<210> 327
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 327
tgtggaatct gccgggag 18
<210> 328
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 328
ctgactctaa gtggcatt 18
<210> 329
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 329
tgatggcctt cgattctg 18
<210> 330
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 330
cggagtcaac ggatttggtc gta 23
<210> 331
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 331
agccttctcc atggtggtga agac 24
<210> 332
<211> 2820
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 332
atggccgaga tcaaggagaa aatctgcgac tatctcttca atgtgtctga ctcctctgcc 60
ctgaatttgg ctaaaaatat tggccttacc aaggcccgag atataaatgc tgtgctaatt 120
gacatggaaa ggcaggggga tgtctataga caagggacaa cccctcccat atggcatttg 180
acagacaaga agcgagagag gatgcaaatc aagagaaata cgaacagtgt tcctgaaacc 240
gctccagctg caatccctga gaccaaaaga aacgcagagt tcctcacctg taatataccc 300
acatcaaatg cctcaaataa catggtaacc acagaaaaag tggagaatgg gcaggaacct 360
gtcataaagt tagaaaacag gcaagaggcc agaccagaac cagcaagact gaaaccacct 420
gttcattaca atggcccctc aaaagcaggg tatgttgact ttgaaaatgg ccagtgggcc 480
acagatgaca tcccagatga cttgaatagt atccgcgcag caccaggtga gtttcgagcc 540
atcatggaga tgccctcctt ctacagtcat ggcttgccac ggtgttcacc ctacaagaaa 600
ctgacagagt gccagctgaa gaaccccatc agcgggctgt tagaatatgc ccagttcgct 660
agtcaaacct gtgagttcaa catgatagag cagagtggac caccccatga acctcgattt 720
aaattccagg ttgtcatcaa tggccgagag tttcccccag ctgaagctgg aagcaagaaa 780
gtggccaagc aggatgcagc tatgaaagcc atgacaattc tgctagagga agccaaagcc 840
aaggacagtg gaaaatcaga agaatcatcc cactattcca cagagaaaga atcagagaag 900
actgcagagt cccagacccc caccccttca gccacatcct tcttttctgg gaagagcccc 960
gtcaccacac tgcttgagtg tatgcacaaa ttggggaact cctgcgaatt ccgtctcctg 1020
tccaaagaag gccctgccca tgaacccaag ttccaatact gtgttgcagt gggagcccaa 1080
actttcccca gtgtgagtgc tcccagcaag aaagtggcaa agcagatggc cgcagaggaa 1140
gccatgaagg ccctgcatgg ggaggcgacc aactccatgg cttctgataa ccagcctgaa 1200
ggtatgatct cagagtcact tgataacttg gaatccatga tgcccaacaa ggtcaggaag 1260
attggcgagc tcgtgagata cctgaacacc aaccctgtgg gtggcctttt ggagtacgcc 1320
cgctcccatg gctttgctgc tgaattcaag ttggtcgacc agtccggacc tcctcacgag 1380
cccaagttcg tttaccaagc aaaagttggg ggtcgctggt tcccagccgt ctgcgcacac 1440
agcaagaagc aaggcaagca ggaagcagca gatgcggctc tccgtgtctt gattggggag 1500
aacgagaagg cagaacgcat gggtttcaca gaggtaaccc cagtgacagg ggccagtctc 1560
agaagaacta tgctcctcct ctcaaggtcc ccagaagcac agccaaagac actccctctc 1620
actggcagca ccttccatga ccagatagcc atgctgagcc accggtgctt caacactctg 1680
actaacagct tccagccctc cttgctcggc cgcaagattc tggccgccat cattatgaaa 1740
aaagactctg aggacatggg tgtcgtcgtc agcttgggaa cagggaatcg ctgtgtaaaa 1800
ggagattctc tcagcctaaa aggagaaact gtcaatgact gccatgcaga aataatctcc 1860
cggagaggct tcatcaggtt tctctacagt gagttaatga aatacaactc ccagactgcg 1920
aaggatagta tatttgaacc tgctaaggga ggagaaaagc tccaaataaa aaagactgtg 1980
tcattccatc tgtatatcag cactgctccg tgtggagatg gcgccctctt tgacaagtcc 2040
tgcagcgacc gtgctatgga aagcacagaa tcccgccact accctgtctt cgagaatccc 2100
aaacaaggaa agctccgcac caaggtggag aacggagaag gcacaatccc tgtggaatcc 2160
agtgacattg tgcctacgtg ggatggcatt cggctcgggg agagactccg taccatgtcc 2220
tgtagtgaca aaatcctacg ctggaacgtg ctgggcctgc aaggggcact gttgacccac 2280
ttcctgcagc ccatttatct caaatctgtc acattgggtt accttttcag ccaagggcat 2340
ctgacccgtg ctatttgctg tcgtgtgaca agagatggga gtgcatttga ggatggacta 2400
cgacatccct ttattgtcaa ccaccccaag gttggcagag tcagcatata tgattccaaa 2460
aggcaatccg ggaagactaa ggagacaagc gtcaactggt gtctggctga tggctatgac 2520
ctggagatcc tggacggtac cagaggcact gtggatgggc cacggaatga attgtcccgg 2580
gtctccaaaa agaacatttt tcttctattt aagaagctct gctccttccg ttaccgcagg 2640
gatctactga gactctccta tggtgaggcc aagaaagctg cccgtgacta cgagacggcc 2700
aagaactact tcaaaaaagg cctgaaggat atgggctatg ggaactggat tagcaaaccc 2760
caggaggaaa agaactttta tctctgccca gtagattaca aggatgacga cgataagtag 2820
<210> 333
<211> 3705
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 333
atgaatccgc ggcaggggta ttccctcagc ggatactaca cccatccatt tcaaggctat 60
gagcacagac agctcagata ccagcagcct gggccaggat cttcccccag tagtttcctg 120
cttaagcaaa tagaatttct caaggggcag ctcccagaag caccggtgat tggaaagcag 180
acaccgtcac tgccaccttc cctcccagga ctccggccaa ggtttccagt actacttgcc 240
tccagtacca gaggcaggca agtggacatc aggggtgtcc ccaggggcgt gcatctcgga 300
agtcaggggc tccagagagg gttccagcat ccttcaccac gtggcaggag tctgccacag 360
agaggtgttg attgcctttc ctcacatttc caggaactga gtatctacca agatcaggaa 420
caaaggatct taaagttcct ggaagagctt ggggaaggga aggccaccac agcacatgat 480
ctgtctggga aacttgggac tccgaagaaa gaaatcaatc gagttttata ctccctggca 540
aagaagggca agctacagaa agaggcagga acaccccctt tgtggaaaat cgcggtctcc 600
actcaggctt ggaaccagca cagcggagtg gtaagaccag acggtcatag ccaaggagcc 660
ccaaactcag acccgagttt ggaaccggaa gacagaaact ccacatctgt ctcagaagat 720
cttcttgagc cttttattgc agtctcagct caggcttgga accagcacag cggagtggta 780
agaccagaca gtcatagcca aggatcccca aactcagacc caggtttgga acctgaagac 840
agcaactcca catctgcctt ggaagatcct cttgagtttt tagacatggc cgagatcaag 900
gagaaaatct gcgactatct cttcaatgtg tctgactcct ctgccctgaa tttggctaaa 960
aatattggcc ttaccaaggc ccgagatata aatgctgtgc taattgacat ggaaaggcag 1020
ggggatgtct atagacaagg gacaacccct cccatatggc atttgacaga caagaagcga 1080
gagaggatgc aaatcaagag aaatacgaac agtgttcctg aaaccgctcc agctgcaatc 1140
cctgagacca aaagaaacgc agagttcctc acctgtaata tacccacatc aaatgcctca 1200
aataacatgg taaccacaga aaaagtggag aatgggcagg aacctgtcat aaagttagaa 1260
aacaggcaag aggccagacc agaaccagca agactgaaac cacctgttca ttacaatggc 1320
ccctcaaaag cagggtatgt tgactttgaa aatggccagt gggccacaga tgacatccca 1380
gatgacttga atagtatccg cgcagcacca ggtgagtttc gagccatcat ggagatgccc 1440
tccttctaca gtcatggctt gccacggtgt tcaccctaca agaaactgac agagtgccag 1500
ctgaagaacc ccatcagcgg gctgttagaa tatgcccagt tcgctagtca aacctgtgag 1560
ttcaacatga tagagcagag tggaccaccc catgaacctc gatttaaatt ccaggttgtc 1620
atcaatggcc gagagtttcc cccagctgaa gctggaagca agaaagtggc caagcaggat 1680
gcagctatga aagccatgac aattctgcta gaggaagcca aagccaagga cagtggaaaa 1740
tcagaagaat catcccacta ttccacagag aaagaatcag agaagactgc agagtcccag 1800
acccccaccc cttcagccac atccttcttt tctgggaaga gccccgtcac cacactgctt 1860
gagtgtatgc acaaattggg gaactcctgc gaattccgtc tcctgtccaa agaaggccct 1920
gcccatgaac ccaagttcca atactgtgtt gcagtgggag cccaaacttt ccccagtgtg 1980
agtgctccca gcaagaaagt ggcaaagcag atggccgcag aggaagccat gaaggccctg 2040
catggggagg cgaccaactc catggcttct gataaccagc ctgaaggtat gatctcagag 2100
tcacttgata acttggaatc catgatgccc aacaaggtca ggaagattgg cgagctcgtg 2160
agatacctga acaccaaccc tgtgggtggc cttttggagt acgcccgctc ccatggcttt 2220
gctgctgaat tcaagttggt cgaccagtcc ggacctcctc acgagcccaa gttcgtttac 2280
caagcaaaag ttgggggtcg ctggttccca gccgtctgcg cacacagcaa gaagcaaggc 2340
aagcaggaag cagcagatgc ggctctccgt gtcttgattg gggagaacga gaaggcagaa 2400
cgcatgggtt tcacagaggt aaccccagtg acaggggcca gtctcagaag aactatgctc 2460
ctcctctcaa ggtccccaga agcacagcca aagacactcc ctctcactgg cagcaccttc 2520
catgaccaga tagccatgct gagccaccgg tgcttcaaca ctctgactaa cagcttccag 2580
ccctccttgc tcggccgcaa gattctggcc gccatcatta tgaaaaaaga ctctgaggac 2640
atgggtgtcg tcgtcagctt gggaacaggg aatcgctgtg taaaaggaga ttctctcagc 2700
ctaaaaggag aaactgtcaa tgactgccat gcagaaataa tctcccggag aggcttcatc 2760
aggtttctct acagtgagtt aatgaaatac aactcccaga ctgcgaagga tagtatattt 2820
gaacctgcta agggaggaga aaagctccaa ataaaaaaga ctgtgtcatt ccatctgtat 2880
atcagcactg ctccgtgtgg agatggcgcc ctctttgaca agtcctgcag cgaccgtgct 2940
atggaaagca cagaatcccg ccactaccct gtcttcgaga atcccaaaca aggaaagctc 3000
cgcaccaagg tggagaacgg agaaggcaca atccctgtgg aatccagtga cattgtgcct 3060
acgtgggatg gcattcggct cggggagaga ctccgtacca tgtcctgtag tgacaaaatc 3120
ctacgctgga acgtgctggg cctgcaaggg gcactgttga cccacttcct gcagcccatt 3180
tatctcaaat ctgtcacatt gggttacctt ttcagccaag ggcatctgac ccgtgctatt 3240
tgctgtcgtg tgacaagaga tgggagtgca tttgaggatg gactacgaca tccctttatt 3300
gtcaaccacc ccaaggttgg cagagtcagc atatatgatt ccaaaaggca atccgggaag 3360
actaaggaga caagcgtcaa ctggtgtctg gctgatggct atgacctgga gatcctggac 3420
ggtaccagag gcactgtgga tgggccacgg aatgaattgt cccgggtctc caaaaagaac 3480
atttttcttc tatttaagaa gctctgctcc ttccgttacc gcagggatct actgagactc 3540
tcctatggtg aggccaagaa agctgcccgt gactacgaga cggccaagaa ctacttcaaa 3600
aaaggcctga aggatatggg ctatgggaac tggattagca aaccccagga ggaaaagaac 3660
ttttatctct gcccagtaga ttacaaggat gacgacgata agtag 3705
<210> 334
<211> 2130
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 334
atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60
aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120
ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180
ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240
aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300
actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360
gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420
tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480
gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540
gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600
agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660
cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720
aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780
aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840
aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900
ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960
caggttttag ctgacgctgt ctcacgcctg gtcctgggta agtttggtga cctgaccgac 1020
aacttctcct cccctcacgc tcgcagaaaa gtgctggctg gagtcgtcat gacaacaggc 1080
acagatgtta aagatgccaa ggtgataagt gtttctacag gaacaaaatg tattaatggt 1140
gaatacatga gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat aatatctcgg 1200
agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa caaagatgat 1260
caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatgtc 1320
cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380
gagccaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440
cggaccaaaa tagagtctgg tgaggggacg attccagtgc gctccaatgc gagcatccaa 1500
acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560
gcacgctgga acgtggtggg catccaggga tccctgctca gcattttcgt ggagcccatt 1620
tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680
taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740
ctcagtggca tcagcaatgc agaagcacgg cagccaggga aggcccccaa cttcagtgtc 1800
aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaaggatgag 1860
ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920
ggcaaggttc cctcccactt actacgctcc aagattacca aacccaacgt gtaccatgag 1980
tccaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040
aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100
cccgattaca aggatgacga cgataagtag 2130
<210> 335
<211> 4401
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 335
atgatgagct ttgtgcaaaa ggggagctgg ctacttctcg ctctgcttca tcccactatt 60
attttggcac aacaggaagc tgttgaagga ggatgttccc atcttggtca gtcctatgcg 120
gatagagatg tctggaagcc agaaccatgc caaatatgtg tctgtgactc aggatccgtt 180
ctctgcgatg acataatatg tgacgatcaa gaattagact gccccaaccc agaaattcca 240
tttggagaat gttgtgcagt ttgcccacag cctccaactg ctcctactcg ccctcctaat 300
ggtcaaggac ctcaaggccc caagggagat ccaggccctc ctggtattcc tgggagaaat 360
ggtgaccctg gtattccagg acaaccaggg tcccctggtt ctcctggccc ccctggaatc 420
tgtgaatcat gccctactgg tcctcagaac tattctcccc agtatgattc atatgatgtc 480
aagtctggag tagcagtagg aggactcgca ggctatcctg gaccagctgg ccccccaggc 540
cctcccggtc cccctggtac atctggtcat cctggttccc ctggatctcc aggataccaa 600
ggaccccctg gtgaacctgg gcaagctggt ccttcaggcc ctccaggacc tcctggtgct 660
ataggtccat ctggtcctgc tggaaaagat ggagaatcag gtagacccgg acgacctgga 720
gagcgaggat tgcctggacc tccaggtatc aaaggtccag ctgggatacc tggattccct 780
ggtatgaaag gacacagagg cttcgatgga cgaaatggag aaaagggtga aacaggtgct 840
cctggattaa agggtgaaaa tggtcttcca ggcgaaaatg gagctcctgg acccatgggt 900
ccaagagggg ctcctggtga gcgaggacgg ccaggacttc ctggggctgc aggtgctcgg 960
ggtaatgacg gtgctcgagg cagtgatggt caaccaggcc ctcctggtcc tcctggaact 1020
gccggattcc ctggatcccc tggtgctaag ggtgaagttg gacctgcagg gtctcctggt 1080
tcaaatggtg cccctggaca aagaggagaa cctggacctc agggacacgc tggtgctcaa 1140
ggtcctcctg gccctcctgg gattaatggt agtcctggtg gtaaaggcga aatgggtccc 1200
gctggcattc ctggagctcc tggactgatg ggagcccggg gtcctccagg accagccggt 1260
gctaatggtg ctcctggact gcgaggtggt gcaggtgagc ctggtaagaa tggtgccaaa 1320
ggagagcccg gaccacgtgg tgaacgcggt gaggctggta ttccaggtgt tccaggagct 1380
aaaggcgaag atggcaagga tggatcacct ggagaacctg gtgcaaatgg gcttccagga 1440
gctgcaggag aaaggggtgc ccctgggttc cgaggacctg ctggaccaaa tggcatccca 1500
ggagaaaagg gtcctgctgg agagcgtggt gctccaggcc ctgcagggcc cagaggagct 1560
gctggagaac ctggcagaga tggcgtccct ggaggtccag gaatgagggg catgcccgga 1620
agtccaggag gaccaggaag tgatgggaaa ccagggcctc ccggaagtca aggagaaagt 1680
ggtcgaccag gtcctcctgg gccatctggt ccccgaggtc agcctggtgt catgggcttc 1740
cccggtccta aaggaaatga tggtgctcct ggtaagaatg gagaacgagg tggccctgga 1800
ggacctggcc ctcagggtcc tcctggaaag aatggtgaaa ctggacctca gggaccccca 1860
gggcctactg ggcctggtgg tgacaaagga gacacaggac cccctggtcc acaaggatta 1920
caaggcttgc ctggtacagg tggtcctcca ggagaaaatg gaaaacctgg ggaaccaggt 1980
ccaaagggtg atgccggtgc acctggagct ccaggaggca agggtgatgc tggtgcccct 2040
ggtgaacgtg gacctcctgg attggcaggg gccccaggac ttagaggtgg agctggtccc 2100
cctggtcccg aaggaggaaa gggtgctgct ggtcctcctg ggccacctgg tgctgctggt 2160
actcctggtc tgcaaggaat gcctggagaa agaggaggtc ttggaagtcc tggtccaaag 2220
ggtgacaagg gtgaaccagg cggtccaggt gctgatggtg tcccagggaa agatggccca 2280
aggggtccta ctggtcctat tggtcctcct ggcccagctg gccagcctgg agataagggt 2340
gaaggtggtg cccccggact tccaggtata gctggacctc gtggtagccc tggtgagaga 2400
ggtgaaactg gccctccagg acctgctggt ttccctggtg ctcctggaca gaatggtgaa 2460
cctggtggta aaggagaaag aggggctccg ggtgagaaag gtgaaggagg ccctcctgga 2520
gttgcaggac cccctggagg ttctggacct gctggtcctc ctggtcccca aggtgtcaaa 2580
ggtgaacgtg gcagtcctgg tggacctggt gctgctggct tccctggtgc tcgtggtctt 2640
cctggtcctc ctggtagtaa tggtaaccca ggacccccag gtcccagcgg ttctccaggc 2700
aaggatgggc ccccaggtcc tgcgggtaac actggtgctc ctggcagccc tggagtgtct 2760
ggaccaaaag gtgatgctgg ccaaccagga gagaagggat cgcctggtgc ccagggccca 2820
ccaggagctc caggcccact tgggattgct gggatcactg gagcacgggg tcttgcagga 2880
ccaccaggca tgccaggtcc taggggaagc cctggccctc agggtgtcaa gggtgaaagt 2940
gggaaaccag gagctaacgg tctcagtgga gaacgtggtc cccctggacc ccagggtctt 3000
cctggtctgg ctggtacagc tggtgaacct ggaagagatg gaaaccctgg atcagatggt 3060
cttccaggcc gagatggatc tcctggtggc aagggtgatc gtggtgaaaa tggctctcct 3120
ggtgcccctg gcgctcctgg tcatccaggc ccacctggtc ctgtcggtcc agctggaaag 3180
agtggtgaca gaggagaaag tggccctgct ggccctgctg gtgctcccgg tcctgctggt 3240
tcccgaggtg ctcctggtcc tcaaggccca cgtggtgaca aaggtgaaac aggtgaacgt 3300
ggagctgctg gcatcaaagg acatcgagga ttccctggta atccaggtgc cccaggttct 3360
ccaggccctg ctggtcagca gggtgcaatc ggcagtccag gacctgcagg ccccagagga 3420
cctgttggac ccagtggacc tcctggcaaa gatggaacca gtggacatcc aggtcccatt 3480
ggaccaccag ggcctcgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540
ccagggcaac caggccctcc tggacctcct ggtgcccctg gtccttgctg tggtggtgtt 3600
ggagccgctg ccattgctgg gattggaggt gaaaaagctg gcggttttgc cccgtattat 3660
ggagatgaac caatggattt caaaatcaac accgatgaga ttatgacttc actcaagtct 3720
gttaatggac aaatagaaag cctcattagt cctgatggtt ctcgtaaaaa ccccgctaga 3780
aactgcagag acctgaaatt ctgccatcct gaactcaaga gtggagaata ctgggttgac 3840
cctaaccaag gatgcaaatt ggatgctatc aaggtattct gtaatatgga aactggggaa 3900
acatgcataa gtgccaatcc tttgaatgtt ccacggaaac actggtggac agattctagt 3960
gctgagaaga aacacgtttg gtttggagag tccatggatg gtggttttca gtttagctac 4020
ggcaatcctg aacttcctga agatgtcctt gatgtgcagc tggcattcct tcgacttctc 4080
tccagccgag cttcccagaa catcacatat cactgcaaaa atagcattgc atacatggat 4140
caggccagtg gaaatgtaaa gaaggccctg aagctgatgg ggtcaaatga aggtgaattc 4200
aaggctgaag gaaatagcaa attcacctac acagttctgg aggatggttg cacgaaacac 4260
actggggaat ggagcaaaac agtctttgaa tatcgaacac gcaaggctgt gagactacct 4320
attgtagata ttgcacccta tgacattggt ggtcctgatc aagaatttgg tgtggacgtt 4380
ggccctgttt gctttttata a 4401
<210> 336
<211> 3117
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 336
atgacttcct cgctgcagcg gccctggcgg gtgccctggc taccatggac catcctgctg 60
gtcagcgctg cggctgcttc gcagaatcaa gaacggctat gtgcgtttaa agatccgtat 120
cagcaagacc ttgggatagg tgagagtaga atctctcatg aaaatgggac aatattatgc 180
tcgaaaggta gcacctgcta tggcctttgg gagaaatcaa aaggggacat aaatcttgta 240
aaacaaggat gttggtctca cattggagat ccccaagagt gtcactatga agaatgtgta 300
gtaactacca ctcctccctc aattcagaat ggaacatacc gtttctgctg ttgtagcaca 360
gatttatgta atgtcaactt tactgagaat tttccacctc ctgacacaac accactcagt 420
ccacctcatt catttaaccg agatgagaca ataatcattg ctttggcatc agtctctgta 480
ttagctgttt tgatagttgc cttatgcttt ggatacagaa tgttgacagg agaccgtaaa 540
caaggtcttc acagtatgaa catgatggag gcagcagcat ccgaaccctc tcttgatcta 600
gataatctga aactgttgga gctgattggc cgaggtcgat atggagcagt atataaaggc 660
tccttggatg agcgtccagt tgctgtaaaa gtgttttcct ttgcaaaccg tcagaatttt 720
atcaacgaaa agaacattta cagagtgcct ttgatggaac atgacaacat tgcccgcttt 780
atagttggag atgagagagt cactgcagat ggacgcatgg aatatttgct tgtgatggag 840
tactatccca atggatcttt atgcaagtat ttaagtctcc acacaagtga ctgggtaagc 900
tcttgccgtc ttgctcattc tgttactaga ggactggctt atcttcacac agaattacca 960
cgaggagatc attataaacc tgcaatttcc catcgagatt taaacagcag aaatgtccta 1020
gtgaaaaatg atggaacctg tgttattagt gactttggac tgtccatgag gctgactgga 1080
aatagactgg tgcgcccagg ggaggaagat aatgcagcca taagcgaggt tggcactatc 1140
agatatatgg caccagaagt gctagaagga gctgtgaact tgagggactg tgaatcagct 1200
ttgaaacaag tagacatgta tgctcttgga ctaatctatt gggagatatt tatgagatgt 1260
acagacctct tcccagggga atccgtacca gagtaccaga tggcttttca gacagaggtt 1320
ggaaaccatc ccacttttga ggatatgcag gttctcgtgt ctagggaaaa acagagaccc 1380
aagttcccag aagcctggaa agaaaatagc ctggcagtga ggtcactcaa ggagacaatc 1440
gaagactgtt gggaccagga tgcagaggct cggcttactg cacagtgtgc tgaggaaagg 1500
atggctgaac ttatgatgat ttgggaaaga aacaaatctg tgagcccaac agtcaatcca 1560
atgtctactg ctatgcagaa tgaacgcaac ctgtcacata ataggcgtgt gccaaaaatt 1620
ggtccttatc cagattattc ttcctcctca tacattgaag actctatcca tcatactgac 1680
agcatcgtga agaatatttc ctctgagcat tctatgtcca gcacaccttt gactataggg 1740
gaaaaaaacc gaaattcaat taactatgaa cgacagcaag cacaagctcg aatccccagc 1800
cctgaaacaa gtgtcaccag cctctccacc aacacaacaa ccacaaacac cacaggactc 1860
acgccaagta ctggcatgac tactatatct gagatgccat acccagatga aacaaatctg 1920
cataccacaa atgttgcaca gtcaattggg ccaacccctg tctgcttaca gctgacagaa 1980
gaagacttgg aaaccaacaa gctagaccca aaagaagttg ataagaacct caaggaaagc 2040
tctgatgaga atctcatgga gcactctctt aaacagttca gtggcccaga cccactgagc 2100
agtactagtt ctagcttgct ttacccactc ataaaacttg cagtagaagc aactggacag 2160
caggacttca cacagactgc aaatggccaa gcatgtttga ttcctgatgt tctgcctact 2220
cagatctatc ctctccccaa gcagcagaac cttcccaaga gacctactag tttgcctttg 2280
aacaccaaaa attcaacaaa agagccccgg ctaaaatttg gcagcaagca caaatcaaac 2340
ttgaaacaag tcgaaactgg agttgccaag atgaatacaa tcaatgcagc agaacctcat 2400
gtggtgacag tcaccatgaa tggtgtggca ggtagaaacc acagtgttaa ctcccatgct 2460
gccacaaccc aatatgccaa tgggacagta ctatctggcc aaacaaccaa catagtgaca 2520
catagggccc aagaaatgtt gcagaatcag tttattggtg aggacacccg gctgaatatt 2580
aattccagtc ctgatgagca tgagccttta ctgagacgag agcaacaagc tggccatgat 2640
gaaggtgttc tggatcgtct tgtggacagg agggaacggc cactagaagg tggccgaact 2700
aattccaata acaacaacag caatccatgt tcagaacaag atgttcttgc acagggtgtt 2760
ccaagcacag cagcagatcc tgggccatca aagcccagaa gagcacagag gcctaattct 2820
ctggatcttt cagccacaaa tgtcctggat ggcagcagta tacagatagg tgagtcaaca 2880
caagatggca aatcaggatc aggtgaaaag atcaagaaac gtgtgaaaac tccctattct 2940
cttaagcggt ggcgcccctc cacctgggtc atctccactg aatcgctgga ctgtgaagtc 3000
aacaataatg gcagtaacag ggcagttcat tccaaatcca gcactgctgt ttaccttgca 3060
gaaggaggca ctgctacaac catggtgtct aaagatatag gaatgaactg tctgtga 3117
<210> 337
<211> 3590
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 337
atgcctacag ctgagagtga agcaaaagta aaaaccaaag ttcgctttga agaattgctt 60
aagacccaca gtgatctaat gcgtgaaaag aaaaaactga agaaaaaact tgtcaggtct 120
gaagaaaaca tctcacctga cactattaga agcaatcttc actatatgaa agaaactaca 180
agtgatgatc ccgacactat tagaagcaat cttccccata ttaaagaaac tacaagtgat 240
gatgtaagtg ctgctaacac taacaacctg aagaagagca cgagagtcac taaaaacaaa 300
ttgaggaaca cacagttagc aactgaaaat cctaatggtg atgctagtgt agaggaagac 360
aaacaaggaa agccaaataa aaaggtgata aagacggtgc cccagttgac tacacaagac 420
ctgaaaccgg aaactcctga gaataaggtt gattctacac accagaaaac acatacaaag 480
ccacagccag gcgttgatca tcagaaaagt gagaaggcaa atgagggaag agaagagact 540
gatttagaag aggatgaaga attgatgcaa gcatatcagt gccatgtaac tgaagaaatg 600
gcaaaggaga ttaagaggaa aataagaaag aaactgaaag aacagttgac ttactttccc 660
tcagatactt tattccatga tgacaaacta agcagtgaaa aaaggaaaaa gaaaaaggaa 720
gttccagtct tctctaaagc tgaaacaagt acattgacca tctctggtga cacagttgaa 780
ggtgaacaaa agaaagaatc ttcagttaga tcagtttctt cagattctca tcaagatgat 840
gaaataagct caatggaaca aagcacagaa gacagcatgc aagatgatac aaaacctaaa 900
ccaaaaaaaa caaaaaagaa gactaaagca gttgcagata ataatgaaga tgttgatggt 960
gatggtgttc atgaaataac aagccgagat agcccggttt atcccaaatg tttgcttgat 1020
gatgaccttg tcttgggagt ttacattcac cgaactgata gacttaagtc agattttatg 1080
atttctcacc caatggtaaa aattcatgtg gttgatgagc atactggtca atatgtcaag 1140
aaagatgata gtggacggcc tgtttcatct tactatgaaa aagagaatgt ggattatatt 1200
cttcctatta tgacccagcc atatgatttt aaacagttaa aatcaagact tccagagtgg 1260
gaagaacaaa ttgtatttaa tgaaaatttt ccctatttgc ttcgaggctc tgatgagagt 1320
cctaaagtca tcctgttctt tgagattctt gatttcttaa gcgtggatga aattaagaat 1380
aattctgagg ttcaaaacca agaatgtggc tttcggaaaa ttgcctgggc atttcttaag 1440
cttctgggag ccaatggaaa tgcaaacatc aactcaaaac ttcgcttgca gctatattac 1500
ccacctacta agcctcgatc cccattaagt gttgttgagg catttgaatg gtggtcaaaa 1560
tgtccaagaa atcattaccc atcaacactg tacgtaactg taagaggact gaaagttcca 1620
gactgtataa agccatctta ccgctctatg atggctcttc aggaggaaaa aggtaaacca 1680
gtgcattgtg aacgtcacca tgagtcaagc tcagtagaca cagaacctgg attagaagag 1740
tcaaaggaag taataaagtg gaaacgactc cctgggcagg cttgccgtat cccaaacaaa 1800
cacctcttct cactaaatgc aggagaacga ggatgttttt gtcttgattt ctcccacaat 1860
ggaagaatat tagcagcagc ttgtgccagc cgggatggat atccaattat tttatatgaa 1920
attccttctg gacgtttcat gagagaattg tgtggccacc tcaatatcat ttatgatctt 1980
tcctggtcaa aagatgatca ctacatcctt acttcatcat ctgatggcac tgccaggata 2040
tggaaaaatg aaataaacaa tacaaatact ttcagagttt tacctcatcc ttcttttgtt 2100
tacacggcta aattccatcc agctgtaaga gagctagtag ttacaggatg ctatgattcc 2160
atgatacgga tatggaaagt tgagatgaga gaagattctg ccatattggt ccgacagttt 2220
gacgttcaca aaagttttat caactcactt tgttttgata ctgaaggtca tcatatgtat 2280
tcaggagatt gtacaggggt gattgttgtt tggaatacct atgtcaagat taatgatttg 2340
gaacattcag tgcaccactg gactataaat aaggaaatta aagaaactga gtttaaggga 2400
attccaataa gttatttgga gattcatccc aatggaaaac gtttgttaat ccataccaaa 2460
gacagtactt tgagaattat ggatctccgg atattagtag caaggaagtt tgtaggagca 2520
gcaaattatc gggagaagat tcatagtact ttgactccat gtgggacttt tctgtttgct 2580
ggaagtgagg atggtatagt gtatgtttgg aacccagaaa caggagaaca agtagccatg 2640
tattctgact tgccattcaa gtcacccatt cgagacattt cttatcatcc atttgaaaat 2700
atggttgcat tctgtgcatt tgggcaaaat gagccaattc ttctgtatat ttacgatttc 2760
catgttgccc agcaggaggc tgaaatgttc aaacgctaca atggaacatt tccattacct 2820
ggaatacacc aaagtcaaga tgccctatgt acctgtccaa aactacccca tcaaggctct 2880
tttcagattg atgaatttgt ccacactgaa agttcttcaa cgaagatgca gctagtaaaa 2940
cagaggcttg aaactgtcac agaggtgata cgttcctgtg ctgcaaaagt caacaaaaat 3000
ctctcattta cttcaccacc agcagtttcc tcacaacagt ctaagttaaa gcagtcaaac 3060
atgctgaccg ctcaagagat tctacatcag tttggtttca ctcagaccgg gattatcagc 3120
atagaaagaa agccttgtaa ccatcaggta gatacagcac caacggtagt ggctctttat 3180
gactacacag cgaatcgatc agatgaacta accatccatc gcggagacat tatccgagtg 3240
tttttcaaag ataatgaaga ctggtggtat ggcagcatag gaaagggaca ggaaggttat 3300
tttccagcta atcatgtggc tagtgaaaca ctgtatcaag aactgcctcc tgagataaag 3360
gagcgatccc ctcctttaag ccctgaggaa aaaactaaaa tagaaaaatc tccagctcct 3420
caaaagcaat caatcaataa gaacaagtcc caggacttca gactaggctc agaatctatg 3480
acacattctg aaatgagaaa agaacagagc catgaggacc aaggacacat aatggataca 3540
cggatgagga agaacaagca agcaggcaga aaagtcactc taatagagta 3590
<210> 338
<211> 1677
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 338
atggctcaag attcagtaga tctttcttgt gattatcagt tttggatgca gaagctttct 60
gtatgggatc aggcttccac tttggaaacc cagcaagaca cctgtcttca cgtggctcag 120
ttccaggagt tcctaaggaa gatgtatgaa gccttgaaag agatggattc taatacagtc 180
attgaaagat tccccacaat tggtcaactg ttggcaaaag cttgttggaa tccttttatt 240
ttagcatatg atgaaagcca aaaaattcta atatggtgct tatgttgtct aattaacaaa 300
gaaccacaga attctggaca atcaaaactt aactcctgga tacagggtgt attatctcat 360
atactttcag cactcagatt tgataaagaa gttgctcttt tcactcaagg tcttgggtat 420
gcacctatag attactatcc tggtttgctt aaaaatatgg ttttatcatt agcgtctgaa 480
ctcagagaga atcatcttaa tggatttaac actcaaaggc gaatggctcc cgagcgagtg 540
gcgtccctgt cacgagtttg tgtcccactt attaccctga cagatgttga ccccctggtg 600
gaggctctcc tcatctgtca tggacgtgaa cctcaggaaa tcctccagcc agagttcttt 660
gaggctgtaa acgaggccat tttgctgaag aagatttctc tccccatgtc agctgtagtc 720
tgcctctggc ttcggcacct tcccagcctt gaaaaagcaa tgctgcatct ttttgaaaag 780
ctaatctcca gtgagagaaa ttgtctgaga aggatcgaat gctttataaa agattcatcg 840
ctgcctcaag cagcctgcca ccctgccata ttccgggttg ttgatgagat gttcaggtgt 900
gcactcctgg aaaccgatgg ggccctggaa atcatagcca ctattcaggt gtttacgcag 960
tgctttgtag aagctctgga gaaagcaagc aagcagctgc ggtttgcact caagacctac 1020
tttccttaca cttctccatc tcttgccatg gtgctgctgc aagaccctca agatatccct 1080
cggggacact ggctccagac actgaagcat atttctgaac tgctcagaga agcagttgaa 1140
gaccagactc atgggtcctg cggaggtccc tttgagagct ggttcctgtt cattcacttc 1200
ggaggatggg ctgagatggt ggcagagcaa ttactgatgt cggcagccga accccccacg 1260
gccctgctgt ggctcttggc cttctactac ggcccccgtg atgggaggca gcagagagca 1320
cagactatgg tccaggtgaa ggccgtgctg ggccacctcc tggcaatgtc cagaagcagc 1380
agcctctcag cccaggacct gcagacggta gcaggacagg gcacagacac agacctcaga 1440
gctcctgcac aacagctgat caggcacctt ctcctcaact tcctgctctg ggctcctgga 1500
ggccacacga tcgcctggga tgtcatcacc ctgatggctc acactgctga gataactcac 1560
gagatcattg gctttcttga ccagaccttg tacagatgga atcgtcttgg cattgaaagc 1620
cctagatcag aaaaactggc ccgagagctc cttaaagagc tgcgaactca agtctag 1677
<210> 339
<211> 3825
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 339
atgcctgagc cggggaagaa gccagtctca gcttttagca agaagccacg gtcagtggaa 60
gtggccgcag gcagccctgc cgtgttcgag gccgagacag agcgggcagg agtgaaggtg 120
cgctggcagc gcggaggcag tgacatcagc gccagcaaca agtacggcct ggccacagag 180
ggcacacggc atacgctgac agtgcgggaa gtgggccctg ccgaccaggg atcttacgca 240
gtcattgctg gctcctccaa ggtcaagttc gacctcaagg tcatagaggc agagaaggca 300
gagcccatgc tggcccctgc ccctgcccct gctgaggcca ctggagcccc tggagaagcc 360
ccggccccag ccgctgagct gggagaaagt gccccaagtc ccaaagggtc aagctcagca 420
gctctcaatg gtcctacccc tggagccccc gatgacccca ttggcctctt cgtgatgcgg 480
ccacaggatg gcgaggtgac cgtgggtggc agcatcacct tctcagcccg cgtggccggc 540
gccagcctcc tgaagccgcc tgtggtcaag tggttcaagg gcaaatgggt ggacctgagc 600
agcaaggtgg gccagcacct gcagctgcac gacagctacg accgcgccag caaggtctat 660
ctgttcgagc tgcacatcac cgatgcccag cctgccttca ctggcagcta ccgctgtgag 720
gtgtccacca aggacaaatt tgactgctcc aacttcaatc tcactgtcca cgaggccatg 780
ggcaccggag acctggacct cctatcagcc ttccgccgca cgagcctggc tggaggtggt 840
cggcggatca gtgatagcca tgaggacact gggattctgg acttcagctc actgctgaaa 900
aagagagaca gtttccggac cccgagggac tcgaagctgg aggcaccagc agaggaggac 960
gtgtgggaga tcctacggca ggcaccccca tctgagtacg agcgcatcgc cttccagtac 1020
ggcgtcactg acctgcgcgg catgctaaag aggctcaagg gcatgaggcg cgatgagaag 1080
aagagcacag cctttcagaa gaagctggag ccggcctacc aggtgagcaa aggccacaag 1140
atccggctga ccgtggaact ggctgaccat gacgctgagg tcaaatggct caagaatggc 1200
caggagatcc agatgagcgg cagcaagtac atctttgagt ccatcggtgc caagcgtacc 1260
ctgaccatca gccagtgctc attggcggac gacgcagcct accagtgcgt ggtgggtggc 1320
gagaagtgta gcacggagct ctttgtgaaa gagccccctg tgctcatcac gcgccccttg 1380
gaggaccagc tggtgatggt ggggcagcgg gtggagtttg agtgtgaagt atcggaggag 1440
ggggcgcaag tcaaatggct gaaggacggg gtggagctga cccgggagga gaccttcaaa 1500
taccggttca agaaggacgg gcagagacac cacctgatca tcaacgaggc catgctggag 1560
gacgcggggc actatgcact gtgcactagc gggggccagg cgctggctga gctcattgtg 1620
caggaaaaga agctggaggt gtaccagagc atcgcagacc tgatggtggg cgcaaaggac 1680
caggcggtgt tcaaatgtga ggtctcagat gagaatgttc ggggtgtgtg gctgaagaat 1740
gggaaggagc tggtgcccga cagccgcata aaggtgtccc acatcgggcg ggtccacaaa 1800
ctgaccattg acgacgtcac acctgccgac gaggctgact acagctttgt gcccgagggc 1860
ttcgcctgca acctgtcagc caagctccac ttcatggagg tcaagattga cttcgtaccc 1920
aggcaggaac ctcccaagat ccacctggac tgcccaggcc gcataccaga caccattgtg 1980
gttgtagctg gaaataagct acgtctggac gtccctatct ctggggaccc tgctcccact 2040
gtgatctggc agaaggctat cacgcagggg aataaggccc cagccaggcc agccccagat 2100
gccccagagg acacaggtga cagcgatgag tgggtgtttg acaagaagct gctgtgtgag 2160
accgagggcc gggtccgcgt ggagaccacc aaggaccgca gcatcttcac ggtcgagggg 2220
gcagagaagg aagatgaggg cgtctacacg gtcacagtga agaaccctgt gggcgaggac 2280
caggtcaacc tcacagtcaa ggtcatcgac gtgccagacg cacctgcggc ccccaagatc 2340
agcaacgtgg gagaggactc ctgcacagta cagtgggagc cgcctgccta cgatggcggg 2400
cagcccatcc tgggctacat cctggagcgc aagaagaaga agagctaccg gtggatgcgg 2460
ctgaacttcg acctgattca ggagctgagt catgaagcgc ggcgcatgat cgagggcgtg 2520
gtgtacgaga tgcgcgtcta cgcggtcaac gccatcggca tgtccaggcc cagccctgcc 2580
tcccagccct tcatgcctat cggtcccccc agcgaaccca cccacctggc agtagaggac 2640
gtctctgaca ccacggtctc cctcaagtgg cggcccccag agcgcgtggg agcaggaggc 2700
ctggatggct acagcgtgga gtactgccca gagggctgct cagagtgggt ggctgccctg 2760
caggggctga cagagcacac atcgatactg gtgaaggacc tgcccacggg ggcccggctg 2820
cttttccgag tgcgggcaca caatatggca gggcctggag cccctgttac caccacggag 2880
ccggtgacag tgcaggagat cctgcaacgg ccacggcttc agctgcccag gcacctgcgc 2940
cagaccattc agaagaaggt cggggagcct gtgaaccttc tcatcccttt ccagggcaag 3000
ccccggcctc aggtgacctg gaccaaagag gggcagcccc tggcaggcga ggaggtgagc 3060
atccgcaaca gccccacaga caccatcctg ttcatccggg ccgctcgccg cgtgcattca 3120
ggcacttacc aggtgacggt gcgcattgag aacatggagg acaaggccac gctggtgctg 3180
caggttgttg acaagccaag tcctccccag gatctccggg tgactgacgc ctggggtctt 3240
aatgtggctc tggagtggaa gccaccccag gatgtcggca acacggagct ctgggggtac 3300
acagtgcaga aagccgacaa gaagaccatg gagtggttca ccgtcttgga gcattaccgc 3360
cgcacccact gcgtggtgcc agagctcatc attggcaatg gctactactt ccgcgtcttc 3420
agccagaata tggttggctt tagtgacaga gcggccacca ccaaggagcc cgtctttatc 3480
cccagaccag gcatcaccta tgagccaccc aactataagg ccctggactt ctccgaggcc 3540
ccaagcttca cccagcccct ggtgaaccgc tcggtcatcg cgggctacac tgctatgctc 3600
tgctgtgctg tccggggtag ccccaagccc aagatttcct ggttcaagaa tggcctggac 3660
ctgggagaag acgcccgctt ccgcatgttc agcaagcagg gagtgttgac tctggagatt 3720
agaaagccct gcccctttga cgggggcatc tatgtctgca gggccaccaa cttacagggc 3780
gaggcacggt gtgagtgccg cctggaggtg cgagtgcctc agtga 3825
<210> 340
<211> 1110
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 340
atgttgaagc catcattacc attcacatcc ctcttattcc tgcagctgcc cctgctggga 60
gtggggctga acacgacaat tctgacgccc aatgggaatg aagacaccac agctgatttc 120
ttcctgacca ctatgcccac tgactccctc agtgtttcca ctctgcccct cccagaggtt 180
cagtgttttg tgttcaatgt cgagtacatg aattgcactt ggaacagcag ctctgagccc 240
cagcctacca acctcactct gcattattgg tacaagaact cggataatga taaagtccag 300
aagtgcagcc actatctatt ctctgaagaa atcacttctg gctgtcagtt gcaaaaaaag 360
gagatccacc tctaccaaac atttgttgtt cagctccagg acccacggga acccaggaga 420
caggccacac agatgctaaa actgcagaat ctggtgatcc cctgggctcc agagaaccta 480
acacttcaca aactgagtga atcccagcta gaactgaact ggaacaacag attcttgaac 540
cactgtttgg agcacttggt gcagtaccgg actgactggg accacagctg gactgaacaa 600
tcagtggatt atagacataa gttctccttg cctagtgtgg atgggcagaa acgctacacg 660
tttcgtgttc ggagccgctt taacccactc tgtggaagtg ctcagcattg gagtgaatgg 720
agccacccaa tccactgggg gagcaatact tcaaaagaga atcctttcct gtttgcattg 780
gaagccgtgg ttatctctgt tggctccatg ggattgatta tcagccttct ctgtgtgtat 840
ttctggctgg aacggacgat gccccgaatt cccaccctga agaacctaga ggatcttgtt 900
actgaatacc acgggaactt ttcggcctgg agtggtgtgt ctaagggact ggctgagagt 960
ctgcagccag actacagtga acgactctgc ctcgtcagtg agattccccc aaaaggaggg 1020
gcccttgggg aggggcctgg ggcctcccca tgcaaccagc atagccccta ctgggccccc 1080
ccatgttaca ccctaaagcc tgaaacctga 1110
<210> 341
<211> 108
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 341
uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60
ggauguucuc cgcggggaua ucgcgauauu caggauuaaa agaagugc 108
<210> 342
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 342
uaauccugaa uaucgcgcaa uuccccagca gagaacaucg cggugugaac gucccuuuau 60
accgggcagg uauagcugaa aucagcgugg c 91
<210> 343
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 343
uuucagcuau accugcccgg uauaaaggga cguucacacc gcgauguucu cugcugggga 60
auugcgcgau a 71
<210> 344
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 344
gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60
ucugcggggc gggggggggc cgucgccgcg u 91
<210> 345
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 345
uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc 60
gggggggggc c 71
<210> 346
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 346
ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc g 51
<210> 347
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 347
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggggc gggggggggc cgucgccgcg u 101
<210> 348
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 348
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggggc gggggggggc c 91
<210> 349
<211> 81
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 349
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggggc g 81
<210> 350
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 350
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca u 71
<210> 351
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 351
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
c 61
<210> 352
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 352
gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60
ucugcggggc gggggggggc cgucgccgcg uggggucguu g 101
<210> 353
<211> 91
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 353
uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc 60
gggggggggc cgucgccgcg uggggucguu g 91
<210> 354
<211> 81
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 354
ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc gggggggggc 60
cgucgccgcg uggggucguu g 81
<210> 355
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 355
ugcgacacuu cggcccagag cugcuccuca ucugcggggc gggggggggc cgucgccgcg 60
uggggucguu g 71
<210> 356
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 356
cggcccagag cugcuccuca ucugcggggc gggggggggc cgucgccgcg uggggucguu 60
g 61
<210> 357
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 357
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggggc 80
<210> 358
<211> 79
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 358
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcgggg 79
<210> 359
<211> 78
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 359
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggg 78
<210> 360
<211> 77
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 360
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcgg 77
<210> 361
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 361
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcg 76
<210> 362
<211> 75
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 362
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugc 75
<210> 363
<211> 74
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 363
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucug 74
<210> 364
<211> 73
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 364
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucu 73
<210> 365
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 365
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca uc 72
<210> 366
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 366
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca 70
<210> 367
<211> 69
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 367
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuc 69
<210> 368
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 368
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccu 68
<210> 369
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 369
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcucc 67
<210> 370
<211> 66
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 370
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuc 66
<210> 371
<211> 65
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 371
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcu 65
<210> 372
<211> 64
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 372
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugc 64
<210> 373
<211> 63
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 373
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cug 63
<210> 374
<211> 62
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 374
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cu 62
<210> 375
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 375
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
c 61
<210> 376
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 376
uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60
gcgauguucu 70
<210> 377
<211> 66
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 377
uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60
gcgaug 66
<210> 378
<211> 71
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 378
ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60
ccucaucugc g 71
<210> 379
<211> 66
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 379
gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60
ucugcg 66
<210> 380
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 380
guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu ccucaucugc 60
g 61
<210> 381
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 381
uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcg 56
<210> 382
<211> 66
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 382
ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60
ccucau 66
<210> 383
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 383
gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60
u 61
<210> 384
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 384
guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu ccucau 56
<210> 385
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 385
uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca u 51
<210> 386
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 386
acgcccaccg ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc 60
ugcuccu 67
<210> 387
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 387
cgcccaccgu gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu 60
gcuccuc 67
<210> 388
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 388
gcccaccgug ugguugcugu ccaggacggu cccggccugc gacacuucgg cccagagcug 60
cuccuca 67
<210> 389
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 389
cccaccgugu gguugcuguc caggacgguc ccggccugcg acacuucggc ccagagcugc 60
uccucau 67
<210> 390
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 390
ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60
ccucauc 67
<210> 391
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 391
caccgugugg uugcugucca ggacgguccc ggccugcgac acuucggccc agagcugcuc 60
cucaucu 67
<210> 392
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 392
accguguggu ugcuguccag gacggucccg gccugcgaca cuucggccca gagcugcucc 60
ucaucug 67
<210> 393
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 393
ccgugugguu gcuguccagg acggucccgg ccugcgacac uucggcccag agcugcuccu 60
caucugc 67
<210> 394
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 394
cgugugguug cuguccagga cggucccggc cugcgacacu ucggcccaga gcugcuccuc 60
aucugcg 67
<210> 395
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 395
gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60
ucugcgg 67
<210> 396
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 396
ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc ugcuccucau 60
cugcggg 67
<210> 397
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 397
gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu gcuccucauc 60
ugcgggg 67
<210> 398
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 398
acgcccaccg ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc 60
ugcuccucau 70
<210> 399
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 399
cgcccaccgu gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu 60
gcuccucauc 70
<210> 400
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 400
gcccaccgug ugguugcugu ccaggacggu cccggccugc gacacuucgg cccagagcug 60
cuccucaucu 70
<210> 401
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 401
cccaccgugu gguugcuguc caggacgguc ccggccugcg acacuucggc ccagagcugc 60
uccucaucug 70
<210> 402
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 402
ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60
ccucaucugc 70
<210> 403
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 403
caccgugugg uugcugucca ggacgguccc ggccugcgac acuucggccc agagcugcuc 60
cucaucugcg 70
<210> 404
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 404
accguguggu ugcuguccag gacggucccg gccugcgaca cuucggccca gagcugcucc 60
ucaucugcgg 70
<210> 405
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 405
ccgugugguu gcuguccagg acggucccgg ccugcgacac uucggcccag agcugcuccu 60
caucugcggg 70
<210> 406
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 406
cgugugguug cuguccagga cggucccggc cugcgacacu ucggcccaga gcugcuccuc 60
aucugcgggg 70
<210> 407
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 407
acgcccaccg ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc 60
ugcuccucau cu 72
<210> 408
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 408
cgcccaccgu gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu 60
gcuccucauc ug 72
<210> 409
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 409
gcccaccgug ugguugcugu ccaggacggu cccggccugc gacacuucgg cccagagcug 60
cuccucaucu gc 72
<210> 410
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 410
cccaccgugu gguugcuguc caggacgguc ccggccugcg acacuucggc ccagagcugc 60
uccucaucug cg 72
<210> 411
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 411
ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60
ccucaucugc gg 72
<210> 412
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 412
caccgugugg uugcugucca ggacgguccc ggccugcgac acuucggccc agagcugcuc 60
cucaucugcg gg 72
<210> 413
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 413
accguguggu ugcuguccag gacggucccg gccugcgaca cuucggccca gagcugcucc 60
ucaucugcgg gg 72
<210> 414
<211> 50
<212> RNA
<213> 人工序列
<220>
<223> dRNA/arRNA
<400> 414
cuguccagga cggucccggc cugcgacacu ucggcccaga gcugcuccuc 50
<210> 415
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物: hIDUA-62F
<400> 415
ccttcctgag ctaccacccg 20
<210> 416
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物: hIDUA-62R
<400> 416
ccagggctcg aactcggtag 20