CN108707621B

CN108707621B - 一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法

Info

Publication number: CN108707621B
Application number: CN201810385845.5A
Authority: CN
Inventors: 夏兰琴; 李少雅; 赵云德; 李晶莹; 杜文明; 张佳慧
Original assignee: Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Current assignee: Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date: 2018-04-26
Filing date: 2018-04-26
Publication date: 2021-02-12
Anticipated expiration: 2038-04-26
Also published as: CN108707621A; WO2019207274A1

Abstract

本发明公开了一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法。本发明以水稻ALS基因为研究对象，构建了同源重组载体。将RCR1‑RCR2‑RDR片段进行体外转录，通过RNP方法，以RNA转录本作为修复模板，在水稻愈伤中实现了目的基因的同源重组修复。同时，利用基因枪方法将载体导入水稻愈伤中，获得了ALS基因定点修饰的水稻植株。结果表明，以RNA作为修复模板可成功介导目的基因的同源重组，为农作物育种提供了新思路，因此在农业育种方面具有强大的应用潜力。

Description

一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法

技术领域

本发明涉及一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法。

背景技术

CRISPR/Cpf1极大拓展了基因编辑范围，已开始应用于农作物遗传改良研究中。利用CRISPR/Cas9介导的基因组编辑技术进行基因敲除，已经在水稻等农作物中得到应用。但是，由于植物中同源重组频率低，利用CRISPR/Cas9介导的同源重组，在农作物中实现基因定点替换或定点整合却少有报道。目前，利用CRISPR/Cpf1系统介导的目的基因片段替换尚未有报道。

有假设提出RNA转录本可作为修复模板参与到DNA双链断裂(DSBs)导致的DNA同源重组修复(HDR)中去，而在酵母和人类细胞中，此假设已被证实。2014年，在一项酵母的研究中，RNA为修复模板介导基因组DNA的同源重组修复的有效性进一步被证实。然而，在酵母和人类细胞中，这一技术并未被广泛应用，主要由于在酵母和人类细胞中DNA修复模板可通过电转化、显微注射或转染等转化方法高效进入细胞，从而介导DNA的重组修复。但是在植物细胞中，由于细胞壁的存在，这些转化方法均不适用，尤其对于一些作物品种如：玉米、小麦、水稻等单子叶植物而言。因此在农作物中通过CRISPR/Cas系统实现目的基因的同源重组修复有很大难度，主要因为：1)在植物细胞中，DSBs主要通过非同源末端连接(non-homologous end joining，NHEJ)的方式进行修复，同源重组介导的修复(homology-directed repair，HDR)发生几率极其小；2)将修复模板转入植物细胞中的量十分有限，目前有两种方法可以提高修复模板的量，但效果仍不理想，一种方式为通过基因枪转化法将修复模板片段导入细胞内；另外一种方法是将修复模板连入病毒来源的replicon载体中，将载体转化细胞，从而增加修复模板的量。

发明内容

本发明的目的是提供一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法。

本发明提供了一种用于取代植物基因组中的目标片段的表达盒甲，包括启动子甲和终止子，其特征在于：在启动子甲和终止子之间包括如下三个区段：区段Ⅰ、区段Ⅱ和区段Ⅲ；区段Ⅲ为区段Ⅲ-1或区段Ⅲ-2；

区段Ⅰ中具有两个核酸酶的编码序列和一个位于它们之间的crRNA1的编码序列；

区段Ⅱ中具有两个核酸酶的编码序列和一个位于它们之间的crRNA2的编码序列；

区段Ⅲ-1中具有两个核酸酶的编码序列和位于它们之间的模板区段；

区段Ⅲ-2中具有两个靶标序列和位于它们之间的模板区段；

所述模板区段包括上游同源臂、供体片段序列和下游同源臂；

所述目标片段的一个末端为区段Ⅰ中crRNA1的靶标序列，另一个末端为区段Ⅱ中crRNA2的靶标序列；

供体片段与目标片段具有如下差异：①预期在目标片段中引入的差异核苷酸；②将crRNA1的靶标中的TTTN突变为非TTTN；③将crRNA2的靶标中的TTTN突变为非TTTN。

区段Ⅰ自5’至3’端依次具有Hammerhead型核酸酶的编码序列、crRNA1的编码序列和丁型肝炎病毒核酸酶的编码序列。

区段Ⅱ自5’至3’端依次具有Hammerhead型核酸酶的编码序列、crRNA2的编码序列和丁型肝炎病毒核酸酶的编码序列。

区段Ⅲ-1中自5’至3’端依次具有Hammerhead型核酸酶的编码序列、上游同源臂、供体片段序列、下游同源臂和丁型肝炎病毒核酸酶的编码序列。

区段Ⅲ-2中自5’至3’端依次具有crRNA1的靶标序列、上游同源臂、供体片段序列、下游同源臂和crRNA2的靶标序列。

所述目标片段中，crRNA1的靶标和crRNA2的靶标之间具有限制性内切酶的识别序列；所述供体片段与目标片段的区别还包括如下④：将所述限制性内切酶的识别序列突变为非识别序列。

所述Hammerhead型核酸酶的编码序列如序列表中序列1自5’端第394至436位所示或序列表的序列1自5’端第724至766位所示。

所述丁型肝炎病毒核酸酶的编码序列如序列表中序列1自5’端第481至548位所示。

所述crRNA1的编码序列如序列表的序列1自5’端第437至480位所示。

所述crRNA2的编码序列如序列表的序列1自5’端第602至645位所示。

所述上游同源臂如序列表的序列1自5’端第767至863位所示。

所述下游同源臂如序列表的序列1自5’端第1245至1365位所示。

所述供体片段序列如序列表的序列1自5’端第864至1244位所示。

所述区段Ⅰ如序列表的序列1自5’端第394至548位所示。

所述区段Ⅱ如序列表的序列1自5’端第559至713位所示。

crRNA1的靶标序列如序列表的序列2自5’端第709至735位所示。

crRNA2的靶标序列如序列表的序列2自5’端第1335至1361位所示。

所述区段Ⅲ-1如序列表的序列1自5’端第724-1433位所示。

所述区段Ⅲ-2如序列表的序列2自5’端第709-1361位所示。

所述启动子甲为OsU3启动子。所述OsU3启动子如序列表的序列1自5’端第13至393位所示。

所述终止子为Nos终止子。所述Nos终止子的序列如序列表的序列1自5’端第1434至1686位所示。

所述表达盒甲如序列表的序列1自5’端第13-1686位所示。

所述表达盒甲如序列表的序列2所示。

所述目标片段具体可为植物基因组中ALS基因中序列表的序列6所示的片段。

本发明还保护含有以上任一所述表达盒甲的重组载体。

所述重组载体还包括表达盒乙；所述表达盒乙中由启动子乙启动LbCpf1核酸酶的编码基因表达。

所述启动子乙为Ubi启动子。所述Ubi启动子的反向互补序列如序列表的序列1自5’端第5912至7897位所示。

所述LbCpf1核酸酶的编码基因的反向互补序列如序列表的序列1自5’端第2061至5909位所示。

所述表达盒乙还包括终止子。所述所述终止子为Nos终止子。所述Nos终止子的反向互补序列如序列表的序列1自5’端第1789至2041位所示。

所述表达盒乙的反向互补序列如序列表的1自5’端1789至7897位所示。

所述重组载体为序列表的序列1所示的环形质粒。

所述重组载体为采用序列2所示的双链DNA分子替代序列1自5’端第13-1686位得到的环形质粒。

本发明还保护以上任一所述表达盒甲，或，以上任一所述的重组载体在实现植物中以RNA转录本为模板进行靶基因同源重组中的应用。

本发明一种植物中以RNA转录本为模板进行靶基因同源重组的方法，包括如下步骤：将以上任一所述的重组载体导入出发植物，实现植物中靶基因同源重组。

以上任一所述靶基因为ALS基因。

以上任一所述植物可为1)或2)或3)或4)或5)：1)单子叶植物；2)双子叶植物；3)禾本科植物；4)水稻；5)水稻品种中花11(Japonica cv.)。

本发明以水稻ALS基因为研究对象，构建了同源重组载体：pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos和pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos。将RCR1-RCR2-RDR片段进行体外转录，通过RNP方法，以RNA转录本作为修复模板，在水稻愈伤中实现了目的基因的同源重组修复。同时，利用基因枪方法将载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos、pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos和pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armeddonor(with targets)分别导入水稻愈伤中，获得了ALS基因定点修饰的水稻植株，其中pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)为DNA修复模板的对照载体。研究结果表明，以RNA作为修复模板可成功介导目的基因的同源重组，为农作物育种提供了新思路，因此在农业育种方面具有强大的应用潜力。

附图说明

图1为三个载体框架图。

图2为水稻愈伤组织中目的基因的测序鉴定结果。

图3为转基因植株中目的基因的测序鉴定结果。

具体实施方式

以下的实施例便于更好地理解本发明，但并不限定本发明。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的试验材料，如无特殊说明，均为自常规生化试剂商店购买得到的。以下实施例中的定量试验，均设置三次重复实验，结果取平均值。

下述实施例中的用于水稻转化的水稻材料为中花11(Japonica cv.)，由中国农业科学院作物科学研究所提供。

质粒pCXUN-Cas9记载于如下文献中：He et al.，2017和Sun et al.，2016；公众可以从中国农业科学院作物科学研究所获得。

质粒pRS316-RCR-GFP记载于如下文献中：Zhang et al.，2017；公众可以从中国农业科学院作物科学研究所获得。

LbCpf1-OsU6载体记载于如下文献中：Wang et al.，2017；公众可以从中国农业科学院作物科学研究所获得。

pCXUN-Cas9-OsU3记载于如下文献中：Sun et al.，2016；公众可以从中国农业科学院作物科学研究所获得。

下述实施例中所用的内切酶、试剂盒和PCR酶均购自试剂公司。其它试剂均为国产分析纯。

下述实施例中的引物、DNA合成及测序均由华大公司完成。

下述实施例中所用的引物如表1。

表1引物序列

实施例1、利用CRISPR/Cpf1系统实现以RNA转录本作为修复模板介导的ALS基因的精确修饰

一、表达载体的构建

1、质粒pCXUN-LbCpf1-Nos的构建

(1)用限制性内切酶BamHI和HindIII双酶切质粒pCXUN-Cas9，得到约9282bp的载体骨架1。

(2)用限制性内切酶BamHI和HindIII双酶切LbCpf1-OsU6载体，得到约5846bp的Ubi-LbCpf1表达盒。

(3)将载体骨架1和Ubi-LbCpf1表达盒用T4连接酶连接，得到质粒pCXUN-LbCpf1-Nos。

2、OsU3-RCR1-RCR2表达盒的构建

(1)以质粒pRS316-RCR-GFP为模板，采用引物RCR1F2和引物RCR-common-R组成的引物对进行第一轮PCR扩增，得到第一轮PCR扩增产物。

(2)以步骤(1)得到的第一轮PCR扩增产物为模板，采用引物RCRF1和引物RCR-common-R组成的引物对进行第二轮PCR扩增，得到第二轮PCR扩增产物(RCR1)。

(3)以质粒pRS316-RCR-GFP为模板，采用引物RCR2-F2和引物RCR-common-R组成的引物对进行第一轮PCR扩增，得到第一轮PCR扩增产物。

(4)以步骤(3)得到的第一轮PCR扩增产物为模板，采用引物RCR-F1和引物RCR-common-R组成的引物对进行第二轮PCR扩增，得到第二轮PCR扩增产物(RCR2)。

(5)以pCXUN-Cas9-OsU3为模板，采用引物OsU3F和引物OsU3-RCR1R组成的引物对进行PCR扩增，得到第一轮PCR扩增产物(OsU3启动子序列)。

(6)以步骤(2)得到的第二轮PCR扩增产物(RCR1)为模板，采用引物RCR-Common-F和引物RCR1-10random-R组成的引物对进行第二轮PCR扩增，得到第二轮PCR扩增产物。

(7)将步骤(5)得到的第一轮PCR扩增产物(OsU3启动子序列)和步骤(6)得到的第二轮PCR扩增产物按照摩尔比1:1混合后作为模板，采用引物OsU3F和引物RCR1-10 random-R组成的引物对进行第三轮PCR扩增，得到第三轮PCR产物(OsU3-RCR1表达盒)。

(8)以步骤(4)得到的第二轮PCR扩增产物(RCR2)为模板，采用引物RCR2-10random-F和引物SacI-RCR2-R组成的引物对进行第四轮PCR扩增，得到第四轮PCR扩增产物。

(9)将步骤(7)得到的第三轮PCR产物(OsU3-RCR1表达盒)和步骤(8)得到的第四轮PCR扩增产物按照摩尔比1:1混合后作为模板，采用引物SacI-OsU3-F和引物SacI-RCR2-R进行第五轮PCR扩增，得到第五轮PCR扩增产物(OsU3-RCR1-RCR2表达盒)。

3、RDR片段的合成

(1)将引物HHF和引物HHR退火形成HH片段(第一轮产物)。

(2)以化学合成定点修饰的ALS基因片段(序列表的序列4)为模板，采用引物donor-HH-F和引物donor-HH-F组成的引物对进行PCR扩增，得到第二轮产物。

(3)以质粒pRS316-RGR-GFP为模板，采用引物HDVF和引物HDVR组成的引物对进行PCR扩增，得到第三轮产物。

(4)以质粒pCXUN-Cas9为模板，采用引物Nos-HDVF和引物KPN-NosR组成的引物对进行PCR扩增，得到第四轮产物

(5)将第一轮产物、第二轮产物、第三轮产物和第四轮产物按照摩尔比1:1:1:1进行混合后，采用引物Kpn-HHF和引物Kpn-NosR组成的引物对进行PCR扩增，得到RDR片段。

4、armed donor(with targets)-Nos片段的合成

(1)以化学合成定点修饰的ALS基因片段(序列表的序列4)为模板，采用引物Kpn-donorF和引物donor-R组成的引物对进行PCR扩增，得到第一轮产物。

(2)以pCXUN-Ubi-LbCpf1-Nos质粒为模板，采用引物Nos-donorF和引物Kpn-NosR组成的引物对进行PCR扩增，得到第二轮产物。

(3)将第一轮产物和第二轮产物按照摩尔比1:1混合后作为模板采用引物Kpn-donorF和引物Kpn-NosR组成的引物对进行PCR扩增，得到armed donor(with targets)-Nos片段。

5、载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos的合成

将步骤2制备的OsU3-RCR1-RCR2表达盒和步骤1制备的质粒pCXUN-LbCpf1-Nos利用同源重组酶(全式金,北京,中国)进行连接获得重组载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos，将步骤3得到的RDR片段插入重组载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos的KpnI位点中，得到载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos。

载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos经测序如序列表的序列1所示。序列表中序列1自5’末端起，第13至713位为OsU3-RCR1-RCR2表达盒的核苷酸序列，其中，第13至393位为OsU3启动子的核苷酸序列，第394至436位和第559至601位均为Hammerhead(HH)型核酸酶的核苷酸序列，第481至548位和第646至713位均为丁型肝炎病毒(HDV)核酸酶的核苷酸序列，第437至480位为crRNA1的核苷酸序列，第602至645位为crRNA2的核苷酸序列。序列表中序列1自5’末端起，第724至1433位为RDR片段，其中，第724至766位为Hammerhead(HH)型核酸酶的核苷酸序列，第1366至1433位为丁型肝炎病毒(HDV)核酸酶的核苷酸序列，第767至1365位为DRT序列。序列表中序列1自5’末端起，第1434至1686位为Nos终止子的核苷酸序列，第1789至2041位为Nos终止子的核苷酸序列的反向互补序列；第2061至5909位为编码LbCpf1的核苷酸序列的反向互补序列，第5912至7897位为Ubi启动子的核苷酸序列的反向互补序列。

RDR片段中，第767至863位为上游同源臂，第864至1244位为突变区段，第1245至1365位为下游同源臂。

6、载体pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos的合成

将步骤2制备的OsU3-RCR1-RCR2表达盒和步骤1制备的质粒pCXUN-LbCpf1-Nos利用同源重组酶(全式金,北京,中国)进行连接获得重组载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos，将步骤4得到的armed donor(with targets)-Nos片段插入重组载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos的KpnI位点中，得到载体pCXUN-OsU3-RCR1-RCR2-armeddonor(with targets)-Nos-Ubi-LbCpf1-Nos。

经测序，载体pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos与载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos的区别在于：采用序列表的序列2所示的片段替代了序列表的序列1自5’端第13-1686位。

序列2所示的片段，自5’端第1至701位为OsU3-RCR1-RCR2表达盒的核苷酸序列，其中，第1至381位为OsU3启动子的核苷酸序列，第382至424位和第547至589位均为Hammerhead(HH)型核酸酶的核苷酸序列，第469至536位和第634至701位为丁型肝炎病毒(HDV)核酸酶的核苷酸序列，第425至468位为crRNA1的核苷酸序列，第590至453位为crRNA2的核苷酸序列。序列表中序列2自5’末端起，第709至1361位为armeddonor(with targets)片段，其中，第709至735位为靶点1的核苷酸序列，第1335至1361位为靶点2的核苷酸序列，第736至1334位为DRT序列。序列表中序列2自5’末端起，第1362至1614位为Nos终止子的核苷酸序列的核苷酸序列。

DRT序列中，第736至832为上游同源臂，第833至1213位为突变区段，第1214至1334位为下游同源臂。

7、载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)的合成

以化学合成定点修饰的ALS基因片段(序列表的序列4)为模板，采用引物Pme-donorF和引物Pme-donorR组成的引物对进行PCR扩增，得到PCR扩增产物(armed-DRT)。

将步骤2制备的OsU3-RCR1-RCR2表达盒和步骤1制备的质粒pCXUN-LbCpf1利用同源重组酶(全式金,北京,中国)进行连接获得重组载体pCXUN-LbCpf1-OsU3-RCR1-RCR2，将armed-DRT插入重组载体pCXUN-LbCpf1-OsU3-RCR1-RCR2的PmeI位点中，得到载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)。

载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)经测序如序列表的序列3所示。序列表中序列3自5’末端起，第13至713位为OsU3-RCR1-RCR2表达盒的核苷酸序列，第13至393位为OsU3启动子的核苷酸序列，第394至436位和第559至601位均为Hammerhead(HH)型核酸酶的核苷酸序列，第481至548位和第646至713位为丁型肝炎病毒(HDV)核酸酶的核苷酸序列，第437至480位为crRNA1的核苷酸序列，第602至645位为crRNA2的核苷酸序列，第817至1069位为Nos终止子的核苷酸序列的反向互补序列；第1089至4937位为编码LbCpf1的核苷酸序列的反向互补序列，第4940至6925位为Ubi启动子的核苷酸序列的反向互补序列，第7217至7886位为DNA修复模板armed-DRT。

DNA修复模板armed-DRT中，第7225至7251位为crRNA1的靶标序列，第7252至7348位为上游同源臂，第7349至7729位为突变区段，第7730至7850位为下游同源臂，第7851-7877位为crRNA2的靶标序列。

载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos、载体pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos和载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)(对照载体)部分元件结构示意图见图1。

载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos通过OsU3启动的基因转录，可获得转录本RCR1-RCR2-RDR片段，其中的HH和HDV核酶对转录本进行自剪切，crRNAs和RNA修复模板被精确释放。

载体pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos通过OsU3启动的基因转录，可获得转录本RCR1-RCR2-armed donor(with targets)片段，其中的HH和HDV核酶对转录本进行自剪切，crRNAs与armed donor(with targets)分开，crRNAs被精确释放，LbCpf1蛋白可在RNA水平armed donor(with targets)片段进行切割，从而获得精确的修复模板。

二、水稻愈伤中RNA作为修复模板介导的DNA重组修复活性检测

1、选取饱满的中花11水稻种子，剥去种皮，灭菌洗涤后，均匀的点入在含有2毫克/升2,4-D的灭菌NB固体培养基中，28℃黑暗培养40-50天以诱导愈伤组织的产生。

2、将步骤1得到的愈伤组织在含有0.3M甘露醇和0.3M山梨醇的MS培养基中高渗处理4-6小时。

3、以pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos载体为模板，利用引物T7-F和引物T7-Nos-R组成的引物对进行PCR扩增，获得体外转录模板RCR1-RCR2-RDR片段，根据HiScribe T7Quick High Yield RNA Synthesis Kit(NEB)说明书要求，配制如下体系，37℃孵育6h，进行体外转录，获得转录产物(crRNAs与RNA修复模板)。

反应体系：

模板	2μL(400ng)
		NTP Buffer Mix	10μL
T7RNA polymerase Mix	2μL
		RNase-Free ddH2O	6μL
总体系	20μL

4、将步骤3得到的转录产物加入2μLDNase I和30μL RNase-Free ddH₂O进行处理，去除DNA，并经试剂盒纯化后与LbCpf1蛋白(序列表的序列7所示)进行组装，室温放置15min，形成RNP，组装体系如下：

组装体系：

LbCpf1蛋白	10μg
		转录产物	10μg
10×Buffer 3	2μL
		RNaseinhibitior	1μL
RNase-Free ddH2O	xμL
		总体系	20μL

5、将步骤4得到的RNP通过基因枪转化水稻愈伤，采用0.6μm金粉，轰击压力为900psi进行轰击。

6、完成步骤5后，将水稻愈伤28℃暗培养36h后提取基因组DNA，以基因组DNA为模板，采用引物ALSTestF和引物T2MR组成的引物对进行PCR扩增，将扩增产物测序检测是否发生ALS基因同源重组。

结果如图2所示。其中，WT ALS为野生型ALS基因(序列表的序列6)；Donor为修复模板序列(序列表的序列5)；下划线序列分别为靶点1和靶点2序列；斜体的碱基为定点突变的PAM位点及EcoRV酶切位点，斜体加粗的碱基为目标替换成的碱基。

结果显示，得到的愈伤组织中，愈伤RDR35中检测到有完整同源重组，RDR41愈伤有部分同源重组。结果表明，以RNA作为修复模板，可成功介导基因组DNA的同源重组修复。

三、转基因水稻的获得

2、将步骤1得到的愈伤组织在含有0.3M甘露醇和0.3M山梨醇的MS培养基中高渗处理4-6小时后，将pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos通过基因枪轰击水稻愈伤，采用0.6μm金粉，轰击压力为900psi进行轰击，轰击后在含有0.3M甘露醇和0.3M山梨醇的MS培养基上28℃暗培养16小时后转移至NB筛选培养基(含有2毫克/升的2,4-D和50毫克/升的潮霉素的NB固体培养基)中，28℃持续暗培养2周。

3、完成步骤2后，选取生长良好呈嫩黄色的阳性愈伤组织，用无菌镊子移至NB预分化培养基(含有1毫克/升NAA、5毫克/升ABA、2毫克/升kinetin和50毫克/升的潮霉素的NB固体培养基)上，28℃持续暗培养2周。

4、完成步骤3后，挑选生长旺盛的愈伤组织转入MS分化培养基(含有0.02毫克/升NAA、2毫克/升kinetin和0.4μM双草醚钠盐的MS固体培养基)中，28℃持续光照培养。

5、完成步骤4后，待分化出来的幼苗长至2至5毫米，转入MS固体培养基中28℃光照培养2到3周，之后移入土中置于温室生长(温度28-30℃，16小时光照/8小时黑暗)，得到T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos)。

6、采用pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos替代pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos，按照步骤1-5进行操作，得到T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos)。

7、采用pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)替代pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos，按照步骤1-5进行操作，得到T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets))。

四、转基因水稻的基因型鉴定

待测植株：野生型中花11水稻(WT)、T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos)、T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos)和T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets))。

提取待测植株的基因组DNA，以基因组DNA为模板，采用引物ALStestF和引物ALStestR组成的引物对进行PCR扩增，将PCR扩增产物采用EcoRV酶切，野生对照可以被EcoRV切开并产生481bp和322bp两种类型片段，不能被EcoRV完全酶切的植株鉴定为同源重组成功植株。将完全没有或者部分切开PCR产物进行克隆测序。统计结果见表2和图3。

表2转基因水稻的基因型鉴定统计结果

图3中，图3A为T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos)的检测结果，图3B为T₀代转基因植株(转pCXUN-OsU3-RCR1-RCR2-armed donor(withtargets)-Nos-Ubi-LbCpf1-Nos)的检测结果。其中，WT ALS为野生型ALS基因(序列表的序列6)；Donor为修复模板序列(序列表的序列5)；下划线序列分别为靶点1和靶点2序列；斜体的碱基为定点突变的PAM位点及EcoRV酶切位点，斜体加粗的碱基为目标替换成的碱基。

对于载体pCXUN-OsU3-RCR1-RCR2-RDR-Nos-Ubi-LbCpf1-Nos而言，共获得58棵植株。对58棵植株PCR产物用EcoRV酶切鉴定后结果表明，288-6一条链为完整同源重组，另一条链为野生型。289-4和293-1一条链为部分同源重组，另一条链为野生型。。

对于载体pCXUN-OsU3-RCR1-RCR2-armed donor(with targets)-Nos-Ubi-LbCpf1-Nos而言，共获得87棵植株183-2,185-5和278-4一条链为完整同源重组，另一条链为野生型。198-1一条链为完整同源重组，另一条链为部分同源重组。193一条链为部分同源重组并伴随28bp缺失，另一条链为野生型。

载体pCXUN-OsU3-RCR1-RCR2-Ubi-LbCpf1-Nos-armed donor(with targets)未得到重组植株。

五、脱靶分析

本实验对8颗植株进行PCR靶点1和靶点2的脱靶进行鉴定，PCR产物克隆并测序结果表明，本实验所设计的crRNA1和crRNA2并不存在脱靶情况。

对8颗植株进行靶标1和靶标2的脱靶情况的鉴定，具体步骤为：提取植株的基因组DNA，采用特异引物对进行PCR扩增，然后将PCR扩增产物进行测序。

靶标1存在三个可能脱靶的位点，ALS1-OFF1、ALS1-OFF2和ALS1-OFF3。

靶标2存在两个可能脱靶的位点，ALS2-OFF4和ALS2-OFF5。

用于各个脱靶位点的引物对见表1。

表3脱靶分析统计结果

注：PAM位点用下划线表示，错配碱基用斜体表示。

序列表

<110> 中国农业科学院作物科学研究所

<120> 一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法

<160> 7

<170> SIPOSequenceListing 1.0

<210> 1

<211> 16802

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gaattcgagc tcaaggaatc tttaaacata cgaacagatc acttaaagtt cttctgaagc 60

aacttaaagt tatcaggcat gcatggatct tggaggaatc agatgtgcag tcagggacca 120

tagcacaaga caggcgtctt ctactggtgc taccagcaaa tgctggaagc cgggaacact 180

gggtacgttg gaaaccacgt gatgtgaaga agtaagataa actgtaggag aaaagcattt 240

cgtagtgggc catgaagcct ttcaggacat gtattgcagt atgggccggc ccattacgca 300

attggacgac aacaaagact agtattagta ccacctcggc tatccacata gatcaaagct 360

gatttaaaag agttgtgcag atgatccgtg gcaaaattac tgatgagtcc gtgaggacga 420

aacgagtaag ctcgtctaat ttctactaag tgtagatggt atggtggtgc aatgggagga 480

ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 540

aatgggacga atacgaccaa attactgatg agtccgtgag gacgaaacga gtaagctcgt 600

ctaatttcta ctaagtgtag atacctgaat gacccataaa gagtgggccg gcatggtccc 660

agcctcctcg ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gaccggtacc 720

acacatcaac tgatgagtcc gtgaggacga aacgagtaag ctcgtcttga tggggatggt 780

agcttcctca tgaacattca ggagctggca ttgatccgca ttgagaacct ccctgtgaag 840

gtgatggtgt tgaacaacca acacctaggc atggtcgtcc agttggagga taggttttac 900

aaggcgaata gggcgcatac atacttgggc aacccggaat gtgagagcga gatatatcca 960

gattttgtga ctattgctaa ggggttcaat attcctgcag tccgtgtaac aaagaagagt 1020

gaagtccgtg ccgccatcaa gaagatgctc gagactccag ggccatactt gttggacatc 1080

atcgtcccgc accaggagca tgtgctgcct atgatcccaa ttgggggcgc attcaaggac 1140

atgatcctgg atggtgatgg caggactgtg tattaatcta taatctgtat gttggcaaag 1200

caccagcccg gcctatgtct gacgtgaatg actcataaag agtggtatgc ctatgatgtt 1260

tgtatgtgct ctatcaataa ctaaggtgtc aactatgaac catatgctct tctgttttac 1320

ttgtttgatg tgcttggcat ggtaatccta attagcttcc tgctgggccg gcatggtccc 1380

agcctcctcg ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gacgatcgtt 1440

caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 1500

tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 1560

tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 1620

aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 1680

tagatcggta cccctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 1740

agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattcccga tctagtaaca 1800

tagatgacac cgcgcgcgat aatttatcct agtttgcgcg ctatattttg ttttctatcg 1860

cgtattaaat gtataattgc gggactctaa tcataaaaac ccatctcata aataacgtca 1920

tgcattacat gttaattatt acatgcttaa cgtaattcaa cagaaattat atgataatca 1980

tcgcaagacc ggcaacagga ttcaatctta agaaacttta ttgccaaatg tttgaacgat 2040

cggggaaatt cggatcctta ctttttcttt tttgcctggc cggccttttt cgtggccgcc 2100

ggccttttgt gcttcacgct ggtctgggcg tactccagcc actccttgtt agagatggcg 2160

atcttcacct tatccagctt ctcgtcctcg gccttcttga actggccgat ggcccacagc 2220

acctttctgg cgatgttata ggcgccattg gcgtcggcgt tctttggcag gatggcattc 2280

tcctgggcct catagttccg gctatcgtag aagatgccgt cggagttctt cacagggctg 2340

atcagaaaat ccacgtcggt gcggcctgtg atgctgttcc gcatctgcag catcaggctc 2400

atcagggcca taaagctaga gtagaaggcc ttgtcggact gctcgcacag cagggctctg 2460

atatcgccct gctgataatt gatgccgtac ttgttgaaca gctccttata ggcgctggtc 2520

aggcacacct cctcccagtc gaacacgttg ttcttcttag gattccggaa gattctgatc 2580

cggttgccgt aggagtacag cttccacttc ttgatgtaat cggcgtctgt gcgagagaag 2640

ttcttatagt ccagggcaaa ctcgaacaga tcctcctcgg gcacgtacat gatcctgtca 2700

aaggagctga tgaacttctt ggaatcggcg atgctggtat acttggtttt cagcaggttc 2760

acaaagccgg tagatggatc gatcttggat gtcagccagg cagggatgta aaagatgaag 2820

ccgttctggg tagacatgga cttaaagctc tcgaacttat tggtgatctg atagcccttc 2880

agggcgccgc ctgttgcaca aggattagac ttcttgtcca ccatgtagtt cagcttatcg 2940

atcagcatct tctcgaactt ctgatacacc tgcttctcca ccttcacgcg gctattctta 3000

aagccagagt tcaggtcctc cagggcgatc acggcatcgt acttctccac cagctcgcag 3060

atcttgtgca ccacctgaga gatatagccg gccttcagct ccttgatatt ctcgatggag 3120

gtccagttct ggcgggcctc gaacctctcc ttctccttct tgtccagcag agagtggtaa 3180

tctgtcttga tcctgatgcc gttgaagttg ttgatgatct cgttcaggga atactgctcc 3240

acgatgttgc ccttgccgtc caccaccacg atatacagca gattgcgctc gcccctatcg 3300

atgccgatca cataggggtt atcgtcgtgc ttcagcagca cgcgcacctc tgtattgatc 3360

ttgaagatgt tcttggggca cttattgatg gcgattggga tgtgcagctc gtactggtcc 3420

tcagaaaacc tcttatcctt atacacgtcg taggacaggg ttgtggtttt cttgggatta 3480

tctggattct tgttggcgat aggggagttg gctgggtgca ccaccagctc ctccttcttc 3540

agggaggcgc gcctcatgaa cagctctgct cctccgctca gcctgatctg tccgtgattg 3600

ttctcgtcaa acagcagctt gaagtacatg gtgtgcagat tgggtgtgcc gtgagactta 3660

tcggaaaagt ccttgttata gatctggaac atatacagct tgccctcctc caccagctta 3720

tccacctcct tcttgctggc agactcgaag ctcaccttat agccctgctc ctccacctct 3780

ctgtaaaagc cggcgatgtc cttatacttc tctgtctcag aaaagttgaa atcgtaggca 3840

ttggaccact ttggataccg ggagatgcta tccttaaaga agtcgatcag cttgtgacag 3900

tcattcaggt taaacatatc gcccttcttg aatgtgccat tcttgtagat cttctggatg 3960

tcctcgctgg ggttatagta ggccatccac ttcttagaaa agaacacctt tggcagcatc 4020

ttattagggc cgggcagcag cttatagttg atcttctcgt aattgccgtt cacatcgtcc 4080

ttgtcgatct tctgcaggca cttggcgtac ttcttatcca tgatggccag atagtacttg 4140

gagccgtatc tcaggatggt ggcccgatag tctgtctcct tatccttgtc ccagccgccc 4200

atgaactgag ggttctgaaa atacagcttg aacttatcct tagagtaggg cttctgggtc 4260

acataattgc ggatggcatc gtagatgtgg tccaccttca gcaggatgtc gtaggccagc 4320

acaaaatcgc catagaagga ctcgtccctg tttgtctcct tgccctcgcc aaagaaggcc 4380

ttgatgtaat tctcgaagct cttcacagaa tccagcaggt ccttcatgat ggccaccacg 4440

gcgtcgttct tcttcaggct cttctccagc acaaaatcgg cgtcgaacag cttctcagag 4500

gagccataca ccttgtagat ctcatccacc ttctggatga tgatctcctt cagcttctcc 4560

accacagaca gatcggcgtc ggcgtactcc tgcagctgct ccagagaaaa ggagccgatc 4620

ttcttgaagg actttctccg atcgtcctcg tacttctcgg tcaccacggc cttcttcttc 4680

aggtggatat cgtcatactc ggcattccac ttgtcccgga tcacgttcca ctcgccgaag 4740

atatccttgg agattgtgct gatggcgggg ccgttcttca caaagatgcc ggcgctagag 4800

tactcgtcaa aattcttgaa cagcttctcc agcttcttga tggagctgaa gatctcgctg 4860

ttcttgttca gggtgtttct aaacacctcc agcacctcct catcggatgt atagccctcg 4920

ccgtagaagc tcagagactc ccgatcgctc agcacctgct tatacagtgg cttaaactta 4980

ggcagcttct gcttggtttt ctgattatac aggttgatgt actcgttcag gcccttgatc 5040

ttctcgccgc tctcggtcac gaagccgccg atgatggcgt tatacacgtc gatgccctcc 5100

tgtgtcagca caaagttaaa gaactcgccc tcaaagaaat cctccacatc atagtcgctg 5160

ttcaggatct tctccttgat ctcctgcacc tcgtgcttat caaagatggc gtccaccttc 5220

tcgaagatgt ccatattaga gatgtagcgg gtcagattct cgttgataca cctgaaggcg 5280

atggatgtgc tcttggcctc ctcggaaaac atattctctc tgttatcaaa gaagccggtg 5340

aaggctgtgg taaagccatt gaagctgttc accagggcga tctcgtcctt atcgtccagg 5400

aactctggca ggattgtctc gatgatatcc ttcttaaaca gggacttgta gccctcgttg 5460

cccttgaagg ccttggcgat ctccttccgc agattgatct ccaggttctc cagctcctta 5520

ttctccttct cggttctggt tttcttccgg aacaggctga tgtaattgtt cagattcttc 5580

agcttgatgc tgtgcagcac gtcgttgata aaagacagat agtagcgatc cagcagcttc 5640

ttcacgccct tataatcctc ggctctcttc tcgtcctcca ccagcagccg cttattgtcg 5700

atgttctcct gggtcttgcc cacagggatg gccttgaacc tcagggtctt agacagggag 5760

tagcagtttg taaacttctc cagcttgctg gctgctggga ctccgtggat accgaccttc 5820

cgcttcttct ttggggccat cttatcgtca tcgtctttgt aatcaatatc atgatccttg 5880

tagtctccgt cgtggtcctt atagtccatg gctgcagaag taacaccaaa caacagggtg 5940

agcatcgaca aaagaaacag taccaagcaa ataaatagcg tatgaaggca gggctaaaaa 6000

aatccacata tagctgctgc atatgccatc atccaagtat atcaagatca aaataattat 6060

aaaacatact tgtttattat aatagatagg tactcaaggt tagagcatat gaatagatgc 6120

tgcatatgcc atcatgtata tgcatcagta aaacccacat caacatgtat acctatccta 6180

gatcgatatt tccatccatc ttaaactcgt aactatgaag atgtatgaca cacacataca 6240

gttccaaaat taataaatac accaggtagt ttgaaacagt attctactcc gatctagaac 6300

gaatgaacga ccgcccaacc acaccacatc atcacaacca agcgaacaaa aagcatctct 6360

gtatatgcat cagtaaaacc cgcatcaaca tgtataccta tcctagatcg atatttccat 6420

ccatcatctt caattcgtaa ctatgaatat gtatggcaca cacatacaga tccaaaatta 6480

ataaatccac caggtagttt gaaacagaat tctactccga tctagaacga ccgcccaacc 6540

agaccacatc atcacaacca agacaaaaaa aagcatgaaa agatgacccg acaaacaagt 6600

gcacggcata tattgaaata aaggaaaagg gcaaaccaaa ccctatgcaa cgaaacaaaa 6660

aaaatcatga aatcgatccc gtctgcggaa cggctagagc catcccagga ttccccaaag 6720

agaaacactg gcaagttagc aatcagaacg tgtctgacgt acaggtcgca tccgtgtacg 6780

aacgctagca gcacggatct aacacaaaca cggatctaac acaaacatga acagaagtag 6840

aactaccggg ccctaaccat ggaccggaac gccgatctag agaaggtaga gagggggggg 6900

gggggaggac gagcggcgta ccttgaagcg gaggtgccga cgggtggatt tgggggagat 6960

ctggttgtgt gtgtgtgcgc tccgaacaac acgaggttgg ggaaagaggg tgtggagggg 7020

gtgtctattt attacggcgg gcgaggaagg gaaagcgaag gagcggtggg aaaggaatcc 7080

cccgtagctg ccgtgccgtg agaggaggag gaggccgcct gccgtgccgg ctcacgtctg 7140

ccgctccgcc acgcaatttc tggatgccga cagcggagca agtccaacgg tggagcggaa 7200

ctctcgagag gggtccagag gcagcgacag agatgccgtg ccgtctgctt cgcttggccc 7260

gacgcgacgc tgctggttcg ctggttggtg tccgttagac tcgtcgacgg cgtttaacag 7320

gctggcatta tctactcgaa acaagaaaaa tgtttcctta gtttttttaa tttcttaaag 7380

ggtatttgtt taatttttag tcactttatt ttattctatt ttatatctaa attattaaat 7440

aaaaaaacta aaatagagtt ttagttttct taatttagag gctaaaatag aataaaatag 7500

atgtactaaa aaaattagtc tataaaaacc attaacccta aaccctaaat ggatgtacta 7560

ataaaatgga tgaagtatta tataggtgaa gctatttgca aaaaaaaagg agaacacatg 7620

cacactaaaa agataaaact gtagagtcct gttgtcaaaa tactcaattg tcctttagac 7680

catgtctaac tgttcattta tatgattctc taaaacactg atattattgt agtactatag 7740

attatattat tcgtagagta aagtttaaat atatgtataa agatagataa actgcacttc 7800

aaacaagtgt gacaaaaaaa atatgtggta attttttata acttagacat gcaatgctca 7860

ttatctctag agaggggcac gaccgggtca cgctgcaaag cttggcactg gccgtcgttt 7920

tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 7980

cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 8040

tgcgcagcct gaatggcgaa tgctagagca gcttgagctt ggatcagatt gtcgtttccc 8100

gccttcagtt taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa 8160

agagcgttta ttagaataac ggatatttaa aagggcgtga aaaggtttat ccgttcgtcc 8220

atttgtatgt gcatgccaac cacagggttc ccctcgggat caaagtactt tgatccaacc 8280

cctccgctgc tatagtgcag tcggcttctg acgttcagtg cagccgtctt ctgaaaacga 8340

catgtcgcac aagtcctaag ttacgcgaca ggctgccgcc ctgccctttt cctggcgttt 8400

tcttgtcgcg tgttttagtc gcataaagta gaatacttgc gactagaacc ggagacatta 8460

cgccatgaac aagagcgccg ccgctggcct gctgggctat gcccgcgtca gcaccgacga 8520

ccaggacttg accaaccaac gggccgaact gcacgcggcc ggctgcacca agctgttttc 8580

cgagaagatc accggcacca ggcgcgaccg cccggagctg gccaggatgc ttgaccacct 8640

agccctggcg acgttgtgac agtgaccagg ctagaccgcc tggcccgcag cacccgcgac 8700

ctactggaca ttgccgagcg catccaggag gccggcgcgg gcctgcgtag cctggcagag 8760

ccgtgggccg acaccaccac gccggccggc cgcatggtgt tgaccgtgtt cgccggcatt 8820

gccgagttcg agcgttccct aatcatcgac cgcacccgga gcgggcgcga ggccgccaag 8880

gcccgaggcg tgaagtttgg cccccgccct accctcaccc cggcacagat cgcgcacgcc 8940

cgcgagctga tcgaccagga aggccgcacc gtgaaagagg cggctgcact gcttggcgtg 9000

catcgctcga ccctgtaccg cgcacttgag cgcagcgagg aagtgacgcc caccgaggcc 9060

aggcggcgcg gtgccttccg tgaggacgca ttgaccgagg ccgacgccct ggcggccgcc 9120

gagaatgaac gccaagagga acaagcatga aaccgcacca ggacggccag gacgaaccgt 9180

ttttcattac cgaagagatc gaggcggaga tgatcgcggc cgggtacgtg ttcgagccgc 9240

ccgcgcacgt ctcaaccgtg cggctgcatg aaatcctggc cggtttgtct gatgccaagc 9300

tggcggcctg gccggccagc ttggccgctg aagaaaccga gcgccgccgt ctaaaaaggt 9360

gatgtgtatt tgagtaaaac agcttgcgtc atgcggtcgc tgcgtatatg atgcgatgag 9420

taaataaaca aatacgcaag gggaacgcat gaaggttatc gctgtactta accagaaagg 9480

cgggtcaggc aagacgacca tcgcaaccca tctagcccgc gccctgcaac tcgccggggc 9540

cgatgttctg ttagtcgatt ccgatcccca gggcagtgcc cgcgattggg cggccgtgcg 9600

ggaagatcaa ccgctaaccg ttgtcggcat cgaccgcccg acgattgacc gcgacgtgaa 9660

ggccatcggc cggcgcgact tcgtagtgat cgacggagcg ccccaggcgg cggacttggc 9720

tgtgtccgcg atcaaggcag ccgacttcgt gctgattccg gtgcagccaa gcccttacga 9780

catatgggca accgccgacc tggtggagct ggttaagcag cgcattgagg tcacggatgg 9840

aaggctacaa gcggcctttg tcgtgtcgcg ggcgatcaaa ggcacgcgca tcggcggtga 9900

ggttgccgag gcgctggccg ggtacgagct gcccattctt gagtcccgta tcacgcagcg 9960

cgtgagctac ccaggcactg ccgccgccgg cacaaccgtt cttgaatcag aacccgaggg 10020

cgacgctgcc cgcgaggtcc aggcgctggc cgctgaaatt aaatcaaaac tcatttgagt 10080

taatgaggta aagagaaaat gagcaaaagc acaaacacgc taagtgccgg ccgtccgagc 10140

gcacgcagca gcaaggctgc aacgttggcc agcctggcag acacgccagc catgaagcgg 10200

gtcaactttc agttgccggc ggaggatcac accaagctga agatgtacgc ggtacgccaa 10260

ggcaagacca ttaccgagct gctatctgaa tacatcgcgc agctaccaga gtaaatgagc 10320

aaatgaataa atgagtagat gaattttagc ggctaaagga ggcggcatgg aaaatcaaga 10380

acaaccaggc accgacgccg tggaatgccc catgtgtgga ggaacgggcg gttggccagg 10440

cgtaagcggc tgggttgtct gccggccctg caatggcact ggaaccccca agcccgagga 10500

atcggcgtga cggtcgcaaa ccatccggcc cggtacaaat cggcgcggcg ctgggtgatg 10560

acctggtgga gaagttgaag gccgcgcagg ccgcccagcg gcaacgcatc gaggcagaag 10620

cacgccccgg tgaatcgtgg caagcggccg ctgatcgaat ccgcaaagaa tcccggcaac 10680

cgccggcagc cggtgcgccg tcgattagga agccgcccaa gggcgacgag caaccagatt 10740

ttttcgttcc gatgctctat gacgtgggca cccgcgatag tcgcagcatc atggacgtgg 10800

ccgttttccg tctgtcgaag cgtgaccgac gagctggcga ggtgatccgc tacgagcttc 10860

cagacgggca cgtagaggtt tccgcagggc cggccggcat ggccagtgtg tgggattacg 10920

acctggtact gatggcggtt tcccatctaa ccgaatccat gaaccgatac cgggaaggga 10980

agggagacaa gcccggccgc gtgttccgtc cacacgttgc ggacgtactc aagttctgcc 11040

ggcgagccga tggcggaaag cagaaagacg acctggtaga aacctgcatt cggttaaaca 11100

ccacgcacgt tgccatgcag cgtacgaaga aggccaagaa cggccgcctg gtgacggtat 11160

ccgagggtga agccttgatt agccgctaca agatcgtaaa gagcgaaacc gggcggccgg 11220

agtacatcga gatcgagcta gctgattgga tgtaccgcga gatcacagaa ggcaagaacc 11280

cggacgtgct gacggttcac cccgattact ttttgatcga tcccggcatc ggccgttttc 11340

tctaccgcct ggcacgccgc gccgcaggca aggcagaagc cagatggttg ttcaagacga 11400

tctacgaacg cagtggcagc gccggagagt tcaagaagtt ctgtttcacc gtgcgcaagc 11460

tgatcgggtc aaatgacctg ccggagtacg atttgaagga ggaggcgggg caggctggcc 11520

cgatcctagt catgcgctac cgcaacctga tcgagggcga agcatccgcc ggttcctaat 11580

gtacggagca gatgctaggg caaattgccc tagcagggga aaaaggtcga aaaggtctct 11640

ttcctgtgga tagcacgtac attgggaacc caaagccgta cattgggaac cggaacccgt 11700

acattgggaa cccaaagccg tacattggga accggtcaca catgtaagtg actgatataa 11760

aagagaaaaa aggcgatttt tccgcctaaa actctttaaa acttattaaa actcttaaaa 11820

cccgcctggc ctgtgcataa ctgtctggcc agcgcacagc cgaagagctg caaaaagcgc 11880

ctacccttcg gtcgctgcgc tccctacgcc ccgccgcttc gcgtcggcct atcgcggccg 11940

ctggccgctc aaaaatggct ggcctacggc caggcaatct accagggcgc ggacaagccg 12000

cgccgtcgcc actcgaccgc cggcgcccac atcaaggcac cctgcctcgc gcgtttcggt 12060

gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 12120

gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 12180

ggcgcagcca tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg 12240

catcagagca gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg 12300

taaggagaaa ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct 12360

cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 12420

cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 12480

accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 12540

acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 12600

cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 12660

acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 12720

atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 12780

agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 12840

acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 12900

gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg 12960

gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 13020

gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 13080

gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 13140

acgaaaactc acgttaaggg attttggtca tgcattctag gtactaaaac aattcatcca 13200

gtaaaatata atattttatt ttctcccaat caggcttgat ccccagtaag tcaaaaaata 13260

gctcgacata ctgttcttcc ccgatatcct ccctgatcga ccggacgcag aaggcaatgt 13320

cataccactt gtccgccctg ccgcttctcc caagatcaat aaagccactt actttgccat 13380

ctttcacaaa gatgttgctg tctcccaggt cgccgtggga aaagacaagt tcctcttcgg 13440

gcttttccgt ctttaaaaaa tcatacagct cgcgcggatc tttaaatgga gtgtcttctt 13500

cccagttttc gcaatccaca tcggccagat cgttattcag taagtaatcc aattcggcta 13560

agcggctgtc taagctattc gtatagggac aatccgatat gtcgatggag tgaaagagcc 13620

tgatgcactc cgcatacagc tcgataatct tttcagggct ttgttcatct tcatactctt 13680

ccgagcaaag gacgccatcg gcctcactca tgagcagatt gctccagcca tcatgccgtt 13740

caaagtgcag gacctttgga acaggcagct ttccttccag ccatagcatc atgtcctttt 13800

cccgttcaac atcataggtg gtccctttat accggctgtc cgtcattttt aaatataggt 13860

tttcattttc tcccaccagc ttatatacct tagcaggaga cattccttcc gtatctttta 13920

cgcagcggta tttttcgatc agttttttca attccggtga tattctcatt ttagccattt 13980

attatttcct tcctcttttc tacagtattt aaagataccc caagaagcta attataacaa 14040

gacgaactcc aattcactgt tccttgcatt ctaaaacctt aaataccaga aaacagcttt 14100

ttcaaagttg ttttcaaagt tggcgtataa catagtatcg acggagccga ttttgaaacc 14160

gcggtgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga 14220

gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac 14280

atgagcaaag tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg 14340

ctgcctgtat cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct 14400

ggtggcagga tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg 14460

cggacgtttt taatgtactg aattaacgcc gaattaattc gggggatctg gattttagta 14520

ctggattttg gttttaggaa ttagaaattt tattgataga agtattttac aaatacaaat 14580

acatactaag ggtttcttat atgctcaaca catgagcgaa accctatagg aaccctaatt 14640

cccttatctg ggaactactc acacattatt atggagaaac tcgagcttgt cgatcgacag 14700

atccggtcgg catctactct atttctttgc cctcggacga gtgctggggc gtcggtttcc 14760

actatcggcg agtacttcta cacagccatc ggtccagacg gccgcgcttc tgcgggcgat 14820

ttgtgtacgc ccgacagtcc cggctccgga tcggacgatt gcgtcgcatc gaccctgcgc 14880

ccaagctgca tcatcgaaat tgccgtcaac caagctctga tagagttggt caagaccaat 14940

gcggagcata tacgcccgga gtcgtggcga tcctgcaagc tccggatgcc tccgctcgaa 15000

gtagcgcgtc tgctgctcca tacaagccaa ccacggcctc cagaagaaga tgttggcgac 15060

ctcgtattgg gaatccccga acatcgcctc gctccagtca atgaccgctg ttatgcggcc 15120

attgtccgtc aggacattgt tggagccgaa atccgcgtgc acgaggtgcc ggacttcggg 15180

gcagtcctcg gcccaaagca tcagctcatc gagagcctgc gcgacggacg cactgacggt 15240

gtcgtccatc acagtttgcc agtgatacac atggggatca gcaatcgcgc atatgaaatc 15300

acgccatgta gtgtattgac cgattccttg cggtccgaat gggccgaacc cgctcgtctg 15360

gctaagatcg gccgcagcga tcgcatccat agcctccgcg accggttgta gaacagcggg 15420

cagttcggtt tcaggcaggt cttgcaacgt gacaccctgt gcacggcggg agatgcaata 15480

ggtcaggctc tcgctaaact ccccaatgtc aagcacttcc ggaatcggga gcgcggccga 15540

tgcaaagtgc cgataaacat aacgatcttt gtagaaacca tcggcgcagc tatttacccg 15600

caggacatat ccacgccctc ctacatcgaa gctgaaagca cgagattctt cgccctccga 15660

gagctgcatc aggtcggaga cgctgtcgaa cttttcgatc agaaacttct cgacagacgt 15720

cgcggtgagt tcaggctttt tcatatctca ttgccccccg gatctgcgaa agctcgagag 15780

agatagattt gtagagagag actggtgatt tcagcgtgtc ctctccaaat gaaatgaact 15840

tccttatata gaggaaggtc ttgcgaagga tagtgggatt gtgcgtcatc ccttacgtca 15900

gtggagatat cacatcaatc cacttgcttt gaagacgtgg ttggaacgtc ttctttttcc 15960

acgatgctcc tcgtgggtgg gggtccatct ttgggaccac tgtcggcaga ggcatcttga 16020

acgatagcct ttcctttatc gcaatgatgg catttgtagg tgccaccttc cttttctact 16080

gtccttttga tgaagtgaca gatagctggg caatggaatc cgaggaggtt tcccgatatt 16140

accctttgtt gaaaagtctc aatagccctt tggtcttctg agactgtatc tttgatattc 16200

ttggagtaga cgagagtgtc gtgctccacc atgttatcac atcaatccac ttgctttgaa 16260

gacgtggttg gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg 16320

ggaccactgt cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat 16380

ttgtaggtgc caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa 16440

tggaatccga ggaggtttcc cgatattacc ctttgttgaa aagtctcaat agccctttgg 16500

tcttctgaga ctgtatcttt gatattcttg gagtagacga gagtgtcgtg ctccaccatg 16560

ttggcaagct gctctagcca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 16620

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 16680

atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 16740

tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 16800

ac 16802

<210> 2

<211> 1614

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60

tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120

ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180

aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240

tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300

caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360

ttgtgcagat gatccgtggc aaaattactg atgagtccgt gaggacgaaa cgagtaagct 420

cgtctaattt ctactaagtg tagatggtat ggtggtgcaa tgggaggagg ccggcatggt 480

cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa tgggacgaat 540

acgaccaaat tactgatgag tccgtgagga cgaaacgagt aagctcgtct aatttctact 600

aagtgtagat acctgaatga cccataaaga gtgggccggc atggtcccag cctcctcgct 660

ggcgccggct gggcaacatg cttcggcatg gcgaatggga ccggtacctt tgggtatggt 720

ggtgcaatgg gaggattgat ggggatggta gcttcctcat gaacattcag gagctggcat 780

tgatccgcat tgagaacctc cctgtgaagg tgatggtgtt gaacaaccaa cacctaggca 840

tggtcgtcca gttggaggat aggttttaca aggcgaatag ggcgcataca tacttgggca 900

acccggaatg tgagagcgag atatatccag attttgtgac tattgctaag gggttcaata 960

ttcctgcagt ccgtgtaaca aagaagagtg aagtccgtgc cgccatcaag aagatgctcg 1020

agactccagg gccatacttg ttggacatca tcgtcccgca ccaggagcat gtgctgccta 1080

tgatcccaat tgggggcgca ttcaaggaca tgatcctgga tggtgatggc aggactgtgt 1140

attaatctat aatctgtatg ttggcaaagc accagcccgg cctatgtctg acgtgaatga 1200

ctcataaaga gtggtatgcc tatgatgttt gtatgtgctc tatcaataac taaggtgtca 1260

actatgaacc atatgctctt ctgttttact tgtttgatgt gcttggcatg gtaatcctaa 1320

ttagcttcct gctgtttgac ctgaatgacc cataaagagt ggatcgttca aacatttggc 1380

aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 1440

tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 1500

gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 1560

agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatc 1614

<210> 3

<211> 16675

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gaattcgagc tcaaggaatc tttaaacata cgaacagatc acttaaagtt cttctgaagc 60

aacttaaagt tatcaggcat gcatggatct tggaggaatc agatgtgcag tcagggacca 120

tagcacaaga caggcgtctt ctactggtgc taccagcaaa tgctggaagc cgggaacact 180

gggtacgttg gaaaccacgt gatgtgaaga agtaagataa actgtaggag aaaagcattt 240

cgtagtgggc catgaagcct ttcaggacat gtattgcagt atgggccggc ccattacgca 300

attggacgac aacaaagact agtattagta ccacctcggc tatccacata gatcaaagct 360

gatttaaaag agttgtgcag atgatccgtg gcaaaattac tgatgagtcc gtgaggacga 420

aacgagtaag ctcgtctaat ttctactaag tgtagatggt atggtggtgc aatgggagga 480

ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 540

aatgggacga atacgaccaa attactgatg agtccgtgag gacgaaacga gtaagctcgt 600

ctaatttcta ctaagtgtag atacctgaat gacccataaa gagtgggccg gcatggtccc 660

agcctcctcg ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gaccggtacc 720

cctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 780

gtcacgacgt tgtaaaacga cggccagtga attcccgatc tagtaacata gatgacaccg 840

cgcgcgataa tttatcctag tttgcgcgct atattttgtt ttctatcgcg tattaaatgt 900

ataattgcgg gactctaatc ataaaaaccc atctcataaa taacgtcatg cattacatgt 960

taattattac atgcttaacg taattcaaca gaaattatat gataatcatc gcaagaccgg 1020

caacaggatt caatcttaag aaactttatt gccaaatgtt tgaacgatcg gggaaattcg 1080

gatccttact ttttcttttt tgcctggccg gcctttttcg tggccgccgg ccttttgtgc 1140

ttcacgctgg tctgggcgta ctccagccac tccttgttag agatggcgat cttcacctta 1200

tccagcttct cgtcctcggc cttcttgaac tggccgatgg cccacagcac ctttctggcg 1260

atgttatagg cgccattggc gtcggcgttc tttggcagga tggcattctc ctgggcctca 1320

tagttccggc tatcgtagaa gatgccgtcg gagttcttca cagggctgat cagaaaatcc 1380

acgtcggtgc ggcctgtgat gctgttccgc atctgcagca tcaggctcat cagggccata 1440

aagctagagt agaaggcctt gtcggactgc tcgcacagca gggctctgat atcgccctgc 1500

tgataattga tgccgtactt gttgaacagc tccttatagg cgctggtcag gcacacctcc 1560

tcccagtcga acacgttgtt cttcttagga ttccggaaga ttctgatccg gttgccgtag 1620

gagtacagct tccacttctt gatgtaatcg gcgtctgtgc gagagaagtt cttatagtcc 1680

agggcaaact cgaacagatc ctcctcgggc acgtacatga tcctgtcaaa ggagctgatg 1740

aacttcttgg aatcggcgat gctggtatac ttggttttca gcaggttcac aaagccggta 1800

gatggatcga tcttggatgt cagccaggca gggatgtaaa agatgaagcc gttctgggta 1860

gacatggact taaagctctc gaacttattg gtgatctgat agcccttcag ggcgccgcct 1920

gttgcacaag gattagactt cttgtccacc atgtagttca gcttatcgat cagcatcttc 1980

tcgaacttct gatacacctg cttctccacc ttcacgcggc tattcttaaa gccagagttc 2040

aggtcctcca gggcgatcac ggcatcgtac ttctccacca gctcgcagat cttgtgcacc 2100

acctgagaga tatagccggc cttcagctcc ttgatattct cgatggaggt ccagttctgg 2160

cgggcctcga acctctcctt ctccttcttg tccagcagag agtggtaatc tgtcttgatc 2220

ctgatgccgt tgaagttgtt gatgatctcg ttcagggaat actgctccac gatgttgccc 2280

ttgccgtcca ccaccacgat atacagcaga ttgcgctcgc ccctatcgat gccgatcaca 2340

taggggttat cgtcgtgctt cagcagcacg cgcacctctg tattgatctt gaagatgttc 2400

ttggggcact tattgatggc gattgggatg tgcagctcgt actggtcctc agaaaacctc 2460

ttatccttat acacgtcgta ggacagggtt gtggttttct tgggattatc tggattcttg 2520

ttggcgatag gggagttggc tgggtgcacc accagctcct ccttcttcag ggaggcgcgc 2580

ctcatgaaca gctctgctcc tccgctcagc ctgatctgtc cgtgattgtt ctcgtcaaac 2640

agcagcttga agtacatggt gtgcagattg ggtgtgccgt gagacttatc ggaaaagtcc 2700

ttgttataga tctggaacat atacagcttg ccctcctcca ccagcttatc cacctccttc 2760

ttgctggcag actcgaagct caccttatag ccctgctcct ccacctctct gtaaaagccg 2820

gcgatgtcct tatacttctc tgtctcagaa aagttgaaat cgtaggcatt ggaccacttt 2880

ggataccggg agatgctatc cttaaagaag tcgatcagct tgtgacagtc attcaggtta 2940

aacatatcgc ccttcttgaa tgtgccattc ttgtagatct tctggatgtc ctcgctgggg 3000

ttatagtagg ccatccactt cttagaaaag aacacctttg gcagcatctt attagggccg 3060

ggcagcagct tatagttgat cttctcgtaa ttgccgttca catcgtcctt gtcgatcttc 3120

tgcaggcact tggcgtactt cttatccatg atggccagat agtacttgga gccgtatctc 3180

aggatggtgg cccgatagtc tgtctcctta tccttgtccc agccgcccat gaactgaggg 3240

ttctgaaaat acagcttgaa cttatcctta gagtagggct tctgggtcac ataattgcgg 3300

atggcatcgt agatgtggtc caccttcagc aggatgtcgt aggccagcac aaaatcgcca 3360

tagaaggact cgtccctgtt tgtctccttg ccctcgccaa agaaggcctt gatgtaattc 3420

tcgaagctct tcacagaatc cagcaggtcc ttcatgatgg ccaccacggc gtcgttcttc 3480

ttcaggctct tctccagcac aaaatcggcg tcgaacagct tctcagagga gccatacacc 3540

ttgtagatct catccacctt ctggatgatg atctccttca gcttctccac cacagacaga 3600

tcggcgtcgg cgtactcctg cagctgctcc agagaaaagg agccgatctt cttgaaggac 3660

tttctccgat cgtcctcgta cttctcggtc accacggcct tcttcttcag gtggatatcg 3720

tcatactcgg cattccactt gtcccggatc acgttccact cgccgaagat atccttggag 3780

attgtgctga tggcggggcc gttcttcaca aagatgccgg cgctagagta ctcgtcaaaa 3840

ttcttgaaca gcttctccag cttcttgatg gagctgaaga tctcgctgtt cttgttcagg 3900

gtgtttctaa acacctccag cacctcctca tcggatgtat agccctcgcc gtagaagctc 3960

agagactccc gatcgctcag cacctgctta tacagtggct taaacttagg cagcttctgc 4020

ttggttttct gattatacag gttgatgtac tcgttcaggc ccttgatctt ctcgccgctc 4080

tcggtcacga agccgccgat gatggcgtta tacacgtcga tgccctcctg tgtcagcaca 4140

aagttaaaga actcgccctc aaagaaatcc tccacatcat agtcgctgtt caggatcttc 4200

tccttgatct cctgcacctc gtgcttatca aagatggcgt ccaccttctc gaagatgtcc 4260

atattagaga tgtagcgggt cagattctcg ttgatacacc tgaaggcgat ggatgtgctc 4320

ttggcctcct cggaaaacat attctctctg ttatcaaaga agccggtgaa ggctgtggta 4380

aagccattga agctgttcac cagggcgatc tcgtccttat cgtccaggaa ctctggcagg 4440

attgtctcga tgatatcctt cttaaacagg gacttgtagc cctcgttgcc cttgaaggcc 4500

ttggcgatct ccttccgcag attgatctcc aggttctcca gctccttatt ctccttctcg 4560

gttctggttt tcttccggaa caggctgatg taattgttca gattcttcag cttgatgctg 4620

tgcagcacgt cgttgataaa agacagatag tagcgatcca gcagcttctt cacgccctta 4680

taatcctcgg ctctcttctc gtcctccacc agcagccgct tattgtcgat gttctcctgg 4740

gtcttgccca cagggatggc cttgaacctc agggtcttag acagggagta gcagtttgta 4800

aacttctcca gcttgctggc tgctgggact ccgtggatac cgaccttccg cttcttcttt 4860

ggggccatct tatcgtcatc gtctttgtaa tcaatatcat gatccttgta gtctccgtcg 4920

tggtccttat agtccatggc tgcagaagta acaccaaaca acagggtgag catcgacaaa 4980

agaaacagta ccaagcaaat aaatagcgta tgaaggcagg gctaaaaaaa tccacatata 5040

gctgctgcat atgccatcat ccaagtatat caagatcaaa ataattataa aacatacttg 5100

tttattataa tagataggta ctcaaggtta gagcatatga atagatgctg catatgccat 5160

catgtatatg catcagtaaa acccacatca acatgtatac ctatcctaga tcgatatttc 5220

catccatctt aaactcgtaa ctatgaagat gtatgacaca cacatacagt tccaaaatta 5280

ataaatacac caggtagttt gaaacagtat tctactccga tctagaacga atgaacgacc 5340

gcccaaccac accacatcat cacaaccaag cgaacaaaaa gcatctctgt atatgcatca 5400

gtaaaacccg catcaacatg tatacctatc ctagatcgat atttccatcc atcatcttca 5460

attcgtaact atgaatatgt atggcacaca catacagatc caaaattaat aaatccacca 5520

ggtagtttga aacagaattc tactccgatc tagaacgacc gcccaaccag accacatcat 5580

cacaaccaag acaaaaaaaa gcatgaaaag atgacccgac aaacaagtgc acggcatata 5640

ttgaaataaa ggaaaagggc aaaccaaacc ctatgcaacg aaacaaaaaa aatcatgaaa 5700

tcgatcccgt ctgcggaacg gctagagcca tcccaggatt ccccaaagag aaacactggc 5760

aagttagcaa tcagaacgtg tctgacgtac aggtcgcatc cgtgtacgaa cgctagcagc 5820

acggatctaa cacaaacacg gatctaacac aaacatgaac agaagtagaa ctaccgggcc 5880

ctaaccatgg accggaacgc cgatctagag aaggtagaga gggggggggg gggaggacga 5940

gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatct ggttgtgtgt 6000

gtgtgcgctc cgaacaacac gaggttgggg aaagagggtg tggagggggt gtctatttat 6060

tacggcgggc gaggaaggga aagcgaagga gcggtgggaa aggaatcccc cgtagctgcc 6120

gtgccgtgag aggaggagga ggccgcctgc cgtgccggct cacgtctgcc gctccgccac 6180

gcaatttctg gatgccgaca gcggagcaag tccaacggtg gagcggaact ctcgagaggg 6240

gtccagaggc agcgacagag atgccgtgcc gtctgcttcg cttggcccga cgcgacgctg 6300

ctggttcgct ggttggtgtc cgttagactc gtcgacggcg tttaacaggc tggcattatc 6360

tactcgaaac aagaaaaatg tttccttagt ttttttaatt tcttaaaggg tatttgttta 6420

atttttagtc actttatttt attctatttt atatctaaat tattaaataa aaaaactaaa 6480

atagagtttt agttttctta atttagaggc taaaatagaa taaaatagat gtactaaaaa 6540

aattagtcta taaaaaccat taaccctaaa ccctaaatgg atgtactaat aaaatggatg 6600

aagtattata taggtgaagc tatttgcaaa aaaaaaggag aacacatgca cactaaaaag 6660

ataaaactgt agagtcctgt tgtcaaaata ctcaattgtc ctttagacca tgtctaactg 6720

ttcatttata tgattctcta aaacactgat attattgtag tactatagat tatattattc 6780

gtagagtaaa gtttaaatat atgtataaag atagataaac tgcacttcaa acaagtgtga 6840

caaaaaaaat atgtggtaat tttttataac ttagacatgc aatgctcatt atctctagag 6900

aggggcacga ccgggtcacg ctgcaaagct tggcactggc cgtcgtttta caacgtcgtg 6960

actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca 7020

gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 7080

atggcgaatg ctagagcagc ttgagcttgg atcagattgt cgtttcccgc cttcagtttg 7140

tttaaacgta aaacgacggc cagtgaattg gagatcggta cttcgcgaat gcgtcgagat 7200

gacccaatgc tctagaaacc aacatttggg tatggtggtg caatgggagg attgatgggg 7260

atggtagctt cctcatgaac attcaggagc tggcattgat ccgcattgag aacctccctg 7320

tgaaggtgat ggtgttgaac aaccaacacc taggcatggt cgtccagttg gaggataggt 7380

tttacaaggc gaatagggcg catacatact tgggcaaccc ggaatgtgag agcgagatat 7440

atccagattt tgtgactatt gctaaggggt tcaatattcc tgcagtccgt gtaacaaaga 7500

agagtgaagt ccgtgccgcc atcaagaaga tgctcgagac tccagggcca tacttgttgg 7560

acatcatcgt cccgcaccag gagcatgtgc tgcctatgat cccaattggg ggcgcattca 7620

aggacatgat cctggatggt gatggcagga ctgtgtatta atctataatc tgtatgttgg 7680

caaagcacca gcccggccta tgtctgacgt gaatgactca taaagagtgg tatgcctatg 7740

atgtttgtat gtgctctatc aataactaag gtgtcaacta tgaaccatat gctcttctgt 7800

tttacttgtt tgatgtgctt ggcatggtaa tcctaattag cttcctgctg tttgacctga 7860

atgacccata aagagtggta tgcctaacta gtccattggg tcatcggatg ccgggaccga 7920

cgagtgcaga ggcgtgcaag cgagcttggc gtaatcatgg tcatagctgt ttcctggttt 7980

aaacaaacta tcagtgtttg acaggatata ttggcgggta aacctaagag aaaagagcgt 8040

ttattagaat aacggatatt taaaagggcg tgaaaaggtt tatccgttcg tccatttgta 8100

tgtgcatgcc aaccacaggg ttcccctcgg gatcaaagta ctttgatcca acccctccgc 8160

tgctatagtg cagtcggctt ctgacgttca gtgcagccgt cttctgaaaa cgacatgtcg 8220

cacaagtcct aagttacgcg acaggctgcc gccctgccct tttcctggcg ttttcttgtc 8280

gcgtgtttta gtcgcataaa gtagaatact tgcgactaga accggagaca ttacgccatg 8340

aacaagagcg ccgccgctgg cctgctgggc tatgcccgcg tcagcaccga cgaccaggac 8400

ttgaccaacc aacgggccga actgcacgcg gccggctgca ccaagctgtt ttccgagaag 8460

atcaccggca ccaggcgcga ccgcccggag ctggccagga tgcttgacca cctagccctg 8520

gcgacgttgt gacagtgacc aggctagacc gcctggcccg cagcacccgc gacctactgg 8580

acattgccga gcgcatccag gaggccggcg cgggcctgcg tagcctggca gagccgtggg 8640

ccgacaccac cacgccggcc ggccgcatgg tgttgaccgt gttcgccggc attgccgagt 8700

tcgagcgttc cctaatcatc gaccgcaccc ggagcgggcg cgaggccgcc aaggcccgag 8760

gcgtgaagtt tggcccccgc cctaccctca ccccggcaca gatcgcgcac gcccgcgagc 8820

tgatcgacca ggaaggccgc accgtgaaag aggcggctgc actgcttggc gtgcatcgct 8880

cgaccctgta ccgcgcactt gagcgcagcg aggaagtgac gcccaccgag gccaggcggc 8940

gcggtgcctt ccgtgaggac gcattgaccg aggccgacgc cctggcggcc gccgagaatg 9000

aacgccaaga ggaacaagca tgaaaccgca ccaggacggc caggacgaac cgtttttcat 9060

taccgaagag atcgaggcgg agatgatcgc ggccgggtac gtgttcgagc cgcccgcgca 9120

cgtctcaacc gtgcggctgc atgaaatcct ggccggtttg tctgatgcca agctggcggc 9180

ctggccggcc agcttggccg ctgaagaaac cgagcgccgc cgtctaaaaa ggtgatgtgt 9240

atttgagtaa aacagcttgc gtcatgcggt cgctgcgtat atgatgcgat gagtaaataa 9300

acaaatacgc aaggggaacg catgaaggtt atcgctgtac ttaaccagaa aggcgggtca 9360

ggcaagacga ccatcgcaac ccatctagcc cgcgccctgc aactcgccgg ggccgatgtt 9420

ctgttagtcg attccgatcc ccagggcagt gcccgcgatt gggcggccgt gcgggaagat 9480

caaccgctaa ccgttgtcgg catcgaccgc ccgacgattg accgcgacgt gaaggccatc 9540

ggccggcgcg acttcgtagt gatcgacgga gcgccccagg cggcggactt ggctgtgtcc 9600

gcgatcaagg cagccgactt cgtgctgatt ccggtgcagc caagccctta cgacatatgg 9660

gcaaccgccg acctggtgga gctggttaag cagcgcattg aggtcacgga tggaaggcta 9720

caagcggcct ttgtcgtgtc gcgggcgatc aaaggcacgc gcatcggcgg tgaggttgcc 9780

gaggcgctgg ccgggtacga gctgcccatt cttgagtccc gtatcacgca gcgcgtgagc 9840

tacccaggca ctgccgccgc cggcacaacc gttcttgaat cagaacccga gggcgacgct 9900

gcccgcgagg tccaggcgct ggccgctgaa attaaatcaa aactcatttg agttaatgag 9960

gtaaagagaa aatgagcaaa agcacaaaca cgctaagtgc cggccgtccg agcgcacgca 10020

gcagcaaggc tgcaacgttg gccagcctgg cagacacgcc agccatgaag cgggtcaact 10080

ttcagttgcc ggcggaggat cacaccaagc tgaagatgta cgcggtacgc caaggcaaga 10140

ccattaccga gctgctatct gaatacatcg cgcagctacc agagtaaatg agcaaatgaa 10200

taaatgagta gatgaatttt agcggctaaa ggaggcggca tggaaaatca agaacaacca 10260

ggcaccgacg ccgtggaatg ccccatgtgt ggaggaacgg gcggttggcc aggcgtaagc 10320

ggctgggttg tctgccggcc ctgcaatggc actggaaccc ccaagcccga ggaatcggcg 10380

tgacggtcgc aaaccatccg gcccggtaca aatcggcgcg gcgctgggtg atgacctggt 10440

ggagaagttg aaggccgcgc aggccgccca gcggcaacgc atcgaggcag aagcacgccc 10500

cggtgaatcg tggcaagcgg ccgctgatcg aatccgcaaa gaatcccggc aaccgccggc 10560

agccggtgcg ccgtcgatta ggaagccgcc caagggcgac gagcaaccag attttttcgt 10620

tccgatgctc tatgacgtgg gcacccgcga tagtcgcagc atcatggacg tggccgtttt 10680

ccgtctgtcg aagcgtgacc gacgagctgg cgaggtgatc cgctacgagc ttccagacgg 10740

gcacgtagag gtttccgcag ggccggccgg catggccagt gtgtgggatt acgacctggt 10800

actgatggcg gtttcccatc taaccgaatc catgaaccga taccgggaag ggaagggaga 10860

caagcccggc cgcgtgttcc gtccacacgt tgcggacgta ctcaagttct gccggcgagc 10920

cgatggcgga aagcagaaag acgacctggt agaaacctgc attcggttaa acaccacgca 10980

cgttgccatg cagcgtacga agaaggccaa gaacggccgc ctggtgacgg tatccgaggg 11040

tgaagccttg attagccgct acaagatcgt aaagagcgaa accgggcggc cggagtacat 11100

cgagatcgag ctagctgatt ggatgtaccg cgagatcaca gaaggcaaga acccggacgt 11160

gctgacggtt caccccgatt actttttgat cgatcccggc atcggccgtt ttctctaccg 11220

cctggcacgc cgcgccgcag gcaaggcaga agccagatgg ttgttcaaga cgatctacga 11280

acgcagtggc agcgccggag agttcaagaa gttctgtttc accgtgcgca agctgatcgg 11340

gtcaaatgac ctgccggagt acgatttgaa ggaggaggcg gggcaggctg gcccgatcct 11400

agtcatgcgc taccgcaacc tgatcgaggg cgaagcatcc gccggttcct aatgtacgga 11460

gcagatgcta gggcaaattg ccctagcagg ggaaaaaggt cgaaaaggtc tctttcctgt 11520

ggatagcacg tacattggga acccaaagcc gtacattggg aaccggaacc cgtacattgg 11580

gaacccaaag ccgtacattg ggaaccggtc acacatgtaa gtgactgata taaaagagaa 11640

aaaaggcgat ttttccgcct aaaactcttt aaaacttatt aaaactctta aaacccgcct 11700

ggcctgtgca taactgtctg gccagcgcac agccgaagag ctgcaaaaag cgcctaccct 11760

tcggtcgctg cgctccctac gccccgccgc ttcgcgtcgg cctatcgcgg ccgctggccg 11820

ctcaaaaatg gctggcctac ggccaggcaa tctaccaggg cgcggacaag ccgcgccgtc 11880

gccactcgac cgccggcgcc cacatcaagg caccctgcct cgcgcgtttc ggtgatgacg 11940

gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 12000

ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 12060

ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga 12120

gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag 12180

aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 12240

tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 12300

aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 12360

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 12420

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 12480

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 12540

cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 12600

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 12660

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 12720

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 12780

agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 12840

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 12900

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 12960

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 13020

ctcacgttaa gggattttgg tcatgcattc taggtactaa aacaattcat ccagtaaaat 13080

ataatatttt attttctccc aatcaggctt gatccccagt aagtcaaaaa atagctcgac 13140

atactgttct tccccgatat cctccctgat cgaccggacg cagaaggcaa tgtcatacca 13200

cttgtccgcc ctgccgcttc tcccaagatc aataaagcca cttactttgc catctttcac 13260

aaagatgttg ctgtctccca ggtcgccgtg ggaaaagaca agttcctctt cgggcttttc 13320

cgtctttaaa aaatcataca gctcgcgcgg atctttaaat ggagtgtctt cttcccagtt 13380

ttcgcaatcc acatcggcca gatcgttatt cagtaagtaa tccaattcgg ctaagcggct 13440

gtctaagcta ttcgtatagg gacaatccga tatgtcgatg gagtgaaaga gcctgatgca 13500

ctccgcatac agctcgataa tcttttcagg gctttgttca tcttcatact cttccgagca 13560

aaggacgcca tcggcctcac tcatgagcag attgctccag ccatcatgcc gttcaaagtg 13620

caggaccttt ggaacaggca gctttccttc cagccatagc atcatgtcct tttcccgttc 13680

aacatcatag gtggtccctt tataccggct gtccgtcatt tttaaatata ggttttcatt 13740

ttctcccacc agcttatata ccttagcagg agacattcct tccgtatctt ttacgcagcg 13800

gtatttttcg atcagttttt tcaattccgg tgatattctc attttagcca tttattattt 13860

ccttcctctt ttctacagta tttaaagata ccccaagaag ctaattataa caagacgaac 13920

tccaattcac tgttccttgc attctaaaac cttaaatacc agaaaacagc tttttcaaag 13980

ttgttttcaa agttggcgta taacatagta tcgacggagc cgattttgaa accgcggtga 14040

tcacaggcag caacgctctg tcatcgttac aatcaacatg ctaccctccg cgagatcatc 14100

cgtgtttcaa acccggcagc ttagttgccg ttcttccgaa tagcatcggt aacatgagca 14160

aagtctgccg ccttacaacg gctctcccgc tgacgccgtc ccggactgat gggctgcctg 14220

tatcgagtgg tgattttgtg ccgagctgcc ggtcggggag ctgttggctg gctggtggca 14280

ggatatattg tggtgtaaac aaattgacgc ttagacaact taataacaca ttgcggacgt 14340

ttttaatgta ctgaattaac gccgaattaa ttcgggggat ctggatttta gtactggatt 14400

ttggttttag gaattagaaa ttttattgat agaagtattt tacaaataca aatacatact 14460

aagggtttct tatatgctca acacatgagc gaaaccctat aggaacccta attcccttat 14520

ctgggaacta ctcacacatt attatggaga aactcgagct tgtcgatcga cagatccggt 14580

cggcatctac tctatttctt tgccctcgga cgagtgctgg ggcgtcggtt tccactatcg 14640

gcgagtactt ctacacagcc atcggtccag acggccgcgc ttctgcgggc gatttgtgta 14700

cgcccgacag tcccggctcc ggatcggacg attgcgtcgc atcgaccctg cgcccaagct 14760

gcatcatcga aattgccgtc aaccaagctc tgatagagtt ggtcaagacc aatgcggagc 14820

atatacgccc ggagtcgtgg cgatcctgca agctccggat gcctccgctc gaagtagcgc 14880

gtctgctgct ccatacaagc caaccacggc ctccagaaga agatgttggc gacctcgtat 14940

tgggaatccc cgaacatcgc ctcgctccag tcaatgaccg ctgttatgcg gccattgtcc 15000

gtcaggacat tgttggagcc gaaatccgcg tgcacgaggt gccggacttc ggggcagtcc 15060

tcggcccaaa gcatcagctc atcgagagcc tgcgcgacgg acgcactgac ggtgtcgtcc 15120

atcacagttt gccagtgata cacatgggga tcagcaatcg cgcatatgaa atcacgccat 15180

gtagtgtatt gaccgattcc ttgcggtccg aatgggccga acccgctcgt ctggctaaga 15240

tcggccgcag cgatcgcatc catagcctcc gcgaccggtt gtagaacagc gggcagttcg 15300

gtttcaggca ggtcttgcaa cgtgacaccc tgtgcacggc gggagatgca ataggtcagg 15360

ctctcgctaa actccccaat gtcaagcact tccggaatcg ggagcgcggc cgatgcaaag 15420

tgccgataaa cataacgatc tttgtagaaa ccatcggcgc agctatttac ccgcaggaca 15480

tatccacgcc ctcctacatc gaagctgaaa gcacgagatt cttcgccctc cgagagctgc 15540

atcaggtcgg agacgctgtc gaacttttcg atcagaaact tctcgacaga cgtcgcggtg 15600

agttcaggct ttttcatatc tcattgcccc ccggatctgc gaaagctcga gagagataga 15660

tttgtagaga gagactggtg atttcagcgt gtcctctcca aatgaaatga acttccttat 15720

atagaggaag gtcttgcgaa ggatagtggg attgtgcgtc atcccttacg tcagtggaga 15780

tatcacatca atccacttgc tttgaagacg tggttggaac gtcttctttt tccacgatgc 15840

tcctcgtggg tgggggtcca tctttgggac cactgtcggc agaggcatct tgaacgatag 15900

cctttccttt atcgcaatga tggcatttgt aggtgccacc ttccttttct actgtccttt 15960

tgatgaagtg acagatagct gggcaatgga atccgaggag gtttcccgat attacccttt 16020

gttgaaaagt ctcaatagcc ctttggtctt ctgagactgt atctttgata ttcttggagt 16080

agacgagagt gtcgtgctcc accatgttat cacatcaatc cacttgcttt gaagacgtgg 16140

ttggaacgtc ttctttttcc acgatgctcc tcgtgggtgg gggtccatct ttgggaccac 16200

tgtcggcaga ggcatcttga acgatagcct ttcctttatc gcaatgatgg catttgtagg 16260

tgccaccttc cttttctact gtccttttga tgaagtgaca gatagctggg caatggaatc 16320

cgaggaggtt tcccgatatt accctttgtt gaaaagtctc aatagccctt tggtcttctg 16380

agactgtatc tttgatattc ttggagtaga cgagagtgtc gtgctccacc atgttggcaa 16440

gctgctctag ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 16500

ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 16560

ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg 16620

tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg attac 16675

<210> 4

<211> 670

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

aaccaacatt tgggtatggt ggtgcaatgg gaggattgat ggggatggta gcttcctcat 60

gaacattcag gagctggcat tgatccgcat tgagaacctc cctgtgaagg tgatggtgtt 120

gaacaaccaa cacctaggca tggtcgtcca gttggaggat aggttttaca aggcgaatag 180

ggcgcataca tacttgggca acccggaatg tgagagcgag atatatccag attttgtgac 240

tattgctaag gggttcaata ttcctgcagt ccgtgtaaca aagaagagtg aagtccgtgc 300

cgccatcaag aagatgctcg agactccagg gccatacttg ttggacatca tcgtcccgca 360

ccaggagcat gtgctgccta tgatcccaat tgggggcgca ttcaaggaca tgatcctgga 420

tggtgatggc aggactgtgt attaatctat aatctgtatg ttggcaaagc accagcccgg 480

cctatgtctg acgtgaatga ctcataaaga gtggtatgcc tatgatgttt gtatgtgctc 540

tatcaataac taaggtgtca actatgaacc atatgctctt ctgttttact tgtttgatgt 600

gcttggcatg gtaatcctaa ttagcttcct gctgtttgac ctgaatgacc cataaagagt 660

ggtatgccta 670

<210> 5

<211> 384

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

cctaggcatg gtcgtccagt tggaggatag gttttacaag gcgaataggg cgcatacata 60

cttgggcaac ccggaatgtg agagcgagat atatccagat tttgtgacta ttgctaaggg 120

gttcaatatt cctgcagtcc gtgtaacaaa gaagagtgaa gtccgtgccg ccatcaagaa 180

gatgctcgag actccagggc catacttgtt ggacatcatc gtcccgcacc aggagcatgt 240

gctgcctatg atcccaattg ggggcgcatt caaggacatg atcctggatg gtgatggcag 300

gactgtgtat taatctataa tctgtatgtt ggcaaagcac cagcccggcc tatgtctgac 360

gtgaatgact cataaagagt ggta 384

<210> 6

<211> 384

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

tttgggtatg gtggtgcaat gggaggatag gttttacaag gcgaataggg cgcatacata 60

cttgggcaac ccggaatgtg agagcgagat atatccagat tttgtgacta ttgctaaggg 120

gttcaatatt cctgcagtcc gtgtaacaaa gaagagtgaa gtccgtgccg ccatcaagaa 180

gatgctcgag actccagggc catacttgtt ggatatcatc gtcccgcacc aggagcatgt 240

gctgcctatg atcccaagtg ggggcgcatt caaggacatg atcctggatg gtgatggcag 300

gactgtgtat taatctataa tctgtatgtt ggcaaagcac cagcccggcc tatgtttgac 360

ctgaatgacc cataaagagt ggta 384

<210> 7

<211> 1260

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala

1 5 10 15

Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr

20 25 30

Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp

35 40 45

Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys

50 55 60

Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp

65 70 75 80

Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu

85 90 95

Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn

100 105 110

Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn

115 120 125

Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu

130 135 140

Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe

145 150 155 160

Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn

165 170 175

Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile

180 185 190

Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys

195 200 205

Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys

210 215 220

Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe

225 230 235 240

Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile

245 250 255

Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn

260 265 270

Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys

275 280 285

Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser

290 295 300

Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe

305 310 315 320

Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys

325 330 335

Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile

340 345 350

Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe

355 360 365

Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp

370 375 380

Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp

385 390 395 400

Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu

405 410 415

Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu

420 425 430

Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser

435 440 445

Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys

450 455 460

Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys

465 470 475 480

Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr

485 490 495

Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile

500 505 510

Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr

515 520 525

Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro

530 535 540

Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala

545 550 555 560

Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys

565 570 575

Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly

580 585 590

Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met

595 600 605

Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro

610 615 620

Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly

625 630 635 640

Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys

645 650 655

Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn

660 665 670

Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu

675 680 685

Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys

690 695 700

Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile

705 710 715 720

Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His

725 730 735

Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile

740 745 750

Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys

755 760 765

Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys

770 775 780

Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr

785 790 795 800

Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile

805 810 815

Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val

820 825 830

Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp

835 840 845

Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly

850 855 860

Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn

865 870 875 880

Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu

885 890 895

Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile

900 905 910

Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys

915 920 925

Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn

930 935 940

Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln

945 950 955 960

Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys

965 970 975

Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile

980 985 990

Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe

995 1000 1005

Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr

1010 1015 1020

Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser

1025 1030 1035 1040

Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu

1045 1050 1055

Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp

1060 1065 1070

Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile

1075 1080 1085

Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu

1090 1095 1100

Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile

1105 1110 1115 1120

Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp

1125 1130 1135

Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln

1140 1145 1150

Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser

1155 1160 1165

Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu

1170 1175 1180

Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala

1185 1190 1195 1200

Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys

1205 1210 1215

Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys

1220 1225 1230

Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala

1235 1240 1245

Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1250 1255 1260

Claims

1.一种用于取代植物基因组中的目标片段的表达盒甲，包括启动子甲和终止子，其特征在于：在启动子甲和终止子之间包括如下三个区段：区段Ⅰ、区段Ⅱ和区段Ⅲ；区段Ⅲ为区段Ⅲ-1或区段Ⅲ-2；

所述启动子甲为OsU3启动子；

区段Ⅰ自5’至3’端依次具有Hammerhead型核酸酶的编码序列、crRNA1的编码序列和丁型肝炎病毒核酸酶的编码序列；

区段Ⅱ自5’至3’端依次具有Hammerhead型核酸酶的编码序列、crRNA2的编码序列和丁型肝炎病毒核酸酶的编码序列；

区段Ⅲ-1中自5’至3’端依次具有Hammerhead型核酸酶的编码序列、上游同源臂、供体片段序列、下游同源臂和丁型肝炎病毒核酸酶的编码序列；

区段Ⅲ-2中自5’至3’端依次具有crRNA1的靶标序列、上游同源臂、供体片段序列、下游同源臂和crRNA2的靶标序列；

所述目标片段的一个末端为区段Ⅰ中crRNA1的靶点序列，另一个末端为区段Ⅱ中crRNA2的靶点序列；

供体片段与目标片段具有如下差异：①预期在目标片段中引入的差异核苷酸；②将crRNA1中的PAM序列TTTN突变为非TTTN；③将crRNA2的PAM序列TTTN突变为非TTTN；

将crRNA1和crRNA2中的靶点序列进行同义突变；

所述表达盒甲如序列表的序列1自5’端第13-1686位所示，或，所述表达盒甲如序列表的序列2所示。

2.含有权利要求1所述表达盒甲的重组载体。

3.如权利要求2所述的重组载体，其特征在于：所述重组载体还包括表达盒乙；所述表达盒乙中由启动子乙启动LbCpf1核酸酶的编码基因表达，所述启动子乙为Ubi启动子。

4.如权利要求2或3所述的重组载体，其特征在于：所述重组载体为序列表的序列1所示的环形质粒，或，所述重组载体为采用序列2所示的双链DNA分子替代序列1自5’端第13-1686位得到的环形质粒。

5.权利要求1所述表达盒甲或权利要求2至4任一所述的重组载体在实现植物中以RNA转录本为模板进行靶基因同源重组中的应用；所述植物为水稻。

6.一种植物中以RNA转录本为模板进行靶基因同源重组的方法，包括如下步骤：将权利要求2至4任一所述的重组载体导入出发植物，实现植物中靶基因同源重组；所述植物为水稻。