一种用于非小细胞肺癌基因突变检测的文库构建方法及试
剂盒
技术领域
本发明涉及分子生物学技术领域,尤其涉及测序文库构建技术领域,特别涉及一种用于非小细胞肺癌基因突变检测的文库构建方法及试剂盒。
背景技术
目前,肺癌是世界上最常见的恶性肿瘤之一,已成为我国城市人口恶性肿瘤死亡原因的第一位,其中大约85%的肺癌为非小细胞肺癌。常规化疗或放疗会严重影响患者的生活质量和身体素质,所以靶向治疗越来越受到重视。针对非小细胞肺癌,已有的科学研究和临床实验已经找出了一系列靶向治疗位点和药物。靶向治疗与传统的化疗法不同,不干扰所有持续分裂细胞,而是通过药物干扰癌变或肿瘤增生所需的特定分子,从而特异的阻止癌细胞增长。药物进入体内会特异地选择致癌位点来相结合发生作用,使肿瘤细胞特异性死亡,而不会波及肿瘤周围的正常组织细胞。与传统的放化疗相比,靶向治疗不仅可以减少毒副反应,而且可以显著提高治疗的有效性,显著延长病人的生存期并提高生存质量。在2016年《非小细胞肺癌靶向药物治疗相关基因检测的规范建议》中,对靶向药物检测基因有相关说明,可以用于或推荐在非小细胞肺癌(NSCLC)检测的基因包括:EGFR、ALK和ROS1融合基因、c-MET、RET、BRAF和KRAS。通过基因检测,明确非小细胞肺癌的分子分型,找到可能的靶药位点或耐药位点,可为患者提供更精准的用药指导。
目前,高通量测序技术已广泛应用到医学研究和临床诊断领域,为致癌位点的检测提供了新的检测手段。高通量测序技术因其结果覆盖范围的全面性,以及不断下降的测序成本,在医学研究和临床应用中表现出越来越高的性价比。有限的样本量和检测报告输出的时效性对该技术提出了更高的要求。简化文库构建流程、提高低起始量样本的建库成功率势在必行。通过优化和改进文库构建方法,缩短酶反应时间和建库步骤、提高样本转化成文库的效率成为高通量测序技术拓展应用领域的一大关键点。
经典的高通量文库构建步骤包括:1.基因组打断(包括物理打断法和化学打断法,如covaris超声打断、fragmentase酶切打断);2.双链DNA(Deoxyribonucleic acid,脱氧核糖核酸)末端修复;3.3’末端加dATP(deoxyadenosine triphosphate,三磷酸脱氧腺苷);4.加与测序平台匹配的接头;5.PCR(Polymerase Chain Reaction,聚合酶链式反应)扩增。每个步骤间都需要进行纯化反应,有时还需要在酶反应之后进行一次片段选择(步骤1、4、5其中之一),整个流程需要大概8-9个小时才能完成。为简化流程,一些生物公司推出了新的建库技术,如illumina公司提出了基于转座酶的打断与加接头一步完成的快速建库方法,但该方法存在测序数据碱基偏向性问题。
如上所述,经典的高通量文库构建方法是目前接受度最广、数据表现最稳定、数据偏向性最少的建库方法,但其建库过程耗时较长,对样本起始量要求较高,日益无法满足快速发展的市场对低起始量微量建库和快速报告周期的需求,这一点在高通量测序技术在临床方面的应用中表现的更为突出。而转座酶建库技术,虽然能够满足低起始量和快速建库的要求,但其数据偏向性又在一定程度上限制了该方法的大范围推广。所以如果能对经典的高通量建库方法进行改良,在保持其现有优势的基础上降低其所需的样本起始量并缩短建库时间,将极大的推进高通量测序方法在市场上特别是医学研究和临床方向的应用,为相关领域研究和临床应用提供更有利的方法和技术。
本发明中的方法对经典的高通量文库构建方法进行了优化改进,使其在保持现有数据表现优势的基础上,兼容不同样本类型(包括低质量的福尔马林固定石蜡包埋样本),可进行微量样本建库,极大的简化了操作流程,减少样本在建库过程中的损失,大大缩短了建库时间,并降低了文库构建成本,更有利于非小细胞肺癌基因检测大规模的推广应用。
目前市面上主要的基因检测产品大部分一次检测只能针对少数基因与位点,且不同的突变类型需要采用不同的起始样本类型或检测方法。如基于Arms PCR方法的检测试剂盒,在检测SNV和InDel时使用DNA样本,每次检测一个或数个基因,检测更全面基因或位点则需进行多次检测,造成时间和成本的增加;而在检测融合基因变异时,需要采用RNA样本,并只能检测已知的融合类型。另外临床上对于融合和拷贝数变异的检测常用的还有FISH方法,该方法一次检测一般针对单个基因,且这一方法灵敏度和准确度相对较低,对需要操作人员的要求和经验较高,价格昂贵。然后,使用本发明中的试剂盒,可以通过一次DNA建库测序检测几百个肺癌相关基因和几千个热点,并检测所有突变类型,包括点突变、插入缺失、基因融合以及拷贝数变异,涵盖所有非小细胞肺癌靶向药物作用位点,大大节省了样本需求量,避免不同核酸类型提取带来的复杂操作,节约宝贵的临床样本。本试剂盒中优化的实验流程大大提高了核酸的利用率,检测结果准确,对于四种突变类型的检出均有非常好的灵敏度、特异性和准确性。本试剂盒优化的实验操作步骤使得检测过程更加简单便捷,进一步减少检测成本和人工成本,更低的成本带来高性价比最终能够更好的使患者获益。
发明内容
本发明提供一种优化的可用于非小细胞肺癌基因突变检测的测序文库构建方法和试剂盒。本方法能够在同一个反应管中实现DNA打断、末端修复与加A、以及接头连接反应,之后对连接产物的扩增产物进行非小细胞肺癌相关基因目标区域杂交捕获并测序,通过信息分析探明非小细胞肺癌基因突变情况。本发明提供一种优化的可用于非小细胞肺癌基因突变检测的文库构建试剂盒,为临床提供了更加安全、准确、灵敏、便捷、高性价比的基因突变检测手段。解决了当前临床方法中无法依靠少量的DNA样本一次性全面检测点突变、插入缺失、融合基因和拷贝数变异的问题,极大的节省了珍贵临床样本的需求量。检测结果准确,可以在较短时间为医生提供全面、精准的基因突变信息,也为患者节省了因多次检测浪费的宝贵时间和金钱。试剂盒简便优化的操作步骤,一定程度上降低了NGS建库操作的复杂性,减少的出错机率,进一步提高了产品在临床应用中的安全性。
在本发明中,末端修复与加A在相同的反应体系中实现,简化了反应过程,减少了纯化步骤,提高了起始DNA转化成可连接接头DNA的效率,降低对起始DNA总量的要求,也可降低PCR扩增的循环数,提高上机文库的可用数据比率并且降低数据碱基偏向性。本发明的方法适用于不同类型微量起始DNA的快速建库。在本发明的用于非小细胞肺癌基因突变检测的文库构建方法的基础上,本发明还提供一种用于非小细胞肺癌基因突变检测的文库构建试剂盒。
根据本发明的第一方面,本发明提供一种用于非小细胞肺癌基因突变检测的文库构建方法,包括:
在反应管中加入基因组DNA,DNA打断酶和打断反应缓冲液;在DNA打断酶的作用下,基因组DNA被随机片段化处理,产生DNA分子片段;
在所述反应管中,直接加入聚合酶、多聚核苷酸激酶、不具有3’-5’外切活性的聚合酶、dNTP、dATP及多聚核苷酸激酶缓冲液,进行末端修复与加A反应;在同一反应体系中,在dNTP存在下,利用聚合酶将片段化DNA的末端补平或切平,例如利用聚合酶的5’-3’聚合活性将5’突出末端补平和/或聚合酶的3’-5’外切活性将3’突出末端切平,利用多聚核苷酸激酶将5’羟基转变成5’磷酸基团且将3’磷酸基团转变成3’羟基;在过量dATP存在下,利用不具有3’-5’外切活性的聚合酶在双链DNA 3’末端加上dATP;
在上述反应体系中,直接加入鼓泡型接头、DNA连接酶和连接反应缓冲液,所述鼓泡型接头的一端为单碱基突出末端;所述单碱基突出末端为T,其位于所在链的3’端;使上一步产生的3’A突出的双链DNA与所述鼓泡型接头连接;
纯化上一步接头连接的产物后,加入与上述接头序列两端互补的核酸单链作为引物进行PCR扩增,其中一条引物5’末端有磷酸化修饰,得到大量双链DNA,其中一条链的5’端有磷酸基团;
使用非小细胞肺癌探针对上一步PCR扩增得到的产物进行非小细胞肺癌目标区域捕获;
对上一步非小细胞肺癌目标区域捕获的产物,加入与上述接头序列两端互补的核酸单链作为引物进行PCR扩增,其中一条引物5’末端有磷酸化修饰,得到大量双链DNA,其中一条链的5’端有磷酸基团;
纯化上一步PCR扩增的产物后,利用热变性将上述双链DNA变成单链脱氧核酸,并加入一段与接头首尾序列互补的单链核酸作为介导桥序列,与变性后的单链脱氧核酸杂交及连接反应,使目的单链核酸环化,得到文库。
作为本发明的进一步改进的方案,上述基因组DNA为手术冷冻组织DNA、福尔马林固定石蜡包埋(formalin-fixed paraffin-embedded,FFPE)DNA、穿刺组织DNA。
作为本发明的进一步改进的方案,上述聚合酶为T4DNA聚合酶和/或Klenow大片段;上述多聚核苷酸激酶为T4多聚核苷酸激酶;上述不具有3’-5’外切活性的聚合酶为Taq聚合酶和/或Klenow片段(3′→5′exo-)。
作为本发明的进一步改进的方案,片段化DNA为酶切打断得到的DNA片段分子,末端修复和加A反应时,每50μL的体系中含有,酶切打断DNA 1-500ng,T4DNA聚合酶0-40U,Klenow大片段0-20U,T4多聚核苷酸激酶0-24U,Taq聚合酶1-10U,每种dNTP各0.02-1mM,额外的dATP0.02-1mM,以及Mg离子8-10mM,条件是T4DNA聚合酶和Klenow大片段的含量不同时为0;更进一步优选地,反应条件为15-37℃反应10-30min,然后65-75℃反应10-30min。
作为本发明的进一步改进的方案,所述待测序样本有多个时,不同样本分别进行DNA打断、末端修复/加A以及接头连接反应步骤;连接反应中使用的所述鼓泡型接头上含有标签序列;所述标签序列,可用于区分待测序样本。
作为本发明的进一步改进的方案,在进行杂交捕获反应之前,可以将不同待测样本的连接产物或PCR扩增产物混合进行杂交捕获。
根据本发明的第二方面,本发明提供一种用于非小细胞肺癌基因突变检测的文库构建试剂盒。首先,所述试剂盒包括DNA打断酶和打断反应缓冲液。
其次,所述试剂盒还包括末端修复-加A酶混合液和末端修复-加A反应缓冲液;所述末端修复-加A酶混合液包括聚合酶、多聚核苷酸激酶、不具有3’-5’外切活性的聚合酶;所述末端修复-加A反应缓冲液包括dNTP、dATP和多聚核苷酸激酶缓冲液;所述末端修复-加A酶混合液和末端修复-加A反应缓冲液为用于配制如下的50μL反应体系的试剂盒单位:每50μL的体系中含有,酶切打断DNA 1-500ng,T4DNA聚合酶0-40U,Klenow大片段0-20U,T4多聚核苷酸激酶0-24U,Taq聚合酶1-10U,每种dNTP各0.02-1mM,额外的dATP0.02-1mM,以及Mg离子8-10mM,条件是T4DNA聚合酶和Klenow大片段的含量不同时为0。
第三,所述试剂盒还包括鼓泡型接头、连接酶和连接反应缓冲液;所述鼓泡型接头序列包括SEQ ID NO:1-2;SEQ ID NO:1中含有标签序列并在5’末端有磷酸化修饰,SEQ IDNO:2的3’末端为T碱基,可与3’末端含有突出A碱基的双链DNA分子连接。
第四,所述试剂盒还包括对连接产物进行扩增的引物序列,所述引物包括SEQ IDNO:3和SEQ ID NO:4,其中SEQ ID NO:3在5’末端有磷酸化修饰,使得扩增得到的大量双链DNA中一条链的5’端有磷酸基团。
本发明的用于非小细胞肺癌基因突变检测的文库构建方法的优势体现在:首先,本发明的DNA打断、末端修复、加A及接头连接四步反应在同一个反应管中进行,其中DNA末端修复与加A在同一反应体系中进行,大大缩短建库时间,节省纯化步骤,降低建库成本,提升高通量建库技术应用到医学临床检测项目,尤其是非小细胞肺癌基因突变检测的实效。其次,本发明在同一个反应体系中进行从DNA末端修复至加A到加接头的反应,能够降低起始DNA在建库过程的损耗,提高DNA回收和利用效率。
另外,本发明通过优化反应条件,提高起始DNA转化成连接接头DNA的效率,即提高起始DNA样本的有效利用率,降低PCR扩增的循环数,从而降低PCR循环数过多导致重复数据的产出,提高可用数据比率,降低数据碱基偏向性。
再者,本发明基于探针杂交捕获方法进行非小细胞肺癌目标区域捕获,可一次性检测点突变、插入缺失、融合基因及拷贝数变异等所有突变类型。
此外,本发明的方法可以广泛实现不同类型微量起始DNA的快速建库,如手术冷冻组织DNA、FFPE样本DNA、穿刺组织DNA。本发明的方法可以应用于BGISEQ-500/1000测序平台。
附图说明
图1为本发明的基于BGISEQ-500/1000测序平台的非小细胞肺癌基因突变检测文库的建库流程示意图;其中,1:起始DNA;2:基因组DNA酶切打断;3:末端修复和加A在同一反应体系中进行,其中3.1:末端修复反应;3.2:加A反应;4:接头连接反应(2、3、4步反应在同一个反应管中进行,为图中所示“一管法”);5:纯化反应体系,去除接头污染;6:连接产物进行PCR扩增;7:纯化PCR反应体系,去除引物二聚体污染;8:使用非小细胞肺癌探针进行非小细胞肺癌目标区域捕获;9:对非小细胞肺癌目标区域捕获产物进行PCR扩增;10:纯化PCR反应体系;11:进行单链环化。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
本发明公开了一种可用于非小细胞肺癌基因突变检测的优化的测序文库构建方法。可在一个反应管中,快速、优化的进行基因组DNA打断、末端修复、加A及接头连接四步反应(一管式反应)。并且能够实现DNA末端修复与加A在同一个反应体系中完成。
本发明的文库构建方法可以应用于许多测序研究领域,特别是应用于临床方向如本发明中的非小细胞肺癌基因突变检测的文库构建中。采用本发明的方法进行非小细胞肺癌基因突变检测文库的构建,能够实现低起始量非小细胞肺癌临床样本的快速建库,缩短文库制备的时间,降低实验成本,增加DNA的有效利用率,提高文库的可用数据产出,文库全方位兼容BGISEQ-500/1000测序平台。
下面将以BGISEQ-500测序平台为例,结合附图,详细说明本发明的技术方案。需要说明的是,本发明的技术方案不局限于以下参考附图所说明的技术方案的细节上。
请参考图1,以基于BGISEQ-500/1000测序平台的非小细胞肺癌相关基因突变检测文库构建为示例,本方案的文库构建过程具体步骤如下:
1、模板DNA的准备:用制备好的模板DNA进行建库反应,模板DNA包括但不限于非小细胞肺癌手术后冷冻组织、FFPE样本和穿刺组织中提取的基因组DNA(如图1中编号1所示)。
2、DNA片段化处理:在反应管中加入上述中任一种基因组DNA,DNA打断酶和打断反应缓冲液。在DNA打断酶的作用下,基因组DNA被随机片段化处理,产生DNA分子片段(如图1中编号2所示)。
3、DNA末端修复与加A反应:在上述同一反应管中,加入聚合酶、多聚核苷酸激酶、不具有3’-5’外切活性的聚合酶、dNTP、dATP及多聚核苷酸激酶缓冲液。在同一反应体系中,在dNTP存在下,利用聚合酶将片段化DNA的末端补平或切平,例如利用聚合酶的5’-3’聚合活性将5’突出末端补平和/或聚合酶的3’-5’外切活性将3’突出末端切平,利用多聚核苷酸激酶将5’羟基转变成5’磷酸基团且将3’磷酸基团转变成3’羟基;在过量dATP存在下,利用不具有3’-5’外切活性的聚合酶在双链DNA 3’末端加上dATP(如图1中编号3.1和3.2所示)。
因打断的基因组DNA片段末端的完整性会受到不同程度的破环,形成5’突出末端、3’突出末端、5’羟基、3’磷酸基团等构型,不利于后续与接头发生连接反应。末端修复反应主要利用聚合酶(如T4DNA聚合酶、Klenow大片段等)在dNTP(deoxy-ribonucleosidetriphosphate,脱氧核糖核苷三磷酸)存在时的5’-3’聚合活性将5’突出末端补平,3’-5’外切酶活性将3’突出末端切平;利用多聚核苷酸激酶(如T4多聚核苷酸激酶等)的5’羟基激酶活性将5’羟基转变成5’磷酸基团,多聚核苷酸激酶的3’磷酸酯酶活性将3’磷酸基团转变成3’羟基。3’末端加A反应则是在反应体系中存在dATP时,利用不具有3’-5’外切活性的聚合酶(如去除了3’-5’外切活性的Klenow大片段(又称“Klenow片段(3′→5′exo-)”)、不具有3’-5’校正活性的Taq DNA聚合酶等),在双链DNA 3’末端加上dATP,以利于双链DNA后续与5’T突出构型的接头序列进行A-T连接。
4、加接头:在步骤3的反应管中直接加入鼓泡型接头、连接酶和连接反应缓冲液,所述鼓泡型接头的一端为单碱基突出末端;所述单碱基突出末端为T,其位于所在链的3’端;使上一步3’A突出的双链DNA与接头连接。所述鼓泡型接头的一条链中含有标签序列。
接头是一段特殊设计的脱氧核糖核酸序列,通过连接等方法固定在DNA片段两端后,在测序时能被识别并作为测序的起始位点,供仪器读取其后的序列信息。由于不同平台的文库结构不同,其使用的接头结构也有差异。在此步骤使用不同接头,即可满足不同测序平台对于文库的需求。本发明中使用的是适用于BGISEQ-500平台的鼓泡型接头(如图1中编号4所示)。
5、纯化接头连接产物:纯化末端修复-加A-加接头的反应体系,去除接头污染(如图1中编号5所示)。
6、连接产物PCR扩增:加入与目的接头序列两端互补的核酸单链作为引物进行PCR扩增,得到大量的DNA产物,由于其中一条引物5’末端有磷酸化修饰,扩增得到的双链DNA其中一条的5’端有磷酸基团(如图1中编号6所示)。
7、PCR产物纯化:纯化PCR反应体系,去除引物二聚体污染(如图1中编号7所示)。
8、非小细胞肺癌目标区域捕获:纯化的PCR产物进行非小细胞肺癌目标区域捕获(如图1中编号8所示)。多个待测样本时,可以通过使用不同标签序列的鼓泡型接头,把不同待测样本混合在一起进行杂交捕获。
目前,基于测序方法的癌症检测探针大多追求覆盖区域的全面性,希望包含所有与药物相关的基因。而事实上,经批准上市的可用于临床的分子靶向和免疫药物数量有限,且多有明确位点,而与化疗相关的位点数量也不多。所以,为了提高检测精度,可以有针对性的设计专门用于非小细胞肺癌检测的探针,从而将探针覆盖区域大大缩小,同时采取加大测序数据量和使用新的区域筛选方法,可以在探针覆盖区域相对集中的同时,不影响探针对整体非小细胞肺癌人群的检测效果,从而达到低成本、高覆盖、精确检测的目的。本发明中使用的非小细胞肺癌探针经过咨询临床专家意见,设计了面向临床的非小细胞肺癌相关基因检测探针,在包含全部重要位点的前提下缩小了芯片体积,增加了覆盖人数。
上述非小细胞肺癌相关基因检测探针包括了以下内容:a.FDA和NSCLC-NCCN推荐检测的突变位点;b.在大型临床研究中取得显著性结果的突变位点;c.与非小细胞肺癌化疗相关的多态性位点;d.NSCLC-NCCN和FDA推荐药物的靶点基因的全外显子;e.其他非小细胞非小细胞肺癌(NSCLC)研究热点基因的全外显子及热点;f.依靠对现有非小细胞肺癌患者数据的挖掘和筛选,用尽可能少的区域保证在95%以上NSCLC患者中包含2个以上单核苷酸变异(SNV),这样可保证探针能在绝大多数NSCLC患者中检出突变。
9、捕获产物扩增:对非小细胞肺癌目标区域捕获产物进行PCR扩增(如图1中编号9所示)。
10、捕获后扩增产物纯化:对捕获目标区域的PCR扩增产物进行纯化(如图1中编号10所示)。
11、单链环化:将纯化后的捕获后扩增产物双链线性DNA制备成单链环状分子(如图1中编号11所示)。
单链环化反应利用热变性将双链DNA变成单链脱氧核酸,并加入一段与接头首尾序列互补的单链核酸(可称为介导桥序列)与变性后的单链脱氧核酸杂交和连接反应,使目的单链核酸环化。反应完的单链环化体系直接用于后续的滚环复制,形成测序上机模板产物DNB(DNA纳米球,DNA纳米球),用于测序反应。
本发明的建库方法,大大简化操作步骤,缩短建库时间,节省建库成本,降低起始量,提升高通量建库技术应用到医学临床检测项目——尤其是非小细胞肺癌基因突变检测项目——的实效。
以下通过实施例详细说明本发明的技术方案,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。除有特殊说明外,本发明中所使用的试剂均可通过公开渠道从市场购买获得,例如从华大基因购买。
实施例1:非小细胞肺癌阴阳性样本DNA的建库和突变检测
阳性样本DNA为含有多个非小细胞肺癌相关热点突变位点的DNA阳性标准品1(其中含有非小细胞肺癌中发生频率较高的点突变和插入缺失突变),含有多个非小细胞肺癌融合基因突变的DNA阳性标准品2,以及含有非小细胞肺癌相关的MET基因扩增的DNA阳性标准品3(HorioznDx),标准品中的突变具有稳定的突变频率。阴性样本来自培养的炎黄细胞DNA(YH DNA),不含有非小细胞肺癌相关的基因突变。
1.DNA样本打断和末端修复:对阴、阳性样本各取100ng的基因组DNA,用水稀释到20μL。
按下表1配置体系。
表1
试剂名称 |
一个反应用量 |
打断和末端修复缓冲液 |
6.4μL |
打断和末端修复酶 |
3.6μL |
总体积 |
10μL |
将10μL反应液加入至稀释好的DNA中,混匀,37℃20分钟-65℃15分钟-4℃保持。
2.接头连接及连接产物纯化:
本方案中使用的接头序列如下(本实施例中的序列从左到右为5’端至3’端,“//”示修饰基团,“phos”示磷酸化,B10示10个碱基的标签序列)。
长链:
/5Phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACAA(B10)CAACTCCTTGGCTCACA(SEQ IDNO:1);
短链:
TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT(SEQ ID NO:2)。
将10μL接头加入上一步反应液中,充分混匀。阴、阳性标准品使用不同标签序列的接头。
按下表2配置体系。
表2
将连接反应体系与接头和产物的混合液混匀,置于23℃孵育1小时。反应完之后,加入40μL磁珠进行纯化,20μL无核酸酶水溶解回收产物。
需要说明:反应产物的纯化有多种方式,有磁珠法、柱纯化法、凝胶回收法等,均可用于替换。
3.PCR(聚合酶链式反应)及扩增产物纯化
引物序列如下:(本实施例中的序列从左到右为5’端至3’端,“//”示修饰基团,“phos”示磷酸化)。
引物1序列:/5Phos/GAACGACATGGCTACGA(SEQ ID NO:3);
引物2序列:TGTGAGCCAAGGAGTTG(SEQ ID NO:4)。
按下表3配制体系。
表3
试剂 |
一个反应用量 |
PCR反应液 |
25μL |
PCR引物 |
5μL |
总体积 |
30μL |
将上步20μL回收产物加入到以上体系中,混匀后进行反应,条件如表4。
表4
反应完成后使用60μL磁珠进行纯化,22μL无核酸酶水溶解回收产物。分别取1μL回收产物,用QubitdsDNA HS分析试剂盒(Invitrogen公司)定量阴、阳性标准品产物浓度,取样1μg后混合,再次进行磁珠选择,最后用20μL无核酸酶水溶解回收产物,进行下一步反应。
4.杂交
使用非小细胞肺癌检测探针对上一步得到的PCR产物进行非小细胞肺癌突变基因目标区域杂交捕获。向上步反应管中加入5.6μL杂交反应液1,充分混匀,运行表5的反应程序。
表5
温度 |
时间 |
循环数 |
95℃ |
5min |
1 |
65℃ |
保持 |
1 |
取新的PCR管,加入20μL杂交反应液2,运行表6的反应程序。
表6
温度 |
时间 |
循环数 |
65℃ |
5min |
1 |
65℃ |
保持 |
1 |
取新的PCR管,加入5μL杂交反应液3,运行表7的PCR反应程序。
表7
温度 |
时间 |
循环数 |
65℃ |
2min |
1 |
65℃ |
保持 |
1 |
取出13μL杂交反应液2加入至杂交反应液1中混匀,65℃保持恒温后,将反应液全部转移至杂交反应液3中,轻柔混匀后,置于PCR仪中,65℃反应16h。
在上述杂交反应快完成时,取50μL链霉亲和素标记磁珠,使用200μL的磁珠结合液清洗磁珠,共清洗三遍,最后加入200μL的磁珠结合液重悬磁珠;待杂交反应完成后,将杂交反应液全部转移至清洗好的磁珠中,室温下颠倒混匀30min。反应完成后,使用磁力架吸附磁珠,弃去上清,加入500μL的洗涤液1清洗磁珠,室温静置15分钟(期间涡旋震荡混匀3至4次),使用磁力架吸附磁珠,弃去上清;然后加入500μL预热到65℃的洗涤液2清洗磁珠,65℃温育10分钟(期间涡旋震荡混匀2至3次),使用磁力架吸附磁珠,弃去上清,并重复使用洗涤液2清洗两遍。反应完成后,加入45μL无酶水重悬,得到含有目标区域DNA片段的磁珠。
5.PCR富集及产物纯化
引物序列如下:(本实施例中的序列从左到右为5’端至3’端,“//”示修饰基团,“phos”示磷酸化)。
引物1序列:/5Phos/GAACGACATGGCTACGA(SEQ ID NO:3);
引物2序列:TGTGAGCCAAGGAGTTG(SEQ ID NO:4)。
按下表8配制体系。
表8
试剂 |
1个反应用量 |
PCR反应液 |
50μL |
PCR引物 |
5μL |
总体积 |
55μL |
将上步45μL回收产物(含磁珠)加入到以上体系中,混匀后进行反应,条件如表9。
表9
反应完成后,使用120μL磁珠进行纯化,40μL洗脱缓冲液溶解回收产物。取1μL回收产物,用QubitdsDNA HS分析试剂盒(Invitrogen公司)定量产物浓度。
6.单链环化:
将目标区域扩增产物取160ng用洗脱缓冲液配置成48μL体系,置于PCR仪中95℃孵育5min,立即置于冰上放置5-10min。
按下表10配制体系:
表10
试剂 |
一个反应用量 |
连接酶 |
0.2μL |
20μM介导片段 |
5μL |
环化反应缓冲液 |
6.8μL |
总体积 |
12μL |
将配制好的环化反应液加入单链产物中,混匀,置于37℃孵育30min进行单链环化反应。
其中介导片段具有相应互补序列用于连接单链两端,其序列如下:(本实施例中的序列从左到右为5’端至3’端)。
GCCATGTCGTTCTGTGAGCCAAGG(SEQ ID NO:5)。
7.将上步构建好的文库经电泳检测合格后进行BGISEQ-500/1000测序仪测序,对测序结果进行数据分析,得到非小细胞肺癌基因突变检测结果。
1)测序
取构建的单链环状DNA文库进行DNA纳米球制备、BGISEQ-500/1000上机测序。测序过程严格按照BGISEQ-500/1000的标准操作流程进行上机操作。
2)数据分析
通过对测序得到的序列进行比对、去重等处理,对样本的变异进行分析,步骤如下:
对于点突变和插入缺失突变,第一步根据比对情况,输出目标区域潜在的突变位点;第二步提取突变位点上每一个支持突变的测序序列碱基质量值、比对质量值和在测序序列中的位置信息,取p-value值小于或等于0.05的位点;第三步统计突变位点前后20bp的插入缺失突变数,过滤掉插入缺失突变数大于10的位点,并过滤掉人群中的多态性位点,最终输出突变位点的信息。
对于融合突变,第一步根据比对情况,得到插入片段异常的双端的测序序列,通过它们的比对位置得到潜在的融合;第二步截取出比对结果B1中截短的测序序列部分,重新把这些测序序列比对到基因组得到一个比对结果B2,结合B1和B2得到潜在的融合突变;第三步结合第一步和第二步得到的潜在融合突变,最终确定融合突变结果并输出发生融合突变的信息。
表11示出了阴阳性样本(DNA阳性标准品1和YH DNA)在建库上机测序后分析出来的点突变和插入缺失突变检测结果。
表11
表12示出了阴阳性样本(DNA阳性标准品2和YH DNA)在建库上机测序后分析出来的融合基因突变检测结果。
表12
表13示出了阴阳性样本(DNA阳性标准品3和YH DNA)在建库上机测序后分析出来的拷贝数变异突变检测结果。
表13
SEQUENCE LISTING
<110> 深圳华大基因研究院
<120> 一种用于非小细胞肺癌基因突变检测的文库构建方法及试剂盒
<130> 15I22173
<160> 5
<170> PatentIn version 3.3
<210> 1
<211> 58
<212> DNA
<213> 人工序列
<220>
<221> 标签序列
<222> (32)..(41)
<220>
<221> misc_feature
<222> (32)..(41)
<223> n is a, c, g, or t
<400> 1
agtcggaggc caagcggtct taggaagaca annnnnnnnn ncaactcctt ggctcaca 58
<210> 2
<211> 43
<212> DNA
<213> 人工序列
<400> 2
ttgtcttcct aagaccgcga acgacatggc tacgatccga ctt 43
<210> 3
<211> 17
<212> DNA
<213> 人工序列
<400> 3
gaacgacatg gctacga 17
<210> 4
<211> 17
<212> DNA
<213> 人工序列
<400> 4
tgtgagccaa ggagttg 17
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<400> 5
gccatgtcgt tctgtgagcc aagg 24