CN109072296A

CN109072296A - 利用核酸酶保护进行直接标靶测序的方法

Info

Publication number: CN109072296A
Application number: CN201780011251.1A
Authority: CN
Inventors: D·汤普森; M·卢恩塞维拉
Original assignee: HTG Molecular Diagnostics Inc
Current assignee: HTG Molecular Diagnostics Inc
Priority date: 2016-02-11
Filing date: 2017-02-10
Publication date: 2018-12-21
Anticipated expiration: 2037-02-10
Also published as: WO2017139672A1; AU2017218112B2; US12104206B2; CN109072296B; EP3390671A1; JP6908615B2; AU2017218112A1; US20190017112A1; JP2019509724A; EP3390671B1; BR112018016240A2; CA3010199A1

Abstract

本公开提供了用于核酸标靶直接测序的方法和试剂盒。此方法可用于确定样品中是否存在一种或更多种核酸标靶。

Description

利用核酸酶保护进行直接标靶测序的方法

相关申请的交叉引用

本申请要求2016年2月11日提交的美国临时申请No.62/294,143和2016年12月16日提交的美国临时申请No.62/435,459的优先权，这两个申请通过引用结合入本文。

技术领域

本公开提供了定量核酸酶保护测序(qNPS)方法和试剂盒，其允许核酸标靶的直接测序。此方法可用于确定样品中是否存在一种或更多种核酸标靶。

背景技术

尽管已知核酸分子测序方法，但仍需要允许同时或同期对多个样品或多个序列进行直接测序分析的方法。直接多重(multiplexing)核酸分子测序反应的方法尚未以最期望的性能或简单水平实现。

发明内容

提供了改进现有定量核酸酶保护测序(qNPS)方法(例如美国公开号US 2011-0104693和美国专利号8,741,564中公开的那些)的方法，并且代表了对当前核酸测序方法的改进。在一些实例中，所公开的方法用于使用多种具有侧翼序列的核酸酶保护探针(NPPF)对样品中的几种不同标靶核酸分子进行测序，其中每种NPPF特异性结合一种或多种特定的标靶核酸分子。在一些实例中，所公开的方法用于同时对多个样品中的至少一种标靶核酸分子进行测序。

所公开的确定样品中至少一种标靶核酸分子的序列的方法可包括将样品与至少一种NPPF在足以使NPPF特异性结合标靶核酸分子的条件下相接触。所述NPPF包括与标靶核酸分子的全部或部分互补的序列，因此允许标靶核酸分子和NPPF之间的特异性结合或杂交。例如，与标靶核酸分子的区域互补的NPPF区域以高特异性与标靶核酸分子的该区域结合或杂交。所述NPPF还包括在NPPF的5'-端和/或3'-端的一个或更多个侧翼序列。因此，所述一个或更多个侧翼序列位于与标靶核酸分子互补的序列的5'、3'或两端。如果所述NPPF在5'-端和3'-端都包括侧翼序列，则在一些实例中，每个NPPF的序列是不同的且不互补的。所述侧翼序列包括几个连续的核苷酸，其具有在样品中存在的核酸分子中未发现的序列(例如至少12个核苷酸的序列)。在一些实例中，所述NPPF(例如在一个或两个侧翼序列和/或与标靶核酸分子的全部或部分互补的区域的序列)包括一个或多个dUTP，以允许随后的NPPF降解(例如，使用尿嘧啶DNA去糖基酶)。在一个实例中，所述NPPF(例如在一个或两个侧翼序列和/或与标靶核酸分子的全部或部分互补的区域的序列)可以包括在否则将是dTTP的位置处的dUTP。

在一些实例中，所述NPPF(例如侧翼序列或与标靶核酸分子的区域互补的NPPF区域)包括单核苷酸错配(例如用G替换A，或用T替换C，使A:T碱基对变成G:T碱基对，或C:G碱基对变成T:G碱基对；或者当标靶核酸是RNA时，A:rU碱基对将变成G:rU碱基对，或C:rG碱基对变成T:rG碱基对)，其不会对所述NPPF以高特异性与标靶核酸分子杂交的能力产生不利影响，并且通常不被单链核酸酶如S1核酸酶识别或切割。因此，与标靶核酸分子的区域互补的NPPF区域是独特的，并且可以与样品中的标靶核酸序列区分开。例如，错配核苷酸的存在能允许人们确定检测(例如，测序)的是NPPF还是标靶核酸分子。在一些实例中，错配核苷酸不存在于所述NPPF的5'-最末端或3'-最末端，例如不存在于所述NPPF的5'-端或3'-端的两个碱基内。在一些实例中，错配核苷酸不存在于侧翼序列和与标靶核酸分子的区域互补的NPPF区域之间的接合处，例如距离这样的结合处约10至15个碱基。在一些实例中，错配核苷酸在与标靶互补的区域内，例如不在侧翼序列与NPPF内与标靶互补的序列之间的结合处的两个碱基内。在一个实例中，错配核苷酸是与标靶互补的序列内的约10-15个核苷酸，例如在与标靶互补的区域内的12个核苷酸。

该方法还包括将样品和与NPPF的侧翼序列具有互补性的核酸分子(CFS)相接触。例如，如果所述NPPF具有5'-侧翼序列，则将所述样品和具有与5'-侧翼序列互补性(5CFS)和5'-端磷酸酯的核酸分子在足以使5'-侧翼序列特异性结合5CFS的条件下相接触。类似地，如果所述NPPF具有3'-侧翼序列，则将所述样品和具有与3'-侧翼序列互补性的核酸分子(3CFS)在足以使3'-侧翼序列特异性结合至3CFS的条件下相接触。在一些实例中，所述3CFS和5CFS中的至少一个包括允许捕获或分离标靶核酸分子的捕获部分。在一些实例中，所述NPPF包括允许捕获或分离标靶核酸分子的捕获部分。该杂交导致产生双链(ds)核酸分子，其中所述NPPF与标靶核酸分子杂交，并与5CFS和/或3CFS杂交。

该方法还包括在足以降解或除去反应中未结合的ss核酸分子的条件下将样品与特异于单链(ss)核酸分子的核酸酶相接触。因此，例如未结合标靶核酸分子或CFS的NPPF，以及未结合的标靶核酸分子或标靶核酸分子的未结合部分、样品中的其他ss核酸分子和未结合的CFS被降解。这导致经消化的样品，包括与其标靶核酸分子杂交的、与其相应的3CFS杂交的、与其相应的5CFS杂交的，或者与其相应的3CFS和其相应的5CFS都杂交的NPPF。捕获该ds核酸分子(例如，通过使用捕获部分，诸如通过将ds核酸分子固定在固体支持物上并清洗去掉样品的其余部分来与样品中的其他核酸分子相分离)。标靶核酸分子的捕获可以在连接之前的任何时间(例如，在任何步骤)进行(例如，在杂交过程中、杂交后或核酸酶消化后，可以捕获或回收包含与标靶和CFS杂交的NPPF的复合物)。

随后，将CFS连接至标靶核酸，例如将5CFS的5'-磷酸酯(5′-phosphate)连接至标靶核酸分子的3'-端，并将3CFS的3'-端连接到标靶核酸分子的5'-端，从而产生经连接的标靶核酸分子(在本文中称为经连接的标靶)。在一些实例中，除了连接之外，还进行聚合步骤(例如与连接同时或在连接之后)。例如，聚合酶可用于替换CFS的核苷酸或被核酸酶无意地去除的标靶(即，通过ss特异性核酸酶倾向于在双链核酸的暴露末端“啃(nibble)”碱基)。将双链的NPPF:经连接的标靶核酸分子分离为其相应的ss核酸分子，从而产生ss NPPF和ss经连接的标靶核酸分子的混合物。在一些实例中，将双链的NPPF:经连接的标靶分离为其相应的ss核酸分子包括用DNA酶处理，例如，如果标靶分子是RNA，所述NPPF是DNA，并且3CFS和5CFS是RNA。在这样的实例中，所述ss NPPF被降解、消化、与所述ss经连接的RNA标靶分子分离，或以上的组合。在一些实例中，通过使用逆转录酶将ss经连接的RNA标靶分子转化为互补DNA(cDNA)。在一个实例中，可以通过用RNA酶H处理复合物来选择性去除NPPF:经连接的标靶的RNA链，所述RNA酶H选择性地去除DNA:RNA复合物的RNA部分(例如，如果标靶分子是DNA，NPPF是RNA，3CFS和5CFS是DNA)。替代核酸酶可用于降解DNA以与RNA分离，或者降解RNA以与DNA分离。任选地捕获经连接的标靶核酸分子(例如，通过使用捕获部分，诸如通过将经连接的标靶核酸分子固定在试管底部并清洗去掉不需要的其他分子来与其他核酸分子相分离)或以其他方式与ss NPPF分离，例如通过使用NPPF、5CFS或3CFS上的捕获部分。任选扩增经连接的标靶核酸分子(例如添加实验标签和/或测序衔接子)。对ss经连接的标靶核酸分子(或其扩增子)的至少一部分进行测序，从而确定样品中至少一种标靶核酸分子的序列。

本文还描述了可用于直接测序一种或多种标靶核酸分子的试剂盒。

由通过参考附图进行的以下详细描述，本公开的前述和其他目的和特征将变得更加明显。附图简要说明

图1A是显示示例性具有侧翼序列的核酸酶保护探针(NPPF)100的示意图。NPPF100包括具有与标靶核酸序列特异性结合/杂交的序列的区域102。NPPF还包括5'-侧翼序列104、3'-侧翼序列106或两者(示出了具有两者的实施方案)。

图1B是显示示例性具有侧翼序列的核酸酶保护探针(NPPF)120的示意图。在该实例中，NPPF 120由两个单独的核酸分子128、130组成，而不是如图1A中所示的单个核酸分子。NPPF 120包括具有与标靶核酸序列特异性结合/杂交的序列的区域122。NPPF还包括5'-侧翼序列124、3'-侧翼序列126或两者(示出了具有两者的实施方案)。

图2A是显示用于直接测序一种或更多种标靶核酸分子的说明性方法的步骤概述的示意图。(步骤1)将样品(例如细胞或FFPE组织)与样品破碎缓冲液相接触(例如以允许裂解样品中的细胞和组织)，并在允许NPPF 202与标靶200以及CFS 208、210特异性杂交的条件下，将样品与至少一种NPPF 202及其互补的5CFS 208和3CFS 210一起温育。(步骤2)用对ss核酸分子具有特异性的核酸酶(例如S1核酸酶)消化未结合的(例如，单链)核酸。(步骤3)将双链NPPF/标靶双链体214任选地捕获或者另外地从核酸酶反应混合物中除去(例如通过使用捕获部分212的捕获方法)。但是，如图2B-2D所示，包含标靶的核酸分子的捕获可以在较早的步骤中实现。例如通过添加连接酶，将CFS 208、210连接至标靶200，从而产生经连接的标靶216。任选地，所述连接反应可以包括聚合酶(例如DNA聚合酶)以进行填充反应以替换由核酸酶除去的任何核苷酸；聚合酶和连接酶可以同时或逐步加入。(步骤4)将NPPF/经连接的标靶双链体214分离为ss NPPF 202和ss经连接的标靶216。在一些实例中，为了分离NPPF/经连接的标靶双链体214，用核酸酶例如DNA酶处理双链体的NPPF。(步骤5)例如通过使用具有合适引物的PCR或RT-PCR，任选地扩增和聚合经连接的标靶216(图5)，然后测序。

图2B-2D是显示用于直接测序一种或多种标靶核酸分子的说明性方法的步骤概述的示意图，具有关于在连接之前于何处捕获或回收标靶的具体标注。图2B显示在杂交310期间可以发生一种或多种标靶核酸分子(例如，图2A中的200，诸如图2A中的214)的捕获320。图2C显示标靶的捕获420可以在核酸酶消化430之后发生。图2D显示标靶的捕获520可以在杂交510之后发生。

图3是显示在连接之前说明性5CFS 208、标靶200和3CFS 210的布置细节的示意图。虽然捕获部分212显示在5CFS 208上，但它可以替代地在3CFS 210或NPPF 202上。其他实施方案(未显示)涉及5CFS 208和标靶200，或标靶200和3CFS 210。

图4是显示5CFS 208和3CFS 210如何通过适当的5'磷酸酯基团连接到标靶200的示意图。

图5是显示在一些实施方案中，可以使用引物(箭头)扩增经连接的标靶并且降解NPPF200产生得到经连接的标靶扩增子226的示意图。所述引物可包括允许将测序衔接子218、220和/或实验标签222、224添加至经连接的标靶扩增子226的序列。

图6A-F是显示经连接的标靶分子的示例性实施方案的示意图，包括仅在经连接的标靶一端上具有CFS(A和B)的实施方案或在经连接的标靶的两端上具有CFS(C-F)的实施方案。

图7A是显示使用所公开的方法对七种不同标靶测序结果的柱状图。

图7B是显示使用所公开的方法对七种不同标靶滴定测序结果的柱状图。

图8是显示所公开的方法辨别单核苷酸变异的能力的柱状图。

图9提供了基因的实例，每个基因具有许多不同的突变，其可以用所公开的方法检测(例如同时或在相同的反应中)。在一些实例中，该基因的野生型版本和该基因的至少两个不同突变(例如2、3、4、5、6、7、8、9或10个不同突变)用单一NPPF检测(例如，参见图10)。

图10提供了示例性探针(显示的是与标靶核酸分子的区域互补的NPPF区域，即，未显示侧翼序列)(SEQ ID NO:1、8和17)，其中每个探针可以检测多个不同的点突变(参见红色核苷酸)以及野生型基因。NPPF序列下方显示的标靶序列不是NPPF将与之杂交的链，而是相反的链，因此说明了相对于待鉴定的标靶对NPPF序列所做的改变。请注意，NPPF序列是唯一的；它不与野生型或突变体序列共享100％的序列同一性。由上至下为SEQ ID NO:1-23。每个NPPF中错配的核苷酸是斜体(蓝色)。

图11A-11B是显示所公开的方法使用两种不同探针设计辨别(A)KRAS或(B)BRAF的单核苷酸变异的能力的柱状图。

图12是显示所公开的方法辨别已知基因组突变状态的细胞系内预期的靶核苷酸变异的能力的柱状图。

图13A-13B是显示所公开的方法一系列输入浓度下多重辨别核苷酸变异的能力的图。更详细地显示了(A)二十个扩增子或(B)两个扩增子的检测和线性。

图14是显示所公开方法辨别稀释系列中单核苷酸变异的能力的表格；显示了四种检测到的标靶中每一种的平均值、标准偏差和％CV。

图15是显示了所公开的方法辨别具有已知BRAF突变状态的临床FFPE样品中核苷酸变异的能力的柱状图。顶部的序列显示了BRAF靶序列(SEQ ID NO:62、63和64)。

图16A-16D是显示使用所公开的方法对RNA标靶测序结果的图。绘制了原始测序计数。(A)来自含有特定RNA寡核苷酸的样品的测序计数。(B)来自含有不同浓度(滴定)的特定RNA寡核苷酸的一组样品的测序计数。(C)含有组织裂解物的样品中存在的三种RNA靶的测序计数。测试了四种不同的样品输入滴定。(D)样品中存在的六种不同RNA靶的测序计数。

序列表

使用37C.F.R.1.822中定义的核苷酸碱基的标准字母缩写显示核酸和蛋白质序列。仅显示了每个核酸序列的一条链，但互补链应理解为包括在对所展示的链的任何引用中。在2017年2月9日创建的名为“seq listing”且内容大小为16KB的文本文件，其全部内容通过引用结合入本文。

SEQ ID NO:1显示了能在氨基酸600处检测多个BRAF编码序列的NPPF核酸序列。

SEQ ID NO:2显示了野生型人BRAF序列的一部分。

SEQ ID NO:3显示了编码V600E突变的BRAF序列的一部分。

SEQ ID NO:4显示了编码V600K突变的BRAF序列的一部分。

SEQ ID NO:5显示了编码V600R突变的BRAF序列的一部分。

SEQ ID NO:6显示了编码V600E2突变的BRAF序列的一部分。

SEQ ID NO:7显示了编码V600D突变的BRAF序列的一部分。

SEQ ID NO:8显示了能在氨基酸12处检测多个KRAS编码序列的NPPF核酸序列。

SEQ ID NO:9显示了野生型人KRAS序列的一部分。

SEQ ID NO:10显示了编码G12D突变的KRAS序列的一部分。

SEQ ID NO:11显示了编码G12V突变的KRAS序列的一部分。

SEQ ID NO:12显示了编码G12A突变的KRAS序列的一部分。

SEQ ID NO:13显示了编码G12C突变的KRAS序列的一部分。

SEQ ID NO:14显示了编码G12S突变的KRAS序列的一部分。

SEQ ID NO:15显示了编码G12R突变的KRAS序列的一部分。

SEQ ID NO:16显示了编码G13D突变的KRAS序列的一部分。

SEQ ID NO:17显示了能在氨基酸61处检测多个KRAS编码序列的NPPF核酸序列。

SEQ ID NO:18显示了野生型人KRAS序列的一部分。

SEQ ID NO:19显示了编码Q61E突变的KRAS序列的一部分。

SEQ ID NO:20显示了编码Q61R突变的KRAS序列的一部分。

SEQ ID NO:21显示了编码Q61L突变的KRAS序列的一部分。

SEQ ID NO:22显示了编码Q61H-C突变的KRAS序列的一部分。

SEQ ID NO:23显示了编码Q61H-T突变的KRAS序列的一部分。

SEQ ID NO:24显示了NPPF的5'-侧翼序列。

SEQ ID NO:25显示了NPPF的3'-侧翼序列。

SEQ ID NO:26显示了具有8个核苷酸区域的正向引物序列，其可用于包括实验标签(诸如SEQ ID NO:28、29、36、37、38、39、40、50、51或54)。

SEQ ID NO:27显示了具有6个核苷酸区域的反向引物序列，其可用于包括实验标签(诸如SEQ ID NO:30、31、32、33、34、35、41、42、43、44、45、46、47、48、49、52、53、55、56、57、58、59、60或61)。

SEQ ID NO:28至61显示了示例性实验标签序列。

SEQ ID NO:62显示了标靶野生型人BRAF序列的一部分。

SEQ ID NO:63显示了编码V600E突变的靶BRAF序列的一部分。

SEQ ID NO:64显示了编码V600E2突变的靶BRAF序列的一部分。

具体实施方式

除非另有说明，否则根据常规用法使用技术术语。分子生物学中常见术语的定义可参见Benjamin Lewin,Genes VII,published by Oxford University Press,2000(ISBN019879276X)；Kendrew et al.(eds.),The Encyclopedia of Molecular Biology,published by Blackwell Publishers,1994(ISBN 0632021829)；Robert A.Meyers(ed.),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,publishedby Wiley,John&Sons,Inc.,1995(ISBN 0471186341)；和George P.Rédei,EncyclopedicDictionary of Genetics,Genomics,and Proteomics,2nd Edition,2003(ISBN:0-471-26821-6)。

除非上下文另有明确规定，否则单数形式“a”、“an”和“the”指的是一个或多于一个。例如，术语“comprising an NPPF”包括单个或多个NPPF，并且被认为等同于短语“comprising at least one NPPF”。除非上下文另有明确说明，否则术语“or”是指所述替代元件的单个元件或两个或更多个元件的组合。如本文所用，“comprises”意指“includes”。因此，“comprising A or B”意指“including A,B,or A and B”，而不排除其他元素。

还应该理解的是，给出的核酸或多肽的所有碱基大小或氨基酸大小以及所有分子量或分子量值是近似的，并提供用以进行描述说明。尽管与本文中所描述的那些相类似或者相等同的方法和材料可用于实施或试验本公开，但下文则描述了适合的方法和材料。通过引用将本文提及的所有出版物、专利申请、专利以及其它参考文献以其全文并入，登记号也是如此(用于2016年2月11日提交的序列)。如有矛盾，以包括术语解释的本说明书为准。此外，所述材料、方法以及实施例仅是阐释性的，而无意进行限制。

除非另有说明，本公开的方法和技术一般按照本领域公知的以及如本说明书通篇引用和讨论的各种通用和更专业的参考文献中所描述的各种常规方法实施。参见，例如，Sambrook等，Molecular Cloning:A Laboratory Manual,2d ed.,Cold Spring HarborLaboratory Press,1989；Sambrook等，Molecular Cloning:A Laboratory Manual,3ded.,Cold Spring Harbor Press,2001,Ausubel等，Current Protocols in MolecularBiology,Greene Publishing Associates,1992(以及至2000的增补)；Ausubel等，ShortProtocols in Molecular Biology:A Compendium of Methods from Current Protocolsin Molecular Biology,4th ed.,Wiley&Sons,1999；Harlow和Lane,Antibodies:ALaboratory Manual,Cold Spring Harbor Laboratory Press,1990；以及Harlow和Lane,Using Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,1999。

I.概述

本公开提供了允许标靶核酸分子的直接测序的方法，该方法可以进一步多重(例如，检测单个样品中的多个标靶)或者适合于高通量(例如，检测多个样本中的标靶)或者多重和高通量(例如，检测多个样本中的多个标靶)。所公开的方法提供了对目前可用的测序方法的若干改进。例如，因为所述方法直接测序感兴趣的标靶核酸分子(或其扩增子)，而不是使用替代物，所以标靶的检测(例如点突变)可以更准确。此外，由于所公开的方法是针对性的，因此简化了数据分析，因为例如，测序仪输出可以与适用的NPPF序列(或适用的NPPF序列的互补序列)的相对较小的数据库比对，这避免了需要将测序仪输出与复杂的核酸数据库(例如，完整的基因组)和序列片段的组装进行比对并以鉴定标靶。也不需要长读取核苷酸，因为例如，被测序的经连接的标靶由相对较少的核苷酸组成(例如，与编码相同标靶的完整mRNA相比)，并且仅有足够数量的经连接的标靶的核苷酸是必须读取的(通常小于完整的经连接的标靶序列)以能与相对简单的参考数据库成功比对。此外，一些测序仪限制了可在单次测序运行中“读取”的核苷酸数量；通过减少鉴定感兴趣的标靶必须读取的核苷酸数量，可以从每次测序运行中获得更有用的数据。此外，可以简单地计算结果，而无需复杂的生物信息学分析。另外，因为该方法需要较少的标靶核酸分子加工，所以可以减少或消除由这种加工引入的偏差。例如，在一些目前的方法中，例如当标靶是RNA(例如mRNA和/或miRNA)时，方法通常采用从样品中分离或提取RNA的步骤，对其进行RT-PCR，连接RNA，或以上的组合。现有方法还可能需要耗尽或分离步骤以除去不需要的核酸分子，诸如tRNA和/或rRNA。在所公开方法的一些实施方案中，不需要这些步骤。结果，该方法允许人们分析一系列不适合检测测序的样品类型。此外，这样可以减少样品中RNA的损失，从而提供更准确的结果。

该方法可用于检测DNA或RNA，突变例如一种或多种基因融合、插入或缺失，串联重复，单核苷酸多态性(SNP)，单核苷酸变体和DNA甲基化状态。在一个实例中，该方法用于检测标靶核酸分子中的点突变。这样的突变可以是已知的突变，或使用所公开的方法新发现的突变。例如，该方法可用于检测单个标靶核酸分子或多个标靶核酸分子中的一个或更多个点突变(例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个或更多个点突变，诸如1、2、3、4、5、6、7、8、9、10个不同的点突变)。在一些实例中，每个不同的点突变被认为是不同的标靶核酸分子(例如，图10显示SEQ ID NO:1可用于检测六种不同的标靶核酸分子(SEQ ID NO:2-7)，包括野生型BRAF基因和其五种不同的突变体)。在一些实例中，该方法可用于检测两种或更多种不同标靶核酸分子中的一个或多个点突变。该方法使用核酸探针，在本文中称为包含侧翼序列的核酸酶保护探针(NPPF)，以及互补侧翼序列(CFS)。NPPF和CFS的使用允许多重，并且在一些实例中大致保留了经测序的标靶核酸分子的化学计量，因为CFS允许通用引物结合位点用于扩增并允许添加测序衔接子和实验标签(在3'-或者5'-端，或者例如同时在两端以增加多重)，而不显著改变化学计量。由于CFS可以是通用的，因此相同的引物可用于扩增与CFS连接的任何标靶核酸分子，从而允许多重化并且在一些实例中大致保存化学计量。

此外，引物(与CFS杂交)允许将标签添加到CFS最终连接到的标靶核酸分子上(例如实验标签以允许鉴定靶而无需对整个靶本身进行测序，或允许来自不同患者或不同实验的样品或以其他方式组合成单个测序运行，或者在3'-或5'-端，或同时在两端，例如以增加多重使用，以及测序衔接子以允许连接上特定测序平台所需的和形成用于某些测序平台的菌落所需的序列)。NPPF和CFS的使用还简化了被分析(例如，测序)的测序仪输入(也称为测序文库)的复杂性，因为测序文库包含感兴趣的标靶(或经连接的标靶扩增子)的已知部分而非整个标靶(或整个标靶的许多碎片)。当NPPF最终与经连接的标靶解离(例如，消化、切割、分离或其任何组合)时，最终测序的是经连接的标靶(或其扩增子)，而不是作为替代物的NPPF。与其他测序方法所需的相比，经连接的标靶(或经连接的标靶的扩增子)的测序简化了数据分析，减少了算法以简单地计算测序的经连接的标靶，而不是必须将序列与基因组匹配并对从标准测序方法获得的多个序列/基因进行去卷积。

在一个实例中，本公开提供了对样品中的至少一种标靶核酸分子进行测序的方法(例如至少2种、至少3种、至少4种、至少5种、至少10种、至少20种、至少30种、至少40种、至少50种、至少100种、至少500种、至少1000种、至少2000种或至少3000种标靶核酸分子)。在一些实例中，样品，例如包括核酸(诸如DNA和/或RNA)的样品被加热以使样品中的核酸分子变性，例如以允许NPPF与样品中的标靶核酸分子之间的后续杂交以及NPPF与其相应的CFS之间的杂交。在一些实例中，样品是裂解的样品(因此在一些实例中，该方法包括裂解样品)。在一些实例中，样品是经固定的样品(例如石蜡包埋的福尔马林固定(FFPE)样品、苏木精和伊红染色的组织，或戊二醛固定的组织)。例如，所述标靶核酸分子可以是经固定的、交联的或不可溶的。

在一些实例中，所公开的方法同时(simultaneously)或同期(contemporaneously)在多个样品中测序至少一种标靶核酸分子(例如至少两种不同的标靶核酸分子)。同时测序是指同一时间或基本上同一时间发生和/或在相同测序文库或相同测序反应中发生或在相同测序流通池或半导体芯片上进行的测序(例如，同期)。在一些实例中，事件在彼此的1微秒至120秒内发生(例如在0.5至120秒，1至60秒，或1至30秒，或1至10秒内)。在一些实例中，所公开的方法对样品中的两种或更多种标靶核酸分子进行测序(例如同时或同期)，例如使用(i)至少两种不同的NPPF，每种NPPF对不同的标靶核酸分子具有特异性，(ii)通过使用一种对多种不同标靶核酸分子具有特异性的NPPF(例如，图10显示SEQ ID NO:1(其是与标靶核酸分子的区域互补的NPPF的一部分))可用于检测六种不同的标靶核酸分子(SEQ ID NO:2-7)，包括野生型BRAF基因和五种不同的BRAF突变体；对KRAS可以给出类似的例子)，或(iii)以上的组合。在一个实例中，使样品与多种NPPF接触(例如至少2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000或更多种)，其中每种NPPF特异性结合特定的标靶核酸分子。例如，如果存在10种标靶核酸分子，则可以使样品与10种不同的NPPF接触，每种NPPF对10种标靶中的一种具有特异性。然而，在一些实例中，样品与至少一种NPPF接触(例如至少2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000或更多种)，其中每种NPPF特异性结合至少两种(例如至少2、3、4、5、6、7、8、9、10或更多种)不同的标靶核酸分子(例如野生型基因和野生型基因的一个或多个突变)。在一些实例中，使样品与一种或多种各自特异性结合特定的标靶核酸分子的NPPF相接触，并与一种或多种各自特异性结合至少两种不同的标靶核酸分子(例如野生型基因和野生型基因的一个或多个突变，例如参见图10)的NPPF相接触。在一个实例中，至少一种NPPF对miRNA标靶核酸分子是特异性的，并且至少一种NPPF对mRNA标靶核酸分子是特异性的。在一些实例中，将至少10种不同的NPPF与样品一起温育。然而，应当理解，在一些实例中，可以使用对单一标靶核酸分子特异的多于一种NPPF(例如2、3、4、5、10、20或更多种)，例如，对于相同标靶核酸的不同区域特异的NPPF群，或可以与标靶核酸及其变体(例如具有突变或多态性的那些)结合的NPPF群。例如，相对于以较高水平表达的核酸标靶，低表达的核酸标靶可具有更多与其杂交的NPPF，例如，四种NPPF与低表达的核酸靶杂交，一种NPPF与高表达的核酸靶杂交。因此，NPPF群可包括至少两个不同的NPPF群(例如2、3、4、5、10、20或50种不同的NPPF序列)，其中每个NPPF群体(或序列)特异性结合不同的标靶核酸分子。

该方法包括在足以使NPPF与标靶核酸分子特异性结合或杂交的条件下将样品与至少一种包括侧翼序列的核酸酶保护探针(NPPF)相接触。杂交是这样发生的过程，其中在两个核酸分子之间存在足够程度的互补性，使得在第一个核酸分子(例如，NPPF)和第二核酸分子(例如，核酸标靶和CFS)之间发生稳定和特异性结合(例如碱基配对)。NPPF分子包括5'-端和3'-端，以及其间与标靶核酸分子的全部或部分互补的序列。核酸序列的5'-端是末端残基的5'位置没有被核苷酸结合的位置。核酸分子的3'-端是没有与末端残基3'结合的核苷酸的末端。这允许NPPF和标靶核酸分子之间的特异性结合或杂交。例如，与标靶核酸分子的区域互补的NPPF区域以高特异性与标靶核酸分子的该区域结合或杂交。所述NPPF分子还包括一个或多个侧翼序列，其位于NPPF的5'-端和/或3'-端。因此，一个或多个侧翼序列位于与标靶核酸分子互补的序列的5'、3'或两端。每个侧翼序列包括几个连续的核苷酸，生成于样品中存在的核酸分子中未发现的序列(例如至少12个连续核苷酸的序列)。如果所述NPPF在5'-端和3'-端都包括侧翼序列，则在一些实例中，每个NPPF的序列是不同的并且彼此不互补。在一个实例中，所述NPPF(例如在一个或两个侧翼序列和/或与标靶核酸分子的全部或部分互补的区域的序列)包括至少一个dUTP，例如至少两个、至少三个、至少四个或至少五个dUTP(例如1、2、3、4、5、6、7、8、9或10个dUTP)。在一个例子中，NPPF中的所有“Ts”都被“U”代替。这些碱基的存在允许单链NPPF在后续步骤中用尿嘧啶DNA去糖基化酶(UDG)降解或破坏(例如，在来自经连接的标靶的NPPF变性之后，但在测序之前，例如在经连接的标靶扩增之前或期间)。在一个实例中，所述NPPF(例如在与标靶核酸分子的全部或部分互补的区域的序列中，或在侧翼区域的序列中)包括至少一个核苷酸错配，例如，所述核苷酸与标靶核酸分子不互补。例如，如图10所示，SEQ ID NO:1在位置12处含有“G”而不是“A”，SEQID NO:8在位置15处含有“G”而不是“A”，并且SEQ ID NO:17在位置13处含有“T”而不是“C”。在一些实例中，侧翼序列中不存在错配。在一些实例中，错配不存在于侧翼序列的两个碱基内(即，不在与标靶核酸分子的全部或部分互补的NPPF区域的5'-端或3'-端的两个碱基内)。在一些实例中，错配核苷酸不存在于侧翼序列和与标靶核酸分子的区域互补的NPPF区域之间的结合处，例如与该结合处相距10、11、12、13、14或15个核苷酸。在一些实例中，错配的存在允许人们将NPPF与标靶核酸分子区分开。

侧翼序列与互补侧翼序列(CFS)互补。CFS提供通用杂交/扩增序列，其与扩增引物的至少一部分互补。在一些实例中，所述CFS可包括(或允许添加)实验标签、测序衔接子或其组合。在一些实例中，至少一个侧翼序列包括至少一个dUTP。在一些实例中，NPPF包括两个侧翼序列，每个具有至少一个dUTP。在一些实例中，NPPF包括两个侧翼序列，但仅一个具有至少一个dUTP。在一些实例中，NPPF包括具有至少一个dUTP的单个侧翼序列。在一些实例中，该dUTP的位置靠近与标靶核酸分子区域互补的序列，例如与互补于标靶核酸分子区域的序列相隔1、2、3、4、5个碱基(例如在1、2、3、4、5个碱基内)。在一些实例中，该dUTP的位置距离与标靶核酸分子区域互补的序列至少两个碱基(例如至少3个、至少4个或至少5个碱基)。

该方法还包括让样品与对该侧翼序列有互补性的至少一个核酸分子(CFS)在足以让该CFS特异结合或杂交该NPPF的侧翼序列的条件下相接触。例如，如果该NPPF具有5′-侧翼序列，则让该样品与具有对该5′-侧翼序列有互补性的序列(5CFS)和5′-端磷酸酯的核酸分子在足以让该5′-侧翼序列特异结合该5CFS的条件下相接触。类似地，如果该NPPF具有3′-侧翼序列，则让该样品与具有对该3′-侧翼序列有互补性的的序列(3CFS)的核酸分子在足以让该3′-侧翼序列特异结合该3CFS的条件下相接触。在一个实例中，该3CFS和5CFS中的至少一个包括允许捕获、分开、回收或分离靶序列的捕获部分。本领域技术人员应理解，可将多个CFS用于保护侧翼序列，而不是采用单个CFS保护侧翼序列(例如，多个5CFS可用于保护5′-侧翼序列)。在一些实例中，所述标靶核酸分子为DNA，所述5CFS和所述3CFS为DNA，或者所述5CFS为DNA且所述3CFS为RNA。在一些实例中，所述标靶核酸分子为RNA，所述5CFS为DNA且所述3CFS为RNA，或者所述5CFS为RNA且所述3CFS为RNA。在一些实例中，所述标靶核酸分子为RNA或DNA，所述5CFS和/或所述3CFS为RNA-DNA杂交寡核苷酸，例如，其中所述5CFS的5'碱基或5'的数个碱基和/或所述3CFS的3'碱基或3'的数个碱基为RNA，而所述5CFS和所述3CFS的剩余部分为DNA。在一些实例中，一个或多个CFS包含对碱基的修饰，或对CFS的3'-或5'-端的修饰，例如硫代磷酸酯键，将导致锁核酸(LNA)的核苷酸(例如，用连接2'氧和4'碳的额外桥连接的核糖，或链终止子(如ddCTP或倒置T碱基))。

这导致产生结合至标靶核酸分子(或其部分)以及CFS的NPPF分子，由此产生包括NPPF的参与与标靶和CFS上的互补碱基杂交的碱基的双链分子。CFS杂交至其对应的侧翼序列并由此防止其对应的侧翼序列被随后步骤中的核酸酶消化。在一些实例中，每个CFS恰好为其对应的侧翼序列的长度。在一些实例中，所述CFS与其对应的侧翼序列完全互补。但是，本领域技术人员应理解，保护5′-端侧翼序列的5CFS的3′-端或保护3′-端侧翼序列的3CFS的5′-端可具有差异，例如在这些位置每一处的核苷酸错配、以上讨论的修饰或其组合。

在让标靶核酸分子和CFS结合NPPF后，所述方法还包括将样品与特异于单链(ss)核酸分子或核酸分子的ss区的核酸酶(例如S1核酸酶)在足以除去未杂交至互补碱基的核酸碱基的条件下相接触。因而例如，未结合至标靶核酸分子或CFS的NPPF以及未结合的单链标靶核酸分子、样品中其它ss核酸分子和未结合的CFS被降解。这产生了经消化的样品，其包括与5CFS、3CFS或二者以及标靶核酸的一部分杂交的以双链加合物存在的完整NPPF。在一些实例中，例如如果所述NPPF由DNA构成，则核酸酶可包括外切核酸酶、核酸内切酶或其组合。

随后，所述CFS可连接至标靶核酸，例如5CFS的5′-磷酸酯连接至标靶核酸分子的3′-端，并且3CFS的3′-端连接至标靶核酸分子的5′-端，由此产生经连接的标靶核酸分子(本文称为经连接的标靶或cNPPF)。在一些实例中，除了连接之外，将CFS暴露于聚合酶处理(例如，DNA聚合酶)，例如以替换在核酸酶处理期间可能已经除去的核苷酸。所述聚合酶处理可以在连接的同时进行，例如在相同的反应容器中进行。在一些实例中，所述聚合酶处理在连接之前进行。

将双链NPPF:经连接的标靶核酸分子分离成ss核酸分子(例如通过建立促进变性的环境，诸如加热(例如，在缓冲液中约95℃或在dH₂O中约50℃)、增加样品的pH，或用50％甲酰胺/0.02％洗涤剂处理，或这些处理的组合，从而产生ss NPPF和ss经连接的标靶核酸分子的混合物。在一个实例中，通过在50℃下在0.02％洗涤剂水溶液中洗涤三次，每次10分钟，将双链NPPF:经连接的标靶核酸分子分离成ss核酸分子。在一个实例中，通过在室温下用50％甲酰胺/0.02％洗涤剂洗涤，将双链NPPF:经连接的标靶核酸分子分离成ss核酸分子。在一些实例中，将双链NPPF:经连接的标靶分离成其相应的ss核酸分子包括用DNA酶处理，例如，如果标靶分子是RNA，NPPF是DNA，并且3CFS和5CFS是RNA。在这样的实例中，NPPF可以被降解、切割、消化、与经连接的RNA标靶分子分离，或以上的组合，从而允许经释放的ss经连接的标靶被进一步分析(例如扩增、逆转录、测序或以上的组合)。在一些实例中，将双链NPPF:经连接的标靶分离成其相应的ss核酸分子包括用RNA酶处理，例如，如果标靶分子是DNA，NPPF是RNA，并且3CFS和5CFS是DNA。在这样的实例中，NPPF可以被降解、切割、消化、与经连接的DNA标靶分子分离，或以上的组合，从而允许经释放的ss经连接的标靶被进一步分析(例如扩增、逆转录、测序或以上的组合)。任选地回收所述ss经连接的标靶核酸分子，例如通过将其捕获，例如通过杂交或使用捕获部分(例如，在5CFS或3CFS上)。在一些实例中，将ss NPPF和ss经连接的标靶核酸分子的混合物与尿嘧啶DNA脱糖基化酶(UDG)在足以切割或破坏具有至少一个dUTP(诸如2、3、4、5，或者6个或更多个dUTP)的ssNPPF的条件下一起温育。

该方法包括一个或更多个步骤，其例如通过使用NPPF、5CFS或3CFS使得能够捕获或回收待测序的靶。例如，如图2B至2D中所显示，这种捕获可发生在杂交期间、在核酸酶消化后，或在杂交之后，但在连接之前。图2A和2C显示了在核酸酶消化后完成捕获的实例。此外，可例如在连接后包括额外的捕获步骤。在一个实例中，将NPPF、5CFS或3CFS附着至固体基体(例如多孔板)，以允许在分子杂交至锚定的NPPF、5CFS或3CFS时捕获它们。在另一实例中，捕获部分(例如连接至标靶、NPPF、5CFS或3CFS的颗粒或标记)可用于将与含有该捕获部分的分子相连接的或杂交的分子与样品的其它组分物理地分开。取决于捕获方法，这些方法可包括离心以收集固体捕获部分、磁珠捕获、结合或杂交至固体支持物、过滤等。此外，这些捕获步骤可包括洗涤所捕获的核酸分子(由此让未捕获的分子，例如未杂交的NPPF和非杂交的CFS，被分开或除去)。这些方法可包括从固体支持物，例如多孔板的孔或单反应管或容器，释放捕获的核酸分子，或者捕获的核酸分子可保持粘附至固体支持物或保存在固体支持物内。在一些实例中，该步骤可包括离心，例如以便将标靶核酸分子捕获至容器或试管的底部，并洗涤以除去不希望的或不需要的试剂。在一些实例中，该步骤包括标靶核酸分子的磁珠捕获，并洗涤以除去不希望的或不需要的试剂。在一些实例中，该步骤包括过滤来捕获标靶核酸分子，并洗涤以除去不希望的或不需要的试剂。该步骤可包括洗涤标靶核酸分子，在一些实例中，其除去不再需要的试剂(例如，核酸酶)和/或允许标靶核酸分子悬浮在另一种溶液中，这在具体的方法实施方案中可能有助于一个或更多个后续步骤。

在一些实例中，该方法的多个步骤(例如显示在图2A中步骤的两个、三个或四个)在相同容器或器皿中进行。例如，所公开的方法使得期望的组分能够保留在相同容器中用于多个步骤，而不希望的或不需要的组分被去除(例如，采用重复捕获和洗涤步骤)。例如，可将待分析样品在容器中裂解。将适当的NPPF和CFS添加至该容器，将核酸酶添加至该容器，并且在该容器内捕获ds核酸分子(例如，用磁珠拉至容器底部)。洗涤所捕获的ds核酸分子以除去不希望的试剂，并将需要的缓冲剂或试剂添加至该容器(例如，连接酶缓冲剂)。然后可将ss经连接的标靶核酸分子捕获在容器中，并进行洗涤。

任选地例如采用PCR扩增来扩增连接的标靶核酸分子。这样的方法可用于向经连接的标靶添加实验标签和/或测序衔接子，和/或增加该经连接的标靶的拷贝数。对该ss经连接的标靶核酸分子(或其扩增子)的至少一部分测序，由此确定样品中该至少一种标靶核酸分子的序列。在一些实例中，所述标靶核酸分子为RNA，并该方法包括在测序前将它们逆转录为DNA。

经连接的标靶可采用一个或更多个扩增引物来扩增，由此产生经连接的标靶扩增子。至少一个扩增引物包括与连接至标靶的CFS互补的区域。在一些实例中，所述标靶在其5′-端连接至5CFS，在其3′-端连接至3CFS，并且使用两个扩增引物，其中一个扩增引物具有与该5CFS的区域相同的区域，另一个扩增引物具有与该3CFS的区域互补的区域。在一些实例中，所述标靶分别在其5′-端和3′-端连接至5CFS或3CFS，并且使用一个扩增引物(例如使用快速扩增或cDNA末端)，其中该扩增引物具有与该5CFS或3CFS的区域互补的区域。扩增引物中的一个或两个都可包括允许在扩增期间将实验标签和/或测序衔接子连接至经连接的标靶扩增子的序列，并且可标记一个或两个引物以允许标记该NPPF扩增子。在一些实例中，实验标签和测序衔接子都添加，例如在经连接的标靶扩增子的相对末端。例如，这些引物的使用可产生从经连接的标靶扩增子的5′-端或3′-端或者从5′-端和3′-端延伸的实验标签和/或测序衔接子，以增加可能的多重(multiplexing)程度。该实验标签可包括允许鉴定样品、受试者或标靶核酸序列的独特核酸序列。该测序衔接子可包括允许将获得的经连接的标靶扩增子捕获在测序平台上的核酸序列。在一些实例中，在测序前从混合物除去引物。

对经连接的标靶或经连接的标靶扩增子(或其部分)测序。任何方法都可用于对所述经连接的标靶或经连接的标靶扩增子测序，并且本公开不限于具体的测序方法。在一些实例中，所用的测序方法为链终止测序、染料终止测序、焦磷酸测序、纳米孔测序或大规模平行测序(也称为下一代测序(或NGS))，这通过ThermoFisher Ion Torrent^TM PersonalGenome Machine(PGM^TM)、Illumina-branded NGS测序仪(例如，MiSeq^TM,HiSeq^TM)(或以其它方式源自Solexa^TM测序的)以及可从Roche Life Sciences获得的454测序来举例说明。在一些实例中，使用单分子测序。在一些实例中，该方法还包括将获得的标靶序列与序列数据库比较，例如以确定是否存在靶突变。在一些实例中，该方法包括确定每个获得的标靶序列的数量(例如计数)。在一些实例中，该方法包括确定获得的每个靶序列的数量(例如，计数)(例如，野生型、SNP、新鉴定的变体等)，例如使用bowtie、bowtie2或TMAP序列比对。在一些实例中，该方法包括将测序结果与合适的基因组(例如，如果标靶核酸分子是人基因，则合适的基因组是人基因组)或其部分进行比对。在一个实例中，该方法包括仅对准预期的标靶序列比对，但列举与预期序列和预期序列内任何变化的匹配。

II.标靶核酸分子的直接测序方法

本文公开了对样品中存在的一种或多种标靶核酸分子进行直接测序的方法。在一些实例中，在相同样品或相同测定中检测至少两种不同的标靶核酸分子。在一些实例中，在至少两个不同的样品或测定中(例如，在来自不同患者的样品中)检测相同的标靶核酸分子。因此，所公开的方法可以是多重(例如，检测单个样本中的多个标靶)、高通量(例如，检测多个样本中的标靶)，或者同时是多重和高通量(例如，检测多个样本中的多个标靶)。

在所公开的方法中，在NPPF与其标靶和相应的CFS杂交，核酸酶消化后，CFS被连接至标靶(并且在一些实施例中用聚合酶处理)，产生经连接的标靶。然后分离ds NPPF:经连接的标靶(例如，变性)，产生ss NPPF和ss经连接的标靶。在一些实例中，例如通过使用3CFS或5CFS上的捕获部分，ss经连接的标靶被回收或捕获(例如，从NPPF分离)。在一些实例中，ss经连接的标靶被扩增，例如通过使用具有与CFS互补的区域的引物(并且可以包括允许将实验标签和/或测序衔接子并入所述经连接的标靶的序列)。然后可以直接对该ss经连接的标靶进行测序(或者可以对其扩增子进行测序)。在一些实例中，所公开的方法提供经测序的核酸分子，其与测试样品中的核酸分子的相对量相似，例如变化不超过20％、不超过15％、不超过10％、不超过9％、不超过8％、不超过7％、不超过6％、不超过5％、不超过4％、不超过3％、不超过2％、不超过1％、不超过0.5％，或不超过0.1％，例如0.001％-5％、0.01％-5％、0.1％-5％或0.1％-1％。

图1A和1B是显示示例性NPPF的示意图。如图1A所示，具有至少一个侧翼序列的核酸酶保护探针(NPPF)100包括区域102，所述区域102包括与标靶核酸序列(例如，标靶核酸序列的至少一部分)特异性结合(例如，杂交)的序列。包括与标靶核酸序列特异性结合(例如，杂交)的序列的区域102或侧翼序列104、106可包括故意的核苷酸错配(即，核苷酸分别不与标靶序列或CFS中的相应核苷酸互补)，例如，允许人们将NPPF与标靶分子区分开来。所述标靶核酸序列可以是DNA(例如基因组DNA或cDNA)或RNA(例如mRNA、miRNA、tRNA、siRNA)，或两者(both)。所述NPPF包括一个或更多个侧翼序列104和106。图1A显示具有5'-侧翼序列104和3'-侧翼序列106的NPPF 100。然而，在一些实例中，NPPF仅具有一个侧翼序列(例如，仅104或106中的一个)。在一些实例中，NPPF 100包括至少一个dUTP，诸如在侧翼序列104、106中的至少一个中，例如以允许NPPF 100的降解。图1A显示了作为单个核酸分子的示例性NPPF 100。图1B显示了示例性NPPF 120，其由两个不能连接在一起的独立核酸分子128、130组成。例如，如果NPPF 100是100-mer，则NPPF 120可以是两个50-mer。类似于图1中所示的NPPF 100，NPPF 120包括区域122，所述区域122包括与标靶核酸序列(例如，标靶核酸序列的至少一部分)特异性结合(例如，杂交)的序列，以及一个或更多个侧翼序列124和126。由两个独立的核酸分子组成的NPPF(图1B)的用途可用于减少由于不完全核酸酶消化引起的背景信号。

图2A是显示使用NPPF 202对核酸分子进行测序的公开方法的实施方案概述的示意图。如步骤1中所示，将样品(诸如已用样品破坏缓冲液处理过(例如，裂解或以其它方式处理以使核酸易于获得)的已知含有或怀疑含有标靶核酸200的样品)与多种具有一个或更多个侧翼序列的核酸酶保护探针(NPPF)202(此处显示的是具有5'-和3'-侧翼序列，分别为204和206)，其中包括至少一个与第一标靶核酸200特异性结合的NPPF，相接触或温育。在一些实例中，至少一种NPPF 202可以结合至多种标靶核酸分子，诸如特定基因的野生型和变体序列(例如，参见图10)。该反应还可以包括与第二标靶核酸(或多个另外的标靶核酸分子)特异性结合的其他NPPF，等等。在一个实例中，所述方法使用一种或多种设计为对每种独特的标靶核酸分子具有特异性的不同NPPF。因此，100种不同核酸标靶(例如，基因或基因表达产物)的测量可以使用至少100种不同的NPPF，对每种标靶至少一种NPPF具有特异性(诸如几种不同的NPPF/标靶)。在另一个实例中，该方法使用设计为对多种标靶核酸分子，例如野生型基因及其变体具有特异性的一种或多种不同NPPF。因此，多个不同核酸标靶的测量可以使用单一NPPF。在一些实例中，这两种类型的NPPF的组合用于单一反应。因此，该方法可以使用至少2种不同的NPPF、至少3种、至少4种、至少5种、至少10种、至少25种、至少50种、至少75种、至少100种、至少200种、至少500种、至少1000种、至少2000或至少2000种不同的NPPF(例如2至500种、2至100种、5至10种、2至10种、2至20种、100至500种、100至1000种、500至5000种或1000至3000种不同的NPPF)。此外，人们会理解在某些例子中，所述多种NPPF可包括不止一种(例如2、3、4、5、10、20、50或更多种)特异于单一标靶核酸分子的NPPF(其称为NPPF的平铺集(tiled set))。该反应还包括与侧翼序列互补的核酸分子(CFS)208、210。因此，如果该NPPF具有5′-侧翼序列204，则反应将包括与该5′-侧翼序列互补的序列(5CFS)208，并且如果该NPPF具有3′-侧翼序列206，则反应将包括与该3′-侧翼序列互补的序列(3CFS)210。在一些实例中，该5CFS 208具有5′-端磷酸酯(例如参见图3)，使得能够在随后步骤中连接至靶200。在一些实例中，CFS中的至少一个包括捕获部分212，其允许在期望的时间回收靶。尽管所述捕获部分212显示在5CFS 208中，但是应理解，在其存在的实施方案中，其可选地处于3CFS210、NPPF 202或标靶200上。本领域技术人员应理解，所述CFS的序列将随存在的侧翼序列而变化。另外，可将不止一个CFS用来保证侧翼序列被保护(例如，可使用结合单一侧翼序列的不同区域的至少两个CFS)。所述CFS可包括天然或非天然碱基。

图3显示了关于5CFS 208、标靶200和3CFS 208的取向的进一步细节(例如，相对于每个分子的5'-和3'-端)。如上文针对图2所讨论的，图3中的捕获部分212是任选的，或者可以在3CFS 210或靶200上。将样品、NPPF和CFS在足以让NPPF特异结合(例如杂交)至它们各自的标靶核酸分子以及让CFS结合(例如杂交)至NPPF侧翼序列上它们的互补序列的条件下一起温育。在一些实例中，添加CFS 208、210量超过NPPF 202，例如CFS比NPPF至少2倍(摩尔过量)，诸如CFS比NPPF至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少20倍、至少40倍、至少50倍或至少100倍。在一些实例中，添加NPPF 202量超过样品中的总核酸分子，例如NPPF比样品中的总核酸分子至少50倍(摩尔过量)，例如NPPF比样品中的总核酸分子至少75倍、至少100倍、至少200倍、至少500倍或至少1000倍。为了实验方便，可包括相似浓度的每种NPPF以形成混合物，这样对于所测量的最丰富核酸靶来说，将有至少50倍的NPPF针对该核酸靶，例如至少过量100倍。所用的全部NPPF的实际过量和总量仅由破坏未与标靶核酸靶杂交的全部NPPF的核酸酶(例如，S1核酸酶)的能力所限制。在一些实例中，该反应是加热的，例如在50℃温育过夜(例如16小时)。

如图2A中步骤2显示的，在允许结合/杂交反应发生之后，将样品与特异于单链(ss)核酸分子的试剂(例如，核酸酶)在足以除去(或消化)ss核酸分子，诸如未结合的核酸分子(例如保持单链的未结合的NPPF、未结合的CFS和未结合的标靶核酸分子或这些分子的一部分，例如未结合NPPF的标靶核酸分子的部分)的条件下相接触。这导致产生ds NPPF/标靶杂交复合体(或双链体)214。如图2A中显示，将样品与特异于ss核酸分子的核酸酶一起温育导致存在的任何ss核酸分子的降解，留下完整的双链核酸分子，包括已结合的NPPF以及CFS和标靶核酸分子。例如，反应可用S1核酸酶在50℃温育1.5小时(尽管水解可在其它温度下发生和可进行其它时长，并且一定程度上，所需的时间和温度将是核酸酶的量、需要水解的核酸的量以及被保护的双链区域的T_m的函数)。

如图2A步骤3中所显示，NPPF/标靶复合体214(有时在连接前被捕获或回收，参见图2B至2D，未杂交材料被去除)暴露于连接条件，其使得靶序列200(其可为DNA或RNA)能够连接至CFS(例如连接至5CFS 208、3CFS 210或二者)，由此产生经连接的标靶216。可使用能够共价连接靶序列和CFS的任何连接酶，例如T4DNA连接酶、T4RNA连接酶或Taq连接酶。使用的连接酶可取决于CFS上存在的最接近标靶序列的核苷酸(核糖核苷酸或脱氧核糖核苷酸)。图4显示了经连接的元素的更详细视图。5CFS 208可包括5′-端磷酸酯，其可连接至靶200的3′-端。3CFS 210可包括3′-端(例如，3′-端核苷酸)，其可连接至标靶的5′-端磷酸酯。3CFS 210可在寡核苷酸的5'-端附近(但不在5'-端)包含内部生物素化的T，其允许与链霉亲和素珠子或其他固体支持物结合。或者，5CFS 208可在寡核苷酸的3'-端附近(但不在3'-端)包含内部生物素化的T，从而允许与链霉亲和素珠子或其他固体支持物结合。尽管示出了两个CFS，但是本公开还预期了单个CFS实施例。如果仅一个侧翼序列存在于NPPF上，则仅一个CFS将结合在NPPF/标靶复合体中，并且标靶将仅连接至一个CFS。该CFS可以是DNA或RNA(或两核苷酸类型的混合体)。如果该CFS或标靶为DNA，则用于连接至DNA的5′-端磷酸酯供体不能是核糖核苷酸。在一个实例中，如果标靶为RNA，则5CFS 208是DNA或RNA并且3CFS210是RNA。在一个实例中，如果标靶是DNA，则5CFS 208是DNA(或者至少5CFS 208的5'-端核苷酸是将连接至标靶的3'-端的dNTP)或RNA并且3CFS 210是RNA。

在一些实例中，除了连接之外，图2A的步骤3还包括聚合步骤。例如，聚合可以在连接的同时(例如，在相同的反应中)进行，或在连接之前进行。这可以允许在核酸酶步骤期间无意中从CFS或标靶中去除的核苷酸被恢复。在一些实例中，使用的聚合酶不具有显著的链置换活性或5'-3'核酸外切酶能力(其可以去除和替换与探针杂交的标靶，而不是简单地替换缺失的碱基)。在一个实例中，在dNTP存在下使用DNA聚合酶，例如T4或T7DNA聚合酶或不含核酸外切酶的热稳定聚合酶。在一个实例中，所述聚合酶不是Taq聚合酶(除非它缺乏核酸外切酶活性)。在一个实例中，使用RNA聚合酶，例如大肠杆菌RNA聚合酶，其中添加了rNTP。如果使用RNA聚合酶，该方法可以进一步包括逆转录步骤(例如，在下文讨论的经连接的标靶216的PCR扩增时)。在一些实例中，例如，如果标靶包括DNA和RNA，则使用DNA聚合酶和RNA聚合酶。

如图2A的步骤4所显示的，在CFS连接至标靶后，NPPF 202与经连接的标靶216分开。即，NPPF/标靶复合体214(例如，双链核酸分子)分开为两个单链核酸分子NPPF 202和经连接的标靶216。在一些实例中，NPPF 202用DNA酶处理，从而允许其与经连接的标靶216分离。在这样的实例中，NPPF 202可以是DNA，标靶200是RNA，5CFS 208是RNA以及3CFS 210是RNA。在一些实例中，NPPF 202用RNA酶处理，从而允许其与经连接的标靶216分离。在这样的实例中，NPPF 202可以是RNA，标靶200是DNA，5CFS 208是DNA以及3CFS 210是DNA。该步骤还除去未连接的核酸分子(例如，未连接的CFS)。例如，可在允许NPPF 202从经连接的标靶216解离的条件下对该反应加热或调整pH(例如，导致该反应具有碱性pH)，产生单链NPPF 202和单链经连接的标靶216的混合群体。在一些实例中，将DNA酶添加到反应中以允许由DNA组成的NPPF 202被降解、消化、切割、分离或其任何组合，这允许经连接的标靶216(在该实例中可以是RNA)从NPPF 202释放或分离。在一些实例中，将RNA酶添加到反应中以允许由RNA组成的NPPF 202被降解、消化、切割、分离或其任何组合，这允许经连接的标靶216(在该实例中可以是DNA)从NPPF202释放或分离。在一些实例中，采用CFS上的捕获部分212将所述经连接的标靶与该混合物分离。本文描述的捕获方法可用于捕获经连接的标靶216。例如，如果捕获部分212是珠子，可采用离心回收经连接的标靶216。如果捕获部分212是金属珠子，可采用磁体回收经连接的标靶216。如果捕获部分212包括羧基基团，可采用适当的标记胺的固体基质捕获经连接的标靶216。在捕获经连接的标靶216后，可(例如，通过洗涤)除去反应的剩余物(例如，NPPF 202)。在一些实例中，采用过滤捕获所述经连接的标靶216。

如图2A的步骤5所显示的，接着可对分离的经连接的标靶216(或其扩增子)测序。在一些实例中，多个经连接的标靶平行测序，例如同时或同期测序。该方法因此可用于对多个经连接的标靶序列测序。

任选地，经连接的标靶216在测序前(例如，采用PCR)进行扩增、洗涤或二者都进行。在一些实例中，例如如果至少一个侧翼序列(例如，图1A的104、106)或捕获序列(例如，图1A的102)包括dUTP(参见图5)，则用尿嘧啶DNA脱糖基化酶(UDG)降解NPPF 202。这种降解可在扩增前或扩增期间发生。在一些实例中，例如如果标靶是RNA，则可将逆转录步骤作为扩增的一部分包括进来。因此，随后可对得到的经连接的标靶扩增子226测序。图5显示了作为箭头的PCR引物或探针。PCR引物或探针可包括一个或更多个实验标签222、224和/或测序衔接子218、220(例如，允许经连接的标靶被特定的测序平台测序，并因此这些衔接子与测序芯片上的捕获序列互补)。PCR引物/探针的至少一部分特异于5CFS 208和/或3CFS 210。在一些实例中，引物的浓度超过经连接的标靶216，例如过量至少10,000倍、至少50,000倍、至少100,000倍、至少150,000倍、至少200,000倍、至少400,000倍、至少500,000倍、至少600,000倍、至少800,000倍或至少1,000,000倍。在一些实例中，反应中引物208的浓度为至少200nM(例如至少400nM、至少500nM、至少600nM、至少750nM或至少1000nM)。

如图2B至2D中显示的，在连接前的时间点(例如，图2A的步骤3)，将标靶(图2A的200)和与其连接/杂交的其它分子回收或捕获(步骤320)，由此使得能够除去样品中的剩余试剂(例如，未杂交材料)并添加新试剂。此外，对标靶的捕获使得能够随后对与该标靶杂交的或以其它方式连接至该标靶的核酸分子进行洗涤(例如，失活或除去残留的酶)。

在一个实例中，所述标靶在杂交时被回收或捕获(图2B)。如图2B中显示的，在任选的变性300后，让含有标靶的样品与NPPF和CFS在允许杂交310的条件下一起温育，由此产生杂交的复合体。在这样的实例中，将标靶连同将与其杂交的NPPF以及可杂交该NPPF的CFS在固体支持物存在下杂交，所述固体支持物含有能够捕获产生的杂交复合体320的材料。例如，存在于3CSF、5CSF和/或NPPF上的捕获部分(例如，图2A中的212)可用作所述固体支持物。例如，如果所述捕获部分是珠子(bead)或板(plate)(例如，采用羧基-胺键，例如CFS上的氨基基团和珠子上的羧基连接至CFS)，则所述固体支持物是珠子或板。这种情况下，所述捕获部分/固体支持物使得杂交复合体结合至所述固体支持物(例如，因为NPPF将杂交至附着于固体支持物的CFS，并且标靶和其它CFS将杂交至该NPPF)。所述方法包括杂交后的洗涤步骤。一个或更多个随后的步骤，例如核酸酶消化330、洗涤340、连接350、UDG消化370(任选地，仅如果该NPPF包括dUTP)和/或PCR扩增380，可在固体支持物存在下进行，其使得试剂能够去除或添加至被捕获的标靶。

在一个实例中，在核酸酶处理后(例如，在图2A中步骤2后)但连接前(例如图2A中步骤3之前)回收或捕获标靶(图2C)。如图2C中显示的，在任选的变性400、杂交410和核酸酶消化430(其产生NPPF/标靶复合体(图2A中的214))后，在步骤420将所述NPPF/标靶复合体从样品混合物回收。在一些实例中，通过使用CFS上的捕获部分回收所述NPPF/标靶复合体，无需将所述NPPF/标靶双链体分开成ss核酸分子。例如，存在于3CSF、5CSF和/或NPPF上的捕获部分(例如，图2A中的212)可用作所述固体支持物。例如，如果所述捕获部分是珠子或板(plate)(例如，采用羧基-胺键合，例如CFS上的氨基基团和珠子上的羧基连接至CFS)，则所述固体支持物是珠子或板。这种情况下，所述捕获部分/固体支持物是NPPF/标靶复合体的一部分，其允许对其捕获或回收。所述方法可包括回收后的洗涤步骤440。一个或更多个随后的步骤，例如连接450、洗涤460、UDG消化470(任选地，仅如果该NPPF包括dUTP)和/或PCR扩增480，可在固体支持物存在下进行，其使得试剂能够去除或添加至被捕获的标靶。

在一个实例中，在杂交后(例如，在图2A中步骤1后)但核酸酶消化前(例如图2A中步骤2之前)回收或捕获靶(图2D)。如图2D中显示的，在任选的变性500和杂交510(其产生杂交复合体)后，在步骤520将该得到的杂交复合体从样品混合物回收。在一些实例中，该杂交复合体通过使用CFS上的捕获部分回收。例如，存在于3CSF、5CSF和/或NPPF上的捕获部分(例如，图2A中的212)可用作所述固体支持物。例如，通过所述捕获部分是珠子或板(plate)(例如，采用羧基-胺键合，例如CFS上的氨基基团和珠子上的羧基连接至CFS)，则所述固体支持物是珠子或板。这种情况下，所述捕获部分/固体支持物是杂交复合体的一部分，其允许对其捕获或回收。该方法可包括回收后的洗涤步骤。一个或更多个随后的步骤，例如核酸酶消化530、连接550、洗涤540、560、UDG消化570(任选地，仅如果该NPPF包括dUTP)和/或PCR扩增580，可在固体支持物存在下进行，其使得试剂能够去除或添加至被捕获的标靶。

A.示例性杂交条件

本文公开了足以使NPPF或多种NPPF与标靶核酸分子，例如来自受试者的样品中存在的DNA和RNA特异性杂交的条件，以及与互补于侧翼序列的CFS特异性杂交的条件。在一些实例中，多种NPPF包括至少2种、至少5种、至少10种、至少20种、至少100种、至少500种、至少1000种、或至少3000(例如2至5000种、2至3000种、10至1000种、50至500种、25至300种、50至300种、10至100种、50至100种、500至1000或1000至5000)独特的NPPF序列。

杂交是互补的单链DNA、RNA或DNA/RNA杂交体形成双链体分子(也称为杂交复合物)的能力。例如，可以基于本公开确定能够使核酸(例如，NPPF)在选定的严格条件下与另一种核酸(例如，靶DNA或靶RNA或CFS)杂交，同时使与其他物质或分子的非特异性杂交最小化的特征(例如长度，碱基组成和互补程度)。“特异性杂交”和“特异性互补”是指示以下的术语，即足够程度的互补性使得在第一核酸分子(例如，NPPF)和第二核酸分子(诸如核酸标靶，例如DNA或RNA标靶，或CFS)之间发生稳定和特异性结合。所述第一和第二核酸分子不需要100％互补即可特异性杂交。特异性杂交在本文中也称为“特异性结合”。导致特定严格程度的杂交条件将根据杂交方法的性质和杂交核酸序列的组成和长度而变化。通常，杂交温度和杂交缓冲液的离子强度(例如Na⁺浓度)将决定杂交的严格性。在Sambrook等，(1989)Molecular Cloning,second edition,Cold Spring Harbor Laboratory,Plainview,NY(第9和11章)中讨论了关于达到特定严格程度的杂交条件的计算。

NPPF的特征将在下面的第III节中详细讨论。通常，NPPF的区域将具有与其相应的标靶核酸分子具有足够的互补性以使其能够在选定的严格杂交条件下杂交的核酸序列(例如，图1A，102)，以及与其相应的CFS具有足够的互补性以使其能够在选定的严格杂交条件下杂交的区域(例如，图1A，104、106)。在一些实例中，NPPF与其靶序列具有至少90％、至少92％、至少95％、至少98％、至少99％或100％的互补性。示例性杂交条件包括在约37℃或更高温度下的杂交(例如约37℃、42℃、50℃、55℃、60℃、65℃、70℃、75℃或更高，例如45-55℃或48-52℃)。可以改变的杂交反应参数包括盐浓度、缓冲液、pH、温度、温育时间、变性剂如甲酰胺的量和类型。例如，可以在缓冲液(例如含有NaCl、KCl、H₂PO₄、EDTA、0.05％TritonX-100或其组合的缓冲液)如裂解缓冲液中将核酸(例如，多种NPPF)以约10pM至约10nM的浓度(例如约30pM至5nM、约100pM至约1nM，例如1nM NPPF)添加至样品中。

在一些实例中，NPPF的添加量超过样品中相应的标靶核酸分子，例如，与样品中相应的标靶核酸分子相比至少10倍、至少50倍、至少75倍、至少100倍、至少250倍、至少1,000倍、至少10,000倍、至少100,000倍、至少1,000,000倍，或者至少10,000,000倍摩尔过量或更多的NPPF。在一个实例中，将每种NPPF以至少10pM，例如至少20pM、至少30pM、至少50pM、至少100pM、至少150pM、至少200pM、至少500pM、至少1nM，或至少10nM的终浓度添加至样品。在一个实例中，将每种NPPF以约30pM的终浓度添加到样品中。在另一个实例中，将每种NPPF以约167pM的终浓度添加到样品中。在再一个实例中，将每种NPPF以约1nM的终浓度添加到样品中。在再一个实例中，每种NPPF以每μl至少约100,000,000、至少300,000,000或至少约3,000,000,000个拷贝添加至样品。在一些实例中，CFS的添加量超过NPPF，例如相对于NPPF至少2倍、至少3倍、至少4倍、至少5倍或至少10倍摩尔过量的CFS。在一个实例中，每种CFS以最终浓度约为探针量的至少6倍，例如探针量的至少10倍或至少20倍(例如探针量的6至20倍)添加到样品中，在一个示例中，每种CFS(例如，5CFS和3CFS)以至少1nM、至少5nM、至少10nM、至少50nM、至少100nM，或至少200nm，例如1至100、5至100或5至50nM进行添加。例如，如果有六种探针，每种探针为166pM，则每种CFS可以以5到50nM进行添加。

在杂交之前，使样品中的核酸变性，使它们成为单链并可供用于杂交(例如在约95℃至约105℃持续约5-15分钟，例如95℃持续10分钟)。通过使用不同的变性溶液，可以改变该变性温度，只要温度和缓冲液组合物的组合导致形成单链靶DNA或RNA或两者。然后将样品中的核酸和5CFS、3CFS或两者与多个NPPF杂交约10分钟至约72小时(例如，至少约1小时至48小时、约2至16小时、约6小时至24小时、约12小时至18小时、约16小时或过夜，例如2至20小时)，温度范围为约4℃至约70℃(例如，约37℃至约65℃、约42℃至约60℃，或约50℃至约60℃，例如50℃)。在一个实例中，杂交在50℃下进行2至20小时。杂交条件将根据所使用的特定NPPF和CFS而变化，但设定为确保NPPF与标靶分子和CFS的杂交。在一些实例中，将多个NPPF和CFS与样品在至少约37℃、至少约40℃、至少约45℃、至少约50℃、至少约55℃、至少约60℃、至少约65℃，或至少约70℃的温度下温育。在一个实例中，将多个NPPF和CFS与样品在约37℃、约42℃或约50℃下温育。

在一些实施方案中，所述方法不包括核酸纯化(例如，在将样品与NPPF和CFS接触之前不进行核酸纯化和/或在将样品与NPPF和CFS接触之后不进行核酸纯化)。在一些实例中，除细胞裂解外，不需要预处理样品。在一些实例中，细胞裂解和将样品与多个NPPF和CFS接触依顺序发生。在其他实例中，细胞裂解和将样品与多个NPPF和CFS接触同时发生，在一些非限制性实例中，没有任何中间步骤。

B.用核酸酶处理

在NPPF与样品中的标靶核酸以及CFS杂交后，对所述样品进行核酸酶保护程序。与NPPF杂交的标靶核酸分子和CFS(一个或两个CFS，取决于NPPF上是否存在5'-和3'-侧翼序列二者或仅其中一个)不会被核酸酶水解，并且可以随后进行测序(并任选地扩增)。

核酸酶是切割磷酸二酯键的酶。核酸内切酶切割核苷酸链中的内部磷酸二酯键(与核酸外切酶相反，核酸外切酶切割在核苷酸链的末端的磷酸二酯键)。因此，核酸内切酶、核酸外切酶及其组合可用于所公开的方法中。核酸内切酶包括限制性核酸内切酶或其他位点特异性核酸内切酶(在序列特异性位点切割DNA)、DNA酶I、胰腺RNA酶、Bal 31核酸酶、S1核酸酶、绿豆核酸酶、核糖核酸酶A、核糖核酸酶T1、RNA酶I、RNA酶PhyM、RNA酶U2、RNA酶CLB、微球菌核酸酶(micrococcal nuclease)和脱嘌呤/脱嘧啶核酸内切酶。核酸外切酶包括核酸外切酶III和核酸外切酶VII。在特定实例中，核酸酶对单链核酸是特异性的，例如S1核酸酶、P1核酸酶、绿豆核酸酶或BAL 31核酸酶。这些酶的反应条件在本领域中是公知的，并且可以凭经验进行优化。

用一种或多种核酸酶处理可破坏所有ss核酸分子(样品中未与NPPF杂交(因此不受其保护)的RNA和DNA，未与标靶核酸杂交的NPPF，以及未与NPPF杂交的CFS)，但不会破坏ds核酸分子，例如与CFS和样品中存在的标靶核酸分子杂交的NPPF。例如，如果样品包括细胞提取物或裂解物，则不需要的核酸，例如一种或多种非靶基因组DNA(例如变性基因组DNA)、tRNA、rRNA、mRNA、miRNA，以及未与互补NPPF序列杂交的标靶核酸分子的部分(例如突出端)，在mRNA或DNA核酸标靶的情况下将构成核酸靶序列的大部分，在该步骤中可以基本上被破坏。在一些实施方案中，该步骤留下大约化学计算量的标靶核酸/CFS/NPPF双链体。如果标靶分子与由固定产生的组织相交联，则在一些实施方案中，NPPF与交联的标靶分子杂交不需要逆转交联，或以其他方式从与其交联的组织释放标靶核酸。

在一些实例中，将在缓冲液(例如含有乙酸钠、NaCl、KCl、ZnSO₄、抗微生物剂(例如ProClin^TM杀生物剂)或其组合的缓冲液)中稀释的S1核酸酶添加至杂交的探针/样品混合物中并在约37℃至约60℃(例如约50℃)下温育10-120分钟(例如，10-30分钟、30-60分钟、60-90分钟、90分钟或120分钟)来消化来自样品的非杂交核酸和未杂交的NPPF和CFS。在一个实例中，通过将样品与核酸酶在核酸酶缓冲液中在50℃温育60至90分钟来进行核酸酶消化。

可任选地处理样品以灭活或除去残留的酶(例如，通过苯酚提取、沉淀、柱过滤、添加蛋白酶k、添加核酸酶抑制剂、螯合核酸酶活性所需的二价阳离子，或其组合)。在一些实例中，处理样品以将pH调节至约7至约8，例如通过添加KOH或NaOH或缓冲液(例如在pH9下含有Tris-HCl或在pH 8下含有Tris-HCl的缓冲液)。提高pH可以防止DNA的脱嘌呤并且还防止许多ss特异性核酸酶(例如S1)完全发挥作用。在一些实例中，加热样品(例如80-100℃)以使核酸酶失活，例如10-30分钟。

在一些实例中，在核酸酶消化后，用包含SSC的缓冲液洗涤样品，然后可以进行更严格的洗涤(例如，50-60℃的水，50mM的NaOH或甲酰胺)。

C.标靶的捕获

在该方法期间的某个时间，回收或捕获待测序的标靶核酸分子，这允许靶与反应混合物中的其他分子分离。何时可以捕获标靶的示例在图2B-2D中示出。一旦标靶被捕获，它就可以在该方法的后续步骤中保持捕获，或者可以在需要时释放。在一些实例中，通过使用NPPF、5CFS或3CFS上存在的捕获部分从反应中回收标靶。所述捕获部分允许标靶与反应中的非标记分子，例如未结合的NPPF、未结合的标靶和未结合的CFS中的一种或多种的部分相物理分离。

在一个实例中，捕获部分共价连接至NPPF、5CFS或3CFS。这种连接的实例包括胺和羧基键(例如，连接到NPPF、5CFS或3CFS，例如5CFS的3'-端的胺基(例如，参见图3)，其可以与捕获部分，诸如磁珠(例如Dynabead)上的羧基(例如羧酸)结合)和碳-碳键。在一个实例中，NPPF、5CFS或3CFS包括胺，并且捕获部分包括伯脂族胺、芳族胺、氯甲基、酰胺、酰肼、醛、羟基、硫醇或环氧基，其允许核酸分子与捕获部分连接。其他示例性附件由Integrated DNATechnologies提供(例如参见www.idtdna.com/pages/docs/default-source/technical-reports/strategies-for-attaching-oligonucleotides-to_v6-3-14-14.pdf？sfvrsn＝2)。可与这种连接一起使用的捕获部分的实例包括但不限于珠子(例如，磁珠或聚苯乙烯珠子)、琼脂糖、琼脂糖凝胶等，以及板(例如，多孔板)、载玻片(例如，玻璃，在一些实例中涂有硅烷)。在一些实例中，NPPF、5CFS或3CFS与捕获部分的共价连接用于在杂交步骤期间捕获标靶，并且标靶至少通过连接步骤保持捕获。

在另一个实例中，捕获部分非共价连接至NPPF、5CFS或3CFS。此类连接的实例包括化学基团或标记，例如亲和素-生物素、链霉亲和素-生物素、中性亲和素-生物素、洋地黄毒苷(digoxigenin)/抗洋地黄毒苷(或任何蛋白质/抗体组合，例如蛋白质A或蛋白质G及其抗体)、谷胱甘肽以及半抗原/蛋白质。因此，含有标靶及其与捕获部分非共价连接的杂交的NPPF、5CFS或3CFS的反应混合物与含有互补结合分子(与捕获部分互补)的适当固体支持物在允许的条件下温育，以允许捕获部分与固体支持物结合。然后可以简单地洗掉或去除未结合的材料。例如，所述捕获部分可包括生物素。在这样的实例中，将反应混合物与包含(例如，包被)亲和素、中性亲和素或链霉亲和素的固体支持物(例如珠子或多孔板)一起温育。含有生物素标签的靶复合物将与亲和素、中性亲和素或链霉亲和素结合，使反应混合物中未标记的分子被除去(例如，洗掉)。在另一个实例中，所述捕获部分可包括胺。在这样的实例中，将反应混合物与包含(例如，涂有)羧基(例如羧酸)的固体支持物(例如珠子或多孔板)一起温育。具有胺基团的靶配合物将与羧基结合，从而除去反应混合物中未标记的分子。在另一个实例中，所述捕获部分可包括洋地黄毒苷或半抗原。在这样的实例中，将反应混合物与分别包括(例如，包被)抗地洋地黄毒苷抗体或抗半抗原抗体的固体支持物(例如珠子或多孔板)一起温育。具有洋地黄毒苷(或半抗原)的靶复合物将与抗洋地黄毒苷(或抗半抗原)抗体结合，从而允许除去反应混合物中的未标记分子。

在一些实例中，所述捕获部分包括固体支持物和化学基团二者(例如，羧基封端的珠子)。

支架的存在允许标靶(例如，图2A的NPPF/标靶双链体214)从反应混合物中捕获或回收。例如，可以将反应离心并洗涤，以允许浓缩和收集标靶。或者可以使标靶结合的支架沉降到容器的底部并洗涤。在另一个实例中，所述支架是磁性的，其允许使用磁体收集(和标靶的收集)。在一些实例中，通过使用过滤(例如，通过使用过滤器捕获珠子)来回收标靶。在标靶固定后，可以除去剩余的反应混合物(例如通过洗涤)。然后可以将适合于后续方法步骤的适当试剂添加到标靶中。在一些实例中，捕获标靶而不使靶复合物变性。捕获后，固体支持物或支架附着(或相连，例如在容器中)的标靶复合物可从固体支持物中释放(或从固体支持物中除去)。或者，标靶复合物可以保持附着于(或相连，例如在容器中)固体支持物以及在反应中加入的用于下一步骤的试剂。

在一些实例中，捕获在室温下进行(例如15-35℃，例如20-30℃或25-30℃，进行至少10分钟，如10-120分钟、10-30分钟、30-60分钟、60-90分钟、30分钟或60分钟)。在一些实例中，捕获后进行一个或多个洗涤步骤，例如使用SSC-T缓冲液(1×SSC，0.02％Tween-20洗涤剂)。

可与这样连接的一起使用的固体支持物的实例包括但不限于珠子(例如，磁珠或聚苯乙烯珠子)、琼脂糖、琼脂糖凝胶等，以及板(例如，多孔板)和载玻片(例如，玻璃，在一些实例中涂有硅烷)。在一些实例中，NPPF、5CFS或3CFS与捕获部分的非共价连接用于在杂交步骤之后的步骤(但在连接之前)捕获标靶，并且标靶至少通过连接步骤保持捕获。

捕获部分可以直接或间接(例如，通过间隔子，例如碳间隔子)连接或缀合至5CFS或3CFS(或NPPF)。所述捕获部分可以连接到5CFS或3CFS(或NPPF)的内部核苷酸上。在一个实例中，所述捕获部分与5CFS的3'-端核苷酸连接(或接近，例如使用生物素-dT接近，但不在3'-端)。在一个实例中，所述捕获部分与3CFS的5'-核苷酸连接(或接近，例如使用生物素-dT接近，但不在5'-端)。在一些实例中，所述捕获部分不与5CFS的5'-端核苷酸或3CFS的3'-端核苷酸连接。在一些实例中，所述捕获部分间接连接至5CFS或3CFS，例如通过使用碳间隔子(例如约6至60个碳原子，例如约6、7、8、9、10、11、12、24、30、36、42、48、54或60个碳原子)、具有硫代磷酸酯键的碱基、生物素-亲和素或其组合。

可与所公开的方法和试剂盒一起使用的固体支持物包括允许检测试剂进入和适合的表面亲和力以固定捕获试剂(例如寡核苷酸)的固体支持物。可以使用的示例性固体支持物或支架包括珠子或颗粒(例如琼脂糖、琼脂糖凝胶(或其他基质/树脂)、胶乳颗粒、聚苯乙烯珠子、超顺磁珠子或磁珠)、多孔板(例如，96-、384-或1536-孔微量滴定板)，反应盘的孔壁、试管、离心管、膜和微粒(如乳胶颗粒)。固体支持物可以由任何合适的材料制成，例如玻璃、塑料、膜、金属、乳胶、琼脂、琼脂糖等。在一些实例中，所述固体支持物是琼脂糖珠或磁珠。在一些实例中，珠子或颗粒为至少1μm、至少2μm、至少3μm、至少4μm、至少10μm、或至少50μm，例如50μm至140μm、1μm至2μm、1μm至3μm、1μm至4μm、1μm至5μm或1μm至10μm。

D.CFS与标靶的连接以及任选的聚合

在除去未杂交的材料并回收NPPF/标靶双链体后，将标靶序列(可以是DNA或RNA)连接到CFS(例如，连接到5CFS、3CFS或两者)，从而产生经连接的标靶。因此，标靶和每个CFS之间的“间隙”(例如，参见图3和4)通过使用连接酶“闭合”。在一些实例中，包括聚合酶步骤，例如以替换可能已被核酸酶除去的CFS或标靶的核苷酸。例如，核酸酶从CFS和/或标靶的5'-和/或3'-端除去几个核苷酸(例如1、2、3或4个核苷酸)。聚合酶可以包含在连接酶中，或者可以在连接步骤之前进行聚合。

连接酶是通过催化磷酸二酯键的形成促进核酸分子连接在一起的酶。实例包括DNA连接酶(例如EC 6.5.1.1)和RNA连接酶(例如EC 6.5.1.3)。可以使用任何连接酶，例如T4DNA连接酶、T4RNA连接酶1、T4RNA连接酶2(例如截短形式)或Taq连接酶。使用的连接酶可取决于CFS上存在的最接近靶序列的核苷酸(核糖核苷酸或脱氧核糖核苷酸)，以及靶序列的类型(例如DNA或RNA)。例如，RNA将与RNA连接，DNA将与DNA连接，RNA 3'-端将与DNA 5'-端连接。在一些实例中，CFS包括磷酸酯或其他5'-端修饰以确保连接酶具有合适的底物。例如，CFS(例如，图2A中的210)可以是在3'-端包含1个或多个RNA碱基的DNA分子。例如，CFS(例如，图2A中的208)可以是在5'-端包含1个或多个DNA碱基的RNA分子。在一些实例中，使用连接酶的组合。在一些实例中，当标靶包括DNA和RNA分子二者时，使用分开单独的连接(其任选地包括聚合)，而在其他实例中，当标靶包括DNA和RNA分子二者时，使用单一连接(其任选地包括聚合)。一些非限制性实例如下所示。

T4DNA连接酶是ATP依赖性酶，其催化双链DNA或RNA中并置的5'-磷酰基(例如，存在于5CFS上的一个和在核酸酶消化后存在于靶DNA或RNA上的一个，例如参见图3和4)和3'-羟基末端(例如存在于3CFS上的一个和存在于靶DNA或RNA上的一个，例如参见图3和4)之间磷酸二酯键的形成。T4DNA连接酶还可以修复双链DNA、RNA或DNA/RNA杂交体中的单链缺口。T4DNA连接酶也可以连接双链DNA或RNA的平末端和粘性末端片段。

Taq DNA连接酶催化在与互补靶DNA杂交的两个相邻寡核苷酸的并置的5'-磷酸酯(例如，存在于5CFS上的一个和在核酸酶消化后存在于靶DNA或RNA上的一个，例如参见图3和4)和3'-羟基末端(例如存在于3CFS上的一个和存在于靶DNA或RNA上的一个，例如参见图3和4)之间形成磷酸二酯键。当寡核苷酸与互补靶DNA完全配对并且它们之间没有间隙时，发生连接。Taq DNA连接酶在高温(45℃-65℃)下有活性。

T4RNA连接酶1(ssRNA连接酶)通过形成3'→5'磷酸二酯键，并将ATP水解为AMP和PPi来催化5'-磷酰基封端的核酸供体(例如，存在于5CFS上的一个和在核酸酶消化后存在于靶DNA或RNA上的一个，例如参见图3和4)与3'羟基封端的核酸受体(例如存在于3CFS上的一个和存在于靶DNA或RNA上的一个，例如参见图3和4)的连接。底物包括单链RNA和DNA以及二核苷焦磷酸酯(dinucleoside pyrophosphate)。

T4RNA连接酶2，也称为T4Rnl-2，具有分子间和分子内RNA链连接活性。其催化5'磷酸酯(例如在核酸酶消化后存在于靶DNA或RNA上的一种，例如参见图3和4)与3'羟基(例如存在于3CFS上的一个，例如见图3和4)。T4RNA连接酶2也可以将RNA的3'羟基与DNA的5'磷酸连接。在一些实例中，使用截短形式的T4RNA连接酶2(例如，氨基酸1-249)。

在一些实例中，将连接酶在缓冲液(例如含有必需辅助因子如NAD+或ATP的缓冲剂)中稀释，并将阳离子加入到含有NPPF/标靶双链体的混合物中，并在约4℃-60℃(取决于所述连接酶)(例如至少4℃、至少20℃、至少25℃、至少30℃、至少37℃、至少50℃，或至少60℃，例如4到37℃、4至25℃或20至25℃)温育至少15分钟、至少30分钟、至少1小时、至少2小时、至少4小时、至少6小时、至少12小时，或至少16小时，以将CFS连接至标靶核酸分子(其中CFS和标靶已经与NPPF杂交)。在一个实例中，T4DNA连接酶的缓冲液包括50mM Tris-HCl(pH7.5)、10mM MgCl₂、10mM二硫苏糖醇，1mM ATP。

聚合酶是可以合成核酸分子链或核酸聚合物的酶，例如通过将一个或多个核苷酸添加到核酸分子的末端。实例包括DNA聚合酶(EC 2.7.7.7)和RNA聚合酶(EC 2.7.7.6)。DNA聚合酶可用于在DNA分子3'-端延伸，即在其3'-端添加核苷酸。在一个实例中，在dNTP存在下使用DNA聚合酶，例如T4或T7DNA聚合酶或不含核酸外切酶的热稳定聚合酶。RNA聚合酶可用于在RNA分子3'-端延伸，即在其3'-端添加核糖核苷酸。在一个实例中，使用RNA聚合酶，例如大肠杆菌RNA聚合酶，其中添加了rNTP。如果使用RNA聚合酶，该方法可以进一步包括逆转录步骤(例如，在PCR扩增经连接的标靶时)。在一些实例中，例如，如果标靶核酸分子包括DNA和RNA二者，则DNA聚合酶和RNA聚合酶都使用。

在一些实例中，聚合反应在连接反应之前进行。例如，捕获的标靶可以与聚合酶和dNTP和/或rNPT在约4℃-60℃(例如至少4℃、至少20℃、至少25℃、至少30℃、至少37℃、至少50℃，或至少60℃，例如4℃至37℃、4℃至25℃或室温(20℃至25℃))温育至少15分钟、至少30分钟、至少1小时、至少2小时、至少4小时、至少6小时、至少12小时或至少16小时。在一个实例中，所述聚合酶是T4DNA聚合酶，温育条件是在37℃下1小时。在一个实例中，所述聚合酶是T4DNA聚合酶，并且在室温(例如20-25℃)下温育30分钟。

在一些实例中，将聚合酶加入到连接反应中，例如与dNTP和/或rNPT一起，并在约4℃-60℃(取决于所述连接酶)(例如至少4℃、至少16℃、至少20℃、至少25℃、至少30℃、至少37℃、至少50℃，或至少60℃，例如4℃至37℃、4℃至25℃或20℃至25℃))下温育至少15分钟、至少30分钟、至少1小时、至少2小时、至少4小时、至少6小时、至少12小时或至少16小时。在一个实例中，聚合/连接反应在室温(例如20℃至25℃)下温育至少15分钟、至少30分钟或至少1小时，例如30-60分钟。

E.从经连接的标靶中分离NPPF

在将CFS连接至标靶并形成经连接的标靶后，将NPPF与所述经连接的标靶分离(例如，变性)。因此，双链NPPF/标靶复合物可以分离成两个单链核酸分子，即ss NPPF和ss经连接的标靶。在一些实例中，通过用DNA酶降解NPPF将NPPF与经连接的标靶分开(例如，其中NPPF是DNA，标靶是RNA，并且CFS是RNA)，从而留下经连接的标靶。在一些实例中，通过用RNA酶降解NPPF将NPPF与经连接的标靶分离(例如，其中NPPF是RNA，标靶是DNA，并且CFS是DNA)，从而留下经连接的标靶。该步骤还可以通过物理分离除去未连接的核酸分子(例如，未连接的CFS)。

在一个实例中，在允许NPPF与经连接的标靶解离的条件下，例如在洗涤缓冲液的存在下加热反应，产生ss NPPF和ss经连接的标靶的混合群。例如，可以在水溶液中加热反应。在一个实例中，将反应在水中加热至至少约50℃(例如50℃至100℃，例如50℃)，并温育至少10分钟。在一些实例中，反应在约50℃下用水洗涤三次，每次10分钟。在一个实例中，将反应在约50℃的0.02％非离子型洗涤剂水溶液中洗涤三次，每次10分钟(可加入洗涤剂以防止小珠结块)。在另一个实例中，将反应在100％甲酰胺溶液中加热至至少90℃，例如约98℃，持续至少10分钟。在一些实例中，重复添加溶液和加热步骤(例如1至5次)，提供随后的洗涤以基本上除去NPPF和未连接的物质并将它们从ss经连接的产物中洗去。在一些实例中，在室温下用50％甲酰胺/0.02％Tween-20非离子洗涤剂洗涤反应。

在另一个实例中，通过用碱(例如KOH或NaOH)改变pH进行变性，使NPPF与经连接的标靶解离，产生ss NPPF和ss经连接的标靶的混合群。例如，可以加入NaOH至终浓度为50mM至2M(例如100mM)并在室温下温育至少10分钟。在一些实例中，重复添加NaOH和温育(例如1至5次)。碱洗后，可将反应物重新悬浮于含水缓冲液(如Tris-HCl)中，或用等正常量的适当缓冲酸溶液中和反应。

在一些实例中，将样品与DNA酶一起温育，例如以每个样品至少1单位DNA酶I的浓度(例如至少5个单位、至少10个单位，或至少20个单位，例如1到10个单位、1到20个单位，或5、6、7、8、9或10个单位)在37℃下温育至少10分钟、至少30分钟、至少60分钟或至少120分钟，例如10分钟、30分钟、60分钟、90分钟或2小时。

在一些实例中，将样品与RNA酶，例如RNA酶H一起温育，例如以每个样品至少1单位RNA酶H的浓度(例如至少5个单位、至少10个单位、至少20个单位，或至少50个单位，例如1到10个单位、1到20个单位，或1到50个单位，诸如5、6、7、8、9、10、20、30、40或50个单位)在37℃下温育至少10分钟、至少30分钟、至少60分钟或至少120分钟，例如10分钟、30分钟、60分钟、90分钟或2小时。

F.经连接的标靶的捕获

可以使用与上文第II.C部分中描述的那些方法相类似的方法，例如通过使用CFS上的捕获部分(其与标靶连接)来回收ss经连接的标靶。在一些实例中，在捕获之后，用包含SSC(例如SSC-T)的缓冲液洗涤样品，然后可以进行更严格的洗涤(例如，50-60℃的水，50mMNaOH，或甲酰胺)或包含-20洗涤剂(例如，0.02％-20洗涤剂)的洗涤。然后可以对得到的ss经连接的标靶进行测序。在一些实例中，在测序之前扩增所述ss经连接的标靶，从而产生经连接的标靶扩增子。

G.任选的经连接的标靶的扩增

可以在测序之前扩增所得捕获的经连接的标靶分子，例如使用以下方法诸如聚合酶链反应(PCR)或其他形式的酶扩增或基于连接的扩增方法。如果标靶是RNA，或者如果使用RNA聚合酶(参见上文D部分)和rNTP，则可以包括逆转录步骤。

在一些实例中，进行不超过30个循环的扩增，例如不超过25个循环的扩增，不超过20个循环的扩增，不超过15个循环的扩增，不超过10个循环的扩增，不超过8个循环的扩增，或不超过5个循环的扩增，例如2到30个循环、5到30个循环、8到30个循环、8到25个循环、2到25个循环、5到25个循环、5到20个循环、5至15个循环，或5至10个循环的扩增。

可以使用的核酸扩增方法包括导致核酸分子(例如经连接的标靶或其部分)的拷贝数增加的方法。所得产物称为扩增产物或扩增子(amplicon)。通常，此类方法包括在允许引物与待扩增的核酸分子杂交的条件下，使待扩增的物质(例如，经连接的标靶)与一个或一对寡核苷酸引物接触。引物在合适的条件下延伸、与模板解离，然后再退火、延伸和解离以扩增核酸分子的拷贝数。

可以使用的体外扩增方法的实例包括但不限于PCR、逆转录PCR(RT-PCR)、定量实时PCR、定量实时逆转录酶PCR、等温扩增方法、链置换扩增；无转录等温扩增；修复链式反应扩增；和NASBA^TM RNA无转录扩增。在一个实例中，使用基于连接的扩增方法，其中引物与至少一部分CFS特异性杂交。连接可以是酶促的或非酶促的。在一个实例中，使用解旋酶依赖性扩增。

在扩增经连接的标靶期间，可以掺入实验标签和/或测序衔接子作为例如引物和延伸构建体的一部分(参见图5)。但是，添加此类标签/衔接子是任选的。例如，包括与5CFS或3CFS的全部或部分互补的第一部分的扩增引物可包括与期望的实验标签和/或测序衔接子互补的第二部分。本领域技术人员将理解，可以将实验标签和/或测序衔接子的不同组合可以添加到经连接的标靶的任一端。在一个实例中，使用第一扩增引物和第二扩增引物扩增所述经连接的标靶，所述第一扩增引物包括与5CFS的全部或部分互补的第一部分和互补于(或包含)所需的测序衔接子的第二部分，并且所述第二扩增引物包括与3CFS的全部或一部分互补的第一部分和互补于(或包含)所需的实验标签的第二部分(例如，参见图5)。在一个实例中，使用两种不同的测序衔接子和两种不同的实验标签。在一些实例中，使用两种不同的测序衔接子和一种实验标签。在另一个实例中，使用第一扩增引物和第二扩增引物扩增所述经连接的标靶，所述第一扩增引物包括与5CFS互补的第一部分的全部或一部分和互补于(或包含)所需测序衔接子和所需实验标签的第二部分，并且所述第二扩增引物包括与3CFS的全部或一部分互补的第一部分和互补于(或包含)所需实验标签的第二部分。

扩增也可用于将可检测的标记引入产生的经连接的标靶扩增子中(例如，如果需要另外的标记)，或其他允许检测或猝灭的分子。例如，扩增引物可包括可检测的标记、半抗原或猝灭剂，其在扩增过程中掺入经连接的标靶中。可以在经连接的标靶扩增子的任一端(或两端)或其间的任何位置引入这种标记、半抗原或猝灭剂。

在一些实例中，在测序之前纯化得到的经连接的标靶扩增子。例如，可以在使用本领域已知的测序之前纯化扩增反应混合物(例如，凝胶纯化、生物素/亲和素捕获和释放、毛细管电泳、尺寸排阻纯化，或与顺磁珠结合和释放(固相可逆固定))。在一个实例中，经连接的标靶扩增子被生物素化(或包括另一个半抗原)并捕获到亲和素或抗半抗原包被的珠子或表面上，洗涤，然后释放用于测序。同样地，可以将经连接的标靶扩增子捕获到互补的寡核苷酸(例如与表面结合的寡核苷酸)上，洗涤然后释放用于测序。扩增子的捕获不需要特别的专一性，因为所公开的方法消除了大部分基因组或转录组，留下了经连接的标靶。如果需要，可以使用其他方法纯化扩增产物。

通过使用水解单链寡核苷酸的核酸酶(例如核酸外切酶I)的方法，扩增产物也可以在扩增的最后一步后纯化，同时仍然是双链的，所述核酸酶可以在继续进行下一步如测序之前被灭活。

1.结合CFS的引物

与CFS(5CFS，3CFS)特异性结合或杂交的扩增引物可用于启动扩增，例如PCR扩增。因此，引物可通过核酸杂交与CFS中的互补序列退火，以在引物和经连接的标靶的CFS之间形成杂交体，然后引物通过聚合酶沿互补链延伸。另外，扩增引物可用于将核酸标记(例如一个或多个实验标签和/或测序衔接子)和/或可检测标记引入所得的经连接的标靶扩增子中。引物是短核酸分子，例如长度至少为12个核苷酸的DNA寡核苷酸(例如长度为约15、20、25、30、50、60、61、62、63、64、65、66、67、68、69、70、75或80个核苷酸或更长，例如15至25nt、50至80nt、60-70nt或62-66nt)。例如，此类引物可具有与CFS互补的部分(例如与CFS互补的至少10个、至少15个、至少20个，或至少25个核苷酸)。在一些实例中，所述引物包括可检测的标记，例如荧光团或生物素，其被掺入经连接的标靶扩增子中。

例如，除了具有与CFS互补的区域的扩增引物之外，它还可以包括具有核酸序列的第二区域，其导致将实验标签、测序衔接子、可检测标记或其组合添加到经连接的标靶扩增子。可以在经连接的标靶的5'-和/或3'-端引入实验标签和/或测序衔接子。在一些实例中，将两个或更多个实验标签和/或测序衔接子添加到经连接的标靶扩增子的单个末端或两个末端，例如使用具有核酸序列的单个引物，其导致添加两个或更多个实验标签和/或测序衔接子。例如，可以使用实验标签来区分一个样品或序列与另一个样品或序列。测序衔接子允许通过特定的测序平台捕获所得的经连接的标靶扩增子。

2.添加实验标签

实验标签是短序列或修饰的碱基，其用作一个或多个反应的标识符，以通过例如：患者、样品、细胞类型、进程时间点或治疗来独立地辨别。实验标签可以是CFS的一部分。在另一个实例中，稍后添加实验标签，例如在经连接的标靶的扩增期间，产生含有实验标签的经连接的标靶扩增子。CFS中通用序列的存在允许使用通用引物，其可以将其他序列引入经连接的标靶上，例如在扩增期间。实验标签也可用于扩增，例如嵌套扩增或两阶段扩增。

实验标签，例如区分一个样品与另一个样品的标签，可用于识别特定的标靶序列。因此，实验标签可用于区分实验或患者彼此。在一个实例中，实验标签是经连接的标靶扩增子的5'-和/或3'-端的前三个、五个、十个、二十个或三十个核苷酸。在一些实例中，将实验标签置于测序引物位点附近。对于测序，实验标签紧邻Read1和Read 2引物位点。对于测序，实验标签通常是读取的前几个碱基。在特定实例中，实验标签的长度为至少3个核苷酸，例如长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个，或至少50个核苷酸，例如3-50个、3-20个、12-50个、6-8个、6-12个或12-30个核苷酸，例如长度为3、5、6、7、8、9、10、11、12、20、21、22、23、24、25、26、27、28、29或30个核苷酸。

在一个实例中，使用实验标签来区分一个样品与另一个样品。例如，这样的序列可以像条形码一样发挥作用，以允许人们将检测到的特定序列与特定样品、患者或实验(例如特定反应孔、日子或反应条件组)相关联。这允许测序的特定的经连接的标靶与例如特定患者或样品或实验相关联。这种标签的使用提供了降低每个样品的成本和增加样品通量的方法，因为可以标记多个经连接的标靶扩增子然后组合(例如来自不同的实验或患者)，例如在单个测序运行或检测阵列中。这允许在同一仪器通道或测序消耗品(例如流动池或半导体芯片)内将不同的实验或患者样品组合成单次运行的能力。例如，这样的标签允许在单个流动池或芯片内的单次运行中对100或1,000个不同的实验进行测序。此外，如果该方法包括凝胶纯化完成的扩增反应的步骤(或其他不需要实际分离的纯化或清除方法)，则每次检测或测序运行只需要运行一次凝胶(或清洁或纯化反应或过程)。然后可以对测序的经连接的标靶扩增子进行分选，例如通过实验标签。

在一个实例中，实验标签用于识别特定的标靶序列。在这种情况下，使用实验标签对应于特定的标靶序列可以缩短所需的测序时间或量，因为对经连接的标靶的末端而不是对整个经连接的标靶测序可以是足够的。例如，如果这种实验标签存在于经连接的标靶扩增子的3'-端，则整个经连接的标靶扩增子序列本身不必测序以鉴定该靶序列。相反，只需要对含有实验标签的经连接的标靶扩增子的3'-端进行测序。这可以显著减少测序时间和资源，因为更少的材料需要进行测序。

3.添加测序衔接子

测序衔接子可以但不必在生成时成为CFS的一部分。在另一个实例中，稍后添加测序衔接子，例如在经连接的标靶的扩增期间，从而产生含有测序衔接子的经连接的标靶扩增子。在CFS中存在通用序列允许使用通用引物，其可以将其他序列引入经连接的标靶上，例如在扩增期间。

可以使用测序衔接子将序列添加至特定测序平台所需的经连接的标靶(或其扩增子)。例如，一些测序平台(例如454品牌(Roche)、Ion Torrent品牌和Illumina品牌)需要待测序的核酸分子在其5'-和/或3'-端包括特定序列，例如以捕获待测序的分子。例如，适当的测序衔接子被测序芯片或珠子上的互补序列识别，并且通过测序衔接子的存在捕获经连接的标靶(或其扩增子)。

在一个实例中，在PCR扩增期间将poly-A(或poly-T)，例如长度至少为10个核苷酸的poly-A或poly-T加入到经连接的标靶中。在一个具体实例中，将poly-A(或poly-T)添加到经连接的标靶的3'-端。在一些实例中，使用末端脱氧核苷酸转移酶(TdT)在该添加的序列的3'-端进行多腺苷酸化。

在特定实例中，添加的测序衔接子的长度为至少12个核苷酸(nt)，例如长度为至少15nt、至少20nt、至少25nt、至少30nt、至少40nt、至少50nt、至少60nt或至少70nt，例如长度为12-50nt、20-35nt、50-70nt、20-70nt或12-30nt。

H.经连接的标靶或经连接的标靶扩增子的测序

对经连接的标靶或经连接的标靶扩增子进行测序，例如通过测序整个经连接的标靶或经连接的标靶扩增子或其部分(例如足以允许鉴定标靶核酸分子或允许确定特定突变是否存在的量)。本公开不限于特定的测序方法。应当理解，经连接的标靶或经连接的标靶扩增子可以设计用于通过任何方法，在当前已知或将来的任何测序仪上进行测序。经连接的标靶本身不限制所用的测序方法，也不限制所用的酶。已经或将要开发其他测序方法，并且本领域技术人员可以理解，产生的经连接的标靶或经连接的标靶扩增子将适合于在这些系统上测序。在一些实例中，在单个反应中对多个不同的经连接的标靶或经连接的标靶扩增子进行测序。因此，多个经连接的标靶可以平行测序，例如同时或同期测序。

可用于确定所得经连接的标靶或经连接的标靶扩增子(例如由DNA组成)的序列的示例性测序方法包括但不限于链终止方法、染料终止子测序和焦磷酸测序(例如Biotage(用于低通量测序)和454Life Sciences(用于高通量测序)商业化的方法。在一些实例中，使用(例如，HiSeq)、Ion Helicos、(Applied Vioasystems)或任何其他商业测序系统对经连接的标靶或经连接的标靶扩增子进行测序。在一个实例中，测序方法使用桥式PCR(例如，)。在一个实例中，使用或单分子测序方法。在一个实例中，使用下一代序列(NGS)，例如来自Illumina、Roche或Thermo Fisher Scientific的那些，例如来自Thermo FisherScientific的SOLiD/Ion Torrent PGM，来自Illumina的Genome Analyzer/HiSeq 2000/MiSeq，来自Roche的GS FLX Titanium/GS Junior，或Qiagen GeneReader^TM系统。测序衔接子(例如存在于经连接的标靶或经连接的标靶扩增子上的poly-A或poly T尾，例如使用PCR引入)可用于捕获经连接的标靶或经连接的标靶扩增子以在特定平台上测序。在一个实例中，使用纳米孔型测序仪。

虽然或的测序通常涉及核酸制备，通过核酸的随机片段化，然后体外连接常见的衔接子序列而完成，对于所公开的方法，待测序核酸的随机片段化步骤可以去除，并且衔接子序列的体外连接可以连接至经连接的标靶或经连接的标靶扩增子，例如存在于经连接的标靶或经连接的标靶扩增子中的实验标签。对于测序，在测序芯片/珠子扩增子上扩增后，测序引物与经连接的标靶杂交。

I.对照

在一些实施方案中，该方法包括使用一种或多种阳性和/或阴性对照。在一些实例中，对照经历与实际实验NPPF和相应CFS相同的反应条件。标记的使用允许实际不同的样品用作对照但经过处理以进行测序并在与测试样品相同的测序泳道中运行。

在一些实例中，对照是包含在与样品接触的多种NPPF和相应CFS中的“阳性对照”NPPF。在一些实例中，该阳性对照是对变量，例如每个样品裂解的细胞数、DNA或RNA的回收，或杂交效率的内部归一化控制。在一个实例中，测量DNA作为测量靶RNA时细胞数的对照。在一些实例中，阳性对照包括对已知存在于样品中的DNA或RNA(例如，可能存在于待测物种中的核酸序列，例如一种或多种基础水平或组成型管家基因，或重复DNA元件)具有特异性的一种或多种NPPF和相应的CFS。示例性阳性对照标靶包括但不限于结构基因(例如肌动蛋白、微管蛋白或其他)或DNA结合蛋白(例如转录调节因子或其他)，以及管家基因。在一些实例中，阳性对照靶包括对以下具有特异性的一种或多种NPPF和相应CFS：甘油醛-3-磷酸脱氢酶(GAPDH)、肽基丙基异构酶A(PPIA)、大核糖体蛋白(RPLP0)、核糖体蛋白L19(RPL19)、SDHA(琥珀酸脱氢酶)、HPRT1(次黄嘌呤磷酸核糖基转移酶1)、HBS1L(HBS1样蛋白)、β-肌动蛋白(ACTB)、5-氨基乙酰丙酸合成酶1(ALAS1)、β-2微球蛋白(B2M)、α血红蛋白稳定蛋白(AHSP)、核糖体蛋白S13(RPS13)、核糖体蛋白S20(RPS20)、核糖体蛋白L27(RPL27)、核糖体蛋白L37(RPL37)、核糖体蛋白38(RPL38)、鸟氨酸脱羧酶抗酶1(OAZ1)、聚合酶(RNA)II(DNA导向)多肽A、220kDa(POLR2A)、硫氧还蛋白样1(TXNL1)、yes-相关蛋白1(YAP1)、酯酶D(ESD)、蛋白酶体(prosome、macropain)26S亚基、ATP酶、1(PSMC1)、真核翻译起始因子3、亚基A(EIF3A)或18S rRNA。在一些实例中，所述阳性对照标靶是重复DNA元件，例如HSAT1、ACRO1和LTR3。在一些实例中，所述阳性对照标靶是单拷贝基因组DNA序列(假设单倍体基因组)。例如，相应的阳性对照NPPF和相应的CFS可以在与多个测试NPPF和相应的CFS杂交之前或期间添加到样品中。

在一些实例中，阳性对照包括一种或多种NPPF和相应的CFS，其补体是在与多种NPPF和相应的CFS杂交之前或期间添加到样品中的掺入(例如，添加的)标靶核酸分子(例如一种或多种体外转录的核酸、从不相关的样品中分离的核酸，或合成核酸如DNA或RNA寡核苷酸)中。在一个实例中，阳性对照NPPF和加标(spike in)具有单核苷酸错配。在一个例子中，添加了多个NPPF和加标，其中加标以已知浓度范围(例如1pM、10pM和100pM)加入，形成输入的“阶梯”并证明最终测序输出中测定的动态范围。

在一些实例中，“阴性对照”包括一种或多种NPPF和相应的CFS，其补体已知不存在于样品中，例如作为杂交特异性的对照，例如来自除被测试物种之外的物种的核酸序列，例如，当分析人核酸时的植物核酸序列(例如，拟南芥AP2样乙烯响应转录因子(ANT))，或在自然界中未发现的核酸序列。

在一些示例中，对照用于确定方法中的特定步骤是否正确地操作。在一些实例中，在最终测序结果中评估阳性或阴性对照。在一个实例中，对照包括在捕获标靶之后但在其测序之前(例如，在图2A中的步骤4和5之间)的分析。在一个这样的实例中，该分析包括使用Taqman探针用于阴性对照探针以评估核酸酶在测定中的有效性。应通过核酸酶步骤去除所有阴性对照探针，因此如果阴性对照探针的量大，则可能表明核酸酶保护不能正常进行并且样品可能受损。在另一个这样的实例中，将阴性对照探针的Taqman测定与整个捕获标靶的量的同时测量定量进行组合(即，使用基于SYBR的qPCR方法)。

在一个实例中，在进行所公开的方法之前，将待分析的样品暴露于扩增条件(例如，qPCR或qRT-PCR)，以确定样品是否具有足够量(和质量)的核酸分子。例如，可以使用扩增感兴趣的靶区域(例如KRAS或BRAF)、管家RNA基因例如GAPDH或重复DNA元件例如LTR3的引物来进行qPCR，以确定样品中的可评估核酸。在一个实例中，设计引物使得它们扩增接近靶区域大小的区域，以确定可用核酸是否足够大以进行评估-小于给定NPPF的靶位点的核酸片段将不予评估，因为它们在核酸酶消化过程中不会保护NPPF。在一个实例中，可接受的样品量和质量的范围通过实验确定，例如使用特定样品类型(例如，肺或黑素瘤样品)或形式(例如，福尔马林固定的组织或细胞系)。

III.具有侧翼序列的核酸酶保护探针(NPPF)

所公开的方法允许一种或多种标靶核酸分子的直接测序，例如同时或同期。基于标靶核酸，可以使用本文所述的标准结合本领域技术人员的知识将NPPF设计用于所公开的方法。在一些实例中，所公开的方法包括产生一种或多种适当的NPPF以检测特定的标靶核酸分子。如果样品中存在这样的标靶，则在各种条件下(已知的或经验确定的)，NPPF特异性结合(或能够特异性结合，例如特异性杂交)标靶核酸或其部分。

图1A显示了具有区域102以及分别在5'-和3'-端的侧翼序列104、106的示例性NPPF100，所述区域102包括与标靶核酸序列特异性结合或杂交的序列，其中所述侧翼序列与其互补序列结合或杂交(在本文中称为CFS)。尽管显示了两个侧翼序列，但在一些实例中，NPPF仅具有一个侧翼序列，例如5'-端的一个或3'-端的一个。在一些实例中，NPPF包括两个侧翼序列：一个在5'-端，另一个在3'-端。在一些实例中，5'-端的侧翼序列不同于3'-端的侧翼序列。图1B显示NPPF 120的实施方案，其由两个分开的核酸分子128、130组成。在一个实例中，NPPF是100nt，每个侧翼序列104、106是25nt，与标靶核酸序列特异性结合或杂交的区域102是50nt。

NPPF(以及与NPPF结合的CFS)可以是任何核酸分子，例如DNA或RNA分子，并且可以包括非天然碱基。因此，NPPF(以及与NPPF结合的CFS)可以由天然(例如核糖核苷酸(RNA)或脱氧核糖核苷酸(DNA))或非天然核苷酸(例如锁定的核酸(LNA，参见，例如美国专利号6,794,499)、肽核酸(PNA))等组成。NPPF可以是单链或双链的。在一个实例中，NPPF是ss DNA，CFS是RNA(例如，以及标靶是RNA)。在一个实例中，NPPF是ss RNA，CFS是DNA(例如，以及标靶是DNA)。在一些实例中，NPPF(以及与NPPF结合的CFS)包括一种或多种合成碱基或替代碱基(例如肌苷)。修饰的核苷酸、非天然核苷酸、合成的或替代的核苷酸可以以一个或多个位置(例如1、2、3、4、5或更多个位置)在NPPF中使用。例如，NPPF和/或CFS可包括一个或多个含有修饰碱基的核苷酸和/或修饰的磷酸主链。在一些实例中，相对于不包括修饰的核酸的相同长度和组成的NPPF的T_m，在NPPF中使用一种或多种修饰的或非天然的核苷酸可以增加NPPF的T_m。本领域技术人员可以设计包括这种修饰的核苷酸的探针以获得具有所需T_m的探针。在一个实例中，NPPF由DNA或RNA组成，例如单链(ssDNA)或分支DNA(bDNA)。在一个实例中，NPPF是适体(aptamer)。

NPPF包括与一种或多种标靶核酸分子互补的区域。在相同反应中使用的NPPF可以设计成具有相似的T_m。在一个实例中，反应中存在对单一标靶核酸序列具有特异性的至少一种NPPF。在这样的实例中，如果存在待检测或测序的2、3、4、5、6、7、8、9或10种不同的标靶核酸序列，则该方法可相应地使用至少2、3、4、5、6、7、8、9或10种不同的NPPF(其中每种NPPF对应于/具有足够的互补性以杂交于特定标靶)。因此，在一些实例中，所述方法使用至少两种NPPF，其中每种NPPF对不同的标靶核酸分子具有特异性。然而，可以理解，可以对特定的标靶核酸分子，例如单个标靶核酸序列的许多不同区域产生几种不同的NPPF。在一个实例中，NPPF包括与仅在转录组中的单个基因中发现的序列互补的区域。

然而，一些实例，在反应中存在单个NPPF，其对两种或更多种标靶核酸序列，例如野生型序列和特定基因的一种或多种突变序列是特异性的(例如，参见图10)。因此，在一些实例中，如果存在2、3、4、5、6、7、8、9或10种不同的标靶基因(例如BRAF、KRAS和EGFR)，每种标靶基因具有两个或更多个待检测或测序的标靶核酸序列，该方法可以相应地使用至少2、3、4、5、6、7、8、9或10种不同的NPPF(其中每种NPPF对应于特定基因，但可以检测该基因序列的多种变异)。

这些类型的NPPF的组合可用于单一反应，例如(1)一种或更多种NPPF，每种NPPF对单一标靶核酸序列具有特异性(例如，互补性)(例如，只能与单个标靶核酸分子充分杂交)，(2)一种或更多种NPPF，每种NPPF对单一标靶基因具有特异性(例如，互补性)，但具有检测该基因的多个变异的能力(例如，可充分杂交至标靶基因的两种或更多种变体，例如野生型序列及其至少一种变体，例如野生型基因序列的2、3、4、5、6、7、8、9或10种不同的变体)。在一些实例中，反应包括(1)至少2种、至少3种、至少4种、至少5种、至少10种、至少15种、至少20种、至少25种，或至少30种不同的NPPF，每种NPPF对单一标靶核酸序列具有特异性(例如，互补性)，(2)至少2种、至少3种、至少4种、至少5种、至少10种、至少15种、至少20种、至少25种，或至少30种不同的NPPF，每种NPPF对单一标靶基因具有特异性(例如，互补性)，但具有检测该基因中的多个变异的能力。

因此，可以使单一样品与一种或多种NPPF接触。一组NPPF是两种或更多种NPPF的集合，每种NPPF特异于(1)不同的标靶序列和/或相同标靶基因的不同部分，或特异于(2)单一标靶基因但具有检测基因序列变异的能力。一组NPPF可以包括至少、至多或恰好2、3、4、5、6、7、8、9、10、12、15、20、25、30、50、100、500、1000、2000、3000、5000或10,000种不同的NPPF。在一些实例中，使样品与足量的NPPF接触以使这种NPPF对标靶过量，例如过量100倍、500倍、1000倍、10,000倍、100,000倍或10⁶倍。在一些实例中，如果使用一组NPPF，则可以将该组中的每种NPPF过量提供给样品中其各自的标靶(或标靶的一部分)。过量的NPPF可以促进结合特定标靶的NPPF量的定量。一些方法实施方案涉及同时或同期与相同的NPPF或一组NPPF接触的多个样品(例如，至少、多至或恰好10、25、50、75、100、500、1000、2000、3000、5000或10,000个不同样品)NPPF或一组NPPF。

经验性地确定与特定标靶或样品(例如经固定的或交联的样品)一起使用的NPPF的合适大小的方法是常规的。在具体的实施方案中，NPPF的长度可多至500个核苷酸，例如多至400个，多至250个，多至100个或多至75个核苷酸，包括例如长度为20-500、20-250、25-200、25-100、25-75或25-50个核苷酸。在一个非限制性实例中，NPPF的长度为至少35个核苷酸，例如长度为至少40个、至少45个、至少50个、至少75个、至少100个、至少150个或至少200个核苷酸，例如长度为50至200个、50至150个、50至100个、75至200个、40至80个、35至150个，或者36个、72个、75个或100个核苷酸。取决于期望的功能，特定的NPPF实施例可以更长或更短。在一些实例中，NPPF具有适当的尺寸(例如，足够小)以穿透经固定的和/或交联的样品。经固定的或交联的样品的固定或交联程度可能不同；因此，普通技术人员可以确定特定样品条件或类型的合适NPPF大小，例如，通过使用具有已知固定标靶浓度的样品进行一系列实验并将NPPF大小与标靶信号强度进行比较。在一些实例中，样品(并且因此至少一部分标靶)是经固定的或交联的，并且NPPF足够小以使信号强度保持高并且基本上不随功能NPPF大小而变化。

影响NPPF-标靶和NPPF-CFS杂交特异性的因素包括NPPF和CFS的长度、解链温度(melting temperature)、自身互补性以及重复或非独特序列的存在。参见，例如Sambrooket al.,Molecular Cloning:A Laboratory Manual,3d ed.,Cold Spring Harbor Press,2001；Ausubel et al.,Current Protocols in Molecular Biology,Greene PublishingAssociates,1992(and Supplements to 2000)；Ausubel et al.,Short Protocols inMolecular Biology:A Compendium of Methods from Current Protocols in MolecularBiology,4th ed.,Wiley&Sons,1999。导致特定杂交程度(严格性)的条件将根据杂交方法的性质和杂交核酸序列的组成和长度而变化。通常，杂交温度和杂交缓冲液的离子强度(例如Na⁺浓度)将决定杂交的严格性。在一些实例中，所公开方法中使用的NPPF具有至少约37℃、至少约42℃、至少约45℃、至少约50℃、至少约55℃、至少约60℃、至少约65℃、至少约70℃、至少约75℃、至少约80℃，例如约42℃-80℃的T_m，(例如，约37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80℃)。在一个非限制性实例中，所公开方法中使用的NPPF具有约42℃的T_m。计算探针的T_m的方法是本领域技术人员已知的(参见例如Sambrooket al.,Molecular Cloning:A Laboratory Manual,3d ed.,Cold Spring Harbor Press,2001,Chapter 10)。在一些实例中，选择针对特定反应的NPPF各自具有相同或相似的T_m，以便于同时检测或测序样品中的多个标靶核酸分子，例如彼此T_m+/-约10℃，诸如例如+/-10℃、9℃、8℃、7℃、6℃、5℃、4℃、3℃、2℃或1℃。

A.与标靶杂交的区域

与标靶核酸序列特异性杂交的NPPF序列102(或122)的部分在序列上与待测序的标靶核酸序列互补。可以设计这种互补性，使得NPP仅与单一标靶核酸序列杂交，或者可以与多个标靶核酸序列杂交，例如野生型基因及其变体。例如，如图10所示，设计单一NPPF(SEQ ID NO:1)不仅与野生型BRAF序列杂交，而且与编码V600E/K/R/E2/D突变的突变序列杂交；设计单一NPPF(SEQ ID NO:8)不仅与野生型KRAS序列杂交，而且与编码G12/D/V/A/C/S/R和G12D突变的突变序列杂交；以及设计单一NPPF(SEQ ID NO:17)不仅与野生型KRAS序列杂交，而且与编码Q61E/R/L/H/C/T突变的突变序列杂交。图10显示了NPPF的序列和标靶序列(因此，对BRAF和导致氨基酸V600突变的突变(红色核苷酸)具有特异性的SEQ ID NO:1中所示的NPPF与SEQ ID NO:2-7的互补序列杂交，对KRAS和导致氨基酸G12和G13突变的突变(红色核苷酸)具有特异性的SEQ ID NO:8中所示的NPPF与SEQ ID NO:9-16的互补序列杂交，以及对KRAS和导致氨基酸Q61突变的突变(红色核苷酸)具有特异性的SEQ ID NO:17中所示的NPPF与SEQ ID NO:18-23的互补序列杂交。

本领域技术人员将理解，序列102(或122)不需要与整个标靶核酸互补(例如，如果标靶是100,000个核苷酸的基因，则序列102(或122)可以是其一部分，例如与特定标靶核酸分子互补的至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少100或更多连续核苷酸)。探针的特异性随着长度而增加。因此，例如，相比仅15个核苷酸的相应序列，包含25个连续核苷酸的特异性结合标靶核酸序列的序列102(或122)将以更高的特异性与靶序列退火。因此，本文公开的NPPF可具有特异性结合标靶核酸序列的序列102(或122)，其包括与特定标靶核酸分子互补的至少6个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少100个或更多个连续核苷酸(例如与靶DNA或靶RNA互补的约6至50个、6至60个、10至40个、10至60个、15至30个、18至23个、19至22个或20至25个连续核苷酸。

特异性结合标靶核酸序列的特定长度的序列102(或122)可以是用于实施本公开的方法的NPPF的一部分，包括与标靶核酸分子互补的6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个连续核苷酸。在标靶核酸分子是miRNA(或siRNA)的一些实例中，特异性结合标靶核酸序列的序列102(或122)的长度可以更短，例如长度为20-30个核苷酸(例如20、21、22、23、24、25、26、27、28、29或30个核苷酸)以匹配miRNA(或siRNA)长度。然而，本领域技术人员将理解，特异性结合标靶的序列102(或122)不需要与标靶核酸分子100％互补。在一些实例中，与标靶互补的NPPF区域和标靶核酸共享至少80％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％，或100％互补性，但其中任何错配都可以幸免于核酸酶消化。在一些实例中，例如，如果需要检测点突变，可以使用两种NPPF，其中一种NPPF的序列102(或122)对野生型序列具有特异性，并且第二种NPPF的序列102(或122)对突变序列具有特异性(可以进行定量测量)。取决于反应条件和所用核酸酶的相应选择性，可存在多于一个错配(例如至少两个相邻错配)，例如以帮助核酸酶消化。在一些实例中，NPPF在一个或更多个位置(例如1、2、3、4、5个或更多个位置)是简并的，例如，在特异性结合标靶的序列102(或122)中的特定位置的核苷酸(例如2、3或4个核苷酸)的混合物。在其他实例中，如果需要检测点突变，可以使用单个NPPF，其中NPPF的序列102(或122)使得其允许与野生型序列和突变序列都杂交(例如，参见图10)。在一些实例中，NPPF包括一个或更多个随机碱基，例如以鉴定含有突变的区域。

在一些实例中，NPPF的序列102(或122)包括至少一个dUTP(例如至少2个、至少3个、至少4个或至少5个dUTP，例如1、2、3、4、5、6、7、8、9、10或11个dUTP)。在一些实例中，所有dTTP都被dUTP替换。这种碱基的存在允许单链NPPF在后续步骤(例如，在NPPF由经连接的标靶变性后，但在测序之前)中用尿嘧啶DNA去糖基化酶(UDG)降解或破坏。

在一个实例中，与标靶核酸分子的全部或部分互补的NPPF的序列102(或122)包括至少一个核苷酸错配。即，至少一个核苷酸与标靶核酸分子中的其相应核苷酸不互补，因此在该位置不会形成碱基对。例如，如图10所示，SEQ ID NO:1在位置12处含有“G”而不是“A”，SEQ ID NO:8在位置15处含有“G”而不是“A”，并且SEQ ID NO:17在位置13处含有“T”而不是“C”。在一些实例中，错配不存在于侧翼序列中。在一些实例中，错配不存在于侧翼序列的两个碱基内(使得它不在与标靶核酸的全部或部分互补的NPPF区域的5'-端或3'-端的两个碱基内)。在一些实例中，错配距离NPPF的3'-或5'-端至少两个碱基。在一些实例中，错配的存在允许人们将NPPF与标靶核酸分子区分开。

B.侧翼序列

侧翼序列104、106(或124、126)的序列提供了CFS可以特异性杂交的互补序列。因此，每个侧翼序列104、106(或124、126)与CFS的至少一部分互补(例如，5'-侧翼序列与5CFS互补，并且3'-侧翼序列与3CFS互补。)。侧翼序列与样品中另外发现的序列不相似(例如，在人类基因组中未发现)。因此，侧翼序列包括在样品中另外存在的核酸分子中未发现的连续核苷酸序列。例如，如果标靶核酸是人序列，则侧翼序列的序列与靶(例如人)基因组中发现的序列不相似。这有助于降低可能存在于标靶基因组中的非靶序列与NPPF的非特异性结合(或交叉反应性)。分析序列与基因组的相似性的方法是已知的。

NPPF可包括一个或两个侧翼序列(例如，一个在5'-端，一个在3'-端，或在两者)，并且侧翼序列可以相同或不同。在具体实例中，每个侧翼序列不特异性结合任何其他NPPF序列(例如，序列102、122或其他侧翼序列)或样品的任何组分。在一些实例中，如果存在两个侧翼序列，则每个侧翼序列104、106(或124、126)的序列是不同的。如果存在两个不同的侧翼序列(例如，在相同的NPPF上的两个不同的侧翼序列和/或在一组NPPF中的其他NPPF的侧翼序列)，则在一些实例中每个侧翼序列104、106(或124、126)具有相似的解链温度(T_m)，例如相互之间的Tm+/-约10℃或+/-5℃，例如+/-4℃、3℃、2℃或1℃。

在一些实例中，至少一个侧翼序列包括至少一个dUTP(例如侧翼序列中的至少2个、至少3个、至少4个或至少5个dUTP，例如每个侧翼序列有1、2、3、4、5、6、7、8、9、10或11个dUTP)。这种碱基的存在允许单链NPPF在后续步骤(例如，在NPPF由经连接的标靶变性后，但在测序之前)中用尿嘧啶DNA去糖基化酶(UDG)降解或破坏。在一些实例中，NPPF包括两个侧翼序列，每个侧翼序列具有至少一个dUTP。在一些实例中，NPPF包括两个侧翼序列，但仅一个侧翼序列具有至少一个dUTP。在一些实例中，NPPF包括具有至少一个dUTP的单个侧翼序列。在一些实例中，dUTP的位置接近于与标靶核酸分子的区域互补的序列，相距与标靶核酸分子的区域互补的序列例如1、2、3、4、5个碱基(例如距离在1、2、3、4、5个碱基之内)。在一些实例中，dUTP的位置是距离与标靶核酸分子的区域互补的序列至少两个碱基(例如至少3个、至少4个，或至少5个碱基)。例如，5'-端侧翼序列104(或124)中的至少一个dUTP与3'-端和5'-端侧翼序列104(或124)相距1、2、3、4或5个碱基。例如，3'-端侧翼序列106(或126)中的至少一个dUTP与3'-端侧翼序列106(或126)的5'-端的1、2、3、4或5个碱基。

在一个实例中，NPPF的侧翼序列104、106(或124、126)部分包括至少一个核苷酸错配。即，至少一个核苷酸与CFS中其相应的核苷酸不互补，因此在该位置不会形成碱基对。

在特定实例中，NPPF的侧翼序列104、106(或124、126)部分长度为至少12个核苷酸，或长度为至少25个核苷酸，例如至少15个、至少20个、至少25个、至少30个、至少40个或至少50个核苷酸，例如12至50个、12至25个或12至30个核苷酸，例如长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸，其中该连续核苷酸在待测样品中存在的核酸分子中未发现。通过使具有与侧翼序列(CFS)互补的序列的分子与侧翼序列杂交，保护侧翼序列免受核酸酶的降解。

IV.互补侧翼序列(CFS)

每个CFS(例如，图2A的208或210)与其相应的NPPF侧翼序列互补。例如，如果NPPF包括5'-侧翼序列，则在该方法中将使用5CFS。如果NPPF包含3'-侧翼序列，则在该方法中将使用3CFS。如果5'-和3'-侧翼序列彼此不同，则5CFS和3CFS将彼此不同。本领域技术人员将理解，只要NPPF与其标靶和相应的CFS之间可发生杂交，CFS和NPPF的侧翼序列不需要100％互补。在一些实例中，NPPF的侧翼序列和CFS共享至少80％、至少90％、至少95％、至少98％、至少99％或100％的互补性。在一些实例中，CFS与其对应的NPPF的侧翼序列长度相同。例如，如果侧翼序列是25nt，则CFS可以是25nt。

在一些实例中，CFS与标靶基因组中发现的序列不相似。例如，如果标靶核酸是人序列，则CFS的序列(和相应的侧翼序列)与标靶基因组中发现的序列不相似。这有助于减少可能存在于标靶基因组中的非靶序列与CFS(和NPPF)的结合。分析序列与基因组的相似性的方法是本领域熟知的。

CFS可以提供与扩增引物的至少一部分互补的通用扩增点。因此，CFS允许使用相同的扩增引物来扩增不同标靶核酸分子的经连接的标靶。因此，CFS序列的至少一部分与扩增引物的至少一部分互补。如图5所示，这允许引物与CFS杂交，并扩增与CFS连接的标靶核酸分子。由于在不同的标靶核酸分子之间CFS可以是相同的，这允许相同的引物用于扩增与CFS连接的任何数量的不同标靶。因此，即使靶序列不同，包括与5CFS互补的序列的扩增引物和包含与3CFS互补的序列的扩增引物都可以用在单个反应中以扩增多个经连接的标靶。

在一些实例中，CFS不包括实验标签序列和/或测序衔接子序列。在一些实例中，CFS包括实验标签序列和/或测序衔接子序列或由其组成。在其他实例中，用于扩增经连接的标靶(包括至少一个CFS)的引物包括实验标签序列和/或测序衔接子序列(例如某些测序平台所需的poly-A或poly-T序列)，因此，允许在扩增经连接的标靶期间将实验标签和/或测序衔接子掺入经连接的标靶扩增子中。实验标签和测序衔接子在以上第II节G中描述。将理解的是，可以包括多于一个的实验标签(例如至少2个、至少3个、至少4个、或至少5个不同的实验标签)，例如用于唯一地识别经连接的标靶、经连接的标靶扩增子，或样品。

如图6A和B所示，该方法可以使用单个CFS。图6A和6B示出了5'-端(5CFS)的CFS，但是可以理解替代性地它也可以在3'-端。图6A显示了反应中的所有标靶连接到相同的CFSF1的实例(因此反应中的NPPF具有相同的侧翼序列)。用F1特异性引物的扩增可用于向每个经连接的标靶添加相同的5'-或3'-标签(例如，测序衔接子或实验标签)。例如，可以将相同的测序衔接子添加到所有经连接的标靶中，允许在相同的测序平台中测序标靶。图6B显示了反应中的每个标靶连接到不同的CFS F1、F2和F3的实例(因此反应中的NPPF或NPPF的每个亚群具有不同的侧翼序列)。在另一个实例中，用T1-F1-、T2-F2-和T3-F3-特异性引物的扩增可用于向每个不同的经连接的标靶添加不同的实验标签。

如图6C-6F所示，在一些实例中，标靶可以连接到两个CFS(因此所用的NPPF具有两个侧翼序列)，一个位于标靶的5'-端，另一个位于标靶的3'-端。图6C示出了反应中的所有标靶在两端都连接到相同CFS，F1的实例。图6D示出了其中5'-端的所有CFS都相同(例如，F1)，并且3'-端的所有CFS都相同(例如，F(a))但是5'-端和3'-端CFS不同的实例。在这样的实例中，这允许在标靶的一端包括相同的实验标签，并在标靶的另一端包括相同的衔接子。图6E示出了一端的所有CFS都相同(例如，5'-端的F1)，但另一端的所有CFS彼此不同(例如，F(a)、F(b)和F(c))的实例。在这样的实例中，这允许对所有经连接的标靶使用测序衔接子。另一端的侧翼序列F(a)、F(b)和F(c)可用于例如差异标记每个标靶(例如使用不同的实验标签)。图6F示出了其中所有CFS都不同的实例，而与它们的位置无关(例如，F(a)、F(b)、F(c)、F1、F2和F3)。在此实例中，每个CFS可用于不同的实验标签或者不同实验标签和不同测序衔接子的组合。

V.样品

样品是包含一种或多种标靶的任何集合体，例如生物样品或生物样本，例如从受试者(例如人或其他哺乳动物受试者，例如兽医受试者，例如已知或怀疑患有肿瘤或感染的受试者)获得的那些。可以使用本领域普通技术人员熟知的方法收集或获得样品。所公开方法中使用的样品可包括任何包含核酸的样本(例如基因组DNA、cDNA、病毒DNA或RNA、rRNA、tRNA、mRNA、miRNA、寡核苷酸、核酸片段、修饰的核酸、合成的核酸等)。在一个实例中，样品包括RNA。在一些实例中，待测序的标靶核酸分子在样品中交联(例如交联的DNA、mRNA、miRNA或vRNA)或可溶于样品中。在一些实例中，样品是经固定的样品，例如包含引起标靶分子交联的试剂的样品(因此在一些实例中，标靶核酸分子可以是经固定的)。在一些实例中，在检测或测序标靶核酸分子之前，样品中的标靶核酸未被提取、溶解或两者。在一些实例中，样品是非原位生物样品。

在一些实例中，所公开的方法包括在分析样品之前获得样品。在一些实例中，所公开的方法包括选择患有特定疾病或肿瘤的受试者，然后在一些实例中，进一步选择一种或更多种靶DNA或RNA以基于受试者的特定疾病或肿瘤进行检测，例如，以确定受试者的诊断或预后或选择一种或更多种疗法。在一些实例中，首先从样品中分离、提取、浓缩或以上组合操作待分析样品中的核酸分子。

在一些实例中，在进行本文提供的方法之前，样品中的RNA被逆转录。

在一些实例中，样品，例如非原位样品被裂解。某些实施例中的裂解缓冲液可以灭活降解RNA的酶，但是在有限稀释到杂交稀释缓冲液中后，它允许核酸酶活性并促进具有严格特异性的杂交。可以加入稀释缓冲液以中和裂解和其他缓冲液的抑制活性，例如对其他酶(例如聚合酶)的抑制活性。或者，可以将裂解缓冲液和其他缓冲液的组合物改变为耐受的组合物，例如通过聚合酶或连接酶。

在一些实例中，所述方法包括同时或同期分析多个样品。例如，该方法可以同时或同期分析至少两个不同的样品(例如来自不同的受试者，例如患者)。在一个这样的实例中，所述方法还可以同时或同期地检测或测序至少两个不同样品(例如，至少5个、至少10个、至少100个、至少500个、至少1000个，或至少10,000个不同的样品)中的至少两种不同的标靶核酸分子(例如2、3、4、5、6、7、8、9或10种不同的标靶)。

示例性样品包括但不限于细胞、细胞裂解物、血涂片、细胞离心制剂、流式分选或以其他方式选择的细胞群、细胞学涂片、染色体制剂、体液(例如、血液及其部分、例如白细胞、血清或血浆；唾液；痰液；尿液；脊髓液；胃液；汗液；精液；等)、口腔细胞、组织、细胞或器官的提取物、组织活检(例如、肿瘤或淋巴结活组织检查)、液体活组织检查、细针抽吸物、brocoscopic灌洗物、穿孔活检、循环肿瘤细胞、骨髓、羊膜穿刺样品、尸检材料、新鲜组织、冷冻组织、固定组织、固定和蜡(例如，石蜡)包埋的组织、骨髓和/或组织切片(例如，低温恒温器组织切片和/或石蜡包埋的组织切片)。

示例性样品可以从正常细胞或组织，或从肿瘤细胞或组织获得。瘤形成是一种生物学状态，其中一个或更多个细胞经历了具有分化丧失、生长速度增加、周围组织侵入的特征性间变，并且其中细胞可能具有转移。在特定实例中，生物样品包括肿瘤样品，例如含有肿瘤细胞的样品。

示例性肿瘤细胞或组织可包括在实体肿瘤中或从实体肿瘤中分离，包括肺癌(例如，非小细胞肺癌，例如肺鳞状细胞癌)，乳腺癌(例如小叶和导管癌)，肾上腺皮质癌，成釉细胞瘤，壶腹癌，膀胱癌，骨癌，宫颈癌，胆管瘤，结直肠癌，子宫内膜癌，食道癌，胃癌，胶质瘤，颗粒状细胞肿瘤(granular call tumor)，头颈癌，肝细胞癌，水肿性痣，淋巴瘤，黑色素瘤，间皮瘤，骨髓瘤，神经母细胞瘤，口腔癌，骨软骨瘤，骨肉瘤，卵巢癌，胰腺癌，毛细胞瘤，前列腺癌，肾细胞癌，唾液腺肿瘤，软组织肿瘤，斯皮茨痣(Spitz nevus)，鳞状细胞癌，畸胎癌和甲状腺癌。示例性肿瘤细胞也可包括在血液癌症中或从血液癌症中分离，包括白血病，包括急性白血病(如急性淋巴细胞白血病，急性髓细胞白血病，急性髓性白血病和成髓细胞，早幼粒细胞，髓单核细胞，单核细胞和红白血病)，慢性白血病(如慢性髓细胞(粒细胞)白血病，慢性髓性白血病和慢性淋巴细胞白血病)，真性红细胞增多症，淋巴瘤，霍奇金病，非霍奇金淋巴瘤(慢性和高级形式)，多发性骨髓瘤，瓦尔登斯特伦巨球蛋白血症，重链疾病，骨髓增生异常综合征和骨髓增生异常。

例如，来自肿瘤的含有细胞物质的样品可以通过手术切除全部或部分肿瘤，通过从肿瘤中收集细针抽吸物以及其他方法来获得。在一些实例中，将组织或细胞样品涂覆于基质并分析以确定一种或多种靶DNA或RNA的存在。用于公开方法的固体支持物仅需要携带生物样品，并且任选地允许方便地检测样品中的组分(例如，蛋白质和/或核酸序列)。示例性支持物包括显微镜载玻片(例如，玻璃显微镜载玻片或塑料显微镜载玻片)、盖玻片(例如，玻璃盖玻片或塑料盖玻片)、组织培养皿、多孔板、膜(例如硝酸纤维素或聚偏二氟乙烯(PVDF))或BIACORE^TM芯片。

所公开的方法是灵敏且特异的，并且允许对甚至包含有限数量的细胞的样品中的标靶核酸分子进行测序。包含少量细胞，例如少于250,000个细胞(例如少于100,000个、少于50,000个、少于10,000个、少于1,000个、少于500个、少于200个、少于100个细胞或少于10个细胞)的样品包括但不限于FFPE样品，细针吸出物(例如来自肺，前列腺，淋巴，乳房或肝脏的那些)，穿刺活检，针刺活检，小群体的(例如，FACS)分选的细胞或循环肿瘤细胞，肺吸出物，少量激光捕获，流式分选的，或宏观的细胞或循环的肿瘤细胞，外来体和其他亚细胞颗粒，或体液(如血浆，血清，脊髓液，唾液和乳房吸出物)。例如，可以在少至1000个细胞(例如包含1000个或更多个细胞的样品，例如1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、50,000个或更多个细胞)中对靶DNA或靶RNA进行测序(并因此检测)。在一些实例中，可以在约1000至100,000个细胞(例如约1000至50,000、1000至15,000、1000至10,000、1000至5000、3000至50,000、6000至30,000，或10,000至50,000个细胞)中检测靶DNA或靶RNA的表达。在一些实例中，可以在约100至250,000个细胞，例如约100至100,000、100至50,000、100至10,000、100至5000、100至500、100至200，或100至150个细胞中检测靶DNA或靶RNA的表达。在其他实例中，靶DNA或靶RNA可以在约1至1000个细胞(例如约1至500个细胞，约1至250个细胞、约1至100个细胞、约1至50个细胞、约1至25个细胞，或约1个细胞)中测序。

在将样品与靶特异性试剂(例如NPPF和相应的CFS)接触之前(或同时)，可以以多种方式处理样品。一种相对简单的处理是将样品悬浮在缓冲液(例如裂解缓冲液)中，其在单一溶液中保存样品的所有组分。在一些实例中，处理样品以从样品中部分或完全分离(例如，提取)标靶(例如，DNA或mRNA)。当标靶与样品中的其他非标靶生物组分纯化分离出来时，已经分离或提取了标靶(例如DNA或RNA)。纯化是指将标靶与样品中也存在的一种或多种外来组分(例如，细胞器、蛋白质)相分离。从混合样本或样品中分离、提取或纯化的组分相比未纯化或未提取的样品通常富集至少50％、至少60％、至少75％、至少90％，或至少98％或甚至至少99％。

从样品中分离生物组分是耗时的并且具有例如通过降解和/或用于分离的方法效率低或不完全而造成丢失被分离的组分的风险。此外，对于一些样品，例如经固定的组织，众所周知(例如，与新鲜或冷冻组织相比)难以高保真地分离标靶(诸如DNA或RNA(例如，mRNA或miRNA))，因为据认为标靶的至少一些部分与固定样品中的其他成分交联，因此，不能容易地分离或溶解，并且在分离可溶性和不溶性级分时可能会丢失。另外，在沉淀或基质结合步骤期间可能会丢失非常短的DNA和RNA片段，导致测量偏差。因此，在一些实例中，所公开的标靶核酸测序方法不需要或涉及在使样品与一种或多种NPPF和相应的CFS接触之前从样品中纯化、提取或分离标靶核酸分子，和/或仅涉及将样品悬浮在溶液中，例如裂解缓冲液，其在样品与NPPF和相应的CFS接触之前保留样品的所有组分。因此，在一些实例中，该方法不包括在分析之前从样品中分离核酸分子。

在一些实例中，样品中的细胞在水溶液中裂解或透化(例如使用裂解缓冲液)。水溶液或裂解缓冲液包括洗涤剂(如十二烷基硫酸钠)和一种或更多种离液剂(如甲酰胺、盐酸胍、异硫氰酸胍或尿素)。该溶液还可以包含缓冲液(例如SSC)。在一些实例中，裂解缓冲液包含约8％至60％甲酰胺(v/v)、约0.01％至0.1％SDS，和约0.5-6X SSC(例如，约3XSSC)。缓冲液可任选地包括tRNA(例如，约0.001至约2mg/ml)；核糖核酸酶；DNA酶；蛋白酶K；降解蛋白质的酶(例如胶原酶或脂肪酶)，基质，碳水化合物，脂质或一种寡核苷酸或其组合。裂解缓冲液还可包括pH指示剂，例如酚红。将细胞在水溶液(任选地用油覆盖)中温育足够的时间(例如约1分钟至约60分钟，例如约5分钟至约20分钟，或约10分钟)且足够的温度(例如，约22℃至约110℃，例如，约80℃至约105℃，约37℃至约105℃，或约90℃至约100℃)以裂解或透化细胞。在一些实例中，裂解在约50℃、65℃、95℃或105℃下进行。在一些实例中，裂解步骤包括在约95℃下将样品温育约5-15分钟以使样品中的RNA变性，但不使基因组DNA变性。在其他实例中，裂解步骤包括在约105℃下温育样品约5-15分钟以使样品中的RNA和基因组DNA都变性。在一个实例中，蛋白酶K包含在裂解缓冲液中。

在一些实例中，粗细胞裂解物直接使用而无需进一步纯化。可以在存在或不存在一种或多种NPPF和相应的CFS的情况下裂解细胞。如果在不存在NPPF和相应的CFS的情况下裂解细胞，则可以随后将一种或多种NPPF和相应的CFS添加到粗裂解物中。在其他实例中，在裂解物与一种或多种NPPF和相应的CFS接触之前，从细胞裂解物中分离核酸(例如DNA和/或RNA)。

在其他实例中，通过将组织固定和包埋入介质中来制备组织样品，或者包括将细胞悬浮液制备成在固体支持物(例如载玻片)上的单层，例如通过将细胞涂抹或离心到固体支持物上。在其他实例中，新鲜冷冻(例如，未固定的)组织或组织切片可用于本文公开的方法中。在特定实例中，FFPE组织切片用于所公开的方法中。

在一些实例中，使用包埋介质(embedding medium)。包埋介质是惰性材料，其中包埋组织和/或细胞以帮助保存它们以供将来分析。包埋还可以使得将组织样本切成薄片。包埋介质包括石蜡、纤维素、OCT^TM化合物、琼脂、塑料或丙烯酸。许多包埋介质是疏水的；因此，在分析之前可能需要除去惰性材料，其主要使用亲水性试剂。术语脱石蜡或脱蜡是指从生物样品中部分或完全除去任何类型的包埋介质。例如，石蜡包埋的组织切片通过有机溶剂，例如甲苯、二甲苯、柠檬烯或其他合适的溶剂而脱蜡。在其他实例中，直接利用石蜡包埋的组织切片(例如，没有脱蜡步骤)。

组织可以通过任何合适的方法固定，包括灌注或浸没在固定剂中。固定剂可以分类为交联剂(例如醛，例如甲醛、多聚甲醛和戊二醛，以及非醛交联剂)、氧化剂(例如金属离子和络合物，例如四氧化锇和铬酸)、蛋白质变性剂(例如乙酸、甲醇和乙醇)、未知机制的固定剂(如氯化汞、丙酮和苦味酸)、组合试剂(如Carnoy固定剂、methacarn、Bouin液、B5固定剂、Rossman液和Gendre液)、微波炉和其他各种固定剂(例如，排阻体积固定和蒸汽固定)。添加剂也可以包含在固定剂中，例如缓冲剂、洗涤剂、单宁酸、苯酚、金属盐(例如氯化锌、硫酸锌和锂盐)和镧。

制备组织或细胞样品中最常用的固定剂是甲醛，通常是福尔马林溶液(缓冲溶液中4％甲醛，称为10％缓冲福尔马林)的形式。在一个实例中，固定剂是10％中性缓冲福尔马林，因此在一些实例中，样品是经福尔马林固定的。

在一些实例中，样品是环境样品(例如土壤、空气、空气过滤器或水样品，或从表面获得的样品(例如通过擦拭))，或食物样品(例如含有样本的蔬菜、水果、乳制品或肉类)，例如用于检测可能存在的病原体。

VI.标靶核酸

标靶核酸分子(例如靶DNA或RNA)是核酸分子，其检测、量和/或序列旨在用所公开的方法(例如以定量或定性方式)确定。在一个实例中，标靶是核酸分子的限定区域或特定部分，例如感兴趣的DNA或RNA。在标靶核酸序列是标靶DNA或标靶RNA的实例中，这种标靶可以通过其特定的序列或功能；通过其基因或蛋白质名称；或通过区分于其他核酸来唯一识别它的任何其他方法来定义。

在一些实例中，标靶核酸序列(例如，DNA或RNA)的改变与疾病或病症“相关”。即，标靶核酸序列的测序可用于推断关于疾病或病症的样品状态。例如，标靶核酸序列可以以两种(或更多种)可区分的形式存在，使得第一种形式与疾病或病症的缺失相关，而第二种(或不同的)形式与疾病或病症的存在相关。两种不同形式可以定性区分，例如通过核苷酸多态性或突变，和/或两种不同形式可以定量区分，例如通过样品中存在的标靶核酸序列的拷贝数。

标靶包括单链、双链或其他多链核酸分子(如DNA(如基因组、线粒体或合成)、RNA(如mRNA、miRNA、tRNA、siRNA、长非编码(nc)RNA，生物学上发生的反义RNA，Piwi相互作用RNA(piRNA)或核仁小RNA(snoRNA))，无论是来自真核生物、原核生物、病毒、真菌、细菌、寄生虫还是其他生物有机体。基因组DNA标靶可包括基因组的一个或几个部分，例如编码区(例如基因或外显子)、非编码区(无论是否具有已知或未知的生物学功能，例如增强子、启动子、调节区、端粒，或“无义”DNA。在一些实施方案中，标靶可以包含或可以是天然存在(例如，种系或体细胞突变)或以其他方式诱导(例如，化学或辐射诱导的突变)的突变的结果。此类突变可包括基因组重排(例如易位、插入、缺失或倒位)、单核苷酸变异和/或基因组扩增(或由其产生)。在一些实施方案中，标靶可含有一个或多个修饰的或合成的单体单元(例如，肽核酸(PNA)、锁核酸(LNA)、甲基化核酸、翻译后修饰的氨基酸、交联的核酸或交联氨基酸)。

NPPF可以特异性结合的标靶核酸分子的部分也可以被称为“标靶”，如上下文所指出的，但更具体地可以称为标靶部分、互补区域(CR)、靶位点、受保护的标靶区域或受保护的位点，或类似的。特异性结合其互补区域的NPPF形成复合物，该复合物可以与整个标靶和/或样品整合，或者可以与整个标靶和/或样品相分离的(已分离开的或变得分离)。在一些实施方案中，NPPF/CR复合物与整个标靶和/或样品分离(或变得解离)，例如通过核酸酶如S1核酸酶的作用。

可以使用所公开的方法分析所有类型的标靶核酸分子。在一个实例中，标靶是核糖核酸(RNA)分子，例如信使RNA(mRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、微RNA(miRNA)、siRNA、反义RNA或病毒RNA(vRNA)。在另一个实例中，标靶是脱氧核糖核酸(DNA)分子，例如基因组DNA(gDNA)、线粒体DNA(mtDNA)、叶绿体DNA(cpDNA)、病毒DNA(vDNA)、cDNA或转染的DNA。在一个具体实例中，标靶是反义核苷酸。在一些实例中，可以使用所公开的方法对细胞或组织的整个转录组进行测序。在一个实例中，待测序的标靶核酸分子是稀有核酸分子，例如在样品中仅出现少于约100,000次、少于约10,000次、少于约5,000次、少于约100次、少于10次，或仅一次，例如核酸分子在样品中仅出现1至10,000次、1至5,000次、1至100次或1至10次。

多个标靶可以在相同的样品或测定中测序，或甚至在多个样品或测定中测序，例如同时或同期测序。类似地，单一标靶可以在多个样品中测序，例如同时或同期测序。在一个实例中，标靶核酸分子是miRNA和mRNA。因此，在这样的实例中，该方法将包括使用至少一种对miRNA特异的NPPF和至少一种对mRNA特异的NPPF。在一个实例中，标靶核酸分子是两种不同的DNA分子。因此，在这样的实例中，该方法包括使用至少一种对第一标靶DNA特异的NPPF和至少一种对第二标靶DNA特异的NPPF。在一个实例中，标靶核酸分子是两种不同的RNA分子。因此，在这样的实例中，该方法将包括使用至少一种对第一标靶RNA特异的NPPF和至少一种对第二标靶RNA特异的NPPF。

在一些实例中，所公开的方法允许DNA或RNA单核苷酸多态性(SNP)或变体(sNPV)、剪接点、甲基化DNA、基因融合或其他突变、蛋白质结合的DNA或RNA以及cDNA的测序，以及表达水平(例如DNA或RNA表达、诸如cDNA表达、mRNA表达、miRNA表达、rRNA表达、siRNA表达或tRNA表达)。可以设计核酸酶保护探针与其杂交的任何核酸分子可以通过所公开的方法进行定量和鉴定。

在一个实例中，通过使用NPPF检测DNA甲基化，NPPF包括在已发生或未发生甲基化的位点处的碱基错配，使得在处理靶样品时，甲基化碱基转化为与NPPF中的碱基互补的不同碱基。因此，在一些实例中，该方法包括用亚硫酸氢盐处理样品。

本领域技术人员将理解，标靶可包括天然或非天然碱基或其组合。

在具体的非限制性实例中，选择与肿瘤(例如，癌症)相关的标靶核酸(例如标靶DNA或标靶RNA)。已经在肿瘤细胞中，尤其是在癌细胞中，例如B细胞和T细胞白血病、淋巴瘤、乳腺癌、结肠癌、神经系统癌症等中鉴定了许多染色体异常(包括易位和其他重排、重复或缺失)或突变。

在一些实例中，标靶核酸分子包括野生型和/或突变的：δ-氨基乙酰丙酸合酶1(ALAS1)(例如，GenBank登录号NM_000688.5或OMIM 125290)、60S核糖体蛋白L38(RPL38)(例如，GenBank登录号NM_000999.3或OMIM 604182)、原癌基因B-Raf(BRAF)(例如，GenBank登录号NM_004333.4或OMIM 164757)(例如野生型BRAF或V600E、V600K、V600R、V600E2和/或V600D突变，例如参见图10)、叉头盒蛋白L2(FOXL2)(例如，GenBank登录号NM_023067.3或OMIM 605597)(例如野生型FOXL2或nt820snp C->G)；表皮生长因子受体(EGFR)(例如，GenBank登录号NM_005228.3或OMIM 131550)(例如野生型EGFR，和/或T790M、L858R、D761Y、G719A、G719S和G719C突变中的一种或多种，或图9中所示的其他突变)；GNAS(例如，GenBank登录号NM_000516.5或OMIM 139320)；或KRAS(例如，GenBank登录号NM_004985.4或OMIM190070)(例如野生型KRAS、D761Y突变、G12突变诸如G12D、G12V、G12A、G12C、G12S、G12R中的一种或多种、G13突变诸如G13D，和/或Q61突变诸如Q61E、Q61R、Q61L、Q61H-C和/或Q61H-T中的一种或多种，例如参见图10)；(也参见图7A、7B、8)。

在一些实例中，标靶核酸分子包括GAPDH(例如，GenBank登录号NM_002046)、PPIA(例如，GenBank登录号NM_021130)、RPLP0(例如，GenBank登录号NM_001002或NM_053275)、RPL19(例如，GenBank登录号NM_000981)、ZEB1(例如，GenBank登录号NM_030751)、Zeb2(例如，GenBank登录号NM_001171653或NM_014795)、CDH1(例如，GenBank登录号NM_004360)、CDH2(例如，GenBank登录号NM_007664)，VIM(例如，GenBank登录号NM_003380)、ACTA2(例如，GenBank登录号NM_001141945或NM_001613)、CTNNB1(例如，GenBank登录号NM_001904、NM_001098209或NM_001098210)、KRT8(例如，GenBank登录号NM_002273)、SNAI1(例如，GenBank登录号NM_005985)、SNAI2(例如，GenBank登录号NM_003068)、TWIST1(例如，GenBank登录号NM_000474)、CD44(例如，GenBank登录号NM_000610、NM_001001389、NM_00100390、NM_001202555、NM_001001391、NM_001202556、NM_001001392、NM_001202557)、CD24(例如，GenBank登录号NM_013230)、FN1(例如，GenBank登录号NM_212474、NM_212476、NM_212478、NM_002026、NM_212482、NM_054034)、IL6(例如，GenBank登录号NM_000600)、MYC(例如，GenBank登录号NM_002467)、VEGFA(例如，GenBank登录号NM_001025366、NM_001171623、NM_003376、NM_001171624、NM_001204384、NM_001204385、NM_001025367、NM_001171625、NM_001025368、NM_001171626、NM_001033756、NM_001171627、NM_001025370、NM_001171628、NM_001171622、NM_001171630)、HIF1A(例如，GenBank登录号NM_001530、NM_181054)、EPAS1(例如，GenBank登录号NM_001430)、ESR2(例如，GenBank登录号NM_001040276、NM_001040275、NM_001214902、NM_001437、NM_001214903)、PRKCE(例如，GenBank登录号NM_005400)、EZH2(例如，GenBank登录号NM_001203248、NM_152998、NM_001203247、NM_004456、NM_001203249)、DAB2IP(例如，GenBank登录号NM_032552、NM_138709)、B2M(例如，GenBank登录号NM_004048)和SDHA(例如，GenBank登录号NM_004168)。

在一些实例中，靶miRNA包括hsa-miR-205(MIR205，例如GenBank登录号NR_029622)、hsa-miR-324(MIR324，例如GenBank登录号NR_029896)、hsa-miR-301a(MIR301A，例如，GenBank登录号NR_029842)、hsa-miR-106b(MIR106B，例如GenBank登录号NR_029831)、hsa-miR-877(MIR877，例如，GenBank登录号NR_030615)、hsa-miR-339(MIR339，例如，GenBank登录号NR_029898)、hsa-miR-10b(MIR10B，例如，GenBank登录号NR_029609)、hsa-miR-185(MIR185，例如，GenBank登录号NR_029706)、hsa-miR-27b(MIR27B，例如，GenBank登录号NR_029665)、hsa-miR-492(MIR492，例如，GenBank登录号NR_030171)、hsa-miR-146a(MIR146A，例如，GenBank登录号NR_029701)、hsa-miR-200a(MIR200A，例如，GenBank登录号NR_029834)、hsa-miR-30c(例如，GenBank登录号NR_029833，NR_029598)、hsa-miR-29c(MIR29C，例如，GenBank登录号NR_029832)、hsa-miR-191(MIR191，例如，GenBank登录号NR_029690)，或hsa-miR-655(MIR655，例如，GenBank登录号NR_030391)。

在一个实例中，标靶是病原体核酸，例如病毒RNA或DNA。示例性病原体包括但不限于病毒、细菌、真菌、寄生虫和原生动物。在一个实例中，所述标靶是病毒RNA。病毒包括正链RNA病毒和负链RNA病毒。示例性的正链RNA病毒包括但不限于：小核糖核酸病毒(例如口蹄疫病毒[例如口蹄疫病毒(FMDV)])、心脏病毒(Cardioviridae)；肠道病毒(Enteroviridae)(如柯萨奇病毒、埃可病毒、肠病毒和脊髓灰质炎病毒)；鼻病毒(Rhinoviridae/Rhinoviruses))；肝病毒(Hepataviridae(甲型肝炎病毒))；披膜病毒(其实例包括风疹；甲病毒(如西部马脑炎病毒、东部马脑炎病毒和委内瑞拉马脑炎病毒))；黄病毒(其实例包括登革热病毒、西尼罗河病毒和日本脑炎病毒)；和冠状病毒(其实例包括SARS冠状病毒，如Urbani菌株)。示例性的负链RNA病毒包括但不限于：正粘病毒(例如流感病毒)、弹状病毒(例如狂犬病病毒)和副粘病毒(其实例包括麻疹病毒、呼吸道合胞病毒和副流感病毒)。在一个实例中，标靶是来自DNA病毒的病毒DNA，例如疱疹病毒(例如水痘-带状疱疹病毒，例如Oka株；巨细胞病毒；和单纯疱疹病毒(HSV)1型和2型)，腺病毒(例如腺病毒1型和腺病毒41型)，痘病毒(如痘苗病毒)和细小病毒(如细小病毒B19)。在另一个实例中，所述标靶是逆转录病毒核酸，例如来自人免疫缺陷病毒1型(HIV-1)例如亚型C、HIV-2的核酸；马传染性贫血病毒；猫免疫缺陷病毒(FIV)；猫白血病病毒(FeLV)；猿猴免疫缺陷病毒(SIV)；和禽肉瘤病毒。在一个实例中，标靶核酸是细菌核酸。在一个实例中，所述细菌核酸来自革兰氏阴性细菌，例如大肠杆菌(K-12和O157：H7)、志贺氏痢疾杆菌(Shigella dysenteriae)和霍乱弧菌(Vibrio cholerae)。在另一个实例中，细菌核酸来自革兰氏阳性细菌，例如炭疽芽孢杆菌(Bacillus anthracis)、金黄色葡萄球菌(Staphylococcus aureus)、肺炎球菌(pneumococcus)、淋球菌(gonococcus)和链球菌性脑膜炎(streptococcal meningitis)。在一个实例中，标靶核酸是来自原生动物、线虫(nemotodes)或真菌的核酸。示例性原生动物包括但不限于疟原虫(Plasmodium)、利什曼原虫(Leishmania)、棘阿米巴(Acanthamoeba)、贾第虫(Giardia)、内阿米巴虫(Entamoeba)、隐孢子虫(Cryptosporidium)、等孢子球虫(Isospora)、肠袋虫(Balantidium)、毛滴虫(Trichomonas)、锥虫(Trypanosoma)、纳氏虫(Naegleria)和弓形虫(Toxoplasma)。示例性真菌包括但不限于球虫(Coccidiodes immitis)和皮肤芽孢杆菌(Blastomycesdermatitidis)。

本领域技术人员可以鉴定可以利用本文公开的方法检测的其他标靶DNA或RNA和/或另外的标靶miRNA。

VII.检验输出

在一些实施方案中，所公开的方法包括确定样品中一种或多种标靶核酸分子的序列，其可包括已检测序列的定量。可以在提供测试结果信息的可感知的输出中向用户(诸如科学家、临床医生或其他医疗保健工作者、实验室人员或患者)提供方法的结果。在一些示例中，输出可以是纸张输出(例如，书写或打印输出)、屏幕上的显示、图形输出(例如，图形、图表或其他图样)或可听的输出。在一个实例中，输出是表格或图形，其包括样品中经测序的标靶核酸(或未检测到的序列)的存在或量(例如标准化量)的定性或定量指示。在实施方案的其他实例中，输出是样品中一种或多种标靶核酸分子的序列，这种报告指示标靶分子中存在特定突变。

输出可提供定量信息(例如，特定标靶核酸分子的量或相对于对照样品或值的特定标靶核酸分子的量)或可提供定性信息(例如，确定存在或不存在特定的标靶核酸分子)。在另外的实例中，输出可以提供关于样品中标靶核酸分子的相对量的定性信息，例如鉴定相对于对照的增加或减少或相对于对照没有变化。

如本文所讨论的，经连接的标靶或经连接的标靶扩增子可包括一个或多个实验标签，其可用于例如鉴定特定患者、样品、实验或靶序列。使用这样的标签允许对测序的经连接的标靶或经连接的标靶扩增子进行“分选”或甚至计数，从而允许在单个反应中分析多种不同的样品(例如来自不同的患者)、多种不同的标靶(例如至少两种不同的核酸)或其组合。在一个实例中，Illumina和Bowtie软件可以用于这种分析。

在一个实例中，经连接的标靶或经连接的标靶扩增子包括对于每种不同的标靶核酸分子独特的实验标签。使用这样的标签允许人们仅对该标签进行测序或检测，而无需对整个经连接的标靶或经连接的标靶扩增子进行测序，以鉴定所述经连接的标靶或经连接的标靶扩增子。此外，如果要分析多个核酸标靶，则对每个标靶使用独特的实验标记简化了分析，因为可以对每个经检测或测序的实验标记进行分类，并且需要时可进行计数。这允许对样品中的标靶核酸进行半定量或定量，因为经连接的标靶或经连接的标靶扩增子与样品中的标靶大致成化学计量比例。例如，如果在样品中检测或测序多个标靶核酸，则该方法允许通过简单检测或测序然后分选实验标签来生成显示每个靶序列以及经检测或测序的拷贝数的表格或图形。

在另一个实例中，经连接的标靶或经连接的标靶扩增子包括对于每种不同样品唯一的实验标签(例如每个患者样品的独特标签)。使用这种标签允许人们将特定检测的经连接的标靶或经连接的标靶扩增子与特定样品相关联。因此，如果在同一反应中分析多个样品(例如相同的孔或相同的测序反应)，则对每个样品使用独特的实验标签简化了分析，因为每个经检测或测序的经连接的标靶或经连接的标靶扩增子可以是与特定样本相关联的。例如，如果在样品中检测或测序标靶核酸，则该方法允许生成显示每个样品的分析结果的表格或图形。

本领域技术人员将理解，每个经连接的标靶或经连接的标靶扩增子可包括多个实验标签(例如至少2、3、4、5、6、7、8、9或10个实验标签)，例如代表靶序列的标签，以及代表样品的另一个标签。一旦检测或测序每个标签，就可以使用适当的软件以任何所需的格式对数据进行分类，例如图形或表格。例如，这允许同时或同期分析多个样品中的多个靶序列。

在一些实例中，将测序的经连接的标靶或经连接的标靶扩增子与每个标靶核酸序列的已知序列的数据库进行比较。在一些实例中，这种比较允许检测突变，例如SNP。

VIII.试剂盒

本文还公开了可用于直接测序一种或多种标靶核酸分子的试剂盒。

试剂盒包括与一种或多种核酸标靶特异性杂交的一种或多种NPPF。该试剂盒还包括相应的CFS。例如，如果NPPF包含5'-侧翼序列，则试剂盒可包括与5'-侧翼序列互补的5CFS。如果NPPF包含3'-侧翼序列，则试剂盒可包括与3'-侧翼序列互补的3CFS。在一些实例中，NPPF和CFS在相同的小瓶或容器中。在一些实例中，试剂盒包括5CFS和3CFS，其中一个CFS包括捕获部分。在一些实例中，试剂盒包括对单一标靶核酸分子具有特异性的多种NPPF和相应CFS，例如可以与标靶核酸分子特异性杂交的至少2种、至少3种、至少4种、至少5种、至少10种，或至少20种不同的NPPF(例如2、3、4、5、6、7、8、9、10、12、15或20种不同的NPPF)。在一些实例中，试剂盒包括对多种不同标靶核酸分子具有特异性的多种NPPF和的相应CFS，例如至少2种、至少3种、至少4种、至少5种、至少10种、至少20种、至少50种、至少75种，或至少100种不同的标靶核酸分子(如2、3、4、5、6、7、8、9、10、12、15、20、40、50、75、100、200或500种不同的标靶核酸分子)。在一些实施方案中，所公开的试剂盒包括对更多对照核酸分子，例如阳性(例如管家)或阴性对照(例如ANT)具有特异性的至少一种NPPF和相应CFS。

在一些实例中，试剂盒包括核酸探针或引物(例如在单独的小瓶或容器中)，其允许扩增标靶核酸分子，例如经连接的标靶核酸分子。在一些实例中，这种探针或引物的至少一部分与试剂盒中的CFS互补，因此允许探针或引物与CFS之间的杂交。在一些实例中，此类探针或引物包括测序衔接子序列和/或实验标签序列(或与其具有互补性的序列)。

在一些实例中，试剂盒另外包括以下中的一种或多种(例如至少2种、至少3种、至少4种，或至少5种)：含有缓冲液的容器(如裂解缓冲液、血浆裂解缓冲液；杂交缓冲液、洗涤缓冲液、扩增缓冲液、变性缓冲液、连接缓冲液、洗脱缓冲液；和/或测序缓冲液)；含有对单链核酸特异的核酸酶(如S1核酸酶)的容器；含乙醇(如80％乙醇)的容器；含有变性油的容器；含有蛋白酶K的容器；含有连接酶和聚合酶的容器(例如在缓冲液中)；含有DNA酶的容器(如DNA酶I)；含有RNA酶(如RNA酶H)的容器；含有可以特异性结合扩增子(例如，包括CFS的经连接的标靶扩增子)的珠子的容器；和含有PCR试剂(例如PCR缓冲液、聚合酶、dNTP、逆转录酶、UDG中的两种或多种)的容器。在一些实例中，试剂盒还包括对照样品，例如已知包括或排除特定核酸分子的样品。在一些实例中，试剂盒还包括用于阳性对照的对照NPPF或加标(spike in)标靶。

在一些实例中，试剂盒包括NPPF、CFS、包含缓冲液和S1酶的消化溶液、洗涤缓冲液、包含连接酶(和任选的聚合酶)和缓冲液的连接溶液、PCR主混合物(其可包括聚合酶、缓冲液、dNTP、UDG(任选的)逆转录酶、引物)、净化珠溶液、80％乙醇、洗脱溶液、裂解缓冲液、变性油、蛋白酶K和任选的血浆裂解缓冲液(例如在单独的小瓶中)。在一些实例中，此类试剂盒还包括DNA酶(例如DNA酶I)、RNA酶(例如RNA酶H)或两者。

试剂盒还可包括说明材料。说明材料可以是书写的、电子形式的，或者也可以是可视的(如视频文件)。

实施例

实施例1

以单碱基分辨率对设计用于检测核酸标靶的多种cNPPF进行同时测序

该实施例描述了用于产生和测序cNPPF(即经连接的标靶)的方法。生成了一组24种NPPF。每种NPPF包括对特定标靶核酸分子具有特异性的区域，其长度为50个核苷酸，对于所有24个探针，中值T_m为70.3℃，以及包括两端都有的侧翼序列。

对于所有NPPF，无论其标靶如何，5'-和3'-侧翼序列彼此不同，但在每一NPPF上的每个5'CFS和每个3'CFS是相同的。5'-侧翼序列(5'TCCCTACACGACGCTCTTCCGAUCT 3'；SEQID NO:24)是T_m为62.8℃的25个核苷酸，3'-侧翼序列(5'GAUCGGAAGAGCACACGTCTGAACT 3'；SEQ ID NO:25)是T_m为60.5℃的25个核苷酸。每一NPPF在侧翼序列中设计有两个dUTP碱基。这些dUTP碱基在SEQ ID NO:24和25中表示为“U”(上文以下划线标记)。

使用上述NPPF对对应于七种探针的标靶材料的混合物进行杂交。滴定标靶材料输入以提供连接效率的信息。标靶在其5'-端被磷酸化。

合并不同的NPPF，并与溶液中系列稀释的标靶杂交，以及与NPPF上的侧翼区域互补的CFS杂交。3'CFS携带内部生物素部分并在5'-端磷酸化。在95℃下初始变性5分钟后，在50℃下进行杂交。

杂交后，通过在缓冲液中加入S1酶对杂交的混合物进行S1消化。将S1反应在50℃下温育1小时。

在S1介导消化未杂交的靶DNA、NPPF和CFS之后，将反应冷却至室温。随后，将浓度为4μg/μl的10μl Dynabeads MyOne C1链霉亲和素顺磁珠(ThermoFisher Scientific)加入到反应中。将珠子与混合物在室温下温育30分钟，使得3'CFS上的生物素部分被珠子上的链霉亲和素捕获。

在室温下，将珠子在50μl的1×SSC-T缓冲液(含有0.05％Tween的1×SSC缓冲液)中洗涤三次。通过将反应管置于支架磁体上以将珠子收集，然后将珠子重新悬浮在1×SSC-T中来进行洗涤。在这种温和缓冲液中洗涤可使杂交结构保持完整。

将珠子重新悬浮在20μl含有200单位T4DNA连接酶的连接混合物中。连接在室温下进行1小时。在连接反应后，在50℃用50μl dH₂O洗涤珠子。通过将反应管置于支架磁体上并使珠子被收集，然后将洗涤缓冲液加入珠子中并在50℃下将管温育10分钟来进行洗涤。重复两次，共洗涤三次。这些洗涤使双链产物变性并洗去NPPF，将经连接的标靶-CFS复合物留在珠子上。洗涤后，最后一次收集珠子并重新悬浮在20μl dH₂O中。

然后将包含样品中使用的原始标靶的经连接的cNPPF的部分上述反应与PCR引物一起温育。一个引物包括与5'-侧翼序列互补的序列，第二个引物包括与3'-侧翼序列互补的序列。两个引物还包括允许将实验标签掺入所得扩增子中的序列，使得使用这些引物扩增的单个样品中的每个cNPPF具有相同的两个核苷酸实验标签。

第一引物(5'AATGATACGGCGACCACCGAGATCTACACxxxxxxxxACACTCTTTCCCTACACGACGCTCTTCCG 3'；SEQ ID NO:26)长度为66个碱基，并携带八个核苷酸的实验标签(在上述序列中标为“xxxxxxxx”)。这些碱基中的22个与5'-侧翼序列相同。这22个碱基的Tm为60.9℃。第二引物，(5'CAAGCAGAAGACGGCATACGAGATxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCG 3'；SEQ ID NO:27)长度为60个碱基，并携带六个核苷酸的实验标签(在上述序列中标为“xxxxxx”)。第二引物的前22个核苷酸与3'-侧翼区完全互补，其Tm约为59.5℃。

以上标为“xxxxxxxx”或“xxxxxx”的实验标签是以下序列之一：

在单独的PCR反应中扩增每个反应，并且用不同的实验标签组合扩增每个反应，因此可以在对合并的反应测序后分别鉴定每个反应。在所有反应中进行扩增之前用尿嘧啶DNA去糖基酶(UDG)处理。UDG催化从含尿嘧啶的DNA，包括寡核苷酸或单链DNA中释放游离尿嘧啶。UDG的功能是破坏先前酶促和洗涤步骤之后存在的任何剩余的NPPF。UDG处理后进行20个PCR循环。

将得到的扩增子合并在一起并使用基于珠子的样品净化(来自BeckmanCoulter的AMPure XP)来进行净化。然后使用Illumina MiSeq平台对含有cNPPF和实验标签的扩增子进行测序。虽然实验标签可位于几个位置，但在该实施例中，它们位于扩增子的两侧，紧邻与索引读取测序引物互补的区域的下游。因此，Illumina测序分三步进行，初始读取序列，然后使用另外两个测序引物对实验标签进行两次较短的读取(所有测序引物都包括在标准Illumina试剂盒中)。本文描述并使用的测序方法是用于在Illumina平台上多重样品的标准方法。

首先根据实验标签对每个测序的分子进行分选，然后在每个实验标签组内，计算针对每种不同标签鉴定的分子数。使用开源软件bowtie将扩增子与预期序列进行比较(Langmead et al.,Ultrafast and memory-efficient alignment of short DNAsequences to the human genome.Genome Biol 10:R25)。

图7A-7B和图8显示了对经连接的标靶和CFS进行测序的结果。该图表示对应于添加到初始杂交反应中的标靶的7种独特NPPF中的每一种检测到的扩增子数。反应中仅添加了7个标靶。预计这些将在测序反应中发出信号，但预计没有其他信号；其他17个探针是阴性对照，没有标靶存在，预计不会产生信号。结果与所有序列比对(无论对其标靶是否包括在内)。图7A显示加入的标靶导致显著的可检测信号，而其他标靶不产生显著信号。显示了原始计数。

在杂交中加入输入材料的滴定，因此标靶信号应当代表了稀释。图7B显示了标靶输入差两倍的两个反应之间的变化，并且它们确实在所有七种情况下滴定。还显示了没有添加标靶的阴性对照反应(ANT)。在所有情况下，数字代表原始计数。

这些结果表明所公开的方法可以辨别单碱基变化。24种NPPF中的6种被设计用于野生型(WT)/单碱基突变对。添加到杂交中的七个标靶中的三个与WT版本的探针匹配。图8显示了为WT/SNP对鉴定的总计数(显示了原始计数)。鉴定了野生型(WT)序列但未鉴定SNP序列，证明该方法能够辨别单碱基差异。

实施例2

示例性NPPF设计

该实施例描述了使用两种不同的NPPF设计策略生成和测序cNPPF的方法。在两种混合物中，每种NPPF包括对特定标靶核酸分子具有特异性的50个核苷酸区域。

在第一混合物中，为每个等位基因产生特定的单一NPPF，并测量该等位基因的每个核苷酸差异。例如，对于BRAF V600E突变，产生特异性地针对野生型(对应于BRAF 1799的核苷酸是dTTP或T)等位基因的NPPF，以及另一个特异性地针对突变等位基因(核苷酸1799是dATP或A)的NPPF。以这种方式产生二十四种NPPF，使得每种NPPF被设计用于具有100％碱基互补性的特定标靶。

在第二混合物中，针对每个等位基因设计一种NPPF，但设计探针仅与突变体标靶100％互补(例如，对于BRAF V600E，对应于BRAF的1799位的核苷酸是A)。因此，NPPF不是设计为与野生型等位基因或可能携带未知变化的任何其他等位基因100％互补。生成了12种这样的NPPF。

对于两种混合物中的所有NPPF，尽管5'-和3'-侧翼序列彼此不同，但在每个NPPF上的每个5'-侧翼序列和每个3'-侧翼序列是相同的。5'-侧翼序列(5'TCCCTACACGACGCTCTTCCGAUCT 3'；SEQ ID NO:24)为25个核苷酸，T_m为62.8℃，3'-侧翼序列(5'GAUCGGAAGAGCACACGTCTGAACT 3'；SEQ ID NO:25)为25个核苷酸，T_m为60.5℃。每个NPPF在侧翼序列中设计有两个dUTP碱基。这些dUTP碱基在上面的序列中用“U”表示。

使用12种双链DNA扩增子产生一组测试样品。每个扩增子携带与野生型或突变体NPPF互补的标靶序列。每个扩增子含有额外的非靶序列。将野生型和突变体标靶扩增子(各6种)以系列稀释比例混合在一起(扩增子的最终浓度相同，但组成不同，参见表1)以形成七种不同的样品：

表1:稀释系列

样品编号	WT扩增子	突变扩增子
			1	100％	0％
2	90％	10％
			3	80％	20％
4	50％	50％
			5	20％	80％
6	10％	90％
			7	0％	100％

将上述两组NPPF中的每一组与互补于NPPF上的侧翼区域的CFS相混合在一起。3'CFS携带内部生物素部分，5'CFS在5'-端磷酸化。然后将NPPF和CFS与扩增子样品杂交。对于每一NPPF组，每个样品一式三份进行。在95℃下初始变性10分钟后，在50℃的溶液中进行NPPF与其标靶的杂交。

杂交后，通过在缓冲液中加入S1酶对杂交的混合物进行S1消化。将S1反应在50℃下温育90分钟。在S1介导消化单链核酸(包括未杂交的DNA、NPPF和CFS)之后，将反应冷却至室温并加入到浓度为4μg/μl的5μl Dynabeads MyOne C1链霉亲和素顺磁珠(ThermoFisherScientific)。将珠子与混合物在室温下温育30分钟，使得3'CFS上的生物素部分被珠子上的链霉亲和素捕获。

在室温下将珠子在150μl的1×SSC-T缓冲液(含有0.05％洗涤剂的1×SSC缓冲液)中洗涤三次。在这种温和缓冲液中洗涤可使杂交结构保持完整。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在1×SSC-T中来进行洗涤。

将洗过的珠子重新悬浮在补充有dNTP的在T4DNA连接酶缓冲液中含有80单位T4DNA连接酶和0.6单位T4DNA聚合酶的20μl连接混合物中(酶和缓冲液来自于New EnglandBiolabs)。连接在室温下进行1小时。在连接反应后，用150μl的0.02％-20洗涤剂洗涤珠子三次。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在1×SSC-T中并在50℃下温育管子10分钟来进行洗涤。这些洗涤使双链产物变性并洗去NPPF，将经连接的标靶-CFS复合物留在珠子上。在扩增前将珠子重新悬浮在20μl的0.02％洗涤剂中。

然后将包含样品中使用的原始标靶的经连接的cNPPF的部分上述反应与PCR引物一起温育。一个引物包括与NPPF的5'-侧翼序列相同的序列，第二个引物包括与NPPF的3'-侧翼序列互补的序列。两种引物还包括允许将实验标签掺入所得扩增子中的序列，使得使用这些引物扩增的单一样品中的每个cNPPF具有相同的两个核苷酸实验标签。

第一引物

(5'AATGATACGGCGACCACCGAGATCTACACxxxxxxxxACACTCTTTCCCTACACGACGCTCTTCCG3'；SEQ ID NO:26)长度为66个碱基，并携带八个核苷酸的实验标签(在上述序列中标为“xxxxxxxx”)。这些碱基中的22个与NPPF的5'-侧翼序列相同。这22个碱基的T_m为60.9℃。

第二引物

(5'CAAGCAGAAGACGGCATACGAGATxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCG 3'；SEQ ID NO:27)长度为60个碱基，并携带六个核苷酸实验标签(在上述序列中标为“xxxxxx”)。第二引物的前22个核苷酸与NPPF的3'-侧翼序列完全互补，并具有约59.5℃的T_m。

以上标为“xxxxxxxx”或“xxxxxx”的实验标签是表2中所示的序列之一。

表2：示例性条形码序列

5'引物编号	5'条形码序列(引物中5'-3')	3'引物编号	3'条形码序列(引物中5'-3')
				F1	CTAATCGA(SEQ ID NO:29)	R1	CGATGT(SEQ ID NO:41)
F2	ATAGAGGC(SEQ ID NO:36)	R2	GCCAAT(SEQ ID NO:42)
				F3	GGCTCTGA(SEQ ID NO:37)	R3	CAGATC(SEQ ID NO:43)
F4	TATAGCCT(SEQ ID NO:38)	R4	GCCTAA(SEQ ID NO:44)
				F5	CCTATCCT(SEQ ID NO:39)	R5	CACTGT(SEQ ID NO:45)
F6	AGGCGAAG(SEQ ID NO:40)	R6	ATTGGC(SEQ ID NO:46)
						R7	TCAAGT(SEQ ID NO:47)
		R8	CGTACG(SEQ ID NO:48)

在单独的PCR反应中扩增每个反应，并且用不同的实验标签组合(一个5'引物和一个3'引物)扩增每个反应，因此可以在对合并的反应测序后分别鉴定每个反应。在所有反应中进行扩增之前用尿嘧啶DNA去糖基酶(UDG)处理。UDG催化从含尿嘧啶的DNA，包括寡核苷酸或单链DNA中释放游离尿嘧啶。在所述反应中，UDG的功能是破坏先前酶促和洗涤步骤之后存在的任何剩余的NPPF。UDG处理后进行22个PCR循环。

将得到的PCR反应合并在一起并使用基于珠子的样品净化(来自BeckmanCoulter的AMPure XP)来进行净化。然后使用Illumina MiSeq平台对含有cNPPF和实验标签的扩增子进行测序。虽然实验标签可位于几个位置，但在该实施例中，它们位于扩增子的两侧，紧邻与索引读取测序引物互补的区域的下游。因此，Illumina测序分三步进行，初始读取序列，然后使用另外两个测序引物对实验标签进行两次较短的读取(所有测序引物都包括在标准Illumina试剂盒中)。本文描述并使用的测序方法是用于在Illumina平台上多重样品的标准方法。

首先根据实验标签对每个测序的分子进行分选，然后在每个实验标签组内，计算针对每种不同标签鉴定的分子数。使用开源软件bowtie将扩增子与预期序列进行比较(Langmead et al.,Genome Biol 10:R25)。

图11A-11B显示了对经连接的标靶和CFS(cNPPF)进行测序的结果。该图表示在八个样品中检测到的野生型和突变体扩增子的相对百分比，使用两组NPPF(或者是针对野生型和突变体二者的特异性探针(“两探针(both probes)”)，或者针对二者仅一种探针(“一探测(one probe)”))。将从一式三份样品产生的原始数据平均以产生数字，然后将给定NPPF的所有信号设定为等于100％，并将野生型和突变体等位基因的相对百分比显示为该100％的比例。示出了显示百分比的图表和表格。显示了两种野生型/突变体扩增子样品稀释组(用于KRAS和BRAF)(分别为图11A和图11B)。

如图11A-11B所示，当使用两种NPPF混合物中的任一种时，每种样品混合物中野生型和突变体扩增子的比例几乎相同(参见图下表中的确切数字)。这表明具有在NPPF与标靶之间少量核苷酸差异(例如，1、2、3、4或5个错配)的NPPF仍将与标靶杂交并保护标靶经受核酸酶消化。这发生时，没有与探针不完全匹配的标靶的有意义的损失(比较两个探针组中野生型扩增子的检测)。这表明NPPF既可用于已知的差异，也可用于有限发现未预期的区域内突变，即从头突变。这不仅可以在分析中提供更大的灵活性，还可以通过简化组件来缩短探针设计时间，降低构建成本并提高系统的稳健性。

实施例3

设计用于在已知突变状态的细胞系内靶向特定区域并鉴定该区域内的核酸变体的多种cNPPF的同时测序

该实施例描述了用于评估具有已知KRAS突变状态的一组细胞系样品中基因组KRAS突变状态的方法。此外，它描述了区分探针和标靶，并且允许识别靶区域内的未知突变的NPPF设计。

使用三种市售细胞系。COLO-205(“KRAS WT”系)携带BRAF 1799T>A碱基变化(V600E氨基酸变化)，但对于KRAS是野生型。NCI-H1155(“KRAS mut”系)携带KRAS183A>T碱基变化(Q61H_T)并且对于该突变等位基因是纯合的。SW948(“KRAS杂合子”)携带KRAS的WT等位基因和182A>C突变等位基因(Q61L)。将细胞系在裂解缓冲液中稀释。

生成了一组19个NPPF。这些NPPF的设计建立在实施例2的基础上，其中显示探针内的错配不会改变探针作为相差一个或多个碱基的靶的杂交支架的能力。每个NPPF包括对特定标靶核酸分子具有特异性的区域，其长度为50个核苷酸，所有19个区域的中值T_m为71.0℃，以及包括两端都有的侧翼序列。每个探针还包括相对于基因组靶序列的单个错配。在这些情况下，错配被置于NPPF内保护序列的5'第三个位置。使用C>T或A>G变化作为错配。

对于所有NPPF，不管它们的预期标靶如何，尽管5'-和3'-侧翼序列彼此不同，但每个NPPF上的每个5'-侧翼序列和每个3'-侧翼序列是相同的。5'-侧翼序列(5'TCCCTACACGACGCTCTTCCGAUCT 3'；SEQ ID NO:24)为25个核苷酸，T_m为62.8℃，3'-侧翼序列(5'GAUCGGAAGAGCACACGTCTGAACT 3'；SEQ ID NO:25)为25个核苷酸，T_m为60.5℃。每个NPPF设计有总共四个dUTP碱基。两个dUTP碱基位于侧翼序列中。这些dUTP碱基在上面的序列中用“U”表示。另外两个dUTP碱基置于NPPF的靶特异性区域内。这些dUTP碱基的位置取决于标靶特异性保护序列中dTTP碱基的位置。将不同的NPPF与互补于NPPF上的侧翼区的CFS合并。5'CFS在5'-端磷酸化，3'CFS携带内部生物素部分。

细胞系裂解物一式三份进行；每份重复在裂解缓冲液中含有5000个细胞。将裂解物与上述NPPF和CFS混合物相混合，并在95℃下初始变性10分钟后在50℃下进行杂交18小时。

杂交后，通过在缓冲液中加入S1酶对杂交的混合物进行S1消化。将S1反应在50℃下温育90分钟。在S1介导的消化后，将反应冷却至室温。将反应物加入到缓冲液中浓度为4μg/μl的5μl Dynabeads MyOne C1链霉亲和素顺磁珠。将珠子与混合物在室温下温育30分钟，使得3'CFS上的生物素部分被珠子上的链霉亲和素捕获。

将洗过的珠子重新悬浮在补充有dNTP的在T4DNA连接酶缓冲液中含有80单位T4DNA连接酶和0.6单位T4DNA聚合酶的20μl连接混合物中(酶和缓冲液来自于New EnglandBiolabs)。连接在室温下进行1小时。在连接反应后，将珠子用150μl的50％甲酰胺/0.02％Tween-20洗涤三次，并在150μl的0.02％-20洗涤剂中洗涤一次。这些洗涤使双链产物变性并洗去NPPF，将经连接的标靶-CFS复合物留在珠子上。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在洗涤缓冲液中来进行洗涤。在扩增之前，将洗过的珠子重新悬浮在20μl的0.02％洗涤剂中。

然后将在样品中包含标靶的经连接的cNPPF的部分上述反应与PCR引物一起温育。如实施例2中所述设计这些引物。使用的实验标签如表3所示。

表3：示例性实验标签。

5'引物编号	5'条形码序列(引物中5'-3')	3'引物编号	3'条形码序列(引物中5'-3')
				F1	CTAATCGA(SEQ ID NO:29)	R1	ACATCG(SEQ ID NO:49)
F2	ATAGAGGC(SEQ ID NO:36)	R2	GGCTAC(SEQ ID NO:32)
				F3	GGCTCTGA(SEQ ID NO:37)	R3	CTTGTA(SEQ ID NO:35)

将得到的扩增子合并在一起并使用基于珠子的样品净化(来自BeckmanCoulter的AMPure XP)来进行净化。然后使用Illumina NextSeq平台对含有cNPPF和实验标签的扩增子进行测序。虽然实验标签可位于几个位置，但在该实施例中，它们位于扩增子的两侧，紧邻与索引读取测序引物互补的区域的下游。因此，Illumina测序分三步进行，初始读取序列，然后使用另外两个测序引物对实验标签进行两次较短的读取(所有测序引物都包括在标准Illumina试剂盒中)。本文描述并使用的测序方法是用于在Illumina平台上多重样品的标准方法。

首先根据实验标签对每个测序的分子进行分选，然后在每个实验标签组内，计算针对每种不同标签鉴定的分子数。使用开源软件bowtie将扩增子与预期序列进行比较。

图12显示了对反应进行测序的结果。为了获得图形，将来自一式三份样品的原始数据取平均值，并通过等位基因绘制Q61区域的所有测序计数。虽然没有检测到有意义的信号，但也显示了仅由探针产生的计数(参见图12中的“KRAS_Q61_探针”)。

这些结果证明了单探针设计在评估样品中检测变异或野生型等位基因的有效性-同时评估了KRAS Q61区域中的各种突变，使用了单一NPPF。因此，虽然NPPF是非特异性的，但是对捕获的标靶(cNPPF)进行测序的测定结果是高度特异性的。通过在已知细胞系内正确检测特定的预期KRAS等位基因来证明该测定的特异性；另外，对于所有三种细胞系的等同细胞输入，检测到的总KRAS信号的量在细胞系之间大致相等，而与等位基因状态无关。由于所述结果通过测序产生，因此也可以鉴定或发现靶区域中的任何意外突变(均未检测到，见图12)。

假阳性或假阴性信号会对特异性产生负面影响。因此，即使NPPF设计包括NPPF和靶区域之间的碱基错配，该错配也远离已知感兴趣的区域，并且允许从结果中筛选出由存在残留探针(在测定中或PCR设置区域的环境污染)产生的任何错误信号。在该实验中，没有可检测的探针序列(参见图12，“KRAS_Q61_探针”)。

实施例4

多种cNPPF的同时测序；多重反应中的线性、特异性和灵敏度

该实施例描述用于产生和测序cNPPF的方法。生成了一组30种NPPF。每种NPPF包括对特定标靶核酸分子特异的区域(长度为50个核苷酸)，以及两端的侧翼序列。NPPF如实施例3中设计。NPPF与互补于NPPF的侧翼区域的CFS合并。3'CFS携带内部生物素部分，5'CFS在5'-端磷酸化。

对含有靶序列的23种双链DNA扩增子的混合物进行杂交。每种扩增子携带已知人等位基因的野生型或突变体拷贝，以及其他非标靶序列。将所有23种扩增子以高浓度合并在一起，然后将合并物在裂解缓冲液中稀释。产生7个稀释度，范围从100fM到100aM。然后使用上述NPPF合并物(pool)，将该稀释系列用于测试多重测定中的测定的再现性、线性、灵敏度和特异性。通过将NPPF和CFS与扩增子样品混合，在溶液中进行杂交。在95℃下初始变性10分钟后，在50℃下进行杂交。

杂交后，通过在缓冲液中加入S1酶对杂交的混合物进行S1消化。将S1反应在50℃下温育90分钟。在S1介导消化单链核酸(包括未杂交的DNA、NPPF和CFS)之后，将反应冷却至室温并加入到浓度为4μg/μl的5μl Dynabeads MyOne C1链霉亲和素顺磁珠(ThermoFisherScientific)。将珠子和样品混合物在室温下温育30分钟，使得3'CFS上的生物素部分被珠子上的链霉亲和素捕获。该步骤还用于停止S1反应。

将洗过的珠子重新悬浮在20μl含有80单位T4DNA连接酶和0.6单位T4DNA聚合酶的连接混合物中。连接在室温下进行75分钟。在连接反应后，将珠子用150μl的-20洗涤剂中的50％甲酰胺洗涤三次，然后在dH₂O中的0.02％-20洗涤剂中洗涤一次。通过将反应管置于支架磁体上并使珠子被收集，除去上清液，然后将洗涤缓冲液加入到珠子来进行洗涤。这些洗涤使双链产物变性并洗去NPPF，将经连接的标靶-CFS复合物留在珠子上。在扩增之前，将洗过的珠子重新悬浮于20μl的dH₂O中的0.02％-20洗涤剂中。

然后将包含样品中使用的原始标靶的经连接的cNPPF的上述部分反应与PCR引物一起温育。如实施例2中所述设计这些引物。使用的实验标签如表4所示。

表4：示例性实验标签。

5'引物编号	5'条形码序列(引物中5'-3')	3'引物编号	3'条形码序列(引物中5'-3')
				F1	TGAACCTT(SEQ ID NO:28)	R1	TGACCA(SEQ ID NO:34)
F2	CTAATCGA(SEQ ID NO:29)	R2	AAGCTA(SEQ ID NO:52)
				F3	ATAGAGGC(SEQ ID NO:36)	R3	ACTTGA(SEQ ID NO:53)
F4	GGCTCTGA(SEQ ID NO:37)
				F5	CCTATCCT(SEQ ID NO:39)
F6	AGGCGAAG(SEQ ID NO:40)
				F7	TAATCTTA(SEQ ID NO:50)
F8	CAGGACGT(SEQ ID NO:51)

将得到的PCR反应合并在一起并使用基于珠子的样品净化(来自BeckmanCoulter的AMPure XP)来进行净化。进行合并以使得滴定样品可以相对于彼此进行分析(即，较高滴定相比较低滴定将有更多的输入材料进入测序运行)。然后使用Illumina MiSeq平台对含有cNPPF和实验标签的扩增子进行测序。虽然实验标签可位于几个位置，但在该实施例中，它们位于扩增子的两侧，紧邻与索引读取测序引物互补的区域的下游。因此，Illumina测序分三步进行，初始读取序列，然后使用另外两个测序引物对实验标签进行两次较短的读取(所有测序引物都包括在标准Illumina试剂盒中)。本文描述并使用的测序方法是用于在Illumina平台上多重样品的标准方法。

图13A-13B和14显示了对经连接的标靶和CFS(cNPPF)进行测序的结果。这是一个多重样本，含有23种扩增子标靶。在反应中存在设计用于检测23种扩增子靶中的20种的NPPF，并且检测到所有20种，证明了该测定对具有小变化的标靶进行多重检测的能力。

另外，每种扩增子在三对数(three-log)标度上滴定，并测量20种扩增子中每一种的线性。所有20种扩增子的数据绘制在图13A中(原始数据，三次重复的平均值，log10标度)，显示了所有20种扩增子的线性。数据是高度线性的-所有20种扩增子的七个滴定点的数据的中值R²为0.998(范围0.997-0.99，线性标度)。

图13B显示了在1500-1.5M输入拷贝范围内检测的再现性、线性、灵敏度和特异性。选择两种扩增子进行更详细的展示；每种与第二标靶扩增子仅相差一个碱基，但在混合物中特异性识别。对于这两种扩增子，原始数据为一式三份的平均值；通过误差条表示再现性(显示；与平均值的一个标准偏差(以log10标度绘制)。数据也是高度线性的；R²值显示在图表上，为0.998和0.997(线性标度)。

图14中的图表显示了稀释系列扩增子标靶上的测定的可重复性。每个输入浓度(一式三份反应，原始数据)中四种扩增子标靶的平均值、标准偏差和％CV显示在表中。这四个标靶高度代表了20种的整个种群。

实施例5

使用所公开的测定评估临床FFPE样品的BRAF突变状态

该实施例描述了用于评估具有已知BRAF突变状态的一组商业上可获得的黑素瘤福尔马林固定、石蜡包埋(FFPE)样品中BRAF基因组突变状态的方法。

将FFPE样品在裂解缓冲液中裂解，每个样品使用2mm²。每个样品一式三份运行。将实施例3中描述的NPPF和CFS混合物加入到样品中。在95℃下初始变性10分钟后，在50℃下在溶液中进行杂交过夜。

杂交后，通过在缓冲液中加入S1酶对杂交的混合物进行S1消化。将S1反应在50℃下温育90分钟。在S1介导消化单链核酸(包括未杂交的DNA、NPPF和CFS)之后，将反应冷却至室温。此时，将反应物添加至浓度为4μg/μl的5μl Dynabeads MyOne C1链霉亲和素顺磁珠(ThermoFisher Scientific)。将珠子和样品混合物在室温下温育30分钟，使得3'CFS上的生物素部分被珠子上的链霉亲和素捕获。该步骤还用于停止S1反应。

在室温下将珠子在150μl的1×SSC-T缓冲液(含有0.05％Tween的1×SSC缓冲液)中洗涤三次。在这种温和缓冲液中洗涤可使杂交结构保持完整。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在1×SSC-T中来进行洗涤。

将洗过的珠子重新悬浮在含有80单位T4DNA连接酶和0.6单位T4DNA聚合酶的20μl连接混合物中(酶和缓冲液来自于New England Biolabs)。连接在室温下进行1小时。在连接反应后，将珠子用150μl的0.02％-20洗涤剂中的50％甲酰胺洗涤三次。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在洗涤缓冲液中来进行洗涤。这些洗涤液使双链产物变性并洗去NPPF，使经连接的标靶-CFS复合物留在珠子上。在最后时间收集经洗涤的珠子并重新悬浮在20μl的在dH₂O中的0.02％-20洗涤剂中。

然后将在样品中包含标靶的经连接的cNPPF的上述部分反应与PCR引物一起温育。如实施例2中所述设计这些引物。使用的实验标签如表5所示。

表5：示例性实验标签。

5'引物编号	5'条形码序列(引物中5'-3')	3'引物编号	3'条形码序列(引物中5'-3')
				F1	TGAACCTT(SEQ ID NO:28)	R1	TAGCTT(SEQ ID NO:55)
F2	CTAATCGA(SEQ ID NO:29)	R2	GAGTGG(SEQ ID NO:56)
				F3	ATATATTC(SEQ ID NO:54)	R3	TTAGGC(SEQ ID NO:57)
		R4	ATCACG(SEQ ID NO:58)
						R5	TGACCA(SEQ ID NO:34)
		R6	AAGCTA(SEQ ID NO:52)
						R7	ACTTGA(SEQ ID NO:53)
		R8	GTAGCC(SEQ ID NO:59)

图15显示了经连接的标靶和CFS(cNPPF)测序的结果。通过首先将一式三份样品的原始计数进行平均来生成该图。感兴趣的是BRAF V600位置(图15中显示l针对野生型基因座(“V600w”)、V600E突变(“V600E”)和V600E2突变(“V600E2”)的标靶序列。)将从所有BRAFV600信号(野生型和突变体)产生的计数总数相加，并计算每个样品的野生型或突变体信号的比例。这些比例在图15中绘出。

数据证明了在这些临床FFPE样品中正确鉴定BRAF V600E突变的能力。虽然只有一个样品携带V600E2突变(序列如图15所示)，但所公开的探针设计允许V600E和V600E2之间的区分(E2突变状态是出乎意料的；样品被标为BRAF突变体样品，但没有描述确切的突变，供应商可能也不知道。)这证明了使用本实施例中使用的探针设计揭示未知突变的能力(在实施例3中描述)。另外，这些结果是使用极少量(2mm²)固定组织产生的，证明了NPPF测定使用少量临床相关样品即可工作的能力。

实施例6

使用NPPF测定评估RNA

该实施例描述了在包含组织裂解物或分离的RNA的样品中使用所公开的方法评估RNA表达水平定量的方法。

生成了一组33种NPPF。这些NPPF的设计遵循实施例3中描述的设计。每种NPPF包括对特定标靶核酸分子具有特异性的50个核苷酸长度的区域。每个探针还包括相对于靶序列的单个错配。使用C>T或A>G变化作为错配。对于所有NPPF，5'-和3'-侧翼序列如实施例3中所述。

该组NPPF与互补于NPPF的侧翼区域的CFS合并。5'-CFS是RNA-DNA杂合寡核苷酸(最5'的三个核苷酸是RNA碱基)并且在5'-端被磷酸化。3'-CFS是RNA-DNA杂合寡核苷酸(最3'的三个核苷酸是RNA碱基)并携带内部生物素部分。NPPF和CFS混合物中还包括两个DNA寡核苷酸，长度为50个碱基并在5'-端磷酸化，其作为混合物中两个NPPF的标靶。由于这些是DNA而不是RNA，因此它们在该特定实施例中用作核苷酸特异性对照。

使用了三种样品类型。一种样品类型是已知序列的RNA寡核苷酸，长度为50个碱基，并在5'-端磷酸化。第二种样品类型是已知序列的六种体外转录的RNA序列的混合物，长度均大于50个碱基。第三种样品是结肠癌组织样品，在裂解缓冲液中匀浆。将每种样品类型在裂解缓冲液中稀释，并以滴定系列进行。将上述NPPF和CFS混合物加入样品中。在95℃下初始变性10分钟后，在50℃下在溶液中进行杂交过夜。

杂交后，通过在缓冲液中加入S1酶对杂交的混合物进行S1消化。将S1反应在50℃下温育90分钟。在S1介导消化单链核酸(包括未杂交的核酸、NPPF和CFS)之后，将反应冷却至室温。将反应物添加至浓度为4μg/μl的5μl Dynabeads MyOne C1链霉亲和素顺磁珠(ThermoFisher Scientific)。将珠子和样品混合物在室温下温育30分钟，使得3'CFS上的生物素部分被珠子上的链霉亲和素捕获。该步骤也停止S1反应。

在室温下将珠子在150μl的1×SSC-T缓冲液(含有0.05％Tween-20的1×SSC缓冲液)中洗涤三次。在这种温和缓冲液中洗涤可使杂交结构保持完整。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在1×SSC-T中来进行洗涤。

将洗过的珠子重新悬浮在20μl含有2单位T4RNA连接酶2和0.5单位大肠杆菌RNA聚合酶(均来自New England Biolabs)的连接混合物中。连接在37℃下进行1小时。在连接反应后，将珠子用150μl在0.02％Tween-20中的50％甲酰胺在50℃洗涤三次。通过将反应管置于支架磁体上以使珠子被收集，除去上清液，然后将珠子重新悬浮在洗涤缓冲液中来进行洗涤。这些洗涤使双链产物变性并洗去NPPF，将经连接的标靶-CFS(cNPPF)复合物留在珠子上。将洗过的珠子收集在10μl的0.02％Tween-20中，并加入10μl逆转录混合物(含有200单位的逆转录酶(New England Biolabs)、缓冲液和引物至终浓度为500nM)。逆转录在45℃下进行2小时。然后将珠子在150μl的SSC-T中洗涤一次，并重新悬浮在20μl的含0.05％Tween-20的10mM Tris pH 8.0中。

然后将在样品中包含标靶的经连接的cNPPF的上述部分反应与PCR引物一起温育。如实施例2中所述设计这些引物。使用的实验标签如表6所示。

表6：实验标签

5'引物编号	5'条形码序列(引物中5'-3')	3'引物编号	3'条形码序列(引物中5'-3')
				F1	GGCTCT(SEQ ID NO:37)	R1	ACATCG(SEQ ID NO:49)
F2	TATAGC(SEQ ID NO:38)	R2	ATTGGC(SEQ ID NO:46)
				F3	AGGCGA(SEQ ID NO:40)	R3	GATCTG(SEQ ID NO:60)
F4	TAATCT(SEQ ID NO:50)	R4	TTAGGC(SEQ ID NO:57)
						R5	ACAGTG(SEQ ID NO:61)
		R6	GCCAAT(SEQ ID NO:42)
						R7	ACTTGA(SEQ ID NO:53)
		R8	CGTACG(SEQ ID NO:48)

在单独的PCR反应中扩增每个反应，并且用不同的实验标签组合(一个5'引物和一个3'引物)扩增每个反应，以在合并的反应测序后分别鉴定每个反应。在所有反应中进行扩增之前用尿嘧啶DNA去糖基酶(UDG)处理。UDG催化从含尿嘧啶的DNA，包括寡核苷酸或单链DNA中释放游离尿嘧啶。在所述反应中，UDG破坏了先前酶促和洗涤步骤之后存在的任何剩余的NPPF。UDG处理后进行24个PCR循环。

将得到的扩增子按样品类型合并，并使用基于珠子的样品净化(来自BeckmanCoulter的AMPure XP)进行净化。使用Illumina MiSeq平台对含有cNPPF和实验标签的扩增子进行测序。虽然实验标签可位于几个位置，但在该实施例中，它们位于扩增子的两侧，紧邻与索引读取测序引物互补的区域的下游。因此，Illumina测序分三步进行，初始读取序列，然后使用另外两个测序引物对实验标签进行两次较短的读取(所有测序引物都包括在标准Illumina试剂盒中)。本文描述并使用的测序方法是用于在Illumina平台上多重样品的标准方法。

首先根据实验标签对每个测序的分子进行分选。使用开源软件bowtie将通过标签分类的测序读数与预期序列进行比较(Langmead et al.,Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.Genome Biol10:R25)，并对每个样品的每个预期序列测序的分子数(“计数”)构建表格。

图16A-16D显示了对经连接的标靶和CFS(cNPPF)进行测序的结果。绘制原始测序计数。图16A显示含有特定RNA寡核苷酸的样品的结果。这些结果证明了所公开的方法测量特定RNA标靶的能力。结果还表明，方法正确地测量了RNA而不是DNA，因为尽管在测定中具有互补的NPPF，但未测量添加到测定中的两种DNA寡核苷酸(图中的“POS1”和“POS2”)。这很重要，因为RNA是从DNA链转录而来的。如果本实施例中使用的方法不是特异于RNA的，则难以鉴定测序结果是否源自RNA或DNA标靶。结果还表明，仅测量样品中存在的标靶，没有假信号或背景信号(“BRAF_V600E_wt”显示为干净背景的实例；所用样品中不存在BRAF RNA标靶)。对于该具体实例，仅测量RNA证明本文所述的方法可以靶向特异性测量RNA或DNA。然而，这并不意味着本文描述的方法仅可用于在给定时间或在给定测定中测量一种类型的核酸(即RNA或DNA)。如果所希望的是混合RNA-DNA的测定，可以使用该方法共同测量DNA和RNA。

图16B显示了在一系列输入(滴定系列)中含有特定RNA寡核苷酸的一组样品的结果。显示来自样品输入的五点滴定的原始数据，结果的R²值为0.9941(线性标度)。这证明了良好的测量线性。

图16C显示来自含有组织裂解物的一组样品的数据。通过四点样品输入滴定测量三个RNA靶，并且所有三个的R²值至少为0.93，证明在生理学样品中滴定输入时具有优异的线性。

图16D显示了由六种体外转录物组成的样品的结果。所有六种都正确且具体地测量，如针对六种标靶绘制的计数所示。图16C和图16D都显示了不同样品类型中RNA靶的多重检测。

这些数据证明了使用本文公开的方法特异性地和定量地测量RNA标靶的能力。

鉴于可以应用所公开发明的原理的许多可能的实施例，应该认识到，所示实施例仅是本公开的示例，并且不应被视为限制本公开的范围。相反，本发明的范围由以下权利要求限定。因此，我们要求将这些权利要求的范围和精神内的所有内容作为我们的发明。

Claims

1.确定样品中标靶核酸分子序列的方法，包括：

将所述样品与至少一种包括侧翼序列的核酸酶保护探针(NPPF)在足以使所述NPPF特异性结合标靶核酸分子的条件下相接触，

其中所述NPPF包括：

5'-端和3'-端，

与所述标靶核酸分子的区域互补的序列，允许所述NPPF和所述标靶核酸分子之间的特异性结合，

其中所述侧翼序列位于所述与标靶核酸分子互补的序列的5'、3'或两端，其中5'-侧翼序列是所述与标靶核酸分子互补的序列的5'，以及3'-侧翼序列是所述与标靶核酸分子互补的序列的3'，

其中所述侧翼序列包括在所述样品中存在的核酸分子中未发现的至少12个连续核苷酸，

如果所述NPPF包括5'-侧翼序列，则将所述样品与包括与所述5'-侧翼序列互补的序列(5CFS)、5'-端磷酸酯的核酸分子在足以使所述5'-侧翼序列特异性杂交至所述5CFS的条件下相接触；

如果所述NPPF包括3'-侧翼序列，则将所述样品与包括与所述3'-侧翼序列互补的序列的核酸分子(3CFS)在足以使所述3'-侧翼序列特异性杂交至所述3CFS的条件下相接触；

其中所述3CFS和所述5CFS中的至少一个包括捕获部分；

其中NPPF中至少一个核苷酸与所述标靶核酸分子中的相应核苷酸不具有互补性，或者与所述5CFS或3CFS中的相应核苷酸不具有互补性，

产生杂交至所述标靶核酸分子、杂交至所述3CFS、杂交至所述5CFS或者杂交至所述3CFS和所述5CFS二者的NPPF；

将所述样品与特异于单链核酸分子的核酸酶在足以除去未结合核酸分子的条件下相接触，由此产生经消化的样品，所述经消化的样品包括杂交至所述标靶核酸分子、杂交至所述3CFS、杂交至所述5CFS或者杂交至所述3CFS和所述5CFS二者的NPPF；

捕获所述杂交至所述标靶核酸分子、杂交至所述3CFS、杂交至所述5CFS或者杂交至所述3CFS和所述5CFS二者的NPPF；

将所述3CFS的5′-磷酸酯连接所述标靶核酸分子的3′-端，将所述5CFS的3′-端连接所述标靶核酸分子的5′-端，由此产生经连接的标靶核酸分子；

将所述NPPF与所述经连接的标靶核酸分子分离，由此产生包括单链NPPF和单链经连接的标靶核酸分子的混合物；以及

对所述单链经连接的标靶核酸分子的至少一部分测序，由此确定所述样品中至少一种标靶核酸分子的序列。

2.权利要求1的方法，其中所述NPPF包括至少一个dUTP，并且所述方法还包括在变性之后和测序之前，将所述包括单链NPPF和单链经连接的标靶核酸分子的混合物与尿嘧啶DNA脱糖基化酶(UDG)在足以降解所述单链NPPF的条件下相接触。

3.权利要求2的方法，其中所述至少一个dUTP位于所述与标靶核酸分子的区域互补的序列的5个碱基对内。

4.权利要求1至3中任一项的方法，其中所述NPPF包括5'-侧翼序列和3'-侧翼序列，并且所述方法还包括在变性之后和测序之前：

将所述单链经连接的标靶核酸分子与第一扩增引物以及与第二扩增引物相接触，所述第一扩增引物包括与所述3CFS互补的区域，所述第二扩增引物包括与所述5CFS互补的区域；和

用所述第一和第二扩增引物扩增所述单链经连接的标靶核酸分子。

5.权利要求1的方法，其中所述NPPF包括5'-侧翼序列和3'-侧翼序列，其中至少一个侧翼序列包括至少一个dUTP，并且所述方法还包括在变性之后和测序之前：

洗涤所述包含单链NPPF和单链经连接的标靶核酸分子的混合物；

将所述包含单链NPPF和单链经连接的标靶核酸分子的混合物与尿嘧啶DNA去糖基酶(UDG)在足以降解单链NPPF的条件下相接触；

用所述第一和第二扩增引物扩增所述经连接的标靶核酸分子。

6.权利要求1至5中任一项的方法，其中所述至少一种标靶核酸分子是DNA，并且其中所述5CFS和所述3CFS是DNA。

7.权利要求1至5中任一项的方法，其中所述至少一种标靶核酸分子是DNA，并且其中所述5CFS是DNA，所述3CFS是RNA。

8.权利要求1至5中任一项的方法，其中所述至少一种标靶核酸分子是RNA，并且其中所述5CFS是DNA，所述3CFS是RNA。

9.权利要求1至5中任一项的方法，其中所述至少一种标靶核酸分子是RNA，并且其中所述5CFS是RNA，所述3CFS是RNA。

10.权利要求1至9中任一项的方法，其中所述NPPF包括DNA分子。

11.权利要求1至10中任一项的方法，其中所述NPPF包括35-150个核苷酸。

12.权利要求1至11中任一项的方法，其中所述与标靶核酸分子的区域互补的序列的长度为10-60个核苷酸。

13.权利要求1至12中任一项的方法，其中所述侧翼序列的长度为12-50个核苷酸。

14.权利要求1至13中任一项的方法，其中所述NPPF包括在所述5'-端和所述3'-端的侧翼序列，其中所述在5'-端的侧翼序列与所述在3'-端的侧翼序列不同。

15.根据权利要求1的方法，其中所述捕获部分包括固体支持物或标记。

16.权利要求15的方法，其中所述固体支持物是珠子。

17.权利要求16的方法，其中所述珠子是磁珠。

18.权利要求15的方法，其中所述标记是生物素。

19.权利要求1至18中任一项的方法，其中所述至少一种标靶核酸分子是经固定的、交联的或不可溶的。

20.权利要求1至19中任一项的方法，其中所述样品是经固定的。

21.权利要求1至20中任一项的方法，其中所述样品是经福尔马林固定的。

22.权利要求1至21中任一项的方法，其中所述NPPF是DNA，并且所述核酸酶包括核酸外切酶、核酸内切酶或其组合。

23.权利要求1至22中任一项的方法，其中所述特异于单链核酸分子的核酸酶包括S1核酸酶。

24.权利要求1至23中任一项的方法，其中用T4DNA连接酶、T4RNA连接酶或Taq连接酶进行所述连接。

25.权利要求1至24中任一项的方法，其中所述方法同时测序或检测多个样品中的一种或多种标靶核酸分子。

26.权利要求1至25中任一项的方法，其中所述方法测序或检测至少两种标靶核酸分子，并且其中所述样品与至少两种不同的NPPF相接触，每种NPPF对不同的标靶核酸分子具有特异性。

27.权利要求1至26中任一项的方法，其中所述方法测序或检测至少两种不同的标靶核酸分子，并且其中所述样品与至少一种对所述至少两种不同的标靶核酸分子具有特异性的NPPF相接触。

28.权利要求27的方法，其中所述至少两种不同的标靶核酸分子包括野生型基因序列和所述基因序列中的至少一个突变。

29.权利要求1至28中任一项的方法，其中对多个样品进行所述方法，并且在所述多个样品的每一个中检测至少两种不同的标靶核酸分子。

30.权利要求1至29中任一项的方法，其中至少一种NPPF对miRNA标靶核酸分子是特异性的，并且至少一种NPPF对mRNA标靶核酸分子是特异性的。

31.权利要求1至30中任一项的方法，其中所述至少一种NPPF包括至少10种不同的NPPF。

32.权利要求1至31中任一项的方法，还包括裂解所述样品。

33.权利要求1至30中任一项的方法，其中测序包括下一代测序。

34.权利要求1至33中任一项的方法，其中测序包括单分子测序。

35.权利要求1至34中任一项的方法，其中测定标靶核酸分子的序列确定了所述标靶核酸分子是否包含点突变。

36.权利要求5至35中任一项的方法，其中洗涤所述包含单链NPPF和单链经连接的标靶核酸分子的混合物包括将所述混合物与能结合捕获部分的表面相接触。

37.权利要求36的方法，其中所述表面包括磁体、多孔板、珠子或柱子。

38.权利要求36或37的方法，其中所述表面包含亲和素或链霉亲和素。

39.权利要求4至38中任一项的方法，其中所述第一和/或第二扩增引物还包括允许在扩增步骤期间将实验标签或测序衔接子连接至所述单链经连接的标靶核酸分子的序列。

40.权利要求4至37中任一项的方法，其中所述第一扩增引物还包括允许在扩增步骤期间将第一实验标签和/或第一测序衔接子连接至所述单链经连接的标靶核酸的5'-端的序列，并且其中所述第二扩增引物还包括允许在扩增步骤期间将第二实验标签和/或第二测序衔接子连接至单链经连接的标靶核酸分子的3'-端的序列。

41.权利要求4至40中任一项的方法，还包括在扩增之后和测序之前移除所述第一和第二扩增引物。

42.权利要求40或41的方法，其中所述实验标签包括允许鉴定样品、受试者、治疗或标靶核酸序列的核酸序列。

43.权利要求40至42中任一项的方法，其中所述测序衔接子包括允许捕获到测序平台上的核酸序列。

44.权利要求40至43中任一项的方法，其中所述实验标签或测序衔接子存在于所述单链经连接的标靶核酸分子的5'-端或3'-端。

45.权利要求1至44中任一项的方法，其中所述方法还包括在连接步骤的同时或在连接步骤之前聚合所捕获的标靶核酸分子。

46.试剂盒，其包括：

(a)至少一种对标靶核酸分子具有特异性的包括侧翼序列的核酸酶保护探针(NPPF)，其中所述NPPF包括：

5'-端和3'-端，

位于所述与标靶核酸分子互补的序列的5'、3'或两端的侧翼序列，其中5'-侧翼序列是所述与标靶核酸分子互补的序列的5'，以及3'-侧翼序列是所述与标靶核酸分子互补的序列的3'，

其中所述侧翼序列包括至少12个核苷酸，

(b)如果所述NPPF包括3'-侧翼序列，包括与所述3'-侧翼序列互补的序列(3CFS)、5'-端磷酸酯和捕获部分的核酸分子；和/或

(c)如果所述NPPF包括5'-侧翼序列，包括与所述5'-侧翼序列互补的序列(5CFS)的核酸分子

其中NPPF中至少一个核苷酸与所述标靶核酸分子中的相应核苷酸不具有互补性，或者与所述5CFS或3CFS中的相应核苷酸不具有互补性。

47.权利要求46的试剂盒，还包括以下一个或更多个：

连接酶；

特异于单链核酸分子的核酸酶；

尿嘧啶DNA去糖基酶(UDG)；

裂解缓冲液；

连接缓冲液；

变性缓冲液；

洗涤缓冲液；

一个或更多个PCR扩增试剂；

蛋白酶K；

变性油；

能特异性结合包括CFS的扩增子的珠子；

洗脱缓冲液；

DNA聚合酶；

RNA聚合酶；

DNA酶；

RNA酶；和

一个或多个核酸测序试剂。

48.权利要求47或48的试剂盒，还包括

第一扩增引物，其包括与所述5CFS互补的区域；和

第二扩增引物，其包括与所述3CFS互补的区域。