[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN116555426B - 一种鉴定肿瘤组织来源的试剂盒及数据分析方法 - Google Patents

一种鉴定肿瘤组织来源的试剂盒及数据分析方法 Download PDF

Info

Publication number
CN116555426B
CN116555426B CN202310501572.7A CN202310501572A CN116555426B CN 116555426 B CN116555426 B CN 116555426B CN 202310501572 A CN202310501572 A CN 202310501572A CN 116555426 B CN116555426 B CN 116555426B
Authority
CN
China
Prior art keywords
cancer
kit
nucleotide sequence
identifying
pcr amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310501572.7A
Other languages
English (en)
Other versions
CN116555426A (zh
Inventor
谷红仓
王云飞
车仙荣
孟祥和
谢长校
谢琼琓
王文君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Shengting Medical Technology Co ltd
Original Assignee
Hangzhou Shengting Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shengting Medical Technology Co ltd filed Critical Hangzhou Shengting Medical Technology Co ltd
Priority to CN202410636980.8A priority Critical patent/CN118737268A/zh
Priority to CN202310501572.7A priority patent/CN116555426B/zh
Priority to EP23189193.8A priority patent/EP4458989A1/en
Publication of CN116555426A publication Critical patent/CN116555426A/zh
Priority to US18/450,653 priority patent/US20240368699A1/en
Application granted granted Critical
Publication of CN116555426B publication Critical patent/CN116555426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种鉴定肿瘤组织来源的试剂盒,包括接头和PCR扩增引物,所述接头包括核苷酸序列,该接头的核苷酸序列包括A01‑T、A01‑B、A02‑T、A02‑B、A03‑T、A03‑B、A04‑T、A04‑B、A05‑T、A05‑B、A06‑T、A06‑B;所述PCR扩增引物包含核苷酸序列,该PCR扩增引物的核苷酸序列包括R01‑F、R01‑R、R02‑F和R02‑R。本发明通过设计新的接头核苷酸序列和PCR扩增引物,其具有更高的准确性和有效性等优点。本发明还公开了一种用于鉴定肿瘤组织来源的试剂盒的数据分析方法,包括数据预处理、比对、甲基化信息统计、质控和分析。本发明通过分析甲基化Beta指标,进一步提高了识别比例。

Description

一种鉴定肿瘤组织来源的试剂盒及数据分析方法
技术领域
本发明涉及生物医药技术领域,尤其是涉及一种鉴定肿瘤组织来源的试剂盒及鉴定肿瘤组织来源的试剂盒的数据分析方法。
背景技术
癌症的转移(metastasis)是指肿瘤细胞从原发灶上脱落,进入循环系统,转移到身体其他部位并继续生长的过程。原有的肿瘤称为“原发病灶”,新形成的肿瘤称为“继发病灶”或“转移病灶”。根据肿瘤细胞进入循环系统的阶段不同,癌症的转移分为早期转移模式(early dissemination model)和后期转移模式(late dissemination model)。这两种模式的区别主要在于转移的癌细胞发生突变时所处的环境。在后期转移模式中,癌细胞在原发灶发生变异和增殖,然后通过循环系统发生转移,此时转移灶与原发灶的基因相似度较高,可使用与原发灶相同的治疗手段;在早期转移模式中,癌细胞在经过循环系统到达目的地之后才发生变异,这种模式中转移灶与原发灶的癌细胞基因相似度较低,不易确定原发灶位置。
当肿瘤已经发展成真正的癌症,也就是所谓浸润癌,表示癌细胞已经从发生的部位向更深的地方侵袭浸润。而对于浸润癌来说,癌细胞的转移优势则是造成癌症的死亡的主要原因。
据统计,90%的癌症死亡就是转移导致的。转移性癌症治疗难度极大,患者的癌细胞的附着能力下降甚至完全丧失,其迁移能力增强,导致癌细胞从原生部位随血液或淋巴系统转移到其他身体部位,最终形成新的肿瘤。肿瘤的转移是指肿瘤细胞从原发位置通过侵入循环系统,转移到其他身体部位并继续生长的过程。
原发灶不明恶性肿瘤(Cancer of unknown primary,以下简称CUP)是一种确诊为转移性恶性,但是无法确定原发位置的肿瘤,约占恶性肿瘤总数的3%~5%,它的死亡率在所有癌症中排名第四。无法确定肿瘤原发位置的原因可能是原发灶太小、原发灶被机体免疫系统破坏或原发灶已在之前的治疗中被切除等。CUP患者的预后都比较差,接受化疗后生存时间中位数为4-12个月,1年生存率约为50%,5年生存率约为10%。由于对各种癌症的治疗手段各不相同,因此确定CUP患者的肿瘤原发位置并采取合适的措施,对于改善其预后具有重要的意义。
PET/CT曾是最有效的识别CUP原发位置的医学影像学工具,能够诊断出约30%的CUP原发位置。Moller等人使用FDG-PET-CT检测CUP原发位置,但当原发灶较小时,PET/CT对于癌症溯源起到的作用比较有限。为此,需要进行组织病理学检查。
组织病理学检查是诊断金标准和临床治疗依据,要查明其原发部位,活检是关键步骤之一,此外,还应行光学显微镜和免疫组化研究。近年来,随着生物技术的发展,研究者已能检测肿瘤组织细胞的基因表达水平、miRNA、lncRNA、甲基化水平等,并通过分析得到组织特异的肿瘤特征。转移灶肿瘤细胞的分子表达谱与原发灶位置的细胞更为相近,而与转移部位的细胞存在差异,这启示我们可以根据转移灶肿瘤细胞的分子表达谱进行肿瘤溯源。目前已有研究使用基因表达水平、miRNA水平、lncRNA水平等特征构建了肿瘤溯源模型,并取得了较高的准确度。而DNA甲基化是一种重要的基因修饰方式,甲基化水平具有组织特异性,有助于确定肿瘤的原发位置。机器学习算法可以从大量的甲基化数据中发现规律,依此对未知的样本进行分类,因此适用于甲基化肿瘤溯源问题。一项荟萃分析显示,在不告知原发部位的情况下,采用免疫组化标记物能准确识别已查明原发灶的转移癌。但是免疫组化标记物识别的准确性和有效性仍然较低,仍然存在当前部分肿瘤患者无法通过免疫组化方法确定原发灶的问题。
发明内容
本发明为了克服现有技术中免疫组化标记物识别的准确性和有效性仍然较低,仍然存在当前部分肿瘤患者无法通过免疫组化方法确定原发灶的问题,本发明通过设计新的甲基化检测反应体系,包括新的接头核苷酸序列和PCR扩增引物等,其具有更高的准确性和有效性等优点。
为了实现上述目的,本发明采用以下技术方案:一种鉴定肿瘤组织来源的试剂盒,包括接头,所述接头包括核苷酸序列,该接头的核苷酸序列包括A01-T、A01-B、A02-T、A02-B、A03-T、A03-B、A04-T、A04-B、A05-T、A05-B、A06-T、A06-B。
作为优选,所述鉴定肿瘤组织来源的试剂盒还包括PCR扩增引物和PCR扩增试剂,所述PCR扩增引物包含核苷酸序列,该PCR扩增引物的核苷酸序列包括R01-F、R01-R、R02-F和R02-R。
作为优选,所述鉴定肿瘤组织来源的试剂盒还包括PCR扩增试剂,所述PCR扩增试剂包括聚合酶、dNTP、MgCl2和Tris-HCl。
作为优选,所述鉴定肿瘤组织来源的试剂盒还包括去磷酸化酶、10X缓冲液内切酶,所述10X缓冲液内切酶为KAc、Tris-Ac或Mg(Ac)2
作为优选,所述鉴定肿瘤组织来源的试剂盒还包括dNTP混合物,所述dNTP混合物包括dATP、dCTP、dGTP。
作为优选,所述鉴定肿瘤组织来源的试剂盒还包括末端修复酶、连接酶和ATP。
作为优选,所述鉴定肿瘤组织来源的试剂盒还包括阴性对照品、阳性对照品,所述阴性对照品为健康人血液白细胞DNA,所述阳性对照品为癌症组织样本DNA。
本发明还公开了一种用于鉴定肿瘤组织来源的试剂盒的数据分析方法,包括以下步骤:
1)数据预处理:对原始下机数据做质控,去除原始数据的接头序列和inlinebarcode序列,得到有效数据。
2)比对:将clean data与人类参考基因组进行比对,然后将比对生成的bam文件转换成mHap文件;
3)CpG甲基化信息统计:提取每个CpG位点的甲基化信息;
4)质量控制:将亚硫酸氢盐转化率低于99%、比对率低于50%以及覆盖度在10x以上的CpG位点的个数小于80万的样本去除;
5)分析:分析甲基化Beta指标,与训练集模型逐一预测所有样本,输出每个样本在10个癌种上的概率值。
作为优选,步骤1)中利用FastQC软件组件对原始下机数据做质控。
作为优选,步骤1)使用Trim Galore软件去除原始数据。
本发明的有益效果是:(1)本发明在《CN 113604540一种利用血液循环肿瘤DNA快速构建RRBS测序文库的方法》和《CN 113550013一种利用福尔马林固定石蜡包埋样本快速构建RRBS测序文库的方法》两个方法学专利的基础上,开发了用于定性检测经临床医生初步诊断为癌症的患者经福尔马林固定的石蜡包埋(FFPE)肿瘤组织或血液样本人基因组的甲基化图谱的试剂盒,其具有更高的准确性和有效性等优点;本发明解决当前部分肿瘤患者无法通过免疫组化方法确定原发灶的问题;(2)本发明通过配套的分析系统,进一步提高了识别比例。
附图说明
图1是本发明的甲基化检测流程图;
图2是本发明的分析模型构建流程图;
图3是本发明甲基化分析流程图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步的描述。
于一个实施例中,本发明公开了一种鉴定肿瘤组织来源的试剂盒,包括接头、PCR扩增引物、PCR扩增试剂、去磷酸化酶、10X缓冲液内切酶、dNTP混合物、末端修复酶、连接酶ATP、阴性对照品和阳性对照品,所述接头包括核苷酸序列,该接头的核苷酸序列包括A01-T、A01-B、A02-T、A02-B、A03-T、A03-B、A04-T、A04-B、A05-T、A05-B、A06-T、A06-B。所述PCR扩增试剂包括聚合酶,dNTP,MgCl2,Tris-HCl。所述10X缓冲液内切酶为KAc、Tris-Ac或Mg(Ac)2
接头中的核苷酸序列具体为:
A01-T mCTmCAmCGAmCGmCTmCTmCmCGTmCTAmCAAmCmC-S-T
A01-B Pho-GGTTGTAGATmCGGAAGAGmCAmCAmCGTmCTAAmC
A02-T mCTAmCAmCGmCGmCTmCTmCmCGATmCTAmCTmCAmC-S-T
A02-B Pho-GTGAGTAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC
A03-T mCTAmCAmCGmCGmCTmCTmCmCGATmCTAGGATG-S-T
A03-B Pho-mCATmCmCTAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC
A04-T mCTAmCAmCAmCGmCTmCTTmCmCGATmCTATmCGAmC-S-T
A04-B Pho-GTmCGATAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC
A05-T mCTAmCAmCGAmCGmCTmCTTmCmCGTmCTmCAAGAG-S-T
A05-B Pho-mCTmCTTGAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC
A06-T mCTAmCAmCGAmCGmCTmCTTmCmCGATmCTmCATAmC-S-T
A06-B Pho-GTmCATGAGATmCGGAAGAGmCAmCAmCmCTGAAmC
所述PCR扩增引物包含核苷酸序列,该PCR扩增引物的核苷酸序列包括R01-F、R01-R、R02-F和R02-R。该PCR扩增引物的核苷酸序列引物序列具体为:
于另一个实施例中,如图1所示,本发明还公开了一种用于鉴定肿瘤组织来源的试剂盒的数据分析方法,包括以下步骤:
1)数据预处理:对原始下机数据做质控,去除原始数据的接头序列和inlinebarcode序列,得到有效数据。步骤1)中利用FastQC软件组件对原始下机数据做质控。步骤1)使用Trim Galore软件去除原始数据。
2)比对:将clean data与人类参考基因组进行比对,然后将比对生成的bam文件转换成mHap文件;
3)CpG甲基化信息统计:提取每个CpG位点的甲基化信息;
4)质量控制:将亚硫酸氢盐转化率低于99%、比对率低于50%以及覆盖度在10x以上的CpG位点的个数小于80万的样本去除;
5)分析:分析甲基化Beta指标,与训练集模型逐一预测所有样本,输出每个样本在10个癌种上的概率值。
实施例1:本产品的检测过程如下:
1)DNA去磷酸化处理:
DNA去磷酸化反应体系:DNA投入量为5-500ng,去磷酸化酶0.1-1.0μL,缓冲液0.3-3.0μL,补水至总体积10-50μL。其中DNA去磷酸化反应条件:37℃处理5-50min,75℃处理5-30min。
2)DNA酶切反应:
DNA酶切反应体系:在上述DNA去磷酸化处理体系中,加入内切酶0.1-1.0μL,缓冲液0.1-1.0μL。DNA酶切反应条件:37℃处理10-100min,70℃处理5-30min。
3)文库末端修复:
末端修复反应体系:在上述DNA酶切反应体系中,加入末端修复酶0.1-1.0μL,缓冲液0.1-1.0μL,dNTP混合物0.1-1.0μL。末端修复反应程序:30℃处理10-30min,37℃处理10-30min,70℃处理5-30min。
4)接头连接:
接头连接体系:在上述文库末端修复体系中,加入ATP 0.1-1.0μL,连接酶0.4-4.0μL,缓冲液0.5-5.0μL,接头0.3-3.0μL;接头连接程序:16℃处理1-4h,70℃处理10-30min。
5)核酸纯化:
用核酸纯化试剂将上述体系纯化,取40-60μLDNA溶液进入转化反应。
6)亚硫酸氢盐转化:
用亚硫酸氢盐转化试剂盒将纯化后的核酸进行亚硫酸盐转化处理;
7)PCR扩增富集:
PCR扩增富集体系:转化后的DNA20-30μL,PCR扩增试剂10-25μL,PCR扩增引物1-5μL。经优化的PCR扩增试剂,扩增反应时间缩短至10分钟以内。
PCR扩增富集扩增程序(见下表):
8)文库纯化:
用核酸纯化试剂将上述文库纯化,取10-50μLDNA溶液保存于1.5mL的EP管中。
9)文库质量质控:
文库浓度质控:采用dsDNA HS Assay Kit对文库浓度进行质控,文库浓度>2.5ng/μL;文库片段长度质控:采用Agilent High Sensitivity DNA Kit进行文库片段质检,若片段主带大小在200-400bp,文库片段合格。
10)通用文库转换成MGI文库(Illumina平台跳过此步骤):
用MGIEasy通用文库转换试剂盒将通用文库转换成MGI文库。
11)测序:
用基因测序仪MGISEQ-2000配套测序试剂或Illumina测序仪配套测序试剂进行测序。
鉴定肿瘤组织来源的试剂盒的数据分析方法:
1)数据预处理:用FastQC软件组件对原始下机数据做质控,再使用Trim Galore软件去除原始数据(raw data)的接头序列和inline barcode序列,得到有效数据(cleandata)。
2)比对:使用BSMAP软件将clean data与人类参考基因组(hg19版本)进行比对,然后利用mHapTools软件将比对生成的bam文件转换成mHap文件。
3)CpG甲基化信息统计:利用甲基化数据分析软件MethylDackel提取每个CpG位点的甲基化信息。
4)质量控制:为了获得高质量的样本,我们将亚硫酸氢盐转化率低于99%、比对率低于50%以及覆盖度在10x以上的CpG位点的个数小于80万的样本去除。
5)特征选择:筛选满足条件的CpG岛用于后续分析,具体的筛选方法如下:CpG岛的覆盖度要大于100x;且应用t检验从498个原发肿瘤和57个肿瘤邻近正常组织中筛选潜在的可作为生物标志物的CpG岛:所选CpG岛需在一种癌症类型中的甲基化水平与其他癌症类型的甲基化水平具有显著差异(FDR≤0.01),且其甲基化水平应显著高于或低于57个肿瘤邻近正常组织(FDR≤0.01)。
本实施例采用了4种不同的方法来表征CpG岛的甲基化水平,这4种方法分别是:mean methylation(Beta value)、Proportion of Discordant Reads(PDR)、CellHeterogeneity-Adjusted cLonal Methylation(CHALM)以及Methylated Haplotype Load(MHL)。每种方法可以得到一组CpG岛,这些CpG岛将用于随后的分类器构建。
6)分类器构建:使用7种机器学习算法(adaboost、KNN、LGR、LinearSVC、NB、RF、SVM)和上述4组CpG岛构建了28个分类器,然后采用验证集对这些分类器进行评估。评估的主要指标包括精度(Precision)、召回率(Recall)、F1分数(F1 score)和准确率(Accuracy),计算公式如下:
Recall=TP/(TP+FN)
Precision=TP/(TP+FP)
F1=2(recall*precision)/(recall+precision)
Accuracy=(TP+TN)/(TP+FP+TN+FN)
基于上述方法构建的分类器的预测AUC(见下表)
本实施例还可选用LGR和LinearSVC算法,分析甲基化Beta指标,其AUC最高。
实施例2:
对生产的人基因组甲基化检测试剂盒进行了测试,检测了来自不同医院的临床样本,采用病理诊断法作为对比验证方法。
对比验证方法——病理诊断法是基于当前医学水平,由专业医生通过对血液和生化检测、尿液分析、粪便隐血试验、对疑似肿瘤原发部位放射学检查、病理免疫组化以及病史等信息综合判定的结果。
本试剂盒的测试方法如下:
石蜡包埋病理组织:从病变组织中取样确定至少含有30%肿瘤病变组织,石蜡包埋病理组织或切片样品确定含有肿瘤病变细胞,选择储存时限未超过1年的样品,使用不少于8片的5μm切片或不少于5片的10μm切片使用商业化的试剂盒进行DNA提取;
使用dsDNA HS Assay Kit测定有效DNA浓度,DNA浓度不低于2ng/μL,DNA总量不低于50ng为合格。
1)DNA去磷酸化处理:
DNA去磷酸化反应体系:DNA投入量为50ng,去磷酸化酶1.0μL,缓冲液10μL,补水至总体积30μL。DNA去磷酸化反应条件:37℃处理50min,75℃处理20min。
2)DNA酶切反应:
DNA酶切反应体系:在上述DNA去磷酸化处理体系中,加入内切酶1.0μL,缓冲液0.2μL。DNA酶切反应条件:37℃处理90min,70℃处理10min。
3)文库末端修复:
末端修复反应体系:在上述DNA酶切反应体系中,加入末端修复酶1.0μL,缓冲液0.4μL,dNTP混合物0.8μL。末端修复反应程序:30℃处理25min,37℃处理25min,70℃处理10min。
4)接头连接:
接头连接体系:在上述文库末端修复体系中,加入ATP 0.2μL,连接酶0.4μL,缓冲液0.6μL,接头3.0μL;接头连接程序:16℃处理4h,70℃处理15min。
5)核酸纯化:
用核酸纯化试剂将上述体系纯化,取40μLDNA溶液进入转化反应。
6)亚硫酸氢盐转化:
用亚硫酸氢盐转化试剂盒将纯化后的核酸进行亚硫酸盐转化处理;
7)PCR扩增富集:
PCR扩增富集体系:转化后的DNA 20μL,PCR扩增试剂25μL,PCR扩增引物5μL。
PCR扩增富集扩增程序(见下表):
8)文库纯化:
用核酸纯化试剂将上述文库纯化,取35μLDNA溶液保存于1.5mL的EP管中。
9)文库质量质控:
文库浓度质控:采用dsDNA HS Assay Kit对文库浓度进行质控,文库浓度>2.5ng/μL;文库片段长度质控:采用Agilent High Sensitivity DNA Kit进行文库片段质检,若片段主带大小在200-400bp,文库片段合格。
10)通用文库转换成MGI文库:
用MGIEasy通用文库转换试剂盒将通用文库转换成MGI文库。
11)测序
用基因测序仪MGISEQ-2000配套测序试剂进行测序。
实施例3
如图2、图3所示,本发明还公开了一种用于鉴定肿瘤组织来源的试剂盒的数据分析方法,其包括以下步骤:
1)数据预处理:用FastQC软件组件对原始下机数据做质控,再使用Trim Galore软件去除原始数据(raw data)的接头序列和inline barcode序列,得到有效数据(cleandata)。
2)比对:使用BSMAP软件将clean data与人类参考基因组(hg19版本)进行比对,然后利用mHapTools软件将比对生成的bam文件转换成mHap文件。
3)CpG甲基化信息统计:利用甲基化数据分析软件MethylDackel提取每个CpG位点的甲基化信息。
4)质量控制:将亚硫酸氢盐转化率低于99%、比对率低于50%以及覆盖度在10x以上的CpG位点的个数小于80万的样本去除。
5)分析:选用LGR和LinearSVC算法,分析甲基化Beta指标,与训练集模型逐一预测所有样本,输出每个样本在10个癌种上的概率值。
6)一致性分析结果见汇总表1,结果显示人基因组甲基化检测试剂盒(联合探针锚定聚合测序法)对癌的原发部位的预测结果(根据概率值高低,选择排名第一的结果与病理诊断结果进行比较),整体符合率为78.75%,与临床诊断结果具有较高的总符合率和一致性,初步验证了试剂盒对癌的原发部位的检测具有较高的准确性和有效性。
表1:一致性分析结果(概率值排名第一结果)
序号 癌种名字 样本数 预测准确数 符合率
1 乳腺癌 27 24 88.89%
2 肺癌 27 23 85.19%
3 胃癌 30 20 66.67%
4 肠癌 31 30 96.77%
5 头颈癌 22 15 68.18%
6 甲状腺癌 25 23 92.00%
7 宫颈癌 16 9 56.25%
8 卵巢癌 26 21 80.77%
9 肝癌 23 18 78.26%
10 食管癌 13 6 46.15%
汇总 总例数 240 189 78.75%
考虑到部分癌种如宫颈癌仅在女性发病,且当预测概率值排在第一位和第二位数值差别较小时,可能预测概率值排在第二位对应的部位为真正的癌原发部位。故将预测概率值排名前两位的结果进行分析,前两位中有一个与临床诊断结果一致的均计做符合,结果如表所示,包括胃癌、头颈癌、宫颈癌和食管癌在内的癌种符合率显著提升,整体准确率提高至88.33%(见表2)。
表2:一致性分析结果(概率值排名前二结果)
序号 癌种名字 样本数 top2准确数 准确率
1 乳腺癌 27 25 92.59%
2 肺癌 27 26 96.30%
3 胃癌 30 22 73.33%
4 肠癌 31 30 96.77%
5 头颈癌 22 20 90.91%
6 甲状腺癌 25 25 100.00%
7 宫颈癌 16 12 75.00%
8 卵巢癌 26 22 84.62%
9 肝癌 23 20 86.96%
10 食管癌 13 10 76.92%
汇总 总例数 240 212 88.33%
在本次测试的240例样本中,有89例癌的分化水平已知为中低分化,其结果如表3所示,按照预测概率值最高结果(TOP1)计算,准确率可达到75.28%;而将预测概率值排名前二(TOP2)的纳入计算,准确率提高至85.39%。说明该产品对中低分化癌的原发部位判定能力优于当前技术水平所报道的免疫组化的准确性。
表3中低分化癌组织一致性分析结果
综合而言,本产品的判定结果与临床诊断结果具有较高的总符合率和一致性,初步验证了人基因组甲基化检测试剂盒对癌的原发部位检测的临床价值,具有较高的准确性和有效性。
以上所述仅为本发明的优选实施例,并非因此即限制本发明的专利保护范围,凡是运用本发明说明书及附图内容所作的等效结构变换,直接或间接运用在其他相关的技术领域,均同理包括在本发明的保护范围内。

Claims (7)

1.一种鉴定肿瘤组织来源的试剂盒,其特征是,包括接头,所述接头包括核苷酸序列,该接头的核苷酸序列包括A01-T、A01-B、A02-T、A02-B、A03-T、A03-B、A04-T、A04-B、A05-T、A05-B、A06-T、A06-B;其中,
A01-T:mCTmCAmCGAmCGmCTmCTmCmCGTmCTAmCAAmCmC-S-T,
A01-B:Pho-GGTTGTAGATmCGGAAGAGmCAmCAmCGTmCTAAmC,
A02-T:mCTAmCAmCGmCGmCTmCTmCmCGATmCTAmCTmCAmC-S-T,
A02-B:Pho-GTGAGTAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC,
A03-T:mCTAmCAmCGmCGmCTmCTmCmCGATmCTAGGATG-S-T,
A03-B:Pho-mCATmCmCTAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC,
A04-T:mCTAmCAmCAmCGmCTmCTTmCmCGATmCTATmCGAmC-S-T,
A04-B:Pho-GTmCGATAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC,
A05-T:mCTAmCAmCGAmCGmCTmCTTmCmCGTmCTmCAAGAG-S-T,
A05-B:Pho-mCTmCTTGAGATmCGGAAGAGmCAmCAmCGTmCTGAAmC,
A06-T:mCTAmCAmCGAmCGmCTmCTTmCmCGATmCTmCATAmC-S-T,
A06-B:Pho-GTmCATGAGATmCGGAAGAGmCAmCAmCmCTGAAmC;
该试剂盒针对癌症类型为乳腺癌、肺癌、胃癌、肠癌、头颈癌、甲状腺癌、宫颈癌、卵巢癌、肝癌和食管癌。
2.根据权利要求1所述的一种鉴定肿瘤组织来源的试剂盒,其特征是,还包括PCR扩增引物和PCR扩增试剂,所述PCR扩增引物包含核苷酸序列,该PCR扩增引物的核苷酸序列包括R01-F、R01-R、R02-F和R02-R;其中,所述R01-F的核苷酸序列引物序列为AATGATACGGCGACCACCGCACTCTTTCCCTACACGACGCTCTTCCGATCT;所述R01-R的核苷酸序列引物序列为CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTGAGTTCAGACGTGTGCTCTTCCGATCT;所述R02-F的核苷酸序列引物序列为AATGATACGGCGACCACCGATACACTCTTTCCCTACACGACGCTCTTCCGATCT;所述R02-R的核苷酸序列引物序列为CAAGCAGAAGACGGCATACGAGATCTAGTACGGTGTCAGACGTGTGCTCTTCCGATCT。
3.根据权利要求1所述的一种鉴定肿瘤组织来源的试剂盒,其特征是,还包括PCR扩增试剂,所述PCR扩增试剂包括聚合酶、dNTP、MgCl2和Tris-HCl。
4. 根据权利要求1所述的一种鉴定肿瘤组织来源的试剂盒,其特征是,还包括去磷酸化酶、10 X缓冲液内切酶,所述10 X缓冲液内切酶为KAc、Tris-Ac或Mg(Ac)2
5.根据权利要求1所述的一种鉴定肿瘤组织来源的试剂盒,其特征是,还包括dNTP混合物,所述dNTP混合物包括dATP、dCTP、dGTP。
6.根据权利要求1或2或3或4或5所述的一种鉴定肿瘤组织来源的试剂盒,其特征是,还包括末端修复酶、连接酶和ATP。
7.根据权利要求1或2或3或4或5所述的一种鉴定肿瘤组织来源的试剂盒,其特征是,还包括阴性对照品、阳性对照品,所述阴性对照品为健康人血液白细胞DNA,所述阳性对照品为癌症组织样本DNA。
CN202310501572.7A 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒及数据分析方法 Active CN116555426B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202410636980.8A CN118737268A (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒的数据分析方法
CN202310501572.7A CN116555426B (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒及数据分析方法
EP23189193.8A EP4458989A1 (en) 2023-05-04 2023-08-02 Kit for identifying tumor tissue-of-origin and data analysis method
US18/450,653 US20240368699A1 (en) 2023-05-04 2023-08-16 Kit for identifying tumor tissue-of-origin and data analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310501572.7A CN116555426B (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒及数据分析方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410636980.8A Division CN118737268A (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒的数据分析方法

Publications (2)

Publication Number Publication Date
CN116555426A CN116555426A (zh) 2023-08-08
CN116555426B true CN116555426B (zh) 2024-07-12

Family

ID=87502997

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310501572.7A Active CN116555426B (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒及数据分析方法
CN202410636980.8A Pending CN118737268A (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒的数据分析方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202410636980.8A Pending CN118737268A (zh) 2023-05-04 2023-05-04 一种鉴定肿瘤组织来源的试剂盒的数据分析方法

Country Status (3)

Country Link
US (1) US20240368699A1 (zh)
EP (1) EP4458989A1 (zh)
CN (2) CN116555426B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112708622A (zh) * 2021-02-01 2021-04-27 深圳裕康医学检验实验室 一种用于文库构建的接头引物组合及其试剂盒
CN113604540A (zh) * 2021-07-23 2021-11-05 杭州圣庭医疗科技有限公司 一种利用血液循环肿瘤dna快速构建rrbs测序文库的方法
CN115132273A (zh) * 2022-08-01 2022-09-30 广州燃石医学检验所有限公司 一种肿瘤形成风险与肿瘤组织来源的评估方法及系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2049682A2 (en) * 2006-07-31 2009-04-22 Illumina Cambridge Limited Method of library preparation avoiding the formation of adaptor dimers
PT2898100T (pt) * 2012-09-20 2018-02-26 Univ Hong Kong Chinese Determinação não invasiva de um metiloma de feto ou tumor a partir de plasma
CN104250663B (zh) * 2013-06-27 2017-09-15 北京大学 甲基化CpG岛的高通量测序检测方法
EP3645718A4 (en) * 2017-06-30 2021-09-15 The Regents of the University of California METHODS AND SYSTEMS FOR EVALUATING DNA METHYLATION IN CELL-FREE DNA
CN107541791A (zh) * 2017-10-26 2018-01-05 中国科学院北京基因组研究所 血浆游离dna甲基化检测文库的构建方法、试剂盒及应用
KR20220015367A (ko) * 2019-05-31 2022-02-08 프리놈 홀딩스, 인크. 메틸화된 핵산의 고심도 시퀀싱 방법 및 시스템
CN110379465A (zh) * 2019-07-19 2019-10-25 元码基因科技(北京)股份有限公司 基于rna靶向测序和机器学习的癌症组织溯源方法
CN111833965B (zh) * 2019-11-08 2024-06-04 中国科学院北京基因组研究所(国家生物信息中心) 一种尿沉渣基因组dna的分类方法、装置和用途
CN112795620B (zh) * 2019-11-13 2024-08-13 深圳华大基因股份有限公司 双链核酸环化方法、甲基化测序文库构建方法和试剂盒
CN110938674B (zh) * 2019-12-05 2024-03-19 广州金域医学检验集团股份有限公司 甲基化测序dna文库的构建方法及其应用
EP4281583A1 (en) * 2021-01-20 2023-11-29 National University of Singapore Heatrich-bs: heat enrichment of cpg-rich regions for bisulfite sequencing
CN112941180A (zh) * 2021-02-25 2021-06-11 浙江大学医学院附属妇产科医院 一组肺癌dna甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用
CN113249439A (zh) * 2021-05-11 2021-08-13 杭州圣庭医疗科技有限公司 一种简化dna甲基化文库及转录组共测序文库的构建方法
CN113539355B (zh) * 2021-07-15 2022-11-25 云康信息科技(上海)有限公司 预测cfDNA的组织特异性来源及相关疾病概率评估系统及应用
CN113550013B (zh) * 2021-07-23 2022-11-01 杭州圣庭医疗科技有限公司 一种利用福尔马林固定石蜡包埋样本快速构建rrbs测序文库的方法
CN114045342A (zh) * 2021-12-01 2022-02-15 大连晶泰生物技术有限公司 一种游离DNA(cfDNA)甲基化突变的检测方法及试剂盒
CN114214408B (zh) * 2021-12-22 2023-02-17 重庆大学附属肿瘤医院 一种高通量、高灵敏度检测肿瘤ctDNA甲基化的方法、探针库及试剂盒
CN115896027A (zh) * 2022-04-07 2023-04-04 广州燃石医学检验所有限公司 一种生物组合物、其制备方法及应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112708622A (zh) * 2021-02-01 2021-04-27 深圳裕康医学检验实验室 一种用于文库构建的接头引物组合及其试剂盒
CN113604540A (zh) * 2021-07-23 2021-11-05 杭州圣庭医疗科技有限公司 一种利用血液循环肿瘤dna快速构建rrbs测序文库的方法
CN115132273A (zh) * 2022-08-01 2022-09-30 广州燃石医学检验所有限公司 一种肿瘤形成风险与肿瘤组织来源的评估方法及系统

Also Published As

Publication number Publication date
CN118737268A (zh) 2024-10-01
EP4458989A1 (en) 2024-11-06
CN116555426A (zh) 2023-08-08
US20240368699A1 (en) 2024-11-07

Similar Documents

Publication Publication Date Title
CN110760580B (zh) 一种肝癌的早期诊断设备
CN111863250B (zh) 一种早期乳腺癌的联合诊断模型及系统
CN111662982B (zh) 用于脑胶质瘤早期诊断和/或复发监测的生物标志物及其应用
CN111910004A (zh) cfDNA在早期乳腺癌无创诊断中的应用
CN110229897A (zh) Med12基因突变检测试剂盒及其应用
CN106399304B (zh) 一种与乳腺癌相关的snp标记
CN116403644B (zh) 一种用于癌症风险预测的方法及装置
CN117165688A (zh) 用于尿路上皮癌的标志物及其应用
CN115896281B (zh) 甲基化生物标记物、试剂盒及用途
CN116987791B (zh) 一组血浆标志物在甲状腺结节良恶性鉴别中的应用
CN112951325A (zh) 一种用于癌症检测的探针组合的设计方法及其应用
CN117079723B (zh) 一种与肌萎缩侧索硬化症相关的生物标志物、诊断模型及其应用
CN116555426B (zh) 一种鉴定肿瘤组织来源的试剂盒及数据分析方法
WO2020194057A1 (en) Biomarkers for disease detection
CN112852969B (zh) 表观遗传修饰lncRNA作为肿瘤诊断或肿瘤进展预测标志物
CN115976209A (zh) 一种肺癌预测模型的训练方法以及预测装置和应用
CN115851923A (zh) 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用
CN106636351B (zh) 一种与乳腺癌相关的snp标记及其应用
CN113151469B (zh) 肿瘤分类标志物组合及其应用
US11807908B2 (en) Genetic markers used for identifying benign and malignant pulmonary micro-nodules and the application thereof
CN106834476A (zh) 一种乳腺癌检测试剂盒
CN114934120A (zh) 一种快速鉴定早期结直肠癌的环状rna标志物的应用及诊断试剂盒
CN106811528B (zh) 一种乳腺癌治病基因新突变及其应用
CN106520957B (zh) Dhrs7易感snp位点检测试剂及其制备的试剂盒
CN115851930A (zh) 用于检测肺结节良恶性的甲基化标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant