[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110246543A - 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统 - Google Patents

基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统 Download PDF

Info

Publication number
CN110246543A
CN110246543A CN201910541057.5A CN201910541057A CN110246543A CN 110246543 A CN110246543 A CN 110246543A CN 201910541057 A CN201910541057 A CN 201910541057A CN 110246543 A CN110246543 A CN 110246543A
Authority
CN
China
Prior art keywords
copy number
number variation
generation sequencing
pattern detection
sequencing technologies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910541057.5A
Other languages
English (en)
Other versions
CN110246543B (zh
Inventor
郎继东
王博
杨家亮
田埂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meta Code Gene Technology (beijing) Ltd By Share Ltd
Original Assignee
Meta Code Gene Technology (beijing) Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meta Code Gene Technology (beijing) Ltd By Share Ltd filed Critical Meta Code Gene Technology (beijing) Ltd By Share Ltd
Priority to CN201910541057.5A priority Critical patent/CN110246543B/zh
Publication of CN110246543A publication Critical patent/CN110246543A/zh
Application granted granted Critical
Publication of CN110246543B publication Critical patent/CN110246543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统。本发明可以从测序原始数据出发,不用依赖比对、测序深度、GC含量矫正及配对样本等传统方法必需或要求的因素对单样本进行拷贝数变异CNV检测。由此不仅简化了实验及分析步骤,降低了成本,而且分析结果与传统方法高度一致,还通过增加临床验证结果(例如FISH验证)对传统的方法检出的假阳性和假阴性进行了有效矫正。

Description

基于二代测序技术利用单样本检测拷贝数变异的方法和计算 机系统
技术领域
本发明涉及基因检测,具体涉及基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统。
背景技术
拷贝数变异(copy number variation,CNV)是一种结构变异,是由基因组发生重排而导致的,其根据大小可以分为显微水平(microscopic)和亚显微水平(submicroscopic)。显微水平的结构变异主要是指显微镜下可见的包括整倍体或非整倍体、插入、缺失、倒位、易位等染色体畸变;亚显微水平的结构变异主要指DNA片段长度在1Kb以上的包括插入、缺失、重复、倒位、易位等发生的变异。拷贝数变异是人类疾病的重要致病因素之一,目前的研究发现CNV与许多复杂遗传疾病的致病机制或易感性有关,包括肿瘤、获得性免疫缺陷综合征、系统性红斑狼疮、自身免疫炎症疾病等。临床上进行拷贝数变异检测是必要的,其可以及早的发现基因组中大片段DNA序列的变异,从而为疾病的诊断和治疗提供参考依据。
目前拷贝数变异检测的手段及方法很多,例如基于聚合酶链反应的方法,包括多重链接探针扩增技术和多重可扩增探针杂交技术等;基于杂交技术的方法,包括原位免疫荧光和Gismsa显带方法等;基于芯片技术的方法,包括单核苷酸多态性芯片等。这些方法不仅操作复杂,分辨率低,难以提供变异区段的具体信息,而且分析通量较低,价格较为昂贵,性价比不是很高。而随着二代测序技术的快速发展,不仅测序成本大大降低,分析通量有了指数提高,并且分辨率可以降到Kb水平,使得亚显微水平的拷贝数变异研究可以更加的深入。目前检测CNV的算法基本上都是基于全基因组测序(WGS)水平来开发的,比如CNVkit、CNVnator、Control-FREEC等,而考虑到检测准确性,一般都会要求是配对样本来检测CNV;对于单样本的检测,一般都会是根据测序深度及GC含量来矫正识别CNV。而随着目标测序的需求越来越高,除了之前提到的算法外也应运而生了一些针对性更强的算法,比如PatternCNV、Ioncopy等。但这些方法无一例外的都要进行比对并且对于过分的依赖于测序深度及GC含量,而且还受限于比对参数及分析算法的参数设置,整体流程较为繁琐和复杂,实验及分析成本也都较高。
发明内容
鉴于此,本发明建立一种基于二代测序技术单样本检测拷贝数变异的方法和计算机系统。本发明可以从测序原始数据出发,不用依赖比对、测序深度、GC含量矫正及配对样本等传统方法必需或要求的因素对单样本进行拷贝数变异CNV检测。
具体地,本发明包括以下内容。
本发明的第一方面,提供一种基于二代测序技术利用单样本检测拷贝数变异的方法,其包括以下步骤:
(1)建立第一基因样本数据库和第二基因样本数据库,其中第一基因样本数据库包含A例拷贝数变异基因,所述第二基因样本数据库包含B例在相应基因未发生拷贝数变异的基因,其中A和B各自分别为50以上的自然数;第一基因样本数据库中的基因优选包含拷贝数变异,而第二基因样本数据库中的基因优选在与第一基因样本数据库中的基因拷贝数变异的位置(即区域)未发生相应的拷贝数变异。需要说明的是,在第二基因样本数据库的基因中可以存在区别与第一基因样本中拷贝数变异区域之外的突变包括拷贝数变异突变。为了保证本发明方法的可靠性和准确性,一般而言需要A和B各自分别为50以上的自然数,优选100以上,更优选200以上,进一步优选300以上。对于A和B的上限没有特别要求。
(2)将长度为Ljbp的j个拷贝数变异区域以m bp大小的滑动窗口分割,步长为nbp,由此在每个拷贝数变异区域得到i=Lj/n个种子序列,其中若Lj/n为整除,则i取整,若Lj/n不为整除,则i向下取整加1,共计得到由j*i个种子序列组成的矩阵。一般而言,j为1以上的自然数,优选10以上,更优选30以上。m为50以上的自然数,更优选80以上的自然数,更优选m为L以下。n为1以上至L以下的自然数,优选5以上至L以下的自然数。
(3)将j*i个种子序列分别在第一基因样本数据库和第二基因样本数据库中进行不容错的完全序列匹配,在每个数据库得到j*i个完全匹配种子序列数的矩阵。
(4)对每个数据库中完全匹配种子序列数的矩阵进行标准化处理,即每个完全匹配种子序列数除以所述拷贝数变异区域的所有完全匹配种子序列数的平均数。
(5)对标准化处理后的完全匹配种子序列数的矩阵进行补0值处理,即以拷贝数变异区域得到的种子序列个数最多的为对比,其余区域不足该个数的矩阵值设置为0。
(6)将A+B个补0值处理后的标准化完全匹配种子序列数矩阵进行数学建模,根据阴、阳性结果建立数据统计模型,最终得到判断拷贝数变异的阴阳性的数学模型。
(7)将待判断样本重复步骤(2)-(5),利用步骤(6)所得的数学模型进行拷贝数变异的预测及判断,若预测值大于0.5,优选大于0.6,更优选大于0.8,则判断为阳性,反之为阴性。
优选地,本发明的基于二代测序技术利用单样本检测拷贝数变异的方法中,所述第一基因样本数据库和第二基因样本数据库中的基因样本数据来源于全基因组测序和/或目标区域捕获/扩增测序得到的数据。
优选地,本发明的基于二代测序技术利用单样本检测拷贝数变异的方法中,所述拷贝数变异包括基因拷贝数扩增和/或缺失。
优选地,本发明的基于二代测序技术利用单样本检测拷贝数变异的方法中,所述拷贝数变异包括染色体的整倍体或非整倍体、插入、缺失、倒位和易位,和DNA片段的插入、缺失、重复、倒位或易位。
优选地,本发明的基于二代测序技术利用单样本检测拷贝数变异的方法中,所述DNA片段的长度为1Kb以上,优选为1.5Kb以上。另一方面,优选为10Kb以下,更优选8Kb以下。
优选地,本发明的基于二代测序技术利用单样本检测拷贝数变异的方法中,所述基因为ERBB2。
优选地,本发明的基于二代测序技术利用单样本检测拷贝数变异的方法中,在步骤(6)中通过逻辑回归或深度学习算法建立数据统计模型。
本发明的第二方面,提供一种计算机系统,其包括处理器,且被配置为执行本发明的第一方面所述的方法。
本发明不仅简化了实验及分析步骤,降低了成本,而且分析结果与传统方法有较高的一致率,也通过增加临床验证结果(例如FISH验证)对传统的方法检出的假阳性和假阴性进行了有效矫正。
附图说明
图1为本发明一种示例性流程图。
具体实施方式
现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。除非另有说明,否则“%”或“量”均为基于重量的百分数。
实施例
选取5例已知ERBB2扩增阳性及5例已知ERBB2扩增阴性的全外显子组数据进行测试本发明的分析方法。具体以1例ERBB2阳性样本实施例Sample1举例(如流程图1),其余实施例重复步骤1-11,如下:
1.收集272例ERBB2基因扩增阳性的全外显子组测序数据,同时收集1029例ERBB2基因扩增阴性的全外显子组测序数据,并且将数据分成训练集合及测试集合两部分;其中训练集合包括223例阳性样本,817例阴性样本,测试集合包括49例阳性样本,212例阴性样本;
2.基因ERBB2包含27个全外显子,将27个扩增或缺失的区域Lj(0<j<28)bp以50bp大小的滑动窗口分割,步长为40bp,每个扩增或缺失的区域可以得到共i=Lj/40个种子序列,其中若Lj/40为整除,则i取整,若Lj/40不为整除,则i向下取整加1,故总共可以得到27*i个种子序列矩阵,其中Lj分别为311bp、152bp、214bp、135bp、69bp、116bp、142bp、120bp、127bp、74bp、91bp、200bp、133bp、91bp、161bp、48bp、139bp、123bp、99bp、186bp、156bp、76bp、147bp、98bp、189bp、253bp、974bp。相应的i分别为8、4、6、4、2、3、4、4、4、2、3、6、4、3、5、2、4、4、3、5、4、2、4、3、5、7、25。
3.将27*i个种子序列分别在训练集合1040例样本的数据中进行不容错的完全序列匹配,可以得到每个样本的27*i个完全匹配种子序列数的矩阵。
4.对每个样本的完全匹配种子序列数矩阵进行标准化处理,即每个完全匹配种子序列数除以该扩增或缺失区域的所有完全匹配种子序列数的平均数。
5.对标准化后的完全匹配种子序列数的矩阵进行补0值处理,即以扩增或缺失区域得到的种子序列个数最多的为对比,其余区域不足该个数的矩阵值设置为0。
6.将1040个补0值处理后的标准化完全匹配种子序列数27*25矩阵进行数学建模,首先对1040个样本进行10倍交叉验证,并且利用深度学习中的卷积神经网络(CNN)算法结合阴、阳性结果对模型选取超参数、调整优化,最终得到对训练集合AUC为93.04%、对测试集合AUC为94.54%的最优数学模型,以此作为判断同类型数据的新样本的模型方法。模型参数如表1所示。
表1-模型参数
7.将Sample1重复步骤2-5,利用6所得的最优数学模型进行拷贝数变异的预测及判断,其预测值为0.9916596,大于0.5,认为是阳性。
Sample2-Sample10预测值及判断结果如下表2所示。
表2-各样本的预测结果汇总
样本ID 预测值 观测值
Sample1 0.9916596 阳性
Sample2 0.9989957 阳性
Sample3 0.9999901 阳性
Sample4 0.9990958 阳性
Sample5 0.99751943 阳性
Sample6 0.012844639 阴性
Sample7 0.006111831 阴性
Sample8 0.003521628 阴性
Sample9 0.008016149 阴性
Sample10 0.002645513 阴性
在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。

Claims (9)

1.一种基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,包括以下步骤:
(1)建立第一基因样本数据库和第二基因样本数据库,其中第一基因样本数据库包含A例拷贝数变异基因,所述第二基因样本数据库包含B例在相应位置未发生拷贝数变异的基因,其中A和B各自分别为50以上的自然数;
(2)将长度为Ljbp的j个拷贝数变异区域以m bp大小的滑动窗口分割,步长为n bp,由此在每个拷贝数变异区域得到i=Lj/n个种子序列,其中若Lj/n为整除,则i取整,若Lj/n不为整除,则i向下取整加1,共计得到由j*i个种子序列组成的矩阵;
(3)将j*i个种子序列分别在第一基因样本数据库和第二基因样本数据库中进行不容错的完全序列匹配,在每个数据库得到j*i个完全匹配种子序列数的矩阵;
(4)对每个数据库中完全匹配种子序列数的矩阵进行标准化处理,即每个完全匹配种子序列数除以所述拷贝数变异区域的所有完全匹配种子序列数的平均数;
(5)对标准化处理后的完全匹配种子序列数的矩阵进行补0值处理,即以拷贝数变异区域得到的种子序列个数最多的为对比,其余区域不足该个数的矩阵值设置为0;
(6)将A+B个补0值处理后的标准化完全匹配种子序列数矩阵进行数学建模,根据阴、阳性结果建立数据统计模型,最终得到判断拷贝数变异的阴阳性的数学模型;
(7)将待判断样本重复步骤(2)-(5),利用步骤(6)所得的数学模型进行拷贝数变异的预测及判断,若预测值大于0.5,则判断为阳性,反之为阴性。
2.根据权利要求1所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,j为1以上的自然数。
3.根据权利要求2所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,所述第一基因样本数据库和所述第二基因样本数据库中的基因样本数据来源于全基因组测序和/或目标区域捕获/扩增测序得到的数据。
4.根据权利要求3所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,所述拷贝数变异包括基因拷贝数扩增和/或缺失。
5.根据权利要求4所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,所述拷贝数变异包括染色体的整倍体或非整倍体、插入、缺失、倒位或易位,和DNA片段的插入、缺失、重复、倒位或易位。
6.根据权利要求5所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,所述DNA片段的长度为1Kb以上。
7.根据权利要求1所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,所述基因为ERBB2。
8.根据权利要求1所述的基于二代测序技术利用单样本检测拷贝数变异的方法,其特征在于,在步骤(6)中通过逻辑回归或深度学习算法建立数据统计模型。
9.一种计算机系统,其特征在于,其包括处理器,且被配置为能够执行根据权利要求1-8任一项所述的方法。
CN201910541057.5A 2019-06-21 2019-06-21 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统 Active CN110246543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910541057.5A CN110246543B (zh) 2019-06-21 2019-06-21 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910541057.5A CN110246543B (zh) 2019-06-21 2019-06-21 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统

Publications (2)

Publication Number Publication Date
CN110246543A true CN110246543A (zh) 2019-09-17
CN110246543B CN110246543B (zh) 2021-02-26

Family

ID=67888607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910541057.5A Active CN110246543B (zh) 2019-06-21 2019-06-21 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统

Country Status (1)

Country Link
CN (1) CN110246543B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111276189A (zh) * 2020-02-26 2020-06-12 广州市金域转化医学研究院有限公司 基于ngs的染色体平衡易位检测分析系统及应用
CN112634987A (zh) * 2020-12-25 2021-04-09 北京吉因加医学检验实验室有限公司 一种单样本肿瘤dna拷贝数变异检测的方法和装置
CN113736865A (zh) * 2021-09-09 2021-12-03 元码基因科技(北京)股份有限公司 用于检测样本中基因拷贝数变异的试剂盒、反应体系及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130184999A1 (en) * 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery
CN106372459A (zh) * 2016-08-30 2017-02-01 天津诺禾致源生物信息科技有限公司 一种基于扩增子二代测序拷贝数变异检测的方法及装置
CN108073791A (zh) * 2017-12-12 2018-05-25 元码基因科技(北京)股份有限公司 基于二代测序数据检测目标基因结构变异的方法
CN108256289A (zh) * 2018-01-17 2018-07-06 湖南大地同年生物科技有限公司 一种基于目标区域捕获测序基因组拷贝数变异的方法
CN108304694A (zh) * 2018-01-30 2018-07-20 元码基因科技(北京)股份有限公司 基于二代测序数据分析基因突变的方法
CN108427864A (zh) * 2018-02-14 2018-08-21 南京世和基因生物技术有限公司 一种拷贝数变异的检测方法、装置以及计算机可读介质
CN108920899A (zh) * 2018-06-10 2018-11-30 杭州迈迪科生物科技有限公司 一种基于目标区域测序的单个外显子拷贝数变异预测方法
CN110808084A (zh) * 2019-09-19 2020-02-18 西安电子科技大学 一种基于单样本二代测序数据的拷贝数变异检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130184999A1 (en) * 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery
CN106372459A (zh) * 2016-08-30 2017-02-01 天津诺禾致源生物信息科技有限公司 一种基于扩增子二代测序拷贝数变异检测的方法及装置
CN108073791A (zh) * 2017-12-12 2018-05-25 元码基因科技(北京)股份有限公司 基于二代测序数据检测目标基因结构变异的方法
CN108256289A (zh) * 2018-01-17 2018-07-06 湖南大地同年生物科技有限公司 一种基于目标区域捕获测序基因组拷贝数变异的方法
CN108304694A (zh) * 2018-01-30 2018-07-20 元码基因科技(北京)股份有限公司 基于二代测序数据分析基因突变的方法
CN108427864A (zh) * 2018-02-14 2018-08-21 南京世和基因生物技术有限公司 一种拷贝数变异的检测方法、装置以及计算机可读介质
CN108920899A (zh) * 2018-06-10 2018-11-30 杭州迈迪科生物科技有限公司 一种基于目标区域测序的单个外显子拷贝数变异预测方法
CN110808084A (zh) * 2019-09-19 2020-02-18 西安电子科技大学 一种基于单样本二代测序数据的拷贝数变异检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MIN ZHAO.ET AL: ""Computational tools for copy number variation"", 《BMC BIOINFORMATICS》 *
刘永壮: ""基于高通量测序数据的基因组变异检测"", 《中国博士学位论文全文数据库(电子期刊)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111276189A (zh) * 2020-02-26 2020-06-12 广州市金域转化医学研究院有限公司 基于ngs的染色体平衡易位检测分析系统及应用
CN112634987A (zh) * 2020-12-25 2021-04-09 北京吉因加医学检验实验室有限公司 一种单样本肿瘤dna拷贝数变异检测的方法和装置
CN113736865A (zh) * 2021-09-09 2021-12-03 元码基因科技(北京)股份有限公司 用于检测样本中基因拷贝数变异的试剂盒、反应体系及方法

Also Published As

Publication number Publication date
CN110246543B (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
Zeng et al. Signatures of negative selection in the genetic architecture of human complex traits
Oldham et al. Network methods for describing sample relationships in genomic datasets: application to Huntington’s disease
JP4594622B2 (ja) 薬発見法
US20020095260A1 (en) Methods for efficiently mining broad data sets for biological markers
CN108474040A (zh) 使用无细胞dna的基于群体的治疗推荐
WO2022170909A1 (zh) 药物敏感预测方法、电子设备及计算机可读存储介质
CN110246543A (zh) 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统
He et al. Microarrays—the 21st century divining rod?
CN112289376B (zh) 一种检测体细胞突变的方法及装置
US20210090686A1 (en) Single cell rna-seq data processing
CN105404793A (zh) 基于概率框架和重测序技术快速发现表型相关基因的方法
van Baardwijk et al. A decentralized kidney transplant biopsy classifier for transplant rejection developed using genes of the Banff-human organ transplant panel
Nanguneri et al. Characterization of nanoscale organization of f-actin in morphologically distinct dendritic spines in vitro using supervised learning
CN113362894A (zh) 一种对协同致死的癌症驱动基因进行预测的方法
Rabier et al. On the inference of complex phylogenetic networks by Markov Chain Monte-Carlo
DeGiorgio et al. A spatially aware likelihood test to detect sweeps from haplotype distributions
CN110010195A (zh) 一种探测单核苷酸突变的方法及装置
Wei et al. DMSC: a dynamic multi-seeds method for clustering 16S rRNA sequences into OTUs
WO2021086595A1 (en) Using machine learning-based trait predictions for genetic association discovery
JP2007504542A (ja) 生物学データを処理する方法
Rao et al. Partial correlation based variable selection approach for multivariate data classification methods
CN111763738A (zh) 一种特征mRNA表达谱组合及肝癌早期预测方法
Zhao et al. The Bayesian polyvertex score (PVS-B): a whole-brain phenotypic prediction framework for neuroimaging studies
CN114317725B (zh) 克罗恩病生物标志物、试剂盒及生物标志物的筛选方法
CN110942808A (zh) 一种基于基因大数据的预后预测方法及预测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant