JP5972448B2 - コピー数変異を検出する方法及びシステム - Google Patents
コピー数変異を検出する方法及びシステム Download PDFInfo
- Publication number
- JP5972448B2 JP5972448B2 JP2015503724A JP2015503724A JP5972448B2 JP 5972448 B2 JP5972448 B2 JP 5972448B2 JP 2015503724 A JP2015503724 A JP 2015503724A JP 2015503724 A JP2015503724 A JP 2015503724A JP 5972448 B2 JP5972448 B2 JP 5972448B2
- Authority
- JP
- Japan
- Prior art keywords
- cnv
- tag sequences
- window
- corrected
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 239000000523 sample Substances 0.000 claims description 56
- 239000012634 fragment Substances 0.000 claims description 53
- 238000012163 sequencing technique Methods 0.000 claims description 49
- 239000013068 control sample Substances 0.000 claims description 41
- 238000007689 inspection Methods 0.000 claims description 41
- 238000012937 correction Methods 0.000 claims description 36
- 210000000349 chromosome Anatomy 0.000 claims description 29
- 150000007523 nucleic acids Chemical class 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 20
- 230000035772 mutation Effects 0.000 claims description 18
- 102000039446 nucleic acids Human genes 0.000 claims description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 15
- 210000004700 fetal blood Anatomy 0.000 claims description 12
- 238000007363 ring formation reaction Methods 0.000 claims description 8
- 210000005259 peripheral blood Anatomy 0.000 claims description 6
- 239000011886 peripheral blood Substances 0.000 claims description 6
- 210000003754 fetus Anatomy 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 63
- 102000053602 DNA Human genes 0.000 description 63
- 238000001514 detection method Methods 0.000 description 19
- 238000003491 array Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 238000012300 Sequence Analysis Methods 0.000 description 6
- 238000004440 column chromatography Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000007400 DNA extraction Methods 0.000 description 5
- 210000004381 amniotic fluid Anatomy 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 208000036878 aneuploidy Diseases 0.000 description 4
- 231100001075 aneuploidy Toxicity 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000010298 pulverizing process Methods 0.000 description 4
- 238000005185 salting out Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 238000002604 ultrasonography Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 208000011580 syndromic disease Diseases 0.000 description 3
- 208000037280 Trisomy Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000006862 enzymatic digestion Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 229920001296 polysiloxane Polymers 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 206010061764 Chromosomal deletion Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 description 1
- 101000893303 Homo sapiens Glycine amidinotransferase, mitochondrial Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000001190 Q-PCR Methods 0.000 description 1
- 210000002593 Y chromosome Anatomy 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 210000002718 aborted fetus Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000004252 chorionic villi Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 238000012176 true single molecule sequencing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C99/00—Subject matter not provided for in other groups of this subclass
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Computing Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
GC含有量により、いくつの群に窓口を分け、各群にあるタグ配列数の平均及び全ての窓口における配列数の平均に基づいて、補正係数を算出し、窓口におけるタグ配列の数を補正して、GC含有量について補正されたタグ配列の数を求めるGC補正ユニットと、
対照群の各窓口におけるタグの総数に対するGC含有量について補正されたタグ配列数の数値を算出し、この数値に基づいて、各対照試料に応じる各窓口の当該数値の平均を求め、上述平均及び試験サンプルのタグ配列の総数に基づいて、試験サンプルの各窓口における予期のタグ配列の数を算出し、GC補正されたタグ配列の数を、対照試料群の補正された予期のタグ配列数により補正し、補正されたタグ配列の数を求める窓口補正ユニットと
を含んでもよい。
コピー数変異(copy number variation, CNV):検出対象サンプル由来の核酸配列を正常なサンプル由来の核酸配列と比べて、1kb以上の核酸分子のコピー数に変化が生じることを意味する。それは、欠失、例えば微小欠失、挿入、例えば微挿入、マイクロ重複、重複、逆位、転座、及び複雑なマルチサイト変異が含まれる。
対照試料からDNA分子を抽出するステップ310A、
対照試料から抽出されたDNA分子をランダムに断片化してから、配列決定し、対照試料のDNA断片の配列決定配列データ(即ち、読み出し)を取得するステップ311A、
対照試料の読み出しを参照ゲノムと対比させるステップ312A、
参照配列に唯一に完全適合する読み出しの数(即ち、タグ配列数)を計算するステップ313A、
対照試料をバッチ補正するステップ314A、
検品を窓口補正するように、対照試料により、予期の窓口数を求めるステップ315A、
候補CNV破過点を選定し、有意差の最も小さい候補CNV破過点を削除し、削除された候補CNV破過点に位置している前の候補CNV破過点と次の候補CNV破過点とのp値を再計算し、残りの断片数が所定の数(例えば、24)になるまでに繰り返する(即ち、候補CNV破過点の選定及び断片化)ステップ316A、及び、
この場合、終了p値の平均を計算することにより、検品の処理における反復と合併を終了させる要件とする終了閾値として、終了p値を効果的に算出することができるステップ317A
を含む。
検品からDNA分子を抽出するステップ310B、
検品から抽出されたDNA分子をランダムに断片化してから、配列決定し、対照試料のDNA断片の読み出しを取得するステップ311B、
検品のDNA断片の読み出しを参照ゲノムと対比させるステップ312B、
参照配列に唯一に完全適合する読み出しの数(即ち、タグ配列数)を計算するステップ313B、
検品をバッチ補正するステップ314B、
検品を窓口補正するように、対照試料により、予期の窓口数を求めるステップ315B、
候補CNV破過点の選定及び断片化をするステップ316B、及び、
得られた結果を濾過するステップ317B
を含む。
1、DNAの抽出:Tiangen社の製造したTIANamp Micro DNAKit(DP316)からの操作マニュアルに従い、8サンプル(以下、Sample1、Sample2、Sample3…Sample8と呼ばれる)からDNAを抽出し、得られたDNAを利用して、訂正されたイルミナ/Hiseq2000からの明細書に従って、ライブラリーを構築し、500bpに集中したDNA分子の両端に配列決定用アダプターをつけ、サンプルに対して、異なるインデックス(index)をつけ、次に、フローセル(flow cell)の界面にある相補のアダプターをハイブリッドし、核酸分子を特定の条件下でクラスタにし、そして、両端を読んでシークエンシングし、100bpの長さを有するDNA断片の配列を得た。
8サンプルを検出及び検証した結果は、表1に示す。
(1)精度:50Mのデータにより、0.45の微小欠失を有する断片を、正確に検出できる。
(2)拡張可能性:最初のDNA量に対する要求を減らすために、配列決定されたデータの数を多くするほか、対照群を大きくすることにより、精度を向上させることができる。
(3)安定、広範囲:これまでに報告される方法においては、操作自体を詳細に説明しないが、本発明は、データによるバッチ補正、グループ補正、及び、断片化用条件の選定などに関する。
Claims (15)
- 検品中の核酸分子の少なくとも一部の配列情報を読み取るステップ、
該配列情報により、ゲノムの参照配列に唯一に完全適合するタグ配列を判断するステッ
プ、
ウィンドウにゲノムの参照配列を分割して、各ウィンドウに入るタグ配列の数を計算するステップ、
各ウィンドウにおけるタグ配列の数を、GC含有量について補正し、対照試料群の補正された予期のタグ配列数により補正し、補正されたタグ配列の数を求めるステップ、
ウィンドウの出発点又は終点を分界点として、補正されたタグ配列の数からなる数値群の有意性を両側ともに計算し、有意差の小さい分界点を候補CNV破過点として選定するステップ、及び、
各CNV破過点とその前のCNV破過点との間にある配列、及び、各CNV破過点とそ
の次のCNV破過点との間にある配列に対して、該二つの配列に含まれるウィンドウにおける補正されたタグ配列の数からなる数値群の有意性をそれぞれ計算した後、有意差の最も小さい候補CNV破過点を削除して、削除された候補CNV破過点の前の候補CNV破過点と次の候補CNV破過点との有意性を再計算し、すべての候補CNV破過点の有意性が終了閾値に満たないまでに繰り返すことにより、CNV破過点を判断するステップ
を含み、
CNV破過点を判断した後に、さらに、CNV破過点の間にある断片に対して、信頼水
準を求めるステップをさらに含み、
前述の信頼水準を求めるステップは、補正されたタグ配列数の分布により、対照群を利
用して、補正されたタグ配列数の正常な信頼区間を求めるステップ、及び、断片にある補
正されたタグ配列数の平均が信頼区間から逸脱する場合に、当該CNV破過点の間にある
断片は異常があると判断するステップ、を含み、
前述検品としては、ヒト由来のサンプルであり、羊膜腔内に穿刺して吸引採取した羊水
、絨毛採取した絨毛、経皮的臍帯血採取した臍帯血、自発的に流産した胎児からの組織、
及びヒト末梢血から選ばれるいずれかの1種である
ことを特徴とするコピー数変異を検出する方法。 - 検品中の核酸分子の少なくとも一部を配列決定することにより配列情報を読み取るステップをさらに含むことを特徴とする請求項1に記載の方法。
- 各ウィンドウは、参照となるタグ配列の数が同じであり、又は同じ長さを有することを特徴とする請求項1に記載の方法。
- 終了閾値は、正常なサンプルからなる対照試料群により得られることを特徴とする請求
項1又は2に記載の方法。 - 前述の各ウィンドウにおけるタグ配列の数をGC含有量について補正するのは、
GC含有量に基づいて群にウィンドウを分け、各群のタグ配列数の平均及び全てのウィンドウにおけるタグ配列数の平均に応じて補正係数を算出し、ウィンドウにおけるタグ配列の数を補正して、GC含有量について補正されたタグ配列の数を求めるステップを含み、
及び/又は
対照試料群の補正された予期のタグ配列数は、対照群の各ウィンドウ毎にGC含有量について補正されたタグ配列数とタグの総数の比を算出し、該比に基づいて、各対照試料の対応のウィンドウの当該比の平均を求め、該平均及び試験サンプルのタグ配列の総数に基づいて、試験サンプルの各ウィンドウにおけるタグ配列の数の予期値を算出することにより求められる
ことを特徴とする請求項1に記載の方法。 - 候補CNV破過点を選択する場合には、単染色体又は全ゲノムに環化反応を行うことを
特徴とする請求項5に記載の方法。 - 補正されたタグ配列の数が正規分布になり、前述信頼区間が95%信頼区間であること
を特徴とする請求項1に記載の方法。 - 異なる検品を区別するように、それぞれ、各試料のDNA断片に、異なるインデックスを追加するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 検品中の核酸分子の少なくとも一部の配列情報を読み取る読み取りユニット、
該配列情報により、ゲノムの参照配列に唯一に完全適合するタグ配列を判断するタグ配列決定ユニット、
ウィンドウにゲノムの参照配列を分割して、各ウィンドウに入るタグ配列の数を計算するタグ配列数算出ユニット、
各ウィンドウにおけるタグ配列の数を、GC含有量について補正し、対照試料群の補正された予期のタグ配列数に基づいて補正し、補正されたタグ配列の数を求めるタグ配列数補正ユニット、
ウィンドウの出発点又は終点を分界点として、補正されたタグ配列の数からなる数値群の有意性を両側ともに計算し、有意差の小さい分界点を候補CNV破過点として選定する候補破過点選定ユニット、及び、
各CNV破過点とその前のCNV破過点との間にある配列、及び、各CNV破過点とそ
の次のCNV破過点との間にある配列に対して、該二つの配列に含まれるウィンドウにおける補正されたタグ配列の数からなる数値群の有意性をそれぞれ計算した後、有意差の最も小さい候補CNV破過点を削除し、削除された候補CNV破過点の前の候補CNV破過点と次の候補CNV破過点との有意性を再計算し、すべての候補CNV破過点の有意性が終了閾値に満たないまでに繰り返すことにより、CNV破過点を判断する破過点決定ユニットを含み、
破過点決定ユニットでCNV破過点を判断した後に、タグ配列数の分布により、対照群
を利用して、補正されたタグ配列数の正常な信頼区間を求め、断片にあるタグ配列数の平
均が信頼区間から逸脱する場合に、当該CNV破過点の間にある断片は異常があると判断
する破過点濾過ユニットをさらに含み、
前述検品としては、ヒト由来のサンプルであり、羊膜腔内に穿刺して吸引採取した羊水
、絨毛採取した絨毛、経皮的臍帯血採取した臍帯血、自発的に流産した胎児からの組織、
及びヒト末梢血から選ばれるいずれかの1種である
ことを特徴とするコピー数変異を検出するシステム。 - 各ウィンドウは、参照となるタグ配列の数が同じであり、又は同じ長さを有することを特徴とする請求項9に記載のシステム。
- 終了閾値は、正常なサンプルからなる対照試料群により得られることを特徴とする請求
項9に記載のシステム。 - 前記タグ配列数補正ユニットは、
GC含有量に基づいて群にウィンドウを分け、各群のタグ配列数の平均及び全てのウィンドウにおけるタグ配列数の平均に応じて補正係数を算出し、ウィンドウにおけるタグ配列の数を補正して、GC含有量について補正されたタグ配列の数を求めるGC補正ユニットと、
対照群の各ウィンドウ毎にGC含有量について補正されたタグ配列数とタグの総数の比を算出し、該比に基づいて、各対照試料の対応のウィンドウの当該比の平均を求め、該平均及び試験サンプルのタグ配列の総数に基づいて、試験サンプルの各ウィンドウにおけるタグ配列の数の予期値を算出することにより対照試料群の補正された予期のタグ配列数を求め、GC補正されたタグ配列の数を、対照試料群の補正された予期のタグ配列数により補正し、補正されたタグ配列の数を求めるウィンドウ補正ユニットと
を含むことを特徴とする請求項9に記載のシステム。 - 前述タグ配列の数が正規分布になり、前述信頼区間が95%信頼区間であることを特徴
とする請求項9に記載のシステム。 - 異なる検品を区別するように、それぞれ、各試料のDNA断片に、異なるインデックスを追加することを特徴とする請求項9に記載のシステム。
- 候補破過点選定ユニットで候補CNV破過点を選択する場合には、単染色体又は全ゲノ
ムに環化反応を行うことを特徴とする請求項9に記載のシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2012/073545 WO2013149385A1 (zh) | 2012-04-05 | 2012-04-05 | 一种拷贝数变异检测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015512264A JP2015512264A (ja) | 2015-04-27 |
JP5972448B2 true JP5972448B2 (ja) | 2016-08-17 |
Family
ID=49299922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015503724A Active JP5972448B2 (ja) | 2012-04-05 | 2012-04-05 | コピー数変異を検出する方法及びシステム |
Country Status (10)
Country | Link |
---|---|
US (2) | US20150056619A1 (ja) |
EP (1) | EP2835752B8 (ja) |
JP (1) | JP5972448B2 (ja) |
KR (1) | KR101795124B1 (ja) |
CN (1) | CN104221022B (ja) |
AU (1) | AU2012376134B2 (ja) |
IL (1) | IL234875B (ja) |
RU (1) | RU2014144349A (ja) |
SG (1) | SG11201406250SA (ja) |
WO (1) | WO2013149385A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224543A (zh) * | 2014-05-30 | 2016-01-06 | 国际商业机器公司 | 用于处理时间序列的方法和装置 |
CN107077537B (zh) * | 2014-09-12 | 2021-06-22 | 伊鲁米纳剑桥有限公司 | 用短读测序数据检测重复扩增 |
CN106795551B (zh) * | 2014-09-26 | 2020-11-20 | 深圳华大基因股份有限公司 | 单细胞染色体的cnv分析方法和检测装置 |
US11242559B2 (en) | 2015-01-13 | 2022-02-08 | The Chinese University Of Hong Kong | Method of nuclear DNA and mitochondrial DNA analysis |
CN104560697A (zh) * | 2015-01-26 | 2015-04-29 | 上海美吉生物医药科技有限公司 | 一种基因组拷贝数不稳定性的检测装置 |
CN104694384B (zh) * | 2015-03-20 | 2017-02-08 | 上海美吉生物医药科技有限公司 | 线粒体dna拷贝数变异性的检测装置 |
CN104745718B (zh) * | 2015-04-23 | 2018-02-16 | 北京中仪康卫医疗器械有限公司 | 一种检测人类胚胎染色体微缺失和微重复的方法 |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
CN105243299B (zh) * | 2015-09-30 | 2018-03-06 | 深圳华大基因科技服务有限公司 | 一种检测cnv的精确断点及断点周围特征的方法及装置 |
KR101848438B1 (ko) | 2015-10-29 | 2018-04-13 | 바이오코아 주식회사 | 디지털 pcr을 이용한 산전진단 방법 |
CN108292327A (zh) * | 2015-11-18 | 2018-07-17 | 索菲亚遗传股份有限公司 | 下一代测序中检测拷贝数变异的方法 |
AU2017218149B2 (en) | 2016-02-12 | 2020-09-03 | Regeneron Pharmaceuticals, Inc. | Methods and systems for detection of abnormal karyotypes |
CN105760712B (zh) * | 2016-03-01 | 2019-03-26 | 西安电子科技大学 | 一种基于新一代测序的拷贝数变异检测方法 |
PL3488443T3 (pl) | 2016-07-20 | 2021-12-20 | BioNTech SE | Selekcja neoepitopów jako swoistych dla choroby celów dla terapii o zwiększonej skuteczności |
CN106520940A (zh) * | 2016-11-04 | 2017-03-22 | 深圳华大基因研究院 | 一种染色体非整倍体和拷贝数变异检测方法及其应用 |
TWI607332B (zh) * | 2016-12-21 | 2017-12-01 | 國立臺灣師範大學 | Correlation between persistent organic pollutants and microRNAs station |
WO2018144449A1 (en) * | 2017-01-31 | 2018-08-09 | Counsyl, Inc. | Systems and methods for identifying and quantifying gene copy number variations |
WO2018161245A1 (zh) * | 2017-03-07 | 2018-09-13 | 深圳华大基因研究院 | 一种染色体变异的检测方法及装置 |
CN109097457A (zh) * | 2017-06-20 | 2018-12-28 | 深圳华大智造科技有限公司 | 确定核酸样本中预定位点突变类型的方法 |
AU2018384737A1 (en) * | 2017-12-14 | 2020-07-30 | Ancestry.Com Dna, Llc | Detection of deletions and copy number variations in DNA sequences |
CN112365927B (zh) * | 2017-12-28 | 2023-08-25 | 安诺优达基因科技(北京)有限公司 | Cnv检测装置 |
CN109979535B (zh) * | 2017-12-28 | 2021-03-02 | 浙江安诺优达生物科技有限公司 | 一种胚胎植入前遗传学筛查装置 |
CN108256289B (zh) * | 2018-01-17 | 2020-10-16 | 湖南大地同年生物科技有限公司 | 一种基于目标区域捕获测序基因组拷贝数变异的方法 |
KR102036609B1 (ko) * | 2018-02-12 | 2019-10-28 | 바이오코아 주식회사 | 디지털 pcr을 이용한 산전진단 방법 |
CN108427864B (zh) * | 2018-02-14 | 2019-01-29 | 南京世和基因生物技术有限公司 | 一种拷贝数变异的检测方法、装置以及计算机可读介质 |
CN108415886B (zh) * | 2018-03-07 | 2019-04-05 | 清华大学 | 一种基于生产工序的数据标签纠错方法及装置 |
CN108664766B (zh) * | 2018-05-18 | 2020-01-31 | 广州金域医学检验中心有限公司 | 拷贝数变异的分析方法、分析装置、设备及存储介质 |
WO2021114139A1 (zh) * | 2019-12-11 | 2021-06-17 | 深圳华大基因股份有限公司 | 一种基于血液循环肿瘤dna的拷贝数变异检测方法和装置 |
CN111261225B (zh) * | 2020-02-06 | 2022-08-16 | 西安交通大学 | 一种基于二代测序数据的反转相关复杂变异检测方法 |
CN113496761B (zh) * | 2020-04-03 | 2023-09-19 | 深圳华大生命科学研究院 | 确定核酸样本中cnv的方法、装置及应用 |
DE102020116178A1 (de) * | 2020-06-18 | 2021-12-23 | Analytik Jena Gmbh | Verfahren zum Erkennen einer Amplifikationsphase in einer Amplifikation |
CN111968701B (zh) * | 2020-08-27 | 2022-10-04 | 北京吉因加科技有限公司 | 检测指定基因组区域体细胞拷贝数变异的方法和装置 |
CN114220481B (zh) * | 2021-11-25 | 2023-09-08 | 深圳思勤医疗科技有限公司 | 基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质 |
CN114999573B (zh) * | 2022-04-14 | 2023-07-07 | 哈尔滨因极科技有限公司 | 一种基因组变异检测方法及检测系统 |
CN114758720B (zh) * | 2022-06-14 | 2022-09-02 | 北京贝瑞和康生物技术有限公司 | 用于检测拷贝数变异的方法、设备和介质 |
CN114864000B (zh) * | 2022-07-05 | 2022-09-09 | 北京大学第三医院(北京大学第三临床医学院) | 一种动态鉴定人类单细胞染色体拷贝数的方法 |
CN115132271B (zh) * | 2022-09-01 | 2023-07-04 | 北京中仪康卫医疗器械有限公司 | 一种基于批次内校正的cnv检测方法 |
CN116386718B (zh) * | 2023-05-30 | 2023-08-01 | 北京华宇亿康生物工程技术有限公司 | 检测拷贝数变异的方法、设备和介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004044225A2 (en) * | 2002-11-11 | 2004-05-27 | Affymetrix, Inc. | Methods for identifying dna copy number changes |
US7702468B2 (en) * | 2006-05-03 | 2010-04-20 | Population Diagnostics, Inc. | Evaluating genetic disorders |
US7979215B2 (en) * | 2007-07-30 | 2011-07-12 | Agilent Technologies, Inc. | Methods and systems for evaluating CGH candidate probe nucleic acid sequences |
US20120178635A1 (en) * | 2009-08-06 | 2012-07-12 | University Of Virginia Patent Foundation | Compositions and methods for identifying and detecting sites of translocation and dna fusion junctions |
WO2011030838A1 (ja) * | 2009-09-10 | 2011-03-17 | 富士フイルム株式会社 | アレイ比較ゲノムハイブリダイゼーション法による核酸変異解析法 |
-
2012
- 2012-04-05 JP JP2015503724A patent/JP5972448B2/ja active Active
- 2012-04-05 WO PCT/CN2012/073545 patent/WO2013149385A1/zh active Application Filing
- 2012-04-05 CN CN201280066929.3A patent/CN104221022B/zh active Active
- 2012-04-05 AU AU2012376134A patent/AU2012376134B2/en active Active
- 2012-04-05 EP EP12873786.3A patent/EP2835752B8/en active Active
- 2012-04-05 SG SG11201406250SA patent/SG11201406250SA/en unknown
- 2012-04-05 KR KR1020147031062A patent/KR101795124B1/ko active IP Right Grant
- 2012-04-05 RU RU2014144349A patent/RU2014144349A/ru not_active Application Discontinuation
- 2012-04-05 US US14/389,898 patent/US20150056619A1/en not_active Abandoned
-
2014
- 2014-09-29 IL IL234875A patent/IL234875B/en active IP Right Grant
-
2018
- 2018-01-29 US US15/881,902 patent/US11371074B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN104221022A (zh) | 2014-12-17 |
EP2835752B1 (en) | 2018-09-19 |
US20150056619A1 (en) | 2015-02-26 |
IL234875B (en) | 2019-03-31 |
US11371074B2 (en) | 2022-06-28 |
US20180148765A1 (en) | 2018-05-31 |
AU2012376134B2 (en) | 2016-03-03 |
CN104221022B (zh) | 2017-11-21 |
EP2835752B8 (en) | 2018-12-26 |
WO2013149385A1 (zh) | 2013-10-10 |
EP2835752A1 (en) | 2015-02-11 |
AU2012376134A1 (en) | 2014-11-06 |
KR20140140122A (ko) | 2014-12-08 |
EP2835752A4 (en) | 2015-11-18 |
JP2015512264A (ja) | 2015-04-27 |
SG11201406250SA (en) | 2014-11-27 |
RU2014144349A (ru) | 2016-05-27 |
KR101795124B1 (ko) | 2017-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5972448B2 (ja) | コピー数変異を検出する方法及びシステム | |
AU2019204917B2 (en) | Size-based analysis of fetal dna fraction in maternal plasma | |
US20180371539A1 (en) | Method of detecting a pre-determined event in a nucleic acid sample and system thereof | |
KR102112438B1 (ko) | 대규모 병렬 게놈 서열분석을 이용한 태아 염색체 이수성의 진단 방법 | |
CN107077537B (zh) | 用短读测序数据检测重复扩增 | |
CN106715711B (zh) | 确定探针序列的方法和基因组结构变异的检测方法 | |
KR20180020137A (ko) | 고유 분자 색인(umi)을 갖는 용장성 판독을 사용하는 서열분석된 dna 단편의 오류 억제 | |
JP2017176181A (ja) | 胎児の染色体異数性の診断 | |
CN105555970B (zh) | 同时进行单体型分析和染色体非整倍性检测的方法和系统 | |
KR20210138556A (ko) | 짧은 탠덤 반복 영역에서의 변이를 결정하기 위한 서열-그래프 기반 툴 | |
CN115989544A (zh) | 用于在基因组的重复区域中可视化短读段的方法和系统 | |
CN110993024B (zh) | 建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置 | |
CN118406760A (zh) | 一种针对人软组织肿瘤融合基因进行检测的探针、试剂盒及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5972448 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |