[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2012162884A1 - 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法 - Google Patents

检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法 Download PDF

Info

Publication number
WO2012162884A1
WO2012162884A1 PCT/CN2011/075037 CN2011075037W WO2012162884A1 WO 2012162884 A1 WO2012162884 A1 WO 2012162884A1 CN 2011075037 W CN2011075037 W CN 2011075037W WO 2012162884 A1 WO2012162884 A1 WO 2012162884A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
chromosome
tested
sequencing
ratio
Prior art date
Application number
PCT/CN2011/075037
Other languages
English (en)
French (fr)
Inventor
高扬
周代星
张建光
田凤
Original Assignee
北京贝瑞和康生物技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京贝瑞和康生物技术有限公司 filed Critical 北京贝瑞和康生物技术有限公司
Priority to HUE11866914A priority Critical patent/HUE031239T2/en
Priority to EP11866914.2A priority patent/EP2716766B1/en
Priority to DK11866914.2T priority patent/DK2716766T3/da
Priority to US13/811,634 priority patent/US9885080B2/en
Priority to RS20161036A priority patent/RS55518B1/sr
Priority to CN201180035510.7A priority patent/CN103080336B/zh
Priority to PL11866914T priority patent/PL2716766T3/pl
Priority to PT118669142T priority patent/PT2716766T/pt
Priority to PCT/CN2011/075037 priority patent/WO2012162884A1/zh
Priority to ES11866914.2T priority patent/ES2605372T3/es
Priority to JP2014513025A priority patent/JP5926795B2/ja
Publication of WO2012162884A1 publication Critical patent/WO2012162884A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Definitions

  • Kit, Apparatus and Method for Detecting Embryo or Tumor Chromosome Copy Numbers Field of the Invention The present invention relates to kits, devices and methods for detecting embryo or tumor chromosome copy number.
  • Abnormal chromosome copy number is closely related to human diseases. There are chromosomal abnormalities in the embryonic parcels carrying hereditary diseases and in the tumor fines. On average, 9 out of every 1,000 newborns carry diseases caused by abnormal chromosome copy numbers (1). It is therefore important to be able to detect the number of chromosome copies before the fetus is born.
  • the present invention is based on the fact that the inventors have found that the GC content of DNA fragments from individual chromosomes measured by the method of the present invention has a linear relationship with the ratio of DNA fragments from individual chromosomes to total DNA fragments, respectively.
  • a and b are constants, which may be different values for different chromosomes a and b, which may be corrected according to the GC content in the DNA fragment from the chromosome to be tested, and the calculation of the sample from the sample to be tested
  • the ratio of the corrected ratio of the DNA fragment of the chromosome to be tested, the degree of the variation determines the copy number of the chromosome to be tested.
  • the embryonic DNA in the maternal plasma is mostly from 100 bp to 250 bp, and the 150 bp to 170 bp DNA is particularly dominant, although the mother's DNA also has a small distribution.
  • DNA with a fragment greater than 250 bp is essentially the DNA of the mother.
  • the present inventors have found that, although the reason is unknown, the DNA fragment from each chromosome accounts for a ratio of total DNA fragments at any point or any interval between 100 bp and 250 bp, that is, the DNA is uniformly distributed from 100 bp to 250 bp.
  • the mutation determines the copy number of the chromosome to be tested based on the degree of the mutation.
  • the inventors found that in the process of tumorigenesis, similarly, a phenomenon similar to that in the maternal blood during embryonic development occurs in the blood of the patient, that is, DNA of the free tumor cell can be detected in the blood of the tumor patient. .
  • the GC content of the DNA fragments from each chromosome measured by the method of the present invention has a linear relationship with the ratio of the DNA fragments from the respective chromosomes to the total DNA fragments, respectively, and should be applied to the chromosomal polyploid of the DNA of the tumor cells. Detection.
  • the DNA of free tumor cells in plasma exists in the form of nucleosomes, so most of them are fragments of lOObp to 250bp, and the ratio of DNA fragments from individual chromosomes to total DNA fragments is between lOObp and 250bp.
  • kits, devices and methods of the invention are equally applicable to detecting the copy number of a tumor cell chromosome or a local chromosome. Based on the above findings, the inventors have invented kits, devices and methods that are relatively non-invasive and economical and more accurate in detecting embryo or tumor chromosome or local chromosome copy number.
  • the invention provides a kit for detecting the chromosome copy number of an embryo or a tumor, comprising: a device for taking blood from a mother or a tumor patient; a device suitable for separating blood cells and plasma in the blood; extracting the plasma Reagents and devices for DNA; reagents and devices for physically separating the fragments according to the size of the DNA; and reagents and devices for sequencing all DNA at any point or any interval between 100 bp and 250 bp.
  • the embryo or tumor chromosome is an entire chromosome or a local chromosome.
  • the kit of the present invention further comprises: reagents and devices for making the DNA into a library for sequencing.
  • the kit of the present invention further comprises: reagents and devices for PCR amplification of the DNA extracted from plasma or the library for sequencing.
  • the DNA of any one or any of the intervals between 100 and 250 bp is 150 bp to 170 bp of DNA, more preferably 167 bp of DNA.
  • Another kit for detecting embryonic or tumor chromosome copy number provided by the present invention, comprising: a device for taking blood from a mother or a tumor patient; an apparatus suitable for separating blood cells and plasma in the blood; extracting the plasma Reagents and devices for DNA; reagents and devices for making the DNA into a library for sequencing; and reagents and devices for sequencing the DNA.
  • the embryo or tumor chromosome is an entire chromosome or a local chromosome.
  • the kit of the present invention further comprises reagents and devices for PCR amplification of the DNA extracted from plasma.
  • the invention provides a device for detecting the chromosome copy number of an embryo or a tumor, comprising: a detecting module, configured to sequence DNA in a plasma sample of a maternal plasma or a tumor patient, the sequencing comprising plasma samples of a maternal plasma or a tumor patient a process of making all of the DNA into a library for sequencing; a comparison module for aligning the sequencing result of the DNA with a genomic sequence map to determine that each DNA in the DNA is from a chromosome and a sequence length of each piece of DNA; a calculation module for calculating a ratio of the number of DNA fragments from the chromosome to be tested in the same sample to the total number of DNA fragments, according to the GC in the DNA fragment from the chromosome to be tested Correcting the ratio; and calculating a
  • Correction of the ratio of chromosomes 6, 7, 8, 12, 13, and X GC of DNA fragments from chromosomes 2, 3, 4, 5, 6, 7, 8, 12, 18, and X
  • the GC content of the DNA fragments from chromosomes 2, 3, 4, 5, 6, 7, 8, 12, 13, 18 and X is proportional to the ratio of the DNA fragments from the respective chromosomes to the total DNA fragments.
  • the linear relationship between them is as shown in Table 1.
  • the calculation module in the apparatus of the present invention is based on the following functions for the first, 9, 10, 11,
  • the GC content has a linear relationship with the ratio of the DNA fragments from each chromosome to the total DNA fragments.
  • the sequencing comprises the process of making all of the DNA in the maternal plasma or tumor patient plasma sample into a library for sequencing.
  • the sequencing of the DNA in the plasma sample of the maternal plasma or tumor patient is double-ended short sequence sequencing, single-ended long sequence sequencing or single-ended short sequence sequencing.
  • the embryo or tumor chromosome is an entire chromosome or a local chromosome.
  • the calculation module is configured to calculate the number of DNA fragments from the chromosome to be tested in any DNA between any point or any interval between 100 bp and 250 bp in the same sample, arbitrarily between 100 bp and 250 bp.
  • the ratio of the total number of all DNA fragments in one or any of the intervals is corrected according to the GC content of the DNA fragment from the chromosome to be tested in all DNAs at any point between 100 bp and 250 bp; A variation of the corrected ratio of the DNA fragment from the chromosome to be tested in the sample to be tested is calculated, and the copy number of the chromosome to be tested is determined according to the degree of the mutation. .
  • all DNA of any point or any interval between 100 bp and 250 bp in the maternal plasma or tumor patient plasma sample is made into a library for sequencing.
  • the DNA in the maternal plasma or tumor patient plasma sample is PCR amplified before or after the library is made ready for sequencing.
  • the DNA of any one or any of the intervals between 100 and 250 bp is 150 bp to 170 bp of DNA, more preferably 167 bp of DNA.
  • the invention provides a method for detecting the chromosome copy number of an embryo or a tumor, comprising the steps of: taking maternal plasma or tumor patient plasma; separating plasma and blood cells in the blood; making the DNA in the plasma available Sequencing the library; sequencing the DNA sequencing library; comparing the result of the sequencing with a genomic sequence map, determining that each of the DNA sequences is from a number of chromosomes and the length of each of said DNA sequences; and using the sequencing and alignment results of said DNA, calculating the ratio of the number of DNA fragments from the chromosome to be tested in the same sample to the total number of DNA fragments, The GC content in the DNA fragment from the chromosome to be tested is corrected for the ratio, and the corrected ratio of the DNA fragment from the chromosome to be tested in the sample to be tested is calculated, and the test
  • the copy number of the chromosome Preferably, the method of the present invention corrects the ratio of chromosomes 2, 3, 4, 5, 6, 7, 8, 12, 18, and X according to the following function: from the 2nd, 3rd, 4th
  • y represents the GC content of the DNA fragment from the chromosome to be tested
  • x represents the ratio of the number of DNA fragments from the chromosome to be tested to the total DNA
  • a and b are constants
  • a is a negative number.
  • the GC content of the DNA fragments from chromosomes 2 3, 4, 5, 6, 7, 8, 12, 13, 18 and X is proportional to the ratio of the DNA fragments from the respective chromosomes to the total DNA fragments The linear relationship between them is as shown in Table 1.
  • the method of the present invention corrects the ratio of chromosomes 1, 9, 10, 11, 15, 16, 17, 19, 20, 21, and 22 according to the following function:
  • the GC content of the DNA fragments of chromosomes 10, 11, 15, 16, 17, 19, 20, 21, and 22 has a linear relationship with the ratio of the DNA fragments from each chromosome to the total DNA fragment, respectively, and the linear relationship is available.
  • & + 1? Indicates, where y represents the GC content of the DNA fragment from the chromosome to be tested, x represents the ratio of the number of DNA fragments from the chromosome to be tested to the total DNA, a and b are constants, and a is a positive number.
  • the GC content of the DNA fragments from chromosomes 1, 9, 10, 11, 15, 16, 17, 19, 20, 21 and 22 is proportional to the ratio of the DNA fragments from the respective chromosomes to the total DNA fragments
  • the linear relationship between them is as shown in Table 2.
  • only the sequencing and alignment results of all DNAs of any point or any interval between 100 bp and 250 bp of the sequence length of the DNA are calculated, and any point or any interval between 100 bp and 250 bp in the same sample is calculated.
  • sequencing of the DNA sequencing library is double-ended short sequence sequencing, single-ended long sequence sequencing or single-ended short sequence sequencing.
  • the DNA of any point or any interval between 100-250 bp is 150 bp to 170 bp of DNA, more preferably 167 bp of DNA.
  • FIG. 1 is an image obtained by electrophoresing a DNA of maternal plasma into a library for double-end sequencing and electrophoresed on a 1% agarose gel. The channel on the left is an image of the DNA lOObp standard, and the channel on the right is an image of the library DNA for double-end sequencing. The most obvious band is located at about 280 bp, which contains a 120 bp ligation primer.
  • Fig. 2 is a distribution diagram of the DNA fragment size of the sample G356. Fig.
  • FIG 3 is a distribution diagram of the DNA fragment from the X chromosome determined in accordance with the fragment size in the sample G356 after the alignment.
  • Figure 4 is a calculated and actual measured distribution of the DNA fragment of the X chromosome of G356 according to the size of the fragment.
  • the line with an asterisk indicates the total number of DNA sequences of the G356 sample multiplied by the percentage of the X chromosome.
  • the resulting graph, the circle ⁇ represents the number of sequences of the actually detected X chromosome.
  • the calculated distribution of the DNA fragment of the G356X chromosome is substantially the same as that of the actual measurement, and the two lines are basically identical.
  • Figures 5A-H are based on sample numbers: G356, G397 (repeated 8 times), G426, G735, G756, G760, G763, G770, G778, G779, G780, G781, G824, and G825 from the chromosome to be tested.
  • the GC content of the DNA fragment and the ratio of the number of DNA fragments from the chromosome to be tested to the total DNA fragment, the resulting standard curve, samples G356, G397, G426, G735, G756, G760, G763, G770, G778, G779, G780, G781, G824 and G825 were identified as normal female embryo samples by amniocentesis by the Amniocentesis of Central South University [46, XX].
  • the X axis represents the ratio of the number of DNA fragments from the chromosome to be tested to the total DNA fragment
  • the Y axis represents the GC content of the DNA fragment from the chromosome to be tested.
  • FIG. 5 AF shows a standard curve for three chromosomes, showing the standard curve of chromosomes 1-18 in turn, and Figure 5G shows the standard curve of chromosomes 19-22, Figure 5H shows A standard curve of the X chromosome is shown.
  • the function of the standard curve for each chromosome is shown in Tables 1 and 2.
  • Figure 6 is a schematic illustration of a sample of chromosome 13 trisomy detected by the method of the present invention. Wherein, the X axis represents the ratio of the number of DNA fragments from chromosome 13 to the total DNA fragment, and the Y axis represents the GC content of the DNA fragment from chromosome 13.
  • FIG. 7 is a schematic illustration of a sample of chromosome 18 trisomy detected by the method of the present invention.
  • the X axis represents the ratio of the number of DNA fragments from chromosome 18 to the total DNA fragment
  • the Y axis represents the GC content of the DNA fragment from chromosome 18.
  • the ratio of the number of DNA fragments from chromosome 18 to the total DNA fragment in each sample is shown by a diamond on the X-axis, and the rectangle indicated by an arrow indicates that the GC content of the DNA fragment from chromosome 18 is corrected. , a sample of the trisomy of chromosome 18 detected.
  • Figure 8 is a schematic representation of an X chromosome monomer or a trisomy sample detected by the method of the present invention.
  • the X axis represents the ratio of the number of DNA fragments from the X chromosome to the total DNA fragment
  • the Y axis represents the GC content of the DNA fragment from the X chromosome.
  • the ratio of the number of DNA fragments from the X chromosome to the total DNA fragment in each sample is shown by a diamond on the X-axis, and the rectangle on the left side of the standard curve indicated by an arrow indicates the GC content of the DNA fragment from the X chromosome.
  • FIGS. 9A-B are schematic illustrations of samples of chromosome 21 trisomy detected by the method of the present invention.
  • the X axis represents the ratio of the number of DNA fragments from chromosome 21 to the total DNA fragment
  • the Y axis represents the GC content of the DNA fragment from chromosome 21.
  • the ratio of the number of DNA fragments from chromosome 21 to the total DNA fragment in each sample is shown by a diamond on the X-axis, and the rectangle indicated by an arrow indicates that the GC content of the DNA fragment from chromosome 21 is corrected. , a sample of the trisomy of chromosome 21 detected. If the GC content of the DNA fragment of the chromosome to be tested of the present invention is not corrected, only the DNA fragment from chromosome 21 is used.
  • a double-ended short sequence refers to a sequence of less than 50 bp immediately following the 5, end-linked primer and a sequence of less than 50 bp immediately following the 3, end-linked primer.
  • the double-ended short sequence refers to a sequence of no more than 36 bp next to the 5, end-linked primer and a sequence of no more than 36 bp immediately following the 3'-end linked primer.
  • a single-ended short sequence refers to a sequence of less than 50 bp immediately following the 5, end-linked primer or a sequence of less than 50 bp immediately following the 3, end-linked primer.
  • a single-ended short sequence refers to a sequence of no more than 36 bp immediately following the 5, end-linked primer or a sequence of no more than 36 bp immediately following the 3'-end linked primer.
  • a single-ended long sequence refers to a sequence of greater than 99 bp immediately following the 5, end-linked primer or a sequence of greater than 99 bp immediately following the 3, end-linked primer.
  • Double-end sequencing refers to testing sequences located at both ends of a sequence, respectively.
  • Single-ended sequencing refers to testing a sequence at one end of a sequence.
  • a DNA cluster refers to a plurality of DNA molecules located in a certain solid area amplified by a single DNA molecule. In the examples of the application, a DNA cluster refers to about 1000 DNA molecules located within 1 square inch of a single DNA molecule.
  • Emulsified PCR refers to the PCR reaction of a PCR (Polymerase Chain Reaction) reaction, including PCR template DNA, PCR primers, PCR polymerase, and free bases in an oil bead. Typically, in a single oil bead, the template for the emulsified PCR has only one DNA molecule.
  • GC content refers to the ratio of the number of guanines and cytosines to the total number of all bases in nucleic acids or deoxyribonucleic acids.
  • Example 1 A method for detecting the chromosome copy number of an embryo Step 1: Take maternal blood and prepare plasma. In this example, a total of 14 maternal blood samples were taken. The samples were coded as: G356, G397, G426, G735, G756, G760, G763, G770, G778, G779, G780, G781, G824, and G825, both Prof. Yan Lingwei from the Xiangya School of Medicine of Central South University identified the female embryo samples [46, XX] by karyotype through amniocentesis. The data of the above samples were used for the standard curve, and the above samples were also used as standard samples.
  • Step 2 Extract plasma DNA.
  • DNA in plasma can be extracted using a DNA extraction kit manufactured by Qiagen (product number 57704).
  • the extracted DNA ends were blunted and subjected to 5, terminal phosphorylation: DNA 30 ⁇ l, pure water 45 ⁇ l, T4 DNA ligase buffer with 10 mM ATP 10 ⁇ l, 10 mM dNTP Mix 4 ⁇ 1, T4 DNA polymerase 5 ⁇ 1 Klenow enzyme 1 ⁇ 1, ⁇ 4 ⁇ 5 ⁇ , and then incubated at 20 °C for 30 minutes (reagent is provided by Illumina sample preparation kit PE-102-1001)ticianQIAGEN QIAquick PCR purification kit after warm bath ( part # 28104 Purification of DNA.
  • End-suspension A The product of the previous step was dissolved in 32 ⁇ M buffer, added to Klenow buffer 5 ⁇ l, ImM dATP 10 ⁇ l, Klenow ⁇ - 3 ⁇ , and kept at 37 ° C for 30 minutes (reagent) For Illumina Sample Preparation Kit PE-102-1001), the product is ligated by QIAGEN MinElute PCR Purification Kit ( part # 28004 ): DNA is dissolved in ⁇ buffer, DNA ligase buffer is added 2 ⁇ 25 ⁇ 1, PE Adapter Oligo Mix ⁇ , DNA ligase 5 ⁇ 1, kept at 20 ° C for 15 minutes (reagent is provided by Illumina sample preparation kit PE-102-1001)paper After warm bath, the DNA was purified using QIAGEN QIAquick PCR Purification Kit ( part # 28104 ).
  • Figure 1 shows the DNA of the sample being made into a double-end sequenced library.
  • the DNA in the library was electrophoresed on a 1% agarose gel.
  • Figure 1 is an image of gel electrophoresis. The most obvious band is 280 bp. Left and right, because the 120 bp ligation primer is included, the main plasma DNA fragment of the mother is concentrated at about 160 bp.
  • the library for double-end sequencing can also be subjected to PCR amplification: 1 ⁇ 1 ⁇ , 22 ⁇ pure water, ⁇ PE PCR primer PE 2.0, 1 ⁇ PE PCR primer PE 1.0, 2x Phusion DNA Polymerase (Finnzymes Oy) (reagent provided by Illumina Sample Preparation Kit PE-102-1001).
  • Step 4 Sequencing the DNA sequencing library.
  • double-end short sequence sequencing, single-end long sequence sequencing or single-ended short sequence sequencing can be performed separately.
  • the following is the process of performing double-ended short sequence sequencing.
  • a single DNA molecule in a DNA double-end sequencing library is made into a DNA cluster using Illumina's cBot instrument. This step can also be used to transform a single DNA molecule into a multi-molecule on a bead by emulsion PCR. ⁇ !
  • the DNA beads obtained by the DNA amplification or emulsification PCR generated above were subjected to double-end sequencing in Illumina's Genome Analyzer or HiSeq2000 sequencer. This process is done automatically by the instrument itself.
  • the DNA cluster generated above or the DNA beads obtained by emulsification PCR can also be subjected to single-end long sequence sequencing in Illumina's Genome Analyzer, HiSeq2000 or Life Technologies' SOLiD sequencer.
  • the sequencing steps and reaction conditions on Illumina's Genome Analyzer, HiSeq2000 and Life Technologies' SOLiD sequencers are the same as described above.
  • Step 5 Determine that the DNA fragment in the plasma is from the chromosome and determine if the copy number of the chromosome to be tested is normal.
  • double-end short sequence sequencing of the DNA library alternatively, it is also possible to measure single-end long sequence or single-ended short sequence sequencing
  • the database is also called hg l9 alignment, and the positions of the sequences at the two ends are determined on the chromosome.
  • Fig. 2 is a distribution diagram of the DNA fragment size of the sample G356 determined according to the above method. As can be seen from the figure, the short DNA of the maternal plasma is mainly concentrated between 100 bp and 220 bp.
  • Fig. 3 is a distribution diagram of the DNA fragment from the X chromosome determined in the post-sample G356 according to the size of the fragment. The resulting graph is almost identical to Figure 2.
  • Step 6 Calculate the ratio of the number of DNA fragments from the chromosome to be tested in the DNA to all DNA fragments in the same sample, correct the ratio according to the GC content in the DNA fragment from the chromosome to be tested, and calculate The DNA from the chromosome to be tested in the sample to be tested The variation of the ratio after the fragment correction determines the copy number of the chromosome to be tested based on the degree of the mutation.
  • the sequencing and alignment results of all the DNAs of any one or any interval between 100 bp and 250 bp of the sequence length of the DNA are calculated, and any point or any interval between 100 bp and 250 bp in the same sample is calculated.
  • the calibration is performed, and the corrected ratio of the DNA fragments from the chromosome to be tested in the sample to be tested is calculated, and the copy number of the chromosome to be tested is determined according to the degree of the mutation. In the experiment, it was found that the sequencing and alignment of all the DNAs at any point or any interval between 100 bp and 250 bp in length can improve the accuracy of the real-risk results.
  • the specific algorithm is as follows: Using a standard sample, the ratio of DNA fragments from the chromosome to be tested in the same sample to all DNA fragments is calculated, and the GC content in the DNA fragment from the chromosome to be tested can be known from the results of the sequencing. Based on the above ratio and GC content, a standard curve of GC content (Y-axis) and individual chromosomes or local chromosomes in total chromosome percentage (X-axis) was determined. The ratio of the chromosomes measured by the sample to be tested is corrected to a fixed GC value according to a function unique to the chromosome itself, and the arithmetic mean of the commonly used GC values is generally used.
  • Figure 5 AH is a standard curve made based on the GC content of the DNA fragment from the chromosome to be tested in the sample and the ratio of the DNA fragment from the chromosome to be tested to the total DNA fragment.
  • Table 1 The functions of forty pairs of chromosomes 2, 3, 4, 5, 6, 7, 8, 12, 13, 14, 18 and X are shown in Table 1: Table 1
  • the GC content of the DNA fragments from chromosomes 1, 9, ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ 10, 11, 15, 16, 17, 19, 20, 21 and 22, respectively, is derived from each chromosome.
  • the ratio, a and b are constants, and JL a is a positive number.
  • the ratio of the chromosomes measured by the sample to be tested is corrected to a fixed GC value according to the function of the chromosome itself, and the arithmetic mean of the commonly used GC values.
  • y ax + b
  • the DNA fragments from each chromosome in each sample account for the total
  • the ratio X of the DNA fragment can be based on this function.
  • the correction formula can be: a .
  • X is the ratio of the DNA fragments from each chromosome to the total DNA fragment after correction
  • is the ratio of the detected sample to the total DNA fragment in the specified chromosome fragment
  • y is the GC of the sample to be tested on the designated chromosome fragment Content
  • is the arithmetic mean GC value of the detected standard sample (a known normal sample, such as the known normal 14 standard samples detected in Example 1) on this chromosome
  • a is the slope of this curve.
  • the functions for each chromosome are shown in Tables 1 and 2; for different samples, the two values ⁇ and y are the measured values of the test-risk, and the two parameters vary with the sample to be tested.
  • the variation of the corrected ratio X of each sample to be tested is calculated, and the number of copies of the chromosome to be tested or the local chromosome to be tested is determined according to the value Z of the mutation.
  • the absolute value of Z is less than 3 as a normal detection error, and the absolute value of Z is greater than 3 as an abnormality.
  • Tables 3, 4 and 5 below are samples G356, G397 (repeated 8 times), G426, G735, G756, G760, G763, G770, G778, G779, G780, G781, G824 and G825 by the method of Example 1.
  • the above detection and calculation methods are not only suitable for detecting abnormalities in the entire chromatogram copy number, but also for detecting copy number abnormalities of local chromosomes.
  • the following is an example of detecting the copy number of the embryo's chromosome 13 in the sample to be tested. As described above, a total of 15 maternal blood samples were taken, and the blood samples were subjected to high-speed centrifugation to obtain plasma samples from which blood cells were removed, and plasma of each sample.
  • the amount is approximately 1 ml, and the sample codes are: G352, G362, G372, G383, G397 (repeated 8 times), G402, G409, G415, G424, G445, G440, G503, G588, G735 and G783. All of the above samples were obtained by Yan Ling's teachings from the Xiangya School of Medicine, Central South University. Detection of the possible presence of chromosome 13 trisomy. Using the standard curve for the No. 13 chromosome obtained above, the results of the test were tested.
  • trisomy samples G445, G352 and G402 on chromosome 13 (three samples marked with a circle on the x-axis) Cannot be distinguished from normal samples (samples that are not labeled on the x-axis).
  • the G445, G352, and G402 samples have a Z value of more than 3, which can be judged as 13 Chromosome trisomy.
  • the remaining samples have Z values between -3 and +3.
  • the following is an example of detecting the copy number of the embryo 18 in the sample to be tested. As described above, a total of 16 maternal blood samples were taken, and the blood samples were subjected to high-speed centrifugation to obtain plasma samples from which blood cells were removed, and plasma of each sample.
  • the amount is approximately 1 ml, and the sample codes are: G362, G372, G383, G397 (repeated 8 times), G407, G409, G415, G424, G442, G432, G445, G440, G595, G588, G735 and G783.
  • the above samples were collected by Professor Yan Lingwei from the Xiangya School of Medicine, Central South University. Detection of the possible presence of chromosome 18 trisomy. As shown in Fig. 7, the results of the detection were verified using the standard curve for chromosome 18 obtained above.
  • the G424, G442, G432, G415, G595, and G407 samples have a Z value of more than 3, and can be judged to be the chromosome 18 trisomy.
  • the remaining samples have Z values between -3 and +3.
  • the following is an example of detecting the copy number of the embryo chromosome 21 in the sample to be tested. As described above, a total of 14 maternal blood samples were taken, and the blood samples were subjected to high-speed centrifugation to obtain plasma samples from which blood cells were removed, and plasma of each sample.
  • the amount is approximately 1 ml, and the sample codes are: G267, G387, G393, G376, G397 (repeated 8 times), G405, G408, G409, G440, G491, G588, G641, G735 and G783.
  • the above samples were collected by Professor Yan Lingwei from the Xiangya School of Medicine, Central South University.
  • Fig. 9A the results of the detection were verified using the standard curve for chromosome 21 obtained above.
  • the sample of chromosome 13 can be detected by its percentage of all chromosomes alone (1 on the X-axis and 3 on the X-axis) a sample marked with a vertical arrow).
  • One of the samples is not significantly different from the normal sample (other diamond-marked samples) and may result in false negative detection of the sample.
  • Kit for detecting embryo or tumor chromosome copy number corresponds to the detection method of Example 1, and the inventors of the present application have developed a kit that can be used to detect embryo or tumor chromosome copy number, which includes: A device for taking blood from a mother or a tumor patient, which may be any blood needle, syringe or the like which can be used for blood collection; a device suitable for separating blood cells and plasma in the blood, which may be suitable for use in a centrifuge Microtubules of blood or any other suitable container or device for separation; reagents and instruments for extracting DNA from the plasma, which may include: protease, saturated phenol, chloroform: isoamyl alcohol (24:1), sodium acetate, none Water ethanol, 70% ethanol, TE solution, and the like.
  • Qiagen's DNA extraction kit can also be used to extract DNA from plasma (product number 57704) and any other reagents or containers that can be used for DNA extraction; making the DNA into a library for sequencing Reagents and Instruments
  • the library for sequencing can be a library for double-ended short sequence sequencing, a library for single-ended long sequence sequencing, or a library for single-ended short sequence sequencing.
  • the reagents and devices for making the DNA into a library for double-end short sequence sequencing include: T4 DNA ligase buffer with 10 mM ATP, lOmM dNTP Mix, T4 DNA polymerase, Klenow enzyme, T4 PNK (above)
  • the reagents are provided by Illumina Sample Preparation Kit PE-102-1001) and ion exchange lipids that have affinity for DNA under specific circumstances to achieve separation of DNA. You can also select the QIAGEN QIAquick PCR Product Separation Kit (Product # 28104) or the QIAGEN MinElute PCR Product Isolation Kit (Product # 28004 ) and the reagents and instruments for sequencing the DNA.
  • the reagents and devices for double-end short sequence sequencing can include: PE PCR primer PE 2.0, PE PCR primer PE 1.0, Phusion DNA polymerase (Finnzymes Oy) (The reagent is supplied by Illumina Sample Preparation Kit PE-102-1001.)
  • Example 3 Another kit for detecting embryo or tumor chromosome copy number
  • the inventors of the present application have developed another that can be used for A kit for detecting embryo or tumor chromosome copy number, comprising: A device for taking blood from a mother or a tumor patient, which may be any blood needle, syringe or the like that can be used for blood collection; a device suitable for separating blood cells and plasma in the blood, which may be suitable for use on a centrifuge a microtube containing blood or any other suitable container or device for separation; reagents and instruments for extracting DNA from the plasma, which may include: protease, saturated phenol, chloroform: is
  • the reagents and instruments for separation may include: Qiongyue sugar powder (Biowest 11860), marker ( Takara lOObp DNA marker, product number D505A), etc.; and all DNAs at any point or any interval between 100 bp and 250 bp.
  • the reagents and instruments for sequencing may include: a cutter that cuts a certain range of agarose gel. Preferably, it may comprise reagents and reagents that will recover DNA from the cut agarose gel for amplification and make it into a library for sequencing.
  • Example 4 A device for detecting the copy number of an embryo or tumor chromosome
  • a device for detecting an embryo or tumor chromosome copy number comprising: a detection module for sequencing DNA in a plasma sample of a maternal plasma or a tumor patient, the sequencing comprising preparing DNA in a plasma sample of a maternal plasma or a tumor patient
  • the process of sequencing the library, sequencing the DNA in the maternal plasma sample which may include Illumina's cBot instrument and Illumina's Genome Analyzer or HiSeq2000 sequencer or ABI's SOLiD series of sequencers;
  • the sequencing result of the DNA is aligned with the genomic sequence map to determine the length of each segment of DNA in the DNA from the chromosome and the length of each segment of the DNA, and the human genome standard sequence database hgl9 can be used;
  • calculating a ratio of the number of DNA fragments from the chromosome to be tested in the same sample to all DNA fragments correcting the ratio according to the GC content in the DNA fragment from the chromosome to be tested; and calculating the sample to be tested a variation of the
  • the detection module can detect all DNA fragments in the sample, or can detect only any point between 100 bp and 250 bp or any interval, such as 150 bp to 175 bp, which can be included by the upstream of the detection device.
  • the fragment size of the DNA, the reagent and the device for separating the DNA in the maternal plasma may be a module or device for performing agarose gel electrophoresis.
  • the invention is not limited to any specific combination of hardware and software.
  • the above are only the preferred embodiments of the present invention, and are not intended to limit the present invention, and various modifications and changes can be made to the present invention. Any modifications, equivalent substitutions, improvements, etc. made within the scope of the present invention are intended to be included within the scope of the present invention.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明提供了检测胚胎或肿瘤染色体拷贝数的试剂盒及其装置和方法。该方法包括取母体或肿瘤患者血液,分离血细胞和血浆,从血浆中提取DNA,构建测序文库和测序。

Description

检测胚胎或肿瘤染色体拷贝数的试剂盒、 装置和方法 技术领域 本发明涉及检测胚胎或肿瘤染色体拷贝数的试剂盒、 装置以及方法。 背景技术 染色体拷贝数异常和人类的疾病有着密切的关系。 在携带遗传性疾病的 胚胎细包中以及肿瘤细包中均有染色体异常的存在。 平均每 1000 个新生儿 中, 有 9个会携带因染色体拷贝数异常而导致的疾病(1)。 因此在胎儿尚未出 生之前能够检测出染色体拷贝数是很重要的。 然而, 目前所用的诊断方法, 包括羊膜穿刺和羊绒毛膜取样, 都属于有创伤的方法, 会给孕妇和胎儿带来 一定的风险。 用血清蛋白标记物和超声波来检测胎儿是否有染色体拷贝数异 常的疾病虽无创伤, 但不是直接检测致病因素, 因而准确性和灵敏度都不太 好 (2), 也存在不能尽早地发现染色体拷贝数异常疾病的问题。 这样的现状促 使研究人员去开发一种精确而且灵敏度高的无创诊断和检测方法。 自从母体血液中的胚胎 DNA被发现之后(3), 无创伤地直接诊断和检测 胚胎染色体异常性成了一个重大的研究课题。 2007年, 卢煜明教授和他的同 事们证明可以用母体血浆 mRNA中胎盘特异基因 4的突变位点比例来断定胚 胎是否有 21号染色体 3倍体 (4)。 突变位点比例同时也被用来判断 18号染色 体是否为 3倍体 (5)。 它的局限性在于突变位点在人群中并不普遍, 所以这些 方法只适用于一部分人群。 在同一时期, 数码 PCR ( digital PCR, 或 dPCR ) 被用来检测胚胎的染色体 3倍体 (6),(7)。 数码 PCR的优势是不依赖任何突变 位点, 但它的精确度不够高, 而且需要大量血样, 加大了釆样的困难。 近年来迅猛发展的高通量测序技术解决了以上的问题。 这些技术包括 Illumina公司的 Genome Analyzer(8), Life Technologies公司的 SOLiD(9), 以 及 Helicos公司的 Heliscope(lO), 能一次性地检测出几亿乃至几十亿个序列。 用这些技术来检测母体血浆 DNA时,血浆中微量的胚胎 DNA的染色体数目 的变化能被检测出来(11),(12),(13)。但因为测序的成本太高, 目前这些技术尚 未被普遍使用。 同时, 从母体血液中检测胚胎染色体的局部拷贝数的变化还 属于未解决的难题。 用高通量测序来检测母体血浆中胚胎染色体的拷贝数变 化有一些优势, 但目前价钱昂贵, 不能普及。 而且测序的偏差(CV )比较高, 检测的精确度和稳定性也都有待改进。 测序的偏差也决定了这种方法只适合 少数几个染色体, 如 21号染色体, 18号染色体, 而且目前还不适合于染色 体局部拷贝数变化的检测。 用高通量测序来检测染色体数目的变化的高成本和难度主要因为母体血 浆中胚胎 DNA的含量比较低, 低时只占 5%, 尤其在胚胎发育的早期。 母体 血浆中的大部分 DNA还是母体 DNA。 胚胎染色体数目或局部拷贝数的变化 艮容易被母体 DNA的背景所覆盖。因此分离母体和胚胎 DNA的方法也就成 为多年来研究的课题, 但成效不大。 比较成功的方法应属 Baylor医学院发明 的针对组蛋白的分离方法(14)。 不过分离出来的 DNA量太少, 只适合于突变 位点的检测, 不宜用来检测染色体拷贝数的变化。 发明内容 针对上面检测胚胎染色体拷贝数的方法中的种种问题, 发明人设计出能 有效地氐成本检测出胚胎染色体全部或局部拷贝数的试剂盒、 装置及方法。 本发明是基于以下的事实: 发明人发现, 通过本发明的方法所测得的来 自各个染色体的 DNA片段的 GC含量分别与来自各个染色体的 DNA片段占 总 DNA片段的比值具有一定的线性关系, 上述现象可能与检测的方法相关, 该线性关系可用 y = ax + b表示,其中 y代表来自待测染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA片段数量占总 DNA的比值, a和 b 是常数, 对于不同的染色体 a和 b可以是不同的值, 可根据所述来自待测染 色体的 DNA片段中的 GC含量对所述比值进行校正, 并计算待测样本中所 述来自待测染色体的 DNA 片段校正后的比值的变异, 居所述变异的程度 确定待测染色体的拷贝数。 通过 GC含量的校正, 能够有效地检测出原来仅 仅靠各个染色体的 DNA片段占总 DNA片段比值的判断方法检测不出来的多 个假阴性结果。 在具体实施方式部分有具体的实验为证。 另夕卜, 如在文献中 4艮道的(15), 母体血浆中的胚胎 DNA大部分为 lOObp 到 250bp的片段, 且 150bp到 170bp的 DNA尤其占多数, 虽然母体的 DNA 也有很小部分分布在这个片段区域, 但片段大于 250bp的 DNA基本上属于 母体的 DNA。 本发明人发现, 虽然理由未知, 来自各个染色体的 DNA片段 占总 DNA片段的比值在 lOObp到 250bp之间的任意一点或任意一个区间处 的 DNA是均匀分布的, 即各个染色体在 lOObp到 250bp之间的任何一点, 比如 HObp或 167bp (此位点的 DNA量最多;), 与总 DNA的比值代表了其 他点的比值, 因此, 也就代表了各个染色体占 lOObp 到 250bp 之间的所有 DNA的比值。 如果通过对所述 DNA中 100bp-250bp之间的任意一点或任意 一个区间的 DNA进行测序, ^!夺所述 DNA中 100bp-250bp之间的任意一点或 任意一个区间的所有 DNA 的测序结果与染色体组序列图谱进行比对, 以确 定所述 DNA中 100bp-250bp之间的任意一点或任意一个区间的所有 DNA中 的每段 DNA来自几号染色体和所述每段 DNA的序列长度;并计算在同一样 本内所述 DNA中 100bp-250bp之间的任意一点或任意一个区间的所有 DNA 中来自待测染色体的 DNA片段占 100bp-250bp之间的任意一点或任意一个 区间的所有 DNA片段的比值,也就得到了各个胚胎染色体与总 DNA的比值。 这样大大降低了检测的结果。 结合上面的根据 GC校正的方法, 根据所述来 自待测染色体的 DNA片段中的 GC含量对所述比值进行校正, 并计算待测 样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 根据所述变 异的程度确定待测染色体的拷贝数。 同时, 发明人发现在肿瘤发生的过程中, 同样地, 患者的血液中出现了 与胚胎发育过程中母体血液中类似的现象, 即在肿瘤患者的血液中, 能够检 测到游离的肿瘤细胞的 DNA。通过本发明的方法所测得的来自各个染色体的 DNA片段的 GC含量分别与来自各个染色体的 DNA片段占总 DNA片段的 比值具有一定的线性关系应同样适用于肿瘤细胞的 DNA 的染色体多倍体的 检测。 而且血浆中游离肿瘤细胞的 DNA 以核小体的形式存在, 所以它们也 大部分为 lOObp到 250bp的片段,而且来自各个染色体的 DNA片段占总 DNA 片段的比值在 lOObp到 250bp之间的任意一点或任意一个区间处的 DNA是 均匀分布的, 即各个染色体在 lOObp到 250bp之间的任何一点, 与总 DNA 的比值代表了其他点的比值,因此,也就代表了各个染色体占 lOObp到 250bp 之间的所有 DNA的比值。 因此, 本发明的试剂盒、 装置和方法也同样适用 于检测肿瘤细胞染色体或局部染色体的拷贝数。 基于以上的发现, 本发明人发明了相对无创且经济方便且更准确地检测 胚胎或肿瘤染色体或局部染色体拷贝数的试剂盒、 装置和方法。 本发明提供的一种检测胚胎或肿瘤染色体拷贝数的试剂盒, 包括: 从母 体或肿瘤患者体内取血液的器械; 适合将所述血液中的血细胞和血浆分离的 器械; 抽提所述血浆中的 DNA的试剂和器械; 通过物理方法根据所述 DNA 的片段大小对其进行分离的试剂和器械; 和取 100bp-250bp之间的任意一点 或任意一个区间的所有 DNA进行测序的试剂和器械。。 优选地, 所述胚胎或肿瘤染色体是整条染色体或局部染色体。 优选地, 本发明的试剂盒还包括: 将所述 DNA制成供测序的文库的试 剂和器械。 优选地, 本发明的试剂盒还包括: 对所述从血浆中抽提的 DNA或所述 供测序的文库进行 PCR扩增的试剂和器械。 优选地, 其中所述 100-250bp 之间的任意一点或任意一个区间的 DNA 是 150bp-170bp的 DNA, 更优选地, 是 167bp的 DNA。 本发明提供的另一种检测胚胎或肿瘤染色体拷贝数的试剂盒, 包括: 从 母体或肿瘤患者体内取血液的器械; 适合将所述血液中的血细胞和血浆分离 的器械; 抽提所述血浆中的 DNA的试剂和器械; 将所述 DNA制成可供测 序的文库的试剂和器械; 和对所述 DNA进行测序的试剂和器械。 其中所述 胚胎或肿瘤染色体是整条染色体或局部染色体。 优选地,本发明的试剂盒还包括:对从血浆中抽提的所述 DNA进行 PCR 扩增的试剂和器械。 本发明提供的一种检测胚胎或肿瘤染色体拷贝数的装置, 包括: 检测模 块, 用于对母体血浆或肿瘤患者血浆样本中的 DNA进行测序, 所述测序包 括了将母体血浆或肿瘤患者血浆样本的所有 DNA制成可供测序的文库的过 程; 比对模块, 用于将所述 DNA的测序结果与染色体组序列图谱进行比对, 以确定所述 DNA中的每段 DNA来自几号染色体以及所述每段 DNA的序列 长度; 计算模块, 用于计算在同一样本内来自待测染色体的 DNA 片段的数 量占 DNA片段总数的比值, 才艮据所述来自待测染色体的 DNA片段中的 GC 含量对所述比值进行校正; 并计算待测样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 根据所述变异的程度确定待测染色体的拷贝数; 以及输出模块, 用于输出所述待测染色体的拷贝数。 优选地, 本发明的装置中的计算模块根据以下的函数对第 2、 3、 4、 5、
6、 7、 8、 12、 13、 18和 X号染色体的比值进行校正: 来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的 DNA片段的 GC含量分别与来自 各个染色体的 DNA片段占总 DNA片段的比值具有一定的线性关系,所述线 性关系可用 y = ax + b表示, 其中 y代表来自待测染色体的 DNA片段的 GC 含量, X代表来自待测染色体的 DNA片段数量占总 DNA的比值, a和 b是 常数, 且 a是负数。 优选地, 所述来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染 色体的 DNA片段的 GC含量与来自各个染色体的 DNA片段占总 DNA片段 的比值之间的线性关系如在表 1中所示。 优选地, 本发明的装置中的计算模块根据以下的函数对第 1、 9、 10、 11、
15、 16、 17、 19、 20、 21和 22号染色体的比值进行校正: 来白第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA片段的 GC含量分别与 来自各个染色体的 DNA片段占总 DNA片段的比值具有一定的线性关系,所 述线性关系可用 y = ax + b表示,其中 y代表来自待测染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA片段数量占总 DNA的比值, a和 b 是常数, 且 a是正数。 优选地, 所述来白 白第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22 号染色体的 DNA片段的 GC含量与来自各个染色体的 DNA片段占总 DNA 片段的比值之间的线性关系如在表 2中所示。 优选地,所述测序包括了将母体血浆或肿瘤患者血浆样本中的所有 DNA 制成可供测序的文库的过程。 优选地, 所述对母体血浆或肿瘤患者血浆样本中的 DNA进行测序是双 端短序列测序、 单端长序列测序或单端短序列测序。 优选地, 其中所述胚胎或肿瘤染色体是整条染色体或局部染色体。 优选地, 其中对所述母体血浆或肿瘤患者血浆样本中的 DNA在测序前 进行了 PCR扩增。 优选地,本发明的装置中,计算模块用于计算在同一样本内 100bp-250bp 之间的任意一点或任意一个区间的所有 DNA中来自待测染色体的 DNA片段 数量占 100bp-250bp之间的任意一点或任意一个区间的所有 DNA片段总数 的比值, 才艮据 100bp-250bp之间的任意一点或任意一个区间的所有 DNA 中 来自待测染色体的 DNA片段的 GC含量对所述比值进行校正; 并计算待测 样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 根据所述变 异的程度确定待测染色体的拷贝数。。 优选地, 其中将所述母体血浆或肿瘤患者血浆样本中 100bp-250bp之间 的任意一点或任意一个区间的所有 DNA制成可供测序的文库。 优选地, 其中所述母体血浆或肿瘤患者血浆样本中的 DNA在被制作成 可供测序的文库之前或之后进行了 PCR扩增。 优选地, 其中所述 100-250bp 之间的任意一点或任意一个区间的 DNA 是 150bp-170bp的 DNA, 更优选地, 是 167bp的 DNA。 本发明提供的一种检测胚胎或肿瘤染色体拷贝数的方法,包括以下步骤: 取母体血浆或肿瘤患者血浆; 将所述血液中的血浆和血细胞分离; 将所述血 浆中的 DNA制作成可供测序的文库; 对所述 DNA测序文库进行测序; 将所 述测序的结果与染色体组序列图谱进行比对, 确定每段所述 DNA序列来自 几号染色体以及每段所述 DNA序列的长度;以及用所述 DNA的测序和比对 结果,计算在同一样本内来自待测染色体的 DNA片段的数量占 DNA片段总 数的比值, 才艮据所述来自待测染色体的 DNA片段中的 GC含量对所述比值 进行校正, 并计算待测样本中所述来自待测染色体的 DNA 片段校正后的比 值的变异, 根据所述变异的程度确定待测染色体的拷贝数。 优选地, 本发明的方法才艮据以下的函数对第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的比值进行校正: 来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的 DNA片段的 GC含量分别与来自各个染色 体的 DNA片段占总 DNA片段的比值具有一定的线性关系,所述线性关系可 用 = & + 1?表示, 其中 y代表来自待测染色体的 DNA片段的 GC含量, x 代表来自待测染色体的 DNA片段数量占总 DNA的比值, a和 b是常数, 且 a是负数。 优选地, 其中所述来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X 号染色体的 DNA片段的 GC含量与来自各个染色体的 DNA片段占总 DNA 片段的比值之间的线性关系如在表 1中所示。 优选地, 本发明的方法才艮据以下的函数对第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的比值进行校正: 来白第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA片段的 GC含量分别与来自各个染色 体的 DNA片段占总 DNA片段的比值具有一定的线性关系,所述线性关系可 用 = & + 1?表示, 其中 y代表来自待测染色体的 DNA片段的 GC含量, x 代表来自待测染色体的 DNA片段数量占总 DNA的比值, a和 b是常数, 且 a是正数。 优选地, 其中所述来自第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21 和 22号染色体的 DNA片段的 GC含量与来自各个染色体的 DNA片段占总 DNA 片段的比值之间的线性关系如在表 2中所示。 优选地, 仅耳又 DNA的序列长度在 100bp-250bp之间的任意一点或任意 一个区间的所有 DNA 的测序和比对结果, 计算在同一样本内 100bp-250bp 之间的任意一点或任意一个区间的所有 DNA中来自待测染色体的 DNA片段 数量占 100bp-250bp之间的任意一点或任意一个区间的所有 DNA片段总数 的比值, 才艮据 100bp-250bp之间的任意一点或任意一个区间的所有 DNA 中 所述来自待测染色体的 DNA片段中的 GC含量对所述比值进行校正, 并计 算待测样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 才艮据 所述变异的程度确定待测染色体的拷贝数。 优选地, 对所述 DNA测序文库进行测序是双端短序列测序、 单端长序 列测序或单端短序列测序。 优选地, 所述 100-250bp 之间的任意一点或任意一个区间的 DNA 是 150bp-170bp的 DNA, 更优选地, 是 167bp的 DNA。 附图说明 图 1是将母体血浆的 DNA制成可供双端测序的文库后,用 1%的琼脂糖 凝胶电泳后的图像。 左边的通道是 DNA lOObp标准样的图像, 右边的通道是 可供双端测序的文库 DNA的图像, 最明显的条带位于 280bp左右, 其中包 含了 120bp的连接引物。 图 2是样品 G356的 DNA片段大小的分布图。 图 3是比对后样品 G356中确定来自 X染色体的 DNA片段根据片段大 小所故的分布图。 图 4是计算得出的和实际测得的 G356的 X染色体的 DNA片段根据片 段大小所做的分布图, 图中带星号的线表示 G356样品的总 DNA序列数乘以 X染色体的百分比后得到的图形,圓圏代表实际检测到的 X染色体的序列数。 如图中所示, 计算得出的 G356X染色体的 DNA片段的分布与实际测量得到 的分布基本相同, 两条线基本吻合。 图 5A-H是根据样品代号为: G356、 G397(重复测了 8次)、 G426、 G735、 G756、 G760、 G763、 G770、 G778、 G779、 G780、 G781、 G824 和 G825 中来自待测染色体的 DNA片段的 GC含量和来自待测染色体的 DNA片段数 量占总 DNA片段的比值,所故的标准曲线,样品 G356、 G397、 G426、 G735、 G756、 G760、 G763、 G770、 G778、 G779、 G780、 G781、 G824 和 G825 均由中南大学湘雅医学院通过羊膜腔穿刺经染色体核型鉴定为正常的女性胚 胎样本 [46 , XX]。其中, X轴表示来自待测染色体的 DNA片段数量占总 DNA 片段的比值, Y轴表示来自待测染色体的 DNA片段的 GC含量。 5 A-F每幅 图示出了针对三个染色体的标准曲线,依次示出了第 1-18号染色体的标准曲 线图, 图 5G示出了第 19-22号染色体的标准曲线图, 图 5H示出了 X染色 体的标准曲线图。针对每个染色体的标准曲线的函数,如表 1和表 2中所示。 图 6是用本发明的方法检测出来的第 13号染色体三体的样品的示意图。 其中, X轴表示来自 13号染色体的 DNA片段数量占总 DNA片段的比值, Y轴表示来自 13号染色体的 DNA片段的 GC含量。在 X轴上用菱形示出了 各个样品中来自第 13号染色体的 DNA片段数量占总 DNA片段的比值, 而 用箭头指示出来的矩形表示经来自第 13号染色体的 DNA片段的 GC含量校 正后, 检测出的第 13 号染色体三体的样品。 如果不釆用本发明的待测染色 体的 DNA片段的 GC含量的校正, 而仅从来自第 13号染色体的 DNA片段 占总 DNA 片段的比值来看, 根本发现不了箭头所指示的三个样品的异常, 则会出现假阴性的结果。 图 7是用本发明的方法检测出来的第 18号染色体三体的样品的示意图。 其中, X轴表示来自 18号染色体的 DNA片段数量占总 DNA片段的比值, Y轴表示来自 18号染色体的 DNA片段的 GC含量。在 X轴上用菱形示出了 各个样品中来自第 18号染色体的 DNA片段数量占总 DNA片段的比值, 而 用箭头指示出来的矩形表示经来自第 18号染色体的 DNA片段的 GC含量校 正后, 检测出的第 18 号染色体三体的样品。 如果不釆用本发明的待测染色 体的 DNA片段的 GC含量的校正, 而仅从来自第 18号染色体的 DNA片段 占总 DNA片段的比值来看, 仅仅能发现来自第 18号染色体的 DNA片段占 总 DNA片段的比值大于等于 0.031的 5个样品是第 18号染色体三体, 不能 发现比值在 0.03左右的两个样品的异常, 对于这两个样品, 就会出现假阴性 的结果。 图 8是用本发明的方法检测出来的 X染色体单体或三体样品的示意图。 其中, X轴表示来自 X染色体的 DNA片段数量占总 DNA片段的比值, Y 轴表示来自 X染色体的 DNA片段的 GC含量。 在 X轴上用菱形示出了各个 样品中来自 X染色体的 DNA片段数量占总 DNA片段的比值, 而用箭头指 示出来的在标准曲线左侧的矩形表示经来自 X染色体的 DNA片段的 GC含 量校正后, 检测出的 X染色体单体的样品, 用箭头指示出来的在标准曲线右 侧的矩形表示经来自 X染色体的 DNA片段的 GC含量校正后, 检测出的 X 染色体三体的样品。 如果不釆用本发明的待测染色体的 DNA片段的 GC含 量的校正, 而仅从来自 X染色体的 DNA片段占总 DNA片段的比值来看, 仅仅能发现 X染色体三体的一个样品,很难发现 X染色体单体的样品, 就会 出现假阴性的结果。 图 9A-B是用本发明的方法检测出来的第 21号染色体三体的样品的示意 图。 其中, X轴表示来自 21号染色体的 DNA片段数量占总 DNA片段的比 值, Y轴表示来自 21号染色体的 DNA片段的 GC含量。 在 X轴上用菱形示 出了各个样品中来自第 21号染色体的 DNA片段数量占总 DNA片段的比值, 而用箭头指示出来的矩形表示经来自第 21号染色体的 DNA片段的 GC含量 校正后, 检测出的第 21 号染色体三体的样品。 如果不釆用本发明的待测染 色体的 DNA片段的 GC含量的校正, 而仅从来自第 21号染色体的 DNA片 段占总 DNA 片段的比值来看, 仅仅能发现在图 9 中来自第 21 号染色体的 DNA片段占总 DNA片段的比值最大的 4个样品是第 21号染色体三体, 不 能发现比值在 0.0138的样品的异常, 对于该样品, 就会出现假阴性的结果。 具体实施方式 需要说明的是, 在不矛盾的情况下, 本申请中的实施例及实施例中的特 征可以相互组合。 下面将参考附图并结合实施例来详细说明本发明。 本发明 的附图及其实施例仅仅用于解释本发明, 并不构成对本发明的任何限制。 名词解释 双端短序列是指紧接着 5,端链接引物的小于 50bp的序列和紧接着 3,端 链接引物的小于 50bp的序列。 优选地, 双端短序列是指紧接着 5,端链接引 物的不大于 36bp的序列和紧接着 3'端链接引物的不大于 36bp的序列。 单端短序列是指紧接着 5,端链接引物的小于 50bp的序列或紧接着 3,端 链接引物的小于 50bp的序列。 优选地, 单端短序列是指紧接着 5,端链接引 物的不大于 36bp的序列或紧接着 3'端链接引物的不大于 36bp的序列。 单端长序列是指紧接着 5,端链接引物的大于 99bp的序列或紧接着 3,端 链接引物的大于 99bp的序列。 双端测序是指分别测试位于序列两端的序列。 单端测序是指测试位于序列一端的序列。
DNA簇指由单一 DNA分子扩增而成的位于一定固体面积的多个 DNA 分子。 在该申请的实施例中, DNA簇指由单一 DNA分子扩增而成的位于 1 平方 ^啟米内的大约 1000个 DNA分子。 乳化 PCR指的是将 PCR ( Polymerase Chain Reaction ) 的反应物, 包括 PCR模板 DNA、PCR引物、 PCR聚合酶和自由碱基置于一个油珠内进行 PCR 反应。 通常情况下, 在一个油珠内, 乳化 PCR的模板只有一个 DNA分子。 GC 含量: 是指在核酸或脱氧核糖核酸中, 鸟嘌呤和胞嘧啶的数量占所 有碱基总数量的比例。 实施例 1: 一种检测胚胎染色体拷贝数的方法 步骤 1 : 取母体血液, 制备血浆。 在本实施例中, 总共抽取了 14个母体血液样品, 样品的代号为: G356、 G397、 G426、 G735、 G756、 G760、 G763、 G770、 G778、 G779、 G780、 G781、 G824和 G825, 均由中南大学湘雅医学院的邬玲仟教授通过羊膜腔穿 刺经染色体核型鉴定为正常的女性胚胎样本 [46 , XX] , 对上述样品检测的数 据用于故标准曲线, 也将上述样品成为标准样品。 血液样品经高速离心后得 到除去了血细包的血浆样品, 每个样品的血浆量大约为 lml。 步骤 2: 提取血浆 DNA。 可以使用 Qiagen公司生产的 DNA抽提试剂盒来提取血浆中的 DNA(产 品号为 57704 )。 步 4聚 3 : 将血浆 DNA制成可供测序的文库。 可以 夺血浆 DNA制成可供双端短序列测序、 单端长序列测序或单端短 序列测序的文库, 以下是制成双端短序列测序文库的过程。 将提取的 DNA末端补平并进行 5,端磷酸化: 将 DNA30 μ1、 纯水 45 μ1、 具有 10mM ATP的 T4 DNA连接酶緩冲液 10 μ1、 10mM dNTP Mix 4 μ1、 T4 DNA 聚合酶 5 μ1、 Klenow酶 1 μ1、 Τ4 ΡΝΚ 5 μΐ混合后, 在 20°C温浴 30分 钟(试剂为 Illumina样本准备试剂盒 PE- 102- 1001提供 )„温浴后釆用 QIAGEN QIAquick PCR 纯化试剂盒 ( part # 28104 ) 纯化 DNA。 末端悬 A: 将上步的产物溶解在 32 μΐ緩冲液中, 加入 Klenow 緩冲液 5 μ1、 ImM dATP 10 μ1、 Klenow Εχο- 3 μΐ, 在 37°C保持 30分钟(试剂为 Illumina 样本准备试剂盒 PE- 102- 1001提供 ), 产物由 QIAGEN MinElute PCR纯化试 剂盒 ( part # 28004 ) 连接: DNA溶解在 ΙΟμΙ緩冲液中, 加入 DNA连接酶緩冲液 2χ 25μ1、 PE Adapter Oligo Mix ΙΟμΙ, DNA 连接酶 5μ1, 在 20°C保持 15分钟 (试剂为 Illumina样本准备试剂盒 PE- 102- 1001提供 )„温浴后釆用 QIAGEN QIAquick PCR纯化试剂盒 ( part # 28104 ) 纯化 DNA。 图 1是样品的 DNA被制作成可供双端测序的文库, 将该文库中的 DNA 用 1%的琼脂糖凝胶进行电泳,图 1是凝胶电泳的图像,最明显的条带在 280bp 左右, 由于包含了 120bp的连接引物, 因此母体血浆 DNA主要片段集中在 160bp左右。 优选地, 还可以对可供双端测序的文库进行 PCR扩增: 1 μ1 ϋΝΑ、 22 μΐ 纯水、 Ιμΐ PE PCR 引物 PE 2.0、 1 μΐ PE PCR引物 PE 1.0、 2x Phusion DNA 聚合酶 ( Finnzymes Oy ) (试剂为 Illumina样本准备试剂盒 PE- 102- 1001提 供)。通过 PCR仪器扩增 DNA,程序为 98°C 30秒; 98°C 40秒, 65 °C 30秒, 72 °C 30秒,共进行 12个循环; 72 °C 5分钟。 步骤 4: 对所述 DNA测序文库进行测序。 才艮据在步骤 3中所制备的文库的不同, 可以分别进行双端短序列测序、 单端长序列测序或单端短序列测序。 以下是进行双端短序列测序的过程。 用 Illumina的 cBot仪器将 DNA双端测序文库中单一的 DNA分子制成 DNA簇, 这一步也可由乳化 PCR将单一 DNA分子变成珠子上的多分子。 ^!夺上面生成的 DNA袭或乳化 PCR得到的 DNA珠在 Illumina 的 Genome Analyzer或 HiSeq2000测序仪进行双端测序。此过程均由仪器本身自动完成。 可替换地, 也可将上面生成的 DNA簇或乳化 PCR得到的 DNA珠在 Illumina的 Genome Analyzer、 HiSeq2000或 Life Technologies公司的 SOLiD 测序仪进行单端长序列的测序。 在 Illumina的 Genome Analyzer, HiSeq2000 和 Life Technologies公司的 SOLiD测序仪上的测序步骤和反应条件与以上描 述的一样。 步骤 5: 确定血浆中的 DNA片段来自几号染色体, 并确定待测染色体的 拷贝数是否正常。 在进行了 DNA文库的双端短序列测序后 (可替换地, 也可以是测定单 端长序列或单端短序列测序), 当已知了一个 DNA片段两端各 36bp的碱基 序 列 后 , 可 以 将这两 端 的序 列 与 人类基因 组标准序 列 37. 1 ( http: //www. ncbi . nlm.nih.gov/projects/genome/as sembly/gr c/human/data/?build =37 ), 该数据库也称 hg l9 比对, 确定了这两端的序列分别在染色体上的位 置, 该两端序列之间的距离就是该 DNA 片段的长度, 同时该两端序列所在 的染色体位置即确定了该 DNA片段来自几号染色体。 图 2是根据上述的方法确定得到的样品 G356的 DNA片段大小的分布 图, 从图中可以看出, 母体血浆的短 DNA主要集中在 lOObp到 220bp之间。 图 3是将比对后样品 G356中确定来自 X染色体的 DNA片段根据片段 大小所 ^¾丈的分布图。 所得到的图形与图 2几乎一致。 步骤 6: 计算在同一样本内所述 DNA中来自待测染色体的 DNA片段数 量占所有 DNA片段的比值, 根据所述来自待测染色体的 DNA片段中的 GC 含量对所述比值进行校正, 并计算待测样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 根据所述变异的程度确定待测染色体的拷贝数。 优选地, 取 DNA的序列长度在 100bp-250bp之间的任意一点或任意一 个区间的所有 DNA的测序和比对结果, 计算在同一样本内 100bp-250bp之 间的任意一点或任意一个区间的所有 DNA中来自待测染色体的 DNA片段数 量占 100bp-250bp之间的任意一点或任意一个区间的所有 DNA片段的比值, 才艮据所述来自待测染色体的 DNA片段中的 GC含量对所述比值进行校正, 并计算待测样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 根据所述变异的程度确定待测染色体的拷贝数。 实验中发现, 取 DNA的序列长度在 100bp-250bp之间的任意一点或任 意一个区间的所有 DNA的测序和比对结果, 能够提高实 -险结果的准确度。 具体的算法如下: 使用标准样品, 计算在同一样本内来自待测染色体的 DNA片段占所有 DNA片段的比值, 根据测序的结果可以知道来自待测染色 体的 DNA片段中的 GC含量。并根据上述比值和 GC含量制定出 GC含量( Y 轴) 和各个染色体或局部染色体占全部染色体百分比 (X轴) 的标准曲线。 将待测样品所测得的染色体的比值根据该染色体自身特有的函数将其校正到 某一固定的 GC值, 一般常用 GC值的算术平均数。 并计算待测样本中所述 来自待测染色体的 DNA片段校正后的比值的变异 Z值, 根据 Z值确定待测 染色体的拷贝数。 图 5 A-H是根据所测的样品中来自待测染色体的 DNA片段的 GC含量 和来自待测染色体的 DNA片段占总 DNA片段的比值, 所做的标准曲线。 从 图中可以看出, 来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 14、 18和 X号 染色体的 DNA片段的 GC含量分别与来自各个染色体的 DNA片段占总 DNA 片段的比值成反比, 所述线性关系可用 y=ax+b表示, 其中 y代表来自待测 染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA片段数量占 总 DNA的比值, a和 b是常数, JL a是负数。 需要说明的是, 针对不同的参 考样本, 公式的具体参数可能会有微小的变化, 但总体趋势是不变的。 在表 1中示出了 4十对第 2、 3、 4、 5、 6、 7、 8、 12、 13、 14、 18和 X号染色 体的函数: 表 1
染色体编号 函数
2 Y = - ■1274.5X + 154.48
3 Υ = - ■682.68Χ + 88.11
4 Υ = - ■391.42X + 62.075
5 Υ = - ■772.25Χ + 88.517
6 Υ = - ■729.61X + 84.354 7 -2874.7Χ + 197.28
8 -1599.4X + 122.84
12 -1936.7X + 129.32
13 -827.29Χ + 67.049
14 -933.9Χ + 74.22
18 -1946.4X + 97.323
X -749.77Χ + 71.33 来自第 1、 9、 γ γ γ γ γ γ γ 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA 片段的 GC含量分别与来自各个染色体的 DNA片段占总 DNA片段的比值成 正比,所述线性关系可用 y = ax +b表示,其中 y代表来自待测染色体的 DNA 片段的 GC含量, X代表来自待测染色体的 DNA片段数量占总 DNA的比值, a和 b是常数, JL a是正数。
表 2
染色体编号 函数
1 Y = 909.17X - 29.372
9 Υ = 2211.3X - 45.632
10 Υ = 1886.8X - 51.026
11 Υ = 1255X - 15.714
15 Υ = 1775.8Χ - 10.124
16 Υ = 797.17X + 23.883
17 Υ = 560.83Χ + 31.227
19 Υ = 513.79X + 43.088
20 Υ = 1006.7X + 22.818
21 Υ = 7298Χ - 51.083
22 Υ = 596.24Χ + 43.346 然后, 将待测样品所测得的染色体的比值根据该染色体自身特有的函数 将其校正到某一固定的 GC值, 一般常用 GC值的算术平均数。 举例来说, 由来自各个染色体的 DNA片段的 GC含量与来自各个染色 体的 DNA片段占总 DNA片段的比值表示的 y=ax+b的函数可知, 每个样本 中来自各个染色体的 DNA片段占总 DNA片段的比值 X可以通过此函数根据
GC值校正。 校正公式可以是: a 。 其中, X为校正后来自各个 染色体的 DNA片段占总 DNA片段的比值; έ为检测到的样本在该指定染色 体片段占总 DNA片段的比值; y为待测样本在指定的染色体片段上的 GC含 量; γ为检测到的标准样本 (已知正常的样本, 如实施例 1 中检测的已知正 常的 14个标准样品)在这一段染色体的算术平均 GC值; a为这条曲线的斜 率。 针对每条染色体的函数见表 1和 2; 针对不同的样本, έ、 y这两个值为 该次试-险的测定值, 这两个参数随着待测样本不同而不同。 通过计算这些校正过的 X 值的平均值和标准误差, 可以得到数值 Z, Z= (待测样品校正过的比值 X-校正过的各标准样品比值的平均值 )/标准误差。 计算各待测样本所述校正过的比值 X的变异, -据所述变异的数值 Z确定待 测染色体或待测局部染色体的拷贝数。 一般情况下, 将 Z的绝对值小于 3视 为正常检测误差, Z的绝对值大于 3视为异常。 以下表 3、 4和 5是通过实施例 1的方法检测样品 G356、 G397(重复测 了 8次)、 G426、 G735、 G756、 G760、 G763、 G770、 G778、 G779、 G780、 G781、 G824和 G825计算得到的针对第 13、 18和 21号染色体的检测以及校 正结果。 表 3 : 第 13号染色体校正示意表
Figure imgf000015_0001
表 4: 第 18号染色体校正示意表
样品 X Y 校正后的 X
G356 0.028355 42.32462 0.028009403
G397L1 0.028042 42.66689 0.027871871
G397L2 0.028211 42.5936 0.028003058
G397L3 0.027866 42.92468 0.027828101
G397L4 0.028163 42.8853 0.028105316 s/uu O z-iz-oosldsoiAV
Figure imgf000016_0003
Figure imgf000016_0001
Figure imgf000016_0002
这里需要特别说明的是上述检测和计算的方法不仅适用于检测整个染色 体拷贝数的异常, 同样适用于检测局部染色体的拷贝数异常。 以下是检测待测样品中胚胎 13号染色体拷贝数的实例 如上面所述的操作, 总共抽取了 15 个母体血液样品, 血液样品经高速 离心后得到除去了血细胞的血浆样品, 每个样品的血浆量大约为 1ml, 样品 的代号为: G352、 G362, G372, G383 , G397(重复测了 8 次)、 G402、 G409, G415 , G424, G445 , G440, G503 , G588, G735和 G783。 上述样 品均由中南大学湘雅医学院的邬玲仟教 ·ί受釆集得到。 对可能存在的 13号染色体三体进行检测。 利用上面得到的针对 13号染 色体的标准曲线, 对所述检测的结果进行-险证。 如图 6所示, 在没有 GC校 正的情况下 (图中以 X轴上的菱形来标记), 13 号染色体三体样品 G445、 G352和 G402 ( x轴上 3个用圓圏标记的样品)与正常样品( x轴上不加标记 的样品) 无法区分开来。 但在 GC 校正的情况下 (图中以矩形来表示), 13 号染色体三体样品 G445、 G352和 G402 (图中 3个用箭头标 ΐ己的样品)与正 常样品 (图中其他以矩形表示的样品) 就可以清楚地区分开来, 而且经 GC 校正的结果与中南大学湘雅医学院的邬玲仟教 ·ί受通过羊膜腔穿刺经染色体核 型鉴定的结果一致。 所以 GC含量的校正可以用来检测 13号染色体三体, 减 少假阴性结果的出现。 下面的表 6中仅示出了部分待测样品的检测和计算结果, 其他样品的结 果未示出。 第 13号染色体校正后 Ζ值计算示意表
Figure imgf000017_0001
Figure imgf000017_0002
从上表可以见到 G445、 G352、 G402样本 Z值超过 3 , 可以判断其为 13 号染色体三体。 其余各样本 Z值均在 -3到 +3之间。 以下是检测待测样品中胚胎 18号染色体拷贝数的实例 如上面所述的操作, 总共抽取了 16 个母体血液样品, 血液样品经高速 离心后得到除去了血细胞的血浆样品, 每个样品的血浆量大约为 1ml, 样品 的代号为: G362, G372, G383 , G397(重复测了 8 次)、 G407, G409, G415 , G424, G442, G432, G445 , G440, G595 , G588, G735和 G783。 上述样品均由中南大学湘雅医学院的邬玲仟教授釆集得到。 对可能存在的 18号染色体三体进行检测。 如图 7所示, 利用上面得到 的针对 18号染色体的标准曲线, 对所述检测的结果进行验证。 在没有 GC校 正的情况下 (图中以 X轴上的菱形表示;), 有些 18号染色体三体样品 (X轴 上 1个用黑色圓圏标记的样品) 与正常样品 (X轴上以菱形表示但不加标记 的样品) 无法区分开来, 所以导致该样品的^ _阴性。 其他 18 号染色体三体 的样品(图中用向下箭头标记的在 X轴上的样品) 可以在没有 GC含量校正 的情况下检测出来。 但在 GC校正的情况下 (图中以矩形来标记), 所有 18 号染色体三体样品 (图中用横向箭头标记的样品) 与正常样品 (图中其他以 矩形表示的样品) 就可以清楚地区分开来, 而且经 GC校正的结果与中南大 学湘雅医学院的邬玲仟教授通过羊膜腔穿刺经染色体核型鉴定的结果一致。 所以 GC含量的校正可以用来检测 18号染色体三体,减少假阴性结果的出现。 下面的表 7中仅示出了部分待测样品的检测和计算结果, 其他样品的结 果未示出。 第 18号染色体校正后 Z值计算示意表
Figure imgf000018_0001
Figure imgf000018_0002
从上表可以见到 G424、 G442、 G432、 G415、 G595、 G407样本 Z值超 过 3 , 可以判断其为 18号染色体三体。 其余各样本 Z值均在 -3到 +3之间。 以下是检测待测样品中胚胎 21号染色体拷贝数的实例 如上面所述的操作, 总共抽取了 14 个母体血液样品, 血液样品经高速 离心后得到除去了血细胞的血浆样品, 每个样品的血浆量大约为 1ml, 样品 的代号为: G267, G387, G393 , G376, G397(重复测了 8次)、 G405 , G408, G409, G440, G491 , G588, G641 , G735和 G783。 上述样品均由中南大 学湘雅医学院的邬玲仟教授釆集得到。 对可能存在的 21号染色体三体即唐氏综合征样品进行检测。如图 9A所 示, 利用上面得到的针对 21 号染色体的标准曲线, 对所述检测的结果进行 验证。 在没有 GC校正的情况下 (图中以 X轴上的菱形表示;), 21号染色体 三体的样品可以单凭它占全部染色体的百分比检测出来 (X轴上 1个用黑色 圓圏和 3个用竖向箭头标记的样品)。 其中一个样品(X轴上 1个用黑色圓圏 标记的样品) 与正常样品 (其他菱形标记的样品) 的区别不是很明显, 可能 导致该样品的假阴性检测。 但在 GC校正的情况下(图中以矩形来标记;), 所 有 21号染色体三体样品(图中 4个用横向箭头标记的样品)与正常样品(图 中其他以矩形标记的样品) 就可以清楚地区分开来, 而且经 GC校正的结果 与中南大学湘雅医学院的邬玲仟教授通过羊膜腔穿刺经染色体核型鉴定的结 果一致。 GC含量校正对 21号染色体三体检测精确度的提高可以用 21号染 色体三体样品距正常样品之间的最小距离来衡量。 如图 9B 所示, 校正后的 最小距离 d l比校正前的最小距离 d 2要大。所以 GC含量的校正可以用来更 精确地检测 21号染色体三体, 减少假阴性结果的出现。 下面的表 8中仅示出了部分待测样品的检测和计算结果, 其他样品的结 果未示出。 表 8: 第 21号染色体校正后 Z值计算示意表
Figure imgf000019_0001
第 18号染色体 校正后 X 平均值 0.013225973
标准误 0.0000762249 从上表可以见到 G405、 G387、 G376、 G393样本 Z值超过 3 , 可以判断 其为 21号染色体三体。 其余各样本 Z值均在 -3到 +3之间。 实施例 2: 检测胚胎或肿瘤染色体拷贝数的试剂盒 对应于实施例 1的检测方法, 本申请的发明人开发了一种能够用于检测 胚胎或肿瘤染色体拷贝数的试剂盒, 其包括: 从母体或肿瘤患者取血液的器械, 可以是任何能用于取血的釆血针、 注 射器等等; 适合将所述血液中的血细胞和血浆分离的器械, 可以是适合于在离心机 上用于盛装血液的微管或其他任何适合分离的容器或器械; 抽提所述血浆中的 DNA的试剂和器械, 可以包括: 蛋白酶、 饱和酚、 氯仿:异戊醇(24 : 1 )、 醋酸钠、 无水乙醇、 70%乙醇、 TE溶液等。 也可以 选取 Qiagen公司生产的 DNA抽提试剂盒来提取血浆中的 DNA (产品号为 57704 ) 以及其它任何可以用于进行 DNA提取的试剂或容器; 将所述 DNA制成可供测序的文库的试剂和器械, 供测序的文库可以是 供双端短序列测序的文库、单端长序列测序的文库或单端短序列测序的文库。 将所述 DNA制成可供双端短序列测序的文库的试剂和器械包括:具有 10mM ATP的 T4 DNA连接酶緩冲液、 lOmM dNTP Mix, T4 DNA聚合酶、 Klenow 酶、 T4 PNK (以上这些试剂为 Illumina样本准备试剂盒 PE-102-1001提供 ) 以及在特定环境下对 DNA具有亲和性的离子交换脂以实现对 DNA的分离。 也可以选取 QIAGEN QIAquick PCR 产物分离试剂盒 (产品号 # 28104 )或 QIAGEN MinElute PCR产物分离试剂盒 (产品号 # 28004 )„ 和对所述 DNA进行测序的试剂和器械,对所述 DNA进行测序可以是双 端短序列测序、 单端长序列测序或单端短序列测序。 进行双端短序列测序的 试剂和器才成可以包括: PE PCR引物 PE 2.0、 PE PCR 引物 PE 1.0、 Phusion DNA聚合酶 ( Finnzymes Oy ) (试剂为 Illumina样本准备试剂盒 PE-102-1001 提供)。 实施例 3: 另一种检测胚胎或肿瘤染色体拷贝数的试剂盒 本申请的发明人开发了另一种能够用于检测胚胎或肿瘤染色体拷贝数的 试剂盒, 其包括: 从母体或肿瘤患者取血液的器械, 可以是任何能用于取血的釆血针、 注 射器等等; 适合将所述血液中的血细胞和血浆分离的器械, 可以是适合于在离心机 上用于盛装血液的微管或其他任何适合分离的容器或器械; 抽提所述血浆中的 DNA的试剂和器械, 可以包括: 蛋白酶、 饱和酚、 氯仿:异戊醇(24 : 1 )、 醋酸钠、 无水乙醇、 70%乙醇、 TE溶液等。 也可以 选取 Qiagen公司生产的 DNA抽提试剂盒来提取血浆中的 DNA (产品号为 57704 ) 以及其它任何可以用于进行 DNA提取的试剂或容器; 通过物理方法根据所述 DNA 的片段大小对其进行分离的试剂和器械, 可以包括: 琼月旨糖粉 (Biowest 11860 ), marker ( Takara lOObp DNA marker, 产品号 D505A ) 等; 和取 100bp-250bp之间的任意一点或任意一个区间的所有 DNA进行测 序的试剂和器械, 可以包括: 如切取一定区间的琼脂糖凝胶的切刀。 优选地, 可以包括将从切取的琼脂糖凝胶回收 DNA进行扩增并将其制 成可供测序的文库的试剂和器才成。 实施例 4: 一种检测胚胎或肿瘤染色体拷贝数的装置
一种检测胚胎或肿瘤染色体拷贝数的装置, 包括: 检测模块, 用于对母体血浆或肿瘤患者血浆样本中 DNA进行测序, 所 述测序包括了将母体血浆或肿瘤患者血浆样本中的 DNA制成可供测序的文 库的过程, 对母体血浆样本中的 DNA进行测序, 可以包括 Illumina的 cBot 仪器和 Illumina的 Genome Analyzer或 HiSeq2000测序仪或 ABI公司的 SOLiD 系列的测序仪; 比对模块, 用于将所述 DNA的测序结果与染色体组序列图谱进行比对, 以确定所述 DNA中的每段 DNA来自几号染色体以及所述每段 DNA的序列 长度, 可以使用人类基因组标准序列数据库 hgl9; 计算模块, 用于计算在同一样本内来自待测染色体的 DNA 片段数量占 所有 DNA片段的比值,根据所述来自待测染色体的 DNA片段中的 GC含量 对所述比值进行校正; 并计算待测样本中所述来自待测染色体的 DNA 片段 校正后的比值的变异, 根据所述变异的程度确定待测染色体的拷贝数; 以及 输出模块, 用于输出所述待测染色体的拷贝数。 可选地, 检测模块可以检测样品中所有的 DNA 片段, 也可以仅仅检测 100bp-250bp之间的任意一点或任意一个区间如 150bp到 175bp的所有 DNA, 这可以通过在检测装置的上游包括一个根据所述 DNA 的片段大小, 对母体 血浆中的 DNA进行分离的试剂和器械, 可以是进行琼脂糖凝胶电泳的模块 或装置。 显然, 本领域的技术人员应该明白, 上述的本发明的一些模块或一些步 骤可以用通用的计算装置来实现, 它们可以集中在单个的计算装置上, 或者 分布在多个计算装置所组成的网络上, 可选地, 它们可以用计算装置可执行 的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行, 或者将它们分别制作成各个集成电路模块, 或者将它们中的多个模块或步骤 制作成单个集成电路模块来实现。 这样, 本发明不限制于任何特定的硬件和 软件结合。 以上仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域 的技术人员来说, 本发明可以有各种更改和变化。 凡在本发明的 ^"神和原则 之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围 之内。
参考文献:
1. Cunningham F, et al. ( 2002 ) In Williams Obstretrics ( McGraw-Hill Professional, New York ) , p942.
2. Wapner R, et al. ( 2003 ) First- trimester screening for trisomies 21 and 18.
N Engl J Med , 3 9 \ 05- \ \3.
3. Lo YM, et al. ( 1997 ) Presence of fetal DAN in maternal plasma and serum. Lancet , 350: 485-487.
4. Lo YM, et al. ( 2007 ) Plasma placental RNA allelic ratio permits
noninvasive prenatal chromosomal aneuploidy detection. Nat Med, 13: 218-223.
5. Tong YK, et al. ( 2006 ) Noninvasive prenatal detection of fetal trisomy 18 by epigenetic allelic ratio analysis in maternal plasma: Theoretical and empirical considerations. Clin Chem, 52: 2194-2202.
6. Fan HC, Quake SR. ( 2007 ) Detection of aneuploidy with digital
polymerase chain reaction. Anal Chem, 79: 7576-7579.
7. Lo YM, et al. ( 2007 ) Digital PCR for molecular detection of fetal
chromosomal aneuploidy. Proc Natl Acad Sci USA, 104: 131 16-13121.
8. Bentley DR, et al. ( 2008 ) Accurate whole human genome sequencing using reversible terminator chemistry. Nature, 456: 53-59.
9. McKeman KJ, et al. ( 2009 ) Sequence and structure variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding. Genome Research, 119: 1527-1541.
10. Harris TD, et al. ( 2008 ) Single-molecule DNA sequencing of a viral genome. Science, 320: 106- 109.
11. Fan HC, et al. ( 2008 ) Noninvasive diagnosis of fetal aneuploidy by sequencing DNA from maternal blood. Proc Natl Acad Sci USA, 105:
16266-16271.
12. Chiu RWK, et al. ( 2008 ) Noninvasive prenatal diagnosis of fetal
chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma. Proc Natl Acad Sci USA, 105: 20458-20463.
13. Chiu RWK, et al. ( 2010 ) Maternal plasma DNA analysis with massively parallel sequencing by ligation for noninvasive prenatal diagnosis of trisomy 21. Chin Chem, 56:459-463.
14. Lewis DE, et al. ( 2010 ) Antigenic approach to the detection and
isolation of microparticles associated fetal DNA. PCT, US2010, #025209. Fan HC, et al. ( 2010 ) Analysis of the size distributions of fetal and maternal cell-free DNA by paired-end sequencing. Clin Chem, 56: 1279-1286.

Claims

权 利 要 求 书
1. 一种检测胚胎或肿瘤染色体拷贝数的试剂盒, 包括:
从母体或肿瘤患者体内取血液的器械;
适合将所述血液中的血细胞和血浆分离的器械;
抽提所述血浆中的 DNA的试剂和器械;
通过物理方法根据所述 DNA 的片段大小对其进行分离的试剂和 器械; 和
取 100bp-250bp之间的任意一点或任意一个区间的所有 DNA进行 测序的试剂和器械。
2. 根据权利要求 1所述的试剂盒, 其中所述胚胎或肿瘤染色体是整条染色 体或局部染色体。
3. 根据权利要求 1所述的试剂盒, 还包括: 将所述 DNA制成供测序的文 库的试剂和器械。
4. 根据权利要求 2所述的试剂盒, 还包括: 将所述 DNA制成供测序的文 库的试剂和器械。
5. 根据权利要求 4所述的试剂盒, 还包括: 对所述供测序的文库进行 PCR 扩增的试剂和器械。
6. 根据权利要求 1或 5所述的试剂盒, 其中所述 100-250bp之间的任意一 点或任意一个区间的 DNA是 150bp-170bp的 DNA。
7. 根据权利要求 6所述的试剂盒, 其中所述 100-250bp之间的任意一点或 任意一个区间的 DNA是 167bp的 DNA。
8. —种检测胚胎或肿瘤染色体拷贝数的试剂盒, 包括:
从母体或肿瘤患者体内取血液的器械;
适合将所述血液中的血细胞和血浆分离的器械;
抽提所述血浆中的 DNA的试剂和器械;
将所述 DNA制成可供测序的文库的试剂和器戈; 和
对所述 DNA进行测序的试剂和器械。
. 根据权利要求 8所述的试剂盒, 其中所述胚胎或肿瘤染色体是整条染色 体或局部染色体。
10. 根据权利要求 8 所述的试剂盒, 还包括: 对从血浆中抽提的所述 DNA 进行 PCR扩增的试剂和器械。
11. 一种检测胚胎或肿瘤染色体拷贝数的装置, 包括:
检测模块,用于对母体血浆或肿瘤患者血浆样本中的 DNA进行测 序;
比对模块,用于将所述 DNA的测序结果与染色体组序列图谱进行 比对, 以确定所述 DNA中的每段 DNA来自几号染色体以及所述每段 DNA的序列长度;
计算模块,用于计算在同一样本内来自待测染色体的 DNA片段的 数量占 DNA片段总数的比值, 根据所述来自待测染色体的 DNA片段 中的 GC含量对所述比值进行校正; 并计算待测样本中所述来自待测 染色体的 DNA片段校正后的比值的变异,根据所述变异的程度确定待 测染色体的拷贝数; 以及
输出模块, 用于输出所述待测染色体的拷贝数。
12. 根据权利要求 11所述的装置,其中所述计算模块根据以下的函数对第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18 和 X号染色体的比值进行校正: 来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的 DNA 片段的 GC含量分别与来自各个染色体的 DNA片段占总 DNA片段的比 值具有一定的线性关系, 所述线性关系可用 y=ax+b表示, 其中 y代表 来自待测染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA 片段数量占总 DNA的比值, a和 b是常数, 且 a是负数。
13. 根据权利要求 12所述的装置, 其中所述来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的 DNA片段的 GC含量与来自各个染色 体的 DNA片段占总 DNA片段的比值之间的线性关系如以下所示
染色体编号 函数
2 Y = -1274.5X + 154.48
3 Υ = -682.68Χ + 88.11
4 Y = -391.42X + 62.075
5 Υ = -772.25Χ + 88.517
6 Υ = -729.61X + 84.354
7 Υ = -2874.7Χ + 197.28
8 Υ = -1599.4X + 122.84
12 Υ = -1936.7X + 129.32 Y = -827.29X + 67.049
Y = - 1946.4X + 97.323
Υ = -749.77Χ + 71.33
14. 根据权利要求 11所述的装置,其中所述计算模块根据以下的函数对第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的比值进行校正: 来自第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA 片段的 GC含量分别与来自各个染色体的 DNA片段占总 DNA片段的比 值具有一定的线性关系, 所述线性关系可用 y=ax+b表示, 其中 y代表 来自待测染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA 片段数量占总 DNA的比值, a和 b是常数, 且 a是正数。
15. 才艮据权利要求 14所述的装置, 其中所述来自第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA片段的 GC含量与来自各个染色 体的 DNA片段占总 DNA片段的比值之间的线性关系如在以下所示: 染色体编号 函数
1 Y = 909. 17X - 29.372
9 Υ = 2211.3X - 45.632
10 Υ = 1886.8X - 5 1.026
11 Υ = 1255X - 15.714
15 Υ = 1775.8Χ - 10. 124
16 Υ = 797. 17X + 23.883
17 Υ = 560.83Χ + 31.227
19 Υ = 513.79X + 43.088
20 Υ = 1006.7X + 22.818
21 Υ = 7298Χ - 5 1.083
22 Υ = 596.24Χ + 43.346
16. 根据权利要求 11- 15所述的装置, 其中所述检测模块将母体血浆或肿瘤 患者血浆样本中的所有 DNA制成可供测序的文库的过程。
17. 居权利要求 11所述的装置,其中所述对母体血浆或肿瘤患者血浆样本 中的 DNA进行测序是双端短序列测序、 单端长序列测序或单端短序列 测序。
18. 根据权利要求 11所述的装置,其中所述胚胎或肿瘤染色体是整条染色体 或局部染色体。
19. 根据权利要求 17所述的装置, 其中对所述母体血浆或肿瘤患者血浆样本 中的 DNA在测序前进行了 PCR扩增。
20. 根据权利要求 19 所述的装置, 其中计算模块用于计算在同一样本内 100bp-250bp之间的任意一点或任意一个区间的所有 DNA中来自待测染 色体的 DNA片段数量占 100bp-250bp之间的任意一点或任意一个区间 的所有 DNA片段总数的比值, 根据 100bp-250bp之间的任意一点或任 意一个区间的所有 DNA中来自待测染色体的 DNA片段的 GC含量对所 述比值进行校正; 并计算待测样本中所述来自待测染色体的 DNA 片段 校正后的比值的变异, 根据所述变异的程度确定待测染色体的拷贝数。
21. 居权利要求 20 所述的装置, 其中将所述母体血浆或肿瘤患者血浆样 本中 100bp-250bp之间的任意一点或任意一个区间的所有 DNA制成可 供测序的文库。
22. 居权利要求 21 所述的装置, 其中所述母体血浆或肿瘤患者血浆样本 中的 DNA在被制作成可供测序的文库之前或之后进行了 PCR扩增。
23. 根据权利要求 20所述的装置,其中所述 100-250bp之间的任意一点或任 意一个区间的 DNA是 150bp-170bp的 DNA。
24. 根据权利要求 23所述的装置,其中所述 100-250bp之间的任意一点或任 意一个区间是 DNA是 167bp的 DNA。
25. 一种检测胚胎或肿瘤染色体拷贝数的方法, 包括以下步骤:
取母体血浆或肿瘤患者血浆;
将所述血液中的血浆和血细月包分离;
将所述血浆中的 DNA制作成可供测序的文库;
对所述 DNA测序文库进行测序;
将所述测序的结果与染色体组序列图谱进行比对, 确定每段所述 DNA序列来自几号染色体以及每段所述 DNA序列的长度; 以及
用所述 DNA的测序和比对结果,计算在同一样本内来自待测染色 体的 DNA片段的数量占 DNA片段总数的比值, 根据所述来自待测染 色体的 DNA片段中的 GC含量对所述比值进行校正,并计算待测样本 中所述来自待测染色体的 DNA片段校正后的比值的变异,根据所述变 异的程度确定待测染色体的拷贝数。
26. 根据权利要求 25中任一项所述的方法, 根据以下的函数对第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的比值进行校正: 来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的 DNA片段的 GC 含量分别与来自各个染色体的 DNA片段占总 DNA片段的比值具有一定 的线性关系, 所述线性关系可用 y = ax + b表示, 其中 y代表来自待测 染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA片段数 量占总 DNA的比值, a和 b是常数, 且 a是负数。
27. 根据权利要求 26所述的方法, 其中所述来自第 2、 3、 4、 5、 6、 7、 8、 12、 13、 18和 X号染色体的 DNA片段的 GC含量与来自各个染色 体的 DNA片段占总 DNA片段的比值之间的线性关系如在权利要求 13 中所示。
28. 根据权利要求 25中任一项所述的方法, 根据以下的函数对第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的比值进行校正: 来自第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA片段的 GC含量分别与来自各个染色体的 DNA片段占总 DNA片段的比值具有 一定的线性关系, 所述线性关系可用 y=ax+b表示, 其中 y代表来自待 测染色体的 DNA片段的 GC含量, X代表来自待测染色体的 DNA片段 数量占总 DNA的比值, a和 b是常数, JL a是正数。
29. 根据权利要求 28所述的方法, 其中所述来自第 1、 9、 10、 11、 15、 16、 17、 19、 20、 21和 22号染色体的 DNA片段的 GC含量与来自各个染色 体的 DNA片段占总 DNA片段的比值之间的线性关系如在权利要求 15 中所示。
30. 根据权利要求 25-29 所述的方法, 其中仅取 DNA 的序列长度在 100bp-250bp之间的任意一点或任意一个区间的所有 DNA的测序和比对 结果, 计算在同一样本内 100bp-250bp之间的任意一点或任意一个区间 的所有 DNA中来自待测染色体的 DNA片段数量占 100bp-250bp之间的 任意一点或任意一个区间的所有 DNA 片段总数的比值, 根据 100bp-250bp之间的任意一点或任意一个区间的所有 DNA中所述来自待 测染色体的 DNA片段中的 GC含量对所述比值进行校正, 并计算待测 样本中所述来自待测染色体的 DNA 片段校正后的比值的变异, 根据所 述变异的程度确定待测染色体的拷贝数。
31. 根据权利要求 25-29所述的方法, 其中对所述 DNA测序文库进行测序 是双端短序列测序、 单端长序列测序或单端短序列测序。
32. 根据权利要求 30所述的方法,其中所述 100-250bp之间的任意一点或任 意一个区间的 DNA是 150bp-170bp的 DNA。
33. 根据权利要求 32所述的方法,其中所述 100-250bp之间的任意一点或任 意一个区间的 DNA是 167bp的 DNA。
PCT/CN2011/075037 2011-05-31 2011-05-31 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法 WO2012162884A1 (zh)

Priority Applications (11)

Application Number Priority Date Filing Date Title
HUE11866914A HUE031239T2 (en) 2011-05-31 2011-05-31 Device for determining the copy number of fetal chromosomes or tumor cell chromosomes
EP11866914.2A EP2716766B1 (en) 2011-05-31 2011-05-31 A device for detecting copy number of fetal chromosomes or tumor cell chromosomes
DK11866914.2T DK2716766T3 (da) 2011-05-31 2011-05-31 Indretning til detektering af kopiantal af føtale kromosomer eller tumorcellekromosomer
US13/811,634 US9885080B2 (en) 2011-05-31 2011-05-31 Kit, a device and a method for detecting copy number of fetal chromosomes or tumor cell chromosomes
RS20161036A RS55518B1 (sr) 2011-05-31 2011-05-31 Uređaj za detektovanje broja kopija fetalnih hromozoma ili hromozoma tumorske ćelije
CN201180035510.7A CN103080336B (zh) 2011-05-31 2011-05-31 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法
PL11866914T PL2716766T3 (pl) 2011-05-31 2011-05-31 Urządzenie do wykrywania liczby kopii chromosomów płodowych lub chromosomów komórek nowotworowych
PT118669142T PT2716766T (pt) 2011-05-31 2011-05-31 Dispositivo para detectar o número de cópias de cromossomas fetais ou células tumorais
PCT/CN2011/075037 WO2012162884A1 (zh) 2011-05-31 2011-05-31 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法
ES11866914.2T ES2605372T3 (es) 2011-05-31 2011-05-31 Un dispositivo para detectar el número de copias de cromosomas fetales o cromosomas de células tumorales
JP2014513025A JP5926795B2 (ja) 2011-05-31 2011-05-31 胎芽又は腫瘍染色体のコピー数を検出するシステム及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/075037 WO2012162884A1 (zh) 2011-05-31 2011-05-31 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法

Publications (1)

Publication Number Publication Date
WO2012162884A1 true WO2012162884A1 (zh) 2012-12-06

Family

ID=47258277

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/075037 WO2012162884A1 (zh) 2011-05-31 2011-05-31 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法

Country Status (11)

Country Link
US (1) US9885080B2 (zh)
EP (1) EP2716766B1 (zh)
JP (1) JP5926795B2 (zh)
CN (1) CN103080336B (zh)
DK (1) DK2716766T3 (zh)
ES (1) ES2605372T3 (zh)
HU (1) HUE031239T2 (zh)
PL (1) PL2716766T3 (zh)
PT (1) PT2716766T (zh)
RS (1) RS55518B1 (zh)
WO (1) WO2012162884A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017527257A (ja) * 2014-05-30 2017-09-21 セクエノム, インコーポレイテッド 染色体提示の決定
WO2018233236A1 (en) * 2017-06-21 2018-12-27 Berry Genomics Co., Ltd METHODS AND KITS FOR CONSTRUCTING A SEQUENCING LIBRARY TO BE USED IN DETECTING A NUMBER OF CHROMOSOME COPY VARIATIONS
EP2875149B1 (en) * 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010242073C1 (en) 2009-04-30 2015-12-24 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US12129514B2 (en) 2009-04-30 2024-10-29 Molecular Loop Biosolutions, Llc Methods and compositions for evaluating genetic markers
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
WO2012177792A2 (en) 2011-06-24 2012-12-27 Sequenom, Inc. Methods and processes for non-invasive assessment of a genetic variation
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2852665A1 (en) 2011-10-17 2013-04-25 Good Start Genetics, Inc. Analysis methods
LT2805280T (lt) 2012-01-20 2022-12-27 Sequenom, Inc. Diagnostikos būdai, kurie atsižvelgia į eksperimentines sąlygas
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP2971159B1 (en) 2013-03-14 2019-05-08 Molecular Loop Biosolutions, LLC Methods for analyzing nucleic acids
HUE061261T2 (hu) 2013-04-03 2023-05-28 Sequenom Inc Eljárások és folyamatok genetikai variánsok nem invazív értékelésére
EP3004383B1 (en) 2013-05-24 2019-04-24 Sequenom, Inc. Methods for non-invasive assessment of genetic variations using area-under-curve (auc) analysis
KR102299305B1 (ko) 2013-06-21 2021-09-06 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
FI3053071T3 (fi) 2013-10-04 2024-01-18 Sequenom Inc Menetelmiä ja prosesseja geneettisten variaatioiden ei-invasiiviseen arviointiin
CN105874082B (zh) 2013-10-07 2020-06-02 塞昆纳姆股份有限公司 用于非侵入性评估染色体改变的方法和过程
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
WO2015061359A1 (en) 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
US11053548B2 (en) 2014-05-12 2021-07-06 Good Start Genetics, Inc. Methods for detecting aneuploidy
JP6659672B2 (ja) 2014-05-30 2020-03-04 ベリナタ ヘルス インコーポレイテッド 胎児染色体部分異数性およびコピー数変動の検出
US20160034640A1 (en) 2014-07-30 2016-02-04 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US11408024B2 (en) 2014-09-10 2022-08-09 Molecular Loop Biosciences, Inc. Methods for selectively suppressing non-target sequences
US10429399B2 (en) 2014-09-24 2019-10-01 Good Start Genetics, Inc. Process control for increased robustness of genetic assays
AU2015360298B2 (en) 2014-12-12 2018-06-07 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
EP3271480B8 (en) 2015-01-06 2022-09-28 Molecular Loop Biosciences, Inc. Screening for structural variants
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
WO2018022890A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Genetic copy number alteration classifications
WO2018140521A1 (en) 2017-01-24 2018-08-02 Sequenom, Inc. Methods and processes for assessment of genetic variations
CN109112191A (zh) * 2017-06-23 2019-01-01 沈阳精准医疗技术有限公司 一种肿瘤ctDNA的信息统计方法
CN109136363A (zh) * 2018-08-31 2019-01-04 领航基因科技(杭州)有限公司 一种检测胎儿染色体非整数倍的试剂盒和检测胎儿甲基化dna拷贝数的方法
KR102532991B1 (ko) * 2019-12-23 2023-05-18 주식회사 랩 지노믹스 태아의 염색체 이수성 검출방법
CN113096728B (zh) * 2021-06-10 2021-08-20 臻和(北京)生物科技有限公司 一种微小残余病灶的检测方法、装置、存储介质及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102108406A (zh) * 2010-12-20 2011-06-29 北京贝瑞和康生物技术有限公司 检测胚胎染色体拷贝数的试剂盒、装置和方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT1206571E (pt) * 1999-05-04 2004-12-31 Ortho Clinical Diagnostics Inc Captura rapida e eficaz de adn a partir duma amostra sem recurso a um reagente de lise celular
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
CA2737643C (en) * 2008-09-20 2020-10-06 Hei-Mun Fan Noninvasive diagnosis of fetal aneuploidy by sequencing
CA2778926C (en) * 2009-10-26 2018-03-27 Lifecodexx Ag Means and methods for non-invasive diagnosis of chromosomal aneuploidy
CN102018406A (zh) 2010-11-30 2011-04-20 赖新莲 一种治疗颈椎病的药枕

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102108406A (zh) * 2010-12-20 2011-06-29 北京贝瑞和康生物技术有限公司 检测胚胎染色体拷贝数的试剂盒、装置和方法

Non-Patent Citations (17)

* Cited by examiner, † Cited by third party
Title
BENTLEY DR ET AL.: "Accurate whole human genome sequencing using reversible terminator chemistry", NATURE, vol. 456, 2008, pages 53 - 59
CHIU R.W.K. ET AL.: "Maternal Plasma DNA Analysis with Massively Parallel Sequencing by Ligation for Noninvasive Prenatal Diagnosis of Trisomy 21", CLINICAL CHEMISTRY, vol. 56, no. 3, 2010, pages 459 - 463, XP055026815 *
CHIU RWK ET AL.: "Maternal plasma DNA analysis with massively parallel sequencing by ligation for noninvasive prenatal diagnosis of trisomy 21", CHIN CHEM, vol. 56, 2010, pages 459 - 463
CHIU RWK ET AL.: "Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma", PROC NATL ACAD SCI USA, vol. 105, 2008, pages 20458 - 20463
CUNNINGHAM F ET AL.: "Williams Obstretrics", 2002, MCGRAW-HILL PROFESSIONAL, pages: 942
FAN H.J. ET AL.: "Analysis of the Size Distributions of Fetal and Maternal Cell-Free DNA by Paired-End Sequencing", CLINICAL CHEMISTRY, vol. 56, no. 8, 17 June 2010 (2010-06-17), pages 1279 - 1286, XP055026439 *
FAN HC ET AL.: "Analysis of the size distributions of fetal and maternal cell-free DNA by double-end sequencing", CLIN CHEM, vol. 56, 2010, pages 1279 - 1286
FAN HC ET AL.: "Noninvasive diagnosis of fetal aneuploidy by sequencing DNA from maternal blood", PROC NATL ACAD SCI USA, vol. 105, 2008, pages 16266 - 16271
FAN HC; QUAKE SR: "Detection of aneuploidy with digital polymerase chain reaction", ANAL CHEM, vol. 79, 2007, pages 7576 - 7579
HARRIS TD ET AL.: "Single-molecule DNA sequencing of a viral genome", SCIENCE, vol. 320, 2008, pages 106 - 109
LO YM ET AL.: "Digital PCR for molecular detection of fetal chromosomal aneuploidy", PROC NATL ACAD SCI USA, vol. 104, 2007, pages 13116 - 13121
LO YM ET AL.: "Plasma placental RNA allelic ratio permits noninvasive prenatal chromosomal aneuploidy detection", NAT MED, vol. 13, 2007, pages 218 - 223
LO YM ET AL.: "Presence of fetal DAN in maternal plasma and serum", LANCET, vol. 350, 1997, pages 485 - 487
MCKERNAN KJ ET AL.: "Sequence and structure variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding", GENOME RESEARCH, vol. 119, 2009, pages 1527 - 1541
See also references of EP2716766A4
TONG YK ET AL.: "Noninvasive prenatal detection of fetal trisomy 18 by epigenetic allelic ratio analysis in maternal plasma: Theoretical and empirical considerations", CLIN CHEM, vol. 52, 2006, pages 2194 - 2202
WAPNER R ET AL.: "First-trimester screening for trisomies 21 and 18", N ENGL J MED, vol. 349, 2003, pages 1405 - 1413

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2875149B1 (en) * 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
EP2877594B1 (en) * 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
JP2017527257A (ja) * 2014-05-30 2017-09-21 セクエノム, インコーポレイテッド 染色体提示の決定
JP2021035393A (ja) * 2014-05-30 2021-03-04 セクエノム, インコーポレイテッド 染色体提示の決定
AU2021200008B2 (en) * 2014-05-30 2022-04-21 Sequenom, Inc. Chromosome representation determinations
JP7182353B2 (ja) 2014-05-30 2022-12-02 セクエノム, インコーポレイテッド 染色体提示の決定
JP7446979B2 (ja) 2014-05-30 2024-03-11 セクエノム, インコーポレイテッド 染色体提示の決定
WO2018233236A1 (en) * 2017-06-21 2018-12-27 Berry Genomics Co., Ltd METHODS AND KITS FOR CONSTRUCTING A SEQUENCING LIBRARY TO BE USED IN DETECTING A NUMBER OF CHROMOSOME COPY VARIATIONS

Also Published As

Publication number Publication date
PL2716766T3 (pl) 2017-09-29
RS55518B1 (sr) 2017-05-31
CN103080336B (zh) 2014-06-04
US9885080B2 (en) 2018-02-06
EP2716766B1 (en) 2016-09-28
ES2605372T3 (es) 2017-03-14
HUE031239T2 (en) 2017-07-28
JP5926795B2 (ja) 2016-05-25
US20130130921A1 (en) 2013-05-23
PT2716766T (pt) 2016-11-21
EP2716766A4 (en) 2014-11-26
DK2716766T3 (da) 2017-01-02
JP2014516541A (ja) 2014-07-17
EP2716766A1 (en) 2014-04-09
CN103080336A (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
WO2012162884A1 (zh) 检测胚胎或肿瘤染色体拷贝数的试剂盒、装置和方法
AU2020202153B2 (en) Single-molecule sequencing of plasma DNA
ES2623089T3 (es) Diagnóstico prenatal no invasivo de trisomía fetal mediante el análisis de la relación alélica usando secuenciación masivamente paralela dirigida
WO2013053183A1 (zh) 对核酸样本中预定区域进行基因分型的方法和系统
CN102108406B (zh) 检测胚胎染色体拷贝数的试剂盒、装置和方法
TW201639967A (zh) 檢測胎兒基因資訊的方法、試劑盒、裝置和系統
WO2015035555A1 (zh) 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
Qadir et al. ChildSeq-RNA: A next-generation sequencing-based diagnostic assay to identify known fusion transcripts in childhood sarcomas
WO2011130880A1 (zh) 胎儿染色体非整倍性的检测方法
US20180142300A1 (en) Universal haplotype-based noninvasive prenatal testing for single gene diseases
JP2020512000A (ja) 胎児の染色体異常を検出する方法
Ohnuki et al. A target enrichment high throughput sequencing system for characterization of BLV whole genome sequence, integration sites, clonality and host SNP
Ma et al. The analysis of ChIP-Seq data
Itokawa et al. Disentangling primer interactions improves SARS-CoV-2 genome sequencing by the ARTIC Network’s multiplex PCR
WO2019009431A1 (ja) 腫瘍細胞で生じた突然変異を高精度に識別する方法
Qian et al. Noninvasive prenatal screening for common fetal aneuploidies using single-molecule sequencing
Rafiei et al. Common Polymorphisms in MTHFR and Prothrombin Gene in Iranian Women with Abortions at Different Ages
McHenry Genomic and Co-Evolutionary Determinants of Clinical Severity in Active Tuberculosis Patients
CN109280697A (zh) 利用孕妇血浆游离dna进行胎儿基因型鉴定的方法
CN118460721A (zh) 一种原发性中枢神经系统淋巴瘤分子分型试剂盒及其应用
CN117737227A (zh) 基于cfDNA筛查胎儿ACH的基因检测试剂盒及系统
WO2014101024A1 (zh) 确定双胞胎中胎儿性别的方法、系统和计算机可读介质
BRPI0902859B1 (pt) método diagnóstico para detecção de doença celíaca através de miniseqüenciamento de haplótipos de hla e kits de diagnóstico

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180035510.7

Country of ref document: CN

REEP Request for entry into the european phase

Ref document number: 2011866914

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2011866914

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13811634

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11866914

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014513025

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: P-2016/1036

Country of ref document: RS